百度十年:AI时代的登月计划

PigSay 2023-03-22 阅读:1381

2015年3月29日清晨,博鳌的一个早餐会上坐着三个严肃的男人:盖茨、马斯克和李彦宏。

所谓早餐会,就是三个大佬每人一瓶矿泉水,然后饿着肚子看台下的媒体记者们享用早餐。不过能把三个顶级人物凑在一起,放眼全球每年也没几次,在李彦宏流利的英文主持下,盖茨和马斯克这两位日后经常隔空互怼的冤家,此刻也乖巧地相敬如宾。

在早餐会之前,李彦宏特地在百度贴吧上向网友征集问题,这些问题的“成功学”浓度很高,比如问盖茨“要怎么超过你成为首富?”,问马斯克“你怎么能做这么多伟大的事情?”在沐浴了一锅鸡汤之后,李彦宏终于问出了那个他最想问的问题:

“你们怎么看人工智能[1]?”

这并非一个会让媒体老师竖起耳朵来的问题。回到2015年,此时距离Alpha Go大战李世石还有一年,主流舆论更关心硝烟未尽的移动互联网大战,或许人工智能在某些主流人群听不懂的领域里取得了突破,但还远远算不上是热门的商业话题。

这个问题的正确答案,对于知乎网友,可能是几千点赞;对于求职的程序员,可能是一个丰厚的offer;而对于商业巨头掌舵者来说,则可能价值百亿甚至千亿美金。“怎么看”三个字,背后指向的是微软、特斯拉和百度三家企业的战略思考。

作为计算机浪潮的受益者,盖茨抓住了个人计算机普及的浪潮,李彦宏和马斯克则抓住了web1.0的浪潮,后者又缔造了电动车的风口。但所有企业家都害怕在酣睡时被列车抛下,所以这个问题的第二层含义是:人工智能会是下一波超级浪潮吗?

对于李彦宏的问题,盖茨和马斯克给出的答案并没有过份展现野心,但在之后的行动更能说明他们的态度:马斯克在会谈结束不久后便跟Sam Altman勾勒了OpenAI的雏形,而微软更是连续多年重金投资AI,最后成功挤进了人工智能的舞台中央。

百度面临的选择可能更加复杂。倒回到2015年甚至更早,那是一个中国移动互联网雄心未泯的时代,巨头们仍然围绕着DAU和GMV来激烈厮杀,打车、外卖、短视频、在线教育甚至共享单车看起来都是百亿美金的赛道,略显冷门的人工智能值得“托付”吗?

8年之后的2023年3月,三个人的答案水落石出:马斯克参与创办的OpenAI已经成为超级明星,自家的无人驾驶技术也遥遥领先同行;微软成为了OpenAI的新主人,刚推出的Copilot给全球热议添了一把火;百度则在3月20日正式发布了文心一言。

为什么现在发布?李彦宏回答道:

“其实百度在过去十几年中持续在AI研发上坚持投入,文心大模型第一个版本2019年就发布了,此后的每一年都发布一个新版本,从这个意义上说,文心一言的发布只是我们过去多年努力的一个自然延续。”

不过,李彦宏也在发布会上大方承认文心一言并不完美,很多内测截图也显示了文心一言还有很大的改进空间。尽管不完美,但百度的确是中国在这波浪潮里为数不多的追赶者,而且无论对文心一言论充满希冀还是饱以嘲讽,都不应该忘记一个事实:

当年百度踏上人工智能这条路时,其实是一种孤注一掷。

李彦宏的选择题

其实在博鳌早餐会三年前,百度已经决定入局人工智能——这一年也是人工智能发展史上极为重要的一年。

2012年9月,深度学习领域的大神Hinton带领团队在李飞飞创建的ImageNet大赛上一鸣惊人,他们通过全新的深度卷积经网络的方式,一举将图像识别的错误率从30%左右降低至16.42%,人工智能似乎已经展示出了接近甚至超越人类的潜力。

Hinton团队夺冠使用的卷积神经网络叫做AlexNet,团队里核心成员之一是Ilya Sutskever,他日后成为OpenAI的联合创始人之一。但倒回2012年,无论是AlexNet、Hinton、Sutskever甚至是李飞飞,在AlphaGo掀起人工智能的第一波出圈浪潮之前,有几个人会去主动了解这些人的工作?

BAT这个级别的互联网巨头,自然对这些技术突破有着极强的敏感性,但驱动百度投入AI的“内因”可能更加重要。

2012年百度净利润首次突破100亿人民币,但李彦宏本人却有一种强烈的危机感。一方面百度的核心业务依然在贡献着稳定增长的利润;但另一方面,移动互联网正在快速渗透,商业世界的巨大变革呼之欲出,这让百度陷入了某种迷茫。

2012年11月,临近年底,李彦宏写了一封在名为《改变,从你我开始》的内部信中,在信中说[2]:

“当业务还在快速成长时,不应该快速追求净利润,而是要把更多的钱投入到更多的新业务和创新上。” 他甚至写道,“我们要淘汰小资、呼唤狼性。”

西村吉雄在《日本电子产业兴衰录》中解释过日本电子产业的坍塌:日本公司很擅长研究“怎么做”,却疏于判断“做什么”。这其实是大型科技公司都面临的问题,它们往往有很高的毛利和大把的现金,但选择一个方向进行坚定的“豪赌”,却有极大的风险。

不过到了2013年的年初,李彦宏不想再等了。在1月份的百度年会上,他宣布百度将成立专注于Deep Learning深度学习的研究院——即Institute of Deep Learning,简称IDL。这是百度历史上第一个研究院,李彦宏亲自担任院长。

日后业界回顾这段往事,总带着思维惯性认为百度做人工智能是因为转型移动互联网步调放缓。但再过10年人们就会发现,与其把大量真金白银变成外卖红包和打车券,的确不如把钱砸进人工智能——只有下游创新被卡住的时候,人们才会重视上游创新的重要性。

李彦宏为IDL提出的的目标是:要做中国人工智能领域的贝尔实验室,吸引全球最顶级的人才。

贝尔实验室是高科技行业一个极具象征意义的符号,而作为大公司的研究部门本身,其成果同样瞩目。成立后的数十年里,贝尔实验室一共获得了三万多项专利,这些专利在字面意义上改变了人类的命运,比如晶体管,太阳能电池和UNIX操作系统。

贝尔实验室的幕后英雄既有高智商高学历的科研团队,但更关键的是垄断当时坐拥美国通信市场90%份额的AT&T,可以义无反顾的将利润投向技术科研。从这个角度看,2012年的百度也符合这样的特征:有雄厚的业务基本盘,但对未来充满危机感。

百度也拿出了足够多的诚意,IDL先后吸引了吴恩达、张亚勤、楼天城等一大批国内外知名AI学者。同一时期,AlphaGo连挑李世石和柯洁,让普通人第一次见识到了AI的神奇。AI浪潮再次汹涌而来:创业圈里,一度狂热到以科学家数量给创业公司估值。

但这条路线并非完美无瑕。过去半个多世纪里,AI浪潮已经出现两次,最终都潦草收尾。第一次兴起于1956年,AI只会依据规则证明中学数学定理;1976年,第二次人工智能浪潮兴起,专家系统登台,能力的上限也只是下赢国际象棋。

另一方面,AI是一个需要巨大投入的“豪赌”。在加盟百度之前,吴恩达一度想开发一个让AI识别猫脸的算法,但即使是斯坦福大学,在当时也供养不起这样一个简单算法所需要的算力消耗,每一次数据训练迭代背后都要花上几十甚至上百万元。

事实证明,那时无论是李彦宏、IDL还是百度,都大大低估了AI研究所需要的成本,以及它能够带来的回报。

造一艘更大的船

2018年,百度CTO王海峰带着一位名叫吴甜的总监杀到了李彦宏面前,开了一场两个半小时的会议,议题只有一个:要不要把百度的AI框架“飞桨”做的更大[6]。

王海峰的身上有诸多名号,最标志性的是ACL迄今50多年历史上首位华人主席,这是自然语言处理领域世界上最具影响力的国际学术组织。吴甜则是在2005年就为百度知道引入AI技术的老员工,作为百度AI技术平台体系执行总监,她还兼任深度学习技术及应用国家工程实验室副主任。

“飞桨”则是IDL自2013年开始研发的AI框架。所谓框架,可以理解为一个集成了主流算法模型和模型训练工具的超级工厂。它向上承接各种模型和行业应用,向下连接芯片,在AI产业中起到了类似操作系统一样承上启下的关键作用。

但直到2018年,飞桨也还是一个只存在于百度内部和实验室的小众产品。此时,这两位为百度AI开疆拓土的老将站在了同一条战线上:他们想让百度飞桨从一个少数科学家、大企业才用得起的产品,变成整个社会的基础设施。

不夸张地说,要普及人工智能,做出一个好用的框架是第一步。另一方面,则是基于框架之上的AI模型,两者的关系可以简单理解为硬件与操作系统。对于百度来说,AI框架的开发者越多,框架的开发迭代速度就越快;开发迭代内容越丰富,使用的用户也就越多。

所以在那次会议上,李彦宏当场拍板:我们决定要做,要什么资源都给。

2019年,仅仅为推广一站式开发平台 AI Studio ,百度就拿出总价值1亿元的免费算力开放;2020年,为培养高校AI人才,飞桨启航计划投入总价值5亿元的资金与资源;2021年,飞桨再发布“大航海”计划,3年投入15亿元资金和资源,李彦宏称,要为中国培养500万AI人才。

目前,飞桨的开发者数量达到535万,生态内创建模型量达到67万个,服务20万家企事业单位,位列中国深度学习平台市场综合份额第一,并一举超越谷歌 TensorFlow 成为全球第二大AI框架[3]。

五年过去,百度对飞桨的支持力度,显然超出了王海峰与吴甜的预想。而飞桨也的确如李彦宏所愿,成功实现了从专业到普惠的破圈。

同一时期,恰好是外界对百度的争议和质疑最猛烈的一段时间。一方面,随着新经济公司轮番上市,“百度错过移动互联网”似乎板上钉钉;另一方面,高附加值产业、尤其是芯片产业核心技术的缺失,成为弥漫在中国科技领域最大的焦虑,对中国公司的苛责也与日俱增。

这其实是百度的AI探索相对尴尬的地方:AI这类前沿科技的成长曲线往往不是线性的,而是大量的研发投入和资本开支的积累,才能形成一个突破的里程碑,其发展路径与制造业中技术突破后的产能规模膨胀,远不可同日而语。

同时,AI在近几年的应用大多集中于数据中心、智慧城市等企业和公共服务领域,即便是在消费市场的应用,也往往集中在某些功能和特性层面,普通消费者对其感知并不算强。

比如2020年,百度发布了自己的第一块量产AI芯片昆仑芯1代。和消费者日常接触的CPU、GPU与手机SoC不同,昆仑芯主要用于数据中心和云计算业务。到了2021年量产的昆仑2代,百度在无人驾驶场景,实现了端到端的性能适配。

很少有人知道,百度搜索其实是当前最大的AI应用场景之一。截至目前,百度的搜索服务每天响应几十亿次用户需求,需要进行1万亿次深度语义推理与匹配[7]。

围绕AI,百度用十年时间,搭建起了一个由芯片层、框架层、模型层以及应用层组合起来的技术架构,每一层之间,都可以通过不断互相反馈,实现端到端优化。在这背后是百度近十年累计投入超过1000亿元的研发开支,核心研发投入占核心收入比例连续8个季度超过20%。

正如ChatGPT今年引起的热潮一样,前沿科技的探索总是隐藏在一个又一个不为人知的角落,以至于它的所有成功看起来都像是横空出世。

与伟大的距离

2022年9月,红杉发表了一篇题为《Generative AI: A Creative New World》的文章,盛赞大模型背后的商业应用潜力,并预言很快会出现“杀手级应用”。而该文的署名作者GPT-3,一个来自OpenAI团队的大模型。

紧接着,基于大模型的AI绘画问世,在全世界范围内卷起一阵AI作画浪潮;时隔几个月,OpenAI团队的新一代大模型ChatGPT推出,能写代码、写小说、做数学题,还能与人类连续对话,越来越接近科幻小说中AI该有的样子。

事实上,Chat-GPT的本质,其实是以GPT-3模型为框架,通过“对话”这一场景,搭建了一个普通用户也能使用的AI应用。换句话说,Chat-GPT在技术上已经非常成熟,但由于GPT-3模型长期以来离主流消费者太远,在一定程度上塑造了Chat-GPT本身的惊艳。

不过伴随Chat-GPT热潮持续,对国内公司的质疑又一次甚嚣尘上,但翻一翻前两年的新闻能发现,早在GPT-3时代,中国公司已经与世界先进水平几乎齐头并进。

2019年,百度在内部推出了“文心”大模型,从轰动一时的AI绘画产品文心一格,到产业级搜索系统文心百中,以及即将推出的AI对话产品文心一言,基础都是类似GPT-3的“文心大模型”。

文心一格根据要求进行的不同风格AI绘画

无论是GPT-3还是文心大模型,其难度都远远不止于技术。

有机构算过一笔账,训练一个GPT-3,至少需要1024张A100显卡持续运转足足一个月,简单估算下来,仅硬件成本支出就高达两千五百万美元。

同时,大模型在训练过程中需要的参数量大、消耗的计算资源大,整个算力集群调度、模型调优同样让人头大。考验的是企业在算法、数据、框架、资源调度等全栈和全流程的综合能力。

更关键的其实是资源,更通俗来说是优质数据。ChatGPT发布之后,不甘人后的谷歌也迅速推出了大模型Bard,可惜首秀即翻车,甚至编造了“太阳系外行星的第一张照片,是用 JWST 拍摄”这样的谣言,问题正是出现在训练所用的数据质量上。

与此同时,做出中文大模型的难度甚至更高。

英文大模型的训练背后,是一座由数不清的英文文献资料库,Quora 、Reddit、github等高质量社区组成的富矿;而中文环境下,不同APP之间是一座座信息的孤岛。另一方面,以中文的博大精深,对上下文语境理解要求更高。

百度的优势在于,旗下不仅有面向专业的百度文库,还有日常向的百度知道、百度贴吧、百家号,同时还向外投资了知乎这样的高质量社区。而在技术层面,百度是市场上少有的全栈布局自研的人工智能公司。所谓全栈,即人工智能从芯片、框架、模型,再到应用的四大环节。

在技术和资源的双重加持之下,百度基于文心大模型研发的数字人度晓晓去年“参加高考”,针对“本手、妙手、俗手”这样的拗口题目,40秒写下40篇高考作文。

文心行业大模型已经在很多个高精尖领域落地,比如在航空领域,文心大模型能够应用在故障部位信息抽取、工程文献情报分类、文献检索与摘要生成等多个应用场景。在传统制造领域,TCL-百度·文心大模型能够在训练样本减少到只有30%~40%的情况下,即可达到原有产线效果,从而缩短产线上线的开发周期。

除此之外,百度的行业大模型还覆盖了能源电力、金融、文娱等多个领域,与国家电网、吉利汽车、泰康保险、浦发银行等多家机构展开了合作。

能够为各行各业带来实际的好处,这是AI从科学变成产业的第一步,也是最关键的一步。

最后一公里

2021年3月,百度赴港二次上市之际,李彦宏在致股东信里再次回顾了创业21年来的风风雨雨:

过去的21年中,每当百度徘徊在十字路口,我都会问自己,什么能够让你真正制胜未来?我认为就是两方面:一是你信仰什么,二是你有多大的决心。从过去到现在,我们的信仰没有变,我们相信技术可以改变世界。

对李彦宏来说,在技术改变世界之前,它得先改变百度。

在过去十几年间,AI带来的变革,实实在在地在百度内部发生着:2005年,百度知道上线,在AI的作用下匹配问题和回答者;2012年,在语音识别领域,百度仅用了三个月就上线了语音搜索,55天就开发完成了语音助手。在图像处理上,百度上线了全球首个人脸搜索产品,以图搜图准确率从20%提升到80%。

作为百度支柱业务的搜索,也在被AI悄无声息地改变着。以框计算、智能计算为代表的AI技术,已经替代了李彦宏二十年前发明的超链,成为如今搜索引擎的核心技术支撑。

拿百度去年发布的新索引技术“知一”来说,借助跨模态大模型,它可以从文字、图片、视频、结构化信息等资源中不断学习,从而更精准地呈现搜索结果。与之同时发布的还有一个叫做“千流”的索引技术,它通过AI技术解决了内容质量参差不齐的问题。

最核心的搜索之外,AI也改变了公众对于百度是谁的认知。

在2017年之前,公众对于百度的印象仍然停留在“搜索”上面,直到这一年的百度AI开发者大会才恍然大悟:百度竟然还是一家科技公司。

大会当天,李彦宏坐在一辆自动驾驶汽车赶来会场。在全程直播画面中,百度的自动驾驶汽车在车水马龙的北京道路上穿梭,完美避障、行驶平稳。

这次的亮相让李彦宏和百度自动驾驶引起了轰动,但却不是以技术实力,而是上了社会新闻:有网友发现,当时北京尚不允许无人驾驶汽车上路,李彦宏“违章驾驶”了;于是,百度先吃到了一张来自交警的罚单。

但就连百度也没有想到,这个计划外的乌龙开头却间接改变了中国自动驾驶法律法规的进程:

四个月后,北京自动驾驶路测新规落地;此后几年内,百度的无人车又相继落地上海、广州、深圳;去年,百度在重庆、成都等地实现了全无人自动驾驶出租车的商业化运营,曾经遥不可及的Robotaxi也似乎照进了现实。

此时,距离李彦宏决定做自动驾驶已经过去了四年。一直以来,李彦宏都将自动驾驶视作是人工智能最顶级的工程,他坚信智能汽车会像是智能机器人一样,彻底改变人类的工作和生活。

百度的许多业务都是如此,它们在改变百度的同时,也改变了我们对未来世界的想象。

百度最新自动驾驶汽车RT6

在百度AI改变世界的故事里,不只是有科学家、工程师们的身影,还有形形色色的普通人:

12岁的初中生,通过使用飞桨中零门槛的easy DL,开发出了一款口罩佩戴检测程序,实现了三千多次调用。零基础的小白,也能在工具的帮助下,快速步入AI的世界。

有年轻人借助百度的AI算法简单训练,就开发出了盲人头戴式露面实时信息采集设备,以语音或震动形式为盲人导航。有了低成本的AI加持,善意加速流向那些不曾被关注的角落。

还有西藏的边区医生,利用百度的电子图像识别技术,训练AI识别寄生虫卵,准确率高达97%。即便是在缺医少药的西藏边区,也能享有国内顶尖专家的医疗服务[8]。

无论是文心大模型、飞桨平台,还是自动驾驶,百度AI正在以不同的方式越来越多地介入到我们的工作和生活中,李彦宏距离那个AI改变世界的梦想,也越来越近了。

尾声

1962年,肯尼迪总统在赖斯大学做了个演讲,号召美国人支持登月计划。说起这个,他激情澎湃:“我们决定登上月球,并非因为它轻而易举,正是因为它困难重重。”

在当时,登月计划并不被美国民众所理解,一些人认为这只是无意义的太空竞赛,并不能对社会带来什么实质性的好处。

登月很贵,这让它招致了大量的批评。登月计划发布之后,美国宇航局NASA的开支水涨船高:第一年就花掉了100万美元,四年后变成了每三个小时就要花100万美元,NASA一跃而成为预算第三大的联邦机构,与农业并列。

一项数据表明[4],这是人类迄今为止做过的最难的事情。巅峰时期,超过41万美国人为了这项计划而努力。从宇航员到一线工厂工人,数十万人在地球上工作了28亿小时——换来了11次载人任务中,宇航员在太空中停留了2502个小时。

这个野心勃勃的计划不像原子弹那样实现了一项基础科学的重大突破,却在科学、工程、计算机等多个领域催生了数以千计的创新。

拿芯片来说,1960年,德州仪器做出了全球第一款商用集成电路产品。但它的真正落地,却是在两年后的阿波罗计划中。

公文包大小的阿波罗计算机

当时,MIT要为NASA设计阿波罗计算机,便从德州仪器那里买了64块集成电路。结果,MIT发现这款集成电路的速度相比晶体管提升了2.5倍,同时所需空间少了40%——即便是“小型”计算机也有冰箱那么大,而阿波罗计算机只有公文包大小,每秒可以处理85000条指令。

因为阿波罗对大规模计算的需求,自此美国计算机芯片产业驶上了快速路:1962年,NASA买下了所有的芯片,每个售价1000美元;1963年,NASA采购了3000个芯片,每个芯片降到了15美元;到了1969年,每个芯片只需要1.58美元[5]。

结果就是,芯片的价格急速下降,政府采购占比越来越低,越来越多的企业开始用上了便宜的芯片——现在,iPhone14每秒可以运算17万亿次,当年的阿波罗计算机需要工作2315天。

阿波罗计划暂时还没能把我们带向一个太空时代,但数字时代却是因它而起。眼下,无论是百度的文心大模型,还是海外OpenAI的GPT大模型,正是全人类在AI时代的登月计划。

在这背后,是算力、算法、数据各种核心要素的集中试炼;以此为牵引,人才供给、科研支持、商业应用,一个庞大的创新生态系统构建形成,为创新提供了源源不断的养分。

而大模型背后的框架引擎,则是一个时代的核心“根技术”,以开源的理念,平等的共享来自最顶级大脑的思维火花与研究成果,在此基础上终将会长出万物智能的参天大树。

正如李彦宏在“文心一言”发布会的结尾所说的:

“我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”

最引人注目的科技进步,往往来自孤注一掷的决定和漫长时间里的等待。无数人都在畅想星辰大海,但只有极少数人愿意去尝试摘下那颗星星。

参考资料

[1] 博鳌李彦宏对话盖茨和马斯克,新浪

[2] 李彦宏内部邮件:从PC到移动互联网需要狼性

[3] 百度CTO王海峰公布飞桨最新进展:535万开发者、20万企事业单位,百度

[4] The one statistic that shows that going to the Moon is the hardest thing we’ve ever done

[5] How NASA gave birth to modern computing—and gets no credit for it

[6] 与百度有关的日子,浅黑科技

[7] 百度的十年,中国科技创新的技术路径,远川研究所

[8] 人工智能助力提升基层医疗能力,中国网

作者:刘芮/胡晓琪

编辑:戴老板

视觉设计:疏睿

责任编辑:李墨天