断断续续,用了两个星期,读完了这本关于当代人工智能的书。
这几年,人工智能太热了。热到什么程度呢?几乎每隔一段时间,就会有一本新书出来,讲大模型,讲深度学习,讲人类未来,讲职业替代,讲某个不可逆转的新纪元。书名一个比一个响,封面一个比一个急。翻开以后,却常常读不下去。许多作者写人工智能,像是在复述几篇新闻稿;写深度学习,像是在讲一个突然从天上掉下来的神迹。仿佛某一天,世界还在按旧规则运转,第二天,神经网络一觉醒来,便成了时代的主人。
事情当然不是这样。
真正的技术革命,从来不是突然发生的。它只是到了某个时刻,终于被众人看见。在此之前,总有人在黑暗里走了很久,走得很慢,也走得很孤独。灯还没有亮,掌声还没有来,同行甚至未必承认那是一条路。若没有这样的前史,后来的热闹就显得轻了。
这本书好看的地方,正在这里。
它没有只写深度学习如何成功,也没有急着把人工智能包装成一个注定胜利的故事。它写那些人,写那些长期不被看好的研究,写一个领域怎样几次沉下去,又怎样在少数人的坚持中慢慢浮上来。读到后来,会觉得这不只是一部技术史,也是一部关于信念、固执、误解、机会和时代回报的故事。
杰弗里·辛顿这个名字,如今已经很响了。
图灵奖,诺贝尔物理学奖,深度学习教父。几个称号放在一起,足以让后来者仰头观看。可是若只看这些结果,很容易误会,以为他一路都站在风口中央,以为世界从一开始就承认他的判断。事实上,神经网络在相当长的时间里,并不受主流人工智能界待见。那时更流行的是符号主义,是规则,是逻辑,是专家系统。人们相信,智能大概应当被清清楚楚地写成规则,像数学证明一样,一步一步推出结论。
这种想法有它的诱人之处。
一个受过科学训练的人,很容易喜欢清楚的规则。输入是什么,条件是什么,推理过程是什么,输出又是什么,一切都能解释,一切都能追踪。神经网络则不同。它看上去有点黑箱,有点笨,有点不优雅。把大量数据喂进去,调很多参数,让它自己慢慢学。这样的东西,在许多人眼里,既不像严格的科学,也不像真正的智能。
可是辛顿偏偏相信它。
这种相信并不容易。年轻人相信一个新方向,尚可说是血气;一个人多年相信一个不被看好的方向,就已经不只是激情了。那里面有判断,也有性情。有时甚至还要有一点近乎不合时宜的固执。别人都换了题目,换了话语,换了阵营,他仍在那里,像守着一小块还没有被证明有矿的土地。
我读到这里时,心里是有些感慨的。
做研究的人,大概都知道这种处境。一个问题,你觉得它重要,可别人未必觉得;一个方法,你觉得它有前途,可论文不好发,经费不好拿,学生也未必愿意跟。时间一长,人很容易动摇。不是每个人都能在冷清里守住十年、二十年。我们常说热爱,其实热爱若没有制度回报、同行认可和现实支持,很快就会变得很薄。能留下来的,常常不是最会说话的人,而是心里真有一团火的人。
辛顿身边后来聚起了学生。
伊利亚,如今很多人都知道了。OpenAI 的创始 CTO,技术气质很重,甚至有一点传说中的神秘。他的名字常常与大模型的崛起连在一起。可另一个学生阿列克斯,普通读者知道得少些。事实上,AlexNet 这个名字里的 Alex,便来自他。这个有些宅、有些纯技术气质的年轻人,和辛顿、伊利亚一起,做出了后来被反复提及的那个转折点。
ImageNet 比赛,是深度学习重新站到舞台中央的一次标志性事件。
李飞飞推动 ImageNet,本来是想给计算机视觉一个足够大的数据集。没有大规模数据,许多算法优劣其实很难真正比较。过去小数据集上看起来不错的模型,一旦面对更复杂的真实世界,常常就露出局限。AlexNet 在比赛中一举夺魁,不只是多赢了几个百分点,而是让许多人忽然意识到:原来这条路真的能走通。
那一刻,像一扇门被推开了。
后来谷歌花四千四百万美元收购辛顿师徒三人的公司。那家公司几乎没有产品,甚至很难说有完整的商业模式。值钱的就是这三个人,或者更准确地说,是这三个人背后的判断力和技术前景。今天回头看,四千四百万美元当然不算贵。可在当时,这仍然是一种极其敏锐的押注。大公司有时笨重,有时迟缓,可一旦它看见了真正的拐点,也会毫不犹豫地伸手。
这让我想起许多技术史上的旧事。
当年晶体管刚出现时,也并不是所有人都立刻明白它会改变世界。Unix、C 语言、互联网、个人计算机,最初都多少带着一点边缘气。真正改变世界的东西,常常不是一开始就被铺上红毯迎接。它先是在某个实验室里、某个车库里、某个不起眼的论文里,以一种并不体面的方式出现。许多人看见了,却没有放在心上。只有少数人觉得,这里有东西。
杨立昆、约书奥、哈萨比斯,也都是这样的人。
他们当然性格不同,路径不同,所处的机构也不同。杨立昆后来在 Meta,约书奥在学术界和产业界之间影响深远,哈萨比斯创立 DeepMind,又把强化学习、神经网络和游戏结合起来,做出 AlphaGo 那样震动世界的东西。可是这些人身上,有一点相通:他们都不太像循规蹈矩的人。
原书名里的 Mavericks,用得真好。
中文里很难找到一个完全贴切的词。说“天才”,太亮;说“异类”,又太冷;说“不合常规的人”,意思到了,气息却弱了些。Maverick 里有一种不肯完全归队的劲儿,有一点冒险,也有一点孤独。这样的人,不一定好相处,也未必总是正确。可一个领域若没有这种人,就很难真正向前。
科学史上,许多重要人物都有这种气质。
费曼不喜欢端着,讲课像聊天,却能把最深的物理讲得清澈;泡利毒舌到近乎伤人,却守着物理学极高的标准;图灵孤独地想着机器能否思考,后来整个人生都让人叹息;钱学森、冯·诺依曼、维纳这些人,也都不是普通意义上的“合格员工”。他们身上有一种东西,不容易被管理,也不容易被格式化。可许多真正的新路,恰恰是这样的人走出来的。
这本书的中译本,我有两点不太满意。
第一是人名翻译有些别扭。技术领域的人名,若译者不熟悉,常常会译得隔了一层。读者明明知道说的是谁,却总觉得口感不对,像鞋里进了一粒小沙子。第二是书名实在可惜。现在这个名字,容易让人误以为是一本技术书,好像要讲反向传播、卷积网络、梯度下降和模型训练。其实它最动人的地方,不在技术细节,而在人。
原书写的不是公式如何推导,而是人如何相信。
这两件事当然有关。没有技术细节,信念就容易变成空话;可若只看技术细节,又会错过历史真正的纹理。深度学习的兴起,不只是算法进步,也不只是算力增强、数据变多。它还是一批人长期坚持某种判断,等来了时代条件的成熟。GPU、大数据、互联网公司、开源框架、学术竞赛、资本投入,这些因素一层一层叠起来,才终于把过去看似笨拙的神经网络,推到了世界中央。
读这样的书,会让人对“成功”这件事稍微多一点耐心。
我们总喜欢把成功讲成几条经验:选择正确方向,坚持长期主义,抓住时代机遇。话都对,却也都太干净。真实的过程往往没有这么整齐。许多人在坚持时,并不知道自己将来会被证明正确。辛顿他们当年做神经网络时,也不可能预先知道某一年会出现 ImageNet,某一年会有足够便宜的 GPU,某一年大公司会开始疯狂争抢 AI 人才。人在历史中行走时,只能看见眼前一小段路。所谓远见,很多时候不是看见全部未来,而是在别人不信的时候,还愿意沿着自己相信的方向多走几步。
这一点,对我尤其有触动。
很多年前,我读米歇尔·沃尔德洛普的《复杂:诞生于秩序与混沌边缘的科学》时,也有过类似的激动。那本书写圣塔菲研究所,写复杂系统,写一群不同学科的人怎样试图理解秩序如何从混沌边缘生长出来。那时我读得心潮澎湃,几乎想立刻转向复杂科学。可是最后没有。原因说起来也简单:胆量不够,路径依赖太强,熟悉的研究方向已经铺在那里,真要完全转身,并不容易。
一个人年轻时,总以为自己很勇敢。
后来才知道,真正的勇敢不是在嘴上说喜欢新东西,而是在需要付出代价时,还能不能真的往前一步。转方向很难。你过去积累的论文、方法、人脉、评价体系,都在原来的地方。新领域则什么都没有,甚至连自己能不能入门都不知道。于是,许多人会像我当年一样,站在门口看很久,心里很向往,却没有进去。
今天回头看,当然有遗憾。
可人生若总用遗憾来丈量,也未免太不厚道。每个人都有自己的局限,也都有自己的迟到。有些门,年轻时没有进去,中年以后才重新推开,也不能说完全太晚。至少今天,我还能看到深度学习的前景,还能重新学习,还能在一个快速变化的领域里,笨拙地寻找自己的位置。对我这样一个年纪已经不轻的人来说,这已经是一件值得庆幸的事。
以前在学校时,我常常觉得自己的研究与社会有些脱节。
做理论,做计算,当然也有它的价值。一个问题若足够清楚,哪怕很小,也值得认真做下去。可是心里总有一点惶恐:这些推导、这些积分、这些程序,究竟能在多大程度上碰到真实世界?当然,科学不能只以直接应用来衡量。许多最深的理论,最初都没有用处,后来却改变了世界。可即便如此,一个研究者若长期完全不面对现实问题,心里难免会虚。
人工智能给了我另一种感觉。
它很新,也很乱;它有泡沫,也有真东西;它被资本和媒体推着跑,也确实在改变许多行业。它不是书斋里的纯粹游戏,而是正在进入医疗、教育、科研、制造、办公、写作、编程和日常生活。它的问题复杂,边界模糊,伦理、制度、技术、商业纠缠在一起。可正因为如此,它让人觉得,自己所学的东西还有机会与现实重新接上。
我喜欢这种感觉。
不是因为它一定会带来成功。到了这个年纪,对成功二字,已经不敢看得太重。年轻时总觉得,做一件事,最好能有结果,有名声,有认可。后来慢慢知道,许多事真正留给人的,并不是结果,而是自己有没有认真走过那一段路。若能在一个值得投入的方向上,重新学习,重新犯错,重新感到自己无知,又重新被某个问题吸引,这本身已经有一种久违的生气。
深度学习的故事,也让我再次相信一件事:真正的研究,终究要解决问题。
这个“问题”未必立刻实用,也未必马上变成产品。但它必须真实。它要么解释世界,要么改变方法,要么打开一条别人没有走通的路。若只是围着概念打转,只是在既有体系里写一些安全的文字,久了便会疲。人心里知道,自己是不是在真正往前走。
辛顿、杨立昆、约书奥、哈萨比斯这些人,让人羡慕的,不只是他们站到了时代中央。
更让人羡慕的,是他们曾经在尚未被时代认可时,就已经把自己交给了问题。那时没有今日的荣誉,没有媒体采访,没有大公司的职位和天价收购。他们面对的只是一个尚不清楚的方向,一堆不稳定的实验,一些不友好的同行意见,还有漫长的等待。若没有那段时间,后来的荣耀便没有根。
读完这本书,我把书合上,心里反而安静了一些。
人工智能的浪潮当然还会继续往前。它会带来兴奋,也会带来混乱;会成就一些人,也会淘汰一些旧方法;会有真正的突破,也会有许多泡沫在风里散掉。我们不知道十年之后,它会走到哪里。就像当年的辛顿,也未必知道神经网络后来会走到今天。
可是,有些事情仍然可以确定。
一个人若还愿意学习,愿意承认自己不知道,愿意从头读论文、写代码、做实验、看错误信息,愿意在一个陌生领域里慢慢摸索,他就还没有完全被时代甩下。也许走得慢,也许追不上最年轻的人,也许最后做不出惊天动地的成果,但至少还能在路上。
这已经很好。
很多年前,我读《复杂》时,曾经站在一扇门前,没有进去。今天读《深度学习革命》,像是又看见了一扇门。门后当然仍有雾气,也有许多我不懂的东西。可这一次,我愿意再往前走一走。
哪怕走得慢一点。
哪怕最后没有成功。
也不后悔。