人工智能专家迈克尔·伍尔德里奇表示:“我并不担心机器人会接管世界。”他谈到了大型科技公司带来的真实风险,以及偶尔带来的益处。

人工智能专家迈克尔·伍尔德里奇表示:“我并不担心机器人会接管世界。”他谈到了大型科技公司带来的真实风险,以及偶尔带来的益处。

迈克尔·伍尔德里奇就像你希望拥有的那种老师:易于交谈,擅长将复杂概念拆解为简单术语,不故作高深也不刻意扮酷,对自己的工作充满真诚的热情。"当看到别人眼中灵光一闪,理解了他们之前不懂的东西时,我特别开心,"他说,"我觉得这非常有成就感。"

他给人的印象是个普通人,但作为一位拥有500多篇科学论文和10本著作的牛津教授,他显然不是。他最喜欢的工作是为瓢虫出版社的专家系列图书——经典儿童系列的更新版——撰写人工智能分册。"我对此非常自豪,"他说着,从书架上取下一本递给我。我们在他牛津大学计算机系的办公室里,这个系看起来相当普通。春日阳光明媚,也许是校园氛围使然,我们的对话几乎像一场研讨会。

伍尔德里奇是一位出色的公共演讲者,尤其是在人工智能领域——他从事这个领域已超过30年,但仍带着健康的怀疑态度。在2023年为英国皇家研究院举办的圣诞讲座《AI的真相》中,他带来了一只机器狗,并让学龄观众投票是否会用棒球棍打它。为了解释强化学习,他重现了80年代经典电影《战争游戏》的场景:年轻的马修·布罗德里克通过让美军计算机与自己玩井字棋(直到它意识到没有真正的获胜方式)来阻止核灾难。"马修·布罗德里克当时在伦敦。我们试图邀请他参加圣诞讲座,但他来不了,"伍尔德里奇说,"所以我们以他的名义把计算机命名为布罗德里克。"

《战争游戏》实际上与伍尔德里奇的新书《博弈论的人生智慧:在复杂世界中战略性思考的艺术》主题非常接近。他说,他已经教这门课超过15年了。现在轮到我们了。伍尔德里奇的书里没有数学公式;相反,他把博弈论变成了21个易于理解的场景,涵盖从大西洋鳕鱼捕捞到百事可乐与可口可乐之争,再到上帝是否存在等方方面面。

"令人惊讶的是,全球许多事件都可以用相对较少的博弈论模型来解释,"伍尔德里奇说。最简单的模型之一是"懦夫游戏",他在书中用詹姆斯·迪恩的电影《无因的反叛》中的场景来说明(他承认,他的学生中没人听说过这部电影)。两个青少年开车冲向悬崖;先跳车的人是"懦夫"并输掉比赛。如果同时跳车,则是平局;如果都不跳,则输得很惨(剧透:电影里就是这种情况)。

这里的理论教训是关于纳什均衡(我们不会深入细节)——但在现实中,我们经常看到这种游戏在真实生活中上演。古巴导弹危机曾是经典例子,但另一个例子正在上演:美伊冲突。"双方都在不断升级对彼此的威胁;总有一方必须在某个时刻让步,"伍尔德里奇说。"危险在于,如果双方都不让步,就会越过不可逆转的临界点,导致对所有人来说最糟糕的结果。"

有没有办法摆脱这种局面?"嗯,改变游戏的一种方式是第三方介入,为一方提供不同的激励。"另一种选择是通过与对手沟通来绕过游戏。这在古巴导弹危机中发生过,但在这里似乎不太可能。"不过,我必须说,伊朗似乎玩得更聪明,因为美国方面非常非常不可预测。不可预测本身也是一种经典的博弈论策略,但这让另一方很难知道如何应对。如果你真的面对一个非理性的玩家,博弈论的一个建议是,你只能对冲风险,为最坏情况做准备。"

伍尔德里奇强调,这不仅仅关乎战争或游戏。在他的书中,他将博弈论定义为"一种旨在理解自利方相互互动情况的数学理论"。他认为这可以应用于各种情况:社会、政治和哲学。

例如,"零和游戏"的概念已成为一个常用术语(部分归功于《战争游戏》),尽管它被广泛误解。伍尔德里奇解释说,零和游戏不仅仅是"一方所得即另一方所失";它是指目标在于尽可能让对手输得惨的游戏。所以,严格来说,国际象棋不是零和游戏,因为你只是想赢,而不是要摧毁或羞辱对手。这有社会和政治层面。"这种零和思维非常有害。这是一种非常男性化的特质,"他说。"证据表明,你不仅不一定能在生活中取得尽可能好的成绩,而且实际上会更痛苦。你会觉得对自己的事务控制更少。博弈论的一个关键教训是,实际上,我们大多数互动都不是零和的。"

这种对抗性的世界观推动了民粹主义政治——比如"移民来抢你的工作"这种说法。你输是因为别人赢了。伍尔德里奇最喜欢的一个游戏鼓励我们反向思考:哲学家约翰·罗尔斯在1971年创造的"无知之幕"。其理念是,你可以随心所欲地设计社会,但之后你会被随机放置在其中。伍尔德里奇称之为"一个美丽的思想实验……它鼓励社会向好的结果发展,但人们仍然遵循自身利益。"他补充说,比尔·克林顿和巴拉克·奥巴马都是它的粉丝。

博弈论如何与人工智能结合并不明显,但如今,它是其中的重要组成部分,伍尔德里奇解释说,尤其是在他主要感兴趣的领域:多智能体系统——相互互动并代表你行事的程序。"所以,如果我想安排与你会面,为什么我要打电话给你?为什么我的Siri不直接与你的Siri对话?"这类互动已融入我们的在线生活。例如,像eBay上的在线拍卖,你试图在最后一刻偷偷出价获胜。"如果我的智能体要与你的智能体互动,而我的偏好不一定与你的匹配,那么解释你应该如何思考这些互动的理论就是博弈论。"

当伍尔德里奇刚开始时,人工智能几乎是一个抽象概念。他通过业余爱好进入计算机领域。他在赫里福德郡乡村长大,是当地苹果酒公司一名中层经理的儿子。大约1980年,当地电子商店有一台家用电脑出售,这对他来说是一件大事。"这听起来很荒谬,因为我以为计算机是价值数百万英镑的东西。"店主好心让他试用(那是一台Tandy TRS-80)。"我一周又一周地回去,自学编程。我 literally 坐在商店橱窗里的电脑前。"他后来攻读计算机本科,1989年开始攻读人工智能博士学位,随后在JANET(联合学术网络,基本上是早期互联网的英国部分)实习。自那以后,技术飞速发展,但正如伍尔德里奇所说,"推动当前人工智能革命的核心技术是在80年代中期发明的。"他提到了杰弗里·辛顿,人工神经网络的先驱——这种机制现在驱动着机器学习。"80年代人工智能革命的唯一障碍,实际上是计算机不够强大,而且我们没有足够的数据。"

下一代有影响力的人将同意将他们所说、所做和所见的一切用于人工智能。

归根结底,伍尔德里奇说,2020年GPT-3的突破性成功很大程度上"基于OpenAI的一个赌注:如果他们做同样的事情,只是规模大10倍,就会产生结果。当时很多人,包括我,对此非常怀疑。我是一名科学家;我希望通过科学发展取得进步,而不仅仅是投入更多计算能力。但事实证明,这确实是一个非常成功的赌注。"这是否意味着OpenAI老板山姆·奥特曼和他的同行并非人们认为的技术天才?"我从未见过山姆·奥特曼;我不知道,"他外交辞令地说。"他显然取得了非凡的成就。"

无论是不是天才,这些人工智能先驱可能正在接近极限。几年前,像奥特曼和谷歌DeepMind的德米斯·哈萨比斯这样的人预计在几年内实现AGI——人类水平的人工通用智能。"我个人认为他们过于乐观了,"伍尔德里奇说。你可以用拉丁语与ChatGPT讨论量子力学,他指出,"但与此同时,我们没有能够进入你从未见过的房子、找到厨房并清理餐桌的人工智能"——这是最低工资的人类工人能做到的事情。

"限制因素是你能投入的计算能力和数据。而数据现在是一个真正的约束。"他说,整个维基百科只占GPT-3训练数据的3%。"下次你从哪里获得10倍的数据?"因此,数据正成为一种宝贵资源,一些组织拥有潜在的数据宝库。"NHS拥有大量关于人类的数据。这是可以想象到的最有价值的数据。"私营公司会为此付出高昂代价,他说,"但我怀疑任何签署此类协议的人都会后悔。"他设想了一个反乌托邦的未来场景:"只有当你同意佩戴可穿戴技术,定期监测你时,你才能使用NHS……我认为我们正在迅速走向一个世界,下一代在线影响者基本上同意将他们所有的生活经历、所说、所做和所见的一切都收集起来,为人工智能提供数据。"

从学术角度来看,伍尔德里奇对硅谷在人工智能领域的主导地位感到不满,无论是在资源方面("训练GPT-3需要2万多台人工智能超级计算机;整个牛津大学可能只有几百台")还是在公共讨论方面。"我们看到叙事被硅谷窃取,他们推广一种人工智能版本[利润驱动、取代工作、几乎完全专注于大型语言模型],这当然我和我的许多同事都没有兴趣推广或构建,"他说。"这有点令人沮丧,作为一个毕生致力于构建人工智能以创造更美好世界和改善人们生活的人。"

他继续说:"如果你看大局,人工智能提供了巨大的好处,这些好处往往被忽视,因为大型语言模型占据了所有注意力。"他提到牛津的一个团队正在开发一种人工智能工具,可以通过简单的超声波分析心脏扫描,并通过手机发送给全科医生。"这是NHS难以提供的昂贵护理,突然以非常低的成本变得可用。"

2025年,伍尔德里奇因向公众解释科学思想的技巧获得了皇家学会著名的法拉第奖。他2月份的讲座题为《这不是我们被承诺的人工智能》。大约在那时,他暗示人工智能可能有一个"兴登堡时刻"——兴登堡号坠毁一夜之间摧毁了飞艇行业。"我们完全有可能看到类似的人工智能相关灾难,"他说。"计算机程序以各种方式失败,而我们完全依赖于一个日益嵌入人工智能的计算网络。"尽管如此,当谈到生存风险时,"人工智能不在我夜不能寐的清单前列,"他补充说。"我不担心机器人接管。至少,它不在我的前五名。"但他认为核战争是更大的威胁,这并不令人安心。

如果可以,他会放慢人工智能的发展,"只是为了让我们有更多时间理解正在发生的事情。"他指出,这是一个经典的"囚徒困境",博弈论中的一个关键概念。在标准场景中,两名囚犯必须分别决定是否承认他们共同犯下的罪行,还是保持沉默。如果一人认罪而另一人不认,只有认罪者获释。如果两人都认罪,他们各服较短的刑期。如果两人都保持沉默,他们服更短的刑期。所以如果两人都同意保持沉默,他们会更好,但谁也不知道对方会怎么做。反直觉的是,博弈论认为最聪明的做法是认罪。

按照同样的逻辑,人工智能公司陷入了一场争先恐后的竞赛。他们的竞争导致了更多的支出、资源和耗能的数据中心,对人类没有净收益。但事实就是如此。"我们有少数非常富有的公司在追逐人工智能,同时又说他们担心事情会出大问题。那他们为什么还在追逐?因为他们认为如果退缩,别人就会上。"

他自己是否曾被硅谷诱惑过?"有几个时刻可能发生,我猜,"他说。"但我今年就60岁了,现在这是年轻人的游戏了。"有些人认为学习已经没有意义,因为人工智能预计将取代大量人类活动。伍尔德里奇不这么看。"我进入计算机领域不是因为我认为它会给我一份好工作。我进入它是因为我真正感兴趣。"他说许多父母问他他们的孩子大学应该学什么,"答案是:'让他们学他们真正热爱的东西。'我认为这是迄今为止最重要的事情。"

《博弈论的人生智慧:在复杂世界中战略性思考的艺术》由迈克尔·伍尔德里奇著,将于5月21日出版(Headline出版社,25英镑)。为支持《卫报》,请在guardianbookshop.com购买一本。您对本文提出的问题有看法吗?如果您想通过电子邮件提交不超过300字的回复以供考虑发表,请这样做。要将您的信件发表在信件专栏,请点击此处。

**常见问题解答**

以下是基于本文主题的常见问题列表,以自然语气和清晰直接的回答撰写。

**初级问题**

1. 等等,不是每个人都害怕人工智能会接管世界吗?为什么这位专家不担心?
答:伍尔德里奇教授说,机器人接管的想法更像是科幻小说而非现实。他认为我们离创造有自己目标或意识的机器还很远。真正的危险不是机器人叛乱,而是人类如何使用这项技术。

2. 如果我们不用担心机器人末日,我们应该担心什么?
答:最大的风险来自控制人工智能的大型科技公司。他担心隐私丧失、有偏见的算法做出不公平的决定以及错误信息的传播。危险不在于人工智能本身,而在于它赋予运行它的人的力量。

3. 那么人工智能实际上有什么好处吗,还是全是坏处?
答:并非全是坏处。伍尔德里奇教授指出了真正的好处。人工智能擅长特定的重复性任务,比如在医学扫描中检测疾病、优化交通流量和帮助科学研究。关键在于将其用作工具,而不是人类判断的替代品。

4. 大型科技公司与此有什么关系?人工智能不只是一个计算机程序吗?
答:大型科技公司拥有训练最强大人工智能所需的巨大计算能力和海量数据。他们决定如何构建它以及谁可以使用它。风险在于少数公司对影响每个人的技术拥有过多控制权。

**高级问题**

5. 文章提到了偶尔的好处。伍尔德里奇强调的具体现实世界好处是什么?
答:他经常指出科学和医学的突破。例如,人工智能可以在几小时内分析数百万种蛋白质结构,而人类需要数年才能完成。这极大地加速了药物发现和我们对疾病的理解。

6. 什么是对齐问题,伍尔德里奇认为它是一个真正的威胁吗?