微软CEO纳德拉:AI不会失控,还能让80亿人更富裕

智东西6月18日消息，近日，外媒《连线》记者史蒂文·利维（Steven Levy）与微软CEO兼董事长萨提亚·纳德拉（Satya Nadella）就微软的AI投资及其背后故事、未来愿景展开了一场深入对话。

此次访谈中，纳德拉畅谈了让他成为AI的信徒的瞬间、与OpenAI合作的幕后故事、对行业龙头谷歌的挑战、AI的未来愿景，也回复了马斯克等人要求暂缓AIGC落地的倡议。

▲微软CEO兼董事长萨提亚·纳德拉，图片来源：彭博社

纳德拉所领导的微软是最早加入AI潮流的公司之一，当其2019年投资的初创企业OpenAI开发出令世界震撼的ChatGPT后，它迅速向OpenAI投资100亿美元，并发布了名为“Copilot”的代码自动补全工具，让开发人员、企业和个人都能利用AI。之后，他又通过名为“Sydney”的聊天机器人将OpenAI最先进的大语言模型（LLM）集成到Bing中，引发新一轮搜索引擎变革。

▲图片来源：美联社

根据投资管理公司Baron Funds的数据，自纳德拉接任首席执行官以来，微软的股价上涨了七倍。市值达2.4万亿美元。他对AI迅速而广泛的采用，表现出一种积极大胆的态度，相信每个人都想听听他对AI的看法。我们先带大家快速回顾本次访谈中的五个重要时刻，并在最后附上此次采访的全文编译。

一、GPT-4译出诗歌真谛，触动微软All in

尽管AI已经存在多年，但纳德拉意识到AI可能会改变世界，却是在GPT-2.5升级到GPT-3的时期。据他描述，那是AIGC（生成式AI）能力开始显现的时刻：“我们没有对它进行单纯的编码训练，它却十分擅长编码。那时起，我成为了AI的信徒。”

而真正扣动扳机、让微软决定全力支持AI的，是当他感受到GPT-4翻译能力的那个瞬间。他解释称，虽然机器翻译已经存在一段时间也取得了很多突破，但无法捕捉所翻译文本微妙之处，而GPT-4弥补了这个问题。

他说：“我在印度海德拉巴长大，一直希望能够读懂波斯诗歌，尤其是诗人鲁米的作品，它已被翻译成乌尔都语，后被译为英语。但是，GPT-4一口气就做到了，这不仅仅是简单的机器翻译，而是跨越两种语言边界还保留了诗歌的精髓。这真的很酷。”

▲图片来源：Cloudbooklet

二、没有明确回应是否会收购OpenAI

在访谈中，利维质疑微软为什么选择与OpenAI合作，而不是创建新的大模型，或完善自己的Turing大模型，毕竟微软已经在这个大模型上努力十多年了。

纳德拉回应称，微软看到了为单一平台搭建根基的机会，而不是试图训练五个基础模型。在与OpenAI的合作中，微软将处理工具并承担确保AI安全和合规的责任，而前者可以继续使用他们更先进的模型。

利维还快速了解了OpenAI和微软如何围绕其明确的非营利章程开展工作，OpenAI开设了一个营利性实体，两家公司也可以分别从中获利。值得注意的是，纳德拉并没有明确回应微软是否会收购OpenAI。

▲图片来源：Shutterstock

三、Copilot帮助下，开发将变得大众化

纳德拉说：“我最兴奋的事情之一就是将快乐带回开发中。”

他相信在Copilot的帮助下，开发将变得大众化：“（享受编程快乐的）人数可以乘以10，1亿人可以是10亿人。当你向LLM发出指令时，你就是在对其进行编程。”

纳德拉还讲述了微软AIGC工具改变印度人生活的一个小故事：

“印度政府有一个名为‘数字公共产品’的项目，其中一个产品是文字转语音系统。在演示中，一个农民正在使用该系统询问他在新闻上看到的一项补贴计划。

系统告知他有关该计划的信息以及他可以填写的申请表格。印度的一个开发人员就所有印度政府文件对GPT进行了训练，因此系统会自动用不同语言为他填写表格。”

纳德拉称自己的梦想便是人人都拥有AI助手。

利维还询问了AI如何具体改变了他的工作，纳德拉分享了使用Outlook中的Copilot进行电子邮件分类对他工作的巨大改变。

▲使用Outlook中的Copilot进行电子邮件分类，图片来源：微软

四、冲击谷歌？谁能让AI落地才是真

利维指出，过去谷歌一直是搜索类软件的行业龙头，微软迅速而广泛地把AIGC功能加入Bing，挑战谷歌地位。纳德拉如何看待微软Bing对谷歌搜索的冲击？

纳德拉回应称：“不在于谁拥有能力，而在于谁能真正发挥这种能力并将其转化为有形的产品。”

他甚至放出豪言，要让谷歌像黯然落幕的搜索引擎Alta Vista一样被淘汰，Alta Vista曾在90年代风靡一时，但在谷歌对其创新后便迅速衰落，2003年被雅虎收购，在2013年正式关闭。

▲图片来源：VICTOR HABBICK VISIONS / Science Photo Library

五、AIGC有风险，但微软不会让它失控

谈到失控的AI时，纳德拉认为认为这种担忧与其说是技术问题，不如说是社会文化方面的考虑。并强调面对这项强大的技术，人类要努力控制住局面。

此外，他还回应了特斯拉CEO埃隆·马斯克（Elon Musk）等人要求暂缓GPT落地的举措。

“回想一下蒸汽机首次部署和工厂创建的时候。如果我们同时考虑到了童工、工厂污染问题，我们是否可以避免几百年的可怕历史？因此，无论何时，当我们对一项新技术感到兴奋时，考虑一下意外的后果是非常好的。”

他认同AIGC使用带有具有风险，也尊重这种技术的顾虑。但他不认为需要为此恐惧，这是一种推卸自身责任的行为，因为一项技术永远不应该失控。他列举了电力与核能的例子，称技术的运用都会产生意想不到的效果，但是人类应该致力于使系统更安全，以便他们能从技术中获益。

利维还提到了微软急于将AIGC推向市场，以及早期的惨败，后来成为“Sydney丑闻”，即《纽约时报》记者凯文·罗斯（Kevin Roose）哄骗Sydney，令其承认它爱上了他，并打算把他从他妻子身边抢走。

对此，纳德拉幽默地回应称：“我们从来没有想过有人会在发布后的100小时内进行对它荣格心理学分析。”

▲Sydney与记者罗斯的交流页面，Sydney称自己已经爱上了他，还说他与妻子的婚姻并不幸福

面对LLM的胡编乱造问题，纳德拉说：“一些非常实用的东西可以减少幻觉。而且技术也在进步，肯定会有解决方案的。但有时幻觉也是‘创造力’，人类应该能够选择何时使用哪种模式。”

以下是《连线》专访的全文编译：

问题1：你什么时候意识到AI会进入到一个具有变革性的阶段？

纳德拉：当GPT2.5升级到GPT-3，我们看到那些新功能的时候。尤其是它展现出的融会贯通能力，我们没有对它进行单纯的编码训练，它却十分擅长编码。那时起，我成为了AI的信徒。我心想：“哇，这真的开始了。”

问题2：是否有一个瞬间让你决定全力支持AI？

纳德拉：就是这种促使我们创建Copilot的编码能力。我第一次看到GPT-4是在2022年的夏天，那是一次非常令人兴奋的经历。有一个查询我总是用作参考，机器翻译已经伴随我们很久了它取得了很多成果，但始终无法捕捉诗歌深层含义的奥妙之处。

我在印度海德拉巴长大，一直希望能够读懂波斯诗歌，尤其是诗人鲁米的作品，它已被翻译成乌尔都语，后被译为英语。但是，GPT-4一口气就做到了，这不仅仅是简单的机器翻译，而是跨越两种语言边界还保留了诗歌的精髓。这真的很酷。

问题3：几十年来，微软一直在投资AI，你们不是有自己很棒的大语言模型吗？为什么还需要OpenAI？

纳德拉：我们有自己的一套方案，包括创建了一个名为Turing的模型，它内置于Bing并在Azure中提供。但我觉得OpenAI和我们追求一样的东西。因此，我不想再去训练五个不同的基础模型，而是希望构建平台性的东西，所以我们合作了。

我们在彼此身上下注，他们做基础模型，我们围绕它做很多工作，包括确保AI安全与合规的工具。我们是两家深度合作的独立公司，以有纪律的方式追求同一个目标，而不是多个团队做随机的事情。我们说：“让我们为此而努力，打造一款真正吸引世界想象力的东西。”

问题4：你是否试图收购OpenAI？

纳德拉：我在微软长大，曾与各类合作伙伴打交道。过去，我们与SAP密切合作建立了SQL Server。所以这些事情对我来说并不陌生。不同之处在于OpenAI是非营利性的。

问题5：这通常看起来像是一个交易障碍，但你和OpenAI想出了一个解决方法。

纳德拉：他们创建了一个营利性实体，我们也同意了。我们有良好的商业合作关系，且我认为这种交易将保持长期稳定。

问题6：显然，这种设置是为了让OpenAI从你的交易中赚钱，但合作可以产生的利润是有上限的。当你们达到了这个上限，就像灰姑娘的马车变成了南瓜一样：OpenAI又变成了一个非营利组织。这样的话，你们的合作会发生什么变化？OpenAI可以说“我们是非营利性的，我们不想成为商业运作的一部分”吗？

纳德拉：我认为他们在博客上对此进行了解释。不过，从根本上说，他们的长期想法是让我们实现超级智能。如果真的发生这种情况，我想所有的赌注都会消失，对吗？

如果这是人类的最后一项发明，那么一切都将落空。不同的人对这意味着什么以及何时发生会有不同的判断，没有说的部分是，政府会怎么说？所以我宁愿把这个问题放在一边，毕竟这只发生在我们获得超级智能的时候。

问题7：但OpenAI的CEO萨姆·阿尔特曼相信这会发生。你是否同意他的观点，即我们将达到超级智能或AGI？

纳德拉：我更关注这一切对所有人的利益。工业革命很久以后，它的成果才触及到我长大的世界各地，这让我很困扰。所以我正在寻找比工业革命更伟大的东西，真正做到工业革命为西方、为世界上每个人所做的事情。所以我一点也不担心AGI会出现，或者它会很快出现。太好了，对吧？这意味着80亿人将过上富足生活，那将一个适合生活的奇妙世界。

问题8：你实现这一愿景的路线图是什么？现在，你正在将AI嵌入到你的搜索引擎、数据库、开发者工具中。这不是那些弱势群体正在使用的东西。

纳德拉：说得好。让我们先来看看开发者的边界是什么，我最兴奋的事情之一就是将快乐带回开发中。微软最初是一家工具公司，尤其是面向开发者的开发公司。但多年来，由于软件开发的复杂性，开发人员曾经享有的关注度和流程已经被打乱了。

我们用AI程序员Copilot编写简单的代码，解放程序员去处理更有挑战性的问题，这项工作很有意义。现在，GitHub上有1亿开发者都可以尽情享受这项功能。不过，随着AI对编程过程的改造，这个人数可以乘以10，1亿人可以是10亿人。当你向LLM发出指令时，你就是在对其进行编程。

问题9：任何拥有智能手机并知道如何说话的人都可以成为一个开发者？

纳德拉：当然可以。你不需要写公式，也不需要学习语法或代数，学习曲线会越来越好，开发将会被大众化。

至于让所有80亿人都能了解这一点，我1月份在印度看到了一个惊人的演示。政府有一个名为“数字公共产品”的项目，其中一个产品是文字转语音系统。

在演示中，一个农民正在使用该系统询问他在新闻上看到的一项补贴计划。系统告知他有关该计划的信息以及他可以填写的申请表格。通常情况下，系统会告诉他在哪里可以获取这些表格。但是，印度的一个开发人员就所有印度政府文件对GPT进行了训练，因此系统会自动用不同语言为他填写表格。

几个月前在美国西海岸创造的东西已经传给了印度的一个开发者，然后他写了一个模组，让一个印度农村的农民在手机上的WhatsApp机器人上获得该技术的好处。我的梦想是地球上80亿人中的每一个人都可以有一个AI导师，一个AI医生，一个程序员，也许还有一个顾问，这就是我的梦想！

问题10：这是一个伟大的梦想。但AIGC是一项神秘的新技术，我们真的不知道它是如何工作的。我们仍然会抱有偏见，有些人认为现在大规模采用还为时过早。谷歌拥有AIGC技术已有多年，但出于谨慎考虑，进展十分缓慢。然后你把它放到Bing中，并挑战谷歌也迈出了这样的一步，尽管谷歌现在还有所保留。你的原话是：“我想让人们知道我们让谷歌跳舞了。”谷歌确实在跳舞，改变了它的战略，凭借自己的AIGC搜索产品Bard进入了市场。我并不是说这是鲁莽的行为，但可以说，你在Bing的大胆举动是过早的发布，让竞争对手们纷纷加入其中，无论它们的技术是否已准备就绪。

纳德拉：某种程度上来说，我们这个行业的美妙之处在于：不在于谁拥有能力，而在于谁能真正发挥这种能力并将其转化为有形的产品。如果你想这样争论，你可以回到施乐公司（XeroxPARC）或微软研究院，说那里开发的所有东西都应该被保留。

问题是，谁做了真正有助于世界向前发展的事情？这就是我们必须做的事情。去年谁会想到搜索会再次变得有趣？谷歌做得非常出色，在产品和分销方面都处于行业领先地位。谷歌搜索是安卓、iOS等系统上的默认搜索引擎，所以我说：“好吧，我们要创新去改变搜索范式，让谷歌的‘10个蓝色链接’模式像Alta Vista一样被淘汰！”

问题11：你是指那个90年代的搜索引擎，当谷歌对其进行创新时，它立刻变得过时了。这话听起来很刺耳。

纳德拉：在这一点上，当我使用Bing Chat时，我无法返回，甚至无法回到原来的Bing。这是没有意义。所以我很高兴现在Bard和Bing共同存在并竞争，这让人们享受到创新。

问题12：我想你一定很高兴终于推出了一项让人们注意到Bing的搜索创新。我记得你在2009年经营Bing时是多么的沮丧，似乎在追逐一个不可战胜的对手。随着AI的发展，我们是否处于“大洗牌”的转折点，以前的行业巨头会失去优势、变得脆弱？

纳德拉：当然是。在某种意义上来说，每一次改变都让我们更接近范尼瓦尔·布什1945年提出的“计算机驱动信息重生”愿景。

布什提出了这个设想后，我们经历了一系列跨越：J.C.R.Licklider1960年提出“人类和计算机的共生”——DougEngelbart构建鼠标和窗口——Alto实现XeroxPARC的图形界面PC——PC——互联网。这都是在说：“能不能有一个更自然的界面，让我们人类能够增强我们的认知能力，做更多的事情？”

所以，我们的创新也只是其中一个例子。Copilot（副驾驶）是一个隐喻，因为这是一个将人放在中心位置的设计选择。因此，不要把这个开放说成是Autopilot（自动驾驶）的延续，它是关于Copilot的。很多人还在惊讶AI到来这件事，但其实AI早就已经无处不在。事实上，所有的行为定位都使用了大量的AIGC。这是一个黑盒子，你我只是其中的目标。

问题13：在我看来，未来将是一场Copilot和Autopilot之间的拉锯战。

纳德拉：问题是，人类如何控制这些强大的能力？一方面是让模型本身与我们所关心的基本人类价值保持一致，这些不是技术问题，而是社会文化方面的考虑。另一个方面是在考虑环境的情况下做出设计决策和制造产品，这能确保部署这些模型的环境与安全性考虑保持一致。

问题14：很多人说“AI应该在半年内踩下刹车”，你是否有这个耐心？

纳德拉：我始终尊重那些说“让我们仔细考虑AI相关问题，以确保没有失控的AI”的人。如果AI起飞了，我们最好要控制住局面。

回想一下蒸汽机首次部署和工厂创建的时候。如果我们同时考虑到了童工、工厂污染问题，我们是否可以避免几百年的可怕历史？因此，无论何时，当我们对一项新技术感到兴奋时，考虑一下意外的后果是非常好的。

也就是说，在这一点上，我们不应该只是说停止，而是应该加快做好所需的工作。在我看到GPT-4的第一天，我们没有在Sydney推出它，因为我们必须做大量的工作来构建安全保障。

但我们也知道，我们不可能在实验室里完成所有的准备工作。要使AI模型与世界保持一致，你必须在世界中而不是在某个模拟中完善它。

问题15：所以你知道Sydney会爱上记者凯文·罗斯（Kevin Roose）？

纳德拉：我们从来没有想过有人会在发布后的100小时内进行对它荣格分析。

问题16：你还没有说，你是否认为AI有可能会毁灭人类。

纳德拉：如果出现完全失控的情况，那就是个问题，我们不会允许这种情况发生，如果这将失控，那就是在推卸我们自己的责任。我们可以处理强大的技术。

顺便说一下，电会产生意想不到的后果。我们确保了电网的安全、制定了标准，我们就有安全保障。很明显，在核能问题上，我们很好地处理了扩散问题。这两个案例很好地说明了我们如何处理强大技术。

问题17：LLM的一个巨大问题是它的幻觉，Sydney和其他模型只是在胡编乱造。这一点可以有效解决吗？

纳德拉：一些非常实用的东西可以减少幻觉。而且技术也在进步，肯定会有解决方案的。但有时幻觉也是“创造力”。人类应该能够选择何时使用哪种模式。

问题18：相较于没有选择的现在，那将是一个进步。但我想问一下另一项技术，不久前，你还在狂热地谈论元宇宙。在2021年，你说你不能夸大混合现实是多么大的一个突破，但现在我们谈论的都是AI。这股热潮是否将元宇宙技术带到了另一个维度？

纳德拉：我仍然相信虚拟存在。在2016年，我写了三件我感到兴奋的事情：混合现实、量子和AI。我仍然对这三件事感到兴奋。今天我们正在谈论AI，但我认为“存在感”是最终的杀手级应用。当然，量子可以加速一切。

问题19：AI不仅仅是一个热议的话题。现在，你已经把微软的中心放在这这项变革性技术的中心。你是如何管理的？

纳德拉：我喜欢在内部使用的一个比喻是：当我们从蒸汽机转向电力，工厂必须重新进行配置。你不能只是把电动机放在蒸汽机的位置，而让其他东西保持不变。这就是斯坦利马车公司和福特汽车公司之间的区别，福特汽车公司能够对整个工作流程重新布线。

因此在微软内部，软件的生产手段正在发生变化。这是微软内部核心工作流程和产品传播方式的彻底转变，它也将改变每所学校、每个组织、每个家庭。

问题20：这个工具如何改变了你的工作？

纳德拉：很多知识工作都是苦差事，比如电子邮件分流。现在，我不知道如果我的Outlook中没有Copilot，我将如何生活。回复一封电子邮件不仅仅是英文作文，它也可以是一张客户支持票。它询问我的客户并带回相关信息，这就像个人电脑第一次出现在工作中一样，在我们的整个产品中都是如此。

问题21：微软在你的任期内表现良好，但你认为自己会因为AI转型而被人记住吗？

纳德拉：我因为什么被记住，取决于你和其他人。但是，我对此很兴奋。微软已经48岁了。我不知道有多少公司在这个年龄段仍十分有价值，这种价值不是因为它们在80年代、90年代或2000年代做了什么，而是因为它们在过去几年做的一些事情。只要我们这样持续努力，我们就有生存的价值。而当我们没做到，我们不应该被视为伟大的公司。

结语：积极拥抱AI，让技术惠及全球

纳德拉在与《连线》的访谈中回应了许多外界关注的问题，包括微软的AI转型、与OpenAI合作的部分细节、与谷歌的竞争以及AI失控的应对之策。

纳德拉领导下的微软对AI等新技术保持开放、大胆的态度，虽然也会部分专业人士质疑AI失控的隐患，但纳德拉强调微软会做好安全保障措施，还描绘了一幅AI惠及全球，人人皆有AI助手的美丽愿景。

推荐阅读

深圳一面馆实现“无人全面机械化” 48秒出一碗(组图)

美国直觉机器着陆器可能在月球南极附近着陆时翻倒

美国宇航局确认:中国通过一庞大项目将减缓地球自转