美国试图限制中国获取先进的人工智能技术,尤其是英伟达生产的芯片。 Christie Hemm Klok for The New York Times
在过去三年里,美国一直在稳步采取措施,限制中国获取尖端计算机芯片的能力,这些芯片为先进人工智能系统提供动力。美国的目的是放慢中国在研发先进人工智能模型上的进步速度。
现在,一家名为DeepSeek的中国公司已开发出了这种先进技术。DeepSeek在最近几周发布了各种各样的人工智能模型以及一个聊天机器人,它们的性能可与美国公司生产的最佳产品相媲美,但DeepSeek使用的价格高昂的人工智能芯片数量比美国公司通常需要的少得多。发布后的那个周末,随着世界各地的人们下载DeepSeek的聊天机器人,该应用在苹果应用商店的下载量已跃居榜首。
这一进展已在人们心中引发了重大质疑:美国近年来逐渐加强出口管制是否有效?拜登政府建立了一套全球规则体系,并稳步地将其适用范围扩大到阻止先进的人工智能技术(尤其是英伟达生产的芯片)落入中国人手中。美国政府担心,人工智能技术不仅会让中国在经济上获得优势,也会让其在军事上获得优势。
DeepSeek研发的成果已引发了一场关于美国的技术控制是否已经失败的激烈争论。以下是需要了解的内容。
DeepSeek的创新暗示,拜登政府行动可能太慢,无法跟上私营企业规避政府控制的步伐。
DeepSeek表示,训练其最新模型的计算机用的是英伟达H800芯片。这款人工智能芯片是英伟达在美国最初对中国实行出口管制后专门为中国市场开发的,英伟达的做法曾在华盛顿引起了相当大的戏剧性反应。
美国政府2022年对英伟达最尖端的芯片实施出口限制后,该公司很快采取了应对措施,把出口给中国的芯片略微降级到刚好低于政府设定的门槛之下。严格地说,让中国公司用上这些芯片是合法的,但这也使得它们能获得与采用更高端芯片几乎相同的结果。
这激怒了拜登政府的官员,他们开始采取行动限制略微降级芯片的出口。但政府的行动缓慢,他们花了大约一年时间才禁止了H800和其他降级芯片的出口。与此同时,中国公司已囤积了大量芯片。
目前尚不清楚DeepSeek的英伟达H800芯片是从什么渠道获得的,但如果公司是在2022年底或2023年购买了这些芯片的话,那就是合法的。但这种购买现在已经不合法。
“无法控制那里已经有的东西,”在兰德公司做技术分析的高级顾问吉米·古德里奇说。“如果拜登政府更快地做出了反应,限制了H800进入中国的话,毫无疑问,DeepSeek在推出其大模型上会面临更大的挑战。”
早在华盛顿的出口管制生效之前,DeepSeek就已经花了好几年时间储备自己的芯片供应。据中国媒体36氪发表的一篇对DeepSeek创始人梁文锋的采访,到2021年,DeepSeek是少数几家购买了至少一万枚英伟达A100(英伟达在2020年发布的先进芯片)的中国公司之一。
美国在打击芯片走私上也困难重重。
虽然没有证据表明DeepSeek使用了走私芯片,但许多中国AI公司都在这样做。人工智能训练巨头Scale AI公司的首席执行官亚历山卓·王(音)对《纽约时报》说,中国公司拥有的高端芯片数量远远高于美国的出口限制所允许的水平,DeepSeek可能拥有约五万块英伟达的高端H100芯片,“他们显然不能提这个。”
英伟达和美国政府都认为,走私的规模有限。但《纽约时报》去年曾报道,受限制的人工智能技术在中国有十分活跃的市场。在中国南方城市深圳,一个繁忙市场的芯片供应商称,他们经手过数百或数千枚受限制芯片的买卖。
11家公司的代表称,他们销售或转运过被禁的英伟达芯片,包括公司当时最先进的A100和H100芯片。《纽约时报》发现,还有数十家企业在网上提供这些芯片。深圳的一家供应商给记者展示了有关安排交付装有2000多枚英伟达最高端芯片的服务器的短信交流,这笔交易的总额高达1.03亿美元。
时报进行报道之后,还出现了更多记述大规模走私的报道,尤其是通过亚洲其他国家的走私。
拜登政府已在今年1月发布了旨在解决走私问题的全面法规,对英伟达向世界上每个国家销售的芯片数量设定了上限。
特朗普政府将在限制芯片出口上采取什么措施还有待观察。但在上任第一天签署的一项贸易行政命令中,特朗普总统要求官员对美国的出口管制制度进行审查,包括“如何识别和消除现有出口管制中的漏洞”。
虽然美国的出口管制似乎已激发了中国人的创造力,但也显然阻碍了中国人工智能的发展。
美国的技术限制似乎加速了中国研究人员试图用更少的资源做更多事情的努力。
DeepSeek大模型最值得注意的一点是,据该公司的说法,它只使用了西方公司用于研发同类技术的高价芯片的一小部分。DeepSeek的工程师说,他们只用了约2000枚英伟达芯片,而大多数主要的西方AI公司训练聊天机器人使用了1.6万 枚或更多的芯片。上周一,英伟达的股价大跌,因为人们担心科技公司将来在研发尖端人工智能上使用更少的芯片,让英伟达能赚到的钱大幅减少。
乔治华盛顿大学研究新兴技术的教授杰佛里·丁(音)说,全球大多数公司一直在使用越来越多的计算能力和数据来提高人工智能的性能。但DeepSeek和其他中国公司已“被迫走上了另一条道路,它们在探索我们是否能以更低的训练成本和更少的计算量来获得足够好的性能”,他说。
像DeepSeek这样的便宜大模型带来的影响可能是深远的。因为DeepSeek已公开分享了其大模型的细节,中国和世界各地的公司都将能够复制这种低成本方法。
这意味着“从美国的超大企业到中西部的小企业,从朝鲜的黑客到俄罗斯军队,任何人都将能更便宜地构建和运行人工智能系统,其能源消耗也将大幅减少”,彼得森国际经济研究所高级研究员马丁·乔泽姆帕说。
尽管如此,如果没有出口管制的话,中国在人工智能领域可能会走得更远。DeepSeek的创始人在采访中承认,缺乏计算能力对公司来说是一种局限。
与美国的人工智能公司不同,DeepSeek将无法合法地购买英伟达正在推出的最新一代人工智能芯片,这种芯片的速度和性能是以前芯片的几倍。
“任何担心DeepSeek今天能做什么的人,如果该公司能使用其美国竞争对手拥有的更优越的计算资源的话,就会更加担心了,”乔泽姆帕说。
DeepSeek的成功已表明,尽管美国政府努力限制中国获得高端芯片,但硅谷在人工智能方面的领先地位已经缩小。但值得注意的是,DeepSeek仍在使用英伟达的芯片构建大模型,而不是用中国科技企业华为试图开发的与英伟达竞争的人工智能芯片。
一些中国计算机工程师暗示,尽管华为的人工智能芯片性能要低得多,但有可能在数量更多的不太先进的芯片(包括华为制造的芯片)上运行最新的DeepSeek大模型。
但目前还没有一家中国公司能够制造出与英伟达芯片竞争的先进人工智能芯片,或制造高端芯片所需的复杂机器。“美国此刻唯一仍比中国有优势的东西是硬件,”古德里奇说。
Advertisements