AI 时代,一切都在变快。
去年有 ChatGPT 创最快用户增速 —— 5 天破百万,2 个月破 1 亿用户,完成了 Facebook 用了四年半才达到的成就。
今年有英伟达市值一路狂飙,单日市值涨达 2770 亿美元,打破了 Meta 20 天前才刷新的美股市值单日增长纪录。
在突破 2 万亿美元市值的路上,英伟达从 1 万亿跃升到 2 万亿也只用了 180 个交易日,而苹果和微软则用了 500 多个交易日。
成功背后,这家被称为「人工智能战争中唯一军火商」的公司,也需要直面在不断向上爬的挑战者。
在之前文章中,我们回溯了黄仁勋的决绝和「豪赌」如何让多番濒临破产的英伟达最终登上「芯片之王」的宝座。
今天,我们将细看作为「王者」的英伟达如何面对挑战和投资未来,寻找下一个「AI 热」。
缺「芯」潮中的危与机
埃隆和我都在求他了,我想这应该是最贴切的描述了,那一个小时是由寿司和乞求组成的。
甲骨文创始人 Larry Ellison 去年聊起,自己曾经和马斯克一起请英伟达 CEO 黄仁勋到加州一家高级日料店吃饭,苦苦哀求想要点 GPU。
Larry Ellison
马斯克也有自己的「难度参照系统」:「现在 GPU 简直比毒品还难到手。」
新一轮 AI 浪潮兴起以来,缺「芯」成为了一个延续至今的主题,并且还得维持一段时间。
在被《连线》问及 AI GPU 供应不足问题时,黄仁勋直言:
我觉得我们今年没法追上供应量。今年不行,也许明年也还不行。
这也难怪当扎克伯格上个月说出「到这今年年底,我们将拥有 35 万个英伟达 H100」时尤其自豪。
毕竟得有算力,你才能在 AI 大战里占个号。
显然,没有科技巨头喜欢把自己的「命脉」交给另一家公司,自研芯片成了新的必争之地。
今年 2 月底,微软宣布和英特尔达成合作,将用英特尔的 18A 制造技术生产自研芯片,并表明公司一直在努力加强芯片设计能力。
Google 的 TPU 在去年 12 月已经做到 TPU v5p。和 TPU v4 相比,TPU v5p 浮点运算次数增加了 2 倍,内存容量高 3 倍,LLM 培训速度提高 2.8 倍。
业界有传连 OpenAI 的 Sam Altman 也在计划募款万亿美元,欲重塑全球半导体行业。
另一让人无法忽视的后起之秀也在今年登场了。
一家名为 Groq 的初创企业打造了 AI 芯片 LPU,自称实现了「地表最强推理」:
LPU 的推理能力是 GPU 的 10 倍,成本却只有十分之一;其运行大模型的生成速度接近每秒 500 token,远高于 GPT-3.5 的每秒 40 token。
在迎面而来的挑衅面前,黄仁勋自有其应对。
一个是隐性的,一个是显性的。
Groq CEO Jonathan Ross 在接受采访时表示,很多客户在找他们时,都透露着被英伟达「抓到」的恐惧:
我们见的很多人都说,如果英伟达听说我们有见面,他们会立马否认。
这里的问题是,你得提前一年给英伟达下单支付,然后你在一年后或者更长的时间才有可能拿到硬件。然后情况是,「噢,你在从别人那买啊,那我想可能还得多等一会(才有货咯)。」
虽然也不确定英伟达是否真会这样做,但其中关系依赖程度也是可以想象。
Jonathan Ross
英伟达对于库存分配的规则并没有透露太多,黄仁勋在最近则表示,他们试图更公平地去分配资源,但会避免把芯片卖给那些不需要马上就用的人。
同时,黄仁勋也说英伟达会把自己的客户介绍给云计算公司,并将一定额的芯片绑定分配。
而在显性方面,英伟达也在不断推动相关技术,让自己保持领先。
在采访中,黄仁勋就透露公司现在正在做一个全新的产品:
我们正在创建一种全新的数据中心,我们把它称之为 AI 工厂。
在现有的数据中心里,很多人会共享一个计算机集群,并将文件存在一个大型数据中心上。
AI 工厂则更像是一台发电机。非常独特。
我们在过去几年里都在建造它,但我们现在得把它变成一个产品。
黄仁勋坚信,这个现在还没定下名字的新产品在未来将无处不在,所有公司都会需要。
所有汽车公司都会有有一个建车的工厂 —— 建实际的产品,原子级 —— 也会有一个为汽车建造 AI 的工厂 —— 电子级。
事实上,你看埃隆·马斯克就在做这个。他对于未来工业公司形态的思考比我们大部分人都超前很多。
除此以外,铸成英伟达今日地位的远见,也在发挥作用,寻找着下一个能像「AI 淘金热」般改变一切的领域。
「造王者」还是「最佳拍档」?
当 AI 还是被资本嫌弃的「差生」,英伟达眼光独到地决心成为一家 AI 公司。
2016 年,黄仁勋亲自世界上首台 DGX-1 送到当时马斯克还是创始成员的 OpenAI。
在接下来这些时间里,硬件发展的迭代和 CUDA 在软件上的积累逐渐形成了英伟达在 AI 领域的护城河。
今天,英伟达正广泛投资创业公司来寻找那一点未来将大放光彩的星光。
有报道称,英伟达去年投资的创业公司超过 30 家,而且每一家的投资都必须是由黄仁勋亲自签字通过的。
虽然掌握着 AI 创业公司渴求的算力资源,但黄仁勋不喜欢别人称他作「造王者」:
我们投资这些公司是因为他们在自己领域做得很好。能投资他们,我们感到很荣幸,而不是反过来。
那些都是世界上最聪明的人。他们不用靠我们来背书。
生物科技是黄仁勋尤其关注的一个领域。最近,他也参加了一个健康投资的研讨会:
生物学家和科学家,这可是一个愤怒的听众群。
(在科技界,)我们用的词语都是「创造」「改善」「加速」,你们却爱「靶点」「抑制」这种词语。
开玩笑暖场以外,他还聊了「冷冻电子显微镜技术」「X 射线晶体学」和「结构预测」这类行内话,最后不忘大声呼唤合作:
我不是故意卖弄的,但你们说还有那家芯片公司 CEO 能这样聊呢?在药物发现的整个过程上,我们都有算法,我们有数学有专家,我们可以成为你的伙伴,所以(有需要)务必和我们联系。
Jacob Berlin 就切身体验到了英伟达的支持。
他是其中一家获得英伟达投资的生物科技公司 Terray Therapeutics 的 CEO。该公司的算法最开始在他自己看来「还不错」,还能用。
当英伟达开始加入后,Terray Therapeutics 有了新的算力和工程支持,决定直接把模型重新训练一次:
我们的现在的表现好太多太多了。
如果没有和英伟达合作,没有他们的支持,我们自己没法做到这样。
说到这里,大家就会想,是不是英伟达投资的公司就能优先拿到 GPU?
别说大众了,获得了投资的创业者也有试过弱弱地偷问。虽然知道大概不会有,但 Imbue AI CEO Kanjun Qiu 还是问了出口:「我们可以优先拿货吗?」
英伟达有别样的解决方案。黄仁勋解释说:
他们和所有人一样都得面对短缺……他们得到的事我们的 AI 技术支持,也就是我们的工程能力和用于优化 AI 模型的特殊技术。
我们会帮他们变得更高效。如果你的吞吐量增加了五倍,那你从实际看就等于得到了额外五个 GPU。
除了技术支持,这些创业者中的一部分人还获得了另一让人羡慕的「特权」—— 和黄仁勋建立直接联系。
旨在建造能像人一样思考的 AI 的 Imbue AI,虽然 CEO 没拿到额外 GPU,但她却有黄仁勋当导师。
她之前曾经给黄仁勋写邮件,想询问下他对自己公司高管补偿问题的建议,黄仁勋很快就回复了她。
他很愿意回应。我也尝试尽量不要去打扰他,但他肯定是在那的。
即便不是每家被投资的公司都有这待遇,黄仁勋的投入还是相当难得。
之前黄仁勋上播客节目「Acquired」接受采访时有一段对答挺火的。当时,黄仁勋被问到如果现在他 30 岁,他会选择创业吗?会创立什么公司?
黄仁勋的回答是:「不会。」
在他看来,创业真的很难,如果他当初知道这一切会那么难,他可能不愿意再经历一次这些痛苦和艰辛了。他觉得,创业真得靠「无知」才有勇气:
我现在和创业者碰面的时候,他们会跟我说一切都很容易,我会很支持他们,不会刺破他们的幻想泡泡。
但我内心知道,「噢,一切可和你想象的完全不同。」
相信那些有幸和黄仁勋一起聊天的创业者内心也希望自己终有一天能成为未来的「OpenAI」:
显然,他们的过往的成功记录很亮眼,总能选对他们认为会发展并起飞的垂直领域,带动他们的芯片和软件需求。
现在,他们正在努力为自己耕耘另一个数十亿级别的垂直市场。