5 月 21 日上午,李开复创立零一万物宣布,零一万物最新千亿参数模型 Yi-Large 在在LMSYS盲测竞技场最新排名中总榜排名世界模型第 7,中国大模型中第一,已经超过 Llama-3-70B、Claude 3 Sonnet。此外,文分榜中,Yi-Large 是与 GPT4o 并列世界第一。
这是一周内久未谋面的李开复第二次面对媒体。中国大模型曾因刷榜乱象广受争议,已经丧失了部分公信力。LMSYS Org是一个针对大型语言模型(LLMs)的研究组织,其发布的大语言模型评估排行榜也被称为大模型匿名竞技场。
“最近我可以想象在你们眼中的各种发布一定是眼花缭乱,因为我刚才跟一位国外朋友聊天,他说他最近见了3个大模型公司负责人,都号称自己世界第二,但是我前几天也看到国内有一篇文章是说中国落后美国 10 年,这两套话似乎不可能都是对的,但是有可能都是错的。”李开复阐述。
李开复指出,零一万物用一年时间把过去几年的技术差距缩短到目前的6个月(在榜单上超过了6个月前更新的海外大模型),“6个月的差别我觉得不是很大,这是以一个不可思议的超级速度在追赶。”李开复解释。
事实也的确如此。“追上ChatGPT 3.5水平,我觉得今年内可能就能够实现,但对于ChatGPT-4或者ChatGPT-5,我认为可能需要3年左右的时间,应该不会低于两年。”在2023年年初王小川曾告诉《AI光年》。
对比中美大模型的差距,李开复表示美国的科学家在突破性科研和创造力上没有对手,但中国人的勤奋、聪明和努力是不能忽视,比做产品,中国公司不一定输给美国公司。而在追赶问题上,李开复提到了算力局限问题。
“我们是一个务实的AGI的信仰者,美国AGI信仰者疯狂堆GPU,不顾成本,因为他们的财务情况跟我们不一样,又有投资人愿意投资,或者公司愿意拨款。零一万物一直秉着我们不要用那么多GPU,我们的GPU就只有Google、Microsoft的5%。”李开复非常坦诚的说。
零一万物主张把一张GPU挤出更多的价值,此外是优化模型表现,涉及到数据配比,引入多模态等技术细节。
一方面中国大模型在技术上对GPT4的追赶如火如荼,而另外一方面,中国大模型的价格战也是风起云涌,战况焦灼。5月21日,阿里云宣布旗下大模型产品全线降价,而不久前刚官宣低价大模型的字节跳动,而下午百度立即宣布两款文心一言大模型免费。
谈及价格战,李开复表示:“我们的定价非常合理,而且我们也在花很大精力希望能够让它再降下来,我觉得一定程度上,整个行业每年降低10倍推理成本是可以期待的,而且也应该发生。今天可能处在一个比较低的点,但是我觉得如果说以后大约以一年降价10倍来看,这是一个好消息,因为今天的 API 模型调用还是一个非常低的比例,如果一年降低10倍,那众多的人都可以用上。”
“100 万个 token 花十几块还是花几块钱有很大差别吗?100 万的 token 对于很大、很难的应用,我们是必然之选。我们发布之后得到国内外非常高的评价,而且是可以横跨中国和外国的 API,都开放,我们有信心在全球范畴是一个表现很好、性价比也很合理的一个模型。”李开复阐述。
在李开复看来,大模型领域如果出现ofo式的疯狂降价是双输的打法,大模型公司不会这么不理智,因为技术是重要的。