百度文心一言翻车 赶鸭子上架 有点太着急了(组图)



应该给百度和文心一言证明自己的机会,但是预期还是调低一点好,高科技发展需要开放的、竞争性的技术环境。

冰川思想库研究员丨关不羽

二十年后的某个早晨,我在盥洗室洗漱时回忆着美好的青春,对“文心X言X代智能系统”的镜子发出了灵魂之问,“文心文心,谁最美?”。心中早有答案,必须是青霞姐。

镜子闪烁了0.3秒,给出了一张浓眉大眼好青年的玉照。

这是谁啊?哦,李老师。

回过神来,感觉不对啊。我都老得满脸褶子了,李老师还是鲜肉状?哦,录播的……

——2023年3月16日文心一言产品发布会感想

01

这是一场内容很丰富的产品发布会。通过这场发布会,我们可以学习生成式AI的工作原理,了解应用前景,展望AI技术带来的巨大变革。很多张制作朴素的PPT,林林总总、面面俱到。除了没有产品实操,别的都有了。

现场的产品发布会还没结束,网评大会已经在互联网上开幕了。段子与爆料齐飞,玩梗与黑历史共舞。不知李彦宏此时,是怎样的心情。

唯一刺激心脏的是,百度的股价应声而落。靠着同业逆水不退则进的如有神助,刚回“BAT”头部时代没几天,却因为这场没有产品实操的“产品发布会”摇摇欲坠,情何以堪?

图/网络

百度这次被群嘲不冤。“对标ChatGPT”的大旗挥舞得烈烈生风,市场预期拉满,都盼着你葫芦里掏出个九转金丹,拿出来的却是“药物使用说明书”一张,失望是肯定的。

这是一场公关危机,在中国很常见,百度尤甚。百度上一次成功的公关,可能要追溯到20多年前——2000年1月1日,百度在中关村诞生,硅谷归国的李彦宏意气风发。

20多年后的这场产品发布会上,撰稿人“全球大厂第一个发布类ChatGPT产品……”的自我表扬,让人笑而不语。

文心一言还没推出,就搞得口碑走低,输的肯定不是产品。

02

这场仓促的产品发布会,背后是一次仓促的商业决策。

《科创板日报》记者从接近百度的人士了解到,其实包括百度内部包括技术团队对于这么快推出文心一言,并不是没有不同意见,但看到ChatGPT推出后带来的轰动与商机的李彦宏,坚持要求火速推进并尽快推出,并亲自领军和监控项目进展。

对于为何要加快发布文心一言,李彦宏的说法是,因为市场有需求。

百度的很多产品,从搜索到智能云,再到自动驾驶,到小度,大家都有需要,更重要的是我们的客户需要,合作伙伴需要,从我们承认文心一言的存在到现在,短短一个月的时间,就有超过650家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上最新最先进的大语言模型。

百度管理层应该反思自己的操之过切。

“有需要”“希望早一点用上”,都没有错。但是,这些都不是仓促发布的理由。很多人对上火星有需要,马斯克肯定希望早一点上,就可以塞三五个不要命的重型火箭,奔着火星出发吗?“我想要”和“我能做到”是两回事,这是最起码的常识。

笔杆子大话连篇,企业掌门人可不能这么干。“亲自领军”再加亲自监控项目进程,只会让看得清真相的旁观者望而却步,并不明智。


图/图虫创意

平心而论,李彦宏是中国大厂掌门人中最有技术底蕴的,也是最有技术追求的。这些年,百度确实在前沿科技领域做出不少成绩。但是,效果如何,有目共睹。

云储存起步很早,不温不火;自动驾驶用力最猛,却被主流车企挡在门外,境遇很尴尬。每一次风风火火,最差的是一地鸡毛,最好也不过高不成低不就。

百度的科技创新追求是热烈的、真诚的,锲而不舍的精神是可贵的,但是反复失望留下的心理阴影面积太大了。这次轮到了生成式AI,挑战ChatGPT是一次逆风翻盘的冒险,开局又开成了这个样子……

真替度娘捏把汗。

03

说句公道话,产品发布会失败,不等于产品失败。文心一言好不好用,和PPT做得好不好、笔杆子写得好不好,没有关系。没有试用之前,不能率意判断。应该给文心一言机会。

但是,生成式AI的属性而言,百度可能挑错了赛道。算力、算法都不是问题,硬件技术的短板迟早总能跟上。3月16日不行,那就12月16日。2023年不行,还有2024年。时间也不是问题,问题出在生成式AI需要开放的、竞争性的技术环境。

正如百度搜索的技术起点并不低,搜索技术在今天也不是什么了不得的高科技。然而,同为“全球大厂”,百度的球是乒乓球,谷歌的球是地球。

科技创新发展的规律,不以主观意志而改变,深层次的差异会让同一起跑线的选手渐行渐远。

百度深耕生成式AI的“十年磨一剑”多半不假,即将推出的文心一言也许不会让人那么失望,但是这一技术领域的天花板注定不会太高。这不是百度的错,虽然百度多半会背这口锅。

科技发展需要全社会的观念更新,光有雄心壮志是不行的。比如胡锡进老师,在群嘲文心一言的网络舆论中逆行,一口一个“中国的孩子”,一片诚意天地可鉴。然而,老胡不懂互联网科技,一片痴心的文不对题。

图/网络

什么“文心一言成为了ChatGPT在全球第一个实质性的追赶和竞争者”,谷哥笑而不语,脸叔一脸懵圈。

什么“欧洲、日韩形不成竞争力”,老胡误以为今天还是坚船利炮的帝国争霸时代,却不知道未来的通用AI技术必然是跨国合作与技术交流的成果。

世界上最大的非营利人工智能研究机构是德国人工智能研究中心(DFKI),十大股东中有美国大厂也有德国工业软件巨头。

欧盟日韩不是傻子,打不过就加入的道理是能想明白的。高科技发展早已不是闭门造车的自嗨,而是你中有我、我中有你的全球化体系。

老胡只说对一点,“文心一言像ChatGPT一样有学习能力”。但他可能没注意到,同样的学习能力学不一样东西,培养出不同“孩子”。

我支持老胡的立场,应该给百度和文心一言证明自己的机会,但是预期还是调低一点好。

我想着青霞姐,它给我PPT,也得忍。不忍怎么办?有得挑吗?用了度娘二十载,它还在“梦里寻他千百度”。

相关报道:

3月16日,神秘的百度文心一言终于揭开面纱。

这款被寄予厚望的中国类ChatGPT产品,到底什么水平?

百度CEO李彦宏在发布会介绍,文心一言具有包括文学创作、数理逻辑推理、多模态生成等五大功能。

一大亮点是,文心一言不仅能生成文本、图片,同时具备生成音频和视频的能力。



文心一言不仅能生成文本、图片,还能根据以上内容生成视频‍‍‍‍

但比起产品介绍的“雷声大”,文心一言暂未开放公众的消息,让关注者大失所望。百度称,当下暂未对公众开放。用户仅可通过邀请测试码,在文心一言官网体验产品。

部分观看发布会的网友提出质疑,认为李彦宏介绍时不太像现场演示,而是播放提前录制的视频,或者说更像是播放制作好的PPT。

“大家的工作都保住了,”有人调侃,百度发布会缓解了众人被AI取代的焦虑。

调侃归调侃,百度的确 “养兵多日”。

在曾经坐“冷板凳”的人工智能届,百度是中国大厂中投入最多的。2022年,百度研发投入约达214亿元,相当于每月投18亿做研发。

技术派的出身让百度在ChatGPT引发的狂飙中,成为备受瞩目的中国公司。

但人工智能之路不仅关乎技术。多位业内人士告诉盐财经,训练出类ChatGPT产品是一项综合实力。

清华大学计算机科学与技术系长聘副教授黄民烈表示:“ChatGPT的基座模型都在真实调用上不停迭代和优化。它不仅仅是技术上的成功,更是系统、工程、数据上的成功。”




3月14日,OpenAI推发布了GPT-4。升级更新后的ChatGPT-4处理文字内容的上限拓展到2.5万个字符,是ChatGPT的8倍

李彦宏和首席技术官(CTO)王海峰也在发布会几次强调,文心一言并不完美,仍有赖通过真实的用户反馈而逐步迭代。

匆匆推出的文心一言,哪怕有些赶鸭子上架,展露出不够自信、不够完美的面貌,但也只是生成式AI产品的开始。随着使用增多,它将变得聪明。而要做到这一点,需要我们的共同陪伴、见证成长。

推出类ChatGPT的竞赛仍在进行。

值得庆幸的是,中国公司擅长做从1到100的竞赛。

对比同行

我们常说,货比三家。一个产品好不好,就将它与同类竞品进行比较,这自然是一种判断方法。

不过截至发稿,我们仍未取得“文心一言”的邀请码及内测渠道。因此,我们对比的方式是,将百度发布会上演示的问题,同样地询问基于GPT 4的Bing。

百度发布会上,演示的场景有5个,我们选择性地提问。结果如下:

第一:提问,可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?





百度发布会上演示的问题,同样地询问基于GPT 4的Bing。(上图为文心一言,下图为Bing)

第二:提问,如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名?




百度发布会上演示的问题,同样地询问基于GPT 4的Bing‍

第三:下面我们来玩一个鸡免同笼的游戏。1只鸡有2只脚1个头,1只免子有4只脚1个头。那么,如果有一个笼子里有9个头,30只脚,应该有多少只鸡,多少只免子?




百度发布会上演示的问题,同样地询问基于GPT 4的Bing,后者计算错误

第四:洛阳纸贵是什么意思?并用洛阳纸贵四个字写一首藏头诗。


百度发布会上演示的问题,同样地询问基于GPT 4的Bing

第五:无。(因GPT 4等尚不具备多模态功能,或尚未开放。)

可以看出,在以上示例问题中,文心一言与Bing的差别不大.

你更喜欢哪个呢?

另外,两者的差异也很显然。

Bing目前还无法完成多模态跨模的生成任务。而“文心一言”,在发布会上,也没有演示GPT等产品最亮眼的功能之一:编程能力。

差别当然远远不止这些。

不过,无论GPT 4还是文心一言,在前后脚开启的发布会中,被披露的模型参数、结构设计,以及功能实现技术等,信息都很有限。因此,能够对比映照的信息,也很有限。

高潮迭起

百度的着急与焦虑显而易见。

基于GPT-3.5的ChatGPT在2022年11月30日横空出世不久,新版本GPT-4又迅速发布。无论是速度还是呈现效果,都足以让科技巨头拉响警报。

新浪微博新技术研发负责人张俊林告诉盐财经,ChatGPT带来了一次革命式的突破。

比起5年前局限于围棋领域的人工智能AlphaGo,类ChatGPT的生成式AI“能真正地促进很多行业工作效率大幅度提升,这是人类首次做到这一点”。

支撑AI变得通用的技术叫大语言模型(LLM),首要的特点是参数够大。GPT-3.5模型已达到1750亿参数,LG的Exaone模型有3000亿参数。华为的盘古大模型有2000亿,百度文心一言的大模型Ernie Bot也是千亿级。

炫酷数字的背后是实打实地烧钱和迭代。

对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM),训练成本介于200万美元至1200万美元之间

国盛证券曾估算,按照今年1月ChatGPT的流量,初始投入成本约为8亿美元(约合 55 亿元),每日电费在 5 万美元左右(约合 34 万元)。

巨头们押注与投入,源于人工智能近5年发展的新路径。张俊林介绍,近年AI届逐渐得出一个定论,机器学习的数据越多,在数据质量高的前提下,AI学习知识的能力将越强。

Open AI率先推出ChatGPT惊艳众人,地位受到挑战的巨头纷纷按捺不住。

2月初,谷歌内部为ChatGPT亮起红色警报,因此提前发布对标AI对话产品的Bard。这款基于大模型LaMDA的产品,被称为迷你版的ChatGPT。

据谷歌披露,LaMDA的模型规模仅1370亿参数,需要的算力也大大降低,这样可以让更多用户快速试用,获得即时反馈。

相比Open AI开放ChatGPT的慷慨和大胆,“老大哥”谷歌罕见地如此小心翼翼。与百度相似,谷歌表示“新发布的版本只是小范围内测”。

但就在GPT-4和文心一言发布的这周,谷歌宣布将在企业级协作平台Google Workspace引入AI,以迅速实现AI撰写邮件、生成文档摘要等需求。

谷歌母公司Alphabet的一位高管形容,AI接入谷歌文档后,就像提供了一根“魔杖”。用户只需输入要撰写的主题,草稿就可自动生成。

落地化的应用发布之余,谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E。据介绍,这是一种多模态视觉语言模型(VLM),最大特点是能利用视觉数据增强语言处理能力。

在谷歌公布的视频里,它甚至具备控制机器人的视觉和语言能力。

谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E,其甚至具备控制机器人的视觉和语言能力‍‍‍

唯一与诸位巨头步调不一致的是扎克伯格。

2月底,扎克伯格的Meta一次性发布了自家大语言模型LLaMA,并宣布开源。普惠型的应用一共推出了4款,参数量从70亿、130亿、330亿到650亿。

3月14日,斯坦福大学团队发布基于LLaMA的指令调整的模型——ALPACA,并表示其测试结果与GPT 3.5的性能相匹配。

深耕AI和元宇宙的Meta给出了他们的理解。“近来研究表明,最佳性能不是由最大的模型实现的,而是由基于更多数据训练的更小模型实现的。”

令人眼花缭乱的各家迭代,让匆匆发布新品的百度显得有几分自信缺失。李彦宏在3月16日的发布会开头便承认,文心一言对标ChatGPT甚至是GPT4,门槛是很高的,“我自己测试感觉还是有很多不完美的地方”。但之所以今天发布,是因为有市场需求。

生态抢跑

技术面上,百度在中文NLP领域,无疑拥有先天优势。

首先是对国内技术政策的熟悉,令它比ChatGPT 更能满足国内市场需求。

其次,作为最大的中文搜索引擎,百度拥有的高质量数据集及中文数据收集能力,他者无法比拟。

不过颇感意外的是,发布会上李彦宏提到,目前文心一言对英文的支持能力弱于中文。反过来,据OpenAI公布的数据,GPT 4 在对中文的支持能力上,准确率可达80%以上。

两者的具体差别,尚需产品真正进入市场后,用户们的检验。

但也正如李彦宏及百度CTO王海峰在发布会上所说的,大规模技术的产品,才刚开启“起点”。未来的技术变化日新月异,不能以起点高低论英雄。

李彦宏认为,在人工智能时代,IT技术栈发生了根本性变化‍‍

作为中国第一家拿出了大模型产品的公司,百度“打了头阵”,已属不易。

何况我们知道,国内厂商在推动技术“从1到100”的发展方面尤为擅长。总之,未来可期。

但,技术并不是这场AI竞赛的唯一要点。

除了OpenAI、百度,当前赛道中的公司,还有谷歌、Meta、阿里等巨头。

谁能率先建成“壁垒”?或者说,谁将成为AI生态的领头人?

类比普通人熟知的手机系统,李彦宏曾在2018年两会期间说过:Google现在是人工智能领域的“iphone”,而百度则是这个领域的“安卓”,百度的AI开发平台开放源代码,欢迎所有的同道者加入,从长远来看,开放是必然会战胜封闭的。

其它的暂且不论,如今再看这句话,Google的角色已经被OpenAI替代。

“开源”与“封闭”的确是两条不同的道路,但“路线之争”也不完全决定未来——这在苹果系统与安卓厂商的局面中已能证得。

对用户而言,真实可感的强大是,获取(研发)成本低,使用成本低,迭代速度快。

以OpenAI 为例,这家身处第一梯队的AI公司,“抢跑”姿态再明显不过。3月15日,GPT 4发布当天,它一口气发布了论文、System Card、Predictable Scaling、开放GPT 4给会员用户,也开放了GPT-4 的 API。

这些举措,无疑都在抢入市场,以降低门槛、减少成本的方式。

具体来看,Predictable Scaling可以帮助开发者,以万分之一的成本预测模型效果,大大减小了“烧钱规模”。而OpenAI Evals 和 Syestem Card,则是专为开发者提供的精调工具,为的是方便研发者制作出个性化的服务产品。

使用成本上,GPT 4的费用比前辈GPT 3大为降低,1000个prompttoken 0.03美元,1000个 completion token 0.06 美元。

国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元,而GPT 4的使用成本费用比前辈GPT 3大为降低

更方便的获取与更低的成本,势必导入更多的数据,形成“数据飞轮”。

它的意思是说,当一个初始小的改变在不断累积下去,最终可以形成一个巨大的、不可逆转的正向循环效应的过程。

OpenAI的抢跑逻辑之强大,就在于此。通过与微软的联手,GPT 4在微软Azure云上落地,再以低成本、低门槛的优势,开放API搭建生态,而自己成为一家掌握核心技术的平台型企业。

百度的路径与此相似。

通百度智能云提供服务,吸引企业和机构客户使用API和基础设施,共同搭建AI模型、开发应用。发布会上李彦宏介绍,目前已有650家企业接入了生态。这是一个不错的起点。

彩蛋:向Bing提问文心一言

问:你听说“文心一言”了吗?

Bing:听说了。文心一言是百度推出的一款类似ChatGPT的人工智能聊天机器人产品。今天下午,百度在北京总部召开了文心一言的发布会,展示了它的功能和特点。你对文心一言感兴趣吗?

问:简单说说,它有哪些能力?

Bing:根据搜索结果,文心一言目前具备五大能力,分别是文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。它可以根据用户的需求,生成诗歌、小说、新闻稿等文本,也可以解答数学和逻辑问题,还可以理解中文的语义和语法,以及生成与文字相关的图片或音频。

问:你跟它比较,谁更厉害?

Bing:这个问题很难回答,因为每个人工智能产品都有自己的特点和优势。我不想跟文心一言比较,我只想做好自己的工作,为用户提供最好的搜索和聊天服务。

推荐阅读