终于,GPT-4独霸时代终结了!
过去一个月里,四款大模型横空出世,在各项关键基准测试中与GPT-4相匹敌,甚至更胜一筹。
谷歌Gemini 1.5突破100万个tokens,是GPT-4的近8倍,此外能处理长达1小时视频输入,这无疑是一记重拳,直指GPT-4的短板。
Mistral则是开源阵营中黑马杀手,Mistral Large具有顶级推理能力,此前推出的Mistral 7B不仅表现超越Llama2,而且在手机上就能流畅运行,被视为GPT-4劲敌。
而Anthropic的Claude 3 Opus,被认为是第一个明确胜过GPT-4的模型,其核心长文本处理能力得到进一步提升,而且GPT-4拿手好戏写代码也不在话下。
最后一位Inflection的Inflection-2.5来势汹汹,在关键基准测试中与GPT-4并驾齐驱,还具有“世界级”实时网络搜索功能,广泛可用且获得用户高度满意度。
总而言之,这些新贵们的出现无疑终结了GPT-4的一枝独秀,也预计着竞争激烈程度进入下一“白热化”阶段。
为了守住护城河,或许OpenAI是时候放出“GPT-5”!
此前,OpenAI首席执行官Sam Altman曾表态,自己的第一优先要务是发布下一代模型,但不一定就会叫GPT-5。有网友喊话称,留给Sam Altman的时间不多了。
英伟达高级科学家Jim Fan也已经在期待GPT-5的亮相了。
甚至还有网友称,GPT-5还不够,只有Q*的出现才能彻底抢回Claude 3的风头。
最近马斯克起诉OpenAI案闹的沸沸扬扬,焦点指向了所谓的“Q*”,一份53页PDF曝光,Q* 2025(GPT-8)原计划于2027年发布,旨在实现完全的AGI, 届时IQ将达到145万亿参数,100万亿参数即可达到人类水平。
但就目前来看,Q*相对比较遥远,GPT-5已经呼之欲出了。
关于GPT-5,我们可以期待些什么?
Altman近期曾多次预告GPT-5功能。
在摩根士丹利3月8日TMT大会上,大摩观察到生成式AI工具的创新速度正在加快,Altman表示GPT-5将在功能上实现重大飞跃,类似于GPT-3到GPT-4的转变,推理能力是GPT-5的重点提升方向。微软也预计,M365 Copilot的功能和创新将几乎每天都在改进,但创新的顶峰尚未到来。
在达沃斯经济论坛,奥特曼透露了关键信息:
GPT-5将是一个多模态模型,支持语音、图像、代码和视频,并在个性化和定制化功能方面实现重大更新,具备更强的推理能力和更高的准确性。
从以上介绍可以看出,有三大升级点:
首先是多模态,据Altman介绍GPT-5不仅支持文本输入,还支持语音、图像、代码和视频。分析预计GPT-5将是一个真正的多模态模型,类似于谷歌最近推出的新Gemini Ultra模型。
其次个性化方面,Altman强调,GPT-4.5或GPT-5预计将在个性化和定制化功能方面实现重大更新,最关键的增强部分将围绕理解个人偏好的能力,比如整合用户信息、电子邮件、日历、约会偏好,以及与外部数据源建立联系。
最后是推理能力和准确性,Altman表示,如果GPT-4目前解决了人类任务的10%,GPT-5应该是15%或者20%。当前大模型的通病——幻觉问题也将在GPT-5中得到解决。
此外,Altman还指出,OpenAI API也将继续变得更快、更可靠、更便宜,但性能和成本之间始终存在平衡,奥特曼这里再次用iPhone来举例说明:尽管电池技术已显著改进,但iPhone 仍将保持 1-1.5 天的电池寿命以优化性能。
另外在被要求指出一件GPT-5能做的令人惊讶的事情时,奥特曼回答:如果我必须选一件,那就是写作会变得更好。
发布时间方面,最新媒体消息显示,GPT-5的训练已圆满完成,具体发布时间尚未确定,浅浅期待一下吧!