最近发现了一个很有意思的现象。Omdia、SuperCLUE、Arena,三个完全不同背景的机构,在同一时间段,不约而同点名了文心5.1。 不是联合测评,不是官方推广,就是各做各的,然后结论撞上了。 我当时看到的第一反应是,这件事背后有个更值得聊的问题,AI走到今天,真正的分水岭到底是什么? 我一直觉得还是文本。Agent、搜索、AI应用,绕来绕去最后考的都是同一件事,模型会不会用语言思考。 所以这几条同期冒出来的消息,我觉得值得认真看待。 SuperCLUE-Writing显示文心5.1拿下国内第一、全球第二,87.57分,超越GPT-5.5。Omdia发布的《2026年基础模型中文创意写作能力评估》报告里,它是8个顶级模型里唯一独占四项最高评级的,被定性为市场领导者。Arena那边更直接,谈到中美文本赛道的代表位置,中国这边点的是文心5.1。 不是一条,是三条线同时验证。 更让海外炸锅的是另一个细节,它的预训练成本只有同规模模型的6%。这个数字对做AI应用的人来说,打开的是完全不同的成本想象空间。 文本底座之争,还没结束。 #AI大模型 #文心大模型 #人工智能 #大模型测评 #百度文心 #科技前沿 #AI干货 #干货分享 #文心5.1