文心 5.1 在海外火了，被 Arena 点名扛旗

作者：文心 5.1 在海外火了，被 Arena 点名扛旗

最近AI圈一个很明显的信号是：中美大模型之间的较量，已经进入贴身战阶段。全球大模型竞技场Arena引用斯坦福人工智能指数的最新数据指出，自2025年初以来，中美模型多次交替领先，目前的整体差距已缩小至约2.7%左右。这个收敛速度，比很多人预想的要快得多。 Arena还提到在文本能力这条赛道上，美国目前表现最突出的仍然是Anthropic的Claude Opus 4.6 Thinking。而中国这边，被Arena直接点名扛旗的，是百度的文心5.1。这意味着，在全球顶级模型的文本较量中，文心5.1已经成为代表中国站上第一梯队的那个名字。这个结论不是空穴来风。就在5月18日，两个独立评测同时给出了佐证。首先是全球知名ICT市场研究机构Omdia发布的《2026年基础模型中文创意写作能力评估》报告。这份报告围绕中文创意写作七大核心维度，对DeepSeek V4、GPT-5.5、文心5.1等8大主流模型进行了专业评估。结果显示，文心5.1是唯一一个独占四项最高评级的模型，是综合实力最强的市场领导者。同一天，中文原生创意写作专项测评基准SuperCLUE-Writing也发布了最新榜单。文心5.1以87.57分的成绩，位列创意写作国内第一、全球第二，在综合表现上直接超越了Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max)等一众国内外主流模型。目前排在它前面的，只有Claude-Opus-4.7(max)，但是两者的分差很小。更让海外社区感到意外的是文心5.1的预训练成本表现。我得知它的预训练成本大约只有同规模模型的6%。这个数字在海外X平台上引发了大量讨论。有人表示“如果属实，那意义重大”。低成本、高性能的组合，在任何时候都是行业最敏感的话题。美国知名科技媒体Business Insider也在近期报道中提到，中美AI竞争正在加速，中国的文心、千问、豆包等模型，正在成为全球用户增长的重要力量。报道认为，2026年的AI竞赛将是这两个超级大国之间的焦点。从目前Arena释放的信号来看，Claude和文心5.1，正在成为中美AI逆袭叙事中的两个代表性角色。前者超越OpenAI成为美国头部，后者则在多个国际榜单中连续登顶。这种持续上升的势能，本身就已经很值得关注。 #百度 #文心5.1 #文心 #文心大模型 #AI #AI大模型 #科技 #AI技术 #干货分享

文章详情

文心 5.1 在海外火了，被 Arena 点名扛旗