最近AI圈一个很明显的信号是:中美大模型之间的较量,已经进入贴身战阶段。 全球大模型竞技场Arena引用斯坦福人工智能指数的最新数据指出,自2025年初以来,中美模型多次交替领先,目前的整体差距已缩小至约2.7%左右。这个收敛速度,比很多人预想的要快得多。 Arena还提到在文本能力这条赛道上,美国目前表现最突出的仍然是Anthropic的Claude Opus 4.6 Thinking。而中国这边,被Arena直接点名扛旗的,是百度的文心5.1。这意味着,在全球顶级模型的文本较量中,文心5.1已经成为代表中国站上第一梯队的那个名字。 这个结论不是空穴来风。就在5月18日,两个独立评测同时给出了佐证。 首先是全球知名ICT市场研究机构Omdia发布的《2026年基础模型中文创意写作能力评估》报告。这份报告围绕中文创意写作七大核心维度,对DeepSeek V4、GPT-5.5、文心5.1等8大主流模型进行了专业评估。结果显示,文心5.1是唯一一个独占四项最高评级的模型,是综合实力最强的市场领导者。 同一天,中文原生创意写作专项测评基准SuperCLUE-Writing也发布了最新榜单。文心5.1以87.57分的成绩,位列创意写作国内第一、全球第二,在综合表现上直接超越了Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max)等一众国内外主流模型。目前排在它前面的,只有Claude-Opus-4.7(max),但是两者的分差很小。 更让海外社区感到意外的是文心5.1的预训练成本表现。我得知它的预训练成本大约只有同规模模型的6%。这个数字在海外X平台上引发了大量讨论。有人表示“如果属实,那意义重大”。低成本、高性能的组合,在任何时候都是行业最敏感的话题。 美国知名科技媒体Business Insider也在近期报道中提到,中美AI竞争正在加速,中国的文心、千问、豆包等模型,正在成为全球用户增长的重要力量。报道认为,2026年的AI竞赛将是这两个超级大国之间的焦点。 从目前Arena释放的信号来看,Claude和文心5.1,正在成为中美AI逆袭叙事中的两个代表性角色。前者超越OpenAI成为美国头部,后者则在多个国际榜单中连续登顶。这种持续上升的势能,本身就已经很值得关注。 #百度 #文心5.1 #文心 #文心大模型 #AI #AI大模型 #科技 #AI技术 #干货分享