今天,百度发布了文心 5.1,一经发布就以 1223 分登上 LMArena 搜索榜(Search Arena)国内第一、全球第四,成为唯一上榜的国产模型。 此前文心 5.0 系列模型已多次登上 LMArena 文本榜和视觉理解榜,4 月 30 日文心 5.1 Preview 还登上了 LMArena 文本榜国内第一,而且还是榜单前十五名中唯一入围的国产模型。 在这次的 LMArena 搜索榜单排名中,百度展现出了自己最核心、也最熟悉的搜索能力。 随着模型逐渐进入应用场景,真正有价值的能力不再只是生成一段像样的话,而是围绕一个复杂问题快速找到信息、筛选信息、整合信息,最后给出相对可靠、可用的答案。这就是所谓的搜索能力。 这里的搜索能力,并不只是联网、索引、排序这么简单。真正强的搜索能力,至少包含几层意思:能理解用户到底在问什么,知道该去哪里找信息,能从多个来源提取关键内容,识别冲突和噪音,再把这些内容组织成一段有逻辑、有重点、尽量减少幻觉的回答。说白了,它不是简单地把网页内容搬过来,而是把查资料这件事,变成交付答案。 用户真正高频的需求逐渐变成查最新资料、比较不同观点、总结一件复杂事情、读取企业知识库,这种场景下好的搜索能力就极为重要。 而这恰恰也是百度最有机会打出差异化的地方。我认为搜索一直是百度最核心的资产,也是它最擅长的赛道。无论是信息检索、结果排序,还是知识图谱、内容理解,本质上都属于“找到信息—组织信息”的能力。 大模型时代,如果这些能力还停留在传统搜索框架里,它们的价值就会被削弱;但如果能和大模型结合,变成更强的检索增强、信息整合和答案生成能力,百度过去积累下来的东西,就不再是旧包袱,而会重新变成竞争力。 深扒一下,文心 5.1 出色能力的背后离不开“多维弹性预训练”技术,简单来说就是,可以一次性训练生成多种规模的模型,训练成本下降,模型能力没有被明显牺牲。 我觉得文心 5.1 值得关注的是,百度把自己最传统、也最有价值的能力,翻译成 AI 时代的新优势了。 另外最近关注到百度 Create2026 大会在 5 月 13 号就要举办了,可以期待一下百度还会亮出什么王牌。#百度 #文心 #文心大模型 #百度create大会 #AI大模型