百度发布预告,4月25日将在武汉召开的Create开发者大会上推出全新升级的文心大模型4.5 Turbo版本。 我推测,大概率会在文心4.5和X1的基础上做全面升级: 1.价格更低——李彦宏曾表示大模型成本每年降低90%,下个月发布文心4.5 Turbo的时候,推理价格或将再创新低,为行业客户提供更好的服务; 2.生成速度更快——Turbo模型的标志就是速度更快,文心4.5 Turbo的生成速度将会大幅提升,为大模型提供多样化场景下的快速响应能力。 在经历DS的毒打后,我对文心4.5的多模态能力十分满意:此前,DeepSeek哪里都好,但遗憾的是多模态能力实在太弱,深度理解图片都费劲,更别提看音视频了,导致和DeepSeek沟通时只能采取最“原始”的文字交流方式,常让我产生“5G内容,2G形式”的既视感,每次使用都意犹未尽。 因此,此次我们在图片理解、视频分析等场景对文心4.5重点展开测评: 首先,再牛的AI也得经得住抽象网友的毒打,几个梗图下来,文心4.5化身鉴梗大师,细节捕捉与推理深度在线,点出梗图的巧妙和幽默。 要精准识别流行文化符号,构建文化共识库;要具备跨次元关联力,才能看懂跨时空混搭梗,这要求模型构建起“古典-现代”知识图谱,实现符号的时空穿越式理解;同时,也要构建起反讽与双关语“解码器”,将黑话转化为直白逻辑,建立情绪强度坐标系…… 然后,上几道图片内容判断题:上传景点实拍、电影截图喂给文心4.5,其分分钟指出意义、⽤途是什么、位置在哪里等关键因素,福尔摩斯·文心4.5上线! 在接下来音视频判断题环节,文心4.5也毫不逊色:上传音频,分分钟听歌识曲,网易云哭晕在厕所。上传视频也能侃侃而谈。 ——综上,文心4.5多模态能力确实在线,能对文字、图片、音频、视频等内容进行综合理解,相当于给AI装上了超级感官中枢+语言大师芯片+文化记忆词典,不仅多模态理解能力优秀,且具备了更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。 前有DeepSeek的史诗性更新,后有百度加速技术突破,并把成本一再击穿地心,距离4月25日Create开发者大会还有两周,期待文心4.5 Turbo上线,到时候高低得整几个狠活测试下。#大厂#AI#互联网大厂#人工智能#文心一言#熊厂