文章详情

专注互联网科技,赋能企业数字化发展

百度开源文心4.5,超越deepseek和qwen?

作者:百度开源文心4.5,超越deepseek和qwen?

不久前百度正式开源了文心一言4.5,为闭源生态画上了一个句号 基本上开源了三类尺寸,超小杯(0.3b),中杯(20b左右),大杯(300b)左右。中杯和大杯都是moe架构,分别有文本模型和多模态模型。 有哪些亮点? 开源的base尺寸大 目前为止除了deepseek之外开源的最大基座文本base模型,为300b的moe,不过开源协议没有deepseek灵活,通义并未开源较高参数的base模型。 跑分比肩deepseek和qwen 据百度在github上发布的benchmark图片来看,文心一言4.5的300b的base模型在多个跑分上超越deepseek-v3-base,后训练的300b模型也在多个跑分上超越deepseek-v3以及qwen3-235b,在20b量级的模型上和qwen3有来有回。百度训练的非推理模型目前是市面上的最先进水平。 从上述信息来看,百度这次开源还是比较有诚意的,同时也能体现出百度的基座模型确实训得还不错,目前的开源力度应该是仅次于qwen和deepseek 但是此次开源并未涉及到推理模型,有些遗憾,要是百度能开源一下文心x1系列就好了 百度也发布了技术报告,我后续也会解读~

返回新闻列表
老人找的后老伴,有继承权吗? 男人12cm正常吗, 多长才算正常? 再来聊聊AI 别错过!金秋9月,文心一言4.0免费用! Blender配置文件找不到?超全路径管理与避坑指南