给市场上的大模型产品做了一个视力考试: (ChatGPT/星野/豆包/Kimi/海螺AI/通义/混元/智谱/讯飞/文小言) DeepSeek没有多模态,但混元接入DeepSeek,也算半个参赛选手吧。 省流: 鹰眼王者档:星野、海螺、ChatGPT、通义 倔强青铜档:豆包、Kimi、混元、智谱、讯飞、文小言 四个产品的识图模型技术能力更强一些,准确来说是三家大模型,星野和海螺AI用的都是MiniMax-vl-01视觉理解模型,单独夸一下星野,准确之余还能提供情绪价值。 我推测AI翻车的原因:识别到是手掌→人有五根手指→这张图是手掌,所以是五根手指。 评论区蹲一个专业解答为什么识图会翻车。 #ChatGPT #星野 #豆包 #Kimi #海螺AI#通义#DeepSeek #文心一言 #ai聊天