测试模型和结果—— kimi:16个问题答出,成绩最好。(但很早之前也和它玩过,那时候还答得一塌糊涂) deepseek推理版:24个问题答出,但过程十分内耗,数次接近正确答案然后给你拐到别的地方去。深度思索把自己给绕进去了。 通义:出乎意料,32个问题就答对了。 文小言(文心一言):惨不忍睹。问到第28个懒得跟它废话了。问了一堆问题越走越偏,到最后为了问而问,它自己估计都不知道自己在问什么。 豆包:不但答不出来,数都数不清楚自己问了几个问题。又是为了问而问的典型,仿佛看到了不一窍不通但试图把数学证明题写满的初中生。 彩蛋-deepseek普通版:不说了,看吧。一整个倒反天罡。 #人工智障与人工智能 #AI聊天 #人工智能替代人工 #大模型 #神奇的人类 #挑战人工智能 #ai