小学问题大模型为何会集体翻车,大模型测不出9.11和9.9哪个大

一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?

就此问题,第一财经测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

原创文章,作者:消费最前线,如若转载,请注明出处:https://www.xiaofei001.com/44328.html

(0)
消费最前线的头像消费最前线管理团队
上一篇 2024年3月21日 下午3:43
下一篇 2024年7月18日 下午5:24

相关推荐

发表回复

登录后才能评论
关注微信
关注微信
商务合作
商务合作
分享本页
返回顶部