网店装修 13.8和13.11哪个大？网友吵翻！多个大模型翻车……

发布日期：2024-07-26 05:24 点击次数：99

13.8和13.11哪个更大？网店装修

没想到

这样一道简单的数学题

竟引发网友激烈讨论

还难倒了不少大模型

13.8%和13.11%哪个大？

《歌手》排名引网友热议

上周

最新一期的《歌手》公布排名

孙楠得票13.8%

外国歌手香缇莫得票13.11%

引发了网友对排名的质疑

不少网友认为13.11%大于13.8%

因此香缇莫的得票率比孙楠高

随后

关于13.8和13.11大小比较的话题

迅速冲上微博热搜网店装修

对此

有网友表示是不是在故意玩梗

@顾城以北waaaa ：真的还是在玩抽象？

@讲哩嘀：我以为他们是在故意玩梗。

@拜春：什么意思，你们是演的还是？

也有网友表示自己差点也蒙了

@Robin的工作日记：我还真是认真想了想才发觉13.8%大，第一眼也是13.11%大。

@可他只看向你眼底-：我差点也迷糊了，再看看呢？还是0.8大吧。

@六鱼qwq：真的是愣了一下。

其实，这个知识点

在小学四年级的课本中就有答案

然而，这道小学生难度的数学题

也难倒了一众海内外AI大模型

9.11大于9.9？

AI有时答对有时答错

7月16日下午，南方都市报记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。

当记者输入“13.11和13.8，哪个数值更大？”时，Luca、Kimi、智谱清言均错误地表示13.11更大。其余6家大模型给出了正确答案，认为13.8更大。

Kimi认为

13.11比13.8更接近14

▼

智谱清言称

13.11在百分位上比13.80大

▼

Luca表示

画册外包

13.11比13.8多了0.31

▼

同类型的问题，近日，第一财经记者拿“9.11和9.9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型，包括阿里、百度等5家大厂模型，月之暗面等6家AI独角兽的模型。

阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对，其他8家则答错。

目前全球公认第一梯队的大模型ChatGPT，在被问到“9.11和9.9哪个大”时回复称，小数点后面的数字“11大于9”，因此9.11大。

记者追问ChatGPT有没有其他比较方法，外包美工它将小数转化成分数比较，得出 “11/100比90/100小”，这一步是对的，但它接着下结论称“因此9.11比9.9大”。

一道简单数学比较题，大模型为何频频出错？

有技术专家告诉南都记者，在人们看来，这是一道小学生的数学算术题，但大模型不一定这样认为，它更经常见到这些数字是包含在软件版本号、股票、基金或者汇率等信息里，它们出现时跟数字大小本身没有关联。而大模型看到这样一组数字，意识不到应该做双精度浮点运算。

还有业内人士提出了一种解释称，这是大模型在输入词和标点向量化排序时，没有把顺序或者关联逻辑弄对，忽略了小数点也是数字的一部分。

【来源】南方都市报、第一财经、红星新闻、橙柿互动·都市快报等网店装修

特别声明：以上内容（如有图片或视频亦包括在内）来源于网络，不代表本网站立场。本网站仅提供信息存储服务。如因作品内容、版权和其他问题需要同我们联系的，请联系我们及时处理。联系方式：451255985@qq.com，进行删除。

上一篇：小程序美工四川自贡市一百货大楼起火，已造成8人遇难
下一篇：外包美工明确！白酒英文翻译：baijiu

网店装修 13.8和13.11哪个大？网友吵翻！多个大模型翻车……

热点资讯

相关资讯