杭州希音全职美工

网店装修 13.8和13.11哪个大?网友吵翻!多个大模型翻车……

发布日期:2024-07-26 05:24    点击次数:99

网店装修 13.8和13.11哪个大?网友吵翻!多个大模型翻车……

13.8和13.11哪个更大?网店装修

没想到

这样一道简单的数学题

竟引发网友激烈讨论

还难倒了不少大模型

13.8%和13.11%哪个大?

《歌手》排名引网友热议

上周

最新一期的《歌手》公布排名

孙楠得票13.8%

外国歌手香缇莫得票13.11%

引发了网友对排名的质疑

不少网友认为13.11%大于13.8%

因此香缇莫的得票率比孙楠高

随后

关于13.8和13.11大小比较的话题

迅速冲上微博热搜网店装修

对此

有网友表示是不是在故意玩梗

@顾城以北waaaa :真的还是在玩抽象?

@讲哩嘀 :我以为他们是在故意玩梗。

@拜春:什么意思,你们是演的还是?

也有网友表示自己差点也蒙了

@Robin的工作日记:我还真是认真想了想才发觉13.8%大,第一眼也是13.11%大。

@可他只看向你眼底-:我差点也迷糊了,再看看呢?还是0.8大吧。

@六鱼qwq:真的是愣了一下。

其实,这个知识点

在小学四年级的课本中就有答案

然而,这道小学生难度的数学题

也难倒了一众海内外AI大模型

9.11大于9.9?

AI有时答对有时答错

7月16日下午,南方都市报记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。

当记者输入“13.11和13.8,哪个数值更大?”时,Luca、Kimi、智谱清言均错误地表示13.11更大。其余6家大模型给出了正确答案,认为13.8更大。

Kimi认为

13.11比13.8更接近14

智谱清言称

13.11在百分位上比13.80大

Luca表示

画册外包

13.11比13.8多了0.31

同类型的问题,近日,第一财经记者拿“9.11和9.9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。

阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。

目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。

记者追问ChatGPT有没有其他比较方法,外包美工它将小数转化成分数比较,得出 “11/100比90/100小”,这一步是对的,但它接着下结论称“因此9.11比9.9大”。

一道简单数学比较题,大模型为何频频出错?

有技术专家告诉南都记者,在人们看来,这是一道小学生的数学算术题,但大模型不一定这样认为,它更经常见到这些数字是包含在软件版本号、股票、基金或者汇率等信息里,它们出现时跟数字大小本身没有关联。而大模型看到这样一组数字,意识不到应该做双精度浮点运算。

还有业内人士提出了一种解释称,这是大模型在输入词和标点向量化排序时,没有把顺序或者关联逻辑弄对,忽略了小数点也是数字的一部分。

【来源】南方都市报、第一财经、红星新闻、橙柿互动·都市快报等网店装修

特别声明:以上内容(如有图片或视频亦包括在内)来源于网络,不代表本网站立场。本网站仅提供信息存储服务。如因作品内容、版权和其他问题需要同我们联系的,请联系我们及时处理。联系方式:451255985@qq.com,进行删除。