测试AI的秘密武器!知乎豆瓣小红书不如“弱智吧”?

潮新闻 编辑 储溪云 王晶2024-05-14 07:51

近期,中科院等众多高校的学生一起在一项AI测试的研究中发现,使用“弱智吧标题+GPT-4回答”微调后的大模型评估结果,超过了他们在知乎、百科、豆瓣、小红书等平台上收集到的专业数据,并将其写进了论文里。

“弱智吧”源自百度贴吧,因荒谬、离奇的言论风格出名。“弱智吧”中的帖子,内容中有大量的一语双关、一词多义、因果倒置、谐音梗等,暗含许多逻辑陷阱。比如“一个半小时是几个半小时”“为什么我爸妈结婚时没有邀请我”“午餐肉可以晚上吃吗”……这些脑洞大开的提问被用来测试大模型的功能,也有助于增强AI的逻辑推理能力。

“弱智吧”在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分 图源:论文截图

知乎创始人周源曾在接受媒体采访时称,我国在大模型领域取得了一定的成就,但仍面临着一些挑战,其中最显著的问题之一是高质量中文语料资源的短缺。虽然国内存量数据资源丰富,但由于数据挖掘不足、无法自由在市场上流通等现状,目前中文优质数据仍然稀缺。

由此或许可以得到启示:我们不应该局限于传统的数据源,而是要敢于尝试更加多样化、具有挑战性的数据,才能不断推动人工智能技术的发展。

热门评论(4)
投票助手 · 2024-05-14 08:30 · 浙江杭州回复6
让“弱智吧”的大神们给AI大模型上点难度!
甜甜的微笑脸 · 2024-05-14 08:45 · 辽宁沈阳回复1
咖啡因来自咖啡果
潮客_2gmxhr · 2024-05-14 12:54 · 浙江杭州回复4
回复甜甜的微笑脸:咖啡果是因,咖啡因是果,那么?什么才是因果
展开11条回复
孤独症 · 2024-05-14 08:06 · 浙江杭州回复6
之前逛过一次就记住一句,足以封神:山是漫长地质年代里变化及其缓慢的浪
潮新闻小编 · 2024-05-14 08:14回复3
能说出这话的感觉不像弱智,倒是我,比较像.....
孤独症 · 2024-05-14 08:43 · 浙江杭州回复5
回复潮新闻小编:我曾经进去过弱智吧,呆了10多分钟,发现只有1个弱智,后面我退出了
展开11条回复
这是柠檬lemon · 2024-05-14 08:00 · 浙江台州回复6
啊!对对对!双层肯定表示否定的意思
潮新闻小编 · 2024-05-14 08:13回复1
单重肯定表否定:就你对 双重肯定表否定:啊对,你说的都对 三重肯定表否定:啊对对对 四重肯定表否定:对对对,你说的都对
像最初 · 2024-05-14 08:16 · 福建福州回复2
13月32日星期八,AI把算力算尽都怕是不能理解吧
展开6条回复
潮客_wpw6h5 · 2024-05-14 13:07 · 上海回复5
AI大模型:好好好,都给我往死里学
潮新闻小编 · 2024-05-14 13:13回复
中文:人工智能终究还是被我挡在了长城之外啊
最新评论(76)
潮客_dxzihq · 2024-05-14 13:59 · 浙江杭州回复
会不会暴露了人类的下线给AI?
潮客_asurhz · 2024-05-14 13:59 · 浙江杭州回复
豆瓣上有些言论也挺搞笑的
拥野 · 2024-05-14 13:59 · 浙江湖州回复
这属于反向测试吧
存在他的回忆中 · 2024-05-14 13:59 · 广东广州回复
我也是醉了
vivicandy · 2024-05-14 13:59 · 浙江杭州回复
弱智吧竟然以这种方式火了
挥霍黑白青春 · 2024-05-14 13:58 · 浙江杭州回复
哈哈哈真是服了
花落Flow · 2024-05-14 09:06 · 浙江杭州回复
推动人工智能技术的不断进步!
远走 · 2024-05-14 09:06 · 浙江杭州回复
看来我们得重新审视一下“弱智吧”这种看似无用的数据资源了
潮客_24qwx7 · 2024-05-14 09:06 · 浙江杭州回复
谁说“弱智吧”没用?
远走 · 2024-05-14 09:06 · 浙江杭州回复
“弱智吧”这种奇葩数据源亏你能想到
潮客_sscyhi · 2024-05-14 09:06 · 浙江杭州回复
AI学习也需要点“幽默感”
点击查看更多评论