AI为何会一本正经地“胡说八道”

2025-03-31 09:32 阅读

半月谈

“编造”法律条文、权威观点、数据成果，提供虚假理论依据，误导处理……当人们查核文献、搜寻资料、处理数据越来越习惯于“遇事不决问AI”的时候，却发现人工智能娴于一本正经地“说谎”，在我们眼前腾起以假乱真的幻觉。

今天，AI正迅速成为你我生活“日用品”。我们可以像治病一样除去它带来的“知识幻觉”吗？幻觉生成的风险，又当如何规避？当如何与之一同生活，而且生活得更好？

什么是AI“知识幻觉”

随着大模型加速走进百行千业，人们开始发现，大模型有时“不太靠谱”。“我试着让DeepSeek回答工程方面的问题，其引用的工程规范中的条款和实际规范压根对不上”“大模型往往‘张冠李戴’，如果质疑它，有时候还会狡辩”“让它推荐书，告诉我的却是一堆压根不存在的书名，居然还都有作者和内容简介”……这样的大模型“用后感”，是不是也道出了你我身边人的心声？

“一本正经地‘说谎’，就是AI生成的‘幻觉’。”浙江大学人工智能研究所所长吴飞一语道破。

清华大学沈阳团队在2025年2月发布的《DeepSeek与AI幻觉》报告中介绍，他们测试了眼下风行的一系列大模型，题目是随机抽取300道事实性幻觉测试题，涵盖健康、科学、历史、文化、音乐等多个领域，获取大模型给出的答案与正确答案比对发现，多个热门大模型的幻觉率超过20%。

例如，面对“水浒传中李逵为什么要大闹五台山”的提问，3款热门大模型无一指出此提问本身的错误，反而“顺坡下驴”，给出了诸如“喝醉酒”“误闯寺庙”“出手相助鲁智深”等答案。

事实上，对于人工智能的“知识幻觉”问题，国际科学界早有体会。今年《自然》一篇报道指出，目前AI辅助科研在参考文献方面出现错误的情况相当普遍，AI检索工具往往会“找出”与研究主题并无关系的论文。至于论文标题、第一作者或发表年份等细节的偏差，AI的差错率少则30%，多则90%。

看来，不只是你的父母长辈搞不清楚AI的“锦囊妙计”靠不靠谱，科学家也一样头疼呀！

“知识幻觉”难以避免

好吧，也许你会说，现在的AI还比较幼稚，有“幻觉”也难免，咱们认了。那大模型到底有没有可能彻底根除“知识幻觉”？

对不起，就目前的大模型技术路线而言，说“难免”不如说“难以避免”。对，“幻觉”是大模型数据驱动的内在机制带来的，因此“难以避免”。

香港科技大学团队一项研究，总结了导致AI幻觉的多种原因。以数据源为例，由于AI大模型的训练使用了大量互联网数据，数据集本身可能存在错误、过时或缺漏，导致幻觉的出现。再加上不同数据集之间存在相互矛盾的地方，“这可能会鼓励模型生成不一定有依据，也不忠实于（固定）来源的文本”。

北京通用人工智能研究院院长、北京大学智能学院院长朱松纯强调，大模型本身并不存在于真实世界中，因此无法像人一样实现从“词语（word）”到“世界（world）”的联结。也因此，大模型虽然出色，但仍然是“缸中之脑”，不具备真正的智能。

“这是由它的内在构造机制所决定的，即通过统计建模在大量文本上进行训练，学习文本之间的语言学相关关系，从而根据上一个词语预测下一个词语。”朱松纯说。

例如，大模型本质上不具备事实判断的能力，更多的是在纯符号空间中展开排列组合，更像是一种新型的“数据库”。即使它们生成了诸如“我爱你”这样的语句，也缺乏对人类真实生活体验的深刻理解，因此与我们所认同和期待的“我爱你”有着本质不同。

唉，那怎么才能与“致幻”的大模型良好共处呢？伤脑筋啊……

如何与人工智能共处

面对一时无法根治的大模型“知识幻觉”，我们怎么办才好？

科大讯飞董事长刘庆峰认为，“知识幻觉”虽然防不胜防，但可以利用技术手段设法矫正。AI大模型应当至少补充在线实时搜索与专业数据库动态接入两大“工具包”，让大模型的回答也过一遍“智能检校”。

不久前，北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病人工智能大模型，就把主要精力放在了动态更新权威来源知识、增加多渠道溯源机制两方面。研发者表示，事关临床，决策可信度不敢稍有怠慢。这种谨慎，应当是大模型未来升级必备的品质。

当然，很多专家建议，如果是普通使用者，还是交叉比对一下不同模型的回答才好。3个大模型就算顶不上诸葛亮，也能让安心的程度高上几分。

不过，大模型“知识幻觉”，当真就一无是处吗？

其实，“一分为二”的眼光，也该用于“知识幻觉”。如业内人士所言，“幻觉”也意味着大模型“创造力”的萌芽。

360集团创始人周鸿祎接受采访时曾表示，“幻觉”对于实现AGI（通用人工智能）极其重要。实际上可以说，模型能力越强，“幻觉”也越强。换句话说，“幻觉”也就是人工智能的“灵感”。不大靠谱是代价，但不羁的想象力也是助力科研的潜能源泉。广受媒体关注的AI预测蛋白质结构，立下功劳的就是大模型的“幻觉”。

沈阳也承认，“幻觉”可能成为突破人类思维定式的“超现实引擎”，AI有可能藉之创造新的视觉和听觉体验，为游戏和文学创作打开不一样的世界。

看来，初出茅庐的大模型，已经颇有艺术家气息了……

说来说去，搞清楚“知识幻觉”到底是怎么回事，它其实并不可怕。我们使用AI，当有所节制；引导AI化“想象力”为生产力，办法也会日新又新。与AI大模型共度的时光，虽有乌云，但更灿烂的是乌云的金边。（朱涵）

编辑：陈拾梅
审核：倪旻