AI为何会一本正经地“胡说八道”
“编造”法律条文、权威观点、数据成果,提供虚假理论依据,误导处理……当人们查核文献、搜寻资料、处理数据越来越习惯于“遇事不决问AI”的时候,却发现人工智能娴于一本正经地“说谎”,在我们眼前腾起以假乱真的幻觉。
今天,AI正迅速成为你我生活“日用品”。我们可以像治病一样除去它带来的“知识幻觉”吗?幻觉生成的风险,又当如何规避?当如何与之一同生活,而且生活得更好?
什么是AI“知识幻觉”
随着大模型加速走进百行千业,人们开始发现,大模型有时“不太靠谱”。“我试着让DeepSeek回答工程方面的问题,其引用的工程规范中的条款和实际规范压根对不上”“大模型往往‘张冠李戴’,如果质疑它,有时候还会狡辩”“让它推荐书,告诉我的却是一堆压根不存在的书名,居然还都有作者和内容简介”……这样的大模型“用后感”,是不是也道出了你我身边人的心声?
“一本正经地‘说谎’,就是AI生成的‘幻觉’。”浙江大学人工智能研究所所长吴飞一语道破。
清华大学沈阳团队在2025年2月发布的《DeepSeek与AI幻觉》报告中介绍,他们测试了眼下风行的一系列大模型,题目是随机抽取300道事实性幻觉测试题,涵盖健康、科学、历史、文化、音乐等多个领域,获取大模型给出的答案与正确答案比对发现,多个热门大模型的幻觉率超过20%。
例如,面对“水浒传中李逵为什么要大闹五台山”的提问,3款热门大模型无一指出此提问本身的错误,反而“顺坡下驴”,给出了诸如“喝醉酒”“误闯寺庙”“出手相助鲁智深”等答案。
事实上,对于人工智能的“知识幻觉”问题,国际科学界早有体会。今年《自然》一篇报道指出,目前AI辅助科研在参考文献方面出现错误的情况相当普遍,AI检索工具往往会“找出”与研究主题并无关系的论文。至于论文标题、第一作者或发表年份等细节的偏差,AI的差错率少则30%,多则90%。
看来,不只是你的父母长辈搞不清楚AI的“锦囊妙计”靠不靠谱,科学家也一样头疼呀!
“知识幻觉”难以避免
好吧,也许你会说,现在的AI还比较幼稚,有“幻觉”也难免,咱们认了。那大模型到底有没有可能彻底根除“知识幻觉”?
对不起,就目前的大模型技术路线而言,说“难免”不如说“难以避免”。对,“幻觉”是大模型数据驱动的内在机制带来的,因此“难以避免”。
香港科技大学团队一项研究,总结了导致AI幻觉的多种原因。以数据源为例,由于AI大模型的训练使用了大量互联网数据,数据集本身可能存在错误、过时或缺漏,导致幻觉的出现。再加上不同数据集之间存在相互矛盾的地方,“这可能会鼓励模型生成不一定有依据,也不忠实于(固定)来源的文本”。
北京通用人工智能研究院院长、北京大学智能学院院长朱松纯强调,大模型本身并不存在于真实世界中,因此无法像人一样实现从“词语(word)”到“世界(world)”的联结。也因此,大模型虽然出色,但仍然是“缸中之脑”,不具备真正的智能。
“这是由它的内在构造机制所决定的,即通过统计建模在大量文本上进行训练,学习文本之间的语言学相关关系,从而根据上一个词语预测下一个词语。”朱松纯说。
例如,大模型本质上不具备事实判断的能力,更多的是在纯符号空间中展开排列组合,更像是一种新型的“数据库”。即使它们生成了诸如“我爱你”这样的语句,也缺乏对人类真实生活体验的深刻理解,因此与我们所认同和期待的“我爱你”有着本质不同。
唉,那怎么才能与“致幻”的大模型良好共处呢?伤脑筋啊……
如何与人工智能共处
面对一时无法根治的大模型“知识幻觉”,我们怎么办才好?
科大讯飞董事长刘庆峰认为,“知识幻觉”虽然防不胜防,但可以利用技术手段设法矫正。AI大模型应当至少补充在线实时搜索与专业数据库动态接入两大“工具包”,让大模型的回答也过一遍“智能检校”。
不久前,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病人工智能大模型,就把主要精力放在了动态更新权威来源知识、增加多渠道溯源机制两方面。研发者表示,事关临床,决策可信度不敢稍有怠慢。这种谨慎,应当是大模型未来升级必备的品质。
当然,很多专家建议,如果是普通使用者,还是交叉比对一下不同模型的回答才好。3个大模型就算顶不上诸葛亮,也能让安心的程度高上几分。
不过,大模型“知识幻觉”,当真就一无是处吗?
其实,“一分为二”的眼光,也该用于“知识幻觉”。如业内人士所言,“幻觉”也意味着大模型“创造力”的萌芽。
360集团创始人周鸿祎接受采访时曾表示,“幻觉”对于实现AGI(通用人工智能)极其重要。实际上可以说,模型能力越强,“幻觉”也越强。换句话说,“幻觉”也就是人工智能的“灵感”。不大靠谱是代价,但不羁的想象力也是助力科研的潜能源泉。广受媒体关注的AI预测蛋白质结构,立下功劳的就是大模型的“幻觉”。
沈阳也承认,“幻觉”可能成为突破人类思维定式的“超现实引擎”,AI有可能藉之创造新的视觉和听觉体验,为游戏和文学创作打开不一样的世界。
看来,初出茅庐的大模型,已经颇有艺术家气息了……
说来说去,搞清楚“知识幻觉”到底是怎么回事,它其实并不可怕。我们使用AI,当有所节制;引导AI化“想象力”为生产力,办法也会日新又新。与AI大模型共度的时光,虽有乌云,但更灿烂的是乌云的金边。(朱涵)