生成式AI“幻覺”困境如何破解

3個月前來源：中國科技網(wǎng) 觀看：21

人工智能（AI）技術(shù)正以前所未有的速度發(fā)展，生成式AI憑借其驚人的創(chuàng)造力，不斷刷新人們的認知。然而，即便是看似“聰明絕頂”的AI，也難逃“幻覺”的困擾。這里的“幻覺”，指的是AI生成看似合理但實際不準確或虛假的信息。

英國《自然》雜志網(wǎng)站在1月22日的報道中指出，AI“幻覺”可能會引發(fā)嚴重后果，科學家正各出奇招，力求降低其發(fā)生率。這些措施包括增加事實核查、對AI進行“腦部掃描”等，以促進AI的健康、高效發(fā)展。

主因是數(shù)據(jù)模糊

各種生成式AI，包括由大語言模型驅(qū)動的聊天機器人，常常會編造信息。它們有時會模糊事實與虛構(gòu)，在看似真實的陳述中夾雜錯誤信息。這既是其創(chuàng)造力的體現(xiàn)，也是其不足之處。

美國佐治亞理工學院理論計算機科學家桑托什·威姆帕拉解釋稱，大語言模型的設(shè)計原理并非輸出準確事實，而是通過模式識別生成答案。其內(nèi)部復(fù)雜的運行機制迄今仍像一個“黑匣子”，人們難以洞悉其推理過程。

美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯(lián)合創(chuàng)始人阿姆爾·阿瓦達拉表示，在訓練過程中，這些模型會壓縮數(shù)萬億個單詞間的關(guān)系，隨后通過一個龐大的網(wǎng)絡(luò)模型重新展開這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓練內(nèi)容，但剩下2%的內(nèi)容卻會讓其“誤入歧途”，生成不準確或虛假信息。

導致AI出現(xiàn)“幻覺”的原因多種多樣，其中訓練數(shù)據(jù)中的模糊性和錯誤是常見因素。也有人認為，即使訓練數(shù)據(jù)準確無誤，AI也有可能產(chǎn)生“幻覺”。這種現(xiàn)象與某一事實的稀缺程度密切相關(guān)。因此，即使經(jīng)過人類反饋調(diào)整過的聊天機器人，也無法完全避免出錯。

多領(lǐng)域面臨考驗

AI的“幻覺”可能會給人們的工作和生活帶來較大影響。

在新聞領(lǐng)域，大語言模型可能生成虛假新聞事件，擾亂信息傳播秩序，誤導公眾認知。Vectara公司針對文檔內(nèi)容開展的研究表明，一些聊天機器人編造事實、虛構(gòu)信息的幾率高達30%。世界經(jīng)濟論壇發(fā)布的《2025年全球風險報告》顯示，錯誤和虛假信息是2025年全球面臨的五大風險之一。

在法律領(lǐng)域，它可能引用虛構(gòu)的法律條文和案例。比如，2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT，在法庭文件中引用了并不存在的法律案例。而在醫(yī)學領(lǐng)域，它可能提供錯誤的診斷和治療建議，危及患者生命。

《自然》在報道中指出，AI“幻覺”在科學參考文獻方面出現(xiàn)錯誤的情況也極為普遍。2024年的一項研究發(fā)現(xiàn)，各類聊天機器人在提及參考文獻時的出錯率在30%至90%之間。它們至少會在論文標題、第一作者或發(fā)表年份上出現(xiàn)偏差。雖然聊天機器人都帶有警告標簽，提醒用戶對重要信息進行二次核實。但如果用戶對聊天機器人的回復(fù)深信不疑，可能會引發(fā)一系列問題。

多舉措減少“幻覺”

為進一步提升AI的精確度，科學家正想方設(shè)法降低其“幻覺”。

例如，增加模型訓練參數(shù)和訓練時長可有效減少“幻覺”。但這種方法需要付出高昂的計算成本，并可能削弱聊天機器人的其他能力，如機器學習算法對未知數(shù)據(jù)的預(yù)測和處理能力。

此外，使用更大、更干凈的數(shù)據(jù)集進行訓練，也是降低AI模型“幻覺”出現(xiàn)的有效途徑。然而，當前可用數(shù)據(jù)的有限性限制了這一方法的應(yīng)用。

檢索增強生成（RAG）技術(shù)也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機器人在回復(fù)問題前參考給定的可信文本，從而確保回復(fù)內(nèi)容的真實性，以此減少“幻覺”的產(chǎn)生。在醫(yī)療和法律等需要嚴格遵循經(jīng)過驗證的知識的領(lǐng)域，RAG技術(shù)備受青睞。

不過，美國斯坦福大學計算機科學家米拉柯·蘇茲根表示，盡管RAG能提升內(nèi)容真實性，但其能力有限。蘇茲根團隊的研究表明，一些為法律研究開發(fā)的、號稱“無幻覺”的RAG增強模型雖有所改進，但仍存在不足。

開發(fā)者也可以使用一個與AI訓練方式不同的獨立系統(tǒng)，通過網(wǎng)絡(luò)搜索對聊天機器人的回復(fù)進行事實核查，谷歌的“雙子星”系統(tǒng)便是一個典型例子。該系統(tǒng)提供了“雙重核查響應(yīng)”功能：內(nèi)容如果突出顯示為綠色，表示其已通過網(wǎng)絡(luò)搜索驗證；內(nèi)容如果突出顯示為棕色，則表示其為有爭議或不確定的內(nèi)容。但是，這種方法計算成本高昂且耗時，而且系統(tǒng)仍會產(chǎn)生“幻覺”，因為互聯(lián)網(wǎng)上錯誤信息泛濫。

在去年6月出版的《自然》雜志上，英國牛津大學科學家刊發(fā)論文稱，他們利用“語義熵”，通過概率來判斷大語言模型是否出現(xiàn)了“幻覺”。語義熵是信息熵的一種，被用于量化物理系統(tǒng)中所包含的信息量。通過評估AI模型在特定提示詞下生成內(nèi)容的不確定性，來計算模型的困惑程度，從而為用戶或模型提供警示，提醒其采取必要的循證措施，確保更準確的答案輸出。

美國卡內(nèi)基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時，繪制其內(nèi)部計算節(jié)點的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計算節(jié)點活動模式，可以告訴我們AI模型是在“說真話”，還是在“胡說八道”。

主因是數(shù)據(jù)模糊

多領(lǐng)域面臨考驗

AI的“幻覺”可能會給人們的工作和生活帶來較大影響。

多舉措減少“幻覺”

為進一步提升AI的精確度，科學家正想方設(shè)法降低其“幻覺”。

點擊展開全文

本文鏈接：http://www.wbe-yiqi.com/news-2-375-0.html生成式AI“幻覺”困境如何破解

聲明：本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。

上一篇：標記速度、均勻性和多功能性超出以往，新技術(shù)可高效標記細胞蛋白質(zhì)

下一篇：頂夸克遵循狹義相對論通過最強測驗

為你推薦

AI+低空經(jīng)濟帶不動！85后女董事長接班1年難解困，賽為智能創(chuàng)始人回歸救場？

85后女董事長接班1年后，連續(xù)虧損的賽為智能要自救了？近日，賽為智能（300044.SZ）發(fā)布2024年度業(yè)績預(yù)告。預(yù)告顯示，賽為智能去年全年預(yù)計實...

01-23

燃！中國“人造太陽”創(chuàng)造“億度千秒”世界紀錄

新華社合肥1月20日電（記者徐海濤、陳諾）“998、999、1000……”大屏幕上的數(shù)字最終定格在1066，原本安靜的控制大廳一片歡呼。1月20日，我國...

01-21

遼寧：低價綠電助力用能企業(yè)節(jié)流增效

　　記者15日從國網(wǎng)遼寧省電力有限公司獲悉，2024年，遼寧省綠電交易電量達127.83億千瓦時，同比增長179.9%。...

01-21

大連多部門齊發(fā)力打造營商環(huán)境標桿城市

　　2月6日，大連市政府新聞辦召開“堅持需求導向　公開承諾踐諾　加快建設(shè)近悅遠來的營商環(huán)境標桿城市”...

02-09

當上全國首個五萬億城市，上海拿什么撐起新的5%增長？

全國2024年GDP公布的當日下午，上海就迫不及待地公布了全年數(shù)據(jù)：53926.71億元，同比增長5.0%。不僅成功晉升為全國第一個五萬億城市，上...

01-21

中國演出行業(yè)協(xié)會：2024年演出票房收入同比增15.37%

　　中新經(jīng)緯1月17日電 2024年全國營業(yè)性演出票房收入579.54億元，同比增長15.37%。　　據(jù)中國演出行業(yè)協(xié)會微信號17日披露，根據(jù)中國演出行業(yè)協(xié)會票務(wù)信息采集平臺數(shù)據(jù)監(jiān)測和調(diào)...

01-21

2024 年理想汽車未達成 2000 座超充站建站目標

1 月 24 日消息，截至 2024 年 12 月 30 日，理想超充站上線超過 1600 站，其中高速理想超充站 714 座、理想城市超充站 895 座。然而，這距離年初公布的2000 站的建站目標...

01-25

春節(jié)期間高速公路充電量同比增長近三成，沈海、長深、京滬排前三

2 月 5 日消息，據(jù)央視新聞報道，記者今天從國家電網(wǎng)智慧車聯(lián)網(wǎng)平臺了解到，2025 年春節(jié)期間，我國新能源汽車高速公路充電量大幅增長，比去年同期增長近三成。從數(shù)據(jù)獲悉，今年...

02-06

樹下有片紅房子陳歡爾和誰在一起了

　　1、《樹下有片紅房子》陳歡爾和景棲遲在一起了，兩人在打打鬧鬧中沉淀下了深厚的感情，互相陪伴彼此走過了艱難的時光。　　2、雖然宋叢先喜歡的陳歡爾，但陳歡爾只是把他當...

02-18

《痞子無間道》第9集劇情解析

自從《痞子無間道》播出以來，該劇在抖音、微博和B站等社交媒體平臺上以及各大媒體和論壇上引發(fā)了廣泛的關(guān)注和熱議。其中，第9集的劇情介紹成為許多觀眾關(guān)注的...

02-19

中國植入式腦機接口獲3.5億元最大融資：腦機接口，風口已至？

21世紀經(jīng)濟報道記者閆碩北京報道腦機接口領(lǐng)域再傳利好消息。2月10日，據(jù)階梯醫(yī)療StairMed微信公眾號，近日，階梯醫(yī)療宣布完成3.5億元人民幣B...

02-13

刷醫(yī)保買華為手表？消費者曬單火熱，但有地方已叫停

21世紀經(jīng)濟報道記者朱藝藝李佳英閆碩杭州、廣州、北京報道“天津老百姓大藥房可以訂購華為WATCH D2，2988元，醫(yī)保賬號走個人賬戶”“上海...

02-14

歷史觸手可及文脈直抵心間

　　特約通訊員魯磊本報記者葛仁鑫　　前不久，成都市樹德實驗中學初二學生朱梓明在完成一份“特...

01-21

童學會小記者走進寶雞吉利汽車

（華商網(wǎng)訊華商小記者李佳澤）10月1日，華商網(wǎng)組織童學會的小記者們前往寶雞吉利汽車制造基地，參觀學習。抵達目的地后，小記者們首先齊聚于禮堂之中，聆聽吉利員工細致入微地介紹工...

01-21

貴陽銀行高管頻繁變動風控踩雷16億難挽回業(yè)績失速凈利潤跌回五年前

　　風控踩雷、治理“失序”、業(yè)績承壓，每一重危機都似一座大山，如何迎難而上，改善業(yè)績，成為貴陽銀...

01-22

信托業(yè)積極服務(wù)經(jīng)濟社會

　　2024年12月30日，中國信托業(yè)協(xié)會發(fā)布《2023—2024中國信托業(yè)社會責任報告》（以下簡稱《報告》）...

01-24

天蝎男無法抗拒的情話，能讓天蝎座男生最心動的瞬間

天蝎座男生通常被認為是神秘、深沉而又充滿魅力的存在。他們對愛情有著極高的要求，很難...

01-22

巨蟹男深愛一個人細節(jié)，帶你見他的家長

巨蟹座的男生通常是非常重視家庭和親情的，當他深愛一個人時，會特別注重對方與自己家庭的...

01-22

讓人驚艷的女星：她們背后的故事與魅力

讓人驚艷的女星：她們背后的故事與魅力當我們談?wù)撟铙@艷的女明星時，心中總會浮現(xiàn)出一系列光彩照人的面孔。她們不單是影視作品中的角色，更是現(xiàn)實生活中無法忽視的存在。你是否也...

02-07

女生格子襯衫搭配什么褲子？

女生格子襯衫搭配什么褲子？一、女生格子襯衫搭配什么褲子？女生穿格子襯衫的時候，建議搭配純色的褲子。比如說白色、乳白色、淺灰色和黑色以及藏青色的褲子。并且適合穿休閑直筒...

02-17

轉(zhuǎn)轉(zhuǎn)：春節(jié)期間二手潮奢商品累計交易量同比增長25%

2月13日消息，轉(zhuǎn)轉(zhuǎn)集團發(fā)布春節(jié)期間（1月5日-2月5日）旗下平臺二手潮奢商品的交易數(shù)據(jù)。春節(jié)期間，轉(zhuǎn)轉(zhuǎn)集團旗下的轉(zhuǎn)轉(zhuǎn)APP和紅布林APP二手潮奢商品累計交易量同比增長25%；五線城市的...

02-14

快手電商男裝運動行業(yè)推出春季上新活動

2月16日消息，時值服飾行業(yè)春季上新節(jié)點，快手電商男裝運動行業(yè)聯(lián)合快手電商中小商家行業(yè)、快手商業(yè)化男裝運動行業(yè)發(fā)起“早春新風尚-男裝運動鞋服煥新季”活動。2月12日-2月28...

02-17

及時用車全國上線“每日提現(xiàn)”功能

2月6日消息，及時用車日前宣布，平臺自2月3日起，全國統(tǒng)一上線“司機每日提現(xiàn)”權(quán)益，以解決司機資金周轉(zhuǎn)難題，提升車輛運維效率，保障車輛資產(chǎn)安全。即日起，無論工作日還是節(jié)假日，司機師...

02-07

美團啟動個人攝影師招募無需營業(yè)執(zhí)照即可入駐

2月8日消息，據(jù)Tech星球消息，美團近期啟動個人攝影師招募計劃，現(xiàn)階段招募的是人像攝影師，服務(wù)類型包含婚戀類、宴會類和景點跟拍類等，攝影師向平臺交付2000元押金后，無需營業(yè)執(zhí)照，即...

02-09

自動駕駛行業(yè)規(guī)模持續(xù)擴大，中金公司預(yù)測文遠知行股價將漲至19.00美元/股

2025年1月21日中金公司發(fā)布了“全球Robotaxi第一股”文遠知行的調(diào)研報告，這一報告引起了媒體的廣泛關(guān)注。中金公司在財報中指出文遠知行有著三大顯著特點：1、自動駕駛行業(yè)的先...

01-23

海爾生物等在天津成立生物醫(yī)藥產(chǎn)業(yè)基金

【#海爾生物等在天津成立生物醫(yī)藥產(chǎn)業(yè)基金# 出資額5600萬】天眼查App顯示，近日，天津協(xié)禾生物醫(yī)藥產(chǎn)業(yè)基金合伙企業(yè)（有限合伙）成立，執(zhí)行事務(wù)合伙人為天津濱海創(chuàng)投投資管理有限公司...

02-09

《黑神話：悟空》萍萍演員泡澡視頻這誰頂?shù)米“。?/a>

《黑神話：悟空》大獲成功后，亢金龍、紫蛛兒、小狐貍萍萍等角色也深受玩家喜愛。近日小狐貍萍萍女演員錢思怡在網(wǎng)上分享視頻，展示了她泡澡的視頻，一起來看看吧！視頻...

01-31

DeepSeek爆火后美國考慮英偉達特供版也不賣中國

近日據(jù)國外媒體報道稱，美國正在研究將銷售限制擴大至英偉達對華“特供版”AI芯片H20。該產(chǎn)品可以用于開發(fā)和運行人工智能軟件和服務(wù)。為了滿足美國對中國出...

02-03

群眾遺失貴重背包，湖北棗陽民警迅速尋回

極目新聞通訊員李璐“太感謝你們了！這么短的時間，就幫我找回了背包，為我解決了大麻煩！”1月31日上午，張先生來到湖北棗陽市公安局北城派出所領(lǐng)回自己失而復(fù)得的背包，緊緊握住民警...

02-02

第九屆亞冬會2月7日開幕中外媒體記者陸續(xù)抵達主媒體中心

第九屆亞冬會2月7日開幕，隨著開幕臨近，各國運動員和媒體陸續(xù)抵達。第九屆亞冬會主媒體中心現(xiàn)場情況如何，跟隨總臺記者何莉一起探訪。這里是哈爾濱2025年第九屆亞冬會的主媒體中...

02-05

国产资源精品一区二区免费,人妻饥渴偷公乱中文字幕,懂色av,恩恩呜呜好大好爽快点

全部導航

生成式AI“幻覺”困境如何破解

新工藝在室溫下造出有序半導體材料

今日視點丨2025年這些創(chuàng)新技術(shù)有望大放異彩

國內(nèi)首個12兆瓦級陸上風電機組成功下線

激光束結(jié)合金屬泡沫造出最亮X射線

全國首家AI醫(yī)院將面向公眾開放，AI會取代醫(yī)生嗎？

性情大變是否預(yù)示患上阿爾茨海默病

人類基因組完整改組圖譜繪成深化人們對遺傳多樣性的理解

新型多功能基因編輯平臺面世