国产资源精品一区二区免费,人妻饥渴偷公乱中文字幕,懂色av,恩恩呜呜好大好爽快点

生成式AI“幻覺”困境如何破解

3個月前 來源:中國科技網(wǎng) 觀看:21

人工智能(AI)技術(shù)正以前所未有的速度發(fā)展,生成式AI憑借其驚人的創(chuàng)造力,不斷刷新人們的認知。然而,即便是看似“聰明絕頂”的AI,也難逃“幻覺”的困擾。這里的“幻覺”,指的是AI生成看似合理但實際不準確或虛假的信息。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

英國《自然》雜志網(wǎng)站在1月22日的報道中指出,AI“幻覺”可能會引發(fā)嚴重后果,科學家正各出奇招,力求降低其發(fā)生率。這些措施包括增加事實核查、對AI進行“腦部掃描”等,以促進AI的健康、高效發(fā)展。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

主因是數(shù)據(jù)模糊xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

各種生成式AI,包括由大語言模型驅(qū)動的聊天機器人,常常會編造信息。它們有時會模糊事實與虛構(gòu),在看似真實的陳述中夾雜錯誤信息。這既是其創(chuàng)造力的體現(xiàn),也是其不足之處。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

美國佐治亞理工學院理論計算機科學家桑托什·威姆帕拉解釋稱,大語言模型的設(shè)計原理并非輸出準確事實,而是通過模式識別生成答案。其內(nèi)部復(fù)雜的運行機制迄今仍像一個“黑匣子”,人們難以洞悉其推理過程。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯(lián)合創(chuàng)始人阿姆爾·阿瓦達拉表示,在訓練過程中,這些模型會壓縮數(shù)萬億個單詞間的關(guān)系,隨后通過一個龐大的網(wǎng)絡(luò)模型重新展開這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓練內(nèi)容,但剩下2%的內(nèi)容卻會讓其“誤入歧途”,生成不準確或虛假信息。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

導致AI出現(xiàn)“幻覺”的原因多種多樣,其中訓練數(shù)據(jù)中的模糊性和錯誤是常見因素。也有人認為,即使訓練數(shù)據(jù)準確無誤,AI也有可能產(chǎn)生“幻覺”。這種現(xiàn)象與某一事實的稀缺程度密切相關(guān)。因此,即使經(jīng)過人類反饋調(diào)整過的聊天機器人,也無法完全避免出錯。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

多領(lǐng)域面臨考驗xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

AI的“幻覺”可能會給人們的工作和生活帶來較大影響。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在新聞領(lǐng)域,大語言模型可能生成虛假新聞事件,擾亂信息傳播秩序,誤導公眾認知。Vectara公司針對文檔內(nèi)容開展的研究表明,一些聊天機器人編造事實、虛構(gòu)信息的幾率高達30%。世界經(jīng)濟論壇發(fā)布的《2025年全球風險報告》顯示,錯誤和虛假信息是2025年全球面臨的五大風險之一。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在法律領(lǐng)域,它可能引用虛構(gòu)的法律條文和案例。比如,2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在醫(yī)學領(lǐng)域,它可能提供錯誤的診斷和治療建議,危及患者生命。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

《自然》在報道中指出,AI“幻覺”在科學參考文獻方面出現(xiàn)錯誤的情況也極為普遍。2024年的一項研究發(fā)現(xiàn),各類聊天機器人在提及參考文獻時的出錯率在30%至90%之間。它們至少會在論文標題、第一作者或發(fā)表年份上出現(xiàn)偏差。雖然聊天機器人都帶有警告標簽,提醒用戶對重要信息進行二次核實。但如果用戶對聊天機器人的回復(fù)深信不疑,可能會引發(fā)一系列問題。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

多舉措減少“幻覺”xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

為進一步提升AI的精確度,科學家正想方設(shè)法降低其“幻覺”。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

例如,增加模型訓練參數(shù)和訓練時長可有效減少“幻覺”。但這種方法需要付出高昂的計算成本,并可能削弱聊天機器人的其他能力,如機器學習算法對未知數(shù)據(jù)的預(yù)測和處理能力。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

此外,使用更大、更干凈的數(shù)據(jù)集進行訓練,也是降低AI模型“幻覺”出現(xiàn)的有效途徑。然而,當前可用數(shù)據(jù)的有限性限制了這一方法的應(yīng)用。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

檢索增強生成(RAG)技術(shù)也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機器人在回復(fù)問題前參考給定的可信文本,從而確保回復(fù)內(nèi)容的真實性,以此減少“幻覺”的產(chǎn)生。在醫(yī)療和法律等需要嚴格遵循經(jīng)過驗證的知識的領(lǐng)域,RAG技術(shù)備受青睞。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

不過,美國斯坦福大學計算機科學家米拉柯·蘇茲根表示,盡管RAG能提升內(nèi)容真實性,但其能力有限。蘇茲根團隊的研究表明,一些為法律研究開發(fā)的、號稱“無幻覺”的RAG增強模型雖有所改進,但仍存在不足。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

開發(fā)者也可以使用一個與AI訓練方式不同的獨立系統(tǒng),通過網(wǎng)絡(luò)搜索對聊天機器人的回復(fù)進行事實核查,谷歌的“雙子星”系統(tǒng)便是一個典型例子。該系統(tǒng)提供了“雙重核查響應(yīng)”功能:內(nèi)容如果突出顯示為綠色,表示其已通過網(wǎng)絡(luò)搜索驗證;內(nèi)容如果突出顯示為棕色,則表示其為有爭議或不確定的內(nèi)容。但是,這種方法計算成本高昂且耗時,而且系統(tǒng)仍會產(chǎn)生“幻覺”,因為互聯(lián)網(wǎng)上錯誤信息泛濫。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在去年6月出版的《自然》雜志上,英國牛津大學科學家刊發(fā)論文稱,他們利用“語義熵”,通過概率來判斷大語言模型是否出現(xiàn)了“幻覺”。語義熵是信息熵的一種,被用于量化物理系統(tǒng)中所包含的信息量。通過評估AI模型在特定提示詞下生成內(nèi)容的不確定性,來計算模型的困惑程度,從而為用戶或模型提供警示,提醒其采取必要的循證措施,確保更準確的答案輸出。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

美國卡內(nèi)基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時,繪制其內(nèi)部計算節(jié)點的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計算節(jié)點活動模式,可以告訴我們AI模型是在“說真話”,還是在“胡說八道”。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

人工智能(AI)技術(shù)正以前所未有的速度發(fā)展,生成式AI憑借其驚人的創(chuàng)造力,不斷刷新人們的認知。然而,即便是看似“聰明絕頂”的AI,也難逃“幻覺”的困擾。這里的“幻覺”,指的是AI生成看似合理但實際不準確或虛假的信息。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

英國《自然》雜志網(wǎng)站在1月22日的報道中指出,AI“幻覺”可能會引發(fā)嚴重后果,科學家正各出奇招,力求降低其發(fā)生率。這些措施包括增加事實核查、對AI進行“腦部掃描”等,以促進AI的健康、高效發(fā)展。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

主因是數(shù)據(jù)模糊xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

各種生成式AI,包括由大語言模型驅(qū)動的聊天機器人,常常會編造信息。它們有時會模糊事實與虛構(gòu),在看似真實的陳述中夾雜錯誤信息。這既是其創(chuàng)造力的體現(xiàn),也是其不足之處。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

美國佐治亞理工學院理論計算機科學家桑托什·威姆帕拉解釋稱,大語言模型的設(shè)計原理并非輸出準確事實,而是通過模式識別生成答案。其內(nèi)部復(fù)雜的運行機制迄今仍像一個“黑匣子”,人們難以洞悉其推理過程。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯(lián)合創(chuàng)始人阿姆爾·阿瓦達拉表示,在訓練過程中,這些模型會壓縮數(shù)萬億個單詞間的關(guān)系,隨后通過一個龐大的網(wǎng)絡(luò)模型重新展開這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓練內(nèi)容,但剩下2%的內(nèi)容卻會讓其“誤入歧途”,生成不準確或虛假信息。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

導致AI出現(xiàn)“幻覺”的原因多種多樣,其中訓練數(shù)據(jù)中的模糊性和錯誤是常見因素。也有人認為,即使訓練數(shù)據(jù)準確無誤,AI也有可能產(chǎn)生“幻覺”。這種現(xiàn)象與某一事實的稀缺程度密切相關(guān)。因此,即使經(jīng)過人類反饋調(diào)整過的聊天機器人,也無法完全避免出錯。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

多領(lǐng)域面臨考驗xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

AI的“幻覺”可能會給人們的工作和生活帶來較大影響。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在新聞領(lǐng)域,大語言模型可能生成虛假新聞事件,擾亂信息傳播秩序,誤導公眾認知。Vectara公司針對文檔內(nèi)容開展的研究表明,一些聊天機器人編造事實、虛構(gòu)信息的幾率高達30%。世界經(jīng)濟論壇發(fā)布的《2025年全球風險報告》顯示,錯誤和虛假信息是2025年全球面臨的五大風險之一。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在法律領(lǐng)域,它可能引用虛構(gòu)的法律條文和案例。比如,2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在醫(yī)學領(lǐng)域,它可能提供錯誤的診斷和治療建議,危及患者生命。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

《自然》在報道中指出,AI“幻覺”在科學參考文獻方面出現(xiàn)錯誤的情況也極為普遍。2024年的一項研究發(fā)現(xiàn),各類聊天機器人在提及參考文獻時的出錯率在30%至90%之間。它們至少會在論文標題、第一作者或發(fā)表年份上出現(xiàn)偏差。雖然聊天機器人都帶有警告標簽,提醒用戶對重要信息進行二次核實。但如果用戶對聊天機器人的回復(fù)深信不疑,可能會引發(fā)一系列問題。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

多舉措減少“幻覺”xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

為進一步提升AI的精確度,科學家正想方設(shè)法降低其“幻覺”。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

例如,增加模型訓練參數(shù)和訓練時長可有效減少“幻覺”。但這種方法需要付出高昂的計算成本,并可能削弱聊天機器人的其他能力,如機器學習算法對未知數(shù)據(jù)的預(yù)測和處理能力。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

此外,使用更大、更干凈的數(shù)據(jù)集進行訓練,也是降低AI模型“幻覺”出現(xiàn)的有效途徑。然而,當前可用數(shù)據(jù)的有限性限制了這一方法的應(yīng)用。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

檢索增強生成(RAG)技術(shù)也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機器人在回復(fù)問題前參考給定的可信文本,從而確保回復(fù)內(nèi)容的真實性,以此減少“幻覺”的產(chǎn)生。在醫(yī)療和法律等需要嚴格遵循經(jīng)過驗證的知識的領(lǐng)域,RAG技術(shù)備受青睞。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

不過,美國斯坦福大學計算機科學家米拉柯·蘇茲根表示,盡管RAG能提升內(nèi)容真實性,但其能力有限。蘇茲根團隊的研究表明,一些為法律研究開發(fā)的、號稱“無幻覺”的RAG增強模型雖有所改進,但仍存在不足。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

開發(fā)者也可以使用一個與AI訓練方式不同的獨立系統(tǒng),通過網(wǎng)絡(luò)搜索對聊天機器人的回復(fù)進行事實核查,谷歌的“雙子星”系統(tǒng)便是一個典型例子。該系統(tǒng)提供了“雙重核查響應(yīng)”功能:內(nèi)容如果突出顯示為綠色,表示其已通過網(wǎng)絡(luò)搜索驗證;內(nèi)容如果突出顯示為棕色,則表示其為有爭議或不確定的內(nèi)容。但是,這種方法計算成本高昂且耗時,而且系統(tǒng)仍會產(chǎn)生“幻覺”,因為互聯(lián)網(wǎng)上錯誤信息泛濫。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在去年6月出版的《自然》雜志上,英國牛津大學科學家刊發(fā)論文稱,他們利用“語義熵”,通過概率來判斷大語言模型是否出現(xiàn)了“幻覺”。語義熵是信息熵的一種,被用于量化物理系統(tǒng)中所包含的信息量。通過評估AI模型在特定提示詞下生成內(nèi)容的不確定性,來計算模型的困惑程度,從而為用戶或模型提供警示,提醒其采取必要的循證措施,確保更準確的答案輸出。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

美國卡內(nèi)基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時,繪制其內(nèi)部計算節(jié)點的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計算節(jié)點活動模式,可以告訴我們AI模型是在“說真話”,還是在“胡說八道”。xxN即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

本文鏈接:http://www.wbe-yiqi.com/news-2-375-0.html生成式AI“幻覺”困境如何破解

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:標記速度、均勻性和多功能性超出以往,新技術(shù)可高效標記細胞蛋白質(zhì)

下一篇:頂夸克遵循狹義相對論通過最強測驗

為你推薦
85后女董事長接班1年后,連續(xù)虧損的賽為智能要自救了?近日,賽為智能(300044.SZ)發(fā)布2024年度業(yè)績預(yù)告。預(yù)告顯示,賽為智能去年全年預(yù)計實...
01-23
新華社合肥1月20日電(記者徐海濤、陳諾)“998、999、1000……”大屏幕上的數(shù)字最終定格在1066,原本安靜的控制大廳一片歡呼。1月20日,我國...
01-21
  記者15日從國網(wǎng)遼寧省電力有限公司獲悉,2024年,遼寧省綠電交易電量達127.83億千瓦時,同比增長179.9%。...
01-21
  2月6日,大連市政府新聞辦召開“堅持需求導向 公開承諾踐諾 加快建設(shè)近悅遠來的營商環(huán)境標桿城市”...
02-09
全國2024年GDP公布的當日下午,上海就迫不及待地公布了全年數(shù)據(jù):53926.71億元,同比增長5.0%。不僅成功晉升為全國第一個五萬億城市,上...
01-21
  中新經(jīng)緯1月17日電 2024年全國營業(yè)性演出票房收入579.54億元,同比增長15.37%。  據(jù)中國演出行業(yè)協(xié)會微信號17日披露,根據(jù)中國演出行業(yè)協(xié)會票務(wù)信息采集平臺數(shù)據(jù)監(jiān)測和調(diào)...
01-21
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上線超過 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,這距離年初公布的2000 站的建站目標...
01-25
2 月 5 日消息,據(jù)央視新聞報道,記者今天從國家電網(wǎng)智慧車聯(lián)網(wǎng)平臺了解到,2025 年春節(jié)期間,我國新能源汽車高速公路充電量大幅增長,比去年同期增長近三成。從數(shù)據(jù)獲悉,今年...
02-06
  1、《樹下有片紅房子》陳歡爾和景棲遲在一起了,兩人在打打鬧鬧中沉淀下了深厚的感情,互相陪伴彼此走過了艱難的時光。  2、雖然宋叢先喜歡的陳歡爾,但陳歡爾只是把他當...
02-18
自從《痞子無間道》播出以來,該劇在抖音、微博和B站等社交媒體平臺上以及各大媒體和論壇上引發(fā)了廣泛的關(guān)注和熱議。其中,第9集的劇情介紹成為許多觀眾關(guān)注的...
02-19
21世紀經(jīng)濟報道記者 閆碩 北京報道腦機接口領(lǐng)域再傳利好消息。2月10日,據(jù)階梯醫(yī)療StairMed微信公眾號,近日,階梯醫(yī)療宣布完成3.5億元人民幣B...
02-13
21世紀經(jīng)濟報道記者朱藝藝 李佳英 閆碩 杭州、廣州、北京報道“天津老百姓大藥房可以訂購華為WATCH D2,2988元,醫(yī)保賬號走個人賬戶”“上海...
02-14
  特約通訊員魯磊本報記者葛仁鑫  前不久,成都市樹德實驗中學初二學生朱梓明在完成一份“特...
01-21
(華商網(wǎng)訊 華商小記者李佳澤)10月1日,華商網(wǎng)組織童學會的小記者們前往寶雞吉利汽車制造基地,參觀學習。抵達目的地后,小記者們首先齊聚于禮堂之中,聆聽吉利員工細致入微地介紹工...
01-21
  風控踩雷、治理“失序”、業(yè)績承壓,每一重危機都似一座大山,如何迎難而上,改善業(yè)績,成為貴陽銀...
01-22
  2024年12月30日,中國信托業(yè)協(xié)會發(fā)布《2023—2024中國信托業(yè)社會責任報告》(以下簡稱《報告》)...
01-24
天蝎座男生通常被認為是神秘、深沉而又充滿魅力的存在。他們對愛情有著極高的要求,很難...
01-22
巨蟹座的男生通常是非常重視家庭和親情的,當他深愛一個人時,會特別注重對方與自己家庭的...
01-22
讓人驚艷的女星:她們背后的故事與魅力當我們談?wù)撟铙@艷的女明星時,心中總會浮現(xiàn)出一系列光彩照人的面孔。她們不單是影視作品中的角色,更是現(xiàn)實生活中無法忽視的存在。你是否也...
02-07
女生格子襯衫搭配什么褲子?一、女生格子襯衫搭配什么褲子?女生穿格子襯衫的時候,建議搭配純色的褲子。比如說白色、乳白色、淺灰色和黑色以及藏青色的褲子。并且適合穿休閑直筒...
02-17
2月13日消息,轉(zhuǎn)轉(zhuǎn)集團發(fā)布春節(jié)期間(1月5日-2月5日)旗下平臺二手潮奢商品的交易數(shù)據(jù)。春節(jié)期間,轉(zhuǎn)轉(zhuǎn)集團旗下的轉(zhuǎn)轉(zhuǎn)APP和紅布林APP二手潮奢商品累計交易量同比增長25%;五線城市的...
02-14
2月16日消息,時值服飾行業(yè)春季上新節(jié)點,快手電商男裝運動行業(yè)聯(lián)合快手電商中小商家行業(yè)、快手商業(yè)化男裝運動行業(yè)發(fā)起“早春新風尚-男裝運動鞋服煥新季”活動。2月12日-2月28...
02-17
2月6日消息,及時用車日前宣布,平臺自2月3日起,全國統(tǒng)一上線“司機每日提現(xiàn)”權(quán)益,以解決司機資金周轉(zhuǎn)難題,提升車輛運維效率,保障車輛資產(chǎn)安全。即日起,無論工作日還是節(jié)假日,司機師...
02-07
2月8日消息,據(jù)Tech星球消息,美團近期啟動個人攝影師招募計劃,現(xiàn)階段招募的是人像攝影師,服務(wù)類型包含婚戀類、宴會類和景點跟拍類等,攝影師向平臺交付2000元押金后,無需營業(yè)執(zhí)照,即...
02-09
2025年1月21日中金公司發(fā)布了“全球Robotaxi第一股”文遠知行的調(diào)研報告,這一報告引起了媒體的廣泛關(guān)注。中金公司在財報中指出文遠知行有著三大顯著特點:1、自動駕駛行業(yè)的先...
01-23
【#海爾生物等在天津成立生物醫(yī)藥產(chǎn)業(yè)基金# 出資額5600萬】天眼查App顯示,近日,天津協(xié)禾生物醫(yī)藥產(chǎn)業(yè)基金合伙企業(yè)(有限合伙)成立,執(zhí)行事務(wù)合伙人為天津濱海創(chuàng)投投資管理有限公司...
02-09
極目新聞通訊員 李璐“太感謝你們了!這么短的時間,就幫我找回了背包,為我解決了大麻煩!”1月31日上午,張先生來到湖北棗陽市公安局北城派出所領(lǐng)回自己失而復(fù)得的背包,緊緊握住民警...
02-02
第九屆亞冬會2月7日開幕,隨著開幕臨近,各國運動員和媒體陸續(xù)抵達。第九屆亞冬會主媒體中心現(xiàn)場情況如何,跟隨總臺記者何莉一起探訪。這里是哈爾濱2025年第九屆亞冬會的主媒體中...
02-05
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕