構建大模型幻覺及其價值風險的預防治理體系

2周前來源：新華網觀看：20

當前，大模型正以日新月異的速度變革人類社會，其以強大的文字、圖像與視頻生成能力，帶給人們學習工作的效率革命與范式創新。越來越多人將大模型應用于日常實踐活動，然而在此過程中，部分用戶由于缺乏必要的媒介素養和信息驗證習慣，很容易被表面嚴絲合縫的人工智能幻覺蒙蔽欺騙，無條件信任大模型輸出的所有答案，進而對生活、學習或工作產生不良影響，引發決策誤導、認知偏差等風險。在推動大模型廣泛應用過程中，必須警惕與治理大模型幻覺問題及其價值風險，加快構建集技術優化、法律規制與倫理調適于一體的預防治理體系。

大模型幻覺的生成原因

在人工智能領域，幻覺特指大模型生成的內容看似語法正確、邏輯嚴謹，但實際上存在著事實錯誤或無法驗證事實的現象，具有“一本正經胡說八道”、無法確認現實依據等特征。大模型的幻覺包括事實性幻覺與忠實性幻覺兩種類型，前者指的是與事實不一致或存在事實捏造，后者指的是生成內容與用戶指令不一致、上下文不一致或邏輯不一致。

在本質上，大模型的幻覺問題是其技術架構、訓練和生成模式共同作用的產物，具有一般性、偶然性、隨機性、難以避免或克服等特征。在生成機制上，大模型幻覺的核心成因來自概率驅動的技術架構、訓練數據局限性以及人機互動生成邏輯的多重耦合。

首先是技術架構的能力短板。目前大模型主要采取基于轉換器結構的GPT范式，這種技術架構確能大幅度提高自然語言處理的精度與效率，但在預訓練、監督微調、推理等環節都可能存在能力短板，產生與事實、指令或上下文不一致的幻覺問題。例如在預訓練階段，大模型通過自回歸生成方式，基于歷史標記的概率分布逐詞預測輸出。這種機制天然缺乏對上下文語義一致性的把控能力，容易優先選擇概率更高但與事實、邏輯不一致的詞匯組合，輸出形成“語法正確但內容失真”的幻覺。

其次是訓練數據的天然缺陷。大模型基于互聯網海量數據進行深度學習，但由于互聯網語料并未經過嚴格檢驗處理，或者由于錯誤標注，不可避免存在事實錯誤或邏輯矛盾，大模型缺乏對數據真實性的鑒別能力，容易抓取或根據錯誤數據生成回答。例如，當要求GPT4大模型講述“林黛玉倒拔垂楊柳”的故事時，大模型并不能辨析其中的陷阱，而是未經事實驗證直接從海量文本數據中進行內容拼接，編造出一段荒謬情節。

最后是人機互動的刻板誤傷。大模型采取的人類反饋強化學習，容易導致大模型在刻意逢迎人類需求過程中出現信口開河、事實偽造等問題。如加拿大航空聊天機器人在錯誤理解“特殊退款”概念后，連續生成虛構的退款條件與時限，最終釀成法律糾紛。大模型特有的技術架構和生成邏輯，導致幻覺具有自我強化的危險性。

大模型幻覺的價值風險

大模型幻覺的隨機出現和難以避免，還存在著削弱人機信任、導向信息極化、沖擊社會秩序甚至引發意識形態安全危機等價值風險，亟待加強預防與治理。

大模型幻覺最直接的危害就是對用戶決策的誤導，特別是在醫療、健康、金融等領域。大模型的權威性表達風格與流暢的敘事邏輯，使得錯誤信息具有極強的迷惑性。如果用戶過于依賴大模型生成信息輔助決策，很有可能被誤導進而產生嚴重后果。例如，相信大模型提供的錯誤治療方案，可能導致疾病無法控制甚至進一步惡化。長此以往，恐將削弱人機信任關系。

更令人擔憂的是，大模型幻覺引發的價值風險呈現出從個人決策誤導向群體認知偏差、社會秩序沖擊的擴散路徑。在公共決策領域，幻覺可能扭曲政策認知，如果不加強對大模型輸出信息的甄別與把關，很有可能出現誤讀政策、發表歧視言論等幻覺問題，不僅會削弱政府公信力，甚至會危及社會公共安全。

在意識形態安全領域，相關威脅更加隱蔽。例如，相關研究監測到，某些境外大模型帶著意識形態的有色眼鏡看待中國特色社會主義發展成就與制度優勢，刻意混入虛假事實或錯誤評價，形成與主流話語不同的輸出。這種經過意識形態包裝的幻覺內容，通過知識問答形式進行價值滲透，其誤導性遠超傳統虛假信息。

大模型幻覺的治理對策

預防與治理大模型幻覺，應構建技術糾偏、法律規制與倫理調適的三維治理體系，通過技術優化消除幻覺問題，借助法律規制明確責任邊界，依托倫理調適培育價值理性，使大模型成為人類更可靠的合作伙伴。

構建多層次防治體系。“以技治技”是解決大模型幻覺問題的首選路徑。人工智能倫理的“價值敏感設計”或價值對齊策略，也有賴于技術層面創新與突破。這不僅需要人工智能企業與專家通過提高訓練數據質量、加強外部驗證與事實檢查、改進模型推理能力、增強透明度與可解釋性等途徑提升大模型性能，而且鼓勵哲學社會科學專家與人工智能專家攜手合作，通過知識庫優化、訓練語料糾錯、價值對齊監測等途徑，幫助大模型提高問答正確率，消除潛在的幻覺問題與價值風險。

建立適應性治理框架。面對大模型的普及化應用，敏捷、柔性、規范的立法治理勢在必行。國家網信辦等七部門頒布實施《生成式人工智能服務管理暫行辦法》，對訓練數據選擇、模型生成與優化、服務提供等提出明確的法律規制與風險防范要求，有利于推動“智能向善”，促進大模型的合規應用。歐盟《人工智能法案》要求大模型履行告知義務、確保技術方案的穩健性和可靠性等規范要求，對大模型的應用形成有效的制度約束和問責框架，值得參考借鑒。

提高技術開發應用的價值基準。對大模型幻覺更有意義的治理創新在于建立技術價值觀，將負責任創新、可控創造性等倫理價值融入工程師的頭腦、植入大模型的代碼。例如，倡導存在爭議結論不生成、無法溯源的信息不生成、超出模型認知邊界的內容不生成等原則，推動大模型從追求生成流暢度向確保內容可靠性轉型；又如，建立大模型回答事實性問題分級置信提示制度，按照高可信、需核實、推測性結論等進行分類標注，加強輸出內容的透明度與可解釋性。

對用戶而言，應進一步提高科學正確應用大模型的信息素養，進而成為引導內容生成的指揮官、幻覺問題的甄別者。研究表明，經過人工智能交叉驗證等使用習慣培訓，能夠顯著降低用戶被幻覺誤導的概率。人們需要與時俱進地提升自身辨析幻覺、掌握常識、批判思考的綜合能力，在利用大模型檢索信息、生成內容的過程中遵守履行事實核查、邏輯驗證、專業甄別、最小必要、場景控制等價值原則，最大限度消除幻覺問題和價值風險。

人工智能的可靠性建設往往滯后于其能力擴展。治理大模型幻覺的終極目標不是完全消滅技術的不確定性，而是要建立風險可控的人機協同機制。在這場人機協同的賽博進化中，始終保持技術的謙遜與倫理的清醒，是破除大模型幻覺迷霧的應有之義。

（作者：李凌，系復旦大學馬克思主義研究院副研究員）

大模型幻覺的生成原因

大模型幻覺的價值風險

大模型幻覺的治理對策

（作者：李凌，系復旦大學馬克思主義研究院副研究員）

點擊展開全文

本文鏈接：http://www.wbe-yiqi.com/news-2-1699-0.html構建大模型幻覺及其價值風險的預防治理體系

聲明：本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇：嫦娥六號采回樣品又有新發現——月背月幔水含量小于2微克/克

下一篇：我國科學家研發出新型合成孔徑雷達三維成像技術

為你推薦

人類基因組完整改組圖譜繪成深化人們對遺傳多樣性的理解

冰島基因解碼公司科學家完成了一項重要研究。他們繪制了一份人類基因組完整改組圖譜，即詳盡的人類DNA在生殖過程中混合方式的地圖。這項研究深化了...

01-23

人工智能助央企拓展國際影響力

1月10日，《2024中國大學、央企、城市海外網絡傳播力建設系列報告》發布會在北京師范大學舉辦。記者在會上了解到，2024年，我國部分中央企業通過將大語...

01-24

18道工序打磨西湖綢傘美出圈

　　在今年的春晚上，節目《借傘》給觀眾留下了深刻印象。演員手中精美的傘也引起了很多人的關注...

02-08

南方持續陰雨北方雨雪增多全國大部氣溫下滑

　　今后三天（2月18日至20日），南方將維持多陰雨的天氣格局，北方今夜起降水也將發展增多，西北地區東部...

02-18

10歲小孩哥沉迷織毛線，意外接到帽子訂單，爸爸發聲：已經織了10多頂了，家里毛線都不夠了

　　海報新聞記者劉澤報道 ...

01-21

百位華商預見2025｜希臘鄒勇：智能技術在商業運營中的應用將擴大

　　中新經緯1月17日電 (魏薇)“到2025年，百貨行業將更加注重數字化、智能化和綠色可持續發展。物流和供應鏈將繼續整合，智能技術在商業運營中的應用也將擴大。” 近日，希臘華...

01-21

13.59萬暢享純電駕駛樂趣南京首批領克Z20車主喜提新車

1月11日，“智享成雙純粹盡興”領克純電試駕會暨Z20首批車主交車儀式在南京云水澗舉行。眾多領克汽車的忠實粉絲、準車主和媒體共同見證領克Z20這款“智趣駕享純電SUV”在南...

01-21

比亞迪騰勢 N9 汽車 3 月份擇機上市，混動車型純電續航里程超 200 公里

2 月 2 日消息，比亞迪騰勢銷售事業部總經理趙長江今日發布視頻分享了騰勢 N9 新車“九大爆料”，其中提到了該車的上市時間、發布節奏，以及部分車型的續航能力。整理趙...

02-02

《六姊妹》片頭曲和片尾曲是什么

?電視劇《六姊妹》的片頭曲是《有我在呢》，由LUMi演唱?。這首歌曲的劇情版MV已經正式上線，歌詞中提到“繁星點點，長路漫漫，你不用回頭，我一直都在”，表達了溫暖...

02-20

難哄鐘思喬職業是什么

電視劇《難哄》中的鐘思喬職業成為了近期熱門話題。該劇開拍前就吸引了大量粉絲，隨著劇集播出，更多觀眾加入粉絲群體，對劇情充滿期待，并對鐘思喬的職業感到好奇...

02-22

“腦腐”是一種現代病嗎

　　回望現代醫學的發展，我們不得不承認有一些“疾病”是和時代捆綁在一起的，但也有一些，似乎像是...

02-08

21健訊Daily |我國急性呼吸道傳染病疫情呈下降趨勢；我國唯一獲批的用于肥胖或體重超重患者的口服治療藥物，獲再注冊批準通知書

這里是《21健訊Daily》，歡迎與21世紀經濟報道新健康團隊共同關注醫藥健康行業最新事件！政策動向醫保結算提速2月17日，國家醫保局官微轉載文章...

02-18

福建省海洋科學與技術創新實驗室揭牌

中新網廈門1月21日電(楊伏山戴佩琪)福建省海洋科學與技術創新實驗室(鷺江創...

01-21

國際學生走出校園感受中華文化魅力

　　日前，在我市學習的百余名國際學生紛紛走出校園，通過學習交流活動，感受中華文化魅力。　　近日，秦漢新城來了一批特殊客人。在中國(陜西)自貿試驗區秦漢新城功能區、西北農...

01-21

天津信托1.36%股權遭流拍

　　阿里資產拍賣網絡平臺顯示，1月11日，安邦集團持有的天津信托1.36%股權流拍。　　二拍將于1月22...

01-22

銀行理財再掀“降費潮”：部分產品管理費調降至接近“0費率”

　　隨著春節臨近，銀行理財子公司再掀“降費潮”。　　1月23日，光大理財在官網發布多條公告，將對旗...

01-24

雙魚男暗戀你的小動作，別當做沒看見

雙魚座的男生通常都是非常浪漫和敏感的，他們對待愛情充滿了幻想和渴望。如果你發現身邊...

01-22

雙子男開始煩你的表現，雙子男能撐幾天不聯系

雙子座的男生善于交際，聰明機智，喜歡追求新鮮刺激的感覺。然而，有時候他們也會變得煩躁不...

01-22

莆田華昌珠寶的上班時間及工作氛圍探秘

莆田華昌珠寶的上班時間及工作氛圍探秘在莆田，華昌珠寶因其精美的珠寶產品和優質的服務而備受青睞。如果你正在考慮加入這家珠寶公司，了解它的上班時間以及工作環境將對你做出...

02-07

170偏瘦男生穿搭？ 170斤的男生穿搭？

170偏瘦男生穿搭？ 170斤的男生穿搭？一、170偏瘦男生穿搭？建議以合身的休閑套裝為主。大家都知道，男生身高170厘米，是屬于中等身材，標準體重在120斤左右。如果這個男生偏瘦，則建議日...

02-17

快手電商女裝親子行業開啟“春日煥新季”活動

2月15日消息，快手電商女裝親子行業近日開啟“春日煥新季”。活動分三個階段，第一階段從2月13日至19日，將為商家帶來商家端和用戶端補貼、流量激勵、新品扶持、磁力金牛對投、短...

02-16

阿里巴巴第三季度營收2801.54億元同比增長8%

阿里巴巴發布2025財年第三財季業績公告。財報顯示，阿里巴巴第三財季收入2801.54億元，同比增長8%；經營利潤為412.05億元，同比增長83%；經調整EBITA548.53億元，同比增長4%；歸屬于普通...

02-21

螞蟻集團副總裁、螞蟻國際CTO達杭離職

2月8日消息，據“市象”公眾號消息，螞蟻集團副總裁、螞蟻國際首席技術官王曉航（花名：達杭）于近日突然離職。公開資料顯示，王曉航畢業于新加坡國立大學，加入螞蟻集團前，曾擔任百度百付...

02-09

美團自營大藥房超九成異地藥品訂單實現當日或次日達

2月22日消息，美團自營大藥房近日再次升級異地訂單快遞物流服務。美團數據顯示，在剛剛過去的流感季，美團自營大藥房已實現90%以上訂單“當日或次日達”，美團也是在醫藥電商領域首...

02-23

華力創科學完成數千萬元A+輪融資，首創光學多模態感知技術獲金屬3D打印龍頭鉑力特青睞

近日，華力創科學宣布完成數千萬元A+輪融資，本輪融資由金屬3D打印領域頭部上市公司鉑力特獨家投資。據披露，本輪融資所募集的資金將專注于深挖高性能光學多模態感知技術，結合金屬...

01-24

華力創科學完成數千萬元A+輪融資，首創光學多模態感知技術獲金屬3D打印龍頭鉑力特青睞

01-24

《文明7》新領袖卑彌呼宣傳片后續更新計劃公開

《文明7》將于2月11日發售，近日Firaxis Games公布了游戲新領袖“卑彌呼”。卑彌呼將作為“倭的女王”登場，其特點是擅長科學和外交。官方還發布卑彌呼宣傳片，一起...

02-03

優化太爛！《漫威蜘蛛俠2》Steam中文區多半差評

《漫威蜘蛛俠2》PC移植版因為優化和其他技術問題而遭到大面積的批評。Steam中文區評價“多半差評”，好評率僅僅33%，被玩家吐槽優化太爛！而在海外PC社群中，《漫威...

02-03

《哪吒2》觀影人次正式突破1億，打破69項影史紀錄，網友：準備二刷三刷

春節期間，國產動畫電影《哪吒之魔童鬧海》（簡稱《哪吒2》）持續走紅。貓眼專業版數據顯示，截至2月5日中午11時52分，票房突破50億元，觀影人次達到1億，成為中國影史第6部觀影人次破1億...

02-05

安徽省政協黨組成員、副主席周喜安接受審查調查

安徽省政協黨組成員、副主席周喜安涉嫌嚴重違紀違法，目前正接受中央紀委國家監委紀律審查和監察調查。（總臺央視記者宋琎）...

02-06

国产资源精品一区二区免费,人妻饥渴偷公乱中文字幕,懂色av,恩恩呜呜好大好爽快点

全部導航

構建大模型幻覺及其價值風險的預防治理體系

全球最大最環保汽車滾裝船從上海首航出海

雙預警發布！我國多地將有暴雨、雷暴大風等強對流天氣

今日視點丨2025年這些創新技術有望大放異彩

仿昆蟲眼相機每秒能拍9120幀圖像

今日視點丨2025年這些創新技術有望大放異彩

大語言模型健康體檢報告智能主檢系統啟用

無人機攜手機器人百米高空除冰

我國南極科考有新進展！