這幾天,中國人工智能初創公司DeepSeek火了,不僅在美區下載榜上超越了ChatGPT,還引發多個美國科技股的股價暴跌。美國總統特朗普稱DeepSeek的出現“給美國相關產業敲響了警鐘”。為何DeepSeek的出現會讓美國如此關注,甚至有些緊張?譚主聯合中國工業互聯網研究院獨家揭秘背后的原因↓↓↓
原因一:
高性價比沖擊美國大模型壟斷地位
DeepSeek可謂是用最少的錢,干最多的事。其推出的模型,在性能上和世界目前頂尖的GPT-4o等大模型不相上下。但在成本上,OpenAI訓練ChatGPT-4花費的成本高達7800萬美元,還可能達到1億美元。而DeepSeek大模型訓練成本不到600萬美元,僅為同性能模型的5%到10%。新模型訓練方法大幅度降低了大模型行業的入局門檻,大規模預訓練不再是科技巨頭的專利。在模型推理層面,DeepSeek新推出的DeepSeek-R1,價格為2.2美元/百萬詞元,而同性能OpenAI-o1的價格為60美元/百萬詞元,DeepSeek大概是OpenAI的三十分之一。這種“低成本”標志著推理大模型調用進入平價時代,顯著改善了大模型的應用成本,對大模型在科研、企業等智力密集型產業中的應用具有重大的價值。因此,無論是從基礎研究角度還是從商業層面上看,在訓練和推理方面,對此前美國一些大模型公司的既有模式沖擊比較大。
原因二:
模式創新,帶來美國高新技術人員恐慌
DeepSeek開發成本與美國大模型相比大幅降低,在于應用了不同的模型訓練模式,打破了美國堆砌算力的“豪氣”方式。在喂養學習數據這一大模型重要環節上,OpenAI選擇了“人海戰術”,堆砌算卡、將資源集中在算力,用海量數據投喂實現能力的提升。而DeepSeek相比于“砸資源”選擇了另外一種方式。利用算法把數據進行總結和分類,經過選擇性處理之后再輸送給大模型,最大優化算力實現了成本的降低和模型性能提升。目前看Meta耗費了大量資金訓練Llama,但是效果上卻沒有成本極低的DeepSeek效果好,Meta高層已經在思考其員工是否在浪費公司資金,而這也引發了不少企業技術人員的恐慌,他們擔心自己被質疑技術能力和創新性從而失去工作。根據海外互聯網平臺對DeepSeek的討論分析,社交媒體帖子的數量遠高于新聞報道,數量約是新聞報道的十倍。時間上來看,社交媒體帖子的討論早于新聞報道,發酵起點比新聞媒體早了五天,這是由從事科技工作的自媒體人以及員工圈層傳播“破圈”造成。
原因三:
國產大模型正在厚積薄發
根據中國工業互聯網研究院推出的《人工智能大模型年度發展趨勢報告》,與國際頂尖大模型能力相比,2024年國內大模型的能力進步非常顯著。從2023年第四季度到2025年第一季度的測評顯示,國內外大模型能力差距縮小了將近75%。可以看出,DeepSeek的出現并不是所謂的“異軍突起”,而是中國國內大模型整體發展的階段性成果體現。此外,在報告統計的世界AI領域的投資上,中國55億美元的投資額排在第二位,僅是第一位美國641億投資額的不到十一分之一,中國未來在AI領域的發展上還有很大的空間。
如今,在DeepSeek對全球AI圈帶來的震動下,很多業內人士都喊出了“DeepSeek接班OpenAI”的口號。事實上,DeepSeek的出現,并不是要取代別人,而是提出了更多樣化的方案,打破了國際主流大模型的市場壟斷,在大模型的發展道路上提出了不同于美西方的中國解法,讓世界看到了在大模型領域不是只有拼算力這一條路,再一次向世界證明,什么是中國智慧。
這幾天,中國人工智能初創公司DeepSeek火了,不僅在美區下載榜上超越了ChatGPT,還引發多個美國科技股的股價暴跌。美國總統特朗普稱DeepSeek的出現“給美國相關產業敲響了警鐘”。為何DeepSeek的出現會讓美國如此關注,甚至有些緊張?譚主聯合中國工業互聯網研究院獨家揭秘背后的原因↓↓↓
原因一:
高性價比沖擊美國大模型壟斷地位
DeepSeek可謂是用最少的錢,干最多的事。其推出的模型,在性能上和世界目前頂尖的GPT-4o等大模型不相上下。但在成本上,OpenAI訓練ChatGPT-4花費的成本高達7800萬美元,還可能達到1億美元。而DeepSeek大模型訓練成本不到600萬美元,僅為同性能模型的5%到10%。新模型訓練方法大幅度降低了大模型行業的入局門檻,大規模預訓練不再是科技巨頭的專利。在模型推理層面,DeepSeek新推出的DeepSeek-R1,價格為2.2美元/百萬詞元,而同性能OpenAI-o1的價格為60美元/百萬詞元,DeepSeek大概是OpenAI的三十分之一。這種“低成本”標志著推理大模型調用進入平價時代,顯著改善了大模型的應用成本,對大模型在科研、企業等智力密集型產業中的應用具有重大的價值。因此,無論是從基礎研究角度還是從商業層面上看,在訓練和推理方面,對此前美國一些大模型公司的既有模式沖擊比較大。
原因二:
模式創新,帶來美國高新技術人員恐慌
DeepSeek開發成本與美國大模型相比大幅降低,在于應用了不同的模型訓練模式,打破了美國堆砌算力的“豪氣”方式。在喂養學習數據這一大模型重要環節上,OpenAI選擇了“人海戰術”,堆砌算卡、將資源集中在算力,用海量數據投喂實現能力的提升。而DeepSeek相比于“砸資源”選擇了另外一種方式。利用算法把數據進行總結和分類,經過選擇性處理之后再輸送給大模型,最大優化算力實現了成本的降低和模型性能提升。目前看Meta耗費了大量資金訓練Llama,但是效果上卻沒有成本極低的DeepSeek效果好,Meta高層已經在思考其員工是否在浪費公司資金,而這也引發了不少企業技術人員的恐慌,他們擔心自己被質疑技術能力和創新性從而失去工作。根據海外互聯網平臺對DeepSeek的討論分析,社交媒體帖子的數量遠高于新聞報道,數量約是新聞報道的十倍。時間上來看,社交媒體帖子的討論早于新聞報道,發酵起點比新聞媒體早了五天,這是由從事科技工作的自媒體人以及員工圈層傳播“破圈”造成。
原因三:
國產大模型正在厚積薄發
根據中國工業互聯網研究院推出的《人工智能大模型年度發展趨勢報告》,與國際頂尖大模型能力相比,2024年國內大模型的能力進步非常顯著。從2023年第四季度到2025年第一季度的測評顯示,國內外大模型能力差距縮小了將近75%。可以看出,DeepSeek的出現并不是所謂的“異軍突起”,而是中國國內大模型整體發展的階段性成果體現。此外,在報告統計的世界AI領域的投資上,中國55億美元的投資額排在第二位,僅是第一位美國641億投資額的不到十一分之一,中國未來在AI領域的發展上還有很大的空間。
如今,在DeepSeek對全球AI圈帶來的震動下,很多業內人士都喊出了“DeepSeek接班OpenAI”的口號。事實上,DeepSeek的出現,并不是要取代別人,而是提出了更多樣化的方案,打破了國際主流大模型的市場壟斷,在大模型的發展道路上提出了不同于美西方的中國解法,讓世界看到了在大模型領域不是只有拼算力這一條路,再一次向世界證明,什么是中國智慧。
本文鏈接:http://www.wbe-yiqi.com/news-2-379-0.html玉淵譚天丨熱解讀:為何DeepSeek引發美國恐慌
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇:新電池讓可穿戴設備比棉花還透氣
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕