国产资源精品一区二区免费,人妻饥渴偷公乱中文字幕,懂色av,恩恩呜呜好大好爽快点

浙大天才,震驚全球

2個月前 來源:投資家網 觀看:66

1.pngJwf即熱新聞——關注每天科技社會生活新變化gihot.com

2024年末,一位科技創業者火了。


作者 | 王思琪
來源 | 投資家(ID:touzijias)

2024年末,一位科技創業者火了。Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

2025年初,這位創業者再度爆火。Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

近日,中國科技行業因一位85后年輕人現身《新聞聯播》,徹底爆了。他以AI初創公司深度求索(DeepSeek)創始人的身份罕見參加了一場國家超高規格座談會,并現場發言。Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

2.pngJwf即熱新聞——關注每天科技社會生活新變化gihot.com

3.pngJwf即熱新聞——關注每天科技社會生活新變化gihot.com

他發言的照片,迅速流傳于各類社交平臺。所有人都想聽聽,他分享了哪些可能改變全球科技未來趨勢的深度見解。這位年輕人,就是把開源模型做到全球第一,性價比超越估值1570億美元獨角獸OpenAI的浙大天才,梁文鋒。他和DeepSeek曾一夜轟動美國硅谷、震驚全球。而梁文鋒及團隊開發的大模型“DeepSeek-V3”則被海外稱作,“來自東方的神秘力量”。Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

梁文鋒與DeepSeek的故事還要從2024年末發生的兩件大事說起。
第一件事,轟動硅谷、震驚全球。2024年12月,一家名叫DeepSeek的杭州初創公司經過技術迭代與升級,發布了全新一代大模型,“DeepSeek-V3”。由于這款大模型太過好用,在AI發燒友圈子傳播后,傳到了海外社交平臺、技術論壇,引發了海外網友的連連稱贊。
4.png
有海外網友直接拿“DeepSeek-V3”和OpenAI發布的“GPT-4o”進行比較,結論是,“兩款產品不相上下”。得出這樣的結論,美國硅谷的技術大牛坐不住了,他們覺得,“網友描述太過夸張”。于是,紛紛把“DeepSeek-V3”拿來使用,挑點毛病。挑來挑去,差點“跪了”。
結果,技術大牛挑了不少“GPT-4o”的毛病。這件事,在硅谷傳播,成了美國科技圈的熱門討論議題。有幾位硅谷AI技術扛把子,開了個分析會。研究“這個新模型是怎么做到的?”會上一些專家頭大了,分析半天,給出結論,“很強,但投入成本肯定會超過OpenAI”。
緊接著,美國媒體打了硅谷的臉。據報道,“DeepSeek-V3”來自一家名叫DeepSeek的中國初創公司。令人驚訝的是,DeepSeek-V3的投入研發費用,只花了558萬美元。“難以想象,一款性能比肩GPT-4o的大模型,訓練成本不到GPT-4o的1/20,硅谷卻還在自以為是。”
看到報道,硅谷心態炸了,科技地震。有人感到羞愧,有人給出了客觀聲音。OpenAI早期成員安德烈·卡帕西說,“DeepSeek-V3的出現,意味著,今后也許不需要大型GPU集群來訓練前沿的大語言模型了。”Scale AI華裔CEO亞歷山大·王感嘆,“DeepSeek-V3更強”。
讓硅谷更加不可思議的是,訓練成本極低的“DeepSeek-V3”只用了2048張H100的GPU集群,且用時僅53天。一位美國AI行業研究員稱,“同等水平下,哪怕是全球AI第一梯隊的頭部公司,至少也要用到1.6萬張以上的GPU進行訓練,真的不可思議,太不可思議了。”
一位推特網友表示,“美國科技故步自封,殊不知勤勞的中國跑到了前面。”伴隨各種驚訝之聲,“DeepSeek-V3”在大模型發燒友的推動下火遍全球,被認為是“來自東方的神秘力量”。
美國CNBC電視臺如此評價硅谷科技地震,“一種新模式,讓整個山谷都嗡嗡作響。”

Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

全球炸鍋了,DeepSeek卻在國內保持低調。
過去一兩年,AI是全球最寵溺風口,沒有之一。眾多細分賽道中,大模型熱度靠前,是大廠、資本投入規模最大賽道。國內,大廠對大模型表現出了極度偏愛,開創了“大模型盛世”。
早期大模型的參與者就有百度、華為、騰訊、阿里巴巴、京東、字節跳動、網易等巨無霸。其中,百度開發了“文心一言”,華為有“盤古”,騰訊弄“混元”,阿里巴巴打造“通義千問”,京東上線“言犀”。不光自己干,素有“中國三大產業資本CVC”之稱的騰訊、阿里巴巴、京東,相繼投了一批大模型,間接折騰出牽動一二級市場、概念滿天飛的“百模大戰”。
“百模大戰”釋放了“無窮大”的市場增量空間,資本、高校、創業者、科學家密集參與。
大模型賽道繼續分化,拆出多個分支,包括通用大模型、行業大模型、垂直大模型3大應用分類,每個大分類有小分類。根據百度文庫一份報告顯示,國內大模型數量超200個,覆蓋芯片、新能源汽車、智能制造、醫療健康、航空航天、數字產業、金融等50多個領域。
拼殺到2024年,資本聚集、表現出眾的5只獨角獸分別是:智譜AI、月之暗面(Kimi)、百川智能、MiniMax、零一萬物。試想,在這么“卷”的大模型賽道,想要出名也不容易。反觀DeepSeek,在競爭激烈的賽道,十分冷靜。第二件事,才讓DeepSeek漸漸浮出水面。
第二件事便是,網傳雷軍天價招人。就在“DeepSeek-V3”轟動硅谷不久,“頂流科技網紅”小米創始人雷軍出手了,要做小米大模型。雷軍出手非同凡響,“年薪千萬元,挖角95后AI天才少女”話題引爆熱搜。雷軍想挖的人,叫羅福莉,她碩士畢業于北大計算語言學研究所計算語言學專業,是AI行業的天才少女。不過,后來羅福莉向媒體說,“還在考慮”。
媒體“瘋狂搶流”,挖出了羅福莉曾跳槽DeepSeek,參與研發了大模型“DeepSeek-V2”。一個員工都有這么大的魅力,DeepSeek創始人得有多強?就這樣,浙大天才,藏不住了。
在一位不缺天才的時代,梁文鋒堪稱天才中的奇才。
他的想法很“超前”、行事低調神秘。他的資料多半靠媒體“拼圖”得來。有媒體說他1985年出生在廣東五線城市,還是有媒體說他1985年出生在廣東三線城市。他在17歲考上浙大前的經歷,仿佛空白,到現在沒有一家媒體能說清楚,更查不到證實過的公開資料。

Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

他的一切,始于浙大。
2002年,梁文鋒考入浙大電子信息工程專業。在一個大模型聞所未聞的年代,“自學成才”的梁文鋒就已是一位“建模達人”。別的同學是研究主流就業方向,他只關注前沿科技。
使得其在學校里“不太合群”。2007年,本科畢業的梁文鋒考入浙大信息與通信工程專業攻讀研究生,主修機器視覺研究。讀了一年,他就把書本知識琢磨透了,帶領同學校外實踐。
“不太合群”的梁文鋒遇到志同道合的同學,點燃了心中的熱情。他自己組建了一個AI實踐團隊,要把市場里的數據、知識研究透徹“理論結合實踐”。有傳言說,梁文鋒帶著同學跑各個行業交流時,得到了大疆創始人汪滔的邀請,“他欣賞,有實干精神的年輕人。”
互聯網風靡全球的階段,梁文鋒就堅定的相信,“AI會改變世界”。他的“超前”意識,不合群,連番交流中,有人嘲笑他“看科幻片看多了,AI會改變世界?太離譜了。”2010年,梁文鋒交出了一篇題為《基于低成本PTZ攝像機的目標跟蹤算法研究》的碩士畢業論文。
畢業后,他在科技行業找不到理想工作,決定拉著志同道合的校友創業。千萬別以為,他馬上干大模型了,梁文鋒冷靜的出奇,知道時機不成熟,先琢磨掙出第一桶金。這里有個小插曲,梁文鋒除了是“建模達人”,也是學生中為數不多的“股神”,炒股賺過一筆財富。
有了“炒股”積累,梁文鋒把AI知識與全自動量化交易融合,創立了雅克比投資。2015年,中證500股指期貨上市,中國量化私募進入2.0時代。量化基金擁有了量化工具,梁文鋒抓住機遇成立幻方科技,闖入陽光私募大軍。后成立幻方量化,正式走上了量化交易之路。
2016年,幻方量化推出第一個大模型,用GPU計算交易倉位,年底管理基金規模約10億元。這亦是梁文鋒創業的獨特之處,“AI是個需要重金投入、燒錢未必能燒成功的賽道。梁文鋒的想法是,用知識切入吸金領域,別人不支持,就自己做資本,再投向未來事業。”
這種在科技行業“自給自足”的創業創新能力,哪怕放到今天也很少見。

Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

“不求他人,不靠資本,就自己干,有錢了給新事業融資。”
2023年,財富積累雄厚的梁文鋒,在杭州投資創立了深度求索,品牌DeepSeek。這也合理的解釋了DeepSeek于“大模型盛世”、“百模大戰”,在未有任何“頂流”資本加持,仍堅強的活下來,創投圈難以捕捉DeepSeek研發成長軌跡的原因。“實現了自給自足式創業”。
打破了科技創業者長久以來,“拿不到融資就很難走下去或資本倒逼過早商業化導致研發投入降低的底層邏輯。”他不愧是天才中的奇才,一夜轟動硅谷。“不鳴則已,一鳴驚人”。
創立DeepSeek,是梁文鋒圓夢AI的開始。他想建設“一個效率奇高、由眾多前所未有的設計組合生成的超級工程。”他要把中國人自己的AI、大模型做到全球第一,輻射全球。
梁文鋒帶領DeepSeek團隊的第一階段是,“降本增效”。“以最低的算力、最少的訓練時間,重構全球大模型生態。”聽上去挺瘋狂,OpenAI號稱“全球最牛大模型公司”也沒做到,“DeepSeek-V3”做到了。據了解,DeepSeek搞出來一個新模式,達到了“降本增效”。
所以,“美國科技創新大本營”硅谷害怕了。根據Chatbot Arena最新數據顯示,“DeepSeek-V3”是全球性價比最高的大模型,開源模型品類排名全球第一,復雜問題、代碼領域表現排名全球前三。更牛的一個突破是,“GPU需求變小”。什么意思?前文提到全球AI第一梯隊的頭部公司訓練大模型至少要用到1.6萬張以上GPU訓練,換句話說,對GPU是愈發依賴。
這也被視為全球大模型的發展障礙,要看GPU的臉色。“訓練離不開GPU”。“DeepSeek-V3”牛在哪呢?2048張GPU完成了1.6萬張GPU干得事,一旦需求降低,GPU與大模型的主導關系會逐漸反轉,對全球AI會是“驚天動地”的變革,減弱GPU廠商的話語權。
全球大模型,沒有公司做到這一步,DeepSeek走出的一小步,對未來AI格局影響深遠。當然,在波詭云譎的全球AI變局中,DeepSeek要做的事情會有很多。梁文鋒創業的一大優勢是,“自給自足”,他和團隊能騰出更多時間專注研發、錘煉技術,推動中國科技主導世界。
最近,梁文鋒又火了。他參加了一場國家超高規格座談會,并現場發言,科技行業沸騰了。雖然,梁文鋒的創業之旅有過“不被認同”、“嘲笑”。但他并不孤單,越來越多的中國年輕人正積極投身科技事業,發力飛行汽車、人形機器人等前沿賽道。踏破荊棘,勇往直前。
送上一句梁文鋒接受媒體報道時的精彩回答,“中國的AI不可能永遠跟隨,需要有人站到技術的前沿。”
Jwf即熱新聞——關注每天科技社會生活新變化gihot.com


Jwf即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://www.wbe-yiqi.com/news-14-6924-0.html浙大天才,震驚全球

聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

上一篇:智算中心太“多”,大模型不夠用了

下一篇:華力創科學完成數千萬元A+輪融資,首創光學多模態感知技術獲金屬3D打印龍頭鉑力特青睞

為你推薦
近日,網易動作武俠手游《流星群俠傳》發布公告宣布,由于游戲開發運營策略的調整,游戲將于2025年3月24日15時起停止新內容開發,關閉部分服務器,具體安排如下: 1. 2025...
01-24
《絕地潛兵2》的開發商箭頭游戲工作室在過去一年里,因其由游戲策劃主導的劇情而備受關注。為紀念《絕地潛兵2》發布一周年,極為神秘的游戲策劃J.O.E.L.首次在一...
02-10
春節期間,國產動畫電影《哪吒之魔童鬧海》(簡稱《哪吒2》)持續走紅。貓眼專業版數據顯示,截至2月5日中午11時52分,票房突破50億元,觀影人次達到1億,成為中國影史第6部觀影人次破1億...
02-05
當地時間5日,烏克蘭總統澤連斯基簽署關于延長烏克蘭戰時狀態和動員的法令,戰時狀態和總動員令將再延長90天至2025年5月9日。(總臺記者 王斌)...
02-06
《自然·醫學》雜志1月21日發表的一項研究報告稱,一種手術植入的腦機接口系統能通過精準偵測和解碼癱瘓患者的神經元活動,轉為“手指動作”,使...
01-22
  科技日報記者 劉霞  美國加州大學伯克利分校和韓國高麗大學科學家攜手,從變色龍身上獲得靈...
01-24
  至1月27日10時40分,經與交警部門協商,沈陽、葫蘆島、鐵嶺、錦州、大連、撫順、盤錦、阜新、營口部分...
01-28
  你見過雪后的七彩丹霞嗎?  剛下過雪的景致,并不令人稱奇。只是白雪覆蓋了起伏的山巒,與別處...
02-14
全國多個省份陸續進入“兩會時間”。1月13日,黑龍江省第十四屆人民代表大會第三次會議開幕。根據2025年黑龍江省政府工作報告,2025...
01-21
  中新經緯1月17日電 題:2024年消費結構在向多元化、品質化轉變  作者 徐洪才 中國政策科學研究會經濟政策委員會副主任  國家統計局17日發布的2024年國民經濟運行情況...
01-21
1 月 24 日消息,小鵬汽車 MONA 產品負責人@XP-楊光 今日分享視頻介紹了 MONA 車型的第五次大規模 OTA。他稱“工程團隊在原計劃的基礎上,全力做了壓縮,終于趕在了春節...
01-25
1 月 31 日消息,據小鵬汽車官方,近日該公司先后在都柏林與赫爾辛基舉辦發布會,小鵬 G9 在芬蘭登場,而小鵬 G6 在芬蘭與愛爾蘭同時亮相。▲ 圖源小鵬汽車公眾號在此之前,...
02-01
《余燼之上》廖知白真實存在嗎?廖知白是幻想出來的嗎?在《余燼之上》的劇情設定中,廖知白是真實存在的。廖知白是電視劇《余燼之上》中的角色,由孫陽飾演。他原...
02-21
近日,娛樂圈內一對知名夫婦——劉詩詩與吳奇隆的生活狀態,通過圈內人士劉大錘的社交平臺分享,再次吸引了公眾的廣泛關注。此次爆料不僅揭示了兩人獨特的家庭分工模式,還意外引發...
02-23
  從國家衛生健康委獲悉,2024年我國居民健康素養水平達到31.87%,比2023年提高2.17個百分點,保持較快增幅。  健康素養是指個人獲取和理解基本健康信息和服務,并運用這...
01-21
21世紀經濟報道記者季媛媛 上海報道 近期,安科生物發布重要公告,宣布將運用自有資金,最高不超過3100萬美元(含相關手續費如經紀傭金及征費等)...
02-14
師生在街頭義務為群眾書寫春聯 賈敏杰 攝  當日,河北省石家莊新樂市東長壽學校舉行“金蛇送福、柿柿如意”師生義務書寫春聯活動,師生為群眾書寫春聯福字,傳遞新年祝福。 編...
01-21
  大眾網記者 王一剛 報道  1.暖·冬至  冬至,在我國農歷的舞臺上,它不僅是一個至關重要的節氣,更是一場闔家團圓、傳承民俗的文化盛宴。  為了在幼兒心底種下傳統...
01-21
  中國經濟網北京2月7日訊 國家金融監督管理總局網站日前發布的上海監管局行政處罰信息公開表...
02-08
  即便是在周末前往新奧爾良觀看超級碗的路上,也不耽誤美國總統特朗普舞起新的關稅大棒,對鋼鐵...
02-13
在愛情的世界里,有時候我們會遇到一些人,他們似乎對我們表現出了濃厚的興趣,但卻讓我們感...
01-22
水瓶座的男生一向以聰明、理性和獨立著稱。他們善于思考,注重自由和個人空間。然而,當涉...
01-22
璀璨舞臺:模特T臺走秀大賽精彩主持稿親愛的觀眾們,大家好!今天我們齊聚一堂,歡迎來到精彩絕倫的模特T臺走秀大賽現場。我是今天的主持人[姓名],倍感榮幸能與大家一同分享這場時尚...
02-12
揭開羽絨服價格背后的秘密,買到理想款式不再難當我們的目光被初冬的寒風所撩動時,羽絨服無疑成了大家衣櫥中的寵兒。然而,面對市場上琳瑯滿目的羽絨服和千差萬別的價格,我常常思...
02-17
2月15日消息,2025年寶山區優化營商環境暨投資促進大會近日舉辦,向全社會釋放寶山區優化營商環境、實干前行的鮮明信號,發出共享發展機遇、雙向奔赴的盛情邀約。本次大會對2024...
02-15
2月18日消息,中經匯達實業有限公司(以下簡稱:中經匯達)董事長邱云飛一行近日到訪涂多多。國聯股份高級副總裁、涂多多CEO劉齋,涂多多高級副總裁、跨境產發部總經理邵春生代表公司...
02-18
2月5日消息,8天假期疊加“請2休11”的拼假策略,帶來了春節假期更多元的出游模式。途牛《2025春節出游消費盤點》(以下簡稱“報告”)數據顯示,更多途牛用戶選擇了5至6天或3至4天的...
02-07
2月10日消息,易生支付近日憑借在萬事達卡(Mastercard)國際與國內收單市場的突出貢獻,再度榮獲由萬事達卡頒發的年度“卓越合作伙伴獎”,并獲得由萬事達卡在華合資公司萬事網聯首...
02-11
1月21日,賽力斯披露2024年年報業績預盈公告,公司預計2024年度實現營業收入1442億元到1467億元,同比增長302.32%到309.30%;預計2024年實現歸屬上市公司股東的凈利潤為55億元...
01-23
全球性金融券商集團英國EBC Group平臺始終致力于以領先生態,與全球交易者共塑交易的未來。 自第一屆交易大賽起,為赤忱的熱愛和卓越的才華提供舞臺,在全球內尋找交易好手以賦能...
01-24
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕