DeepSeek和國運有啥關係?

關不羽
2025-02-16
image
日前在國際爆紅的DeepSeek,被人懷疑其處理流程為先調用外國AI,再加上內容審核。(GREG BAKER/AFP via Getty Images)

DeepSeek橫空出世,成功破圈。破圈之後,照例就是各自發揮的「六經注我」。其中最值得警惕的,中美雙方都出現了借題發揮的「技術孤立主義」。美方的「脫鈎論」者把DeepSeek視為技術威脅,剽竊、盜用的指責滿天飛;這邊的「國運賭徒」則是把DeepSeek渲染為「中美爭霸」的一擊制勝的,自我感覺良好。

好端端的科技成果,卻成了地緣政治的符號。妖魔化和神化看似針尖對麥芒,其實都是對科技進步事業的褻瀆,是阻撓人類科技進步事業的合謀。

唯有屏蔽雜音,才能直面真相:DeepSeek到底是什麼?將會造成怎樣的影響?

01 DeepSeek師承chatgpt

1月27日,DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。隨即引發了資本市場的震盪,DeepSeek被形容為「英偉達的最大空頭」,英偉達的股價大幅下跌。「DeepSeek碾壓ChatGPT,吊打英偉達」的神話就此誕生。

先說Deepseek和ChatGPT之間的關係。DeepSeek和ChatGPT之間的競爭,是「師徒之戰」。兩者的師承關係源於「蒸餾技術」,這是Deepseek快速崛起的技術路徑。

通俗的說,「蒸餾技術」就是用一個較為成熟的「教師模型」訓練「學生模型」,這一過程類似低度酒蒸餾加工為高度酒。具體操作方式是,「學生模型」每分鐘上百萬次高頻提問,從「教師模型」中汲取數據、學習邏輯。然後在人工干預下優化算法,最終形成獨特的個性。ChatGPT就是Deepseek的「教師模型」,或許不是唯一的,肯定是主要的。因此,說ChatGPT是Deepseek的老師,不過分吧?

「蒸餾技術」不是近年來的新發明,發明者既不是中國人,也不是美國人,而是英國佬傑弗里.辛頓在2015年提出的,比阿爾法狗一戰成名還早一年。所以,當時「蒸餾技術」只是純理論的屠龍技——壓根就沒有成熟的「教師模型」,沒法蒸餾。直到ChatGPT等成熟大模型相繼投入實際應用,「蒸餾技術」才有了實際應用的空間。因此,「先有ChatGPT,後有Deepseek」也是無法否認的事實。

顯然,Deepseek不是「天上掉下個林妹妹」,而是站在巨人肩膀上的衍生產品。咋咋呼呼的「國運賭徒」竭力否認、淡化Deepseek的師承ChatGPT,強拗「獨立原創」的造型,是可笑又可憐的掩耳盜鈴。

當然,也不能因為Deepseek是蒸餾技術的產物,就否認其原創性。蒸餾不等於盜竊、抄襲。要是能一抄了之,哪裡輪得到Deeseek?在蒸餾技術的賽道上,有名有姓的玩家少說也有上百家。Deepseek能出圈,是有幾把刷子的。「蒸餾」大同小異,人工干預的算法優化各顯神通。簡潔高效的算法是Deepseek的成功關鍵,頗有中國特色。

人工智能三大要素——算法、算力、數據,中國長於算法,美國重視算力。這種「偏科」傾向在賽道開啟初期就已經顯現了。昔日商湯為代表的視覺系AI「中國四小龍」,就是以算法著稱。

ChatGPT崛起,「算力為王」的大力出奇蹟成為主流。風水輪流轉,Deeepseek的勃興,在一定程度上是「算法復興」。這種技術風格的轉換,在人類的科技進步史上反覆發生,是一種常態。

Deepseek最大的優勢是性價比,算法賦能大幅降低了算力成本。省錢永遠是商業競爭的王道,絕大部分個人用戶都沒有很高的專業需求,免費、開源的Deepseek更有吸引力,這是人工智能商業化應用的成功。

但是,這並不意味着因Deepseek已經青出於藍勝於藍,更談不上「碾壓ChatGPT」。「蒸餾技術」和算法優化是做減法,以簡化的方式提高效率。所以,Deepseek更垂直、更聚焦專業領域,這也意味着犧牲了一部分通用性。比如說,文生圖等視覺系技術就不是Deepseek的強項,和文心一言比都有差距,遑論ChatGPT。而且,蒸餾技術的技術「天花板」到底有多高,現在也很難判斷。未來能否實現性能全面超越,並沒有清晰的預期。

這從資本市場的表現也可以看出端倪,Deepseek上架後,微軟的股價僅僅下跌了2%。表明了市場投資者還處於觀望態度,資本市場用真金白銀的站隊表態,不是各路「嘴強王者」的唾沫星子可比的。

反而是英偉達的股價「大跌」17%,Deepseek真是「英偉達終結者」嗎?

02 Deepseek不是「英偉達終結者」

Deepseek到底使用了多少英偉達芯片,目前有三個版本分別是五萬、一萬和兩千多,越傳越少。其中「只有了兩千多」的版本最假,Deepseek創始人梁文峰本人在採訪中就說過,早在公司成立前額2021年就囤了一萬塊GPU。無論是一萬還是五萬,比起動輒幾十萬芯片的大廠產品,都是數量級的降低。大可不必在傳播過程中人為誇大Deepseek的「省芯」。

必須指出的是,Deepseek的算法優化「省芯」,並不會降低人工智能領域的算力需求降低。算法優化和算力需求的關係,有點類似燃油發動機技術節油和燃油消費需求。燃油發動機開發省油技術,並沒有降低汽油消費的總量。因為汽車的燃油成本越低,促進了汽車的普及度,燃油消費的總量不降反增。

Deepseek省芯降低了人工智能研發應用的資金門檻,會吸引更多的投資者進場。

人工智能的研發端將會進一步走向「群狼搏虎」的遍地開花。在應用端,Deepseek成功實現免費開源模式,大幅推進了人工智能的普及應用,也會產生巨大的算力需求增長。別小看中小企業、個人用戶本地部署的仨瓜倆棗,聚沙成塔是巨大的潛在需求增長。Deepseek不是「英偉達終結者」,而是英偉達的財神爺。

所以,英偉達對Deepseek的態度非常積極,不僅第一時間登陸NVIDIANIM,還給了權威背書——「DeepSeek-R1是最先進的大語言模型」。

至於所謂「股價大跌」,英偉達經歷了市值十年增長222倍的超高增長,區區17%的跌幅不痛不癢。這輪迴調,不是Deepseek對英偉達產生了實質性威脅,而是市場投資者借Deepseek釋放一波回調勢能。

當然,算力需求增長,未必是英偉達笑到最後。給英偉達造成競爭壓力的不是Deepseek,而是其他大廠的算力芯片。英偉達的大客戶谷歌、亞馬遜、微軟競相推出自家算力芯片,算力大戰已經開打。這場「神仙打架」對人工智能技術的研發、應用無疑是好消息。

因此,「國運賭徒」強行把Deepseek樹立為英偉達的對手,是莫名其妙的「關公戰秦瓊」。這種強行對立,不是拔高,而是矮化——低估了Deepseek對整個人工智能領域的結構性衝擊。

03 Deepseek是計劃外的中美科技合作產物

我們應該怎樣評價Deepseek呢?DeepSeek創始人梁文峰給出了標準答案,「我們不是有意成為一條鲶魚,只是不小心成了一條鲶魚」。

Deepseek的成功完全是計劃外的市場產物。一家註冊資金1000萬的小公司,而不是「國運賭徒」心心念念的「國家隊」。起點不高,也沒有「星辰大海」的宏大目標——DeepSeek的初始目標是專攻金融交易,就是「國運賭徒」們最反感的「資本工具」。這樣一家「起於草莽」的小民企,打造了一款成功的人工智能產品。不經意間改變了整個產業。這才是科技產業發展的正常模式。各種奇思妙想在開放的市場中競爭、試錯,實現從量變到質變的升華。

Deepseek的成功,沒有「賭國運」、中美爭霸的宏大敘事,只有樸實的市場邏輯和水到渠成的科技路徑。市場需要性價比高的人工智能技術,企業研發滿足了市場需求。蒸餾技術從純理論的紙上談兵,到成熟大模型開道後真正落地。自然而然,不需要拔苗助長。

Deepseek不是閉門造車的產物,而是中美科技合作的成果。美國大廠的「教師模型」和算力技術,中國科技企業的研發力量,缺一不可。市場機制的無形之手,總是撮合出「佳偶天成」。那些彩旗飄飄、儀式感十足的「合作簽約儀式」十之八九只是「儀式」而已。只有市場機制下的合作才保真。

因此,大可不必刻意強調Deepseek的原創性、創新性。師承chatgpt的蒸餾技術、使用英偉達GPU都是無法否認的事實,又何必遮遮掩掩?「微創新」的一小步,也可以是人類科技事業的一大步。瓦特並沒有發明蒸汽機,而是改良了前輩的創作。這並不妨礙瓦特蒸汽機叩開了工業化的大門。

一款好產品本身,足以說明一切。Deepseek無疑是一款好產品,至於是否具備「劃時代」的意義,無需「口頭加冕」,時間會說明一切。就算沒有又何妨?只要有良好的市場合作機制,而不是以鄰為壑的自我封閉,劃時代的好產品一定不會缺席。

 全文轉自微信公眾號關胖本胖

 

猜你喜歡

編輯推薦

image