圖/IC


北京時間3月1日中午,DeepSeek于“開源周”收官之際在知乎發(fā)文,不僅解讀了關鍵的降本增效技術,還首次公開了API服務的成本、收入以及理論上高達545%的利潤率。不過,這也意外引發(fā)了兩家為用戶提供DeepSeek服務的MaaS供應商“互懟”,讓國內(nèi)AI Infra(人工智能基礎設施)企業(yè)罕見成為“吃瓜大戲”的主角。


MaaS,直譯為模型即服務,指將模型部署到企業(yè)端提供給用戶服務。春節(jié)期間DeepSeek“服務器繁忙”時,不少從事MaaS服務的大模型基礎設施公司,如潞晨科技、硅基流動等為用戶提供了使用“滿血版”DeepSeek的機會。


對于該項服務,潞晨科技創(chuàng)始人尤洋曾公開發(fā)文表示“MaaS模式下用戶越多虧損越多”,而隨著DeepSeek公開成本和利潤率,面對網(wǎng)友質(zhì)疑,尤洋發(fā)文反駁并一度“辣評”競對公司硅基流動,最終和硅基流動創(chuàng)始人袁進輝開始“互懟”。此后,更延展到此前潞晨科技涉及的抄襲風波上,引來了更多圈內(nèi)人士“下場”。


對此,中存算董事長陳巍評價道:“創(chuàng)業(yè)不易,創(chuàng)新不易,需要多一點寬容。技術上偶爾出現(xiàn)判斷偏差都很正常。”而對于究竟DeepSeek的MaaS服務“虧不虧”這一問題,陳巍對新京報貝殼財經(jīng)記者表示,“這個問題已經(jīng)超出純技術討論范疇了,涉及產(chǎn)品定位和AI Infra企業(yè)的求生。建議雙方擱置爭議,抓緊時間做Infra優(yōu)化,搶占用戶日活攀升的產(chǎn)業(yè)窗口期。”


DeepSeek展示盈利能力:一天收入56.2萬美元,理論成本利潤率545%


事件發(fā)生在DeepSeek的“開源周”行將結束之際——此前,DeepSeek曾表示將在從2月24日開始的“開源周”發(fā)布五項開源成果,但當五項成果全部發(fā)布結束后的第六天,DeepSeek又發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》技術文章,首次公布了模型推理系統(tǒng)降本增效的優(yōu)化細節(jié)。


該篇文章以DeepSeek推理系統(tǒng)的優(yōu)化目標:更大的吞吐,更低的延遲為核心,詳細介紹了其解決方案:使用大規(guī)模跨節(jié)點專家并行(Expert Parallelism / EP)。以通俗的方式來理解,就類似把AI模型拆分成多個“小專家”,分散到不同的顯卡(GPU)上運行。就像餐館里多個廚師同時備菜,每個廚師只負責自己最擅長的部分,整體出餐速度更快。V3系統(tǒng)中,每層有256個專家,但每次只用8個,通過動態(tài)分配實現(xiàn)高效計算。


此外,當不同顯卡之間需要傳遞數(shù)據(jù)時,系統(tǒng)會像工廠流水線一樣,讓計算和傳輸同時進行。例如在生成文字時,前一部分還在計算,后一部分已經(jīng)開始傳輸,避免“干等”浪費時間。


對此,袁進輝評論道,“DeepSeek官方披露大規(guī)模部署成本和收益,又一次顛覆了很多人的認知。現(xiàn)在很多供應商還做不到這個水平,主要是V3/R1架構和其他主流模型差別太大了,由大量小Expert(專家)組成,導致瞄準其他主流模型結構開發(fā)的系統(tǒng)都不再有效,必須按照DeepSeek報告描述的方法才能達到最好的效率,而開發(fā)這樣的系統(tǒng)難度很高,需要時間,幸好這周DeepSeek五連發(fā)已經(jīng)把主要模塊開源出來了,降低了社區(qū)復現(xiàn)的難度。”


一個可以讓人直觀感受DeepSeek效率的數(shù)據(jù)是,其在文章最后展示了以2月27日12:00至2月28日12:00,一天內(nèi)DeepSeek V3和 R1推理服務占用的節(jié)點,并統(tǒng)計了包括網(wǎng)頁、APP和API的所有負載,推算發(fā)現(xiàn)假定GPU租賃成本為2美元/小時,總成本為 8.7萬美元,若所消耗的tokens(算力計價單位)全部按照DeepSeek R1的API定價計算,理論上一天的總收入為56.2萬美元,成本利潤率為545%。


DeepSeek在知乎的文章中披露了其推算的成本、理論收入和利潤率 圖片來源:知乎截圖


“這份成本利潤披露看似坦誠,實則暗藏殺機。它告訴所有人:大模型的游戲規(guī)則早已變了,單靠算法或者簡單囤積算力不能贏得大模型的勝利。在算法+數(shù)據(jù)+算力的三要素中,有效算力(算力x算力效率)才是最暴力美學的生存規(guī)則,唯快不破這個道理也適用于大模型行業(yè)。這份數(shù)據(jù)事實上是三頭六臂‘大鬧東海,腳踢很白的宮’的技術演繹,也是‘算力+智力’逆風翻盤的真實寫照。”陳巍表示。


值得注意的是,此前DeepSeek的重要信息發(fā)布一般在X、GitHub等以英文為主的平臺,而本次的發(fā)布還額外登錄了知乎,這瞬間引發(fā)了國內(nèi)AI圈的熱情,截至3月3日早,DeepSeek發(fā)布的文章在知乎獲得了7735個贊,以及866條評論。


尤洋遭網(wǎng)友“點名” DeepSeek API服務到底“虧不虧”?


新京報貝殼財經(jīng)記者注意到,不少網(wǎng)友本著“看熱鬧不嫌事大”的心態(tài)在這篇文章的評論區(qū)里“呼叫尤洋”,其中一條@尤洋知乎賬號的評論獲得了475個點贊,點贊數(shù)為評論區(qū)第二高。


這是因為,此前尤洋曾發(fā)文直言“MaaS在中國短時間內(nèi)可能是最差的商業(yè)模式”“滿血版DeepSeek R1每日輸出1000億tokens,那么每個月虧損4億”,引發(fā)了業(yè)界對MaaS商業(yè)模式的爭論。


潞晨科技創(chuàng)始人尤洋微博截圖


AI與云基礎設施專家左鵬飛表示,DeepSeek和尤洋之間觀點沖突的主要原因是對每臺H800機器能跑出多大吞吐量的認知不同。


“根據(jù)尤洋老師的采訪視頻,4臺機器跑出的吞吐量是1K tokens/s,而DeepSeek官方跑出的數(shù)據(jù)是平均每臺機器14.8K tokens/s, 有14.8*4 ≈ 59倍的性能差距。不同MaaS服務提供商對相同機器上相同模型跑出來的吞吐量可以相差59倍,那么自然有的MaaS服務商能掙錢,有的MaaS服務商大虧錢。這也證明AI Infra的系統(tǒng)優(yōu)化能力是多么重要。”左鵬飛說。


對于網(wǎng)友的“點名”,尤洋本人也發(fā)文進行了回應,他認為DeepSeek文章中的數(shù)據(jù)對計算MaaS成本沒有太多參考價值,因為文章把DeepSeek網(wǎng)頁,APP和MaaS API的token數(shù)加在一起計算,且數(shù)據(jù)是建立在大量用戶把DeepSeek的APP和網(wǎng)頁完全超負荷占滿的情況下,不是一個常規(guī)的MaaS。


貝殼財經(jīng)記者發(fā)現(xiàn),DeepSeek提到的545%利潤率更多指的是“理想情況”,DeepSeek在官方文章里也表示“當然我們實際上沒有這么多收入,因為V3的定價更低,同時收費服務只占了一部分,另外夜間還會有折扣。”


尤洋強調(diào),自己對DeepSeek的模型能力沒有貶低,但其使用體驗非常差,“我春節(jié)期間用過幾次,問一個問題,然后說繁忙,讓我稍后嘗試,我等了15分鐘或者一小時。這不是一個合格的MaaS產(chǎn)品。”


似乎為了證明自己的觀點,尤洋在發(fā)布完回應文章后,宣布潞晨科技將在一周后停止提供DeepSeek的API服務,


潞晨科技公眾號截圖


對此,左鵬飛告訴新京報貝殼財經(jīng)記者,尤洋的觀點有一定的道理,但“即使考慮上資源預留,也就是545%的利潤率除以2或3,依然是盈利的,不影響我提到的核心邏輯。”


兩家MaaS供應商開吵“嘴架” 引出抄襲“舊賬”


這一事情的發(fā)展開始逐漸“跑偏”。尤洋在回復網(wǎng)友后,又在知乎發(fā)文,矛頭直指春節(jié)期間最早開始承接DeepSeek流量,為用戶提供“滿血版DeepSeek服務”的硅基流動,認為該公司“犧牲員工春節(jié)假期捆綁華為宣傳、在小紅書拉人頭、API速度慢”等。


對此,袁進輝在朋友圈反擊稱“我們團隊愿意拼搏抓一個機會有什么錯?邀請用戶送點免費券有什么錯?春節(jié)那幾天,全民都想訪問DeepSeek而不得時,我們提供了僅有的一個穩(wěn)定的服務。”同時,他還提到了此前潞晨科技曾抄襲過硅基流動。


這導致更多AI圈人士被牽涉進來,如尤洋提到該起抄襲事件代碼的負責人是原潞晨科技CTO方佳瑞,但后者發(fā)長文回應了自己的“背鍋”經(jīng)歷,表示代碼在自己入職之前就已存在。


此外,橘皮優(yōu)團隊在2024年11月發(fā)布的對潞晨科技的公開信也被挖出,該公開信提到,“潞晨云算力云平臺公然抄襲我們的業(yè)務模式和機主協(xié)議,侵犯了知識產(chǎn)權。”袁進輝轉發(fā)了該公開信并配文稱:“不是一次抄襲,多次發(fā)生。”


貝殼財經(jīng)記者注意到,雖然潞晨科技和硅基流動彼此指責,但二者都曾和華為云合作,為用戶推出基于國產(chǎn)算力的DeepSeek服務,而在DeepSeek公布開源方案之后,這些AI Infra企業(yè)能否復現(xiàn)DeepSeek的技術細節(jié),從中攤薄成本,就成了考驗企業(yè)技術實力的時候。


值得注意的是,雖然DeepSeek在過去一周中開源了多個代碼庫,但大多數(shù)是針對英偉達芯片架構的。對此,有開發(fā)者告訴貝殼財經(jīng)記者,這些開源成果無法直接用在華為云的推理服務中,但其思想可以借鑒。


當前,DeepSeek的成本透明化如同一面鏡子,映照出了AI Infra企業(yè)的理想與現(xiàn)實,如何更好地借鑒DeepSeek的解決方案,控制企業(yè)成本,或許才是“破局”的鑰匙,畢竟545%的理想利潤率已經(jīng)被DeepSeek“點出”。


當技術紅利逐漸消退,AI Infra企業(yè)需回答更本質(zhì)的問題:是繼續(xù)內(nèi)卷于算力租賃的價格戰(zhàn),還是以模型優(yōu)化、場景深耕和生態(tài)整合構建真正的壁壘?這場爭議或許只是序幕,行業(yè)的生存法則正在被重新書寫。


記者聯(lián)系郵箱:luoyidan@xjbnews.com


新京報貝殼財經(jīng)記者 羅亦丹

編輯 王進雨

校對 柳寶慶