“價(jià)格屠夫”DeepSeek的理想主義：開(kāi)源、降本與AI普惠

訊石光通訊網(wǎng) 發(fā)布時(shí)間:2025/1/28 9:52:46 編者:iccsz

摘要：DeepSeek證明了，在“大力出奇跡”的Scaling Law之外，AI大模型或許還有另一條制勝之道、一種“DeepSeek Law”?！癉eepSeek目標是實(shí)現AGI，而不僅僅是短期的商業(yè)化?！眲?chuàng )始人梁文鋒表示，降價(jià)并非為了搶用戶(hù)，而是基于成本下降和對普惠AI的追求。

一天內登頂中美App Store免費榜、火到兩天崩潰兩次、Meta開(kāi)設四個(gè)作戰室研究，連日來(lái)，DeepSeek猶如一顆 “東方核彈”，引爆了全球AI圈。

DeepSeek這次引發(fā)全球震動(dòng)的根源之一，就是其最新發(fā)布的開(kāi)源模型DeepSeek-R1。據公司介紹，在數學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上，DeepSeek-R1性能比肩已經(jīng)能OpenAI o1正式版，并采用MIT許可協(xié)議，支持免費商用、任意修改和衍生開(kāi)發(fā)等。

可以說(shuō)，DeepSeek和它的大模型證明了，在“大力出奇跡”的Scaling Law之外，AI大模型或許還有另一條制勝之道、一種“DeepSeek Law”：調整改變大模型的基礎結構+有效利用有限資源。

▌“一份給全球的開(kāi)源大禮”

DeepSeek的很多選擇都和國內的大模型創(chuàng )業(yè)公司不同，比如堅定選擇開(kāi)源路線(xiàn)，將代碼、模型權重和訓練日志全部公開(kāi)，DeepSeek-R1自然也不例外。

對于DeepSeek-R1，多位AI行業(yè)大佬都不乏溢美之詞。

“DeepSeek-R1是我見(jiàn)過(guò)最令人驚嘆、最讓人印象深刻的突破之一，而且它還是開(kāi)源的，可以說(shuō)是一份給全球的大禮?！表敿夛L(fēng)投之一A16Z創(chuàng )始人Marc Andreesen如此形容這個(gè)模型。

“我們生活在這樣一個(gè)時(shí)代，一家非美國公司正在讓OpenAI的初衷得以延續，即做真正開(kāi)放、為所有人賦能的前沿研究?！庇ミ_高級研究科學(xué)家Jim Fan表示，DeepSeek-R1可能是第一個(gè)展示了RL（強化學(xué)習）飛輪可發(fā)揮作用，且能帶來(lái)持續增長(cháng)的OSS（開(kāi)源軟件）項目。

Meta首席科學(xué)家楊立昆（Yann Lecun）則表示， “開(kāi)源模型正在超越專(zhuān)有模型。DeepSeek從開(kāi)放研究和開(kāi)源中獲益匪淺。他們提出了新的想法，并基于其他人的工作進(jìn)行創(chuàng )新。由于他們的工作是公開(kāi)和開(kāi)源的，所有人都能從中獲益。這就是開(kāi)源研究和開(kāi)源技術(shù)的力量?！?

隨之而來(lái)的，是全球范圍內AI技術(shù)人員們掀起的“DeepSeek復現熱潮”：

比如UC伯克利博士生潘家怡和兩位研究人員，就在游戲CountDown中復現了DeepSeek R1-Zero。團隊驗證了通過(guò)RL，3B的基礎語(yǔ)言模型也能夠自我驗證和搜索，成果出色。更重要的是，這項復現成本僅僅不到30美元。

全球最大開(kāi)源平臺HuggingFace團隊，也已官宣復刻DeepSeek R1所有pipeline。復刻完成后，所有的訓練數據、訓練腳本等等，將全部開(kāi)源。

“在顛覆性的技術(shù)面前，閉源形成的護城河是短暫的。即使OpenAI閉源，也無(wú)法阻止被別人趕超?！盌eepSeek創(chuàng )始人梁文鋒曾這樣解釋選擇開(kāi)源的原因，“開(kāi)源，發(fā)論文，其實(shí)并沒(méi)有失去什么。對于技術(shù)人員來(lái)說(shuō)，被follow是很有成就感的事。開(kāi)源更像一個(gè)文化行為，而非商業(yè)行為……我們不會(huì )閉源。我們認為先有一個(gè)強大的技術(shù)生態(tài)更重要?！?/strong>

▌技術(shù)降本造就“AI價(jià)格屠夫”

談到DeepSeek大模型，另一個(gè)被常常提到的形容詞，應該是“物美價(jià)廉”。

最新面世的這一DeepSeek-R1，API服務(wù)定價(jià)為每百萬(wàn)輸入tokens 1元（緩存命中）/4元（緩存未命中），每百萬(wàn)輸出tokens 16元，輸出API價(jià)格僅僅只有OpenAI o1的3%。

這不是DeepSeek第一次舉起“價(jià)格屠刀”。

在去年5月，DeepSeek已經(jīng)帶著(zhù)開(kāi)源第二代MoE大模型DeepSeek-V2，頂著(zhù)“價(jià)格屠夫”、“AI界拼多多”的稱(chēng)號一炮而紅——性能比肩GPT-4，但定價(jià)上每百萬(wàn)token輸入1元、輸出2元（32K上下文），僅是GPT-4的近百分之一水平。

在這之后，字節跳動(dòng)、百度、騰訊、阿里巴巴等互聯(lián)網(wǎng)大廠(chǎng)紛紛按捺不住，紛紛官宣大模型降價(jià)，由此打響了國內大模型價(jià)格戰。

低價(jià)背后，還是離不開(kāi)“技術(shù)炫技”帶來(lái)的降本。

一個(gè)多月前DeepSeek-V3就曾引發(fā)業(yè)內高度關(guān)注，關(guān)鍵原因之一就是預訓練成本之低——這個(gè)參數量高達671B的大模型，在預訓練階段僅使用2048塊GPU訓練了2個(gè)月，且只花費557.6萬(wàn)美元。與此同時(shí)，DeepSeek-V3相比其他前沿大模型，性能卻足以比肩乃至更優(yōu)。

在這背后，DeepSeek-V3采用了用于高效推理的多頭潛在注意力（MLA）和用于經(jīng)濟訓練的DeepSeekMoE。研發(fā)團隊證明，多Token預測目標（Multi-Token Prediction，MTP）有利于提高模型性能，可以用于推理加速的推測解碼。后訓練方面，DeepSeek V3引入了一種創(chuàng )新方法，將推理能力從長(cháng)思維鏈模型（DeepSeek R1）中，蒸餾到標準模型上。這在顯著(zhù)提高推理性能的同時(shí)，保持了DeepSeek V3的輸出風(fēng)格和長(cháng)度控制。

▌AI應用普及前奏

“DeepSeek的目標是實(shí)現AGI，而不僅僅是短期的商業(yè)化?！?/strong>梁文鋒曾在采訪(fǎng)中如此強調。

DeepSeek的降價(jià)并非為了搶用戶(hù)，而是基于成本下降和對普惠AI的追求。他相信，隨著(zhù)經(jīng)濟的發(fā)展，中國也應該成為技術(shù)創(chuàng )新的貢獻者，而不僅僅是應用創(chuàng )新的跟隨者。

站在當下時(shí)點(diǎn)，AI應用滲透率仍然較低，產(chǎn)業(yè)仍在早期。中信證券指出，DeepSeek模型相比GPT4模型更小的參數量也意味著(zhù)更低的推理成本，推理成本的降低，將是AI應用普及的前奏，正如4G提速降費給我國移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)提供了助力。

其進(jìn)一步表示，豆包pro、DeepSeek-v3等國產(chǎn)模型連續發(fā)布。模型能力上，國產(chǎn)模型在文本和知識能力上接近GPT-4、Claude、Llama等海外前沿模型水平，多模態(tài)能力逐步完備，邏輯和代碼能力在非o1技術(shù)路線(xiàn)下達到可用水平。價(jià)格上，國產(chǎn)模型API百萬(wàn)tokens輸出普遍定價(jià)10元以?xún)?，是GPT-4o的1/3甚至更低。

預計模型性?xún)r(jià)比持續提升下，國內AI應用依托豐富生態(tài)和成熟流量，有望加速在各領(lǐng)域落地。其中，Agent模式有望以更長(cháng)的任務(wù)流程、更好的場(chǎng)景理解、更高的自主能力，成為所有互聯(lián)網(wǎng)用戶(hù)的數字助手，在企業(yè)管理、教育、辦公、金融等領(lǐng)域展現應用價(jià)值。

值得一提的是，有消息稱(chēng)Meta生成AI小組和基礎設施團隊已開(kāi)設四個(gè)作戰室，學(xué)習DeepSeek工作原理。其中兩個(gè)動(dòng)員起來(lái)的小組正在試圖了解High-Flyer如何降低訓練和運行DeepSeek的成本。第三個(gè)Meta研究小組正在試圖弄清楚High-Flyer可能使用哪些數據來(lái)訓練其模型。第四作戰室正在考慮基于DeepSeek模型屬性重構Meta模型的新技術(shù)——

這或許也意味著(zhù)，站在巨人肩膀上的DeepSeek，成為了有望托舉更多人的巨人。

內容來(lái)自：財聯(lián)社
本文地址：http://joq5k4q.cn//Site/CN/News/2025/01/28/20250128015456181575.htm 轉載請保留文章出處
關(guān)鍵字:
文章標題:“價(jià)格屠夫”DeepSeek的理想主義：開(kāi)源、降本與AI普惠

1、凡本網(wǎng)注明“來(lái)源：訊石光通訊網(wǎng)”及標有原創(chuàng )的所有作品，版權均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉載、摘編及鏡像，違者必究。對于經(jīng)過(guò)授權可以轉載我方內容的單位，也必須保持轉載文章、圖像、音視頻的完整性，并完整標注作者信息和本站來(lái)源。
2、免責聲明，凡本網(wǎng)注明“來(lái)源：XXX（非訊石光通訊網(wǎng)）”的作品，均為轉載自其它媒體，轉載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責。因可能存在第三方轉載無(wú)法確定原網(wǎng)地址，若作品內容、版權爭議和其它問(wèn)題，請聯(lián)系本網(wǎng)，將第一時(shí)間刪除。
聯(lián)系方式：訊石光通訊網(wǎng)新聞中心　電話(huà)：0755-82960080-168 Right

相關(guān)新聞

· DeepSeek：請繼續折射人類(lèi)千年文明的星光吧

· 因監管存在不確定性，去年美國 AI 企業(yè)游說(shuō)支出大幅上升

· 5000億美元“星門(mén)”計劃：美國AI基礎設施的宏偉藍圖及其對電信業(yè)的影響

· Cignal AI光器件初創(chuàng )公司追蹤：從34家激增至58家

· 兆馳股份答投資者：聚焦化合物半導體產(chǎn)業(yè)鏈致力打造光模塊自有品牌

· 騰景科技2024年業(yè)績(jì)預增光通信業(yè)務(wù)進(jìn)一步擴大

· 沃達豐高管：電信領(lǐng)域的AI仍處早期階段

· 諾基亞和Zain KSA為企業(yè)客戶(hù)實(shí)施獨特的室內解決方案

· 英偉達AI芯片故障引發(fā)微軟等客戶(hù)削減訂單

· 科大訊飛的AI模型將正式發(fā)布國產(chǎn)大模型有望快速崛起

“價(jià)格屠夫”DeepSeek的理想主義：開(kāi)源、降本與AI普惠

相關(guān)新聞

“價(jià)格屠夫”DeepSeek的理想主義：開(kāi)源、降本與AI普惠