
從技術原理創新,再到資本市場的震盪,中國AI公司DeepSeek的崛起正重新定義人工智能領域的一個新競爭賽道:訓練成本!本文Invest101將從其DeepSeek背景、競爭優勢、與ChatGPT的對比、工作原理,以及對全球投資市場的影響角度展開分析。
DeepSeek 背景
DeepSeek由梁文峰於2023年7月創立,在此之前,梁文峰成立了名為「幻方量化」的對沖基金,該基金利用量化交易技術分析數據從而作出交易決策,於 2019 成為中國國內首個募資超過1,000億元的量化避險基金。
DeepSeek 競爭優勢
- 模型訓練成本據報只有550萬美元,不到ChatGPT 4o訓練成本的十分之一,因此DeepSeek又被稱爲「AI界拼多多」
- 模型採用開源方式供用戶及開發者使用
- 兩個大型語言模型「DeepSeek-V3」和「DeepSeek-R1」 表現性能對標 ChatGPT 4o 及 o1模型
- 「DeepSeek-V3」和「DeepSeek-R1」在多項業內評測均領先其他開源及閉源模型
DeepSeek-V3 在多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,並在效能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

DeepSeek-R1在後期訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,大幅提升了模型推理能力。

DeepSeek vs ChatGPT:技術路線與應用場景的差異
兩者在架構、成本、語言處理等領域存在顯著差異,具體對比如下:
DeepSeek | ChatGPT | |
核心架構 | MoE + MLA(資源高效) | Transformer(通用性強) |
訓練成本 | 557.6萬美元(V3) | 估計5億美元(GPT-4) |
推理速度 | 每秒60 token(高效) | 每秒20 token(較慢) |
語言處理 | 中文優勢(文言文、方言) | 多語言支持(50+種) |
應用場景 | 技術問答、垂直領域分析 | 創意寫作、開放對話 |
API 收費 | 輸入Token費用為每百萬Token 2元人民幣(約0.28美元); 輸出Token為每百萬Token 8元人民幣(約1.12美元) | 輸入Token費用為每百萬Token 2.5美元; 輸出Token為每百萬Token 10美元 |
關鍵差異:
- 專業性 vs 通用性:DeepSeek擅長邏輯推理與垂直任務(如代碼生成、醫學診斷),而ChatGPT在創意內容與多語言場景更強。
- 成本效益:DeepSeek的API定價僅為ChatGPT的 10-15%,能夠惠及更多中小企業採用。
- 本地化部署:開源策略進一步降低企業客製化成本,例如開發者可基於開源模型優化,無需支付額外授權費;DeepSeek支持私有化部署,適合數據敏感行業(如金融、醫療)。
- 中文優勢:DeepSeek對中文的分析處理能力優於ChatGPT
延伸閱讀:如何運用ChatGPT理財投資,附實例分享及註冊教學
DeepSeek 低成本與高效能的技術革新背後的原理
DeepSeek的核心競爭力在於其獨特的架構設計與資源優化策略,主要體現在以下四個層面:
- 混合專家架構(MoE)與多頭潛在注意力(MLA)
DeepSeek採用混合專家架構(Mixture of Experts, MoE),將任務分解為子問題並由不同專家模塊處理,僅激活相關參數(如V3模型總參數6710億,每次激活370億),顯著降低計算資源消耗。
結合多頭潛在注意力(MLA),通過緩存壓縮技術減少內存佔用,提升推理速度(V2模型吞吐量達每秒5萬個token)。這種架構使其在有限算力下(如使用H800 GPU)仍能實現高效訓練與推理。 - 多標記預測與自我獎勵機制
傳統模型逐個生成token,而DeepSeek通過多標記預測(Multi-Token Prediction, MTP)同時預測後續多個token,接受率高達85%-90%,速度提升近兩倍。此外,後訓練階段引入自我獎勵機制,通過強化學習優化推理能力,減少對人工標註數據的依賴。 - 低成本訓練與開源策略
採用FP8混合精度訓練,結合參數通信優化,DeepSeek-V3的總訓練成本僅557.6萬美元(為ChatGPT的1/10),並開源模型供開發者二次開發,推動技術普惠。 - 垂直領域的深度整合
其知識圖譜與多模態分析能力(如醫療診斷、金融風控)使其在專業場景中表現突出,例如通過醫學文獻分析輔助心臟病診斷。
DeepSeek對投資市場的衝擊
DeepSeek的技術突破與商業策略已引發資本市場的連鎖反應:
- 科技股震盪與算力需求重估
2025年1月27日,DeepSeek登頂中美應用商店下載榜,當日美股半導體指數(SOX)暴跌9.2%,英偉達市值蒸發6000億美元,市場擔憂其低成本模型將減少對高階GPU的需求。 - 開源生態與行業競爭格局
DeepSeek開源策略打破巨頭壟斷,吸引開發者構建分佈式生態(如騰訊雲、阿里雲接入其API),推動AI創新從「算力軍備」轉向「算法效率」。Meta等公司成立專案組研究其技術,試圖複製低成本模式。 - 新興投資機會
- 邊緣計算:DeepSeek輕量化模型(如R1)適用於終端設備(如聯想AIPC、自動駕駛),加速AI從雲端向終端滲透。
- 數據隱私與本地化:其私有化部署方案吸引金融、醫療等敏感行業,催生「個人知識庫」市場。
- 市場開始重估中資企業在AI賽道的定位:根據富途證券的一篇文章分析,在港上市的科技股會因爲deepseek而受惠,由於之前市場一直擔心美國對華的晶片限制政策會約束中國在AI賽道的發展,但隨著deepseek帶來的低成本高效技術革新,外資也開始重新評估中國企業,尤其是大型科技股的投資價值,整個科技股版塊均有望受惠。


結論
DeepSeek憑藉MoE架構、低成本訓練與垂直整合能力,不僅在技術層面挑戰ChatGPT,更通過開源策略重塑行業生態。其崛起標誌著AI競爭從「規模競賽」轉向「效率創新」,並迫使全球投資者重新評估算力、算法與市場需求的平衡。未來,DeepSeek能否持續引領這場變革,將取決於其技術迭代速度與生態共建能力,而這也將成為AI領域最值得關注的動向之一。
免責聲明:Invest101團隊竭力提供準確資訊,惟不能保證資料絕對準確無誤。Invest101所提供的內容只用作教學用途,並不構成要約、招攬、邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦任何金融產品或投資建議。 |