DeepSeek春節投下震撼彈,台美AI股後勢如何看待?

DeepSeek春節投下震撼彈,台美AI股後勢如何看待?

 

為何DeepSeek引發國際股市大修正?

 

春節期間國際股市發生一件大事,中國AI新創公司DeepSeek(深度求索)在120日發表的DeepSeek-R1模型引起市場關注,該模型不僅開放旗下原始碼免費提供給任何人使用和分享,且表現可比擬去年125日發布的OpenAI-o1模型,也因此引起國際股市大幅震盪。

為何這個新模型會引起國際股市大幅震盪呢?因為DeepSeek-R1模型的前身DeepSeek-V3(去年1213日發表),其訓練成本僅為557.6萬美元,與國際科技巨頭相比成本非常的低,故市場也開始擔心美國的雲端服務巨頭,可能會因此下修AI伺服器、GPU的需求量;除此之外,也有另一種擔憂是中國AI的發展速度越來越快,將使得美國給予更激進的關稅政策,故23日開盤後,可以看到AI相關硬體股,包括台積電(2330)、鴻海(2317)、廣達(2382)、奇鋐(3017)等皆大幅重挫。


 

DeepSeek是什麼?


DeepSeek
採用的技術框架原理包含:MLA多層注意力架構、混合經度訓練、Dual Pipe跨節點通訊、輔助無損平衡、MTP技術、數據篩選、蒸餾技術,主要是利用壓縮模型所需計算的參數量,並且強化推理與訓練效率,產生高質量數據再重複訓練,進而達成最佳效果。簡言之,DeepSeek的創新是從一個大模型中獲取相對較少的精選數據樣本(不到一百萬個),來顯著提高較小模型能力,並擁有以下創新及優化。

  • 演算法最佳化:透過改進演算法,提高訓練效率,減少不必要的運算,進而降低資源消耗。
  • 硬體利用:利用高效率的硬體資源,如GPUTPU,這些專用硬體能夠加速深度學習模型的訓練流程。
  • 資料管理:採用智慧的資料管理和預處理技術,確保訓練資料質量,減少雜訊資料對模型訓練的影響。
  • 模型壓縮:透過模型剪枝、量化等技術,減少模型的複雜度,降低儲存與運算需求。
  • 分散式訓練:採用分散式訓練策略,將訓練任務分散到多個運算節點,加快訓練速度,同時分攤成本。
  • 預訓練模型:利用預訓練模型(如BERTGPT等)作為起點,進行微調以適應特定任務,可節省從頭開始訓練的成本。
  • 開源共享:借助開源社群的力量,分享模型和訓練成果,避免重複工作,減少研發成本。
  • 能源效率:優化能源消耗,使用更環保經濟的能源解決方案,減少能源成本。

 

<延伸閱讀:策略選股工具實戰-族群股短線操作法>

<延伸閱讀:策略選股工具實戰-短線動能突破飆股選股法>

 

科技業如何看待DeepSeek影響?

 

而對於DeepSeek的看法,美國重量級政府官員、科技大佬也給出看法如下表。玉山投顧則認為,中美AI競賽進入下一階段,DeepSeek帶來機會與威脅,美國軟硬體業者皆納入DeepSeek模型,等於投下DeepSeek技術的同意票,但擔憂美國於AI領域獨佔性將會遭到瓜分。除此之外,隨著DeepSeek為產業帶來新的模型建構思維,透過蒸餾大模型提升特定領域的模型表現,背後仍需大模型支持,因此透過算力、參數堆疊,追求突破Scaling law的趨勢不變,反而多種方式並行將放大整體AI市場規模

 

圖:科技業、美國政府官員對DeepSeek看法整理

公司

看法

OpenAI

執行長Sam Altman於社群平台表示DeepSeek-R1模型令人印象深刻,尤其是如此低的成本,但也表示更強的運算能力仍然是AI成功的關鍵,且比以往更加重要。OpenAI研究副總裁Mark Chen暗示OpenAI也可利用同樣技術完成,甚至能以更大優勢降低成本。

輝達
(NVDA.US)

於官網表示DeepSeek-R1模型已納入NVIDIA NIM微服務平台,提供開發者使用。

微軟
(MSFT.US)

會將DeepSeek R1納入Azure AI Foundry開發中心平台,並表示未來客戶將可使用精簡版R1,並可於Copilot+ PCAI裝置上執行。

AMD
(AMD.US)

宣布整合DeepSeek-V3到自家MI300X GPU

美國準商務部長
Howard Lutnick

表示中國DeepSeek已成了許多民眾及議員擔心的問題,未來將藉由課徵關稅的方式以及限制輝達晶片銷往中國,阻止中國AI科技超越美國。

微軟及Meta
(META.US)
財報會議

認為AI效率提升將會帶來更龐大的需求,大規模投資AI仍是長期戰略目標,Meta也並未下修資本支出金額。

資料來源:玉山證券數位投顧、玉山投顧(2025/02/03

 

DeepSeek對哪些美股、台股有影響?

 

至於個別股票,隨著DeepSeek橫空出世,預期模型的演進速度將有機會變得更加快速,故目前市場的主流論點是DeepSeek反倒會加速下游推論端的產品推出。除此之外,由於過去研調機構多半看好AI在推論端會加大ASIC的採用力道,ASIC晶片更大量的導入也是市場看好的趨勢之一。

 

圖:DeepSeek對美、台相關股票可能影響

公司名稱

看法

利多/利空

美國4CSP:
亞馬遜
(AMZN.US)
微軟
(
MSFT.US)
Meta
(META.US)
谷歌
(GOOG.US)

DeepSeek為產業帶來新方法,透過蒸餾大模型提升特定領域的模型表現,背後仍須大模型支持,因此透過算力、參數堆疊,追求突破Scaling law的趨勢不變,反而多種方式並行將放大整體AI市場規模,且成本降低後,AI應用開發商將有機會建立更多樣的AI應用,推升雲端服務需求。

正向

輝達
(NVDA.US)

短期股價可能受到DeepSeek事件影響,及川普政府可能因此加大晶片出口管制所影響,但長期DeepSeek同樣也能帶動中小型模型開發需求,且大型模型開發商仍會維持較高的資本支出維持與競爭對手差距,有望放大整體AI市場規模,但輝達未來也會遇到ASIC分食市場的議題,比例與規模則仍需觀察。

中性

美國ASIC廠商:
博通
(AVGO.US)
Marvell
(MRVL.US)

DeepSeek-R1推升推論需求,將有利ASIC產業。博通預估FY2027AI產品將佔據600900億美元營收,為目前的4倍。Marvell預估AI資料中心營收將於FY2028達到750億美元,其中約430億美元來自客製化晶片,並與亞馬遜已簽訂5ASIC開發計畫。

正向

台積電(2330)

1季財測展望優於預期,技術依舊為全球領先者,無論是GPUASIC都是美國科技廠之主要合作廠商,且兩種類型之AI晶片都將持續往更先進製程(3nm)發展,有助於維持獲利成長動能。

正向

台廠ASIC廠商
創意(3443)
世芯KY(3661)

創意之HBM3eHBM4 IP預期可順利切入AI ASIC客戶供應鏈,加密貨幣ASIC專案亦可逐步放量。世芯-KY與亞馬遜具有策略合作關係,並已切入自研晶片專案。

正向

資料來源:玉山投顧(2025/02/03

 

<延伸閱讀:策略選股工具實戰-族群股短線操作法>

<延伸閱讀:策略選股工具實戰-短線動能突破飆股選股法>

 

 

相關商品

E-TRADER
投資大富翁挑戰,抽星宇東京雙人
sizeshare
sizeshare