DeepSeek春節投下震撼彈，台美AI股後勢如何看待？

2025/02/03

為何DeepSeek引發國際股市大修正？
DeepSeek是什麼？
科技業如何看待DeepSeek影響？
DeepSeek對哪些美股、台股有影響？

為何DeepSeek引發國際股市大修正？

春節期間國際股市發生一件大事，中國AI新創公司DeepSeek（深度求索）在1月20日發表的DeepSeek-R1模型引起市場關注，該模型不僅開放旗下原始碼免費提供給任何人使用和分享，且表現可比擬去年12月5日發布的OpenAI-o1模型，也因此引起國際股市大幅震盪。

為何這個新模型會引起國際股市大幅震盪呢？因為DeepSeek-R1模型的前身DeepSeek-V3（去年12月13日發表），其訓練成本僅為557.6萬美元，與國際科技巨頭相比成本非常的低，故市場也開始擔心美國的雲端服務巨頭，可能會因此下修AI伺服器、GPU的需求量；除此之外，也有另一種擔憂是中國AI的發展速度越來越快，將使得美國給予更激進的關稅政策，故2月3日開盤後，可以看到AI相關硬體股，包括台積電（2330）、鴻海（2317）、廣達（2382）、奇鋐（3017）等皆大幅重挫。

DeepSeek是什麼？

DeepSeek採用的技術框架原理包含：MLA多層注意力架構、混合經度訓練、Dual Pipe跨節點通訊、輔助無損平衡、MTP技術、數據篩選、蒸餾技術，主要是利用壓縮模型所需計算的參數量，並且強化推理與訓練效率，產生高質量數據再重複訓練，進而達成最佳效果。簡言之，DeepSeek的創新是從一個大模型中獲取相對較少的精選數據樣本（不到一百萬個），來顯著提高較小模型能力，並擁有以下創新及優化。

演算法最佳化：透過改進演算法，提高訓練效率，減少不必要的運算，進而降低資源消耗。
硬體利用：利用高效率的硬體資源，如GPU和TPU，這些專用硬體能夠加速深度學習模型的訓練流程。
資料管理：採用智慧的資料管理和預處理技術，確保訓練資料質量，減少雜訊資料對模型訓練的影響。
模型壓縮：透過模型剪枝、量化等技術，減少模型的複雜度，降低儲存與運算需求。
分散式訓練：採用分散式訓練策略，將訓練任務分散到多個運算節點，加快訓練速度，同時分攤成本。
預訓練模型：利用預訓練模型（如BERT、GPT等）作為起點，進行微調以適應特定任務，可節省從頭開始訓練的成本。
開源共享：借助開源社群的力量，分享模型和訓練成果，避免重複工作，減少研發成本。
能源效率：優化能源消耗，使用更環保經濟的能源解決方案，減少能源成本。

<延伸閱讀：策略選股工具實戰-族群股短線操作法>

<延伸閱讀：策略選股工具實戰-短線動能突破飆股選股法>

科技業如何看待DeepSeek影響？

而對於DeepSeek的看法，美國重量級政府官員、科技大佬也給出看法如下表。玉山投顧則認為，中美AI競賽進入下一階段，DeepSeek帶來機會與威脅，美國軟硬體業者皆納入DeepSeek模型，等於投下DeepSeek技術的同意票，但擔憂美國於AI領域獨佔性將會遭到瓜分。除此之外，隨著DeepSeek為產業帶來新的模型建構思維，透過蒸餾大模型提升特定領域的模型表現，背後仍需大模型支持，因此透過算力、參數堆疊，追求突破Scaling law的趨勢不變，反而多種方式並行將放大整體AI市場規模。

圖：科技業、美國政府官員對DeepSeek看法整理

公司	看法
OpenAI	執行長Sam Altman於社群平台表示DeepSeek-R1模型令人印象深刻，尤其是如此低的成本，但也表示更強的運算能力仍然是AI成功的關鍵，且比以往更加重要。OpenAI研究副總裁Mark Chen暗示OpenAI也可利用同樣技術完成，甚至能以更大優勢降低成本。
輝達 (NVDA.US)	於官網表示DeepSeek-R1模型已納入NVIDIA NIM微服務平台，提供開發者使用。
微軟 (MSFT.US)	會將DeepSeek R1納入Azure AI Foundry開發中心平台，並表示未來客戶將可使用精簡版R1，並可於Copilot+ PC等AI裝置上執行。
AMD (AMD.US)	宣布整合DeepSeek-V3到自家MI300X GPU。
美國準商務部長 Howard Lutnick	表示中國DeepSeek已成了許多民眾及議員擔心的問題，未來將藉由課徵關稅的方式以及限制輝達晶片銷往中國，阻止中國AI科技超越美國。
微軟及Meta (META.US) 財報會議	認為AI效率提升將會帶來更龐大的需求，大規模投資AI仍是長期戰略目標，Meta也並未下修資本支出金額。

資料來源：玉山證券數位投顧、玉山投顧（2025/02/03）

DeepSeek對哪些美股、台股有影響？

至於個別股票，隨著DeepSeek橫空出世，預期模型的演進速度將有機會變得更加快速，故目前市場的主流論點是DeepSeek反倒會加速下游推論端的產品推出。除此之外，由於過去研調機構多半看好AI在推論端會加大ASIC的採用力道，ASIC晶片更大量的導入也是市場看好的趨勢之一。

圖：DeepSeek對美、台相關股票可能影響

公司名稱	看法	利多/利空
美國4大CSP: 亞馬遜 (AMZN.US) 微軟 (MSFT.US) Meta (META.US) 谷歌 (GOOG.US)	DeepSeek為產業帶來新方法，透過蒸餾大模型提升特定領域的模型表現，背後仍須大模型支持，因此透過算力、參數堆疊，追求突破Scaling law的趨勢不變，反而多種方式並行將放大整體AI市場規模，且成本降低後，AI應用開發商將有機會建立更多樣的AI應用，推升雲端服務需求。	正向
輝達 (NVDA.US)	短期股價可能受到DeepSeek事件影響，及川普政府可能因此加大晶片出口管制所影響，但長期DeepSeek同樣也能帶動中小型模型開發需求，且大型模型開發商仍會維持較高的資本支出維持與競爭對手差距，有望放大整體AI市場規模，但輝達未來也會遇到ASIC分食市場的議題，比例與規模則仍需觀察。	中性
美國ASIC廠商: 博通 (AVGO.US) Marvell (MRVL.US)	DeepSeek-R1推升推論需求，將有利ASIC產業。博通預估FY2027其AI產品將佔據600至900億美元營收，為目前的4倍。Marvell預估AI資料中心營收將於FY2028達到750億美元，其中約430億美元來自客製化晶片，並與亞馬遜已簽訂5年ASIC開發計畫。	正向
台積電(2330)	第1季財測展望優於預期，技術依舊為全球領先者，無論是GPU或ASIC都是美國科技廠之主要合作廠商，且兩種類型之AI晶片都將持續往更先進製程(3nm)發展，有助於維持獲利成長動能。	正向
台廠ASIC廠商創意(3443)、世芯KY(3661)	創意之HBM3e與HBM4 IP預期可順利切入AI ASIC客戶供應鏈，加密貨幣ASIC專案亦可逐步放量。世芯-KY與亞馬遜具有策略合作關係，並已切入自研晶片專案。	正向