ETF
美股投資
美國龍頭企業ETF競爭白熱化!SPY、VOO、IVV、SPLG誰才是美股代表?

輝達年度盛會GTC登場,再次成為市場觀察AI產業風向的重要指標!包括推論需求快速增加、AI 資料中心升級、下一代平台路線圖延伸至 Rubin Ultra與Feynman,以及代理式AI、機器人、自駕車與太空運算等新應用同步擴大,輝達精彩描繪AI工廠時代基礎建設藍圖,以下本文即帶你快速掌握本次輝達提出了哪些AI關鍵!
文章目錄,點選你想看的段落:
過去兩年,生成式 AI 快速發展,帶動市場對高效能運算的需求明顯上升。不過,隨著模型從開發與訓練階段,逐漸走向實際部署與商業應用,推論的重要性也快速提升。所謂推論,就是模型正式上線後,在面對使用者提問、生成內容、讀取資料甚至執行工作時,背後所進行的即時運算。
這類工作除了需要大量算力之外,也更重視反應速度、吞吐量與使用成本。黃仁勳在演講中也明確指出,推理型AI與代理式AI的崛起,正在讓AI的運算需求出現結構性變化。未來模型不只是回答問題,而是要能夠思考、規劃、執行與協作,這將使推論端的算力需求大幅高於過去。
同時,黃仁勳也重新定義了資料中心的角色。認為未來的資料中心不只是存放資料的地方,而是生產詞元(token)的工廠。從這個角度來看,AI服務的商業模式將直接連結到詞元產出效率、回應速度與單位成本。也因此,輝達已把推論視為AI產業下一階段的核心需求,並預估未來幾年AI基礎建設市場規模可望上看1兆美元。

圖片來源:輝達
本次GTC一大亮點,就是Vera Rubin NVLink 72平台的亮相。該平台整合Rubin GPU、Vera CPU、ConnectX-9、BlueField-4、NVLink Switch、Spectrum CPO與Groq 3 LPU等多種元件,提供3.6 exaflops的運算能力與260 TB/s的NVLink頻寬,鎖定agentic AI等更高強度的應用場景。
輝達也在這次大會上同步揭示後續平台藍圖。下一代Rubin Ultra將採用全新的Kyber機架架構,把更多GPU整合進單一NVLink系統中,進一步提升運算密度與系統規模;再往後一代的Feynman,則預計同時支援銅纜與光學互連技術,顯示未來AI資料中心的升級方向,將更重視高速傳輸、系統彈性與大規模整合能力。

圖片來源:輝達
除了平台架構升級之外,這次大會另一個值得注意的變化,是輝達把Groq 3 LPU納入整體系統設計中。具體來看,Groq LPU主要負責推論流程中的decode階段,而pre-fill則由Vera Rubin平台處理。
其背後原因在於,大型語言模型的推論流程本來就不是單一型態的運算工作,而是可大致分成兩個階段:前段的prefill主要負責處理輸入內容與上下文,屬於計算密集型任務,較適合由GPU執行;後段的decode則是模型逐步生成答案的過程,這時候真正的挑戰往往不在算力本身,而在資料能否被快速讀取與持續供應。
也因此,Groq 3 LPU的價值不只是新增一顆推論晶片,而是在架構上針對decode階段的需求提供更好的處理。
可留意的是,相較於傳統GPU多仰賴HBM來兼顧訓練與推論,Groq 3 LPU更強調高頻寬、低延遲的資料存取效率,並透過大量片上SRAM設計,盡量減少資料在晶片與外部記憶體之間來回搬移所造成的時間與能耗損失。這樣的設計更貼近推論端的實際需求,特別是在即時對話、代理式 AI 與長文本生成等應用場景中,更有機會提升回應速度與整體效率。

圖片來源:輝達
黃仁勳在演講中多次提及 Google、AWS、Microsoft、Oracle等大型雲端平台,也顯示輝達在AI工廠時代的落地方式,仍是透過與CSP與大型資料中心客戶深度合作來推進。
他指出,目前輝達約六成業務來自前五大超大規模雲端業者,其餘則分布於區域雲、主權雲、企業、工業、機器人、邊緣運算等不同領域。這也意味著,AI 基礎建設需求並不只停留在晶片本身,而是會一路向外延伸到伺服器、網通設備、散熱方案、儲存設備,甚至機房電力與建置能力。
黃仁勳也提到AI工廠的經濟學概念,強調資料中心的關鍵不再只是「蓋得多大」,而是相同電力與資本支出之下,誰能生產更多詞元、把單位成本壓得更低。這讓AI基礎建設競賽,從硬體規格之爭,進一步升級成整體效率與商業模式之爭。

圖片來源:輝達
除了核心平台與資料中心之外,今年GTC也顯示輝達正把AI能力往更多垂直領域延伸。自駕車、機器人、邊緣運算,甚至太空資料中心,都是本次大會著墨的重要方向。
在自駕車領域,輝達宣布新增多家無人計程車與車廠夥伴,並進一步與平台業者合作。在機器人方面,Isaac Lab、Newton、Cosmos、Groot等工具與模型則被定位為physical AI的核心基礎,背後重點在於透過模擬、合成資料與世界模型,降低機器人訓練對真實資料的依賴。
另外,Aerial AI RAN與Vera Rubin Space One等概念也顯示輝達的技術也延伸到通訊與太空運算場景。未來AI算力需求來源不會只集中在大型雲端資料中心,而是有機會逐步擴散至更多產業與應用環節。

圖片來源:輝達
除了硬體平台,這次GTC另一個值得關注的焦點,是代理式AI的開源與企業化部署。黃仁勳提到,OpenClaw的定位已不只是熱門開源專案,而更像是代理式AI的基礎作業框架。它可以管理資源、調用模型、存取檔案、使用工具、安排任務與協調多個子代理,讓AI從單純的聊天回應,進一步變成可執行任務的系統。
但他也點出,若這類系統要真正進入企業環境,還會牽涉到資料安全、程式執行、外部通訊與權限控管等挑戰。因此,輝達也提出NemoClaw平台和與之搭配的OpenShell執行環境,希望讓代理式AI能走向企業可部署、可管理、可控風險的方向。
這透露出一趨勢:未來企業不只會導入模型,也會開始思考自己的代理式AI策略,AI商業模式也可能從軟體即服務,逐步擴展到代理即服務。

圖片來源:輝達
整體來看,這次GTC大會可說貼合市場原先期待,不過同時也再度強化了兩件事。第一,AI 的核心需求正從訓練轉向推論;第二,輝達的優勢也從GPU領先,進一步擴大到整體平台整合能力。
從投資角度來看,這代表市場未來觀察AI受惠族群時,不能只聚焦在最上游晶片,而應延伸到整個AI基礎建設升級鏈。其中,隨著AI機櫃、資料中心與高速互連架構持續升級,而這使得記憶體、BMC、散熱、網通與光通訊等供應鏈理論上都有機會受惠。因為未來AI系統競爭的關鍵,不只是運算能力更強,而是整體系統是否能穩定運作、有效散熱、快速傳輸並降低成本。
還再想要怎麼把握AI龍頭股的投資機會嗎?玉山證券邀請你用定期定額的方式穩穩參與美股市場。透過固定的投入節奏,你能在市場漲跌中平均成本、降低情緒干擾,也能長期享受企業成長與市場復利。
玉山證券為此提供了相應的服務。想要使用玉山證券美股定期定額的服務很簡單,投資人只要於「美股e指存」平台完成約定,玉山證券將會固定於投資人指定交易日(5、10、15、20、25日)以固定金額(最低美金100元,無上限金額)幫顧客進行委託買進固定金額的標的。
