《Yahoo Finance》報導,輝達 (Nvidia)(NVDA.US) 周一 (16 日) 在加州聖荷西舉行的 GTC 大會揭幕,推出多款晶片與平台,從全新的 Groq 3 語言處理器 (LPU) 到大型 Vera CPU 伺服器機櫃,直接與英特爾 (INTC.US) 和超微 (AMD.US) 產品競爭。
輝達稱這次共推出五種大型伺服器機櫃系統,各自負責 AI 資料中心中的不同任務。
此次最重要的發布是 Groq 3 晶片。輝達去年 12 月宣布與 Groq 簽署技術授權協議,並以 200 億美元的交易聘請創辦人 Jonathan Ross、總裁 Sunny Madra 及多名 Groq 團隊成員加入公司。
Groq 的處理器專注於 AI 推論,即運行 AI 模型的階段。例如當使用者在 OpenAI 的 ChatGPT、Anthropic 的 Claude,或 Google 的 Gemini 輸入問題並得到回應,就是 AI 推論的過程。
輝達的 GPU 屬於多用途處理器,可同時用於 AI 模型訓練與推論。但隨著 AI 市場逐漸轉向模型運行階段,確保公司擁有專門的推論晶片變得愈來愈重要。
這正是 Groq 3 的角色。
輝達超大規模與高效能運算副總裁 Ian Buck 表示,雖然輝達 GPU 支援的記憶體容量遠高於 Groq 3,但 LPU 的記憶體速度更快,因此公司將結合兩種晶片的性能優勢。
為此,輝達推出 Groq 3 LPX 平台,這是一個由 128 顆 Groq 3 LPU 組成的伺服器機櫃。若搭配 Vera Rubin NVL72 機櫃使用,輝達表示客戶可獲得:每 MW(百萬瓦) 電力的處理量提高 35 倍、營收機會提升 10 倍。
公司在聲明中表示,「LPX 架構針對兆級參數模型與百萬 token 上下文進行最佳化,並與 Vera Rubin 共同設計,在功耗、記憶體與運算效率上達到最大化。每瓦處理量與 token 效能的提升,將開啟超高階 AI 推論的新層級,為所有 AI 服務供應商擴大營收機會。」
LPX 機櫃也有助於回應市場對輝達可能在 AI 競賽中被專注於推論晶片的新創企業追趕的疑慮。
除了 LPX 外,輝達還公布 Vera CPU 機櫃。過去輝達提到 Vera Rubin 超級晶片時,指的是三合一架構:一顆 Vera CPU 與兩顆 Rubin GPU。
現在公司將 Vera CPU 獨立成單一晶片,並將其部署在專屬伺服器機櫃中。每個系統將整合 256 顆液冷 Vera 晶片。
隨著代理型 AI 興起,CPU 的重要性正在上升。雖然 GPU 與 LPU 用於運行 AI 模型,但當 AI 代理需要瀏覽網站或從試算表取得資料時,主要依賴的是 CPU 效能。
這些晶片在資料探勘、個人化處理,以及為 GPU 與 AI 模型提供情境分析等方面,也扮演關鍵角色。
Buck 表示,「Vera 是最適合代理型 AI 工作負載的 CPU。我們設計了一種新的 CPU 核心——Olympus core,由輝達專為 AI 執行打造。Vera 能在極端條件下提供更快速的代理 AI 回應,適用於所有代理 AI 與強化學習場景。」
這並非輝達首次談到 CPU 伺服器。上個月,公司宣布與 Meta Platforms(META.US) 達成合作,為其提供史上最大規模部署的 Grace CPU 系統。
但此次 Vera 發布顯示輝達正試圖鞏固其地位,不僅是 GPU 公司,同時也是 CPU 公司,並在資料中心市場與英特爾及 AMD 正面競爭。
除了 Vera Rubin NVL72、Groq LPX 與 Grace 機櫃外,輝達還展示了 Bluefield-4 STX 儲存機櫃及 Spectrum-6 SPX 網路機櫃。
這些新產品將幫助輝達持續擴大資料中心營收,因為 AI 平台需求仍在持續成長。公司表示,2026 會計年度資料中心營收達 1,935 億美元,高於 2025 年度的 1,162 億美元。
此外,包括亞馬遜 (AMZN.US) 、Alphabet(GOOGL.US) 、Meta 及微軟(MSFT.US) 等超大型雲端業者,今年預計將在 AI 能力上投入 6,500 億美元,輝達預料將取得其中一大部分。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網