在2025年OCP Global Summit活動上,Intel宣布推出代號「Crescent Island」的資料中心GPU,專為應對日益增長的AI推論工作負載設計,並且同步公布Gaudi 3機架級參考設計,進一步擴展其AI加速器產品組合。
專攻AI推論市場的全新資料中心GPU
「Crescent Island」資料中心GPU針對氣冷式企業級伺服器進行最佳化設計,採用Xe3P微架構,配備160GB LPDDR5X記憶體,主打高記憶體容量與能源效率,特別適合「Token-as-a-Service」供應商與各類推論應用場景。
Intel首席技術長Sachin Katti表示:「AI正從靜態訓練轉向即時且無所不在的推論運算,這股轉變正由『代理式AI』所驅動。為有效擴展這類複雜工作負載,需要能讓不同晶片各展所長的異質系統。」
這款新GPU預計將於2026年下半年開始提供客戶樣品,而相關軟體堆疊目前正於Arc Pro B系列GPU上進行開發與測試。
Gaudi 3機架級參考設計,支援大型模型推論
同步公布的Gaudi 3機架級參考設計支援每個機架最多64個加速器,配備8.2 TB高頻寬記憶體與液冷系統,針對大型模型與即時推論進行最佳化。這種設計讓客戶能從既有PCIe基礎架構,靈活擴展至完整機架等級的推論效能。
筆者看法
Intel此次產品更新,顯示其正積極調整戰略方向,從過往強調訓練效能,轉向擁抱快速成長的推論市場。「Crescent Island」鎖定企業級氣冷伺服器,正好填補了中高階推論市場的空白,與專攻訓練的Gaudi系列形成互補。
隨著AI應用落地加速,推論工作負載正成為市場主力。Intel透過Xeon 6、Gaudi 3與新資料中心GPU的組合,建構完整的端到端解決方案,試圖在與NVIDIA、AMD的競爭中走出差異化路線。特別是對成本敏感的企業客戶來說,這種靈活的異質系統架構確實具備相當吸引力。