AWS打造AI工廠服務：將NVIDIA Blackwell與Trainium算力直接搬進客戶機房，解決主權與合規難題

隨著AI模型規模日益龐大，政府與大型企業對於數據主權 (Data Sovereignty) 與合規性的需求也越來越高。AWS此次在re:Invent 2025大會上宣布推出全新AI工廠 (AI Factories)服務，將AWS的AI基礎設施，包含最新的NVIDIA加速運算平台與AWS自研Trainium晶片直接佈署至客戶既有資料中心內，協助其快速建立高效能、合規且合乎主權的AI運算環境。

▲AWS宣布推出全新AI工廠 (AI Factories)服務，將AWS的AI基礎設施，包含最新的NVIDIA加速運算平台與AWS自研Trainium晶片直接佈署至客戶既有資料中心內

解決自建痛點，運作如「私有AWS區域」

AWS指出，對於受監管產業與公共部門而言，自建大規模AI基礎設施將面臨巨大的資本投入與採購週期挑戰。AWS此次提出AI工廠服務的核心概念，是將AWS的全套AI堆疊 (包含高速網路、儲存、資安及Bedrock、SageMaker等服務) 直接搬進客戶機房，並且由AWS負責營運。

▲AWS此次提出AI工廠服務的核心概念，是將AWS的全套AI堆疊 (包含高速網路、儲存、資安及Bedrock、SageMaker等服務) 直接搬進客戶機房，並且由AWS負責營運

這使得該環境運作起來就像是一個「私有AWS區域」 (Private AWS Region)，客戶可利用既有的電力與空間，同時享有AWS的管理服務與模型存取權，無需自行與多個供應商談判授權，大幅縮短佈署時間，並且滿足數據在地化的法規要求。

深化NVIDIA合作，將導入Grace Blackwell及後續即將推出的Vera Rubin

在硬體層面，AWS與NVIDIA的合作將進一步深化。AWS AI工廠服務將整合NVIDIA全端AI軟體與加速運算平台，其中包含支援最新的NVIDIA Grace Blackwell加速運算架構，以及接下來即將推出的NVIDIA Vera Rubin運算平台。

此外，AWS的下一代Trainium4晶片也將支援NVIDIA NVLink Fusion高速互連技術，意味接續Qualcomm、聯發科、Intel等業者之後，AWS也將藉由NVLink Fusion技術與NVIDIA的GPU加速運算生態系統更緊密結合，藉此讓AWS的客戶能有更大AI加速運算選擇彈性。

NVIDIA Hyperscale與HPC副總裁Ian Buck表示，大規模AI運算需要全端方法，此次透過與AWS合作，能將這些龐大運算能力直接交付到客戶環境中，讓組織專注於創新而非整合。

▲AWS發表搭載NVIDIA GB300 NVL72系統，專為大規模AI推論運算打造的Amazon EC2 P6e-GB300 UltraServers實例

P6e-GB300 UltraServer登場，首波落地沙烏地阿拉伯

配合AI工廠服務推出，AWS也發表了全新的Amazon EC2 P6e-GB300 UltraServers實例，其中搭載NVIDIA GB300 NVL72系統，專為大規模AI推論運算打造，支援生產環境中具備推理能力 (reasoning capabilities) 的兆級參數 (trillion-parameter) 模型，並且由AWS Nitro System驅動，可無縫整合Amazon EKS等服務。

而P6e-GB300 UltraServer首個應用案例將是隸屬沙烏地阿拉伯公共投資基金的HUMAIN，預計在沙烏地阿拉伯境內建立首個「AI Zone」專區。該專區將佈署高達 150000顆AI晶片 (其中包含NVIDIA GB300 GPU)，由AWS AI工廠服務基礎設施驅動，藉此滿足當地與全球加速增長的AI算力需求。

除了與AWS、NVIDIA合作，HUMAIN先前也已經宣布與AMD、Qualcomm在內業者合作AI運算晶片供應，甚至今年在Snapdragon Summit 202更宣布與Qualcomm合作推出AI PC，藉此推動更貼近使用者的代理AI發展，同時也藉由Qualcomm AI加速運算方案在沙烏地阿拉伯佈署大規模AI推論基礎設施。

至於提供Amazon EC2 P6e-GB300 UltraServers之餘，AWS仍維持提供搭載GB200 NV72系統的Amazon EC2 P6e-GB200 UltraServers，同時也繼續提供搭載B300、B200系統的Amazon EC2 P6。

Tags: AI Factories AI工廠 Amazon AWS AWS AI Factories B200 B300 GB200 GB300 Grace Blackwell Nvidia re:Invent re:Invent 2025 Superchip Vera Rubin 亞馬遜

AWS打造AI工廠服務：將NVIDIA Blackwell與Trainium算力直接搬進客戶機房，解決主權與合規難題
攜手NVIDIA將最新GB300 NVL72導入EC2 UltraServer，首波與沙烏地阿拉伯HUMAIN合作建置15萬組晶片AI算力專區

楊又肇 (Mash Yang)

Leave a Reply Cancel reply

同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO

訪談／Sony定調全新旗艦手機的Xperia 5，究竟是否歸類「Compact」定位？

Raspberry Pi基金會宣布推出Raspberry Pi 5開發板，顯示供應鏈問題已經獲得改善

Google從明年5月起將讓非AMP格式網頁也能優先納入行動搜尋結果

Ubuntu母公司確認計畫上市募股但仍未有具體時程表

索尼互動娛樂證實PlayStation 5僅向下相容絕大多數的PlayStation 4平台遊戲

AWS預覽其第五代自研處理器Graviton5、蘋果再次罕見站台，S3 Vectors正式上線助攻AI向量資料檢索

拉斯維加斯實測：亞馬遜Zoox無人計程車試乘，體驗如「未來移動艙」、安全機制能偵測小型遺落物

Netflix遊戲部門再傳變動，Spry Fox由創辦人買回獨立運作，新作手遊版本仍由Netflix發行

Welcome Back!

Retrieve your password

AWS打造AI工廠服務：將NVIDIA Blackwell與Trainium算力直接搬進客戶機房，解決主權與合規難題攜手NVIDIA將最新GB300 NVL72導入EC2 UltraServer，首波與沙烏地阿拉伯HUMAIN合作建置15萬組晶片AI算力專區