隨著AI模型規模日益龐大,政府與大型企業對於數據主權 (Data Sovereignty) 與合規性的需求也越來越高。AWS此次在re:Invent 2025大會上宣布推出全新AI工廠 (AI Factories)服務,將AWS的AI基礎設施,包含最新的NVIDIA加速運算平台與AWS自研Trainium晶片直接佈署至客戶既有資料中心內,協助其快速建立高效能、合規且合乎主權的AI運算環境。

解決自建痛點,運作如「私有AWS區域」
AWS指出,對於受監管產業與公共部門而言,自建大規模AI基礎設施將面臨巨大的資本投入與採購週期挑戰。AWS此次提出AI工廠服務的核心概念,是將AWS的全套AI堆疊 (包含高速網路、儲存、資安及Bedrock、SageMaker等服務) 直接搬進客戶機房,並且由AWS負責營運。

這使得該環境運作起來就像是一個「私有AWS區域」 (Private AWS Region),客戶可利用既有的電力與空間,同時享有AWS的管理服務與模型存取權,無需自行與多個供應商談判授權,大幅縮短佈署時間,並且滿足數據在地化的法規要求。
深化NVIDIA合作,將導入Grace Blackwell及後續即將推出的Vera Rubin
在硬體層面,AWS與NVIDIA的合作將進一步深化。AWS AI工廠服務將整合NVIDIA全端AI軟體與加速運算平台,其中包含支援最新的NVIDIA Grace Blackwell加速運算架構,以及接下來即將推出的NVIDIA Vera Rubin運算平台。
此外,AWS的下一代Trainium4晶片也將支援NVIDIA NVLink Fusion高速互連技術,意味接續Qualcomm、聯發科、Intel等業者之後,AWS也將藉由NVLink Fusion技術與NVIDIA的GPU加速運算生態系統更緊密結合,藉此讓AWS的客戶能有更大AI加速運算選擇彈性。
NVIDIA Hyperscale與HPC副總裁Ian Buck表示,大規模AI運算需要全端方法,此次透過與AWS合作,能將這些龐大運算能力直接交付到客戶環境中,讓組織專注於創新而非整合。

P6e-GB300 UltraServer登場,首波落地沙烏地阿拉伯
配合AI工廠服務推出,AWS也發表了全新的Amazon EC2 P6e-GB300 UltraServers實例,其中搭載NVIDIA GB300 NVL72系統,專為大規模AI推論運算打造,支援生產環境中具備推理能力 (reasoning capabilities) 的兆級參數 (trillion-parameter) 模型,並且由AWS Nitro System驅動,可無縫整合Amazon EKS等服務。
而P6e-GB300 UltraServer首個應用案例將是隸屬沙烏地阿拉伯公共投資基金的HUMAIN,預計在沙烏地阿拉伯境內建立首個「AI Zone」專區。該專區將佈署高達 150000顆AI晶片 (其中包含NVIDIA GB300 GPU),由AWS AI工廠服務基礎設施驅動,藉此滿足當地與全球加速增長的AI算力需求。
除了與AWS、NVIDIA合作,HUMAIN先前也已經宣布與AMD、Qualcomm在內業者合作AI運算晶片供應,甚至今年在Snapdragon Summit 202更宣布與Qualcomm合作推出AI PC,藉此推動更貼近使用者的代理AI發展,同時也藉由Qualcomm AI加速運算方案在沙烏地阿拉伯佈署大規模AI推論基礎設施。
至於提供Amazon EC2 P6e-GB300 UltraServers之餘,AWS仍維持提供搭載GB200 NV72系統的Amazon EC2 P6e-GB200 UltraServers,同時也繼續提供搭載B300、B200系統的Amazon EC2 P6。







