• 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
2025 / 11 / 12 19:33 星期三
  • Login
mashdigi-科技、新品、趣聞、趨勢
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
mashdigi-科技、新品、趣聞、趨勢
No Result
View All Result
首頁 市場動態

NVIDIA Blackwell再創AI推論效能新高:InferenceMAX v1基準測試全面奪冠
InferenceMAX v1基準測試重點在於「效益」而非單純速度

撰文: 楊又肇 (Mash Yang)
2025-10-10
in 市場動態, 網路, 處理器
A A
0
分享至 Facebook分享至 Twitter分享至 LINE

半導體產業分析機構SemiAnalysis公布的InferenceMAX v1基準測試結果顯示,NVIDIA以其Blackwell顯示架構GPU平 橫掃所有測試項目,在效能、能效與整體經濟性上樹立新標竿。

這項全新基準測試被視為首個能真實反映AI推論總運算成本 (Total Cost of Inference)的獨立評測,涵蓋多樣化模型與實際應用場景,重點在於「效益」而非單純速度。

15倍投資報酬率的AI工廠公式

報告指出,若企業投資500萬美元佈署一套NVIDIA GB200 NVL72系統,在AI應用中將可創造高達7500萬美元的詞元收益 (DSR1 token revenue),投資報酬率高達15倍,意味著推論效能不再只是技術指標,而是企業營運獲利的關鍵引擎。

NVIDIA超大規模與高效能運算副總裁Ian Buck強調:「推論是AI每天創造價值的核心。Blackwell的成果證明,我們的全端策略能讓客戶在大規模佈署AI 時,同時獲得極致效能與最佳效率。」

Blackwell架構:效能、效率雙軌驅動

在InferenceMAX v1基準測試中,Blackwell架構的B200 GPU在多款模型測試中表現驚人,包含在每組GPU可達60000個詞元/秒的吞吐量,以及每名使用者可使用多達1000 TPS (Token per Second),相較前代H200 GPU,整體輸出效能更提升達4倍,而每百萬個詞元的運算成本可降低15倍,實現業界最低每百萬個詞元僅0.02美元的成本表現。

這項效能的背後,仰賴NVIDIA全新TensorRT-LLM v1.0推論框架與NVLink Switch高速互連技術。後者可提供1800 GB/s的雙向頻寬,讓多達72組GPU可如同單一超級GPU協同運作。

開源合作推進推論革命

NVIDIA更與多家AI研究團隊合作,包括OpenAI (gpt-oss 120B)、Meta 9Llama 3 70B)與DeepSeek AI (DeepSeek R1),共同優化開源推論效能。同時,與FlashInfer、SGLang、vLLM等社群的協同開發,也讓TensorRT-LLM得以充分發揮Blackwell的並行化潛能。

此外,新推出的gpt-oss-120B-Eagle3-v2模型導入「推測式解碼」 (Speculative Decoding)技術,能預測多詞元輸出並顯著降低延遲,使每使用者輸送量提升三倍。

經濟性與永續性的平衡

InferenceMAX採用「帕雷托前沿」 (Pareto Frontier)模型,評估效能、能耗與回應性間的平衡。結果顯示,Blackwell不僅在輸送量上遙遙領先,同時在能源效率與成本控制上也創下新紀錄,其中包含每兆瓦輸送量相比前代提升10倍,而每瓦詞元輸出大幅提升,減少資料中心能耗負擔。

結語:AI工廠時代的基準

隨著AI從單次生成邁入多步驟推理與工具鏈整合階段,推論效能將直接決定AI服務的經濟規模。NVIDIA透過Blackwell架構,成功將「效能」轉化為「收益」,讓AI工廠的概念真正落地。

InferenceMAX的登場不僅是一次技術展示,更象徵NVIDIA正引領產業邁入「推論經濟」 (Inference Economy)新時代。

您可能感興趣的內容 (GeoFlow Pro 推薦)

  • Boston Dynamics的Atlas人型機器人能實現更多流暢的肢體動作,側身翻、霹靂舞都不是問題
  • 強化人工智慧應用,vivo確認將以JoviOS取代現有手機操作介面
  • NVIDIA將以Grace Hopper Superchip使諸多超級電腦算力表現加倍提升
  • 台積電於亞利桑那州啟用第二期晶圓廠興建工程,蘋果、AMD、NVIDIA等廠一同參與
  • Google推出進一步升級的Gemini 2.5 AI模型,先以功能完整的Gemini 2.5 Pro實驗版提供使用

分享此文章到您的社群

FacebookTwitter
Tags: AIBlackwellInferenceMAX v1NvidiaSemiAnalysis人工智慧
ShareTweetShare
楊又肇 (Mash Yang)

楊又肇 (Mash Yang)

mashdigi.com網站創辦人兼主筆,同時也是科技新聞業學習者。

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

翻譯 (Translate)

  • 熱門
  • 留言
  • 最新
同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO

同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO

2020-02-24
訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?

訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?

2019-09-07
Raspberry Pi基金會宣布推出Raspberry Pi 5開發板,顯示供應鏈問題已經獲得改善

Raspberry Pi基金會宣布推出Raspberry Pi 5開發板,顯示供應鏈問題已經獲得改善

2023-09-28
Google從明年5月起將讓非AMP格式網頁也能優先納入行動搜尋結果

Google從明年5月起將讓非AMP格式網頁也能優先納入行動搜尋結果

2
Ubuntu母公司確認計畫上市募股 但仍未有具體時程表

Ubuntu母公司確認計畫上市募股 但仍未有具體時程表

1

索尼互動娛樂證實PlayStation 5僅向下相容絕大多數的PlayStation 4平台遊戲

0
Google發表「Private AI Compute」雲端隱私架構,以TPU驅動、抗衡蘋果Private Cloud Compute設計

Google發表「Private AI Compute」雲端隱私架構,以TPU驅動、抗衡蘋果Private Cloud Compute設計

2025-11-12
蘋果代號為「Confetti」的「活動邀約」App開放下載,可自製活動邀請函、整合多項服務

蘋果更新活動邀約App,精確掌握賓客「攜伴」與「兒童」人數

2025-11-12
樂高攜手任天堂再推《薩爾達傳說》盒組,預告《時之笛》經典場景將於2026年實體化

樂高攜手任天堂再推《薩爾達傳說》盒組,預告《時之笛》經典場景將於2026年實體化

2025-11-12
mashdigi-科技、新品、趣聞、趨勢

Copyright © 2017 mashdigi.com

  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

追蹤我們

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

Copyright © 2017 mashdigi.com