• 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
2025 / 11 / 18 17:56 星期二
  • Login
mashdigi-科技、新品、趣聞、趨勢
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
mashdigi-科技、新品、趣聞、趨勢
No Result
View All Result
首頁 市場動態

xAI突襲發表Grok 4.1,幻覺大幅降低、劍指Google Gemini 3.0
Thinking版本登頂LMArena榜首、標準版與推理版同步免費開放

撰文: 楊又肇 (Mash Yang)
2025-11-18
in 市場動態, 生活, 網路, 軟體
A A
0
分享至 Facebook分享至 Twitter分享至 LINE

Elon Musk 旗下的人工智慧公司 xAI 採突襲戰術,悄然上線了全新的 Grok 4.1 模型系列。此次更新分為標準版的 Grok 4.1 ,以及支援深度推理的 Grok 4.1 Thinking,兩者目前均向使用者免費開放。

LMArena 霸榜前二,施壓 Google Gemini

在 LMArena 排行榜中,Grok 4.1 Thinking 以 1483 Elo 分的成績強勢空降榜首,而切換至非推理模式的標準版 Grok 4.1 也緊隨其後殺入第二名。

值得注意的是,原先表現不俗的 Google Gemini 2.5 Pro 目前滑落至第三,與榜首的 Grok 4.1 Thinking 相差足足 31 分。此舉無疑給 Google 即將推出的 Gemini 3.0 帶來了不小的競爭壓力。

創意寫作能力躍進,僅次 GPT 5.1

新版模型在創意寫作能力上也有顯著提升,根據 Creative Writing v3 的跑分結果,Grok 4.1 Thinking 與 Grok 4.1 的表現僅次於 OpenAI 的 GPT 5.1,成功擊敗包含 OpenAI o3、Claude Sonnet 4.5 ,以及 Kimi K2 Instruct 等強勁對手。

幻覺大幅降低,資訊錯誤率減 7 成

除了效能與創作力,xAI 也大幅優化了模型的準確性。數據顯示,相較於前一代的 Grok 4 Fast,Grok 4.1 的資訊錯誤率大幅下降了約 7 成。在 AI 容易出現的「幻覺」 (hallucination) 問題上,發生機率也從原先的 12.09% 顯著降低至 4.22%,大幅提升了其實用性與可靠度。

Tags: AIElon MuskGeminiGoogleGrokGrok 4.1xAI人工智慧
ShareTweetShare
楊又肇 (Mash Yang)

楊又肇 (Mash Yang)

mashdigi.com網站創辦人兼主筆,同時也是科技新聞業學習者。

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

翻譯 (Translate)

  • 熱門
  • 留言
  • 最新
同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO

同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO

2020-02-24
訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?

訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?

2019-09-07
Raspberry Pi基金會宣布推出Raspberry Pi 5開發板,顯示供應鏈問題已經獲得改善

Raspberry Pi基金會宣布推出Raspberry Pi 5開發板,顯示供應鏈問題已經獲得改善

2023-09-28
Google從明年5月起將讓非AMP格式網頁也能優先納入行動搜尋結果

Google從明年5月起將讓非AMP格式網頁也能優先納入行動搜尋結果

2
Ubuntu母公司確認計畫上市募股 但仍未有具體時程表

Ubuntu母公司確認計畫上市募股 但仍未有具體時程表

1

索尼互動娛樂證實PlayStation 5僅向下相容絕大多數的PlayStation 4平台遊戲

0
xAI突襲發表Grok 4.1,幻覺大幅降低、劍指Google Gemini 3.0Thinking版本登頂LMArena榜首、標準版與推理版同步免費開放

xAI突襲發表Grok 4.1,幻覺大幅降低、劍指Google Gemini 3.0
Thinking版本登頂LMArena榜首、標準版與推理版同步免費開放

2025-11-18
前Intel執行長Pat Gelsinger引領7家新創來台建立生態合作,攜手台積電、日月光等大廠攻次世代運算

前Intel執行長Pat Gelsinger引領7家新創來台建立生態合作,攜手台積電、日月光等大廠攻次世代運算

2025-11-18
紅海飛彈攻擊、地緣政治風險加劇,Meta 2Africa、Google Blue-Raman海底電纜計畫傳延遲

紅海飛彈攻擊、地緣政治風險加劇,Meta 2Africa、Google Blue-Raman海底電纜計畫傳延遲

2025-11-18
mashdigi-科技、新品、趣聞、趨勢

Copyright © 2017 mashdigi.com

  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

追蹤我們

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

Copyright © 2017 mashdigi.com