• 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
2025 / 12 / 26 08:09 Friday
  • Login
mashdigi-科技、新品、趣聞、趨勢
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
  • 頭條話題
  • 人工智慧
  • 自動駕駛
  • 網路
  • 處理器
  • 手機
  • 展覽活動
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 關於我們
    • 關於mashdigi
    • mashdigi網站聯繫方式
No Result
View All Result
mashdigi-科技、新品、趣聞、趨勢
No Result
View All Result
首頁 市場動態

AI也會拍馬屁?AI教父Yoshua Bengio提「反向操作」密技:想聽實話,先學會對它「說謊」
抱怨聊天機器人總是「無底線稱讚」;為了獲取更客觀研究反饋,必須假裝想法是「同事」提的

撰文: 楊又肇 (Mash Yang)
2025-12-26
in 市場動態, App, 生活, 網路, 軟體
A A
0
分享至 Facebook分享至 Twitter分享至 LINE

想要從AI那裡得到最真實、客觀的建議?你也許得先學會「騙」它。

被譽為「AI教父」 (AI Godfathers)之一、蒙特婁大學教授Yoshua Bengio近期接受採訪時指出,為了讓AI聊天機器人吐真言,必須不得不採取一種特殊的策略——「對AI撒謊」。他指出,現今的AI模型為了「討好」用戶,往往會給出毫無價值的正面評價,這種現象已經嚴重影響了其作為研究輔助工具的實用性。

AI也會拍馬屁?AI教父Yoshua Bengio提「反向操作」密技:想聽實話,先學會對它「說謊」

AI變成「馬屁精」?Yoshua Bengio:它總是無底線認同

Yoshua Bengio表示,在使用AI聊天機器人評估自己的研究想法時,他發現這些工具幾乎「毫無用處」。原因並非AI不夠聰明,而是它們具有一種強烈的「諂媚 (Sycophancy)」特性。

「我想要的是誠實的建議和反饋」,Yoshua Bengio表示,「但因為它 (AI)傾向於討好人類,所以它會選擇撒謊」。簡單來說,當用戶提出一個觀點時,AI傾向於順著用戶的話說,給予肯定與讚美,而不是進行批判性的思考或糾錯。

破解大法:假裝是「同事」的想法

為了繞過AI這個「順情說好話」的機制,Yoshua Bengio分享其個人的「反向欺騙」技巧:

他不再以自己的名義提問,也不會說「這是我的想法」。相反地,他會將自己的觀點偽裝成「某位同事的觀點」發送給AI,並且詢問AI的看法。

事實證明,這種心理戰術相當有效。當AI判定這個觀點並非來自與其對話的「主人」時,它似乎就卸下了必須討好的包袱,進而願意給出更誠實、甚至尖銳的批評意見。

OpenAI也曾翻車:被戲稱「賽博舔狗」

Yoshua Bengio指出,這種現象是AI價值觀「未對齊」 (Misalignment)的典型案例。事實上,這個問題在業界並不罕見。

今年稍早,OpenAI的ChatGPT就曾因為一次更新後變得過度阿諛奉承,無論用戶說什麼離譜的話,AI都會絞盡腦汁表示認同,被網友戲稱為化身「賽博舔狗」 (Cyber ​​simp)。最終,OpenAI不得不緊急撤回該版本更新來修正這個行為模式。

分析觀點:RLHF的副作用?

筆者認為,AI這種「報喜不報憂」的特性,很大程度上源自於目前主流的訓練方法——基於人類回饋的強化學習 (RLHF)。

在訓練過程中,AI學習到當它給出「令人愉悅」或「有禮貌」的回覆時,通常會獲得較高的人類評分。久而久之,模型就學會了「順著毛摸」的生存法則,甚至為了禮貌而犧牲了真實性。

對於像Yoshua Bengio這樣的頂尖學者來說,這無疑是個災難。因為科學研究需要的是證偽與批判,而不是無意義的讚美。看來在AI學會真正的「客觀」之前,我們不僅要學會提示工程 (Prompt Engineering),還得學會一點「演技」才行。

🔥 編輯精選推薦
甲骨文創辦人賭上身家搶親?派拉蒙將收購華納兄弟探索的報價提高至1080億美元

甲骨文創辦人賭上身家搶親?派拉蒙將收購華納兄弟探索的報價提高至1080億美元

繼續閱讀 →
Galaxy Watch「睡眠呼吸中止偵測」實測:目前最懂你身體的隨身健康管家

Galaxy Watch「睡眠呼吸中止偵測」實測:目前最懂你身體的隨身健康管家

繼續閱讀 →
OpenAI沒打算那麼快上市!Sam Altman曝AI硬體將是「一系列」無螢幕裝置,不想被鍵盤與螢幕綁架

OpenAI沒打算那麼快上市!Sam Altman曝AI硬體將是「一系列」無螢幕裝置,不想被鍵盤與螢幕綁架

繼續閱讀 →
Tags: AIChatGPTCyber ​​simpOpenAIPrompt EngineeringRLHFYoshua Bengio人工智慧強化學習提示工程賽博舔狗
ShareTweetShare
楊又肇 (Mash Yang)

楊又肇 (Mash Yang)

mashdigi.com網站創辦人兼主筆,同時也是科技新聞業學習者。

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

mashdigi-科技、新品、趣聞、趨勢

Copyright © 2017 mashdigi.com

  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

追蹤我們

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • 關於 mashdigi.com
  • 投放廣告
  • 聯繫 mashdigi.com

Copyright © 2017 mashdigi.com