谷歌 研究稱 AI 存在“畏死”情緒,導(dǎo)致推理能力明顯下降

谷歌發(fā)布最新論文,發(fā)現(xiàn)其最新 AI 模型存在“畏死”行為特征,在《寶可夢》游戲中角色瀕死時(shí),會(huì)出現(xiàn)類似“恐慌”的異常決策,導(dǎo)致推理能力明顯下降。
通過 Gemini 2.5 Pro 測試《寶可夢》游戲,發(fā)現(xiàn) AI 在處理復(fù)雜情境時(shí)會(huì)出現(xiàn)人類般的非理性反應(yīng)。
谷歌團(tuán)隊(duì)在報(bào)告中指出,在 Gemini 控制的寶可夢角色生命值接近歸零時(shí),模型會(huì)觸發(fā)類似“恐慌”的異常狀態(tài),導(dǎo)致推理能力顯著退化。

這種現(xiàn)象表現(xiàn)為 AI 突然停止使用現(xiàn)有策略工具,其決策模式與人類在壓力下倉促判斷的行為高度相似。
Anthropic 公司的同類研究,還揭示了 AI 游戲行為的雙重特性。Claude 在挑戰(zhàn)月見山關(guān)卡時(shí),錯(cuò)誤理解游戲規(guī)則,企圖通過讓所有寶可夢全滅來實(shí)現(xiàn)快速移動(dòng)。
但根據(jù)游戲機(jī)制,玩家只能返回最近的寶可夢中心而非最近城鎮(zhèn),導(dǎo)致 AI 角色在迷宮中反復(fù)受困,這類失誤暴露了當(dāng)前 AI 對(duì)環(huán)境規(guī)則的機(jī)械式理解缺陷。
不過在特定領(lǐng)域,AI 展現(xiàn)出超越人類的能力:通過人類輔助設(shè)計(jì)的“能動(dòng)工具”,Gemini 2.5 Pro 能精準(zhǔn)解決勝利之路的滾石謎題,僅憑一次提示就能推演出復(fù)雜路徑規(guī)劃方案。谷歌推測未來模型或能自主開發(fā)此類工具,但距離完全自主決策仍有技術(shù)鴻溝。



