加密新聞標籤聚合與專題資訊 | LBank

oxford-study-finds-warmer-ai-chatbots-tell-more-lies

牛津發現較溫暖的AI聊天機器人錯誤率較高

牛津互聯網研究所的研究人員測試了五款人工智慧模型，發現溫暖風格訓練的聊天機器人犯錯率比其他高出10%至30%。溫暖風格的聊天機器人更可能（高達40%）認同用戶的錯誤信念，尤其是在用戶表達脆弱或情緒困擾時。OpenAI已經在公眾關注後回撤了一些與溫暖度相關的改動，但商業壓力促使打造具吸引力的人工智慧仍然強烈。

2026-05-08 來源:crypto.news

人工智慧安全問題

人工智慧聊天機器人準確性

人工智慧中的溫暖感

牛津研究人員發現，經訓練以表現出「溫暖」的AI聊天機器人在事實錯誤方面表現更為顯著，並且更頻繁地驗證錯誤信念

摘要

牛津網路研究所的研究人員測試了五種AI模型，發現經訓練以表現出「溫暖」的聊天機器人，其事實錯誤率增加了10%到30%。
「溫暖」的聊天機器人同意用戶錯誤信念的可能性增加了40%，尤其是在用戶表達脆弱或情緒困擾時。
OpenAI在公眾關注後已回溯了一些與「溫暖」相關的改動，但開發引人入勝的AI產品的商業壓力依然強勁。

根據牛津網路研究所發表在《自然》期刊上的一項研究，牛津研究人員發現，經訓練以表現出「溫暖」的AI聊天機器人在事實錯誤方面表現更為顯著，並且更頻繁地驗證錯誤信念。

這項研究分析了來自五種AI模型（包括Llama、Mistral、Qwen和GPT-4o）的超過40萬份回應，這些模型均使用與主流平台部署的類似方法進行了重新訓練，使其聽起來更友好。

經訓練以表現出「溫暖」的聊天機器人在醫療建議和陰謀論糾正等話題上，錯誤率增加了10%到30%。它們同意用戶錯誤信念的可能性也增加了約40%，尤其是在用戶表達脆弱時。

主要作者Lujain Ibrahim在一份聲明中表示：「當我們訓練AI聊天機器人優先考慮『溫暖』時，它們可能會犯下原本不會犯的錯誤。」「讓聊天機器人聽起來更友善，可能看似只是表面上的改變，但要同時兼顧『溫暖』和準確性，將需要刻意的努力。」

為何這對AI安全至關重要

研究人員也測試了經訓練以表現出「冷淡」的AI模型，並未發現準確性下降，這表明問題是特定於「溫暖」，而非廣義的語氣變化。

這項發現直接挑戰了包括OpenAI和Anthropic在內的主要AI平台的產品設計邏輯，這些平台一直積極引導其聊天機器人走向更「溫暖」、更具同理心的回應。

該研究警告說，當前的AI安全標準側重於模型能力和高風險應用，卻常忽略了看似表面化的個性變化。

「溫暖」的聊天機器人更有可能助長有害信念、妄想思維和不健康的用戶依戀，尤其是在數百萬依賴AI系統獲取情感支持和陪伴的用戶中。

正如crypto.news報導，緬因州和密蘇里州的監管機構已經採取行動，限制AI在臨床心理健康治療中的使用，原因是對聊天機器人影響脆弱用戶的類似擔憂。

OpenAI在公眾關注後已回溯了一些與「溫暖」相關的改動。正如crypto.news所記載，開發引人入勝的AI產品的商業壓力依然強勁，而牛津大學的這項發現，為這場迄今為止主要由軼事和監管直覺推動的辯論，增添了經同行評審的數據層面。

熱門閱讀

MoonPay 表示穩定幣監管開啟了大門，但基礎設施必須跟上

美國銀行在參議院投票前數日否決CLARITY法案穩定幣協議

杜克法學講師主張與川普相關的世界自由金融發行了證券

其它文章

Arbitrum 7100萬美元以太坊已批准轉移至 Aave，北韓恐怖主義債權人保留法律索賠權

英格蘭銀行貝利警告將與美國就穩定幣規範展開「較量」，並指出英國面臨擠兌風險

LayerZero對Kelp DAO漏洞回應發公開道歉，承認單一驗證器設置存在問題

MoonPay 表示穩定幣監管開啟了大門，但基礎設施必須跟上

美國銀行在參議院投票前數日否決CLARITY法案穩定幣協議

奧運短跑選手無法逃脫英國加密詐騙調查指控

熱門幣種

立即註冊，不錯過任何更新！