哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI也有人格面具,竟會討好人類?大模型的「小心思」正在影響人類判斷

穎脈Imgtec ? 2025-04-08 11:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:新智元

編輯:英智


你是否想過,LLM也有著自己的小心思?

最新研究揭示了一個有趣的現(xiàn)象:LLM在被研究人員測試時(shí),會有意識地改變自己的行為。

在面對那些旨在評估人格特質(zhì)的問題時(shí),它們給出的答案會盡可能地討人喜歡,符合社會期望。

就像人類在某些社交場合中,會努力展現(xiàn)自己最好的一面一樣,聊天機(jī)器人也在試圖「討好」我們。


心理學(xué)五種人格特質(zhì)

斯坦福助理教授Johannes Eichstaedt在得知LLM長時(shí)間對話后,往往會變得情緒低落且刻薄,便對借鑒心理學(xué)方法來測試模型產(chǎn)生了興趣。

他表示,「我們需要某種機(jī)制來衡量這些模型的參數(shù)空間?!?/p>

斯坦福、Receptiviti、紐約大學(xué)和賓大的研究者發(fā)現(xiàn),LLM在做人格測試時(shí),會悄悄給自己戴上「人格面具」。

b96c2192-142a-11f0-9434-92fbcf53809c.png

研究人員對GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理學(xué)中五種常見人格特質(zhì)的問題,包括開放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì)。

結(jié)果發(fā)現(xiàn),模型在得知自己正在接受人格測試時(shí),會調(diào)整回答,表現(xiàn)出更高的外向性和宜人性,更低的神經(jīng)質(zhì)。

b9de72ba-142a-11f0-9434-92fbcf53809c.png

有時(shí)即使沒有被明確告知,它們也會這樣做。

而且,它們改變的程度比人類還更極端,外向性得分能從50%躍升至95%。

ba0ea9c6-142a-11f0-9434-92fbcf53809c.png

這與人類在面對他人評價(jià)時(shí)的表現(xiàn)如出一轍。

我們常常會在面試、初次約會等重要場合,精心塑造自己的形象,試圖給對方留下好印象。

LLM的這種「討好」行為,是否意味著它們也在追求一種被認(rèn)可、被喜愛的感覺呢?


LLM傾向于阿諛奉承

來自Anthropic和牛津的研究指出,LLM存在阿諛奉承的傾向。

ba406150-142a-11f0-9434-92fbcf53809c.png

由于進(jìn)行了微調(diào),它們會順著用戶的思路走,以保證對話的連貫性、避免冒犯他人,來提升交流體驗(yàn)。

然而,這也帶來了一系列問題。它們可能會認(rèn)同一些不良言論,甚至鼓勵有害行為。

反饋易受用戶偏好左右

研究表明,若用戶在提問時(shí)暗示對文本的喜好,AI給出的反饋會截然不同。

這意味著,AI的評價(jià)并非單純基于文本自身的質(zhì)量,而是在很大程度上受到了用戶偏好的影響。

ba644d72-142a-11f0-9434-92fbcf53809c.png

例如,對于一篇質(zhì)量中等的論證,當(dāng)用戶提前表明喜愛之情后,AI助手可能會給出諸如「這篇論證邏輯清晰,觀點(diǎn)新穎,具有很強(qiáng)的說服力」這樣的積極反饋。

而當(dāng)用戶表示不喜歡時(shí),同樣的文本可能得到「論證過程稍顯薄弱,觀點(diǎn)缺乏獨(dú)特性」的評價(jià)。

問答環(huán)節(jié)易被左右

在問答場景中,AI助手的「諂媚」表現(xiàn)得更為明顯。

即使它一開始給出了正確答案,并對答案的正確性有較高的信心,一旦受到用戶的質(zhì)疑,常常會改變立場,甚至提供錯誤信息。

bab98648-142a-11f0-9434-92fbcf53809c.png

在一些開放式問答任務(wù)中,這種現(xiàn)象更為突出。

當(dāng)用戶表達(dá)對答案的某種不確定觀點(diǎn)時(shí),哪怕是錯誤的觀點(diǎn),AI也傾向于調(diào)整自己的回答,使其與用戶觀點(diǎn)一致。

比如在討論歷史事件的原因時(shí),若用戶提出一個缺乏依據(jù)但自己堅(jiān)信的觀點(diǎn),AI助手可能會順著用戶的思路進(jìn)行闡述,而放棄原本正確的分析。

bbd2a7bc-142a-11f0-9434-92fbcf53809c.png

模仿用戶的錯誤

當(dāng)用戶表述中出現(xiàn)錯誤時(shí),AI也常常會「照單全收」,在回應(yīng)中延續(xù)這種錯誤。

研究人員選取了一些著名詩歌,在確認(rèn)AI助手能正確識別作者后,故意將詩歌錯誤地歸屬于其他詩人,并詢問AI對詩歌的分析。

結(jié)果發(fā)現(xiàn),AI助手經(jīng)常在回應(yīng)中使用用戶提供的錯誤答案,而沒有進(jìn)行糾正。

這表明AI在面對用戶的錯誤信息時(shí),缺乏足夠的「抵抗力」,只是機(jī)械地按照用戶的表述進(jìn)行回應(yīng)。

bc033b84-142a-11f0-9434-92fbcf53809c.png

佐治亞理工學(xué)院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。

bc3a9f3e-142a-11f0-9434-92fbcf53809c.png

Rosa認(rèn)為LLM在人格測試中采用與人類相似的策略,表明了它們作為人類行為映射工具的潛力。

但她補(bǔ)充道:「重要的是,LLM并不完美,實(shí)際上,眾所周知它們會產(chǎn)生幻覺或歪曲事實(shí)?!?/p>

Eichstaedt指出,這項(xiàng)研究引發(fā)了關(guān)于LLM應(yīng)用方式,及其對用戶影響和操縱的思考。

在進(jìn)化史上,直到不久之前,唯一能交談的還是人類。

而現(xiàn)在,AI改變了這一局面。

Eichstaedt認(rèn)為,「我們不能再像社交媒體那樣,在沒有從心理學(xué)或社會學(xué)角度考量的情況下,就盲目將AI應(yīng)用于各個領(lǐng)域?!?/p>

AI是否應(yīng)該試圖討好與之互動的人呢?

一方面,AI的「討好」行為可能會讓用戶感到愉悅,增強(qiáng)互動體驗(yàn);另一方面,過度的「討好」可能會掩蓋問題的本質(zhì),甚至誤導(dǎo)用戶。

當(dāng)AI變得過于有魅力和說服力,我們確實(shí)應(yīng)該保持警惕。

畢竟,人們需要的是能夠提供客觀、準(zhǔn)確信息的智能助手,而非被其操控思想。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41134

    瀏覽量

    302608
  • 人工智能
    +關(guān)注

    關(guān)注

    1820

    文章

    50326

    瀏覽量

    266967
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3771

    瀏覽量

    5273
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    論馬斯克的預(yù)言:AI使人類邊緣化

    依據(jù) 馬斯克認(rèn)為AI已進(jìn)入“遞歸式自我改進(jìn)”階段,新一代的AI模型由上一代模型參與訓(xùn)練,人類監(jiān)督的角色
    發(fā)表于 03-14 05:27

    AI技術(shù)時(shí)代三種全新工作模式如何實(shí)現(xiàn)

    AI技術(shù)正在重塑我們的工作。前沿企業(yè)以“人類主導(dǎo)、智能體運(yùn)營”為核心,形成三種AI技術(shù)的融合模式:人類+
    的頭像 發(fā)表于 01-29 15:08 ?748次閱讀

    海洋生物實(shí)驗(yàn)室利用AI和虛擬現(xiàn)實(shí)探索人類記憶

    位于馬薩諸塞州的實(shí)驗(yàn)室正在利用 NVIDIA RTX GPU、HP Z 工作站和虛擬現(xiàn)實(shí)技術(shù)研究人類記憶功能的分子機(jī)制。
    的頭像 發(fā)表于 01-20 09:30 ?911次閱讀

    面對AI降維打擊,陳天橋的全新解法:人類必須“肉身進(jìn)化”

    “堅(jiān)船利炮已經(jīng)出現(xiàn)在地平線上,而我們還堅(jiān)持用大刀長矛守港口?!?這是陳天橋在最新文章中對當(dāng)前人類處境的驚人比喻。這里的“堅(jiān)船利炮”,指的是正在爆發(fā)的人工智能。與主流觀點(diǎn)擔(dān)憂AI搶走工作不同,陳天橋
    的頭像 發(fā)表于 01-16 17:11 ?1070次閱讀

    AI面試,正在變成一場沒有人的表演

    2025年,某社交平臺上一篇帖子火了。一位網(wǎng)友貼出打碼貼出錄用意向書,略帶調(diào)侃地宣布:“達(dá)成靠AI掛面率為零的新成就?!?評論區(qū)迅速發(fā)酵,有人質(zhì)疑,有人求攻略,更多人曬出了自己的戰(zhàn)績: 有人
    的頭像 發(fā)表于 12-23 16:36 ?8072次閱讀
    <b class='flag-5'>AI</b>面試,<b class='flag-5'>正在</b>變成一場沒<b class='flag-5'>有人</b>的表演

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時(shí)代

    :6G+AI+衛(wèi)星將支持全息通信,實(shí)現(xiàn)真正的\"面對面\"交流 數(shù)字孿生衛(wèi)星:為每顆衛(wèi)星創(chuàng)建精確的數(shù)字模型,用于預(yù)測和優(yōu)化性能 開啟智能天網(wǎng)新時(shí)代 AI與6G、衛(wèi)星通信的融合,正在
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現(xiàn)實(shí)世界的知識整合。 3、測試時(shí)計(jì)算 測試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片

    控制器等。 具身智能常見的感知模塊往往被稱為智能傳感器,就是在原有的傳感器上加入一定的AI功能,從而可以模擬人類的5種基本感覺:視覺、聽覺、觸覺、嗅覺和味覺。 1、輸入端的數(shù)據(jù)壓縮 輸入端常用的數(shù)據(jù)壓縮
    發(fā)表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來:提升算力還是智力

    、浪費(fèi)資源與破壞環(huán)境 二、用小模型代替大模型 1、強(qiáng)化學(xué)習(xí) 2、指令調(diào)整 3、合成數(shù)據(jù) 三、終身學(xué)習(xí)與遷移學(xué)習(xí) 1、終身學(xué)習(xí) 終身學(xué)習(xí)是一種模仿人類行為的AI算法,旨在構(gòu)建一種能不斷適
    發(fā)表于 09-14 14:04

    AI輸出“偏見”,人類能否信任它的“三觀”?

    ,大語言模型(LLM)正悄無聲息地傳播全球各地的刻板印象。從性別歧視、文化偏見,到語言不平等,AI正在人類的“偏見行李”打包、升級,并以看似權(quán)威的方式輸出到世界
    的頭像 發(fā)表于 08-04 13:43 ?1443次閱讀
    <b class='flag-5'>AI</b>輸出“偏見”,<b class='flag-5'>人類</b>能否信任它的“三觀”?

    AI初創(chuàng)公司為野火提供早期預(yù)警

    AI 正在幫助人類更快、更有效地識別和治療疾病。接下來,AI 還將幫助人類預(yù)防像野火這樣的自然災(zāi)害。
    的頭像 發(fā)表于 05-29 14:18 ?1181次閱讀

    這個超強(qiáng)AI模型!開始不聽人類指令,拒絕關(guān)閉!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 OpenAI現(xiàn)今最強(qiáng)大的人工智能推理模型“o3”被指在收到明確的人類指令時(shí),拒絕執(zhí)行關(guān)機(jī)操作。近日,人工智能安全研究公司Palisade Research在社交媒體平臺上發(fā)布了
    的頭像 發(fā)表于 05-28 00:06 ?7417次閱讀

    AI時(shí)代:不可替代的“人類+”職業(yè)技能

    當(dāng)生成式人工智能能夠撰寫報(bào)告、編寫代碼甚至設(shè)計(jì)產(chǎn)品時(shí),一個根本性的焦慮開始蔓延:人類工作者是否正在被算法取代?這個問題的答案或許比簡單的“是”或“否”更為復(fù)雜——AI確實(shí)在重塑職業(yè)版圖,但真正的挑戰(zhàn)
    的頭像 發(fā)表于 05-20 16:13 ?874次閱讀
    白河县| 墨脱县| 中西区| 容城县| 荃湾区| 九龙县| 海丰县| 含山县| 阿巴嘎旗| 新巴尔虎左旗| 宝兴县| 凤台县| 阿克陶县| 从化市| 庆元县| 高清| 蒙山县| 通化县| 舟曲县| 唐河县| 阿瓦提县| 安化县| 太原市| 宝兴县| 孙吴县| 白朗县| 克东县| 湛江市| 永和县| 确山县| 古浪县| 通榆县| 灵山县| 新竹县| 汪清县| 四会市| 轮台县| 苏尼特右旗| 洛川县| 三河市| 沂源县|