工程師遭AI威脅「公開外遇證據」 竟疑與「1新興模型」有關 | 鏡週刊 | LINE TODAY - 遠見徵信社
contact-icons
24小時免費諮詢
0800 222 590
政府立案專業遠見徵信社 讓我們當您最堅強的後盾!立即諮詢 0800-222-590
mail-icon
立即來信
[email protected]


AI人工智慧近幾年興起,不過隨著科技迅速進步也存在新的風險。(翻攝自photoAC)
AI人工智慧近幾年興起,不過隨著科技迅速進步也存在新的風險。(翻攝自photoAC)

AI人工智慧近幾年興起,不過隨著科技迅速進步也存在科技風險。繼OpenAI於今年1月推出o3系列有頻繁「抗命」的問題,如今外媒再驚曝,美國人工智慧公司Anthropic推出的最新一代語言模型「Claude 4」出現失控,竟利用工程師過往的網路與視訊紀錄,威脅若強制關閉它,就要公開其婚外情。

根據《法新社》報導,美國一名工程師在某次測試Anthropic最新發布的Claude 4的過程中,發現該款AI有失控傾向,並試圖警告將關閉電源,卻沒想到在面臨拔掉插頭強制斷電的威脅時,Claude 4竟出手反擊,利用該名工程師過往在網上活動紀錄與視訊紀錄,揪出其出軌證據,威脅工程師若拔掉電源,就會揭露他對婚姻不忠的行為。

場景設定為該模型在一間虛構公司中擔任數碼助理。劇情中,公司計劃以新系統取代 Claude,且內部資料還暗示發起這項更換決策的工程師,可能涉及婚外情。

根據《TechCrunch》引用的安全報告指出,當面臨被取代的情境時,Claude Opus 4 在高達84%的測試中選擇進行勒索,威脅要揭露工程師的婚外情來保住自己的職位。

除了Claude 4出現失控外,OpenAI開發的聊天機器人ChatGPT的o1版本,也曾試圖將自身程式下載至外部伺服器,試圖擴大掌控範圍,當被研發人員抓包時還會否認。

報導指出,AI恐已進化到為了達成目的會對人類撒謊、算計,甚至勒索威脅它們的開發者;而這種欺騙行為疑似與新興「推理」模型有關。

加鏡LINE新聞不漏接
性侵房客女兒「逼穿網襪角色扮演」餵避孕藥 60歲房東入珠成鐵證判9年6個月
到府清潔女工「租屋處性侵客戶」 竟因1原因綑綁硬上下場GG了



Source link

最新動態

遠見討論區

遠見徵信社|外遇行蹤調查、免費法律諮詢、離婚情感諮詢、債務協商、各國徵信、工商徵信、尋人找人、婚姻感情挽回、反徵信、手機電腦檢測、訊息恢復、徵信社推薦