Copilot
圖片來源:Unsplash/CC0 公共領域

當德國記者 Martin Bernklau 在微軟的 Copilot 中輸入他的名字和位置,看看他的文章將如何被聊天機器人接收時,答案嚇壞了他

副駕駛的結果斷言伯恩克勞是精神病院的逃亡者、被定罪的虐待兒童者和掠奪鰥夫的騙子。多年來,伯恩克勞一直擔任法庭記者,人工智慧 (AI) 聊天機器人錯誤地指責他因為他所掩蓋的罪。

當然,對 Bernklau 的指控並不屬實,而是生成人工智慧的例子”幻覺驚人地普遍有了這項技術。任何嘗試使用人工智慧的人都應該非常謹慎,因為來自此類系統的資訊需要經過人類的驗證和驗證才能被信任。

但為什麼副駕駛會產生這些可怕且錯誤的指控的幻覺呢?

Copilot 和其他生成式 AI 系統(例如 ChatGPT 和 Google Gemini)大語言模型(法學碩士)。LLM 中的底層資訊處理系統稱為“深度學習神經網絡”,它使用大量的人類語言來“訓練”其演算法。

該演算法從訓練資料中學習不同單字之間的統計關係以及某些單字在文字中一起出現的可能性。這使得法學碩士能夠根據計算的機率預測最可能的反應。法學碩士不具備實際知識。

用於培訓 Copilot 和其他法學碩士的數據非常龐大。雖然 Copilot 或 ChatGPT 語料庫的大小和組成的確切細節尚未公開,但 Copilot 合併了整個 ChatGPT 語料庫以及 Microsoft 自己的特定附加文章。ChatGPT4 的前身——ChatGPT3 和 3.5——已知使用了“數千億字。」

Copilot 是基於 ChatGPT4,它使用比 ChatGPT3 或 3.5 「更大」的語料庫。雖然我們不知道這到底有多少個單詞,但不同版本的 ChatGPT 之間的跳躍往往要大幾個數量級。我們也知道該語料庫包括書籍、學術期刊和。這就是副駕駛幻覺伯恩克勞應對滔天罪行負責的原因。

伯恩克勞定期報道虐待、暴力和欺詐的刑事審判,並在國內和國際報紙上發表。他的文章想必已被包含在使用與案件性質相關的特定字詞的語言語料庫中。

由於伯恩克勞在法庭上報道了多年,當副駕駛被問及他時,與他的名字相關的最有可能的詞與他作為記者報道的罪行有關。這並不是唯一的此類案例,未來幾年我們可能會看到更多。

2023年,美國脫口秀主持人馬克沃特斯成功起訴OpenAI,擁有 ChatGPT 的公司。沃特斯主持了一個名為「武裝美國廣播電台」的節目,該節目探討並促進美國的槍支所有權。

法學碩士曾幻想沃特斯因詐騙和挪用資金而被美國支持槍支權利的組織第二修正案基金會(SAF)起訴。此前,一名記者向 ChatGPT 詢問了一起有關新加坡武裝部隊和華盛頓州總檢察長的真實且正在進行的法律案件。

沃特斯從未在 SAF 工作過,也沒有以任何方式參與 SAF 與華盛頓州之間的案件。但由於基金會與沃特斯的表演目標相似,因此可以推斷語言語料庫中的文本內容在沃特斯和引起幻覺的 SAF 之間建立了統計相關性。

更正

在整個語言語料庫中糾正這些問題幾乎是不可能的。語料庫中包含的每一篇文章、句子和單字都需要仔細檢查,以識別和消除有偏見的語​​言。考慮到資料集的規模,這是不切實際的。

錯誤地將人們與犯罪聯繫起來的幻覺(例如伯恩克勞的案例)甚至更難發現和解決。要永久解決問題,Copilot 需要刪除 Bernklau 作為文章作者的名字以中斷連線。

為了解決這個問題,微軟設計了一個自動回應,當使用者向 Copilot 提示有關 Bernklau 的案例時,就會給予自動回應。回應詳細說明了幻覺,並澄清伯恩克勞沒有任何指控。微軟表示,它不斷吸收用戶回饋並推出更新,以改善其回應並提供積極的體驗。

可能還有更多類似的例子有待發現。嘗試解決每個單獨的問題變得不切實際。幻覺是底層 LLM 演算法工作方式不可避免的副產品。

作為這些系統的用戶,我們知道輸出值得信賴的唯一方法是使用一些既定的方法來詢問其有效性。這可能包括在接受輸出正確之前找到三個與法學碩士所做的斷言一致的獨立來源,因為我自己的研究已顯示。

對於擁有這些工具的公司(例如 Microsoft 或 OpenAI)來說,沒有真正的主動策略可以採取來避免這些問題。他們真正能做的就是對類似幻覺的發現做出反應。

本文轉載自對話根據知識共享許可。閱讀原創文章The Conversation

引文:為什麼微軟的 Copilot AI 錯誤地指控法庭記者他所報道的罪行 (2024 年 9 月 19 日)檢索日期:2024 年 9 月 20 日來自 https://techxplore.com/news/2024-09-microsoft-copilot-ai-falsely-accused.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。