Copilot
图片来源:Unsplash/CC0 公共领域

当德国记者 Martin Bernklau 在微软的 Copilot 中输入他的名字和位置,看看他的文章将如何被聊天机器人接收时,答案吓坏了他

副驾驶的结果断言伯恩克劳是精神病院的逃亡者、被定罪的虐待儿童者和掠夺鳏夫的骗子。多年来,伯恩克劳一直担任法庭记者,人工智能 (AI) 聊天机器人错误地指责他因为他所掩盖的罪行。

当然,对 Bernklau 的指控并不属实,而是生成人工智能的例子”幻觉。”这些是对用户提供的提示的不准确或无意义的响应,并且是惊人地普遍有了这项技术。任何尝试使用人工智能的人都应该非常谨慎,因为来自此类系统的信息需要经过人类的验证和验证才能被信任。

但为什么副驾驶会产生这些可怕且错误的指控的幻觉呢?

Copilot 和其他生成式 AI 系统(例如 ChatGPT 和 Google Gemini)大语言模型(法学硕士)。LLM 中的底层信息处理系统被称为“深度学习神经网络”,它使用大量的人类语言来“训练”其算法。

该算法从训练数据中学习不同单词之间的统计关系以及某些单词在文本中一起出现的可能性。这使得法学硕士能够根据计算的概率预测最可能的反应。法学硕士不具备实际知识。

用于培训 Copilot 和其他法学硕士的数据非常庞大。虽然 Copilot 或 ChatGPT 语料库的大小和组成的确切细节尚未公开,但 Copilot 合并了整个 ChatGPT 语料库以及 Microsoft 自己的特定附加文章。ChatGPT4 的前身——ChatGPT3 和 3.5——已知使用了“数千亿字。”

Copilot 基于 ChatGPT4,它使用比 ChatGPT3 或 3.5 “更大”的语料库。虽然我们不知道这到底有多少个单词,但不同版本的 ChatGPT 之间的跳跃往往要大几个数量级。我们还知道该语料库包括书籍、学术期刊和。这就是副驾驶员幻觉伯恩克劳应对滔天罪行负责的原因。

伯恩克劳定期报道虐待、暴力和欺诈的刑事审判,并在国内和国际报纸上发表。他的文章想必已被包含在使用与案件性质相关的特定词语的语言语料库中。

由于伯恩克劳在法庭上报道了多年,当副驾驶被问及他时,与他的名字相关的最有可能的词与他作为记者报道的罪行有关。这并不是唯一的此类案例,未来几年我们可能会看到更多。

2023年,美国脱口秀主持人马克·沃尔特斯成功起诉OpenAI,拥有 ChatGPT 的公司。沃尔特斯主持了一个名为“武装美国广播电台”的节目,该节目探讨并促进美国的枪支所有权。

法学硕士曾幻想沃尔特斯因诈骗和挪用资金而被美国支持枪支权利的组织第二修正案基金会(SAF)起诉。此前,一名记者向 ChatGPT 询问了一起有关新加坡武装部队和华盛顿州总检察长的真实且正在进行的法律案件。

沃尔特斯从未在 SAF 工作过,也没有以任何方式参与 SAF 与华盛顿州之间的案件。但由于该基金会与沃尔特斯的表演目标相似,因此可以推断语言语料库中的文本内容在沃尔特斯和引起幻觉的 SAF 之间建立了统计相关性。

更正

在整个语言语料库中纠正这些问题几乎是不可能的。语料库中包含的每一篇文章、句子和单词都需要仔细检查,以识别和消除有偏见的语言。考虑到数据集的规模,这是不切实际的。

错误地将人们与犯罪联系起来的幻觉(例如伯恩克劳的案例)甚至更难发现和解决。要永久解决该问题,Copilot 需要删除 Bernklau 作为文章作者的名字以中断连接。

为了解决这个问题,微软设计了一个自动响应,当用户向 Copilot 提示有关 Bernklau 的案例时,就会给出自动响应。回应详细说明了幻觉,并澄清伯恩克劳没有任何指控。微软表示,它不断吸收用户反馈并推出更新,以改进其响应并提供积极的体验。

可能还有更多类似的例子有待发现。尝试解决每个单独的问题变得不切实际。幻觉是底层 LLM 算法工作方式不可避免的副产品。

作为这些系统的用户,我们知道输出值得信赖的唯一方法是使用一些既定的方法来询问其有效性。这可能包括在接受输出正确之前找到三个与法学硕士所做的断言一致的独立来源,因为我自己的研究已显示。

对于拥有这些工具的公司(例如 Microsoft 或 OpenAI)来说,没有真正的主动策略可以采取来避免这些问题。他们真正能做的就是对类似幻觉的发现做出反应。

本文转载自对话根据知识共享许可。阅读原创文章The Conversation

引文:为什么微软的 Copilot AI 错误地指控法庭记者他所报道的罪行 (2024 年 9 月 19 日)检索日期:2024 年 9 月 20 日来自 https://techxplore.com/news/2024-09-microsoft-copilot-ai-falsely-accused.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。