人工智能生成的论文有一个修复方法。为什么我们不使用它？

2024-09-07 16:40:35

有一种方法可以防止抄袭、学术不诚实和写得不好的 ChatGPT 论文。为什么我们不使用它？

这是新学年的开始，也是新学年的开始新鲜圆的话语关于生成式人工智能在学校中的新角色。在大约三年的时间里，论文已经从各地课堂教育的支柱变成了一个不太有用的工具，原因之一是：ChatGPT。估计有多少学生使用 ChatGPT 撰写论文各不相同，但这已经很常见了迫使教师适应。

虽然生成式人工智能有很多局限性，但学生论文属于他们非常擅长的服务类别：他们的训练数据中有很多关于指定主题的论文示例，需要大量的论文这样的论文，学生论文的散文质量和原创性研究的标准并不是那么高。

报名这里探索世界面临的重大、复杂的问题以及解决这些问题的最有效方法。每周发送两次。

目前，通过使用人工智能工具进行论文作弊很难被发现。许多工具宣称它们可以验证文本是否是人工智能生成的，但它们是不太可靠。自从诬告学生抄袭这是一件大事，这些工具必须极其精确才能发挥作用，但它们根本就做不到。

AI指纹技术

但这里有一个技术解决方案。早在 2022 年，由量子计算研究员领导的 OpenAI 团队斯科特阿伦森开发了一种“水印”解决方案，即使最终用户在这里或那里更改几个单词或重新排列文本，也可以使人工智能文本几乎不会被误认。该解决方案在技术上有点复杂，但请耐心等待，因为它也非常有趣。

从本质上讲，人工智能文本生成的工作方式是，人工智能根据目前文本中出现的内容“猜测”一堆可能的下一个标记。为了避免过度可预测并不断产生相同的重复输出，人工智能模型不仅仅猜测最可能的标记，而是包含随机化元素，有利于“更有可能”完成，但有时选择可能性较小的一个。

水印在此阶段起作用。它不是让人工智能根据随机选择生成下一个令牌，而是让人工智能使用非随机过程：优先选择在 OpenAI 发明的内部“评分”功能中获得高分的下一个令牌。例如，它可能会稍微偏爱带有字母 V 的单词，因此使用此评分规则生成的文本将比正常的人类文本多 20% 的 V（尽管实际的评分函数比这更复杂）。读者通常不会注意到这一点，事实上，我编辑了这份时事通讯以增加其中 V 的数量，我怀疑我正常写作中的这种变化是否会引人注目。

同样，乍一看，带水印的文本与正常的人工智能输出没有什么不同。但对于知道秘密评分规则的 OpenAI 来说，评估给定的文本正文是否在隐藏评分规则上获得比人类生成的文本高得多的分数是很简单的。例如，如果评分规则是我上面关于字母 V 的示例，您可以通过验证程序运行此时事通讯，并看到它在 1,200 个单词中包含大约 90 个 V，这比您根据 V 出现频率所预期的要多。用于英语。这是一个针对难题的巧妙且技术复杂的解决方案，OpenAI 已经为该问题提供了一个工作原型两年。

因此，如果我们想解决人工智能文本伪装成人类书写文本的问题，这是完全可以解决的。但 OpenAI 尚未发布他们的水印系统，业内其他公司也没有发布。为什么不呢？

一切都与竞争有关

如果 OpenAI（而且只有 OpenAI）发布了 ChatGPT 的水印系统，可以轻松辨别生成式 AI 何时生成文本，这对学生论文抄袭不会有丝毫影响。消息很快就会传开，每个人都会转向当今可用的众多人工智能选项之一：Meta 的 Llama、Anthropic 的 Claude、Google 的 Gemini。抄袭行为将继续有增无减，OpenAI 将失去大量用户群。因此，他们对水印系统保密也就不足为奇了。

在这种情况下，监管机构介入似乎是合适的。如果每个生成式人工智能系统都需要有水印，那么这并不是竞争劣势。这就是加州议会今年提出的一项名为“加州数字内容来源标准，这将要求生成式人工智能提供商使其人工智能生成的内容可被检测到，同时要求提供商标记生成式人工智能并删除欺骗性内容。OpenAI 是赞成账单的一部分 - 毫不奇怪，因为他们是已知唯一拥有执行此操作的系统的生成人工智能提供商。他们的竞争对手大多持反对态度。

我总体上赞成对生成人工智能内容的某种水印要求。人工智能可以非常有用，但它的生产用途并不需要它假装是人类创造的。虽然我不认为政府有权禁止报纸用人工智能取代我们的记者，但我当然不希望媒体误导读者，让他们知道他们正在阅读的内容是否是由真实的人类创造。

尽管我希望有某种水印义务，但我不确定是否可以实施。已经发布的最好的“开放”人工智能模型（例如最新的 Llama），您可以在自己的计算机上运行的模型，质量非常高，对于学生论文来说肯定足够好。它们已经存在，并且无法返回并添加水印，因为任何人都可以运行当前版本，无论未来版本中应用什么更新。（这是我对开放模型有复杂感受的众多方式之一。它们带来了大量的创造力、研究和发现——而且它们也使得不可能进行各种常识性的反冒充或反冒充行为。反儿童性虐待材料否则我们可能真正希望采取的措施。）

因此，尽管水印是可能的，但我认为我们不能指望它，这意味着我们必须弄清楚如何解决社会中普遍存在的人工智能生成的简单内容的问题。教师们已经开始采用课堂论文要求和其他方法来减少学生作弊。我们也可能会看到大学招生论文的转变——老实说，这将是很好的摆脱，因为这些可能是从来都不是选择学生的好方法。

但是，虽然我不会对大学招生论文感到太多哀悼，而且我认为老师非常有能力找到更好的方法来评估学生，但我确实注意到整个传奇中的一些令人不安的趋势。有一种简单的方法可以让我们利用人工智能的好处，而不会出现冒充和抄袭等明显的缺点，但人工智能的发展速度如此之快，社会或多或少让这个机会与我们擦肩而过。个别实验室可以做到这一点，但他们不会这样做，因为这会让他们处于竞争劣势，而且不太可能有一个好方法让每个人都这样做。

在学校关于抄袭的争论中，风险很低。但人工智能水印争论中也反映出同样的动态——商业激励措施阻止公司自我监管，而变革的步伐阻止外部监管机构介入，直到为时已晚——似乎可能仍然存在，因为风险仍然存在。变得更高。

另请参阅其他语言版本: English | 简中 | 正體 | 日本語 | 한국인 | हिंदी | Español