多任务学习模型增强仇恨言论识别

2024-10-15 02:17:20

研究人员开发了一种新方法，可以使用新的多任务学习（MTL）模型更准确、一致地自动检测社交媒体平台上的仇恨言论；一种跨多个数据集工作的机器学习模型。

网上辱骂性仇恨言论的传播可能会加深政治分歧、边缘化弱势群体，削弱民主并引发现实世界的伤害，包括增加国内恐怖主义的风险。

悉尼科技大学 (UTS) 行为数据科学实验室负责人 Marian-Andrei Rizoiu 副教授正在奋战在打击网络错误信息和仇恨言论的第一线。他的跨学科研究结合了计算机和社会科学，以更好地理解和预测在线环境中的人类注意力，包括影响和极化数字渠道舆论的言论类型。

“随着社交媒体成为我们日常生活的重要组成部分，自动识别仇恨和辱骂内容对于打击有害内容的传播和防止其传播至关重要。破坏性影响”，Rizoiu 副教授说。

“设计有效的仇恨言论自动检测是一项重大挑战。当前的模型在识别所有不同类型的仇恨言论方面并不是很有效，包括种族主义、性别歧视、骚扰、煽动暴力和极端主义。

“这是因为当前的模型仅针对某一部分进行训练数据集并在相同的数据集上进行测试。这意味着当他们面对新的或不同的数据时，他们可能会陷入困境并且表现不一致。”

Rizoiu 副教授在论文中概述了新模型，“使用多任务学习推广仇恨言论检测：政治公众人物的案例研究，”发表于计算机语音和语言，与合著者和悉尼科技大学博士。候选人袁兰钦。

多任务学习模型能够同时执行多个任务并跨数据集共享信息。在本例中，它接受了来自 Twitter（现在的 X）、Reddit、Gab 和新纳粹论坛 Stormfront 等平台的八个仇恨言论数据集的训练。

然后，MTL 模型在一个独特的数据集上进行了测试，该数据集包含来自 15 位美国公众人物的 300,000 条推文，其中包括前总统、保守派政治家、极右翼阴谋论者、媒体专家和被认为非常进步的左倾代表。

分析显示，辱骂和充满仇恨的推文通常带有厌女症和伊斯兰恐惧症，主要来自右倾个人。具体来说，在 5,299 个辱骂帖子中，有 5,093 个是由右倾人士发布的。

“仇恨言论作为一个概念并不容易量化。它与攻击性言论和其他言论是一个连续体。辱骂性内容例如欺凌和骚扰，”里佐尤说。

联合国将仇恨言论定义为“基于个人或群体的身份（包括其宗教、种族、性别或其他身份）攻击或使用贬义或歧视性语言的任何形式的言语、写作或行为交流”因素。

MTL 模型能够将虐待行为与仇恨言论，并确定特定主题，包括伊斯兰教、妇女、种族和移民。

更多信息：Lanqin Yuan 等人，使用多任务学习推广仇恨言论检测：政治公众人物的案例研究，计算机语音和语言（2024）。DOI：10.1016/j.csl.2024.101690

引文：多任务学习模型增强仇恨言论识别（2024 年，10 月 14 日）检索日期：2024 年 10 月 14 日来自 https://techxplore.com/news/2024-10-multi-task-speech-identification.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外，不得未经书面许可，不得复制部分内容。所提供的内容仅供参考。