多工學習模型增強仇恨言論識別

2024-10-15 02:17:20

研究人員開發了一種新方法，可以使用新的多任務學習（MTL）模型更準確、一致地自動檢測社交媒體平台上的仇恨言論；一種跨多個資料集工作的機器學習模型。

網路上辱罵性仇恨言論的傳播可能會加深政治分歧、邊緣化弱勢群體，削弱民主並引發現實世界的傷害，包括增加國內恐怖主義的風險。

雪梨科技大學 (UTS) 行為資料科學實驗室負責人 Marian-Andrei Rizoiu 副教授正在奮戰打擊網路錯誤訊息和仇恨言論的第一線。他的跨學科研究結合了電腦和社會科學，以更好地理解和預測線上環境中的人類注意力，包括影響和極化數位管道輿論的言論類型。

「隨著社群媒體成為我們日常生活的重要組成部分，自動識別仇恨和辱罵內容對於打擊有害內容的傳播和防止其傳播至關重要。破壞性影響”，Rizoiu 副教授說。

「設計有效的仇恨言論自動偵測是一項重大挑戰。目前的模式在識別所有不同類型的仇恨言論方面並不是很有效，包括種族主義、性別歧視、騷擾、煽動暴力和極端主義。

「這是因為目前的模型僅針對某一部分進行訓練數據集並在相同的數據集上進行測試。這意味著當他們面對新的或不同的數據時，他們可能會陷入困境並且表現不一致。

Rizoiu 副教授在論文中概述了新模型，“使用多任務學習推廣仇恨言論檢測：政治公眾人物的案例研究，」發表於電腦語音和語言，與合著者和悉尼科技大學博士。候選人袁蘭欽。

多工學習模型能夠同時執行多個任務並跨資料集共享資訊。在本例中，它接受了來自 Twitter（現在的 X）、Reddit、Gab 和新納粹論壇 Stormfront 等平台的八個仇恨言論資料集的訓練。

然後，MTL 模型在一個獨特的數據集上進行了測試，該數據集包含來自15 位美國公眾人物的300,000 條推文，其中包括前總統、保守派政治家、極右翼陰謀論者、媒體專家和被認為非常進步的左傾代表。

分析顯示，辱罵和充滿仇恨的推文通常帶有厭女症和伊斯蘭恐懼症，主要來自右傾個人。具體來說，在 5,299 個辱罵貼文中，有 5,093 個是由右傾人士發布的。

「仇恨言論作為一個概念並不容易量化。它與攻擊性言論和其他言論是一個連續體。辱罵性內容例如霸凌和騷擾，」里佐尤說。

聯合國將仇恨言論定義為「基於個人或群體的身份（包括其宗教、種族、性別或其他身份）攻擊或使用貶義或歧視性語言的任何形式的言語、寫作或行為交流」因素。

MTL 模型能夠將虐待行為與仇恨言論，並確定特定主題，包括伊斯蘭教、婦女、種族和移民。

更多資訊：Lanqin Yuan 等人，使用多任務學習推廣仇恨言論檢測：政治公眾人物的案例研究，電腦語音和語言（2024）。DOI：10.1016/j.csl.2024.101690

引文：多工學習模式增強仇恨言論認同（2024 年，10 月 14 日）檢索日期：2024 年 10 月 14 日取自 https://techxplore.com/news/2024-10-multi-task-speech-identification.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外，不得未經書面許可，不得複製部分內容。所提供的內容僅供參考。