train travel
图片来源:Pexels 的 Donald Tong

对于聋人来说,乘坐火车旅行可能是一场赌博。平常的日子里,不会有什么问题:他们乘火车到达目的地,然后继续他们的生意。

但当发生不寻常的事情时,情况很快就会变得可怕,因为大多数更新仅通过音频公告传递。聋人旅客可能会错过他们的火车,因为火车被移到了不同​​的站台,或者看着他们的车站呼啸而过,因为火车今天没有停在那里。在紧急情况下,当其他人都撤离后,他们也可能留在火车车厢内,必须由车站工作人员营救。

这些例子中的每一个已被绘制来自悉尼聋人的真实生活经历。但我和我的同事正在与悉尼火车公司和澳大利亚聋人社区成员合作开发一种先进的、(AI) 支持的签名它可以自动将音频公告翻译成澳大利亚语。

我们在阿凡达上的工作也朝着下一步发展:开发可以“理解”Auslan 的人工智能系统。

旅程并不总是按计划进行

今年早些时候,我和我的同事跑步试点研究与悉尼的三名聋人火车旅客。除了他们分享的关于火车旅行期间可能出现问题的故事之外,我们还了解到他们使用经过考验的策略来使旅程顺利进行。

他们的策略对于普通通勤者来说可能很熟悉。例如,他们会使用应用程序计划行程,提前到达并寻找标牌,让他们知道是否有任何变化。

但他们也表示,他们觉得自己需要站在信息屏幕附近观看更新,并在情况发生变化时向车站工作人员或其他乘客询问信息。他们还报告说,在火车上时保持高度警惕,确保自己不会错过车站。

但这些策略并不总能确保聋哑旅行者收到重要信息,包括有关紧急情况的信息。例如,虽然车站工作人员通常很乐于助人,但有时却太忙而无法提供帮助。

最令人沮丧的是其他乘客不愿意或无法提供信息,让我们的聋哑旅客只能“随波逐流”。这通常意味着最终会来到错误的地方。

开发签名头像

语音转文本软件似乎可以轻松解决其中一些问题。但对于许多聋人来说,英语不是他们的和 Auslan 的处理更加容易和快捷。

我们的聋人旅行者告诉我们,在完美的世界中,他们需要现场翻译。然而,自动、人工智能驱动的翻译使用平台或火车屏幕上显示的手语头像,可以识别音频公告中的关键词,生成具有正确澳大利亚语语法的句子,并将我们词汇库中的相应手语拼凑在一起,这对我们来说很有吸引力。有很多原因。

首先,它允许实时翻译使用已知词汇的公告,这与火车和车站的环境相关,其中许多公告都涵盖类似的主题。

其次,可以根据给定情况的需要定制化身及其签名,例如使用有关屏幕位置的信息来确保化身在指出出口或其他平台时指向正确的方向。

第三,多个手语者可以为化身的词汇贡献手语,然后可以将这些词汇顺利地拼接在一起以组成句子。

重要的是,化身意味着无需真人成为组织自动生成的公告的“面孔”。这一点尤其重要,因为澳大利亚聋人社区规模小且联系紧密,如果翻译出现问题,没有人会遭受任何声誉损害。

从技术角度来看,头像还可以让我们保证签名的最低质量门槛。我们使用动作捕捉来确保词汇库中的每个标志都是准确的,并且动作清晰。

它还可以帮助我们避免“恐怖谷”——一种类似于人类但微妙错误的东西令人不安的效应。我们不想要任何你最近看到的由人工智能生成的多指怪物。

适合所有人的人工智能

这项工作是我们创建一个能够理解 Auslan 的人工智能系统这一更广泛目标的一步。这种人工智能可用于帮助聋哑人和听力正常的车站工作人员进行交谈,或者创建“聊天机器人亭”或基于应用程序的助手,让聋哑人可以根据需要用 Auslan 获取有关他们的火车旅行或其他日常任务的信息。

世界各地的手语和聋人文化之间存在细微差别和复杂性,对于人工智能的听力研究人员和开发人员来说可能不知道。这些细微差别和复杂性必须嵌入新技术中,研究人员和开发人员必须采用语言优先的方法来收集和设计人工智能数据– 不仅仅是针对 – 聋哑人。

只有这样,人工智能才能满足聋人的真正需求:确保他们在日常生活的各个方面的安全和独立。

本文转载自对话根据知识共享许可。阅读原创文章The Conversation

引文:对于聋哑人来说,火车旅行可能是一场赌博——人工智能驱动的 Auslan 头像可以提供帮助(2024 年,10 月 17 日)检索日期:2024 年 10 月 17 日来自 https://techxplore.com/news/2024-10-deaf-people-gamble-ai-powered.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。