不久或将来的某一天,合成叙述者和演员可能会变得司空见惯并被人们毫不犹豫地接受,但目前还存在争论的空间:当机器完成人类表演者的工作时,会失去什么,会获得什么?

当有声读物旁白等工作外包给人工智能时,谁应该获得收入?

圣地亚哥一家名为 Yembo 的软件公司的联合创始人正在陷入这个泥潭,对前所未有的情况提出了前所未有的答案。圣地亚哥及其他地区的配音演员正在饶有兴趣地关注这种为人工智能增强型劳动付费的方式。

场景:Yembo 的联合创始人撰写并自行出版了一本有关人工智能的书,一名演员去年录制了英文有声读物,并根据录制时间获得报酬。现在,她的人工智能克隆声音被用来朗读该有声读物的 15 种翻译。

叙述者不会说瑞典语、乌克兰语和土耳其语,但她的声音会。

该书的作者兼出版商、Yembo 的联合创始人扎克·拉特纳 (Zach Rattner) 在一封电子邮件中写道:“美国英语是由有血有肉的海莉讲述的,其余的都是与她相似的人工智能。”

海莉指的是声音被克隆的演员海莉·汉萨德。根据她的合同,汉萨德将获得用她的声音制作的有声读物的版税,尽管她没有用任何一种语言来叙述这本书。

虽然有声读物和文章的人工智能旁白越来越普遍,但这可能是有声读物领域首次为人工智能克隆翻译支付版税——市场研究公司称,这个蓬勃发展的行业预计到 2033 年全球规模将达到 390 亿美元市场.美国。

“据我所知,这个有声读物项目是第一个,叙述者通过使用他们的人工智能相似性的产品获得版税,但他们并没有创造,”拉特纳说。“这是我所知道的第一个,这已经足够了,当我试图弄清楚时,我找不到任何东西。我们必须从头开始弄清楚。我们找不到模板。”

圣地亚哥演员桑德拉·康德(Sandra Conde)的肖像已被扫描到生成人工智能游戏项目中,她审查了合同中的细节,并表示它满足了发行商和配音演员在未知、快速变化的领域的利益。

康德说:“这是一种新的前沿事物,我们不知道它会是什么样子,甚至两年后或一年后都会是什么样子。”

康涅狄格州的配音演员兼娱乐律师罗伯特·西格林帕利亚 (Robert Sciglimpaglia) 表示,这份合同值得注意,因为它具有开创性,涉及有声读物旁白、翻译和人工智能。

“这是狂野的西部,”他说。“据我所知,(演员)工会没有任何关于(人工智能)翻译的信息。”

合同之所以重要,是因为其中的利害关系:“这是现在有声读物世界的一个大问题:无论你使用真人声音还是使用克隆声音。因为有一些有声读物是用人工智能完成的,而叙述者正试图保护现场旁白”“努力保护他们的生计,”他说。

他补充说,人工智能毫无疑问将取代人类叙述者。

“我心中的问题是它会走多远?它会占用 50% 的业务吗?25%?75%?100%?这是我们应该问的问题,”Sciglimpaglia 说。

美国配音演员协会主席兼联合创始人蒂姆·弗里德兰德表示,这份合同意义重大,即使这只是一个例子,因为它允许人工智能生成的材料取代或补充人类叙述。

“任何合成内容标准化的情况(合同条款)都会很重要,”弗里德兰德在洛杉矶表示。

他补充说,人类演员比人工智能工具拥有一些东西:他们的人性,这让他们能够根据生活经验、文化和背景进行细致入微的解读。他说,机器可能会尝试模仿这一点,但它们无法以真实的方式解释故事或文章中的文字。

有点像罗伯特·弗罗斯特所说的诗歌在翻译中丢失。

拉特纳对此表示同意。毕竟,他确实雇佣了一个人来录制英语有声读物,而不是从一开始就使用克隆声音。只是翻译被克隆了。

“我的意思是,有一些变化。在有声书中,她偷笑了几次。就像,你确实会因为成为人工智能而失去一些东西,”他说。但他表示,在某些情况下人工智能是有意义的。

听众会关心声音是人声还是合成声音吗?

这可能取决于书。或者声音。

寻求帮助:染色体可选

虽然几十年来演员们一直在通过录制和重新组合声音的项目获得报酬——Siri 于 2011 年首次亮相,在同意和补偿方面有一个不祥的背景故事——但使用生成式人工智能来克隆声音是一种新的方式,而且效率要高得多,只需要小样本来创造新材料。

十年前,“你做不到这一点——你必须请一位配音演员,并支付他一个月的费用”来录制大量的声音和单词,SAG-AFTRA 的成员 Sciglimpaglia 说。“现在你可以拿一个三分钟的样本,然后你可以用它做任何你想做的事情。你可以制作有声读物、电影、电视节目,你可以用三种不同的语言来呈现它。它只需要非常少量的数据”。

《大西洋》杂志使用人工智能旁白插件,圣地亚哥调查新闻媒体 inewsource 也是如此。人工智能文本转语音旁白服务的家庭手工业激增:ElevenLabs、Podcastle、Speechify、Murf AI、Revoicer、Audiobook.ai 等。

在这次飞跃之前,表演和有声读物旁白更难外包。马来西亚和斯里兰卡的劳动力价格可能很便宜,但加州的节奏是他们无法制造的。人工智能是一种解决方法:使用机器,而不是外包给人类。

这就是为什么演员和其他创意专业人士将生成式人工智能视为一种生存威胁。

西格林帕利亚说,这就是去年演员和编剧在罢工中与制片厂发生冲突的原因。

工作室是否应该被允许扫描演员的脸部并使用这些扫描生成新的材料,或者即使合成演员(不需要上厕所或薪水)可以取代他们,他们是否应该继续雇用人类?如果制片厂确实扫描了演员的特征,他们是否可以只为这次扫描付费,还是应该为未来或潜在的用途(人类演员本来可以实现的用途)付费?

西格林帕利亚表示,演员们的罢工协议允许人工智能克隆,但对未来的使用设定了限制,并增加了补偿规则,以更好地保护演员。

弗里德兰德说,保守估计,美国约有 10 万名在职配音演员,其中约 80% 的配音工作没有工会。

人与机器

去年夏天,拉特纳(在共同创立 Yembo 之前曾在高通公司从事软件创新工作)自行出版了一本名为《快速成长:人工智能初创公司的经验教训》的书。这是一本创业回忆录,讲述了他如何帮助建立 Yembo 公司,该公司使用称为计算机视觉的人工智能子集为搬家和保险行业制造工具。

该书的西班牙语译本将于本月发布,随后将推出乌克兰语和其他 10 多种语言。拉特纳说,所有这些都可以在几个月内完成,并且有时间进行调整和修改。

他说,人工智能旁白“肯定会降低那些无法传达信息的人的进入门槛”。

他详细分析了人力和机器的时间和金钱成本。英文有声读物的录制大约花了四个星期。(Hansard 只能在周末录音,她的声带需要休息。)“考虑到母带处理、编辑、QA 听力和重录,我估计这本美国英语有声读物需要各方大约 65 个工时才能创作,“他写道。

接下来,他们用她三个小时的书籍录音来训练一种称为语音合成模型的人工智能工具,并使用该模型来翻译其他书籍。

不包括人类的翻译(拉特纳雇人来写翻译,因为“人工智能翻译会以不可预测的方式犯下时髦的错误”),每本人工智能有声读物旁白需要五个小时,其中大部分花在质量保证上——消除阅读等错误2nd 不是“第二”,而是“two-en-dee”。

美元差异更加惊人:他估计,一位真人解说员每次录音可能会收取几百美元的费用,或者一本有声读物的费用可能为 2,500 美元。语音合成软件每月费用为 22 美元。

公平的合同

叙述者不必做额外的工作来创作 15 本翻译书籍,但出版商也不必出去雇用 15 个其他叙述者。当有声读物的部分制作外包给人工智能时,什么样的付款方式对创作者和出版商来说是公平的?

拉特纳与《联合论坛报》分享的这份合同试图最大限度地减少人类工人的损失,同时最大限度地发挥人工智能的好处,对于有声读物翻译来说,这包括扩大信息获取范围。每当《快速成长》的翻译版售出时,叙述者就会赚到钱——尽管她从未用其他语言录制过唱片。出版商也会如此,他们使用人工智能来叙述翻译,而成本只是使用人类演员的一小部分。

  • Hansard 每天在录音室录音 4 小时的报酬为 500 美元,并在使用她的克隆声音翻译的作品中获得 10% 的版税。在 10 年期限内每季度付款一次。
  • 她的克隆声音只能用于本书的翻译。其他用途需要新的许可证。
  • 解说员有 30 天的时间来审查产品(包括翻译),并在产品上线之前要求进行编辑。
  • 出版商可以以任意价格出售该书并进行赠品。

其中一节涉及标签。“人工智能的使用必须在产品标记中披露,”拉特纳说。这样,读者或听众就会知道有声读物是“由 Hailey Hansard 讲述”还是“以 Hailey Hansard 的声音”。

其他审查了合同要点的参与者称其“令人鼓舞”,并表示总体上对双方来说都是公平的,但也有一些人持保留意见。

所有人都同意叙述者应该获得版税。Sciglimpaglia 表示,出版商通过使用人工智能代替人类演员来获得更大的利润,而未来的叙述者正在因为人工智能而失去潜在的收入。

“他们只有一个人用一种语言阅读,他们可以使用机器免费转换它,”他说。

弗里德兰德喜欢该合同解决了同意、控制、补偿和透明度问题。但他表示,即使是一份公平的合同也会引发人们对先例的质疑。

“这位配音演员可以使用所有这些不同的语言,”他说。他提到“这对所有其他用不同语言做这件事的叙述者造成了损害。”

他说,有一天可能会有“少数四五个叙述者成为一切的声音”。有声读物尤其是配音“很多人开始的地方之一”。他问道,如果合成声音成为常态,那么这些新人将如何开始。

康德想知道为什么特许权使用费在 10 年后停止。“契约解除了,她的声音可以在任何地方使用吗?”她问道。“我会担心十年条款之后会发生什么。”

圣地亚哥配音兼上镜演员温迪·霍夫兰表示,时间限制可以帮助叙述者重新谈判。她还表示,出版商“似乎正在与她公开合作,告诉她它将如何使用,并想出一种对双方都有效的补偿方法。”她说,配音演员并不总是能理解这一点。

“这是一个大问题:声音——我不知道‘被偷’这个词是否正确,但使用方式与最初的意图不同。配音演员以为他们在表达一件事,却发现他们的声音用于其他用途,”她说。

Hansard 觉得这份合同“非常保护”,因为未经她同意,合同禁止她的克隆声音用于其他用途。

“像其他演员和创作者一样,我确实担心被人工智能利用。但这个特殊的协议是双赢的。扎克非常愿意解决我的所有担忧,”汉萨德说。

人工智能有声读物作为概念证明

要了解为什么拉特纳优先考虑与叙述者签订公平合同(这对 Yembo 有何意义),有助于了解 Yembo 销售的产品。Yembo 的软件扫描房屋内部并创建库存和 3D 模型,用于移动、存储和保险重建估算。

拉特纳说,签约新客户的最大挑战不是竞争对手,而是对变革的抵制。在一个使用打字机仍然可行的行业中(正如他遇到的一家搬家公司所做的那样),他们将如何信任新技术,无论它是否是人工智能?如果几十年来一切都运转良好,为什么还要冒险呢?

他的解决方案是:证明人工智能的用途不仅仅是利润。

“我发现商业安排和这本书本身一样有趣。我……认为这是一个关于如何利用人工智能来做善事的有趣故事,尤其是考虑到人工智能参与者的所有焦虑,”拉特纳写道。

“人工智能允许经济价值与创造的产出挂钩,而不是与付出的努力(例如,换取美元的时间)挂钩,”他补充道。

拉特纳表示,如果没有人工智能,他就不会从事外语旁白,因为他的工作是经营一家科技初创公司,而不是一家出版社。他从 Yembo 的队伍中找到了叙述者:Hansard 是 Yembo 聘用的产品经理,曾是一名职业演员。她符合美国演员工会的资格,但不是工会成员。

“(人工智能的)替代品什么都没有,”他说。他解释说,他所说的“无”是指没有翻译,也没有雇用各种语言的叙述者。

在洛杉矶的一次采访中,汉萨德谈到了听到她的克隆声音的不可思议。这是她的第一本有声读物,包括英文版和翻译版。

“听到我的声音几乎令人震惊说着我以前从未说过的语言,但令人惊讶的是这种可能性的存在,”她说。

她对这个项目感到满意,因为她确信它不会占用其他人的工作。

“我认为最好的结果是人工智能不会取代人类演员或人类声音,”汉萨德说。“只有在没有它就不可能的情况下,它才会起到补充作用。”

她继续说道,“我认为每个人都必须深入了解自己的人性,以确保人工智能不会取代人类。它只会增强——如果某件事不可能,那么它就会填补空白”。

2024 年圣地亚哥联合论坛报。由 Tribune Content Agency, LLC 发行。

引文:人工智能讲述的书籍在这里:人类失业了吗?(2024 年 3 月 13 日)检索日期:2024 年 8 月 5 日摘自 https://techxplore.com/news/2024-03-ai-narerated- humans-job.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。