不久或將來的某一天,合成敘述者和演員可能會變得司空見慣並被人們毫不猶豫地接受,但目前還存在爭論的空間:當機器完成人類表演者的工作時,會失去什麼,會獲得什麼?

當有聲書旁白等工作外包給人工智慧時,誰應該獲得收入?

聖地牙哥一家名為 Yembo 的軟體公司的聯合創始人正在陷入這個泥潭,對前所未有的情況提出了前所未有的答案。聖地牙哥及其他地區的配音演員正在饒有興趣地關注這種為人工智慧增強型勞動付費的方式。

場景:Yembo 的聯合創始人撰寫並自行出版了一本有關人工智慧的書,一名演員去年錄製了英文有聲讀物,並根據錄製時間獲得報酬。現在,她的人工智慧克隆聲音被用來朗讀該有聲讀物的 15 種翻譯。

敘述者不會說瑞典語、烏克蘭語和土耳其語,但她的聲音會。

該書的作者兼出版商、Yembo 的聯合創始人 Zach Rattner 在一封電子郵件中寫道:「美國英語是由有血有肉的海莉講述的,其餘的都是與她相似的人工智慧。

海莉指的是聲音被複製的演員海莉漢薩德。根據她的合同,漢薩德將獲得用她的聲音製作的有聲讀物的版稅,儘管她沒有用任何一種語言來敘述這本書。

雖然有聲書和文章的人工智慧旁白越來越普遍,但這可能是有聲書領域首次為人工智慧克隆翻譯支付版稅——市場研究公司稱,這個蓬勃發展的行業預計到2033 年全球規模將達到390億美元市場.美國。

「據我所知,這個有聲書計畫是第一個,敘述者透過使用他們的人工智慧相似性的產品獲得版稅,但他們並沒有創造,」拉特納說。「這是我所知道的第一個,這已經足夠了,當我試圖弄清楚時,我找不到任何東西。我們必須從頭開始弄清楚。我們找不到模板。”

聖地亞哥演員桑德拉·康德(Sandra Conde)的肖像已被掃描到生成人工智能遊戲項目中,她審查了合約中的細節,並表示它滿足了發行商和配音演員在未知、快速變化的領域的利益。

康德說:“這是一種新的前沿事物,我們不知道它會是什麼樣子,甚至兩年後或一年後都會是什麼樣子。”

康乃狄克州的配音演員兼娛樂律師 Robert Sciglimpaglia 表示,這份合約值得注意,因為它具有開創性,涉及有聲書旁白、翻譯和人工智慧。

“這是狂野的西部,”他說。“據我所知,(演員)工會沒有任何關於(人工智慧)翻譯的資訊。”

合約之所以重要,是因為其中的利害關係:「這是現在有聲書世界的一個大問題:無論你使用真人聲音還是使用克隆聲音。因為有一些有聲讀物是用人工智慧完成的,而敘述者正試圖保護現場旁白” “努力保護他們的生計,”他說。

他補充說,人工智慧毫無疑問將取代人類敘述者。

「我心中的問題是它會走多遠?它會佔用 50% 的業務嗎?25%?75%?100%?這是我們應該問的問題,」Sciglimpaglia 說。

美國配音演員協會主席兼聯合創始人蒂姆·弗里德蘭德表示,這份合約意義重大,即使這只是一個例子,因為它允許人工智慧生成的材料取代或補充人類敘述。

「任何合成內容標準化的情況(合約條款)都會很重要,」弗里德蘭德在洛杉磯表示。

他補充說,人類演員比人工智慧工具擁有一些東西:他們的人性,這讓他們能夠根據生活經驗、文化和背景進行細緻的解讀。他說,機器可能會嘗試模仿這一點,但它們無法以真實的方式解釋故事或文章中的文字。

有點像羅伯特·弗羅斯特所說的詩在翻譯中遺失。

拉特納對此表示同意。畢竟,他確實僱用了一個人來錄製英語有聲讀物,而不是從一開始就使用克隆聲音。只是翻譯被克隆了。

「我的意思是,有一些變化。在有聲書中,她偷笑了幾次。就像,你確實會因為成為人工智慧而失去一些東西,」他說。但他表示,在某些情況下人工智慧是有意義的。

聽眾會關心聲音是人聲還是合成聲音嗎?

這可能取決於書。或聲音。

尋求幫助:染色體可選

雖然演員們幾十年來一直在透過錄製和重新組合聲音的項目獲得報酬——Siri 於2011 年首次亮相,在同意和補償方面有一個不祥的背景故事——但使用生成式人工智慧來克隆聲音是一種新的方式,而且效率要高得多,只需要小樣本來創造新材料。

十年前,「你做不到這一點——你必須請一位配音演員,並支付他一個月的費用」來錄製大量的聲音和單詞,SAG-AFTRA 的成員 Sciglimpaglia 說。「現在你可以拿一個三分鐘的樣本,然後你可以用它做任何你想做的事情。你可以製作有聲書、電影、電視節目,你可以用三種不同的語言來呈現它。它只需要非常少量的數據」。

《大西洋》雜誌使用人工智慧旁白插件,聖地牙哥調查新聞媒體 inewsource 也是如此。人工智慧文字轉語音旁白服務的家庭手工業激增:ElevenLabs、Podcastle、Speechify、Murf AI、Revoicer、Audiobook.ai 等。

在這次飛躍之前,表演和有聲書旁白更難外包。馬來西亞和斯里蘭卡的勞動力價格可能很便宜,但加州的節奏是他們無法製造的。人工智慧是一種解決方法:使用機器,而不是外包給人類。

這就是為什麼演員和其他創意專業人士將生成式人工智慧視為生存威脅。

西格林帕利亞說,這就是去年演員和編劇在罷工中與製片廠發生衝突的原因。

工作室是否應該被允許掃描演員的臉部並使用這些掃描來產生新的材料,或者即使合成演員(不需要上廁所或薪水)可以取代他們,他們是否應該繼續僱用人類?如果製片廠確實掃描了演員的特徵,他們是否可以只為這次掃描付費,還是應該為未來或潛在的用途(人類演員本來可以實現的用途)付費?

西格林帕利亞表示,演員們的罷工協議允許人工智慧克隆,但對未來的使用設定了限制,並增加了補償規則,以更好地保護演員。

弗里德蘭德說,保守估計,美國約有 10 萬名在職配音員,其中約 80% 的配音工作沒有工會。

人與機器

去年夏天,拉特納(在共同創立 Yembo 之前曾在高通公司從事軟體創新工作)自行出版了一本名為《快速成長:人工智慧新創公司的經驗教訓》的書。這是一本創業回憶錄,講述了他如何幫助建​​立 Yembo 公司,該公司使用稱為電腦視覺的人工智慧子集為搬家和保險行業製造工具。

該書的西班牙語譯本將於本月發布,隨後將推出烏克蘭語和其他 10 多種語言。拉特納說,所有這些都可以在幾個月內完成,並且有時間進行調整和修改。

他說,人工智慧旁白「肯定會降低那些無法傳達訊息的人的進入門檻」。

他詳細分析了人力和機器的時間和金錢成本。英文有聲書的錄音大約花了四個星期。(Hansard 只能在周末錄音,她的聲帶需要休息。)“考慮到母帶處理、編輯、QA 聽力和重錄,我估計這本美國英語有聲讀物需要各方大約 65 個工時才能創作, “他寫道。

接下來,他們用她三個小時的書籍錄音來訓練一種稱為語音合成模型的人工智慧工具,並使用該模型來翻譯其他書籍。

不包括人類的翻譯(拉特納僱人來寫翻譯,因為「人工智慧翻譯會以不可預測的方式犯下時髦的錯誤」),每本人工智慧有聲讀物旁白需要五個小時,其中大部分花在品質保證上-消除閱讀等錯誤2nd 不是“第二”,而是“two-en-dee”。

美元差異更加驚人:他估計,真人解說員每次錄音可能會收取幾百美元的費用,或者一本有聲書的費用可能為 2,500 美元。語音合成軟體每月 22 美元。

公平的合約

敘述者不必做額外的工作來創作 15 本翻譯書籍,但出版商也不必出去僱用 15 個其他敘述者。當有聲書的部分製作外包給人工智慧時,什麼樣的付款方式對創作者和出版商來說是公平的?

拉特納與《聯合論壇報》分享的這份合約試圖最大限度地減少人類工人的損失,同時最大限度地發揮人工智慧的好處,對於有聲讀物翻譯來說,這包括擴大資訊取得範圍。每當《快速成長》的翻譯版售出時,敘述者就會賺錢——儘管她從未用其他語言錄製過唱片。出版商也會如此,他們使用人工智慧來敘述翻譯,而成本只是使用人類演員的一小部分。

  • Hansard 每天在錄音室錄音 4 小時的報酬為 500 美元,並在使用她的克隆聲音翻譯的作品中獲得 10% 的版稅。在 10 年期限內每季付款一次。
  • 她的克隆聲音只能用於本書的翻譯。其他用途需要新的許可證。
  • 解說員有 30 天的時間來審查產品(包括翻譯),並在產品上線之前要求進行編輯。
  • 出版商可以以任何價格出售該書並進行贈品。

其中一節涉及標籤。「人工智慧的使用必須在產品標記中披露,」拉特納說。這樣,讀者或聽眾就會知道有聲書是「由 Hailey Hansard 講述」還是「以 Hailey Hansard 的聲音」。

其他審查了合約要點的參與者稱其“令人鼓舞”,並表示總體上對雙方來說都是公平的,但也有一些人持保留意見。

所有人都同意敘述者應該要獲得版稅。Sciglimpaglia 表示,出版商透過使用人工智慧取代人類演員來獲得更大的利潤,而未來的敘述者正在因為人工智慧而失去潛在的收入。

「他們只有一個人用一種語言閱讀,他們可以使用機器免費轉換它,」他說。

弗里德蘭德喜歡該合約解決了同意、控制、補償和透明度問題。但他表示,即使是一份公平的合約也會引發人們對先例的質疑。

「這位配音演員可以使用所有這些不同的語言,」他說。他提到“這對所有其他用不同語言做這件事的敘述者造成了損害。”

他說,有一天可能會有「少數四、五個敘述者成為一切的聲音」。有聲書尤其是配音「很多人開始的地方之一」。他問道,如果合成聲音成為常態,那麼這些新人將如何開始。

康德想知道為什麼特許權使用費在 10 年後停止。“契約解除了,她的聲音可以在任何地方使用嗎?”她問。“我會擔心十年條款之後會發生什麼。”

聖地牙哥配音兼上鏡演員溫蒂霍夫蘭表示,時間限制可以幫助敘事者重新談判。她還表示,出版商“似乎正在與她公開合作,告訴她它將如何使用,並想出一種對雙方都有效的補償方法。”她說,配音演員並不總是能理解這一點。

「這是一個大問題:聲音——我不知道『被偷』這個詞是否正確,但使用方式與最初的意圖不同。配音演員以為他們在表達一件事,卻發現他們的聲音用於其他用途,」她說。

Hansard 覺得這份合約“非常保護”,因為未經她同意,合約禁止她的克隆聲音用於其他用途。

「像其他演員和創作者一樣,我確實擔心被人工智慧利用。但這個特殊的協議是雙贏的。扎克非常願意解決我的所有擔憂,」漢薩德說。

人工智慧有聲書作為概念證明

要了解為什麼拉特納優先考慮與敘述者簽訂公平合約(這對 Yembo 有何意義),有助於了解 Yembo 銷售的產品。Yembo 的軟體掃描房屋內部並建立庫存和 3D 模型,用於移動、儲存和保險重建估算。

拉特納說,簽約新客戶的最大挑戰不是競爭對手,而是對改變的抗拒。在一個使用打字機仍然可行的行業中(正如他遇到的一家搬家公司所做的那樣),他們將如何信任新技術,無論它是否是人工智慧?如果幾十年來一切都運作良好,為什麼還要冒險呢?

他的解決方案是:證明人工智慧的用途不僅僅是利潤。

「我發現商業安排和這本書本身一樣有趣。我……認為這是一個關於如何利用人工智慧來做善事的有趣故事,尤其是考慮到人工智慧參與者的所有焦慮,」拉特納寫道。

「人工智慧允許經濟價值與創造的產出掛鉤,而不是與付出的努力(例如,換取美元的時間)掛鉤,」他補充道。

拉特納表示,如果沒有人工智慧,他就不會從事外語旁白,因為他的工作是經營一家科技新創公司,而不是一家出版社。他從 Yembo 的隊伍中找到了敘述者:Hansard 是 Yembo 聘用的產品經理,曾是一名職業演員。她符合美國演員工會的資格,但不是工會成員。

「(人工智慧的)替代品什麼都沒有,」他說。他解釋說,他所說的「無」是指沒有翻譯,也沒有僱用各種語言的敘述者。

在洛杉磯的一次採訪中,漢薩德談到了聽到她的克隆聲音的不可思議。這是她的第一本有聲讀物,包括英文版和翻譯版。

「聽到我的聲音幾乎令人震驚說著我以前從未說過的語言,但令人驚訝的是這種可能性的存在,」她說。

她對這個項目感到滿意,因為她確信它不會佔用其他人的工作。

「我認為最好的結果是人工智慧不會取代人類演員或人類聲音,」漢薩德說。“只有在沒有它就不可能的情況下,它才會起到補充作用。”

她繼續說道,「我認為每個人都必須深入了解自己的人性,以確保人工智慧不會取代人類。它只會增強——如果某件事不可能,那麼它就會填補空白」。

2024 年聖地牙哥聯合論壇報。由 Tribune Content Agency, LLC 發行。

引文:人工智慧講述的書籍在這裡:人類失業了嗎?(2024 年 3 月 13 日)檢索日期:2024 年 8 月 5 日取自 https://techxplore.com/news/2024-03-ai-narerated- humans-job.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。