近い将来、またはさらに遠い日、合成ナレーターや俳優が一般的になり、まばたきすることなく受け入れられるようになるかもしれません。しかし、現時点では議論の余地があります。機械が人間のパフォーマーの仕事をするときに、何が失われ、何が得られるのでしょうか。

オーディオブックのナレーションなどの仕事が AI にアウトソーシングされた場合、誰が収益を得るべきでしょうか?

サンディエゴのソフトウェア会社Yemboの共同創設者は、前例のないシナリオに対する前例のない答えを持ってこの泥沼に足を踏み入れている。サンディエゴやその他の地域の声優たちは、AI によって強化された労働力に対して人間に報酬を支払うというこのアプローチに興味と不安を持って注目しています。

シナリオ: Yembo の共同創設者は AI に関する本を執筆して自費出版し、俳優は昨年その英語のオーディオブックを録音し、その録音時間に対して報酬を受け取りました。現在、AI で複製された彼女の声は、そのオーディオブックの 15 冊の翻訳のナレーションに使用されています。

ナレーターはスウェーデン語、ウクライナ語、トルコ語を話せませんが、彼女の声は話します。

「アメリカ英語は生身のヘイリーによってナレーションされており、残りは彼女に似せたAIです」と、この本の著者兼出版者であり、Yemboの共同創設者であるザック・ラトナー氏は電子メールで書いた。

ヘイリーとは、声のクローンが作成されている俳優、ヘイリー・ハンサードのことです。ハンサードさんは契約を通じて、たとえどの言語で本をナレーションしていなかったとしても、彼女の声でオーディオブックの著作権料を受け取ることになる。

オーディオブックや記事の AI ナレーションがますます普及している一方で、市場調査会社によると、2033 年までに全世界で 390 億ドルに達すると予想される急成長産業であるオーディオブック分野において、AI クローン翻訳に対する著作権料の支払いはこれが初めてとなる可能性があります。マーケット.us.

「私の知る限り、このオーディオブックプロジェクトは、ナレーターがAIの肖像を使用した製品で著作権料を得る初めてのプロジェクトだが、彼らが作成したわけではない」とラトナー氏は語った。「これは私が知る初めてのことでした。理解しようとしても何も見つかりませんでした。私たちはそれを一から理解する必要がありました。見つけることができるテンプレートはありませんでした。」

ジェネレーティブ AI ゲーム プロジェクトに肖像がスキャンされたサンディエゴの俳優、サンドラ コンデ氏は、契約の詳細を確認し、これは未知の、急速に変化する領域におけるパブリッシャーと声優の利益に対応していると述べました。

「これは新しいフロンティアのようなもので、2年後、あるいは1年後であっても、どうなっているかは分かりません」とコンデ氏は語った。

コネチカットを拠点とする声優でエンターテイメント弁護士のロバート・シグリンパーリア氏は、この契約は画期的なものであり、オーディオブックのナレーション、翻訳、AIに触れているため注目に値すると述べた。

「ここは荒野の西部だ」と彼は言った。「(俳優の)組合には、私が知っている限り(AI)翻訳に関するものは何もありません。」

何が問題になっているのかを考えると、契約は重要だ。「人間の声を使うか、クローンの声を使うかということは、現在オーディオブックの世界で大きな問題になっている。AIを使って作られているオーディオブックもあり、ナレーターは生のナレーションを守ろうとしているからだ」「彼らの生活を守ろうとしている」と彼は語った。

AIは間違いなく人間のナレーターに取って代わられるだろうと同氏は付け加えた。

「私の頭の中にある疑問は、それがどこまで進むのかということだ。事業の50パーセントがかかるのか?25パーセント?75パーセント?100パーセント?それが私たちが問うべき質問だ」とシグリンパーリア氏は語った。

全米声優協会の会長兼共同創設者であるティム・フリードランダー氏は、人間のナレーションをAIが生成した素材で置き換えたり補完したりできるため、この契約はたとえ一例にすぎないとしても重要だと述べた。

「合成コンテンツを正規化するあらゆる種類の事例において、(契約条件は)重要になるだろう」とフリードランダー氏はロサンゼルスから語った。

人間の俳優には、AI ツールよりも何かがある、それは人間性であり、生きた経験、文化、文脈に基づいて微妙な解釈を与えることができる、と彼は付け加えた。機械はそれを模倣しようとするかもしれないが、物語やエッセイの中の言葉を本物の方法で解釈することはできない、と彼は言う。

ロバート・フロストが翻訳中に詩が失われるという言葉に似ています。

ラトナー氏も同意する。結局のところ、彼は最初からクローン音声を使用するのではなく、英語のオーディオブックを録音するために人間を雇ったのです。翻訳だけがクローンされます。

「つまり、抑揚があるのです。オーディオブックの中で、彼女は何度かクスッと笑ったり、くすくす笑ったりします。AI になることで何かを失うのと同じです」と彼は言った。しかし、AIが理にかなうシナリオもある、と同氏は言う。

リスナーはその声が人間の声なのか合成なのかを気にするでしょうか?

それは本によるかも知れません。あるいは声です。

助けを求めています: 染色体はオプションです

俳優たちは何十年もの間、自分の声を録音して再合成するプロジェクトで報酬を受けてきました。Siri は 2011 年にデビューしましたが、同意と報酬に関する不気味な裏話がありました。声のクローンを作成するための生成 AI の使用は新しく、はるかに効率的であり、必要なのは新しい素材を作成するための小さなサンプル。

SAG-AFTRAのメンバーであるシグリムパーリア氏は、10年前には、音と言葉を大量に録音するには「声優を雇って1か月分の料金を支払わなければならなかったでしょう」と語った。「これで、3 分間のサンプルを取得して、それを使って何でもできるようになります。オーディオブック、映画、テレビ番組を作成でき、3 つの異なる言語で作成できます。必要なデータはほんの少量です。。」

Atlantic マガジンは、サンディエゴの調査報道機関である inewsource と同様に、AI ナレーション プラグインを使用しています。AI によるテキスト読み上げナレーション サービスの家内産業が急増しています。イレブンラボ、Podcastle、Speechify、Murf AI、Revoicer、Audiobook.ai などです。

この飛躍が起こる前は、俳優やオーディオブックのナレーションを外注するのはより困難でした。マレーシアやスリランカでは人件費は安いかもしれないが、カリフォルニアのリズムは彼らでは作り出せないものの一つだ。AI は回避策です。人間に任せるのではなく、機械を使用します。

俳優やその他のクリエイティブな専門家が生成 AI を実存の脅威とみなしているのはそのためです。

だからこそ、昨年俳優や脚本家がストライキでスタジオと衝突したのだとシグリンパーリア氏は語った。

スタジオは俳優の顔をスキャンし、そのスキャンを使用して新しい素材を生成することを許可されるべきでしょうか、それともトイレ休憩も給料も必要ない合成俳優が代わりになれるとしても、人間を雇用し続けるべきでしょうか?そして、スタジオが俳優の特徴をスキャンする場合、そのスキャンに対してのみ料金を支払うことができるのでしょうか、それとも将来の使用や潜在的な使用、つまり人間の俳優が実行したであろう使用に対して料金を支払う必要があるのでしょうか?

シグリンパーリア氏によると、今回の俳優らのストライキ和解により、AIのクローン作成は認められるものの、将来の使用に関して制限が設けられ、俳優をよりよく保護するための報酬に関する規則が追加されたという。

フリードランダー氏によると、米国には控えめに見積もっても約10万人の現役声優がおり、吹き替えの仕事の約80%は組合員以外によるものだという。

人間と機械

昨年の夏、Yembo を共同設立する前はクアルコムでソフトウェア イノベーションに従事していたラトナー氏は、「Grow Up Fast: Lessons from an AI Startup」という本を自費出版しました。これは、コンピュータ ビジョンと呼ばれる AI のサブセットを使用して引越業界や保険業界向けのツールを作成する会社、Yembo の設立に彼がどのように貢献したかを描いた起業家精神の回想録です。

この本のスペイン語訳は今月発売され、その後ウクライナ語、その他10か国語以上が発売される予定だ。ラトナー氏によると、微調整と修正のための時間が組み込まれているため、数か月以内にすべてが完成する可能性があるという。

AI ナレーションは「メッセージを伝えることができなかった人々の参入障壁を確実に下げます」と彼は言いました。

彼は人間と機械にかかる時間とお金のコストを分析しました。英語のオーディオブックの録音には約 4 週間かかりました。(ハンサードさんは週末にしか録音できず、声帯には休憩が必要でした。) 「マスタリング、編集、QA リスニング、リテイクを考慮すると、米国英語のオーディオブックの作成には関係者全員で約 65 人時間の作業がかかったと推定されます。」と彼は書いた。

次に、彼女の書籍の 3 時間の録音を使用して音声合成モデルと呼ばれる AI ツールをトレーニングし、そのモデルを使用して他の翻訳書籍を作成しました。

人間による翻訳を考慮しないと(ラトナー氏は、「AI翻訳は予期せぬ方法でおかしな間違いをする」ため、翻訳を書くために人を雇った)、AIオーディオブックのナレーションはそれぞれ5時間かかり、その大部分は品質保証、つまり読み上げなどの間違いの排除に費やされる。「セカンド」ではなく「ツーエンディー」としての2nd。

この金額の差はさらに驚くべきもので、人間のナレーターの場合、録音セッションごとに数百ドル、またはオーディオブックの場合はおそらく 2,500 ドルを請求する可能性がある、と同氏は推定しています。音声合成ソフトウェアの料金は月額 22 ドルです。

公正な契約

ナレーターは 15 冊の翻訳本を作成するために追加の作業を行う必要はありませんでしたが、出版社はわざわざ他の 15 人のナレーターを雇う必要もありませんでした。オーディオブックの制作の一部が AI に委託される場合、クリエイターと出版社にとって公平な支払いはどれくらいでしょうか?

ラトナー氏がユニオン・トリビューンと共有したこの契約は、AIの利点を最大化しながら、一人の人間の労働者の損失を最小限に抑えようとするもので、オーディオブックの翻訳には情報へのアクセスの拡大が含まれる。「Grow Up Fast」の翻訳が売れるたびに、たとえ他の言語で録音したことがなかったとしても、ナレーターはお金を稼ぐことになります。AI を使用して人間の俳優を使用する場合の数分の 1 のコストで翻訳のナレーションを行った出版社も同様です。

  • ハンサードさんには、1日4時間のスタジオ録音ごとに500ドルが支払われ、彼女のクローン音声を使用した翻訳作品には10%の著作権料が支払われる。支払いは 10 年間にわたって四半期ごとに行われます。
  • 彼女のクローン音声は、この本の翻訳にのみ使用できます。その他の用途には新しいライセンスが必要です。
  • ナレーターには、公開前に翻訳を含む製品をレビューし、編集を依頼するための 30 日間の時間が与えられます。
  • 出版社は本を任意の価格で販売したり、プレゼントを提供したりできます。

1 つのセクションではラベル付けについて説明します。「AIの使用は製品のマーキングで開示されなければならない」とラトナー氏は述べた。こうすることで、読者やリスナーは、オーディオブックが「ヘイリー・ハンサードによるナレーション」なのか「ヘイリー・ハンサードの声で」なのかを知ることができます。

契約の要点を精査した他の関係者らは、この契約を「心強い」と呼び、一部の共通の留保はあるものの、両当事者にとって概ね公平に見えると述べた。

ナレーターが印税を受け取るべきだということに全員が同意した。出版社は人間の俳優の代わりにAIを利用することでより大きな利益を得ており、将来のナレーターはAIのせいで潜在的な収入を失いつつある、とシグリンパーリア氏は述べた。

「ある言語で読む人が一人いるだけで、機械を使って無料で変換できるんです」と彼は言う。

フリードレンダー氏は、契約が同意、管理、補償、透明性を扱っていることを気に入っています。しかし、たとえ公平な契約であっても、前例が設定されることについては疑問が生じると同氏は述べた。

「この一人の声優が、さまざまな言語をすべて演じることができるのです」と彼は語った。彼は、「異なる言語でこれを行ったであろう他のナレーター全員に与えられる損害」について言及した。

いつか、「すべての声となる数人の4、5人のナレーター」が現れるかもしれない、と彼は言う。特にオーディオブックは、声優の「多くの人が始める場所の 1 つ」です。もし合成音声が標準になったら、新しい人々はどうやって始めるのかと彼は尋ねた。

コンデ氏は、なぜ10年後にロイヤルティが止まるのか不思議に思った。「契約は解除され、彼女の声はどこでも使用できるようになるのでしょうか?」彼女は尋ねた。「10年条項が切れた後はどうなるのか心配です。」

サンディエゴの声優兼カメラ俳優のウェンディ・ホブランド氏は、時間制限はナレーターの再交渉に役立つ可能性があると語った。また、出版社は「彼女にオープンに協力して、どのように使われるのかを伝え、双方にとって有利な補償方法を考え出そうとしているようだ」とも述べた。声優は必ずしもそれを理解するとは限りません、と彼女は言いました。

「それは大きな問題だ。『盗まれた』という言葉が正しいかどうかは分からないが、声が本来の意図とは異なる形で使われているのだ。声優たちは自分たちが一つのことを声を出していると思っていたのに、自分たちの声が違うことに気づいたのだ」別のことに使われます」と彼女は言った。

ハンサードさんは、この契約によって彼女の同意なしにクローン音声を他の用途に使用することが禁じられているため、この契約によって「非常に守られている」と感じている。

「他の俳優やクリエイターと同じように、私もAIに悪用されるのではないかと心配しています。しかし、この特定の合意は双方にとって有利でした。ザックは私の懸念すべてに非常に快く対応してくれました」とハンサード氏は語った。

概念実証としての AI オーディオブック

なぜラトナーがナレーターと公正な契約を結ぶことを優先したのか、それがイェンボにとって何になるのかを理解することは、イェンボが何を販売しているのかを理解するのに役立ちます。Yembo のソフトウェアは家の中をスキャンし、移動、保管、保険再建の見積もりの​​ための在庫と 3D モデルを作成します。

新規顧客の獲得における最大の課題は競合他社ではなく、変化への抵抗であるとラトナー氏は語った。彼が出会ったある引越し会社のように、タイプライターの使用がまだ可能な業界で、AIであろうとなかろうと、新しいテクノロジーをどうやって信頼するのでしょうか?何十年もうまくいってきたのなら、なぜ危険を冒す必要があるのでしょうか?

彼の解決策は、AI が利益以上の目的で使用できることを証明することです。

「このビジネスの取り決めも、本自体と同じくらい興味深いと思います。特に AI 関係者をめぐるあらゆる不安の中で、AI をどのように良い方向に利用できるかについての興味深い物語だと思います」とラトナー氏は書いています。

「AIにより、経済的価値は、費やした労力(たとえば、お金を得る時間)ではなく、生み出された生産物に結び付けられるようになります」と彼は付け加えた。

ラトナー氏は、自分の仕事が出版社ではなくテック系スタートアップの経営であることを考えると、AIがなかったら外国語のナレーションを追求することはなかったと語った。彼はイェンボの仲間内からナレーターを見つけた。ハンサードはイェンボに雇われているプロダクトマネージャーであり、元プロの俳優である。彼女は SAG の資格がありますが、組合員ではありません。

「(AIに代わる)ものは何もなかった」と彼は語った。決して、翻訳をしたり、さまざまな言語のナレーターを雇ったりするつもりはないと彼は説明した。

ロサンゼルスからのインタビューで、ハンサードは自分のボーカルクローンを聞いた時の不気味さについて語った。これは、英語と翻訳の両方で書かれた彼女の最初のオーディオブックです。

「私の声を聞くのはほとんど不快ですこれまで話したことがない言語を話すことができましたが、このような可能性が存在することにも驚きました」と彼女は言いました。

他の人の仕事を奪うことはないと確信していたので、彼女はこのプロジェクトに満足していました。

「最良の結果は、AI が人間の俳優や人間の声に取って代わらないことだと思います」とハンサード氏は語った。「それなしでは実現できなかった場合にのみ補完します。」

さらに彼女は続けた。「そこは、AIが人類に取って代わらないようにするために、誰もが自分の人間性に手を伸ばさなければならないところだと思います。AIは強化するだけです。何かが不可能だったとしても、それはギャップを埋めるだけです」。」

2024年 サンディエゴ・ユニオン・トリビューン紙。Tribune Content Agency, LLC によって配布されます。

引用:AI がナレーションを務める本はこちらです: 人間は仕事を失っていますか?(2024年3月13日)2024 年 8 月 5 日に取得https://techxplore.com/news/2024-03-ai-narrated-humans-job.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。