조만간 합성 내레이터와 배우가 눈 하나 깜빡하지 않고 흔하게 받아들여질 수도 있지만, 지금은 논쟁의 여지가 있습니다. 기계가 인간 연기자의 작업을 수행할 때 무엇을 잃고 무엇을 얻습니까?

오디오북 내레이션 등의 업무를 AI에 아웃소싱하면 누가 수익을 창출해야 할까요?

Yembo라는 샌디에이고 소프트웨어 회사의 공동 창업자는 전례 없는 시나리오에 대한 전례 없는 답변을 가지고 이 수렁에 빠져들고 있습니다.샌디에고와 그 외 지역의 성우들은 AI로 강화된 노동에 대해 인간에게 비용을 지불하는 이러한 접근 방식을 관심과 우려를 가지고 지켜보고 있습니다.

시나리오: Yembo의 공동 창업자가 AI에 관한 책을 집필하고 자체 출판했으며, 배우가 작년에 영어 오디오북을 녹음하고 녹음 시간에 대한 대가를 받았습니다.이제 그녀의 AI 복제 음성은 해당 오디오북의 15개 번역본을 해설하는 데 사용되고 있습니다.

내레이터는 스웨덴어, 우크라이나어, 터키어를 구사하지 않지만 목소리는 구사합니다.

책의 저자이자 출판사이자 Yembo의 공동 창립자인 Zach Rattner는 이메일에서 "미국 영어는 살과 피가 섞인 Hailey가 해설하고 나머지는 그녀를 닮은 AI입니다"라고 썼습니다.

Hailey는 목소리가 복제된 배우 Hailey Hansard를 말합니다.계약을 통해 Hansard는 자신의 목소리로 된 오디오북에 대한 로열티를 받게 됩니다. 비록 그녀가 해당 언어로 책을 해설하지 않았더라도 말이죠.

오디오북과 기사의 AI 내레이션이 점차 보편화되고 있지만, 이는 오디오북 영역에서 AI 복제 번역에 대해 로열티를 지불하는 최초의 사례일 수 있습니다. 시장 조사 회사에 따르면 2033년까지 전 세계적으로 390억 달러에 이를 것으로 예상되는 급성장 산업입니다.market.us.

Rattner는 "내가 아는 한, 이 오디오북 프로젝트는 내레이터가 AI 유사성을 사용하는 제품에 대해 로열티를 얻지만 직접 만들지 않은 최초의 프로젝트입니다"라고 말했습니다."제가 아는 것은 처음이고, 알아내려고 해도 아무것도 찾을 수 없을 정도로 충분했어요. 처음부터 알아내야 했어요. 찾을 수 있는 템플릿이 없었어요."

생성적 AI 게임 프로젝트에 초상이 스캔된 샌디에이고 배우 산드라 콘데(Sandra Conde)는 계약의 세부 사항을 검토했으며 이 계약이 빠르게 변화하는 미지의 영역에서 퍼블리셔와 성우의 이익을 다룬다고 말했습니다.

Conde는 "이것은 지금으로부터 2년 뒤, 아니면 1년 뒤가 어떻게 될지 우리가 모르는 새로운 개척지의 일입니다"라고 말했습니다.

코네티컷에서 활동하는 성우이자 엔터테인먼트 변호사인 로버트 시글림파글리아(Robert Sciglimpaglia)는 이번 계약이 오디오북 내레이션, 번역, AI를 다룬 획기적인 계약이기 때문에 주목할 만하다고 말했습니다.

"이곳은 거친 서부입니다."라고 그는 말했습니다."(배우) 노조에는 제가 아는 (AI) 번역 관련 내용이 전혀 없습니다."

계약은 위태로운 상황 때문에 중요합니다. "지금 오디오북 세계에서는 인간의 목소리를 사용하든 복제된 목소리를 사용하든 이것이 큰 문제입니다. AI로 수행되는 오디오북이 있고 내레이터가 실시간 내레이션을 보호하려고 하기 때문입니다.“그들의 생계를 보호하려고 노력하고 있다”고 그는 말했다.

그는 AI가 의심할 여지 없이 인간 내레이터를 대체할 것이라고 덧붙였습니다.

Sciglimpaglia는 "내 마음 속에 있는 질문은 그것이 얼마나 멀리 갈 것인가이다. 사업의 50%를 차지할 것인가? 25%? 75%? 100%를 차지할 것인가? 이것이 바로 우리가 물어봐야 할 질문이다"라고 말했다.

전국성우협회(National Association of Voice Actors)의 회장이자 공동 창립자인 팀 프리들랜더(Tim Friedlander)는 이번 계약이 단지 하나의 예일지라도 의미가 크다고 말했습니다. 왜냐하면 인간 내레이션을 AI 생성 자료로 대체하거나 보완할 수 있기 때문입니다.

로스엔젤레스의 Friedlander는 "합성 콘텐츠를 정규화하는 모든 종류의 경우(계약 조건이) 중요할 것"이라고 말했습니다.

그는 인간 배우가 AI 도구보다 더 뛰어난 인간성을 갖고 있다고 덧붙였습니다. 이를 통해 실제 경험, 문화 및 맥락을 바탕으로 미묘한 차이를 읽을 수 있습니다.기계는 그것을 모방하려고 노력할 수 있지만 이야기나 에세이의 단어를 진정한 방식으로 해석할 수는 없다고 그는 말했습니다.

번역에서 시가 사라진다는 로버트 프로스트의 말과 비슷합니다.

래트너도 이에 동의합니다.결국 그는 처음부터 복제된 음성을 사용하는 대신 영어 오디오북을 녹음하기 위해 사람을 고용했습니다.번역만 복제됩니다.

"내 말은, 변곡점이 있다는 것입니다. 오디오북에서 그녀는 몇 번 낄낄거리고 웃습니다. 마치 AI가 되면 뭔가를 잃는 것과 같습니다."라고 그는 말했습니다.그러나 AI가 의미를 갖는 시나리오도 있다고 그는 말했다.

청취자들은 목소리가 인간인지 합성인지 신경을 쓰나요?

책에 따라 다를 수도 있습니다.아니면 목소리.

구함: 염색체는 선택사항

배우는 수십 년 동안 자신의 목소리를 녹음하고 재결합하는 프로젝트에 돈을 받았지만 Siri는 2011년에 데뷔했으며 동의와 보상에 대한 불길한 뒷이야기가 있었습니다. 목소리를 복제하기 위해 생성 AI를 사용하는 것은 새롭고 훨씬 더 효율적입니다.새로운 재료를 만들기 위한 작은 샘플.

10년 전에는 "이렇게 할 수 없었습니다. 성우를 고용하고 그에게 한 달치 비용을 지불해야 했을 것입니다"라고 SAG-AFTRA의 회원인 Sciglimpaglia는 말했습니다."이제 3분짜리 샘플을 가지고 원하는 것은 무엇이든 할 수 있습니다. 오디오북, 영화, TV 쇼를 만들 수 있고 세 가지 다른 언어로 넣을 수 있습니다. 아주 적은 양의 데이터만 필요합니다.."

Atlantic 잡지는 샌디에고의 탐사 보도 매체인 inewsource와 마찬가지로 AI 내레이션 플러그인을 사용합니다.AI 텍스트 음성 변환 서비스의 코티지 산업은 ElevenLabs, Podcastle, Speechify, Murf AI, Revoicer, Audiobook.ai 등으로 확산되었습니다.

이러한 도약 이전에는 연기와 오디오북 내레이션을 아웃소싱하기가 더 어려웠습니다.말레이시아와 스리랑카에서는 인건비가 저렴할 수 있지만 캘리포니아 종지는 생산할 수 없습니다.AI는 해결 방법입니다. 사람에게 농사를 짓는 대신 기계를 사용하세요.

이것이 바로 배우와 기타 창의적인 전문가들이 생성 AI를 실존적 위협으로 보는 이유입니다.

이것이 배우와 작가들이 작년에 스튜디오와 파업을 벌인 이유라고 Sciglimpaglia는 말했습니다.

스튜디오가 배우의 얼굴을 스캔하고 그 스캔을 사용하여 새로운 자료를 생성하도록 허용해야 할까요, 아니면 화장실 휴식이나 월급이 필요하지 않은 합성 배우가 인간을 대체할 수 있더라도 인간을 계속 고용해야 할까요?그리고 스튜디오가 배우의 특징을 스캔하는 경우 해당 스캔에 대해서만 비용을 지불해야 합니까, 아니면 인간 배우가 수행했을 미래 또는 잠재적 용도에 대한 비용을 지불해야 합니까?

배우들의 파업 합의는 AI 복제를 허용하지만 향후 사용에 대한 제한을 설정하고 배우를 더 잘 보호하는 보상에 대한 규칙을 추가했다고 Sciglimpaglia는 말했습니다.

보수적으로 추산하면 미국에는 약 10만명의 성우가 활동하고 있으며 성우 작업의 약 80%가 비노조라고 프리들랜더는 말했다.

인간과 기계

작년 여름, Yembo를 공동 창립하기 전에 Qualcomm에서 소프트웨어 혁신 분야에 종사했던 Rattner는 "Grow Up Fast: Lessons from an AI Startup"이라는 책을 직접 출판했습니다.컴퓨터 비전이라는 AI의 하위 집합을 사용하여 이사 및 보험 산업을 위한 도구를 만드는 회사인 Yembo를 설립하는 데 그가 어떻게 도움을 주었는지에 대한 기업가 정신 회고록입니다.

이 책의 스페인어 번역본은 이번 달에 출시될 예정이며, 이어서 우크라이나어 및 기타 10개 이상의 언어가 출시될 예정입니다.Rattner는 모든 것이 몇 달 안에 나올 수 있으며 조정과 수정을 위한 시간이 필요하다고 말했습니다.

AI 내레이션은 "자신의 메시지를 전달할 수 없었던 사람들의 진입 장벽을 확실히 낮춰준다"고 그는 말했습니다.

그는 인간과 기계의 시간과 비용을 세분화했습니다.영어 오디오북을 녹음하는 데 약 4주가 걸렸습니다.(Hansard는 주말에만 녹음할 수 있었고 성대에는 휴식이 필요했습니다.) "마스터링, 편집, QA 청취 및 재촬영을 고려하면 미국 영어 오디오북을 만드는 데 모든 당사자가 약 65시간의 작업이 소요된 것으로 추정됩니다."라고 썼다.

다음으로 그들은 그녀의 책 녹음 중 3시간을 사용하여 음성 합성 모델이라는 AI 도구를 훈련하고 해당 모델을 사용하여 번역된 다른 책을 만들었습니다.

인간에 의한 번역을 포함하지 않고(Rattner는 "AI 번역이 예측할 수 없는 방식으로 엉뚱한 실수를 하기" 때문에 번역을 작성하기 위해 사람들을 고용했습니다) 각 AI 오디오북 내레이션은 5시간이 걸리며 그 중 대부분은 읽기와 같은 실수를 제거하는 품질 보증에 소비됩니다.두 번째는 "두 번째"가 아니라 "투엔디"입니다.

달러 차이는 더욱 놀랍습니다. 인간 내레이터는 녹음 세션당 수백 달러를 청구할 수도 있고 오디오북 비용으로 아마도 2,500달러를 청구할 수도 있다고 그는 추정했습니다.음성 합성 소프트웨어의 비용은 한 달에 22달러입니다.

공정한 계약

해설자는 번역된 책 15권을 만들기 위해 추가 작업을 할 필요가 없었지만, 출판사는 나가서 15명의 다른 해설자를 고용할 필요가 없었습니다.오디오북 제작의 일부가 AI에 아웃소싱되는 경우 제작자와 출판사에게 어떤 지불이 공정합니까?

Rattner가 Union-Tribune과 공유한 이 계약은 오디오북 번역에 대한 정보에 대한 접근 확대를 포함하는 AI의 이점을 극대화하는 동시에 작업자 한 명에 대한 손실을 최소화하려고 시도합니다."Grow Up Fast" 번역이 팔릴 때마다 화자는 다른 언어로 녹음한 적이 없더라도 돈을 벌게 됩니다.AI를 사용하여 인간 배우를 사용하는 비용의 일부만으로 번역을 해설한 출판사도 마찬가지입니다.

  • Hansard는 하루 4시간 동안 스튜디오 녹음을 할 때마다 500달러를 받았고 자신의 복제된 목소리를 사용한 번역 작품에 대해 10%의 로열티를 받았습니다.지불은 10년 동안 분기별로 이루어집니다.
  • 그녀의 복제된 목소리는 이 책의 번역에만 사용될 수 있습니다.다른 용도로 사용하려면 새 라이센스가 필요합니다.
  • 내레이터는 30일 동안 번역을 포함하여 제품을 검토하고 제품이 출시되기 전에 편집을 요청합니다.
  • 출판사는 책을 어떤 가격에도 팔 수 있고 경품도 제공할 수 있습니다.

한 섹션에서는 라벨링을 다룹니다.Rattner는 "AI의 사용은 제품 표시에 공개되어야 합니다"라고 말했습니다.이렇게 하면 독자나 청취자는 오디오북이 "Hailey Hansard의 내레이션"인지 "Hailey Hansard의 목소리로"인지 알 수 있습니다.

계약의 핵심 사항을 검토한 다른 관계자들은 이것이 "장려적"이라고 말하며 일부 공유된 의구심에도 불구하고 일반적으로 양 당사자에게 공평한 것으로 보인다고 말했습니다.

화자가 로열티를 받아야 한다는 데 모두 동의했습니다.출판사는 인간 배우 대신 AI를 사용하여 더 큰 수익을 창출하고 있으며 미래 내레이터는 AI로 인해 잠재적 수입을 잃고 있다고 Sciglimpaglia는 말했습니다.

"그들은 한 언어를 읽을 수 있는 사람이 한 명 뿐이고 기계를 사용하여 그것을 무료로 변환할 수 있습니다"라고 그는 말했습니다.

Friedlander는 계약이 동의, 통제, 보상 및 투명성을 다루는 것을 좋아합니다.그러나 그는 공평한 계약이라 할지라도 선례가 정해지는 것에 대해 의문을 제기한다고 말했습니다.

"이 한 명의 성우는 다양한 언어를 모두 구사할 수 있습니다."라고 그는 말했습니다.그는 "다른 언어로 이 일을 했을 다른 모든 해설자들에게 피해를 입혔다"고 언급했습니다.

언젠가는 "모든 것의 목소리가 되는 소수의 4~5명의 해설자"가 있을 수도 있다고 그는 말했습니다.특히 오디오북은 "많은 사람들이 성우를 시작하는 장소 중 하나"입니다.표준이 합성 음성이 된다면, 새로운 사람들이 어떻게 시작할 것인지 그는 물었습니다.

Conde는 왜 10년 후에 로열티가 중단되는지 궁금했습니다."계약이 만료되고 그녀의 목소리는 어디에서나 사용할 수 있습니까?"그녀는 물었다."10년 조항 이후에 무슨 일이 일어날지 걱정될 것 같아요."

샌디에고의 성우 겸 카메라 배우인 Wendy Hovland는 시간 제한이 내레이터가 재협상하는 데 도움이 될 수 있다고 말했습니다.그녀는 또한 출판사가 "그것이 어떻게 사용될 것인지 알려주고 양측 모두에게 효과적인 보상 방법을 찾기 위해 그녀와 공개적으로 협력하고 있는 것으로 보인다"고 말했습니다.성우들이 항상 그런 걸 이해하는 것은 아니다”라고 그녀는 말했다.

"그게 큰 문제다. 목소리가... '훔치다'가 맞는 표현인지는 모르겠지만 원래 의도했던 것과는 다른 방식으로 사용됐다. 성우들은 자신이 한 가지 목소리를 내고 있다고 생각하고 자신의 목소리가다른 용도로 사용된다"고 말했다.

Hansard는 자신의 동의 없이 복제된 목소리를 다른 용도로 사용하는 것을 금지하기 때문에 계약에 의해 "매우 보호된다"고 느낍니다.

Hansard는 "다른 배우 및 창작자들과 마찬가지로 AI에 의해 이용당하는 것에 대해 걱정하고 있습니다. 하지만 이 특별한 합의는 윈윈이었습니다. Zach는 제가 가진 모든 우려 사항을 잘 처리해 주었습니다"라고 Hansard는 말했습니다.

개념 증명으로서의 AI 오디오북

Rattner가 서술자와 공정한 계약을 맺는 것을 우선시한 이유를 이해하려면 Yembo에 대한 내용은 무엇입니까? Yembo가 판매하는 제품을 이해하는 데 도움이 됩니다.Yembo의 소프트웨어는 주택 내부를 스캔하고 이동, 보관 및 보험 재건 견적을 위한 재고 및 3D 모델을 생성합니다.

새로운 고객을 확보하는 데 가장 큰 어려움은 경쟁자가 아니라 변화에 대한 저항이라고 Rattner는 말했습니다.타자기를 사용하는 것이 여전히 가능한 산업에서 그가 만난 한 이사 회사처럼 AI이든 아니든 신기술을 어떻게 믿을 수 있을까요?수십 년 동안 일이 잘 진행되었다면 위험을 감수할 이유가 무엇입니까?

그의 해결책은 AI가 이익 이상의 용도로 사용될 수 있다는 것을 증명하는 것입니다.

Rattner는 "나는 책 자체만큼 사업 계획이 흥미롭다고 생각합니다. 특히 AI 배우를 둘러싼 모든 불안 속에서 AI가 어떻게 선하게 사용될 수 있는지에 대한 흥미로운 이야기라고 생각합니다"라고 썼습니다.

"AI는 경제적 가치가 들이는 노력(예: 달러에 대한 시간)이 아닌 생성된 산출물에 연결되도록 허용합니다."라고 그는 덧붙였습니다.

Rattner는 자신의 직업이 출판사가 아닌 기술 스타트업을 운영하고 있다는 점을 고려할 때 AI가 없었다면 외국어 내레이션을 추구하지 않았을 것이라고 말했습니다.그는 Yembo 계열에서 내레이터를 찾았습니다. Hansard는 Yembo에 고용된 제품 관리자이자 전직 전문 배우입니다.그녀는 SAG 자격이 있지만 조합원은 아닙니다.

그는 "(AI에 대한) 대안은 아무것도 아니었다"고 말했다.그는 아무것도 번역하지 않고 다양한 언어로 해설자를 고용하지 않는다는 뜻이라고 설명했습니다.

로스앤젤레스에서의 인터뷰에서 Hansard는 자신의 보컬 복제 소리를 듣는 것의 기괴함에 대해 이야기했습니다.이것은 영어와 번역으로 된 그녀의 첫 번째 오디오북입니다.

"내 말을 듣는 게 거의 거슬릴 정도야.이전에 한 번도 말해본 적이 없는 언어를 사용하지만 이런 가능성이 존재한다는 것도 놀랍습니다."라고 그녀는 말했습니다.

그녀는 이 프로젝트가 다른 사람의 작업을 방해하지 않는다는 것을 확신했기 때문에 이 프로젝트에 만족했습니다.

Hansard는 “가장 좋은 결과는 AI가 인간 배우나 목소리를 대체하지 않는다는 것입니다.”라고 말했습니다."그것 없이는 불가능했을 경우에만 보완됩니다."

그녀는 계속해서 "AI가 인류를 대체하지 않도록 모든 사람이 자신의 인류성에 접근해야 한다고 생각합니다. 무언가가 가능하지 않을 경우 AI가 향상시킬 뿐이라는 것입니다. 그러면 격차를 메울 수 있습니다."."

2024 샌디에고 유니온-트리뷴.Tribune Content Agency, LLC에서 배포합니다.

소환:AI 내레이션 책이 여기 있습니다. 인간은 직업을 잃었습니까?(2024년 3월 13일)2024년 8월 5일에 확인함https://techxplore.com/news/2024-03-ai-narrated-humans-job.html에서

이 문서는 저작권의 보호를 받습니다.사적인 학습이나 조사를 목적으로 하는 공정한 거래를 제외하고는 어떠한 행위도 허용되지 않습니다.서면 허가 없이 일부를 복제할 수 있습니다.콘텐츠는 정보 제공 목적으로만 제공됩니다.