Algún día, pronto o más adelante, los narradores y actores sintéticos podrían ser algo común y aceptado sin siquiera pestañear, pero por ahora hay lugar para el debate: ¿qué se pierde y qué se gana cuando una máquina hace el trabajo de un actor humano?

¿Quién debería obtener ingresos cuando trabajos como la narración de audiolibros se subcontratan a la IA?

El cofundador de una empresa de software de San Diego llamada Yembo se está adentrando en este atolladero con una respuesta sin precedentes a un escenario sin precedentes.Los actores de doblaje en San Diego y más allá están observando con interés y aprensión este enfoque de pagar a un humano por un trabajo mejorado con IA.

El escenario: el cofundador de Yembo escribió y publicó por su cuenta un libro sobre IA, y un actor grabó el audiolibro en inglés el año pasado y le pagaron por ese tiempo de grabación.Ahora su voz clonada por IA se está utilizando para narrar 15 traducciones de ese audiolibro.

La narradora no habla sueco, ucraniano ni turco, pero su voz sí.

"El inglés estadounidense está narrado por Hailey de carne y hueso, (el) resto es IA a su semejanza", escribió en un correo electrónico Zach Rattner, autor y editor del libro, y cofundador de Yembo.

Hailey se refiere a Hailey Hansard, el actor cuya voz está siendo clonada.A través de su contrato, Hansard recibirá regalías por los audiolibros con su voz, aunque no narró el libro en ninguno de esos idiomas.

Si bien la narración de audiolibros y artículos con IA es cada vez más frecuente, este puede ser el primer caso de pago de regalías por traducciones clonadas con IA en el ámbito de los audiolibros, una industria en auge que se espera que alcance los 39 mil millones de dólares a nivel mundial para 2033, según una empresa de investigación de mercado.mercado.nosotros.

"Hasta donde yo sé, este proyecto de audiolibro es el primero en el que el narrador gana regalías por un producto que utiliza su imagen de IA, pero que él no creó", dijo Rattner."Es la primera vez que sé, y fue suficiente que cuando intenté resolverlo, no pude encontrar nada. Tuvimos que resolverlo desde cero. No había plantillas que pudiéramos encontrar".

Sandra Conde, una actriz de San Diego cuya imagen ha sido escaneada en un proyecto de juegos de IA generativa, revisó los detalles del contrato y dijo que aborda los intereses del editor y actor de doblaje en un territorio inexplorado y en rápido cambio.

"Es una especie de nueva frontera, que no sabemos cómo será, ni siquiera dentro de dos años o dentro de un año", dijo Conde.

Robert Sciglimpaglia, actor de doblaje y abogado de entretenimiento con sede en Connecticut, dijo que el contrato es digno de mención porque es innovador: aborda la narración de audiolibros, la traducción y la inteligencia artificial.

"Esto es el salvaje, salvaje oeste", dijo."Que yo sepa, el sindicato (de actores) no tiene nada para la traducción (AI)".

El contrato es importante por lo que está en juego: "Este es un gran problema en el mundo de los audiolibros en este momento: si se usan voces humanas o voces clonadas. Porque hay algunos audiolibros que se están haciendo con IA y los narradores están tratando de proteger la narración en vivo".tratando de proteger su sustento", dijo.

Sin duda, la IA sustituirá a los narradores humanos, añadió.

"La pregunta que tengo en mente es ¿hasta dónde va a llegar? ¿Se necesitará el 50 por ciento del negocio? ¿el 25 por ciento? ¿el 75 por ciento? ¿el 100 por ciento? Esa es la pregunta que deberíamos hacernos", dijo Sciglimpaglia.

Tim Friedlander, presidente y cofundador de la Asociación Nacional de Actores de Voz, dijo que este contrato es importante, aunque sea sólo un ejemplo, porque permite que la narración humana sea reemplazada o complementada por material generado por IA.

"Cualquier tipo de instancia en la que se normalice el contenido sintético, (los términos del contrato) van a importar", dijo Friedlander desde Los Ángeles.

Los actores humanos, añadió, tienen algo más que las herramientas de IA: su humanidad, lo que les permite dar lecturas matizadas basadas en la experiencia vivida, la cultura y el contexto.Las máquinas podrían intentar imitar eso, pero no pueden interpretar las palabras de una historia o un ensayo de manera auténtica, dijo.

Algo así como el dicho de Robert Frost acerca de que la poesía se pierde en la traducción.

Rattner está de acuerdo.Después de todo, contrató a un humano para grabar el audiolibro en inglés en lugar de usar una voz clonada desde el principio.Sólo las traducciones están clonadas.

"Quiero decir, hay inflexiones. En el audiolibro, ella se ríe y ríe un par de veces. Por ejemplo, pierdes algo siendo IA", dijo.Pero hay escenarios en los que la IA tiene sentido, afirmó.

¿Les importará a los oyentes si una voz es humana o sintética?

Eso podría depender del libro.O la voz.

Se busca ayuda: cromosomas opcionales

Si bien a los actores se les ha pagado por proyectos que graban y recombinan sus voces durante décadas (Siri debutó en 2011, con una historia premonitoria en torno al consentimiento y la compensación), el uso de IA generativa para clonar voces es nuevo y mucho más eficiente, y solo requiere unapequeña muestra para crear nuevo material.

Hace diez años "no se podía hacer esto; se habría tenido que contratar un actor de doblaje y pagarle durante un mes" para grabar un banco profundo de sonidos y palabras, dijo Sciglimpaglia, miembro de SAG-AFTRA."Ahora puedes tomar una muestra de tres minutos y hacer lo que quieras con ella. Puedes hacer un audiolibro, una película, un programa de televisión, puedes ponerlo en tres idiomas diferentes. Sólo requiere una cantidad muy pequeña de datos".".

La revista Atlantic utiliza un complemento de narración de IA, al igual que inewsource, un medio de noticias de investigación de San Diego.Ha proliferado una industria artesanal de servicios de narración de texto a voz con IA: ElevenLabs, Podcastle, Speechify, Murf AI, Revoicer, Audiobook.ai y otros.

Antes de este salto, la actuación y la narración de audiolibros eran más difíciles de subcontratar.El precio de la mano de obra puede ser barato en Malasia y Sri Lanka, pero la cadencia de California es algo que no pueden fabricar.La IA es una solución alternativa: en lugar de subcontratar personas, utilice máquinas.

Es por eso que los actores y otros profesionales creativos ven la IA generativa como una amenaza existencial.

Y esa fue la razón por la que actores y escritores se enfrentaron con los estudios en huelgas el año pasado, dijo Sciglimpaglia.

¿Se debería permitir a los estudios escanear los rostros de los actores y generar nuevo material usando esos escaneos, o deberían seguir contratando humanos incluso si actores sintéticos, que no necesitan ir al baño ni recibir sueldo, pudieran reemplazarlos?Y si los estudios escanean las características de un actor, ¿pueden pagar sólo por ese escaneo, o deberían pagar por los usos futuros o potenciales, usos que habría realizado el actor humano?

El acuerdo de huelga de los actores permite la clonación de IA, pero establece límites sobre usos futuros y agrega reglas sobre compensación que protegen mejor a los actores, dijo Sciglimpaglia.

Hay alrededor de 100.000 actores de doblaje en activo en Estados Unidos, una estimación conservadora, y alrededor del 80 por ciento del trabajo de doblaje no está sindicalizado, dijo Friedlander.

Humano y maquina

El verano pasado, Rattner, que trabajó en innovación de software en Qualcomm antes de cofundar Yembo, publicó un libro llamado "Grow Up Fast: Lessons from an AI Startup".Es una memoria empresarial sobre cómo ayudó a construir Yembo, una empresa que utiliza un subconjunto de IA llamado visión por computadora para crear herramientas para las industrias de mudanzas y seguros.

La traducción al español del libro se publicará este mes, seguida del ucraniano y más de 10 idiomas más.Todo podría salir en unos meses, con tiempo para realizar ajustes y revisiones, dijo Rattner.

La narración por IA "definitivamente derriba la barrera de entrada para las personas que no habrían podido difundir su mensaje", dijo.

Desglosó los costos de tiempo y dinero de humanos y máquinas.La grabación del audiolibro en inglés tardó unas cuatro semanas.(Hansard solo podía grabar los fines de semana y sus cuerdas vocales necesitaban descansos). "Teniendo en cuenta la masterización, la edición, la escucha de control de calidad y las repeticiones, calculo que el audiolibro en inglés de EE. UU. requirió alrededor de 65 horas de trabajo de todas las partes para crearlo.", escribió.

Luego, utilizaron tres horas de la grabación de su libro para entrenar una herramienta de inteligencia artificial llamada modelo de síntesis de voz y usaron ese modelo para crear los otros libros traducidos.

Sin contar la traducción realizada por humanos (Rattner contrató personas para escribir traducciones, porque "la traducción con IA comete errores extraños de manera impredecible"), cada narración de audiolibro con IA toma cinco horas, y la mayor parte de ese tiempo se dedica a garantizar la calidad: eliminar errores como la lectura.2º no como "segundo" sino como "dos en dee".

La diferencia de dólares es más asombrosa: un narrador humano podría cobrar unos cientos de dólares por sesión de grabación o quizás 2.500 dólares por un audiolibro, estimó.El software de síntesis de voz cuesta 22 dólares al mes.

Un contrato justo

El narrador no tuvo que hacer trabajo extra para crear 15 libros traducidos, pero el editor no tuvo que contratar a otros 15 narradores.Cuando parte de la producción de un audiolibro se subcontrata a la IA, ¿qué pago es justo para el creador y el editor?

Este contrato, que Rattner compartió con el Union-Tribune, intenta minimizar las pérdidas de un trabajador humano y al mismo tiempo maximizar los beneficios de la IA, que para las traducciones de audiolibros incluye un mayor acceso a la información.Cada vez que se venda una traducción de "Grow Up Fast", la narradora ganará dinero, aunque nunca haya grabado en esos otros idiomas.Lo mismo hará el editor, que utilizó IA para narrar traducciones a una fracción del costo de utilizar un actor humano.

  • A Hansard le pagaron 500 dólares por cada día de grabación de cuatro horas en el estudio y recibe un 10 por ciento de regalías por las obras traducidas que utilizan su voz clonada.Los pagos son trimestrales a un plazo de 10 años.
  • Su voz clonada sólo puede usarse para las traducciones de este libro.Otros usos requieren una nueva licencia.
  • El narrador tiene 30 días para revisar el producto, incluidas las traducciones, y solicitar modificaciones antes de su lanzamiento.
  • El editor puede vender el libro a cualquier precio y realizar obsequios.

Una sección cubre el etiquetado."El uso de la IA debe indicarse en las marcas de los productos", afirmó Rattner.De esta manera, los lectores u oyentes sabrán si el audiolibro fue "Narrado por Hailey Hansard" o "En la voz de Hailey Hansard".

Otros actores que revisaron los puntos clave del contrato lo calificaron de "alentador" y dijeron que en general parece justo para ambas partes, aunque algunos compartían reservas.

Todos estuvieron de acuerdo en que el narrador debería recibir regalías.El editor está obteniendo mayores ganancias al utilizar IA en lugar de actores humanos, y los futuros narradores están perdiendo ingresos potenciales debido a la IA, dijo Sciglimpaglia.

"Sólo tienen una persona para leer en un idioma y pueden usar una máquina para convertirlo gratis", dijo.

A Friedlander le gusta que el contrato aborde el consentimiento, el control, la compensación y la transparencia.Pero dijo que incluso un contrato equitativo plantea dudas sobre si se puede sentar un precedente.

"Este actor de doblaje puede hablar en todos estos idiomas diferentes", dijo.Mencionó el "daño que se les ha hecho a todos los demás narradores que habrían hecho esto, en esos diferentes idiomas".

Algún día podría haber "un puñado de cuatro o cinco narradores que se conviertan en la voz de todo", dijo.Los audiolibros en particular son "uno de los lugares donde mucha gente se inicia" en la actuación de voz.Si la norma se convierte en voces sintéticas, ¿cómo empezarán esas nuevas personas?, preguntó.

Conde se preguntó por qué las regalías se acaban después de 10 años."¿El contrato finaliza y su voz se puede utilizar en cualquier lugar?"preguntó ella."Me preocuparía lo que pase después de la cláusula de 10 años".

Wendy Hovland, actriz de voz y cámara de San Diego, dijo que el límite de tiempo puede ayudar al narrador a renegociar.También dijo que el editor "parece estar trabajando abiertamente con ella, para decirle cómo se utilizará y encontrar una manera de compensar que funcione para ambas partes".Los actores de doblaje no siempre entienden eso, dijo.

"Ese es un gran problema: las voces son... No sé si 'robadas' es la palabra correcta, pero se usan de una manera que no estaba prevista originalmente. Los actores de doblaje pensaron que estaban expresando una cosa y descubrieron que sus vocesse utilizan para otra cosa", afirmó.

Hansard se siente "muy protegida" por el contrato porque prohíbe otros usos de su voz clonada sin su consentimiento.

"Al igual que otros actores y creadores, me preocupa que la IA me explote. Pero este acuerdo en particular fue beneficioso para todos. Zach fue muy receptivo a la hora de atender todas las inquietudes que tenía", dijo Hansard.

Audiolibro con IA como prueba de concepto

Para entender por qué Rattner dio prioridad a la creación de un contrato justo con el narrador (qué le espera a Yembo), es útil comprender qué vende Yembo.El software de Yembo escanea el interior de las casas y crea inventarios y modelos 3D para estimaciones de mudanza, almacenamiento y reconstrucción de seguros.

El mayor desafío para conseguir nuevos clientes no ha sido la competencia sino la resistencia al cambio, dijo Rattner.En una industria donde todavía es factible usar una máquina de escribir, como lo hace una empresa de mudanzas con la que se encontró, ¿cómo confiarán en las nuevas tecnologías, ya sea IA o no?Si las cosas han funcionado bien durante décadas, ¿por qué arriesgarse?

Su solución: demostrar que la IA puede usarse para algo más que ganancias.

"Encuentro el acuerdo comercial tan interesante como el libro en sí. Yo... creo que es una historia interesante sobre cómo la IA puede usarse para el bien, especialmente con toda la ansiedad en torno a los actores de la IA", escribió Rattner.

"La IA permite vincular el valor económico a la producción creada, no al esfuerzo realizado (por ejemplo, tiempo por dólares)", añadió.

Rattner dijo que no habría seguido las narraciones en idiomas extranjeros sin la IA, dado que su trabajo consiste en dirigir una startup tecnológica y no una editorial.Encontró al narrador dentro de las filas de Yembo: Hansard es un gerente de producto empleado por Yembo y ex actor profesional.Ella es elegible para el SAG, pero no es miembro del sindicato.

"La alternativa (a la IA) no era nada", afirmó.Con nada, explicó, se refería a no realizar traducciones ni contratar narradores en varios idiomas.

En una entrevista desde Los Ángeles, Hansard habló sobre lo extraño de escuchar su clon vocal.Este es su primer audiolibro, tanto en inglés como traducido.

"Es casi discordante escuchar mihablando idiomas que nunca antes había hablado, pero también es sorprendente que exista esta posibilidad", dijo.

Se sentía cómoda con el proyecto porque tenía la seguridad de que no quitaría trabajo a otros.

"Creo que el mejor resultado sería que la IA no reemplace a los actores humanos ni a las voces humanas", dijo Hansard."Sólo complementa si no hubiera sido posible sin él".

Continuó: "Creo que ahí es donde todos tendrán que profundizar en su humanidad para asegurarse de que la IA no reemplace a la humanidad. Que sólo mejore... si algo no fuera posible, entonces llenará el vacío".".

2024 El Union-Tribune de San Diego.Distribuido por Tribune Content Agency, LLC.

Citación:Los libros narrados por IA ya están aquí: ¿Están los humanos sin trabajo?(2024, 13 de marzo)recuperado el 5 de agosto de 2024de https://techxplore.com/news/2024-03-ai-narated-humans-job.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.