Con voces de muertos, presidentes o actores, la inteligencia artificial reconfigura el negocio de los audiolibros
La tecnología permitió que libros enteros sean leídos por una voz sintética entrenada por personas reales, tanto vivas como muertas. Pese a que el mercado crece, muchos temen quedarse sin trabajo
Aunque no es tan visto, el mundo de los audiolibros y los actores de voz es gigante. Desde doblajes hasta novelas enteras, son cientos de personas las que participan de una industria que tomó una nueva relevancia con los podcast. Con la llegada de la Inteligencia Artificial (IA), el sector se enfrenta a una enorme disyuntiva: ¿crecerá o se volverá más chico?
Dentro de poco, quienes escuchen audiolibros no sabrán si la voz detrás del archivo corresponde a una persona o a un robot. Habrá algunos que oirán la voz de un actor que murió hace mucho, pero que lee un libro publicado después de su fallecimiento. La IA generativa, hoy de moda por el ChatGPT y las imágenes de Midjourney o DALL-E, también funciona para las voces. Y, allí, tiene un enorme universo todavía sin explotar.
Empresas como DeepZen lograron desarrollar una IA que replica a la perfección las voces humanas, a tal punto que es imposible distinguir una grabación de una persona de una del modelo de voz. Con ella, grabaron más de 100 audiolibros y esperan grabar muchos más.
Para la tecnología, DeepZen contrató a más de 30 actores profesionales para ayudar a su motor de inteligencia artificial a capturar todos los rangos de la emoción humana. El procedimiento era igual para todos: que leyeran en su idioma un mismo libro, primero con enojo, después con disgusto, luego con humor, más tarde con dramatismo y así sucesivamente.
El potencial es enorme, pero en la realidad ya hay evidencias. Miles de audiolibros narrados por IA —entrenadas con voces humanas— están disponibles en mercados populares como Google Play Books y Apple Books. Amazon, en cambio, no ofrece ninguno por ahora. Aunque la empresa fundada por Jeff Bezos es dueña de Audible, el servicio de audiolibros más grande de Estados Unidos, ya está evaluando su posición sobre la IA.
Las editoriales más grandes, por ahora, no la necesitan. Sin embargo, los autores más pequeños encuentran en la voz generada por IA una opción muy barata para dar a conocer su obra, contrario a la contratación de un servicio que ronda los 5.000 dólares.
De cara a lo que se viene, la iniciativa encuentra cada vez más consenso. El motor de inteligencia artificial creado por DeepZen utiliza un software de aprendizaje automático que replica cómo habla una persona, así como las características de la voz de esa persona. Puede agregar emoción y enfocarse en palabras difíciles de pronunciar, como nombres de personajes en novelas de ciencia ficción o las ciudades más pequeñas de China, dijo Kamis. “Es más fácil que usar un narrador humano”, dijo el CEO de DeepZen, Taylan Kamis, al Wall Street Journal (WSJ).
Y por si eso no era suficiente, también está el generador de voz de TikTok, entre muchos otros. En la red social se volvieron tendencia los videos en los que Donald Trump, Barack Obama y Joe Biden jugaban videojuegos juntos mientras charlaban mediante Discord. El resultado es muy gracioso pero, también, muy realista.
Así como en la profecía que hizo el autor Roald Dahl sobre el ChatGPT, muchos temen que la IA deje sin trabajo a los actores de voz. “Por lo que puedo ver, los narradores humanos se están volviendo locos”, dijo al WSJ Dima Abramov, directora ejecutiva de Speechki, una productora de audiolibros con sede en Austin, Texas, que utiliza voces narradas sintéticamente.
El Michigan Press, por ejemplo, creó alrededor de 100 audiolibros con la plataforma gratuita de narración automática de Google. La nueva tecnología hizo posible esos títulos porque eliminó los costos asociados con el uso de un estudio de producción, personal de apoyo y narradores humanos. En términos económicos, la IA parece ser una solución para los sueldos. Además de eso, hay otro ítem clave: DeepZen adquirió los derechos de Edward Herrmann, un actor de voz prolífico que murió hace casi una década, y grabó muchos audiolibros con su voz. Ni siquiera necesitaron de un actor vivo para la narración.
Sin embargo, los actores de voz no creen que su trabajo vaya a desaparecer. Audible declaró que "la narración profesional siempre fue y seguirá siendo fundamental para la experiencia auditiva" de la compañía, y que ven "un futuro en el que las actuaciones humanas y el contenido generado de texto a voz pueden coexistir".
Scott Brick, narrador de más de 1.000 audiolibros de autores como Tom Clancy y Nelson DeMille, dijo al WSJ que la narración automática de IA es más adecuada para títulos de no ficción, donde los narradores y los lectores no están tan involucrados emocionalmente como con las obras de ficción. “Hay realismo ahí, pero no hay alma”, afirmó.
“No creemos que las interrupciones sean inmanejables para el locutor profesional”, opinó, en esta línea, el consejero general del Screen Actors Guild-American Federation of Television and Radio Artists, un sindicato nacional que representa a los artistas, Jeffrey Bennett. "Todo lo que estamos viendo y escuchando ahora mejorará cada vez más", agregó.
Un mercado que creceLos audiolibros en español, a diferencia de lo que pasa en Estados Unidos, no paran de crecer. El informe “Spanish Audio Markets Growth Report (2017-2022)”, elaborado por DosDoce, pronosticó que a finales de este año habrá más de 25.000 audiolibros y 100.000 podcasts en español gracias a un mercado cada vez más demandante. Actualmente hay más de 20.000 audiolibros y 100.000 podcasts en español en oferta frente a los escasos miles de hace tan solo unos años.
Además, la inversión de las principales plataformas de audio pago invirtieron más de 50 millones de dólares en los últimos cinco años en busca de captar la atención de sus potenciales usuarios. Se prevé que el mercado de los audiolibros en español en los próximos años llegue a 26.6 millones de oyentes en 2026, generando unos ingresos de 632 millones de dólares en los mercados españoles a través de publicidad, contenido de marca, ingresos derivados de suscripciones y más.
Y aunque eventualmente los audiolibros narrados por IA llegarán, quien quiere buscar cuentos o libros que le sean leídos tendrá que dar con algunos programas de radio que se suben a internet. Algunos, como El Pez Soluble, que se transmite de lunes a viernes por la AM 750 por Radio Nacional Córdoba, con la conducción Jorge Chacho Marzetti, un lector que puede sorprender por su estilo con algunos escritores, como el ritmo que encontró para leer a Jorge Luis Borges.
Otros, como Jorge Echavarría, lee clásicos de la literatura universal con una voz impactante en Literatura para oír, que se emite por Radio Bolivariana, de la Universidad Pontificia Bolivariana. Opciones hoy hay muchas. ¿Qué pasará en el futuro? Por ahora, nadie lo sabe.
- Com.Ven.Var. %
- Com.Ven.Var. %

