Crearon en Bariloche un sistema que cambia la voz con Inteligencia Artificial

Dos jóvenes de Río Negro desarrollaron una plataforma capaz de "segmentar los componentes del habla" y a partir de esto modificar voces

El proyecto apunta a ayudar a las empresas audiovisuales

Agregá BAE Negocios como fuente preferida

La Inteligencia Artificial dio grandes pasos este año a nivel mundial, por ejemplo al ayudar a Google a crear el pronóstico del tiempo más preciso del mundo, entre otros avances. Ahora, en Bariloche, dos ingenieros del Instituto Balseiro desarrollaron un sistema que modifica voces en cuestión de "milisegundos".

El proyecto segmenta componentes del habla como el mensaje, la emoción y el acento. Los jóvenes elaboraron una plataforma que permite a los usuarios modificar su voz en cualquier computadora sin necesidad de que sea un equipo potente.

"En el milisegundo que vos hablás, sale el audio", explicó uno de los fundadores del sistema, Julian Ñener. Gracias a este proyecto, Ñener y su compañero Raúl Sosa obtuvieron el primer puesto del Concurso IB50K 2023, organizado por el propio Instituto Balseiro, que reparte 50 mil dólares en premios.

Neuralwave, una solución para videojuegos, TV y películas

Neñer sostuvo que su sistema, denominado Neuralwave, es una solución para, por ejemplo, las grandes productoras de videojuegos, TV y películas, "que tienen el problema de que gastan entre el 5% y el 15% de sus presupuestos en contratar a equipos numerosos de actores de voz", además permitirá acortar las demoras de estos procesos.

En el caso del "gaming", donde es común que haya pequeños productores, con este sistema "un solo usuario puede hacer todas las voces distintas y reducir tiempos y costos en la producción del juego", ejemplificó.

El sistema también posibilita editar solo el componente de emoción o el acento, sin cambiar la voz. Así, en una película o serie, podría modificarse una voz para que hable en otro idioma, pero sin dejar de ser esa voz.

A quiénes afecta este proyecto

El peligro de este desarrollo

El aporte de este tipo de desarrollos al ahorro de tiempo y dinero, para realizadores y productores, tiene una contraparte en cuanto a la "pérdida de profesionalidad de la voz" y de puestos de trabajo, cuestionan desde el sector de la locución y los profesionales del doblaje.

“Está poniendo en manos del público general programas que permiten clonar voces y no pagar por esa clonación", advirtió a Télam Sergio Colman, secretario general de la Sociedad Argentina de Locutores y Conductores (SALCO).

El uso de estos programas "va a tender a suplantar la voz del locutor", dado que "le ponés cualquier voz, en cualquier idioma, y no contempla la propiedad intelectual ni el usuario, que son cuestiones que están reguladas por la actividad profesional”, agregó.

En lo que respecta a los derechos y permisos de los dueños de las voces, "somos éticos, estamos de acuerdo con la ética de la IA, y no liberamos al público la tecnología de clonación", aseguró Neñer.

Y aclaró que en caso de ser una necesidad de un cliente, pueden "obtener la voz de una persona en particular, consiguiendo los permisos necesarios o pagando incluso regalías, si es algún actor de voz conocido o algún actor de voz que se busque en particular".

Cómo surgió Neuralwave

La idea de realizar esta plataforma surgió del contacto de Ñener y Sosa con pequeños desarrolladores de videojuegos: "Nos comentaron que tenían este problema y a nosotros se nos ocurrió: ‘Bueno, ¿qué tal si le pudiéramos dar cualquier voz a cualquier persona?’", recordó Neñer.

"Estuvimos mirando que no existían buenas soluciones con inteligencia artificial de voz", contó, y diferenció el proceso que emplea su sistema con el de "texto a voz".

El "voz a voz" permite un mayor control y por eso mismo este emprendimiento apunta al tipo de productoras que requieren "voces altamente emocionales", ejemplificó.

Esta nota habla de:

¡Seguinos!

Crearon en Bariloche un sistema que cambia la voz con Inteligencia Artificial

Dos jóvenes de Río Negro desarrollaron una plataforma capaz de "segmentar los componentes del habla" y a partir de esto modificar voces