Otro sobresalto más gracias a la inteligencia artificial. Hay que reconocer que desde hace dos años esto es un sinvivir y no hay día en el que no tengamos una noticia que nos ponga a cavilar.
En el ámbito de la tecnología y la inteligencia artificial (IA), pocas cosas parecen tan futuristas y, a la vez, tan actuales como la clonación de voz. OpenAI, la compañía respaldada por Microsoft y creadora del famoso chatbot generativo ChatGPT, ha sido protagonista de una revelación que bien podría parecer sacada de una novela de ciencia ficción: su tecnología de clonación de voz necesita tan solo 15 segundos de material de audio para reproducir una voz humana con una precisión sorprendente.
Esta hazaña es posible gracias a un modelo denominado Voice Engine, que OpenAI ha estado desarrollando desde finales de 2022. Alimentado por un mínimo de 15 segundos de material hablado, el Voice Engine es capaz de crear lo que la compañía describe como un habla «emotiva y realista» que se asemeja estrechamente al hablante original. Es una proeza técnica sin duda, pero que no está exenta de controversias y desafíos éticos.
OpenAI es plenamente consciente del potencial para el mal uso de la voz sintética y ha adoptado un enfoque cauteloso e informado para su lanzamiento más amplio. El objetivo es iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades. La preocupación no es infundada, ya que existen malas prácticas documentadas, como estafas en las que los criminales clonan una voz y luego llaman a un amigo o familiar de la víctima para engañarlos y conseguir que transfieran dinero. Además, hay temores sobre cómo dicha tecnología podría usarse en las elecciones presidenciales, destacados por incidentes recientes como las llamadas automatizadas utilizando una clonación de la voz del presidente Joe Biden.
Pero no todo es negativo en el horizonte de la clonación de voz. OpenAI señala aplicaciones positivas, como la asistencia de lectura para no lectores y niños, utilizando voces naturales y emotivas que representan una gama más amplia de oradores que lo que es posible con voces preestablecidas. También está la traducción instantánea de videos y podcasts, algo que Spotify ya está probando, y la posibilidad de ayudar a pacientes que están perdiendo su voz debido a una enfermedad a seguir comunicándose utilizando una voz que suena como la suya propia.
En la página web de OpenAI, hay ejemplos de audio generado por la IA que son extraordinarios y que evidencian el nivel de avance de esta tecnología.
Ante todo esto, surgen preguntas ineludibles sobre la ética y la regulación. ¿Cómo protegeremos la identidad vocal de las personas y cómo garantizaremos que el uso de sus voces clonadas no infrinja sus derechos? ¿Qué medidas se pueden tomar para evitar fraudes y engaños? Y desde el punto de vista profesional, ¿cómo afectará esta tecnología a los actores de voz y a las industrias que dependen de la autenticidad y el talento humano?
Ya sabíamos que con las herramientas de creación de imágenes, las fotografías a partir de ahora dejaban de ser pruebas fiables porque se podían generar mediante inteligencia artificial. Desde hace unos meses sabemos que las imágenes en vivo, el video, también se puede generar de forma artificial y de una manera tan realista que es casi imposible distinguirlo de un video grabado de forma tradicional. Ahora está nueva función de Voice Engine permite imitar exactamente el tono de voz, el acento y las emociones de otra persona. ¿Cómo reaccionarías tú si ahora mismo recibes una llamada por teléfono de una persona a la que tú identificas como un familiar tuyo, porque suena exactamente igual, y te pide que le envíes cualquier cosa, o aunque sea dinero, una pequeña transferencia o un Bizum para cualquier gastillo de emergencia? ¿Te engañaría? ¿Tendremos que crear mentalmente un nuevo patrón para, cuando recibamos una llamada solicitando algo, hacer una serie de preguntas de control para asegurarnos de que la persona que nos llama es realmente quien dice ser y no una voz clonada mediante inteligencia artificial? ¿Tenemos ya que dejar de creernos lo que vemos y lo que oímos? ¿Nos vamos a volver locos dudando de si lo que entra por nuestros ojos y nuestros oídos es real o es falso?
Los retos son enormes, pero también lo son las oportunidades. Es esencial que, como sociedad, emprendamos una reflexión seria sobre cómo queremos que estas herramientas modelen nuestro futuro. El potencial de la clonación de voz para hacer el bien es inmenso, pero solo si se maneja con un compromiso firme con la ética y la responsabilidad. OpenAI ha dado pasos hacia ese futuro, y ahora nos toca a todos participar en el diálogo sobre cómo estos avances deben integrarse en nuestro mundo. Con la mirada puesta en los beneficios que estos avances pueden aportar y con la precaución necesaria para evitar sus riesgos, el viaje hacia la próxima frontera de la IA promete ser tan emocionante como complejo.
Por supuesto, vete preparando para lo peor. Recuerda que cuando apareció Internet nos dijeron que iba a servir para tener toda la información del mundo en la punta de los dedos y que eso nos iba a permitir ser mejores personas y luego fíjate en la montaña de mi**da que es Internet hoy gracias a las redes sociales. Los avances tecnológicos sacan lo mejor y lo peor de nosotros y esto de poder clonar la voz no tiene muy buena pinta.