No hay día que no tengamos una noticia o varias relacionadas con la inteligencia artificial. No hay campo que se escape a los tentáculos de OpenAI, la principal empresa en este campo, y ahora le ha tocado al podcasting. ¿Te imaginas hacer un podcast en español y que se traduzca automáticamente a varias docenas de idiomas para que todo el mundo pueda escucharte? ¿Eres un experto en voley playa? Tu podcast podría ser el número uno mundial sin que tú supieras ni una pizca de alemán o de italiano. ¿A que suena interesante?
Spotify, el gigante de la música en streaming, ha marcado un hito revolucionario en el mundo del podcasting gracias a su alianza con OpenAI. Las voces de reconocidos podcasters serán clonadas por inteligencia artificial para traducirlas a diferentes idiomas, eliminando así barreras lingüísticas y permitiendo que su contenido sea accesible a un público más amplio.
Una reciente noticia en The Verge nos coloca nuevamente en un debate ético y tecnológico sobre las IA. La tecnología encargada de llevar a cabo este asombroso proceso es Whisper, una invención de OpenAI. Originalmente diseñada como una herramienta de transcripción, ahora se encargará de la traducción de voz a voz para Spotify. La promesa es simple: sintetizar la voz del presentador y reproducirla «hablando» en la traducción, manteniendo una calidad y autenticidad cercanas a la voz original.
Ziad Sultan, vicepresidente de personalización de Spotify, destacó que esta característica permitirá que oyentes de todo el mundo se «inspiren con los podcasters de una manera más auténtica». Si bien puede ser un desafío entender cómo una voz sintetizada podría ser considerada «más auténtica» que la original, lo cierto es que la tecnología está avanzando a pasos agigantados en cuanto a la calidad de reproducción de estas voces.
El movimiento de Spotify puede considerarse estratégico y visionario. Es innegable que los podcasts están experimentando un renacimiento, con una popularidad incluso mayor que en sus primeros días impulsados por Apple y el iPod. En este contexto, la propuesta de Spotify se destaca. Si bien es cierto que ha habido recortes en su división de podcasts y no todos los anuncios de contenidos exclusivos se han concretado, hoy en día su oferta es sumamente atractiva.
La implementación de Whisper, combinada con la tecnología propia de Spotify, marca un antes y un después. Ya no sólo se trata de transcribir audio, sino de traducirlo y luego usar una solución de síntesis de voz para replicar el contenido original en otro idioma, preservando la esencia de la voz del creador.
Además, Spotify ya ha comenzado a poner a prueba esta función, trabajando con varios creadores cuyos contenidos ya están disponibles en español y pronto lo estarán en francés y alemán. Aunque los resultados iniciales no son perfectos, son sorprendentemente naturales y superan a otras soluciones de texto a voz existentes.
Spotify se ha reinventado continuamente. Su apuesta por el podcasting ha sido notable, y ahora, con la incorporación de la inteligencia artificial para traducción, se posiciona en la vanguardia de la innovación. Esta colaboración con OpenAI, líder indiscutible en el mundo de la IA, lleva a la plataforma a un nivel superior. Una de las funcionalidades más prometedoras es que los usuarios pueden activar el doblaje automático con su propia voz, brindando una experiencia personalizada.
No obstante, la utilización de esta tecnología también plantea preocupaciones éticas. El potencial para actores maliciosos de imitar voces de figuras públicas o cometer fraudes es real. Es crucial que se tomen medidas para garantizar la seguridad y la privacidad de los usuarios y creadores.