IA y Tecnología

Google Gemini está equipado con 'Lyria 3', que crea música con texto e imágenes

El último modelo de creación musical capaz de crear pistas de 30 segundos, integrado oficialmente en la app Gemini

AI Reporter Alpha··4 min de lectura·
구글 제미나이, 텍스트·이미지로 음악 만드는 'Lyria 3' 탑재
Resumen
  • Google DeepMind ha instalado el último modelo de creación musical, Lyria 3, en la aplicación Gemini.
  • Puedes crear una pista de música de 30 segundos simplemente ingresando texto o imágenes.
  • Se espera que la competencia por las funciones multimodales de los asistentes de IA se expanda al área del audio.

Conclusión clave: agregue la funcionalidad de creación de música a la aplicación Gemini

Google DeepMind ha instalado el último modelo de creación musical 'Lyria 3' en su aplicación Gemini, asistente de inteligencia artificial. Esto permite a los usuarios crear pistas de música de 30 segundos utilizando únicamente mensajes de texto o imágenes.

Lyria 3 es el modelo de creación musical más avanzado desarrollado por Google DeepMind y está diseñado para permitir que cualquiera pueda crear su propia música sin ningún conocimiento musical o experiencia en composición. Si describe el estado de ánimo o género deseado en texto o carga una imagen, la IA compondrá automáticamente música que coincida con la emoción de la imagen.

Por qué es importante: escalamiento multimodal de la IA generativa

Esta actualización es un ejemplo que muestra que la IA generativa se está expandiendo más allá del texto y las imágenes hacia el área de audio. El Gemini existente ha demostrado fortalezas en la generación de texto, análisis de imágenes y escritura de códigos, pero la incorporación de la función de creación musical ha ampliado enormemente su rango de uso como herramienta creativa.

En particular, se espera que acelere la democratización de la creación en el sentido de que incluso los usuarios comunes sin software de producción musical (DAW) profesional o la capacidad de tocar instrumentos musicales puedan crear música solo con sus ideas. Los creadores de contenido, usuarios de redes sociales, productores de videos, etc. pueden crear fácilmente música de fondo (BGM).

Comparación del panorama competitivo: estado del mercado de generación de música con IA

servicioDesarrolladorlongitud máxima de creaciónMétodo de entradaIntegración de plataforma
Lyria 3 (Géminis)Google DeepMind30 segundostexto, imagenAplicación Géminis
SunoSuno AIHasta 4 minutostextoWeb, API
AudioAudioHasta 2 minutostextoweb
MúsicaLMGoogle20 segundostextolanzamiento experimental
Audio estableEstabilidad IAHasta 3 minutostextoWeb, API

El límite de tiempo de 30 segundos de Lyria 3 es más corto que el de los servicios de la competencia, pero se diferencia en términos de accesibilidad porque está directamente integrado en la aplicación Gemini y se puede usar inmediatamente sin registrarse en un servicio separado. Además, la creación de música basada en imágenes es una característica única que no ofrecen servicios de la competencia como Suno y Udio.

Flujo de desarrollo de Lyria

El desarrollo de la inteligencia artificial musical de Google DeepMind comenzó en serio con el lanzamiento de MusicLM en 2023. MusicLM es uno de los primeros modelos para convertir texto en música y se lanzó de forma limitada con fines de investigación académica. Posteriormente, el modelo Lyria se anunció en 2024 y se aplicó a 'Dream Track', una herramienta de experimentos musicales de inteligencia artificial en la plataforma YouTube.

Este Lyria 3 es la versión de tercera generación de esta tecnología y es el primero que se instala oficialmente en la aplicación Gemini para consumidores generales. Esto significa que Google ha hecho la transición de su tecnología de creación musical con IA de la etapa experimental a la etapa de servicio público.

[Análisis de IA] Perspectivas e implicaciones futuras

Es probable que la integración Gemini de Lyria 3 afecte al mercado de varias maneras.

En primer lugar, la competencia por las funciones de asistente de IA se está intensificando. Competidores como OpenAI, Microsoft y Meta también tienen mayores incentivos para integrar funciones de creación musical en sus plataformas de IA. En particular, OpenAI ha realizado recientemente pocos movimientos públicos relacionados con la IA musical después de Jukebox, pero se espera que aumente la presión competitiva.

En segundo lugar, están surgiendo cuestiones de derechos de autor y regalías. Es muy probable que se discutan en serio las cuestiones de la atribución de derechos de autor a la música generada por IA y la compensación por la música existente utilizada como datos de aprendizaje. La industria de la música ya ha expresado su preocupación por el aprendizaje de la IA y la popularización de Lyria 3 podría acelerar estos debates.

En tercer lugar, los cambios en el ecosistema de creadores. El límite de 30 segundos está exactamente en línea con la demanda de música de fondo para contenido de formato corto (Reels, TikTok, YouTube Shorts). Es probable que los creadores que anteriormente utilizaban bibliotecas de música libres de derechos de autor o servicios de música en stock pasen a la música generada por IA, y se espera una reorganización del mercado relacionado.

Actualmente, Google no ha revelado más detalles, incluida la región exacta de lanzamiento de Lyria 3, la política de precios y si la música producida estará disponible para uso comercial. También existe la posibilidad de que se agreguen funciones de expansión de la duración de la creación y de edición más detalladas a través de futuras actualizaciones.

Compartir

댓글 (2)

용감한구름8시간 전

Google 관련 기사 잘 읽었습니다. 유익한 정보네요.

따뜻한돌고래8시간 전

Gemini에 대해 더 알고 싶어졌습니다. 후속 기사 부탁드립니다.

Más de esta serie

Más en IA y Tecnología

Últimas noticias