Google Gemini está equipado con 'Lyria 3', que crea música con texto e imágenes
El último modelo de creación musical capaz de crear pistas de 30 segundos, integrado oficialmente en la app Gemini

- •Google DeepMind ha instalado el último modelo de creación musical, Lyria 3, en la aplicación Gemini.
- •Puedes crear una pista de música de 30 segundos simplemente ingresando texto o imágenes.
- •Se espera que la competencia por las funciones multimodales de los asistentes de IA se expanda al área del audio.
Conclusión clave: agregue la funcionalidad de creación de música a la aplicación Gemini
Google DeepMind ha instalado el último modelo de creación musical 'Lyria 3' en su aplicación Gemini, asistente de inteligencia artificial. Esto permite a los usuarios crear pistas de música de 30 segundos utilizando únicamente mensajes de texto o imágenes.
Lyria 3 es el modelo de creación musical más avanzado desarrollado por Google DeepMind y está diseñado para permitir que cualquiera pueda crear su propia música sin ningún conocimiento musical o experiencia en composición. Si describe el estado de ánimo o género deseado en texto o carga una imagen, la IA compondrá automáticamente música que coincida con la emoción de la imagen.
Por qué es importante: escalamiento multimodal de la IA generativa
Esta actualización es un ejemplo que muestra que la IA generativa se está expandiendo más allá del texto y las imágenes hacia el área de audio. El Gemini existente ha demostrado fortalezas en la generación de texto, análisis de imágenes y escritura de códigos, pero la incorporación de la función de creación musical ha ampliado enormemente su rango de uso como herramienta creativa.
En particular, se espera que acelere la democratización de la creación en el sentido de que incluso los usuarios comunes sin software de producción musical (DAW) profesional o la capacidad de tocar instrumentos musicales puedan crear música solo con sus ideas. Los creadores de contenido, usuarios de redes sociales, productores de videos, etc. pueden crear fácilmente música de fondo (BGM).
Comparación del panorama competitivo: estado del mercado de generación de música con IA
| servicio | Desarrollador | longitud máxima de creación | Método de entrada | Integración de plataforma |
|---|---|---|---|---|
| Lyria 3 (Géminis) | Google DeepMind | 30 segundos | texto, imagen | Aplicación Géminis |
| Suno | Suno AI | Hasta 4 minutos | texto | Web, API |
| Audio | Audio | Hasta 2 minutos | texto | web |
| MúsicaLM | 20 segundos | texto | lanzamiento experimental | |
| Audio estable | Estabilidad IA | Hasta 3 minutos | texto | Web, API |
El límite de tiempo de 30 segundos de Lyria 3 es más corto que el de los servicios de la competencia, pero se diferencia en términos de accesibilidad porque está directamente integrado en la aplicación Gemini y se puede usar inmediatamente sin registrarse en un servicio separado. Además, la creación de música basada en imágenes es una característica única que no ofrecen servicios de la competencia como Suno y Udio.
Flujo de desarrollo de Lyria
El desarrollo de la inteligencia artificial musical de Google DeepMind comenzó en serio con el lanzamiento de MusicLM en 2023. MusicLM es uno de los primeros modelos para convertir texto en música y se lanzó de forma limitada con fines de investigación académica. Posteriormente, el modelo Lyria se anunció en 2024 y se aplicó a 'Dream Track', una herramienta de experimentos musicales de inteligencia artificial en la plataforma YouTube.
Este Lyria 3 es la versión de tercera generación de esta tecnología y es el primero que se instala oficialmente en la aplicación Gemini para consumidores generales. Esto significa que Google ha hecho la transición de su tecnología de creación musical con IA de la etapa experimental a la etapa de servicio público.
[Análisis de IA] Perspectivas e implicaciones futuras
Es probable que la integración Gemini de Lyria 3 afecte al mercado de varias maneras.
En primer lugar, la competencia por las funciones de asistente de IA se está intensificando. Competidores como OpenAI, Microsoft y Meta también tienen mayores incentivos para integrar funciones de creación musical en sus plataformas de IA. En particular, OpenAI ha realizado recientemente pocos movimientos públicos relacionados con la IA musical después de Jukebox, pero se espera que aumente la presión competitiva.
En segundo lugar, están surgiendo cuestiones de derechos de autor y regalías. Es muy probable que se discutan en serio las cuestiones de la atribución de derechos de autor a la música generada por IA y la compensación por la música existente utilizada como datos de aprendizaje. La industria de la música ya ha expresado su preocupación por el aprendizaje de la IA y la popularización de Lyria 3 podría acelerar estos debates.
En tercer lugar, los cambios en el ecosistema de creadores. El límite de 30 segundos está exactamente en línea con la demanda de música de fondo para contenido de formato corto (Reels, TikTok, YouTube Shorts). Es probable que los creadores que anteriormente utilizaban bibliotecas de música libres de derechos de autor o servicios de música en stock pasen a la música generada por IA, y se espera una reorganización del mercado relacionado.
Actualmente, Google no ha revelado más detalles, incluida la región exacta de lanzamiento de Lyria 3, la política de precios y si la música producida estará disponible para uso comercial. También existe la posibilidad de que se agreguen funciones de expansión de la duración de la creación y de edición más detalladas a través de futuras actualizaciones.
댓글 (2)
Google 관련 기사 잘 읽었습니다. 유익한 정보네요.
Gemini에 대해 더 알고 싶어졌습니다. 후속 기사 부탁드립니다.
Más de esta serie
Más en IA y Tecnología

La NASA otorga un contrato de 180 millones de dólares a Intuitive Machines para explorar el polo sur lunar

El satélite conjunto NISAR de NASA-ISRO captura la primera imagen de radar del Monte Rainier

El satélite conjunto NISAR de NASA-ISRO captura el volcán St. Helens a través de las nubes

La NASA planea lanzar una misión experimental de órbita baja equipada con 7 pequeños satélites

La NASA selecciona a 10 científicos para apoyar la exploración del polo sur lunar Artemis

La NASA busca la adquisición privada del servicio de retransmisión en banda Ka 'Nexus' para reemplazar satélites obsoletos
Últimas noticias

Oh Se-hoon: "Elegiría 5º Mandato como Alcalde de Seúl Antes que la Presidencia"
El alcalde de Seúl Oh Se-hoon afirma que elegiría un 5º mandato antes que la presidencia

BTS alcanza el No. 1 en Billboard 200 con 'Arirang'—Séptimo álbum en la cima
La nueva canción 'Arirang' de BTS alcanza el No. 1 en la lista Billboard 200 de EE.UU.

Tres arrestados en París tras intento de ataque con bomba cerca de Bank of America
Tres sospechosos arrestados tras intento de ataque con bomba cerca de sucursal de Bank of America en París

Tres periodistas muertos en ataque israelí en sur del Líbano, cientos lloran en Beirut
Tres periodistas asesinados en ataque dirigido israelí en sur del Líbano

Dos estados australianos ofrecen transporte público gratuito ante el aumento de precios de combustible por guerra de Irán
Victoria y Tasmania implementan transporte público gratuito en respuesta al aumento de precios de combustible por la guerra de Irán

Misil iraní impacta zona industrial del sur de Israel: gran incendio y fuga de materiales peligrosos
Misil balístico iraní impacta directamente zona industrial del sur de Israel, causando gran incendio

Trump Comparte Carta de Pastor en Medio de Guerra con Irán: "Bienaventurados los Pacificadores"
Presidente Trump comparte carta pastoral en aniversario de un mes de guerra con Irán

Dimite el jefe del fútbol africano en medio de la polémica por la final Marruecos-Senegal
El Secretario General de la CAF, Veron Mosengo-Omba, dimite en medio de la polémica por la final Marruecos-Senegal