EL NUEVO MODELO DE IA GENERATIVA DE META PUEDE TOMAR ACUERDOS O RITMOS Y CONVERTIRLOS EN CANCIONES


 Entre los cada vez más numerosos rivales en el campo de la generación de música con inteligencia artificial se encuentra Meta Platforms, propietario de Facebook e Instagram, cuyo grupo de investigación de IA reveló su desarrollo más reciente el martes 18 de junio.


El primer vistazo de JASCO, una herramienta capaz de tomar acordes o ritmos y convertirlos en canciones musicales completas, provino del equipo de Investigación Fundamental de IA (FAIR) de Meta.


Meta afirma que esta capacidad permitirá a los productores de herramientas musicales de IA tener más control sobre la producción.


Comparable en calidad a otras herramientas de inteligencia artificial, JASCO, "Acondicionamiento conjunto de audio y símbolo para la generación de texto a música controlada temporalmente", "permite controles significativamente mejores y más versátiles sobre la música generada", dijo Meta FAIR en una publicación de blog.


Meta creó una página de clips musicales que destacan los talentos de JASCO, convirtiendo melodías básicas de dominio público en canciones musicales.


Por ejemplo, una melodía de Maurice Ravel Bolero se convierte en una "canción pop de los 80" y una "canción popular con acordeón y guitarra acústica". Swan Lake de Tchaikovsky se convierte en una "pista tradicional china con guzheng, percusión y flauta de bambú" y una "pista de R&B con bajo profundo, batería electrónica y trompeta solista".


"A medida que la innovación en el campo continúa avanzando a un ritmo rápido", decimos, "creemos que la colaboración con la comunidad global de IA es más importante que nunca".


meta


Meta ha estado publicando una buena cantidad de su investigación sobre inteligencia artificial para uso público. La firma ha publicado un artículo de investigación que detalla el trabajo con JASCO; A finales de este mes tiene la intención de proporcionar el modelo JASCO previamente entrenado bajo una licencia Creative Commons y el código de inferencia bajo una licencia MIT. De este modo, otros desarrolladores de inteligencia artificial podrán utilizar el modelo para producir sus propias herramientas.


"Creemos que trabajar con la comunidad mundial de IA es más crucial que nunca a medida que la innovación en el campo sigue acelerándose", añadió Meta FAIR.


Un año después de que Meta presentara MusicGen, un generador de texto a audio capaz de producir melodías de 12 segundos a partir de señales de texto básicas, la creación más reciente está aquí.


Junto con 390.000 grabaciones de instrumentos de Shutterstock y Pond5, esa herramienta se enseñó con 20.000 horas de música con licencia Meta destinada al entrenamiento de inteligencia artificial.


Además de poder utilizar melodías como entrada, se dice que MusicGen es el primer programa de inteligencia artificial musical capaz de transformar una melodía en una canción completamente completa.


JASCO de Meta sigue numerosos desarrollos en la escena musical de IA que han salido a la luz últimamente.


DeepMind, el equipo de inteligencia artificial de Google, anunció una nueva herramienta de vídeo a audio (V2A) capaz de producir bandas sonoras para vídeo el mismo día que Meta reveló JASCO. Las indicaciones de texto permiten a los usuarios decirle al programa qué tipo de sonido quieren para el vídeo; Alternativamente, la herramienta puede generar ruidos dependiendo de lo que revele el video.


DeepMind dijo que esto es absolutamente esencial para producir material de video utilizando simplemente técnicas de inteligencia artificial. Por lo general, los creadores de vídeos con inteligencia artificial sólo producen vídeos silenciosos.


La empresa detrás del conocido generador de arte de IA Stable Diffusion, Stability AI, presentó la semana pasada Stable Audio Open, un modelo gratuito de código abierto para generar grabaciones de audio de hasta 47 segundos de duración.


Diseñado para la producción de sonidos adecuados para su uso en canciones o para otros fines distintos de la creación de canciones, el programa ayuda a los usuarios a personalizar el producto utilizando sus propios datos de audio personales.


Un baterista podría enseñar el modelo en sus propios discos de batería, por ejemplo, produciendo así ritmos frescos y distintivos a su manera.


Este tipo de tecnologías de inteligencia artificial se diferencian de las plataformas de música de inteligencia artificial como Udio y Suno, que producen pistas completas a partir de nada más que señales de texto.


Estas tecnologías, que normalmente se basan en grandes cantidades de datos, se han convertido en un motivo de preocupación para el negocio de la música, ya que han sido entrenadas con música protegida por derechos de autor sin permiso.

Entre los cada vez más numerosos rivales en el campo de la generación de música con inteligencia artificial se encuentra Meta Platforms, propietario de Facebook e Instagram, cuyo grupo de investigación de IA reveló su desarrollo más reciente el martes 18 de junio.


El primer vistazo de JASCO, una herramienta capaz de tomar acordes o ritmos y convertirlos en canciones musicales completas, provino del equipo de Investigación Fundamental de IA (FAIR) de Meta.


Meta afirma que esta capacidad permitirá a los productores de herramientas musicales de IA tener más control sobre la producción.


Comparable en calidad a otras herramientas de inteligencia artificial, JASCO, "Acondicionamiento conjunto de audio y símbolo para la generación de texto a música controlada temporalmente", "permite controles significativamente mejores y más versátiles sobre la música generada", dijo Meta FAIR en una publicación de blog.


Meta creó una página de clips musicales que destacan los talentos de JASCO, convirtiendo melodías básicas de dominio público en canciones musicales.


Por ejemplo, una melodía de Maurice Ravel Bolero se convierte en una "canción pop de los 80" y una "canción popular con acordeón y guitarra acústica". El lago de los cisnes de Tchaikovsky se convierte en una "pista tradicional china con guzheng, percusión y flauta de bambú" y una "pista de R&B con bajos profundos, batería electrónica y trompeta solista".


"A medida que la innovación en el campo continúa avanzando a un ritmo rápido", decimos, "creemos que la colaboración con la comunidad global de IA es más importante que nunca".


meta


Meta ha estado publicando una buena cantidad de su investigación sobre inteligencia artificial para uso público. La firma ha publicado un artículo de investigación que detalla el trabajo con JASCO; A finales de este mes tiene la intención de proporcionar el modelo JASCO previamente entrenado bajo una licencia Creative Commons y el código de inferencia bajo una licencia MIT. De este modo, otros desarrolladores de inteligencia artificial podrán utilizar el modelo para producir sus propias herramientas.


"Creemos que trabajar con la comunidad mundial de IA es más crucial que nunca a medida que la innovación en el campo sigue acelerándose", añadió Meta FAIR.


Un año después de que Meta presentara MusicGen, un generador de texto a audio capaz de producir melodías de 12 segundos a partir de señales de texto básicas, la creación más reciente está aquí.


Junto con 390.000 grabaciones de instrumentos de Shutterstock y Pond5, esa herramienta se enseñó con 20.000 horas de música con licencia Meta destinada al entrenamiento de inteligencia artificial.


Además de poder utilizar melodías como entrada, se dice que MusicGen es el primer programa de inteligencia artificial musical capaz de transformar una melodía en una canción completamente completa.


JASCO de Meta sigue numerosos desarrollos en la escena musical de IA que han salido a la luz últimamente.


DeepMind, el equipo de inteligencia artificial de Google, anunció una nueva herramienta de vídeo a audio (V2A) capaz de producir bandas sonoras para vídeo el mismo día que Meta reveló JASCO. Las indicaciones de texto permiten a los usuarios decirle al programa qué tipo de sonido quieren para el vídeo; Alternativamente, la herramienta puede generar ruidos dependiendo de lo que revele el video.


DeepMind dijo que esto es absolutamente esencial para producir material de video utilizando simplemente técnicas de inteligencia artificial. Por lo general, los creadores de vídeos con inteligencia artificial sólo producen vídeos silenciosos.


La empresa detrás del conocido generador de arte de IA Stable Diffusion, Stability AI, presentó la semana pasada Stable Audio Open, un modelo gratuito de código abierto para generar grabaciones de audio de hasta 47 segundos de duración.


Diseñado para la producción de sonidos adecuados para su uso en canciones o para otros fines distintos de la creación de canciones, el programa ayuda a los usuarios a personalizar el producto utilizando sus propios datos de audio personales.


Un baterista podría enseñar el modelo en sus propios discos de batería, por ejemplo, produciendo así ritmos frescos y distintivos a su manera.


Este tipo de tecnologías de inteligencia artificial se diferencian de las plataformas de música de inteligencia artificial como Udio y Suno, que producen pistas completas a partir de nada más que señales de texto.


Estas tecnologías, que normalmente se basan en grandes cantidades de datos, se han convertido en un motivo de preocupación para el negocio de la música, ya que han sido entrenadas con música protegida por derechos de autor sin permiso.

Publicar un comentario

Artículo Anterior Artículo Siguiente