Stability AI lanza Stable Audio 3.0, su nueva IA gratuita que genera canciones de hasta 6 minutos en segundos

Stable Audio 3.0,

- STABLILITY AI

MADRID, 21 May. (Portaltic/EP) -

Stability AI ha anunciado el lanzamiento de Stable Audio 3.0, su nueva familia de modelos de texto a audio para música y sonidos de efectos entre los que se incluyen modelos de pesos abiertos, disponibles para usar de forma local en un PC.

Stable Audio 3 es la última generación de inteligencia artificial creada por Stability AI para la creación de sonido, y se caracteriza por usar una tecnología capaz de entender la estructura musical profunda. Permite generar audios de longitud variable (de hasta más de 6 minutos continuos en sus versiones más potentes) con calidad profesional (estéreo a 44.1 kHz.)

Desde su blog, de Stability AI ha anunciado la disponibilidad de esta IA y el despliegue de tres modelos de pesos abiertos en el repositorio Hugging Face, desde el que se pueden descargar, y en GitHub, con un repositorio optimizado específicamente para la inferencia de Stable Audio 3 (encargado de su ejecución) y el ajuste fino con LoRA. Todos ellos han sido entrenados con contenidos licenciados.

Stable Audio 3 Small SFX, disponible para su descarga desde Hugging Face, es el modelo especializado en la creación de efectos de sonido como ruidos ambientales, explosiones, pisadas y más, y se caracteriza por generar clips de hasta dos minutos y por ser extremadamente ligero. está diseñado para funcionar de forma local en móviles o portátiles comerciales.

Stable Audio 3.0 Small Music es el modelo hermano del anterior creado para la composición musical. Es capaz de componer canciones y melodías instrumentales completas desde texto y genera pistas de hasta dos minutos con la cualidad de poder hacerlo de forma local y sin conexión en ordenadores de consumo diario.

El modelo diseñado para la máxima fidelidad artística que se puede descargar gratis es Stable Audio 3.0 Medium. Genera tanto música como sonido general, pero a un nivel superior. Es capaz de mantener la coherencia melódica, un ritmo y estructura de canción de una forma más compleja que las versiones pequeñas. Ofrece la posibilidad de generar pistas de hasta 6 minutos y 20 segundos.

Hay también un cuarto modelo, Stable Audio 3.0 Large, que está disponible a través de la API de Stability AI y mediante autoalojamiento para despliegues empresariales. Es el más potente de la familia y está diseñado para grandes plataformas. A diferencia de los otros tres modelos, requiere el uso de superordenadores y no está disponible para su descarga. Se puede probar desde la web de Stable Audio.

Estos modelos funcionan bajo Stability AI Community License, lo que significa que son totalmente gratuitos para uso personal y creativo. Desde su anuncio, Stability AI señala que no reclama royalties ni derechos de propiedad sobre los resultados generados por el modelo. También se han publicado dos artículos académicos sobre Stable Audio 3.0: Stable Audio 3 paper y SAME paper.

Stability AI lanza Stable Audio 3.0, su nueva IA gratuita que genera canciones de hasta 6 minutos en segundos

Contenido patrocinado