A Stability AI, empresa responsável pelo gerador de imagens Stable Diffusion, anunciou um novo pacote de modelos de áudio para criar músicas de até seis minutos de duração. O Stability Audio 3.0 promete gerar faixas com qualidade profissional e sem perigo de sofrer processos por direitos autorais.
São quatro versões, chamadas de small SFX e small, que rodam direto no dispositivo e criam músicas de até dois minutos, e medium e large. Esses modelos maiores conseguem compor faixas com até seis minutos e vinte segundos, além de manter a estrutura musical e o tom melódico. Esse tempo de geração é o dobro da capacidade do Stable Audio 2.0, lançado em 2024.
Também existe uma diferença no perfil de desenvolvedores para cada versão: as três primeiras podem ser usadas por qualquer pessoa, enquanto o maior é mais robusto e fica restrito ao uso por uma interface de programação e serviços pagos de hospedagem própria. Além disso, companhias que têm faturamento superior a um milhão de dólares devem adquirir uma licença corporativa específica.
