O MusicGen foi treinado em 20 mil horas de música, incluindo 10 mil faixas licenciadas
(Foto: Divulgação)
Atualmente Meta lançou um novo programa movido por inteligência artificial, capaz de gerar músicas, nomeado de MusicGen. Ela nos conta que seu novo programa foi habilitado em 20 mil horas de música, além de possuir 10 mil faixas licenciadas com uma qualidade muito boa, contando também com mais 390 mil faixas somente de instrumentos do ShutterStock e Pond5, uma variada biblioteca de mídia. Sua automação foi programada com tanta excelência, a qual com apenas 12 segundos de áudio ferramenta é capaz de transformar uma descrição de texto automaticamente e, também, possui áudio de referência, sendo opcionalmente direcionada como uma música existente.
De acordo com o TechCrunch (website focado em notícias sobre tecnologia), as suas músicas são razoavelmente melódicas, no mínimo para prompts básicos como “música ambiente” e no mesmo nível do gerador de música AI do Google, MusicLM.
O TechCrunch destaca a existência de importantes questões éticas e legais que ainda precisam ser abordadas no campo da inteligência artificial. Um exemplo disso é o MusicGen, uma IA que aprende com músicas existentes para produzir efeitos semelhantes, algo que nem todos os artistas ou usuários de IA generativa se sentem confortáveis.
A Meta, por sua vez, não está impondo restrições quanto ao uso do MusicGen. A empresa afirma que todas as músicas utilizadas para treinar a ferramenta estavam cobertas por acordos legais com os detentores dos direitos, incluindo um acordo com a Shutterstock.
Embora o TechCrunch não tenha divulgado o código utilizado para treinar o modelo, modelos pré-treinados foram disponibilizados, permitindo que qualquer pessoa com o hardware adequado, principalmente uma GPU com aproximadamente 16 GB de memória, possa executá-los.
Meta se une ao mercado de inteligência artificial de conversão de texto em música, seguindo os passos do Google. A empresa lançou seu próprio modelo de linguagem capaz de gerar músicas inéditas a partir de prompts de texto, marcando um momento importante nesse campo em constante evolução.
Em janeiro, o Google introduziu o MusicLM, uma ferramenta experimental de inteligência que pode gerar música de alta qualidade com base em prompts de texto e zumbidos, e a disponibilizou no mês passado.
De acordo com informações do Music Business Worldwide, ao usar a ferramenta MusicLM em nível público, basta digitar um prompt como "jazz cheio de alma para um jantar". O modelo MusicLM, então, criará duas versões da música solicitada para o usuário, que poderá escolher a sua preferida. O modelo do Google foi treinado com cinco milhões de clipes de áudio, totalizando 280 mil horas de música a 24 kHz.
Publicidade
Comments