TRANSCRIÇÃO AUTOMÁTICA DE MÚSICA ATRAVÉS DE REDES NEURAIS CONVOLUCIONAIS
Palavras-chave:
Transcrição Automática de Música, Cifras de Violão, Inteligência ArtificialResumo
Idealmente, o processo de ensino-aprendizagem da música deveria possuir um caminho de aprendizagem gradual, favorecendo assim todos os tipos de curva de aprendizagem eliminando barreiras que impedem o estudante de prosseguir por conta própria, sem necessariamente a atenção plena ou presencial de um instrutor. Este projeto visa desenvolver um software de transcrição automática de músicas para cifras de violão, oferecendo diversos níveis de dificuldades de cifras, fomentando o apoio ao ensino e prática musical de estudantes de violão. A fase inicial do projeto focou na curadoria e preparação dos dados. Foram empregados conjuntos de dados públicos, como o MusicNet e o HookTheory, que continham faixas musicais previamente anotadas com seus respectivos acordes e modulações tonais. Os arquivos de áudio foram convertidos em espectrogramas, uma representação que visualiza a distribuição de frequências sonoras ao longo do tempo. Subsequentemente, procedeu-se à construção da arquitetura de rede neural. Para tal, foi utilizada uma abordagem híbrida que combinou Redes Neurais Convolucionais (CNNs) e Redes Neurais Recorrentes (LSTM/GRU), com o suporte da biblioteca TensorFlow. As CNNs foram designadas para a extração de características espaciais dos espectrogramas, enquanto as unidades LSTM/GRU se encarregaram de modelar as dependências temporais e identificar padrões harmônicos e modulações tonais. A arquitetura foi projetada para gerar uma previsão de acorde por intervalo de tempo (timestamp), assegurando que a sequência de saída correspondesse à duração total da canção. A etapa de treinamento do modelo foi conduzida e equipada com uma GPU NVIDIA GTX 3090 (24GB de VRAM), o que viabilizou o processamento de grandes lotes de dados (batches) e a execução de operações computacionais intensivas. A validação do modelo treinado foi realizada com um subconjunto de dados não utilizado durante o treinamento. Para a disponibilização do sistema, foi desenvolvida uma aplicação web com uma interface de usuário interativa e intuitiva, utilizando PHP e o framework Yii. O frontend permitiu aos usuários submeter arquivos de áudio para transcrição, visualizar as cifras resultantes e ajustar o nível de complexidade das mesmas (básico, intermediário, avançado). O armazenamento de dados foi gerenciado por um banco de dados PostgreSQL, integrado ao Yii, que persistiu informações sobre usuários, suas configurações e o histórico de transcrições musicais. A implementação da aplicação incorporou testes unitários e de integração para assegurar a qualidade e a robustez do código. Finalmente, foi estabelecido um pipeline de integração e entrega contínua (CI/CD) baseado em Docker. O projeto resultou no desenvolvimento de uma plataforma web funcional, capaz de transcrever automaticamente músicas para cifras de violão. O sistema incorpora um modelo de aprendizado profundo treinado para reconhecer acordes e gera cifras em três níveis de dificuldade (básico, intermediário e avançado), permitindo ao usuário submeter um áudio e receber a transcrição de forma intuitiva. Como produto final, foi entregue a API de transcrição e a interface de usuário interativa, cumprindo os objetivos técnicos propostos.
Downloads
Downloads
Publicado
Métricas
Visualizações do artigo: 3 PDF downloads: 2