A new model for symbolic music generation using musical metadata
사용자 인터페이스를 보여주는 팀 시스템 데모의 스크린샷.신용: Han et al.

인공 지능(AI)은 음악 산업에 새로운 흥미로운 기회를 열었습니다. 예를 들어 음악 작곡이나 특정 악기 트랙을 자동으로 생성할 수 있는 도구 개발이 가능해졌습니다.그러나 대부분의 기존 도구는 비전문가 사용자가 아닌 음악가, 작곡가 및 음악 제작자가 사용하도록 설계되었습니다.

LG AI 리서치 연구원들은 최근 모든 사용자가 자신의 아이디어를 음악으로 쉽게 번역할 수 있는 새로운 인터랙티브 시스템을 개발했습니다.이 시스템은 논문에 요약되어 있습니다.출판됨~에arXiv사전 인쇄 서버는 직관적인 사용자 인터페이스와 음악 데이터 세트에 대해 훈련된 디코더 전용 자동 회귀 변환기를 결합합니다.

한상준, 함지원 및 동료들은 논문에서 "우리는 서사의 중심 주제가 되는 짧은 음악 모티프를 제공하는 데 중점을 두고 상징적 음악 세대의 시연을 소개합니다."라고 썼습니다."이 세대에서는 음악 메타데이터를 입력으로 사용하고 4바의 멀티트랙 MIDI 시퀀스를 생성하는 자동 회귀 모델을 채택했습니다."

팀의 상징적인 음악 생성 시스템을 뒷받침하는 트랜스포머 기반 모델은 두 가지 음악 데이터 세트, 즉Lakh MIDI 데이터 세트그리고MetaMIDI 데이터 세트.전체적으로 이러한 데이터 세트에는 400,000개 이상의 MIDI(디지털 인터페이스) 파일은 음악 트랙에 대한 다양한 정보(예: 연주된 음표, 음표의 지속 시간, 재생 속도)가 포함된 데이터 파일입니다.

모델을 교육하기 위해 팀은 각 MIDI 파일을 REMI(음악 이벤트 표현) 파일로 변환했습니다.이 특정 형식은 MIDI 데이터를 다양한 음악 기능(예: 피치 및 속도)을 나타내는 토큰으로 인코딩합니다.REMI 파일은 음악 생성을 위한 AI 모델 훈련에 특히 유리한 방식으로 음악의 역동성을 포착합니다.

연구원들은 "훈련 중에 음악 메타데이터에서 무작위로 토큰을 삭제하여 유연한 제어를 보장합니다"라고 썼습니다."이는 생성 성능을 유지하면서 입력 유형을 자유롭게 선택할 수 있도록 하여 사용자에게 더 큰 유연성을 제공합니다.."

상징적 음악 생성을 위한 변환기 기반 모델을 개발하는 것 외에도 Han, Ham 및 동료들은 전문가와 비전문가 모두가 액세스할 수 있는 간단한 인터페이스를 만들었습니다.이 인터페이스는 현재 사이드바와 중앙 대화형 패널로 구성되어 있습니다.

사이드바에서 사용자는 어떤 악기를 연주해야 하는지, 노래의 템포 등 모델이 생성하기를 원하는 음악의 측면을 지정할 수 있습니다.모델이 노래를 생성한 후 악기를 제거/추가하거나 음악 재생을 시작할 시간을 조정하는 등 중앙 패널에서 트랙을 편집할 수 있습니다.

Han, Ham 및 동료들은 "우리는 모델 용량, 음악적 충실도, 다양성 및 제어 가능성 측면에서 실험을 통해 전략의 유효성을 검증합니다."라고 썼습니다."또한 모델을 확장하고 주관적인 테스트를 통해 다른 음악 세대 모델과 비교합니다. 우리의 결과는 제어 및 음악 품질 모두에서 우수함을 나타냅니다."

연구원들은 그들의 모델이 상당히 잘 작동하고 사용자의 사양에 따라 최대 4마디의 음악을 안정적으로 생성할 수 있다는 것을 발견했습니다.향후 연구에서는 모델이 생성할 수 있는 음악 트랙의 지속 시간을 연장하고, 사용자가 제공할 수 있는 사양을 넓히고, 시스템의 사용자 인터페이스를 더욱 향상시켜 시스템을 더욱 개선할 수 있습니다.

연구진은 "전역 제어를 통해 4마디의 음악을 생성하도록 훈련된 우리 모델은 음악 길이를 연장하고 마디 수준의 로컬 요소를 제어하는 ​​데 한계가 있습니다"라고 썼습니다."그러나 우리의 시도는 루프로 사용할 수 있는 고품질의 음악 테마를 생성하는 데 의미가 있습니다."

추가 정보:한상준 외, 음악 메타데이터를 통한 상징적 음악 생성의 유연한 제어,arXiv(2024).DOI: 10.48550/arxiv.2409.07467

저널 정보: arXiv

© 2024 사이언스 X 네트워크

소환:음악 메타데이터를 활용한 상징음악 세대의 새로운 모델(2024년 10월 1일)2024년 10월 1일에 확인함https://techxplore.com/news/2024-09-music- Generation-musical-metadata.html에서

이 문서는 저작권의 보호를 받습니다.사적인 학습이나 조사를 목적으로 하는 공정한 거래를 제외하고는 어떠한 행위도 허용되지 않습니다.서면 허가 없이 일부를 복제할 수 있습니다.콘텐츠는 정보 제공 목적으로만 제공됩니다.