A new model for symbolic music generation using musical metadata
顯示其使用者介面的團隊系統演示的螢幕截圖。圖片來源:Han 等人。

人工智慧 (AI) 為音樂產業帶來了新的有趣機會,例如,可以開發可以自動生成音樂作品或特定樂器曲目的工具。然而,大多數現有工具都是為音樂家、作曲家和音樂製作人設計的,而不是供非專家使用者使用的。

LG AI Research 的研究人員最近開發了一種新的互動系統,讓任何用戶輕鬆地將他們的想法轉化為音樂。該系統在論文中概述發表arXiv預印本伺服器,將在音樂資料集上訓練的僅解碼器自回歸變壓器與直覺的使用者介面結合。

Sangjun Han、Jiwon Ham 和他們的同事在論文中寫道:“我們引入了象徵性音樂生成的演示,重點是提供作為敘事中心主題的簡短音樂主題。”“對於這一代,我們採用自回歸模型,將音樂元數據作為輸入並生成 4 個小節的多軌 MIDI 序列。”

支援團隊符號音樂生成系統的基於變壓器的模型在兩個音樂資料集上進行了訓練,即十萬個 MIDI 資料集元MIDI資料集。這些資料集總共包含超過 400,000 個 MIDI (數位介面)文件,這些資料檔案包含有關音樂曲目的各種資訊(例如,演奏的音符、音符的持續時間、演奏的速度)。

為了訓練他們的模型,團隊將每個 MIDI 檔案轉換為音樂事件表示 (REMI) 檔案。這種特定格式將 MIDI 資料編碼為代表各種音樂特徵(例如音高和速度)的標記。REMI 檔案以特別有利於訓練用於音樂生成的 AI 模型的方式捕捉音樂的動態。

研究人員寫道:“在訓練過程中,我們從音樂元數據中隨機刪除標記,以確保靈活的控制。”「它為用戶提供了選擇輸入類型的自由,同時保持生成性能,從而實現更大的靈活性」。

除了開發基於變壓器的符號音樂生成模型之外,Han、Ham 和他們的同事還創建了一個簡單的介面,使專家和非專家用戶都可以使用它。該介面目前由側邊欄和中央互動面板組成。

在側邊欄中,使用者可以指定他們希望模型產生的音樂的各個方面,例如應該演奏什麼樂器以及歌曲的節奏。模型產生歌曲後,他們可以在中央面板中編輯曲目,例如,透過刪除/新增樂器或調整開始播放音樂的時間。

Han、Ham 和他們的同事寫道:“我們通過模型容量、音樂保真度、多樣性和可控性方面的實驗來驗證該策略的有效性。”“此外,我們擴大了模型的規模,並通過主觀測試將其與其他音樂生成模型進行了比較。我們的結果表明了其在控制和音樂質量方面的優越性。”

研究人員發現他們的模型表現非常好,並且可以根據用戶的規格可靠地生成最多 4 小節的音樂。在未來的研究中,他們可以透過延長模型創建的音樂曲目的持續時間、擴大用戶可以給出的規格以及進一步增強系統的用戶介面來進一步改進系統。

研究人員寫道:“我們的模型經過訓練可以生成具有全局控制的 4 個小節音樂,但在延長音樂長度和控制小節級局部元素方面存在局限性。”“然而,我們的嘗試對於產生可用作循環的高品質音樂主題具有重要意義。”

更多資訊:Sangjun Han 等人,透過音樂元資料靈活控制符號音樂生成,arXiv(2024)。DOI:10.48550/arxiv.2409.07467

期刊資訊: arXiv

© 2024 Science X 網絡

引文:使用音樂元資料產生符號音樂的新模型(2024 年 10 月 1 日)檢索日期:2024 年 10 月 1 日取自 https://techxplore.com/news/2024-09-music- Generation-musical-metadata.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。