generative adversarial networks
圖片來源:Pixabay/CC0 公共領域

近年來,人工智慧(AI)和深度學習模型發展迅速,變得越來越容易取得。這使得人們,即使是那些沒有專業知識的人,也能夠使用人工智慧執行各種任務。在這些模型中,生成對抗網路(GAN)因其在生成與訓練資料具有相同特徵的新資料實例方面的出色表現而脫穎而出,這使得它們對於生成圖像、音樂和文字特別有效。

GAN 由兩個組成,即從隨機雜訊開始創建新資料分佈的生成器,以及檢查生成的資料分佈是「真實」(與訓練資料相符)還是「假」的鑑別器。隨著訓練的進行,生成器在產生真實分佈方面有所改進,而鑑別器在識別生成的資料是假的方面有所改進。

GAN 使用損失函數來衡量假分佈和真實分佈之間的差異。然而,這種方法可能會導致梯度消失和學習不穩定等問題,直接影響穩定性和效率。儘管在改進 GAN 方面取得了相當大的進展,包括結構修改和損失函數調整,但梯度消失和模式崩潰(生成器產生的多樣性有限)等挑戰繼續限制了它們的適用性。

為了解決這些問題,由韓國中央大學電機與電子工程學院 Minhyeok Lee 助理教授領導的研究小組制定了一項新策略。「想像教導藝術家畫風景。一致的指導可能會導致他們產生相似的場景,這種現像在機器學習中稱為模式崩潰。為了防止這種情況,我們的PMF-GAN 模型改進了鑑別器的能力,懲罰生成器產生過於相似的輸出,從而促進多樣性,」李博士解釋道。

他們的研究結果發表在期刊上應用軟運算2024 年 10 月。

PMF-GAN 框架引入了兩個關鍵增強功能。首先,它採用內核最佳化來細化判別器的能力,在解決模型崩潰和梯度消失問題方面具有顯著優勢。核心是將資料轉換為更高維空間的數學函數,即使在複雜的資料中也可以更輕鬆地檢測模式。鑑別器的輸出透過核函數進行處理,產生核密度估計值(KDE)。

其次,PMF-GAN 將一種稱為直方圖變換的數學技術應用於 KDE 輸出,從而能夠更直觀地分析結果。在訓練過程中,模型會最小化核直方圖轉換後的假分佈和真實分佈之間的差異,這種差異稱為 PMF 距離。

特別是,該方法允許使用各種數學距離函數和核函數。這種靈活性使得 PMF-GAN 能夠適應不同的資料類型和學習目標。此外,PMF-GAN 可以整合到現有改進的 GAN 架構中,以獲得更好的效能。

在實驗中,PMF-GAN 在多個資料集的視覺品質和評估指標方面優於多個基準模型。對於 Animal FacesHQ 資料集,與傳統的 WGAN-GP 模型相比,其初始分數提高了 56.9%,Fréchet 初始距離 (FID) 分數提高了 61.5%。

「靈活性和PMF-GAN 的提出為在各種技術和數位領域產生合成數據開闢了新的可能性。在,這將帶來更加穩定和多樣化的圖像生成。它還可以為電影、電玩和虛擬實境體驗提供更真實、更多樣化的電腦生成視覺效果。

「隨著人工智慧生成的內容在我們的日常生活中變得越來越普遍,我們的方法提高了內容的品質和多樣性,並將確保人工智慧繼續成為人類創造力和解決問題的寶貴工具。 」

更多資訊:Jangwon Seo 等人,使用核直方圖變換和機率質量函數距離進行穩定的 GAN 模型訓練,應用軟運算(2024)。DOI:10.1016/j.asoc.2024.112003

提供者:中央大學

引文:研究人員開發了一種新的生成對抗網路模型,可以穩定訓練和表現(2024 年,10 月 16 日)檢索日期:2024 年 10 月 16 日取自 https://techxplore.com/news/2024-10-generative-adversarial-networks-stabilizes.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。