研究者は、トレーニングとパフォーマンスを安定させる新しい敵対的生成ネットワークモデルを開発

2024-10-16 23:06:49

近年、人工知能（AI）やディープラーニングモデルが急速に進歩し、簡単に利用できるようになりました。これにより、専門知識を持たない人でもAIを活用してさまざまな業務を遂行できるようになりました。これらのモデルの中でも、敵対的生成ネットワーク (GAN) は、トレーニングデータと同じ特性を持つ新しいデータインスタンスを生成する優れたパフォーマンスで際立っており、画像、音楽、テキストの生成に特に効果的です。

generative adversarial networks — クレジット: Pixabay/CC0 パブリックドメイン

GAN は 2 つで構成されますニューラルネットワークつまり、ランダムノイズから開始して新しいデータ分布を作成するジェネレーターと、生成されたデータ分布が「本物」（トレーニングデータと一致する）か「偽物」かをチェックするディスクリミネーターです。トレーニングが進むにつれて、ジェネレーターは現実的な分布を生成する能力が向上し、ディスクリミネーターは生成されたデータが偽物であることを識別する能力が向上します。

GAN は損失関数を使用して、偽の分布と実際の分布の差を測定します。ただし、このアプローチでは、勾配の消失や不安定な学習などの問題が発生し、安定性と効率に直接影響を与える可能性があります。構造の変更や損失関数の調整など、GAN の改善は大きく進んでいますが、ジェネレーターが生成する種類が限られている勾配消失やモード崩壊などの課題により、GAN の適用性は引き続き制限されています。

これらの問題に対処するために、韓国中央大学電気電子工学部の Minhyeok Lee 助教授が率いる研究チームは、新しい戦略を開発しました。「アーティストに風景を描くように教えることを想像してみてください。一貫した指導により、似たようなシーンが生成される可能性があります。これは、機械学習でモード崩壊と呼ばれる現象です。これを防ぐために、PMF-GAN モデルは識別器の機能を改良し、過度に類似した出力を生成するジェネレーターにペナルティを与えます」、それによって多様性が促進されます」とリー博士は説明します。

彼らの発見は雑誌に掲載されました応用ソフトコンピューティング2024年10月に。

PMF-GAN フレームワークには 2 つの重要な機能強化が導入されています。まず、カーネル最適化を採用してディスクリミネーターの機能を改良し、モデルの崩壊や勾配の消失の問題に対処する際に大きな利点をもたらします。カーネルは、データを高次元空間に変換する数学関数であり、複雑なデータであってもパターンの検出を容易にします。弁別器の出力はカーネル関数を通じて処理され、カーネル密度推定 (KDE) が生成されます。

2 番目に、PMF-GAN はヒストグラム変換と呼ばれる数学的手法を KDE 出力に適用し、結果のより直観的な分析を可能にします。トレーニング中に、モデルはカーネルヒストグラムに変換された偽の分布と実際の分布の間の差 (PMF 距離と呼ばれる尺度) を最小限に抑えます。

特に、このアプローチでは、さまざまな数学的距離関数とカーネル関数の使用が可能になります。この柔軟性により、PMF-GAN をさまざまなデータ型や学習目標に適応させることができます。さらに、PMF-GAN を既存の改良された GAN アーキテクチャに統合して、パフォーマンスをさらに向上させることができます。

実験では、PMF-GAN は、複数のデータセットにわたるビジュアル品質と評価指標の点で、いくつかのベースラインモデルを上回りました。Animal FacesHQ データセットの場合、従来の WGAN-GP モデルと比較して、開始スコアで 56.9%、フレシェ開始距離 (FID) スコアで 61.5% の改善が示されました。

「柔軟性とパフォーマンスの向上PMF-GAN が提供するものは、さまざまな技術分野およびデジタル分野で合成データを生成する新たな可能性をもたらします。で健康管理より安定した多様な画像生成につながります。また、映画、ビデオゲーム、および仮想現実体験のための、より現実的で多様なコンピュータ生成ビジュアルも可能になります」とリー博士は述べています。

「AIが生成したコンテンツが私たちの日常生活でより普及するにつれて、私たちの手法はコンテンツの品質と多様性を向上させ、AIが人間の創造性と問題解決にとって価値あるツールであり続けることを保証します。」

詳細情報:Jangwon Seo 他、カーネルヒストグラム変換と確率質量関数距離を使用した安定化 GAN モデルのトレーニング、応用ソフトコンピューティング（2024年）。DOI: 10.1016/j.asoc.2024.112003

提供元中央大学

引用:研究者らがトレーニングとパフォーマンスを安定させる新しい敵対的生成ネットワークモデルを開発 (2024 年 10 月 16 日)2024 年 10 月 16 日に取得https://techxplore.com/news/2024-10-generative-adversarial-networks-stabilizes.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。

他の言語バージョンも参照: English | 简中 | 正體 | 日本語 | 한국인 | हिंदी | Español

研究者は、トレーニングとパフォーマンスを安定させる新しい敵対的生成ネットワーク モデルを開発

研究者は、トレーニングとパフォーマンスを安定させる新しい敵対的生成ネットワークモデルを開発