Distinguishing Real Sounds from Deepfakes
ディープフェイク検出の実験で使用されたパイプラインの概要と、MLP のネットワーク アーキテクチャの図。dim の値は、使用される埋め込み方法によって異なります。クレジット:ディープフェイク環境音声の検出(2024年)。

人工知能によって生成されたディープフェイク動画は虚偽であることを特定することがますます困難になっており、この課題は次期大統領選挙の結果を大きく歪める可能性がある。

カーネギーメロン大学心理学教授のローリー・ヘラー氏は、ナントコール・セントラルのハフサ・ウアジディ氏、ウサマ・ハダー氏、モーダン・タイユール氏、マチュー・ラグランジュ氏らと協力して、最初のディープ・ニューラル・ネットワークによって生じたエラーを分析した。研究チームは、環境音を実際の音か AI が生成した音かを自動的に分類する方法を開発しました。

研究チームはその結果を論文で発表しました。ディープフェイク環境音声の検出」と彼らは8月27日に発表した。第 32 回欧州信号処理カンファレンス(EUSIPCO 2024) フランス、リヨン。

環境音は、録音の背景ノイズ、つまり音声と音楽を除くあらゆる音として定義されます。これらの音には、車の走行音や別の部屋のドアが閉まる音などが含まれる場合があります。

研究チームが開発した検出器は、現時点では環境音の 7 つのカテゴリを識別することに限定されています。コール・セントラル・ナントの環境音検出器をテストしたところ、その精度が信じられないほど高く、最終的には約 6,000 個の音のうち約 100 個のエラーが発生することが判明しました。

分析の結果、検出器が引き起こす可能性のある 2 種類のエラーが明らかになりました。検出器は、AI が生成した音を本物の音としてラベル付けすることも、本物の音を AI が生成した音としてラベル付けすることもできます。ヘラー氏の研究の目的は、人間が探知機が見逃した可聴手がかりを見つけて、見逃した本物の音の一部を本物と判断したり、見逃したAIが生成した音の一部を偽物と判断したりできるかどうかを判断することだった。

Heller の研究は 20 から構成されていました。、彼らは検出器が誤って識別したのと同じ一連の音を聞いていました。探知機と同様に、参加者には、聞こえた音のうちどれが本物でどれが AI によって生成された音かを識別するという課題が与えられました。

研究で使用された実際の環境音は、公開されているデータベースから取得されました。AI が生成した環境音は、応募者が AI を使用して開発した音を提出したコンテストの勝者から採取されたもので、最も正確または本物の音が優勝しました。

探知機が本物と判断した偽の音については、人間による研究の結果は決定的ではありませんでした。人間は約 50% の確率で正確でした。これは、人間が探知機を騙す音の偽物に敏感ではなかったことを示しています。参加者は聞いている音を明確に分類できなかった可能性があり、その結果は信頼できる答えではなく偶然の選択を反映していました。

しかし、探知機が偽物と判断した本物の音については、人間の判断は約 71% の確率で正しく、探知機よりも正確でした。この統計は、答えが偶然の結果ではなく、参加者による実際の音の決定的かつ正確な分類によるものであることを明らかにしています。

ヘラー氏は、これらの結果は、人間が検出できるものの、検出器が認識できない実際の環境音の中に何らかの手がかりがある可能性があることを示唆していると結論付けています。研究者がこの仮説上の合図を特定できれば、AI 音検出器を改良して精度を高めることができるでしょう。

環境音検出器とヘラーの結果は、より複雑な AI 検出ツールの開発につながる可能性があります。以前の AI 音声検出器は音声を識別することのみを目的として作られていましたが、環境音AI 検出ツールを改善するためのさらなる研究は、急速に機能が進歩している AI 主導のディープフェイク技術に追いつくために重要です。

「私たちは国民がその能力を過小評価する段階に来ているが、その能力は急速に改善しつつある」とヘラー氏は語った。

「最悪のシナリオは、AIが発達しすぎて人間が何が本物で何が人工なのかを見分けられなくなる社会になることだ。そうなる前に備えておきたい。」

ヘラー氏はまた、AI主導のメディアコンポーネントを規制できる政策を導入することの重要性についても言及した。

「AI を使用して生成されたすべてのものにはフラグを付ける必要があります」と彼女は提案しました。

詳細情報:Ouajdi、H. ディープフェイク環境音声の検出、eurasip.org/Proceedings/Eusipc ? 024/pdfs/0000196.pdf

引用:本物の音とディープフェイクの区別 (2024年9月16日)2024 年 9 月 16 日に取得https://techxplore.com/news/2024-09-distinguishing-real-deepfakes.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。