Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
このプロジェクトは、世界中の何百万人ものアラビア語話者のコミュニケーションとアクセシビリティを向上させる可能性を秘めています。クレジット: シャルジャ大学美術デザイン学部、ハラ ジョージズ博士。

シャルジャ大学の科学者らは、誰かが話しているアラビア語の方言を自動的に識別できる人工知能システムを開発したと考えている。作品は出版されたIEEE エクスプロア

彼らによれば、彼らのシステムは、これまでの従来の音声システムでは正確に解釈して識別することができなかった、アラビア語の方言の豊かで複雑なタペストリーを解き明かすという。

「アラビア語は多くの地域の方言を持つ豊かな言語であり、それぞれに独自の語彙、表現、発音があります。この多様性により、テクノロジーがそれらを正確に理解して区別することが困難になっています。」とコンピューターサイエンスのアシュラフ・エルナガー教授は述べています。インテリジェンスシステム。

「これに対処するために、私たちは誰かが話しているアラビア語の方言を自動的に識別できるシステムを開発しました。」

中東、北アフリカ、アラビア半島にまたがる 22 か国の公用語であるアラビア語は、世界で最も話されている言語の 1 つです。3億7千万人以上それを母国語として持っているのです。また、世界で最も文化に溶け込んでいる言語の一つでもあり、母国語として、あるいは第二言語として学習している言語でもあります。イスラム教とその文化についても学ぶことができます。

Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
アラビア語は、中東、北アフリカ、アラビア半島にまたがる 22 か国の公用語であり、世界で最も話されている言語の 1 つです。クレジット: シャルジャ大学美術デザイン学部、ハラ ジョージズ博士。

英語とはまったく異なるアルファベットを持つこの言語には、音韻論に特有の音が多数あります。音とキャラクターの魅力に惑わされる数え切れないほどの外国人学習者流暢に話したいと思っている人。アラビア語の学習のほとんどは標準的な形式で行われますが、多くの外国人学習者は口語または日常的なバージョン、特にエジプトやシリアの通貨での話し言葉を選択します。

著者らは、話された言葉を聞くだけでさまざまなアラビア語の方言を認識できるようにコンピュータに教えるという試みは、簡単な作業ではなかったと述べている。彼らは、「主な課題は、アラビア語の広範囲にわたる方言を正確に識別できる機械学習モデルの開発である」と書いています。

「この課題は、アラビア語の方言に固有の多様性と複雑さに加え、音声処理と機械学習モデルの最適化という技術的な課題によってさらに複雑になります。」

著者らは、YouTube から収集した 3,000 時間以上の音声セグメントで構成されるデータセットを利用しました。このデータには、アルジェリア、エジプト、イラク、ヨルダン、サウジアラビア、クウェート、レバノン、リビア、モーリタニア、チュニジア、モロッコ、オマーン、パレスチナ、カタール、スーダン、シリア、アラブ首長国連邦(UAE)、バーレーンで話されている19の異なる方言が含まれています。そしてイエメン。

結果は印象的であったとエルナガー教授は述べ、地域レベルおよび国レベルでのアラビア語の方言識別におけるモデルの精度の高さを強調した。「私たちのモデルは正しく識別されました97.29% の確率で、94.92% の確率で特定の国の方言が使用されます。

Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
アラビア語は多くの地域の方言を持つ豊かな言語であり、それぞれに独自の語彙、表現、発音があります。クレジット: シャルジャ大学美術デザイン学部、ハラ ジョージズ博士。

「注目に値するのは、わずか 29% を使用してこれを達成したことです。通常、他の研究者によって要求されます。私たちはモデルを公開し、他の研究者や開発者がそのモデルを使用してアラビア語話者のためのより優れた音声関連技術を作成できるようにしました。」

このプロジェクトは、世界中の何百万人ものアラビア語話者のコミュニケーションとアクセシビリティを向上させる可能性を秘めています。エルナガー教授は、方言を正確に識別するモデルの能力により、「仮想アシスタント、翻訳サービス、自動顧客サポート システムなどの音声起動技術を改善できる」と述べた。

「これは、異なるアラビア語圏間のコミュニケーションのギャップを埋めるだけでなく、テクノロジーをアラビア語話者にとってより包括的で使いやすいものにすることにも貢献します。」

驚くべき結果にもかかわらず、エルナガー教授は、このプロジェクトはまだ改善の余地があると述べた。この目的のために、著者らは自分たちのシステムを「HuggingFace と呼ばれるオンラインのプラットフォーム上で」公開し、他の人がアラビア語技術を改善するための私たちの成果にアクセスして構築できるようにしました。

この研究は、エルナガー教授と彼の3人の研究者の共同研究の成果です。音声からアラビア語の方言を識別するための深層学習モデルを構築するプロジェクトの一環として。初期の研究結果は、2024 年の第 15 回応用コンピューティングに関する学部研究会議 (URC) で初めて発表されました。

Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
英語とはまったく異なるアルファベットを持つこの言語には、音韻論に特有の音が多数あります。その音と文字の魅力は、流暢に話したいと願う無数の外国人学習者を困惑させます。クレジット: シャルジャ大学美術デザイン学部、ハラ・ジョルジュ博士

「私たちのシステムの背後にあるテクノロジーは、熱心な学生によって開発され、最先端の方法論と深層学習技術を統合しています。その機能をテキストからオーディオ信号まで拡張することで他とは一線を画し、アラビア語の理解と処理にマルチモーダルなアプローチを提供します。」と教授は述べています。エルナガルは言った。

学生研究者のアムル・バラカット氏にとって、このプロジェクトは「言語技術における重大なギャップを埋め、世界中のアラビア語話者にとってより包括的で正確なコミュニケーションを可能にします。高度な機械学習を活用することで、パフォーマンスに優れているだけでなく、道を切り開くモデルを作成しました」音声認識における将来のイノベーションのために。」

別の学生研究者であるアブドゥラ・アルダヘリ氏は、このプロジェクトは「AI主導のさまざまな言語アプリケーションやサービスに多くの利点と改善をもたらし、広く採用される可能性を秘めている」ため、業界から幅広い関心を集めていると報告した。

精度が高いことに加えて、著者らが開発したツールは、現在利用可能なモデルとは異なり、必要なデータと計算リソースが少なく、より幅広い用途に利用できるようになっています。著者らによれば、この特徴が彼らの研究に対する業界の関心の背後にあったという。彼らはマイクロソフトなどのハイテク企業やアラブ首長国連邦シャルジャの政府機関を挙げた。自分の仕事に特に熱心であると考えられます。

詳細情報:Amr Barakat 他、音声によるアラビア語の方言識別、2024年第15回応用コンピューティングに関する学部研究会議(URC)(2024年)。DOI: 10.1109/URC62276.2024.10604557

引用:科学者がアラビア語圏 22 か国のアラビア語方言を正確に識別する機械学習ツールを開発 (2024 年 10 月 7 日)2024 年 10 月 7 日に取得https://techxplore.com/news/2024-10-scientists-machine-tool-accurately-arabic.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除いて、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。