New Computer Vision Tool Wins Prize for Social Impact
2018 年にインドネシアを襲ったパル津波。データは 113 枚の高解像度衛星画像で構成されていました。災害前後の衛星画像を使用して、建物の数とその被害レベルをタイルごとに収集しました。色はさまざまな被害レベルを示し (赤 = 破壊)、DISCount はサブ地域ごとに被害を受けた建物の推定値を示しました。クレジット:人工知能に関する AAAI 会議の議事録(2024年)。DOI: 10.1609/aaai.v38i20.30235

マサチューセッツ大学アマースト校のコンピューター科学者のチームは、危機地帯で損傷した建物を迅速に検出する方法と、鳥の群れのサイズを正確に推定する方法という 2 つの異なる問題に取り組んでおり、最近、その両方を実行できる AI フレームワークを発表しました。DISCount と呼ばれるこのフレームワークは、人工知能の速度と大規模なデータ処理能力と人間による分析の信頼性を組み合わせて、非常に大規模な画像コレクションから特定の特徴を迅速に特定してカウントできる信頼性の高い推定値を迅速に提供します。

研究では、出版された人工知能に関する AAAI 会議の議事録、社会的影響力のある AI に関する最優秀論文賞を同協会から表彰されました。

「DISCount は、2 つの非常に異なるアプリケーションとして統合されました」と、マサチューセッツ州アマースト大学の情報およびコンピューターサイエンスの准教授であり、論文の著者の 1 人であるサブランス・マジ氏は述べています。「マサチューセッツ州アマースト校のデータ サイエンス センターを通じて、私たちは赤十字社と長年協力して、赤十字社のデータ サイエンスの構築を支援してきました。地震や戦争などのイベント中に被害を受けた建物を正確に数えることができるツール。同時に、私たちは気象レーダーデータを使用して鳥の群れのサイズを正確に推定することに関心のあるコロラド州立大学とオクラホマ大学の鳥類学者を支援しました。」

マジ氏と彼の共著者、アマースト大学での博士課程の一環としてこの研究を完了した筆頭著者のグスタボ・ペレス氏と、アマースト大学の情報およびコンピューターサイエンスの准教授であるダン・シェルドン氏は、被害を受けた問題を解決できると考えた。建物と鳥の群れの問題をコンピューター ビジョンで解決します。コンピューター ビジョンは、鳥や瓦礫の山など、特定のものを探して膨大な画像アーカイブをスキャンして数えることができる AI の一種です。

しかし、チームは各プロジェクトで同じ障害に遭遇していました。「標準的なコンピュータ ビジョン モデルは十分な精度がありませんでした」とペレス氏は言います。「私たちは、AI の専門家以外でも使用でき、より高い信頼性を提供できる自動化ツールを構築したいと考えていました。」

シェルドンによれば、その答えは、計数問題を解決するための典型的なアプローチを根本的に再考することでした。

「一般的には、人間が非常に小さなデータセットを時間をかけて正確に手動でカウントするか、コンピュータービジョンで巨大なデータセットの精度が低い自動カウントを実行するかのどちらかです」とシェルドン氏は言う。「私たちは、両方をやったらどうだろうと考えました。」

DISCount は、既存の AI コンピューター ビジョン モデルと連携できるフレームワークです。これは、AI を使用して非常に大規模なデータセット (たとえば、10 年間に特定の地域で撮影されたすべての画像) を分析し、人間の研究者がどの特定の小さなデータセットを調べるべきかを決定することによって機能します。

この小さなセットは、たとえば、コンピュータ ビジョン モデルがその地域の建物被害の程度を最もよく示すと判断した、重要な数日間のすべての画像である可能性があります。その後、人間の研究者は、はるかに少ない画像セットから被害を受けた建物を手作業で数えることができ、アルゴリズムはそれらを使用して、地域全体で被害を受けた建物の数を推定します。最後に、DISCount は人間による推定値がどの程度正確であるかを推定します。

「DISCount は、私たちが検討したタスクではランダム サンプリングよりもはるかにうまく機能します」と Pérez 氏は言います。「そして、私たちのフレームワークの利点の 1 つは、あらゆるコンピューター ビジョン モデルと互換性があることです。これにより、研究者はニーズに最適な AI アプローチを選択できます。また、信頼区間も得られるため、研究者は情報を得ることができます。」彼らの見積もりがどれほど適切であるかについての判断。」

「振り返ってみると、私たちは比較的単純なアイデアを持っていました」とシェルドンは言います。「しかし、人間と人工知能のどちらかを選択する必要がなくなったという小さな心の変化により、どちらかのアプローチだけを使用するよりも、より高速で、より包括的で、より信頼性の高いツールを構築することができました。」

詳細情報:Gustavo Perez 他、DISCount: 検出器ベースの重要度サンプリングによる大規模画像コレクションのカウント、人工知能に関する AAAI 会議の議事録(2024年)。DOI: 10.1609/aaai.v38i20.30235

引用:新しいコンピューター ビジョン ツールは、危機地帯で被害を受けた建物を数え、鳥の群れのサイズを正確に推定できる (2024 年 4 月 11 日)2024 年 4 月 11 日に取得https://techxplore.com/news/2024-04-vision-tool-crisis-zones-accurately.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。