New technique could help self-driving cars see their surroundings better
2D から 3D への機能リフティングにおける、私たちが提案する MvACon の効果。クレジット:マルチビュー 3D オブジェクト検出のためのマルチビューの注意深いコンテキスト化(2024年)

ノースカロライナ州立大学の研究者が開発した技術のおかげで、自動運転車が道路をより効率的に走行できるようになる日が来るかもしれません。この技術により、人工知能プログラムは 2 次元画像を使用して 3 次元空間をより正確にマッピングできるようになります。

"ほとんどビジョン トランスフォーマーと呼ばれる強力な AI プログラムを使用して、複数のカメラから 2D 画像を取得し、車両の周囲の 3D 空間の表現を作成します」と電気工学准教授の Tianfu Wu 氏は述べています。ノースカロライナ州立大学の教授であり、新しい技術に関する論文の責任著者。「しかし、これらの AI プログラムはそれぞれ異なるアプローチを採用していますが、まだ改善の余地がかなりあります。」

これらの AI プログラムは異なるアプローチを使用していますが、新しい技術ウーと彼の協力者によって開発されたこの機能は、それらすべてを大幅に改善する可能性を秘めています。

「Multi-View Attentive Contextualization (MvACon) と呼ばれる私たちの技術は、これらの既存のビジョン トランスフォーマー AI と組み合わせて使用​​して、3D 空間をマッピングする能力を向上させることができるプラグ アンド プレイの補足です」とウー氏は言います。「ビジョントランスフォーマーはカメラから追加のデータを取得していません。データをより有効に活用できるだけです。」

研究チームは、現在市販されている 3 つの主要なビジョン トランスフォーマーを使用して MvACon のパフォーマンスをテストしました。これらはすべて、変換する 2D 画像を収集するために 6 台のカメラのセットに依存しています。

MvACon により、3 つすべてのパフォーマンスが大幅に向上しましたトランスフォーマー。

「オブジェクトの位置特定、およびそれらのオブジェクトの速度と方向に関してパフォーマンスが特に向上しました」とウー氏は言います。

研究チームは、「マルチビュー 3D オブジェクト検出のためのマルチビュー アテンティブ コンテキスト化」というタイトルの論文を今年の国際学会で発表しました。コンピュータビジョンとパターン認識に関するIEEE/CVFカンファレンス

引用:新しい技術は、自動運転車が周囲をよりよく認識できるようにする可能性があります (2024 年 10 月 16 日)2024 年 10 月 16 日に取得https://techxplore.com/news/2024-10-technique-cars.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。