Autonomous vehicles could understand their passengers better with ChatGPT, research shows
パデュー大学の助教授、Ziran Wang 氏は、ChatGPT またはその他の大規模な言語モデルを使用して乗客からのコマンドを解釈するために、彼と学生たちに装備された自動運転テスト車両の隣に立っています。クレジット: パデュー大学 / ジョン・アンダーウッド

車に「急いでいます」と伝えるだけで、目的地までの最も効率的なルートを自動的に案内してくれると想像してみてください。

パデュー大学のエンジニアは、自動運転車 (AV) が ChatGPT または大規模言語モデルと呼ばれる人工知能アルゴリズムによって可能になった他のチャットボットの助けを借りてこれを実行できることを発見しました。

研究、プレプリント サーバーに表示されますarXiv、9月25日に発表される予定です。第 27 回 IEEE 高度道路交通システム国際会議。これは、実際の AV が大規模な言語モデルを使用して乗客からのコマンドを解釈し、それに応じて運転できるかをテストする最初の実験の 1 つである可能性があります。

この研究を主導したパーデューのライルズ土木建設工学大学院の助教授、ジラン・ワン氏は、いつか車両が完全に自動運転になるためには、たとえそれが暗示されたものであっても、乗客の命令をすべて理解する必要があると考えている。たとえば、タクシーの運転手は、「急いでいる」と言ったときに、渋滞を避けるために運転手が通るべきルートを指定しなくても、何が必要かを理解できます。

今日の AV にはコミュニケーションを可能にする機能が備わっていますが、人間と話す場合よりも明確に話す必要があります。対照的に、大規模な言語モデルは、膨大な量のテキスト データから関係を導き出し、時間をかけて学習し続けるようにトレーニングされているため、より人間らしい方法で解釈して応答することができます。

「私たちの車両に搭載されている従来のシステムは、ユーザー インターフェイス設計で、ボタンを押さなければ言いたいことを伝えられなかったり、音声認識システムでは、車両があなたの言うことを理解できるように、非常に明確に話す必要があった」とワン氏は語った。。「しかし、大規模な言語モデルの力は、ユーザーの発言のあらゆる種類をより自然に理解できることです。他の既存のシステムではそれができないと思います。」

Autonomous vehicles could understand their passengers better with ChatGPT, research shows
パデュー博士学生の Can Cui はテスト用自動運転車に座って座っています。コンソールのマイクが彼のコマンドを拾い、クラウド内の大きな言語モデルがそれを解釈します。車両は大規模な言語モデルから生成された指示に従って運転します。クレジット: パデュー大学 / ジョン・アンダーウッド

新しい種類の研究を実施する

この研究では、大規模な言語モデルは AV を駆動しませんでした。代わりに、彼らは既存の機能を使用して AV の運転を支援していました。ワン氏と彼の学生たちは、これらのモデルを統合することで、AV が乗客をよりよく理解できるだけでなく、乗客が満足するように運転をパーソナライズできることを発見しました。

実験を開始する前に、研究者らは、より直接的なコマンド(「もっと速く運転してください」など)から間接的なコマンド(「今、少し乗り物酔いをしています」など)までの範囲のプロンプトを使ってChatGPTをトレーニングしました。ChatGPT がこれらのコマンドに応答する方法を学習するにつれて、研究者らはその大規模な言語モデルに従うべきパラメータを与え、トラフィック ルールを考慮する必要がありました。、カメラや光の検出と測距などの車両のセンサーによって検出された天気やその他の情報。

次に研究者らは、これらの大規模な言語モデルをクラウド経由で実験車両にアクセスできるようにしました。SAE International が定義するレベル 4 の自律性。レベル 4 は、業界が完全にレベルとみなしているレベルから 1 レベル離れています。

実験中に車両の音声認識システムが乗客からのコマンドを検出すると、クラウド内の大規模な言語モデルが研究者が定義したパラメータを使用してコマンドを推論しました。次に、これらのモデルは、スロットル、ブレーキ、ギア、ステアリングに接続された車両のドライブ・バイ・ワイヤ・システムに対して、そのコマンドに従って運転する方法に関する指示を生成しました。

Autonomous vehicles could understand their passengers better with ChatGPT, research shows
研究参加者がテスト自動運転車の運転席に座ってコマンドを話す間、パーデュー州の研究者は後部座席に座って大規模な言語モデルと車両のカメラからのフィードを監視した。車両の後ろから前までの写真: パデュー大学の修士課程の学生 Yupeng Zhou と Ph.D.学生のカン・キュイさん。クレジット: パデュー大学 / ジョン・アンダーウッド

一部の実験では、ワン氏のチームはシステムにインストールしたメモリモジュールもテストした。これにより、大規模な言語モデルが乗客の過去の好みに関するデータを保存し、それらをコマンドへの応答に組み込む方法を学習できるようになった。

研究者らは実験の大部分を、以前は空港の滑走路だったインディアナ州コロンバスの試験場で実施した。この環境により、滑走路を高速道路で走行したり、二方向交差点を処理したりしながら、乗客のコマンドに対する車両の反応を安全にテストすることができました。彼らはまた、パーデューのロス・エイド・スタジアムの敷地内で、乗客の指示に従って車両がどれだけうまく駐車できるかテストした。

研究参加者は、大規模な言語モデルが学習したコマンドと、乗り物に乗っている間に新しいコマンドの両方を使用しました。乗車後のアンケート回答に基づいて、参加者は、大規模な言語モデルの支援なしでレベル 4 の AV に乗車したときに人々がどのように感じる傾向があるかに関するデータと比較して、AV が下した決定に対する不快感を表明する割合が低いことがわかりました。

チームはまた、AVの性能を、追突を回避するために車両がどれだけの時間反応することができるか、どれくらいの速さで車両が反応できるかなど、人々が平均的に安全で快適な乗り心地であると考えるデータから作成されたベースライン値と比較しました。車が加速したり減速したりする。研究者らは、この研究の AV が、大規模な言語モデルを使用して駆動している間、モデルがまだ学習していないコマンドに応答する場合でも、すべてのベースライン値を上回っていることを発見しました。

Autonomous vehicles could understand their passengers better with ChatGPT, research shows
テスト用自動運転車のトランクにはドライブ・バイ・ワイヤ・システムが組み込まれており、クラウド内の大規模な言語モデルが車両が乗客のコマンドに応答するのを支援できるようになります。写真は左から右へ: Purdue Ph.D.学生のZichong Yang氏とパデュー大学助教授のZiran Wang氏。クレジット: パデュー大学/ジョン・アンダーウッド

今後の方向性

この研究における大規模な言語モデルは、乗客のコマンドを処理するのに平均 1.6 秒かかりました。これは、時間が重視されないシナリオでは許容できると考えられますが、AV がより速く応答する必要がある状況では改善する必要があると Wang 氏は述べています。これは大規模な言語モデル全般に影響を及ぼす問題であり、大学の研究者だけでなく業界も取り組んでいます。

この研究の焦点では​​ありませんが、ChatGPT のような大規模な言語モデルは「幻覚」を起こしやすいことが知られています。つまり、学習したものを誤解し、間違った方法で応答する可能性があります。ワン氏の研究は、大規模な言語モデルがコマンドを誤解した場合でも参加者が安全に乗車できるようにするフェイルセーフ機構を備えた設定で実施された。参加者の乗車を通じてモデルの理解力は向上しましたが、自動車メーカーが AV への大規模な言語モデルの実装を検討する前に、幻覚の問題に対処する必要があることが依然として残っています。

自動車メーカーは、大学の研究者が実施した研究に加えて、大規模な言語モデルを使用してさらに多くのテストを行う必要があるでしょう。これらのモデルをAVの制御装置と統合して実際に車両を運転できるようにするには、さらに規制当局の承認が必要になるとワン氏は述べた。

その間、Wang 氏と彼の学生たちは、業界が AV に大規模な言語モデルを追加することを検討するのに役立つかもしれない実験を続けています。

Autonomous vehicles could understand their passengers better with ChatGPT, research shows
このテスト自動運転車は、パーデューのロス・エイド・スタジアムの駐車場でのデモンストレーションの一環として自動運転します。クレジット: パデュー大学 / ジョン・アンダーウッド

ChatGPT をテストする研究以来、研究者らは、Google の Gemini や Meta の Llama AI アシスタント シリーズなど、大規模な言語モデルに基づいて他のパブリックおよびプライベートのチャットボットを評価してきました。これまでのところ、AV での安全で時間効率の高い乗車のためのインジケーターに関して ChatGPT が最高のパフォーマンスを発揮することが確認されています。結果は今後公開される予定です。

次のもう 1 つのステップは、各 AV の大規模な言語モデルが相互に対話できるかどうかを確認することです。たとえば、AV が 4 方向の停留所でどちらを先に進むべきかを決定できるようにすることができます。ワン氏の研究室は、中西部全域に共通する極度の冬の天候下でAVの運転を支援するための大型ビジョンモデルの使用を研究するプロジェクトも開始している。これらのモデルは次のようなものです大規模な言語モデル詳細情報:

Can Cui 他、大規模言語モデルを使用したパーソナライズされた自動運転: フィールド実験、arXiv(2023年)。DOI: 10.48550/arxiv.2312.09397雑誌情報:

arXiv 引用

:自動運転車は ChatGPT を使用して乗客をよりよく理解できることが研究で判明 (2024 年 9 月 16 日)2024 年 9 月 16 日に取得https://techxplore.com/news/2024-09-autonomous-vehicles-passengers-chatgpt.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。