Los vehículos autónomos podrían comprender mejor a sus pasajeros con ChatGPT, según muestra una investigación

2024-09-16 21:41:03

Imagínese simplemente decirle a su vehículo: "Tengo prisa" y éste lo llevará automáticamente por la ruta más eficiente hacia donde necesita estar.

Autonomous vehicles could understand their passengers better with ChatGPT, research shows — El profesor asistente de la Universidad Purdue, Ziran Wang, se encuentra junto a un vehículo autónomo de prueba que él y sus estudiantes equiparon para interpretar comandos de pasajeros utilizando ChatGPT u otros modelos de lenguaje de gran tamaño.Crédito: Universidad Purdue / John Underwood

Imagínese simplemente decirle a su vehículo: "Tengo prisa" y éste lo llevará automáticamente por la ruta más eficiente hacia donde necesita estar.

Los ingenieros de la Universidad Purdue han descubierto que un vehículo autónomo (AV) puede hacer esto con la ayuda de ChatGPT u otros chatbots posibles gracias a algoritmos de inteligencia artificial llamados modelos de lenguaje grandes.

el estudio, que aparece en el servidor de preimpresiónarXiv, se presentará el 25 de septiembre en la27a Conferencia Internacional IEEE sobre Sistemas de Transporte Inteligentes.Puede ser uno de los primeros experimentos que prueben qué tan bien un AV real puede utilizar grandes modelos de lenguaje para interpretar las órdenes de un pasajero y conducir en consecuencia.

Ziran Wang, profesor asistente en la Escuela Lyles de Ingeniería Civil y de Construcción de Purdue, quien dirigió el estudio, cree que para que algún día los vehículos sean completamente autónomos, necesitarán comprender todo lo que sus pasajeros ordenan, incluso cuando el comando esté implícito.Un taxista, por ejemplo, sabría lo que necesitas cuando le dices que tienes prisa sin que tengas que especificar la ruta que debe tomar el conductor para evitar el tráfico.

Aunque los AV actuales vienen con funciones que te permiten comunicarte con ellos, necesitan que seas más claro de lo que sería necesario si estuvieras hablando con un humano.Por el contrario, los modelos de lenguaje grandes pueden interpretar y dar respuestas de una manera más humana porque están entrenados para establecer relaciones a partir de grandes cantidades de datos de texto y seguir aprendiendo con el tiempo.

"Los sistemas convencionales de nuestros vehículos tienen un diseño de interfaz de usuario en el que tienes que presionar botones para transmitir lo que quieres, o un sistema de reconocimiento de audio que requiere que seas muy explícito cuando hablas para que tu vehículo pueda entenderte", dijo Wang.."Pero el poder de los grandes modelos de lenguaje es que pueden comprender de forma más natural todo tipo de cosas que dices. No creo que ningún otro sistema existente pueda hacer eso".

Realizar un nuevo tipo de estudio

En este estudio, los modelos de lenguaje grandes no manejaban un AV.En cambio, estaban ayudando a conducir el AV utilizando sus funciones existentes.Wang y sus estudiantes descubrieron mediante la integración de estos modelos que un AV no solo podía comprender mejor a su pasajero, sino también personalizar su conducción para satisfacer su satisfacción.

Antes de comenzar sus experimentos, los investigadores entrenaron a ChatGPT con indicaciones que iban desde comandos más directos (por ejemplo, "Conduce más rápido") hasta comandos más indirectos (por ejemplo, "Me siento un poco mareado en este momento").A medida que ChatGPT aprendió cómo responder a estos comandos, los investigadores le dieron a sus grandes modelos de lenguaje parámetros a seguir, exigiéndole que tuviera en cuenta las reglas de tráfico.condiciones del camino, el clima y otra información detectada por los sensores del vehículo, como cámaras y detección y alcance de luz.

Luego, los investigadores hicieron que estos grandes modelos de lenguaje fueran accesibles a través de la nube para un vehículo experimental conAutonomía de nivel cuatro según lo definido por SAE International.El nivel cuatro está a un nivel de lo que la industria considera un nivel totalmentevehículo autónomo.

Cuando el sistema de reconocimiento de voz del vehículo detectó una orden de un pasajero durante los experimentos, los grandes modelos de lenguaje en la nube razonaron la orden con los parámetros que definieron los investigadores.Luego, esos modelos generaron instrucciones para el sistema de conducción por cable del vehículo, que está conectado al acelerador, los frenos, las marchas y la dirección, sobre cómo conducir de acuerdo con ese comando.

Para algunos de los experimentos, el equipo de Wang también probó un módulo de memoria que habían instalado en el sistema que permitía a los grandes modelos de lenguaje almacenar datos sobre las preferencias históricas del pasajero y aprender a factorizarlas en una respuesta a un comando.

Los investigadores llevaron a cabo la mayoría de los experimentos en un campo de pruebas en Columbus, Indiana, que anteriormente había sido una pista de aterrizaje de un aeropuerto.Este entorno les permitió probar de forma segura las respuestas del vehículo a las órdenes de un pasajero mientras conducían a velocidades de autopista en la pista y manejaban intersecciones de dos vías.También probaron qué tan bien estacionaba el vehículo según las órdenes de un pasajero en el estacionamiento del estadio Ross-Ade de Purdue.

Los participantes del estudio utilizaron tanto comandos que los modelos de lenguaje grande habían aprendido como otros que eran nuevos mientras viajaban en el vehículo.Según las respuestas de la encuesta después de sus viajes, los participantes expresaron una menor tasa de incomodidad con las decisiones que tomó el AV en comparación con los datos sobre cómo tienden a sentirse las personas cuando viajan en un AV de nivel cuatro sin ayuda de modelos de lenguaje grandes.

El equipo también comparó el rendimiento del AV con valores de referencia creados a partir de datos sobre lo que las personas considerarían en promedio como un viaje seguro y cómodo, como cuánto tiempo permite el vehículo reaccionar para evitar una colisión trasera y qué tan rápidoel vehículo acelera y desacelera.Los investigadores encontraron que el AV en este estudio superó todos los valores de referencia al usar los modelos de lenguaje grandes para conducir, incluso cuando respondía a comandos que los modelos aún no habían aprendido.

Direcciones futuras

Los modelos de lenguaje grandes en este estudio promediaron 1,6 segundos para procesar la orden de un pasajero, lo que se considera aceptable en escenarios en los que el tiempo no es crítico, pero debería mejorarse para situaciones en las que un AV necesita responder más rápido, dijo Wang.Este es un problema que afecta a los grandes modelos lingüísticos en general y que está siendo abordado tanto por la industria como por los investigadores universitarios.

Aunque no es el foco de este estudio, se sabe que los modelos de lenguaje grandes como ChatGPT son propensos a "alucinar", lo que significa que pueden malinterpretar algo que aprendieron y responder de manera incorrecta.El estudio de Wang se llevó a cabo en una configuración con un mecanismo a prueba de fallas que permitía a los participantes viajar de manera segura cuando los modelos de lenguaje grandes entendían mal las órdenes.Los modelos mejoraron su comprensión a lo largo del viaje del participante, pero las alucinaciones siguen siendo un problema que debe abordarse antes de que los fabricantes de vehículos consideren implementar modelos de lenguaje grandes en los vehículos autónomos.

Los fabricantes de vehículos también necesitarían realizar muchas más pruebas con modelos de lenguaje grandes además de los estudios que han realizado los investigadores universitarios.Además, se requeriría la aprobación regulatoria para integrar estos modelos con los controles del AV para que realmente puedan conducir el vehículo, dijo Wang.

Mientras tanto, Wang y sus estudiantes continúan realizando experimentos que pueden ayudar a la industria a explorar la adición de modelos de lenguaje grandes a los AV.

Desde su estudio que prueba ChatGPT, los investigadores han evaluado otros chatbots públicos y privados basados en grandes modelos de lenguaje, como la serie de asistentes Llama AI de Google Gemini y Meta.Hasta ahora, han visto que ChatGPT tiene el mejor desempeño en indicadores para un viaje seguro y eficiente en el tiempo en un AV.Los resultados publicados están próximos.

Otro próximo paso es ver si sería posible que modelos de lenguaje grandes de cada AV se comuniquen entre sí, para ayudar a los AV a determinar cuál debe ir primero en una parada de cuatro vías.El laboratorio de Wang también está iniciando un proyecto para estudiar el uso de modelos de visión de gran tamaño para ayudar a los vehículos autónomos a conducir en condiciones climáticas invernales extremas, comunes en todo el Medio Oeste.Estos modelos son comograndes modelos de lenguajepero entrenado en imágenes en lugar de texto.Más información:

Can Cui et al, Conducción autónoma personalizada con modelos de lenguaje grandes: experimentos de campo,arXiv(2023).DOI: 10.48550/arxiv.2312.09397Información de la revista:

arXiv Citación

:Los vehículos autónomos podrían comprender mejor a sus pasajeros con ChatGPT, según muestra una investigación (2024, 16 de septiembre)recuperado el 16 de septiembre de 2024de https://techxplore.com/news/2024-09-autonomous-vehicles-passengers-chatgpt.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.

Véase también la versión en otros idiomas: English | 简中 | 正體 | 日本語 | 한국인 | हिंदी | Español