Herts researchers take a step closer to developing robots able to "act on intuition"
Los robots juegan ajedrez contra el personal y los estudiantes de la Universidad.Crédito: Universidad de Hertfordshire

Investigadores de la Universidad de Hertfordshire han desarrollado un nuevo algoritmo que permitirá a los robots funcionar de forma más intuitiva, es decir, tomar decisiones utilizando su entorno como guía.

El principio es que, a través del algoritmo, elEl agente crea sus propios objetivos.

Por primera vez, el algoritmo unifica diferentes enfoques de establecimiento de objetivos bajo un concepto directamente vinculado a la física y, además, hace que este cálculo sea transparente para que otros puedan estudiarlo y adoptarlo.

El principio del algoritmo está relacionado con la famosa teoría del caos, porque el método convierte al agente en "maestro del caos de la dinámica del sistema".

El estudio ha sidopublicadoen el diariovida prx.Los investigadores de Herts exploraron "modelos de motivación" de robots que imitan los procesos de toma de decisiones de humanos y animales, incluso en ausencia de señales de recompensa claras.

El estudio presenta(IA) fórmulas que calculan una forma para que un robot decida acciones futuras sin instrucciones directas ni intervención humana.

Daniel Polani, profesor de Ciencias de la Computación y autor principal, explica: "En un sentido aplicado, lo que esto podría significar, por ejemplo, es lograr que un robot juegue y manipule objetos por sí solo sin que se le indique que lo haga.

"Podría mejorar la forma en que los robots aprenden a interactuar tanto con los humanos como con otros robots, fomentando comportamientos e interacciones más 'naturales'.

"Esto tiene otras aplicaciones, como el comportamiento de supervivencia de robots semiautónomos colocados en situaciones donde son inalcanzables para un operador humano, como en ubicaciones subterráneas o interplanetarias".

En humanos y animales, una teoría supone la existencia de una "motivación intrínseca", en la que los comportamientos son impulsados ​​únicamente por la interacción entre el ser y su entorno y no por recompensas aprendidas específicas, como la comida.Este artículo traduce con éxito esa teoría de la "motivación intrínseca" en una que puede ser utilizada por agentes robóticos.

El profesor Polani añade: "Este trabajo es apasionante porque ahora podemos implementar en robots un mecanismo similar a los que ayudan a humanos y animales a resolver nuevos problemas sin experiencia previa.

"Esperamos poder aprovechar este trabajo para desarrollar en el futuro más robots parecidos a los humanos con procesos más intuitivos. Esto abre una gran oportunidad para robots más sofisticados con procesos de decisión similares a los nuestros".

La teoría que subyace a este artículo, llamada "maximización del empoderamiento", se ha desarrollado en Herts durante muchos años.Sugiere que al aumentar la gama de resultados futuros, un robot tendrá mejores opciones también en un futuro más largo.Es importante destacar que este método reemplaza y, por lo tanto, posiblemente elimina, los sistemas de recompensa tradicionales (por ejemplo, señales alimentarias).

Si bien la maximización del empoderamiento ha resultado prometedora, aún no se comprende plenamente ni se aplica ampliamente.La mayoría de los estudios solían basarse en simulaciones, mientras calculaban meticulosamente la información necesaria paray la teoría sigue siendo desafiante.

Sin embargo, esta última investigación innovadora tiene como objetivo explicar por qué las motivaciones basadas en el empoderamiento pueden crear comportamientos similares a los de los organismos vivos, lo que podría conducir a robots más motivados intrínsecamente;y además ofrece una forma significativamente mejorada de calcular estas motivaciones.

El profesor Polani dice que los próximos pasos son utilizar este innovador algoritmo para permitir que los robots descubran más sobre el mundo, desarrollando un aprendizaje directo e identificando y perfeccionando nuevas habilidades que impulsarían su valor en escenarios del mundo real.

Más información:Stas Tiomkin et al, Motivación intrínseca en sistemas de control dinámico,vida prx(2024).DOI: 10.1103/PRXLife.2.033009

Citación:El algoritmo acerca a los robots un paso más hacia la capacidad de "actuar según la intuición" (2024, 11 de septiembre)recuperado el 11 de septiembre de 2024de https://techxplore.com/news/2024-09-algorithm-robots-closer-intuition.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.