알고리즘은 로봇을 '직관에 따라 행동'할 수 있는 수준으로 한 단계 더 발전시킵니다.

2024-09-11 17:12:59

허트퍼드셔 대학(University of Hertfordshire)의 연구원들은 로봇이 보다 직관적으로 기능할 수 있도록 하는 새로운 알고리즘을 개발했습니다. 즉, 안내를 위해 환경을 사용하여 결정을 내릴 수 있습니다.

Herts researchers take a step closer to developing robots able to "act on intuition" — 로봇은 대학 교직원 및 학생들을 상대로 체스를 두고 있습니다.크레딧: 하트퍼드셔 대학교

허트퍼드셔 대학교(University of Hertfordshire) 연구원들은 로봇이 보다 직관적으로 기능할 수 있도록 하는 새로운 알고리즘을 개발했습니다. 즉, 환경을 지침으로 사용하여 결정을 내릴 수 있습니다.

원리는 알고리즘을 통해기계 인간에이전트는 자체 목표를 만듭니다.

처음으로 이 알고리즘은 물리학과 직접적으로 연결된 하나의 개념으로 다양한 목표 설정 접근 방식을 통합하고, 더 나아가 다른 사람들이 이를 연구하고 채택할 수 있도록 이 계산을 투명하게 만듭니다.

알고리즘의 원리는 유명한 혼돈 이론과 관련이 있습니다. 그 이유는 이 방법이 에이전트를 "시스템 역학의 혼돈의 주인"으로 만들기 때문입니다.

연구는출판됨일지에PRX 라이프.Herts 연구자들은 명확한 보상 신호가 없는 경우에도 인간과 동물의 의사 결정 과정을 모방하는 로봇 "동기 부여 모델"을 탐색했습니다.

연구에서는 다음과 같이 소개합니다.인공지능(AI) 로봇이 직접적인 지시나 사람의 입력 없이 미래의 행동을 결정할 수 있는 방법을 계산하는 공식입니다.

컴퓨터 과학 교수이자 수석 저자인 Daniel Polani는 "응용적인 의미에서 이것이 의미할 수 있는 것은 예를 들어 로봇이 지시를 받지 않고도 스스로 물체를 놀고 조작하게 하는 것입니다.

"보다 '자연스러운' 행동과 상호 작용을 장려함으로써 로봇이 인간 및 다른 로봇과 상호 작용하는 방법을 배우는 방식을 향상시킬 수 있습니다.

"이것은 지하나 행성 간 위치와 같이 인간 조작자가 접근할 수 없는 상황에 배치된 반자율 로봇의 생존 가능성과 같은 추가 응용 프로그램을 가지고 있습니다."

인간과 동물의 경우, 한 이론은 음식과 같은 특정 학습된 보상보다는 존재와 환경 사이의 상호 작용에 의해서만 행동이 주도되는 "내재적 동기"가 존재한다고 가정합니다.이 논문은 "내재적 동기 부여" 이론을 로봇 에이전트가 사용할 수 있는 이론으로 성공적으로 번역했습니다.

Polani 교수는 "이번 연구는 인간과 동물이 사전 경험 없이도 새로운 문제를 해결하도록 돕는 것과 유사한 메커니즘을 로봇에서 구현할 수 있다는 점에서 흥미롭다"고 덧붙였습니다.

"우리는 이 작업을 기반으로 미래에 보다 직관적인 프로세스로 더욱 인간과 유사한 로봇을 개발할 수 있을 것으로 기대합니다. 이는 우리와 유사한 의사 결정 프로세스를 가진 보다 정교한 로봇에게 큰 기회를 열어줍니다."

"임파워먼트 극대화"라고 불리는 이 논문의 기초가 되는 이론은 수년 동안 Herts에서 개발되었습니다.이는 미래 결과의 범위를 확대함으로써 로봇이 장기적으로 더 나은 옵션을 갖게 될 것임을 시사합니다.중요한 것은 이 방법이 전통적인 보상 시스템(예: 음식 신호)을 대체하여 제거할 수 있다는 것입니다.

권한 부여 극대화는 가능성을 보여주었지만 아직 완전히 이해되거나 널리 적용되지는 않았습니다.대부분의 연구는 시뮬레이션에 의존하면서 필요한 정보를 꼼꼼하게 계산해 왔습니다.복잡한 시스템이론은 여전히 도전적입니다.

그러나 이 최신 혁신적인 연구는 왜 권한 부여 기반 동기가 살아있는 유기체의 행동과 유사한 행동을 생성하여 잠재적으로 더 본질적인 동기를 부여받은 로봇으로 이어질 수 있는지 설명하는 것을 목표로 합니다.또한 이러한 동기를 계산하는 상당히 향상된 방법을 제공합니다.

Polani 교수는 다음 단계는 이 획기적인 알고리즘을 사용하여 로봇이 세상에 대해 더 많은 것을 발견하고 직접 학습을 개발하며 실제 시나리오에서 가치를 창출할 새로운 기술을 식별 및 연마할 수 있도록 하는 것이라고 말합니다.

추가 정보:Stas Tiomkin 외, 동적 제어 시스템의 내재적 동기 부여,PRX 라이프(2024).DOI: 10.1103/PRXLife.2.033009

소환:알고리즘은 로봇을 '직관에 따라 행동'할 수 있는 수준으로 한 단계 더 발전시킵니다(2024년 9월 11일).2024년 9월 11일에 확인함https://techxplore.com/news/2024-09-algorithm-robots-closer-intuition.html에서

다른 언어 버전도 참조하세요: English | 简中 | 正體 | 日本語 | 한국인 | हिंदी | Español