GPT-4 driven robot takes selfies, 'eats' popcorn
Alter3의 본체.본체에는 공기 구동기에 의해 제어되는 43개의 축이 있습니다.각 눈 안에는 카메라가 장착되어 있습니다.제어 시스템은 본체를 제어하기 위해 직렬 포트를 통해 명령을 보냅니다.새로 고침 빈도는 100~150ms입니다.신용 거래:arXiv(2023).DOI: 10.48550/arxiv.2312.06571

도쿄 대학의 연구진은 전통적인 하드웨어 의존 제어를 없애면서 보다 인간과 유사한 제스처를 약속하는 로봇과 대규모 언어 모델 사이에 다리를 구축했습니다.

Alter3는 휴머노이드의 최신 버전입니다.연구원들은 이제 GPT-4를 사용하여 셀카 찍기, 공 던지기, 팝콘 먹기, 에어 기타 연주 등 다양한 시뮬레이션을 통해 로봇을 안내하고 있습니다.

이전에는 이러한 작업을 수행하려면 각 활동에 대한 특정 코딩이 필요했지만 GPT-4를 통합하면 자연어 교육을 통해 학습하는 로봇에 광범위한 새로운 기능이 도입됩니다.

AI로 구동되는 로봇은 "LLM을 활용하여 실제와 같은 반응을 해석하고 가장하는 등 컴퓨터 내에서 생명체와 로봇 간의 기본적인 의사소통을 촉진하는 데 주로 중점을 두었습니다"라고 연구진은 최근 연구에서 밝혔습니다.

"프로그램 코드를 통해 인간 행동의 언어적 표현을 로봇의 신체에 매핑함으로써 직접적인 제어가 가능해졌습니다."라고 그들은 말했습니다.그들은 이러한 발전을 "패러다임 전환"이라고 불렀습니다.

복잡한 작업이 가능한 Alter3움직임을 포함한 세부적인에는 인간의 근골격 운동을 시뮬레이션하는 43개의 축이 있습니다.베이스 위에 놓여 있지만 걸을 수는 없습니다(걷는 모습을 흉내낼 수는 있지만).

메탈 음악을 연주하는 동작입니다.이 모션은 언어 피드백을 통해 GPT4에 의해 생성됩니다.

너무 많은 관절의 조정을 코딩하는 작업은 매우 반복적인 동작을 포함하는 대규모 작업이었습니다.

"LLM 덕분에 우리는 이제 반복적인 작업에서 자유로워졌습니다."라고 저자는 말했습니다.

이제 원하는 동작을 설명하는 구두 지침을 제공하고 LLM에게 Android 엔진을 실행하는 Python 코드를 생성하도록 지시하는 프롬프트를 전달할 수 있습니다.

Alter3는 메모리에 활동을 유지하며 연구자는 해당 동작을 개선하고 조정하여 시간이 지남에 따라 더 빠르고 부드럽고 정확한 움직임을 유도할 수 있습니다.

저자는 셀카 촬영을 위해 Alter3에 제공되는 자연어 지침의 예를 제공합니다.

크고 즐거운 미소를 지으며 눈을 크게 뜨고 설렘을 표현하세요.

상체를 살짝 왼쪽으로 빠르게 돌리며 역동적인 자세를 취합니다.

올리다높음, 전화기를 시뮬레이션합니다.

유령 흉내를 내는 동작.

오른쪽 팔꿈치를 구부려 전화기를 얼굴에 더 가까이 가져옵니다.

머리를 오른쪽으로 살짝 기울여서 장난스러운 분위기를 연출해보세요.

연구원들은 로봇공학 연구에서 LLM을 활용하면 "인간-로봇 협업의 경계를 재정의하여 보다 지능적이고 적응력이 뛰어나며 개성 있는 로봇 개체를 위한 길을 닦습니다"라고 말했습니다.

그들은 Alter3의 활동에 약간의 유머를 주입했습니다.한 시나리오에서 로봇은 팝콘 봉지를 먹는 척했지만 그 봉지가 옆에 앉은 사람의 것임을 알게 되었습니다.과장된 표정과 팔 동작은 놀라움과 당혹감을 전달한다.

카메라가 장착된 Alter3는 인간을 "볼" 수 있습니다.연구원들은 Alter3가 인간의 반응을 관찰함으로써 행동을 개선할 수 있다는 것을 발견했습니다.그들은 그러한 학습을 ​​아동 행동주의자들이 신생아에게서 관찰하는 신생아 모방과 비교했습니다.

연구원들은 GPT-4 연결 로봇의 '제로 샷' 학습 능력이 '인간-로봇 협업의 경계를 재정의할 수 있는 잠재력을 갖고 있어 보다 지능적이고 적응력이 뛰어나며 개성 있는 로봇 개체를 위한 길을 열었습니다'라고 말했습니다.

Takahide Yoshida, Atsushi Masumori 및 Takashi Ikegami가 작성한 논문 "From Text to Motion: Grounding GPT-4 in a Humanoid Robot 'Alter3'"은사용 가능사전 인쇄 서버로arXiv.

추가 정보:Takahide Yoshida 외, 텍스트에서 동작으로: 휴머노이드 로봇 "Alter3"에서 GPT-4 접지,arXiv(2023).DOI: 10.48550/arxiv.2312.06571

프로젝트 페이지:tnoinkwms.github.io/ALTER-LLM/

저널 정보: arXiv

© 2023 사이언스 X 네트워크

소환:GPT-4 구동 로봇이 셀카를 찍고 팝콘을 '먹는다'(2023년 12월 19일)2023년 12월 19일에 확인함https://techxplore.com/news/2023-12-gpt-driven-robot-selfies-popcorn.html에서

이 문서는 저작권의 보호를 받습니다.사적인 학습이나 조사를 목적으로 하는 공정한 거래를 제외하고는 어떠한 행위도 허용되지 않습니다.서면 허가 없이 일부를 복제할 수 있습니다.콘텐츠는 정보 제공 목적으로만 제공됩니다.