최신연구

[옥정슬 교수] Breadth-First Exploration on Adaptive Grid for Reinforcement Learning

2025-03-18
  • 130

[연구의 필요성]
강화학습에서 에이전트가 희소한 보상 환경(sparse reward environment)에서 효율적으로 탐색하는 것은 여전히 해결되지 않은 핵심 과제임. 특히 복잡한 연속 상태공간에서는 기존의 탐색 기법들이 효율적인 학습을 이끌어내기 어렵다는 한계가 존재함.

[포스텍이 가진 고유의 기술]
주어진 상태 공간을 정적으로 분할한 grid 위에서 탐험 경험을 기반으로 동적으로 refinement를 진행하는 폭 우선 탐색(Breadth-First Exploration)을 수행하는 새로운 프레임워크를 제안함. 제안한 기술은 grid 구조에서 경험을 계층적으로 축정하여, 학습 초기 단계에서 넓은 영역을 빠르게 탐색하고, 정밀한 탐색이 필요한 경우에 집중적으로 탐색을 진행함.

[연구의 의미]
기존 대부분의 탐색 기법이 랜덤성에 의존하였다면, 본 연구는 학습 초기단계에서의 체계적인 탐색에 집중하여 sparse reward 환경에서도 빠르게 유의미한 경험을 수집할 수 있음을 보였음. 또한 이 프레임워크를 복잡한 robot manipulation 및 navigation 환경에서 기존 기법보다 우수한 성능을 검증함.

[연구결과의 진행 상태 및 향후 계획]
본 연구는 ML 분야 최고 수준 학회인 ICML 2024에 accept 되어 발표를 진행함.

[성과와 관련된 실적]
본 연구는 ML 분야 최고 수준 학회인 ICML 2024에 accept 되어 발표를 진행함.
https://youngsikyoon.github.io/BEAG/

[성과와 관련된 이미지]

목록