최신연구
[이근배/김형훈 교수] Why Do Multilingual Reasoning Gaps Emerge in Reasoning Language Models?
- 등록일2026.05.20
- 조회수329
-

교수이근배, 김형훈
[연구의 필요성]
최근 reasoning language model(RLM)은 복잡한 추론 문제에서 뛰어난 성능을 보이고 있으나, 영어와 같은 고자원 언어에서는 높은 성능을 보이는 반면 스와힐리어, 텔루구어 등 저자원 언어에서는 성능이 크게 저하되는 multilingual reasoning gap 문제가 존재한다. 기존 연구들은 이러한 성능 격차를 줄이기 위한 다양한 방법을 제시해왔으나, 해당 격차가 왜 발생하는지에 대한 근본적인 원인은 충분히 분석되지 않았다. 이러한 원인을 규명하는 것은 다양한 언어 사용자에게 공평한 AI 서비스를 제공하기 위해 필수적이다.
[포스텍이 가진 고유의 기술]
본 연구에서는 RLM의 다국어 추론 과정을 이해(understanding), 추론(reasoning), 생성(generation)의 세 단계로 나누어 분석하는 stage-wise attribution framework를 제안하였다. 이를 통해 multilingual reasoning gap의 주요 원인이 입력을 올바르게 이해하지 못하는 understanding failure에 있음을 최초로 규명하였다. 또한, reasoning trace 내의 신호를 활용하여 이러한 이해 실패를 자동으로 탐지할 수 있음을 보였으며, 이를 기반으로 필요한 경우에만 입력을 영어로 번역하는 Selective Translation 기법을 제안하였다. 이 방법은 전체 입력 중 약 20%만 번역하면서도 전체 번역(full translation)에 근접한 성능을 달성하여 효율성과 성능을 동시에 확보하였다.
[연구의 의미]
본 연구는 multilingual reasoning gap의 원인을 체계적으로 분석하여, 단순한 성능 개선이 아닌 문제의 근본적인 원인을 규명했다는 점에서 의미가 있다. 특히, 이해 실패가 주요 원인임을 밝힘으로써 향후 multilingual reasoning 모델 설계 방향에 중요한 통찰을 제공한다. 또한 Selective Translation은 비용 효율적으로 성능을 개선할 수 있는 실용적인 방법으로, 다양한 다국어 AI 시스템에 적용 가능하다.
[연구결과의 진행 상태 및 향후 계획]
본 연구는 ACL 2026 Findings에 게재될 예정이다. 향후에는 understanding failure를 모델 내부에서 직접 인식하고, 필요 시 번역을 수행하도록 학습하는 방향으로 확장하여 보다 효율적인 multilingual reasoning 모델을 개발할 계획이다.
[성과와 관련된 실적]
Deokhyung Kang, Seonjeong Hwang, Daehui Kim, Hyounghun Kim, Gary Geunbae Lee, Why Do Multilingual Reasoning Gaps Emerge in Reasoning Language Models?, Findings of ACL 2026
[성과와 관련된 이미지]

[그림1] Attribution Analysis 방법론

[그림2] Attribution Analysis 결과



