최신연구
-
[최승문 교수] 소리와 진동의 다감각 통합을 이용한 관통형 팬텀 감각 증진
[연구의 필요성] 관통형 팬텀 감각은 신체 전·후면 사이를 자극이 통과하는 듯한 착각을 유도하여, 가상 환경에서 매우 독특하고 몰입감 있는 촉각 경험을 제공할 수 있다. 그러나 기존 연구는 주로 시각 자극과의 결합만을 다루었으며, 청각 자극과의 통합이 이러한 관통 감각의 현실감과 방향 인지, 사용자 만족도에 어떤 영향을 미치는지는 알려져 있지 않았다. 특히, 게임이나 VR 환경에서 소리와 촉각이 함께 제공되는 경우가 많음에도 불구하고, 두 감각의 의미적 일치도와 조화가 착각의 강도와 몰입감에 미치는 영향에 대한 체계적인 분석은 부족했다. 따라서 본 연구는 다양한 청각 단서와 관통형 진동 자극을 결합하여, 다감각 통합이 감각의 사실성·방향성·감정 반응에 미치는 영향을 실험적으로 규명하고, 이를 통해 몰입형 인터페이스 설계에 필요한 실질적인 지침을 제공하고자 한다. [포스텍이 가진 고유의 기술] 본 연구는 전·후면에 부착된 최소 수의 진동 액추에이터를 이용하여 관통형 팬텀 감각을 정밀하게 구현하는 기술을 기반으로 한다. 이 진동 자극은 시간에 따른 진폭 변조(γ=3)로 설계되어, 실제 관통감을 효과적으로 유발한다. 여기에 게임 환경에서 빈번히 사용되는 다섯 가지 유형의 청각 자극을 결합하고, 자극 간 시간 동기화 및 의미적 조화를 세밀하게 제어함으로써, 청각·촉각 통합 효과를 정량적으로 분석하였다. 특히, 포스텍은 VR·게임 환경과 같은 실제 응용 시나리오를 고려하여, 다양한 음향-진동 매핑 조건을 실험 설계에 반영하고, 통계 분석을 통해 감각 조화와 착각 강도 간의 상관관계를 도출하는 고유의 실험·분석 능력을 보유하고 있다. [연구의 의미] 연구 결과, 관통과 관련된 청각 자극(예: 총격, 칼 관통)과 관통형 진동 자극을 함께 제시했을 때, 현실감·방향 인지·만족도가 모두 유의하게 향상되었으며, 청각과 촉각의 의미적 조화가 높을수록 착각의 강도도 크게 증가함을 확인하였다. 이는 다감각 통합이 단순한 감각 합산을 넘어, 청각 자극의 의미 해석 자체를 변화시킬 수 있음을 보여준다. 예를 들어, 총격음이 단독으로 제시될 때는 외부 사건으로 인식되었으나, 관통형 진동과 결합되면 실제로 피격되는 경험으로 해석되었다. 이러한 결과는 VR·게임·훈련 시뮬레이션 등에서 사용자 몰입도와 감각적 사실성을 동시에 높일 수 있는 핵심 설계 전략을 제시한다. [연구결과의 진행 상태 및 향후 계획] 현재 관통형 팬텀 감각과 청각 자극의 결합에 대한 실험적 분석을 완료하였으며, 각 조건별 주관적 평가와 정서 반응, 의미 해석 변화를 규명하였다. 향후 연구에서는 소리의 음높이와 진동 주파수를 매칭하여 감각 조화를 극대화하는 조건을 탐구하고, 관통 방향을 전·후면뿐 아니라 좌·우, 사선 등으로 확장하여 다양한 신체 부위에서의 효과를 검증할 예정이다. 또한, 공간 음향과의 결합을 통해 3D 환경에서 방향 인지와 몰입감을 강화하고, 생리 신호 기반의 정량 지표(심박 변이도, 피부 전도도 등)를 도입하여 감각 효과를 보다 객관적으로 측정할 계획이다. 이를 통해, 개인 맞춤형 다감각 피드백 시스템 설계로 확장 가능성을 넓히고자 한다. [성과와 관련된 실적] 국제 학술지 논문: Hyunuku Kim, Dajin Lee and Seungmoon Choi, “Enhancing Body-Penetrating Phantom Sensations Through Multisensory Integration of Sound and Vibration,” IEEE World Haptics Conference (WHC), 2025 [성과와 관련된 이미지] [그림 1] 소리 유형과 렌더링 방식에 따른 관통, 방향성, 만족도, 조화 및 감정 반응 측정 결과. [그림 2] 소리와 진동 자극 조건별 소리 해석의 변화 양상.
최승문 교수 2025.09.08 837 -
[최승문 교수] XR 상호작용을 위한 스마트 링 진동 피드백 기반 핀치 제스쳐 증강: 지각적 분석 및 가이드라인
[연구의 필요성] 확장현실(XR) 기술이 발전하며 맨손 상호작용(bare-hand interaction)을 위한 자연스러운 햅틱 피드백의 중요성이 커지고 있다. 주요 글로벌 기업들은 이미 물리적, 가상 환경을 넘나드는 자연스러운 상호작용을 위해 맨손 인터페이스를 적극적으로 도입하고 있다. 이러한 기술은 기존의 컨트롤러와 달리 휴대성이 높고 손의 움직임을 방해하지 않는 햅틱 장치를 필요로 한다. 스마트 링은 효과적인 대안이 될 수 있지만, 링 형태 장치가 제공하는 햅틱 피드백의 사용자 지각 효과에 대한 심층적인 연구는 부족한 실정이다. 따라서 더욱 풍부하고 다채로운 상호작용 경험을 제공하기 위해서는 햅틱 자극과 인간의 지각 관계를 명확히 규명하고자 한다. [포스텍이 가진 고유의 기술] 본 연구에서는 XR 환경의 대표적인 상호작용 방식인 '핀치 선택' 동작 시, 스마트 링을 통해 손가락에 전달되는 진동 촉각 피드백의 지각 공간(Perceptual Space)과 핵심 지각 차원(Perceptual Dimension)을 분석하였다. 이를 위해 주파수, 진폭, 파형, 지속시간을 조절한 36가지의 진동 패턴과 피드백이 없는 조건을 포함하여 총 37개의 피드백을 설계하였다. 두 가지의 지각 실험을 수행하여, 첫 번째 실험에서는 다차원 척도 분석(MDS)을 통해 37개 피드백 간의 지각적 관계를 시각화하는 2차원 지각 공간을 구축했으며, 감각이 주로 주파수와 인지된 강도에 의해 구별됨을 확인했다. 두 번째 실험에서는 7개의 양극 형용사 쌍을 이용해 각 피드백의 감성적 품질을 평가하였고, 그 결과 '사소한-중요한(Trivial-Consequential)'과 '뭉툭한-날카로운(Dull-Crisp)'이 지각 공간을 가장 잘 설명하는 핵심 차원임을 밝혀냈다. [연구의 의미] 본 연구는 스마트 링의 진동 피드백이 핀치 제스처의 감각을 어떻게 증강시키는지에 대한 깊은 이해를 제공하며, 목표로 하는 특정 감각을 유발하기 위한 구체적인 디자인 가이드라인을 처음으로 제시한다. 예를 들어, 주파수를 낮추면 '뭉툭한' 느낌을, 높이면 '날카로운' 느낌을 줄 수 있으며, 진동의 전체적인 에너지(세기)를 높이면 '중요한' 피드백으로, 낮추면 '사소한' 피드백으로 인식시킬 수 있다는 것을 정량적으로 검증했다. 이러한 결과는 향후 생산성 앱, 게임 등 다양한 XR 애플리케이션의 목적에 맞게 햅틱 피드백을 맞춤 설계하거나, 시스템의 상태(예: 성공/실패)에 대한 정보를 사용자에게 직관적으로 전달하는 데 활용될 수 있다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 스마트 링을 활용한 핀치 제스쳐 피드백의 2차원 지각 공간을 성공적으로 구축하고, '사소한-중요한'과 '뭉툭한-날카로운'이라는 핵심 지각 차원을 규명하여 디자인 가이드라인을 도출했다. 향후에는 기본적인 진동 파라미터를 넘어 더 복잡한 패턴의 진동 자극을 통해 더욱 풍부한 의미를 전달하는 연구를 진행할 계획이다. 또한, 사용자의 핀치 동작(속도, 힘 등)을 센서로 감지하여 이에 동적으로 반응하고 피드백을 실시간으로 조절하는 개인화된 햅틱 기술로 발전시켜 나가려고 한다. [성과와 관련된 실적] 국제 학술대회 논문: Soyeon Nam and Seungmoon Choi. 2025. Augmenting Pinch Selection Using Smart Ring Vibration Feedback for Extended Reality Interaction: Perceptual Analysis and Guidelines. 2025 IEEE World Haptics Conference (WHC). [성과와 관련된 이미지] [그림 1] XR 환경에서 맨손 인터랙션을 위한 핀치 제스처와 스마트 링을 통해 제공되는 촉각 피드백 티저 이미지. [그림 2] 세 가지 주파수, 두 가지 파형 형태, 세 가지 지속 시간, 두 가지 진폭을 조합하여 구성된 36개의 진동 자극으로, 핀치 피드백을 보강하기 위해 사용됨. (주파수)-(파형 형태)(지속 시간)-(진폭)으로 표기됨 (예시: 50-R70-W) [그림 3] 37가지 핀치 피드백 간의 지각적 관계를 시각화한 2차원 지각 공간 및 2차원 지각 공간에 7개의 형용사 쌍을 회귀 분석하여 표현한 지각적 축. 계층적 클러스터링을 통해 4개의 그룹(서로 다른 색과 모양)으로 군집화.
최승문 교수 2025.09.08 917 -
[이근배 교수] Mirror: Multimodal Cognitive Reframing Therapy for Rolling with Resistance
[연구의 필요성] 기존의 텍스트 기반 인지행동치료(CBT) 모델은 내담자의 저항(resistance)에 효과적으로 대응하지 못한다는 한계가 있다. 저항은 CBT와 같은 상담치료 과정에서 흔히 발생하는 중요한 도전 과제로, 내담자가 변화를 거부하거나 방어적인 태도를 보이는 현상이다. 이러한 저항은 종종 얼굴 표정, 한숨, 몸짓과 같은 비언어적 단서로 표현되는데, 텍스트 기반 모델은 이를 인식하지 못해 조기 문제 해결에만 치중하거나 공감적 반응을 놓칠 수 있다. 그 결과 조기 문제 해결에 치중하거나 공감적 반응을 놓쳐 치료적 동맹(therapeutic alliance)이 약화되고, 궁극적으로 치료 효과가 저하된다. 따라서 실제 상담 맥락을 반영하고 내담자의 저항을 정밀하게 탐지·관리하기 위해, 언어와 비언어 정보를 함께 통합하는 다중모달(multimodal) 접근의 필요성이 제기된다. [포스텍이 가진 고유의 기술] 본 연구에서는 MIRROR (Multimodal Interactive Rolling with Resistance)라는 새로운 합성 데이터셋을 구축하였다. 이 데이터셋은 내담자 발화와 해당 발화에 대응하는 얼굴 표정을 쌍으로 제공하며, 인지적·정서적·행동적 저항을 포함한 다양한 유형의 저항을 시뮬레이션한다. 이를 위해 (1) 텍스트 기반 CBT 데이터를 기반으로 한 상담 대본(screenplay) 생성, (2) GPT 기반 모델을 활용한 감정적 동작 지시문 (stage direction) 부여, (3) 얼굴 이미지 합성을 통한 표정 생성 과정을 결합하였다. 또한 Emotional Captioning 모듈을 도입하여, 모델이 내담자의 표정에서 감정 상태를 추출하고 이를 상담 반응에 반영하도록 하였다. 이를 통해 모델은단순한 텍스트 대응을 넘어, 비언어적 단서를 고려한 공감적이고 맥락적으로 적합한 대응을 생성할 수 있다. [연구의 의미] MIRROR는 저항 상황을 다루는 최초의 다중모달 CBT 데이터셋이라는 점에서 학문적·실용적 의의가 크다. 기존 연구들이 대체로 텍스트 기반 상담이나 단일 이미지 수준의 감정 인식에 머물렀던 것과 달리, 본 연구는 턴 단위로 얼굴 표정을 동반한 대화를 제공하여 실제 상담의 동적인 감정 변화를 반영했다. 또한, 모델 평가 결과 MIRROR로 학습한 VLM 기반 상담사는 기존 텍스트 모델 대비 내담자와의 협력(collaboration), 정서적 유대(affective bond), 저항 관리 능력에서 우수한 성과를 보였다. 이는 AI 상담사가 상담 과정에서 저항을 효과적으로 다루고, 내담자와의 신뢰 관계를 형성하는 데 기여할 수 있음을 시사한다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 EMNLP 2025에서 발표될 예정이며, MIRROR 데이터셋과 코드도 함께 공개될 계획이다. 앞으로는 얼굴 표정과 발화를 넘어 음성, 몸짓 등 다양한 비언어적 신호를 포함하고, 단일 세션을 넘어 다중 세션 상담 데이터로 확장함으로써 장기적인 상담 관계와 더 깊은 인지 재구조화를 반영할 수 있는 AI 상담사 모델 개발을 지향한다. [성과와 관련된 실적] EMNLP 2025 Main Accept/ 김수빈, 김훈래, 이지현, 전예진, 이근배 / Mirror: Multimodal Cognitive Reframing Therapy for Rolling with Resistance [성과와 관련된 이미지]
이근배 교수 2025.09.04 981 -
[이근배, 김형훈 교수] Self-Correcting Code Generation Using Small Language Models
[연구의 필요성] 기존 연구는 대규모 언어모델 (GPT, Gemini)을 중심으로 자가 수정 능력을 탐구했으나, 소규모 모델은 생성한 코드를 스스로 점검하고 개선하는 과정에서 한계를 보여 실제 응용에 제약이 있었다. 코드 생성은 정확성과 안정성이 필수적이기에 자원 제약 환경에서도 활용 가능한 소규모 모델의 자기 수정 역량 강화가 필요하다. 그러나 지금까지 소규모 모델이 자기 성찰적 행동을 통해 성능을 향상시킬 수 있는지에 대한 연구는 부족했으며, 이에 본 연구는 누적 보상과 세밀한 보상 체계를 활용한 접근법을 제안하여 초기 응답 품질을 높이고 다중 턴 코드 수정 과정을 통해 실질적 성능 개선을 달성하고자 한다. [포스텍이 가진 고유의 기술] 본 연구는 소규모 언어모델이 다중 턴 코드 수정에서 효과적으로 자기 수정을 수행할 수 있도록 설계된 온라인 강화학습 기반 접근법에 있다. 이를 위해 전체 수정 trajectory를 고려하는 누적 보상 함수를 도입해 초기 정답을 유지하면서 점진적 개선을 유도하고, 단순한 binary 평가를 넘어 부분적 향상까지 반영할 수 있는 (turn-wise) progressive reward function를 적용한다. 이러한 보상 설계는 소규모 모델이 외부 교사 모델에 의존하지 않고도 자기 수정 능력을 내재화하게 하며, 결과적으로 초기 응답 품질을 높이는 동시에 반복적 교정을 통해 성능을 안정적으로 향상시키는 것을 가능하게 한다. [연구의 의미] 본 연구는 소규모 언어모델이 기존에 한계로 지적되던 자기 수정 능력을 강화할 수 있는 새로운 학습 틀을 제시했다는 데 있다. 누적 보상과 점진적 보상을 결합한 온라인 강화학습 방식을 통해, 자원 제약 환경에서도 소규모 모델이 초기 응답의 정확성을 유지하면서 반복적 교정을 통해 성능을 실질적으로 개선할 수 있음을 입증하였다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 자연어처리 분야 우수 국제학술대회인 EMNLP 2025 Findings에 소개될 예정이다. 추후에는 다양한 코드 생성 과제와 더 큰 규모의 모델에 확장 적용하여 일반화 가능성과 성능을 더욱 검증하는 것이다. [성과와 관련된 실적] Jeonghun Cho, Deokhyung Kang, Hyounghun Kim, Gary Geunbae Lee, Self-Correcting Code Generation Using Small Language Models, Findings of EMNLP 2025 [성과와 관련된 이미지]
이근배, 김형훈 교수 2025.09.04 901 -
[이근배 교수] Leveraging What's Overfixed: Post-Correction via LLM Grammatical Error Overcorrection
[연구의 필요성] 기존의 지도학습 기반 소형 모델(sLM)은 보수적으로 수정하는 경향 때문에 정밀도(precision)는 높지만 재현율(recall)이 낮아 오류를 놓치기 쉽습니다. 반대로 거대언어모델(LLM)은 과수정(overcorrection)으로 인해 의미 왜곡과 정확도 저하가 잦습니다. 학습·첨삭 현장에서는 학습자의 오류 인식을 돕기 위해 재현율을 일정 수준 이상 확보하는 것이 핵심이기 때문에, 두 경향의 균형적 해소가 필요합니다. PoCO는 바로 이 sLM의 낮은 재현율과 LLM의 낮은 정밀도의 구조적 한계를 함께 다루기 위한 동기로 제안되었습니다. [포스텍이 가진 고유의 기술] PoCO는 두 단계로 정밀하게 균형을 맞춥니다. - 의도적 과수정 유도: CoT 프롬프트를 변형해 LLM이 “가능한 많은 수정”을 하도록 유도해 잠재 오류를 최대한 끌어올린다(overcorrection triggering). - Post-Correction(복구 중심 미세조정): LLM이 수정한 편집과 정답 편집(gold)이 동일한 경우에만 “올바른 수정”을 선택적으로 끌어와 Recovered Target을 구성하고, gold target + recovered target 두 쌍으로 학습해 과수정 복구(precision↑)와 신규 오류 보정(recall 유지)을 동시에 달성한다. [연구의 의미] PoCO는 BEA-19(dev/test)와 CoNLL-14에서 상위 재현율을 달성하고, BEA-19(dev/test) F0.5 최고를 기록해 PoCO 방법론을 통해 정밀도와 재현율의 균형잡힌 성능 개선을 입증하였습니다. [연구결과의 진행 상태 및 향후 계획] GPT를 통한 과수정 유도 프롬프트 및 Recovered Target 설계를 완료하고, PoCO-Seq/Mix로 학습·평가를 마쳤습니다. 추후 다양한 opensource LLM을 통해 과수정 유도 프롬프트 설계를 진행할 계획입니다. [성과와 관련된 실적] EMNLP 2025 Main Accept/ 박태희, 도희진, 이근배 / Leveraging What's Overfixed: Post-Correction via LLM Grammatical Error Overcorrection [성과와 관련된 이미지]
이근배 교수 2025.09.04 958 -
[이근배, 김형훈 교수] Progressive Facial Granularity Aggregation with Bilateral Attribute-based Enhancement for Face-to-Speech..
Progressive Facial Granularity Aggregation with Bilateral Attribute-based Enhancement for Face-to-Speech Generation [연구의 필요성] 뇌졸중과 같은 외상적 사건을 겪은 개인들은 발화 기능에 심각한 제약을 받아 음성을 통한 의사소통이 불가능해지는 경우가 많습니다. 이러한 상황에서 음성합성 기술은 의사소통을 보조하는 수단으로 활용될 수 있으나, 기존의 TTS는 사용자 고유의 음색을 반영하지 못한다는 한계가 있습니다. 따라서 사용자의 얼굴 이미지를 기반으로 목소리를 예측하고, 이를 활용하여 개인의 고유한 음성을 복원·합성하는 기술은 기존 보조 의사소통 기술의 한계를 극복하고, 사용자 정체성과 심리적 만족감을 동시에 보장할 수 있다는 점에서 중요한 연구적 의의를 갖습니다. [포스텍이 가진 고유의 기술] 본 연구에서는 말을 하지 못하는 화자를 위한 개인 맞춤형 음성 합성 기술을 제안하며, 이를 구현하기 위해 zero-shot 다화자 TTS 모델을 개발하였습니다. 기존 연구들이 다단계 파이프라인이나 외부 사전학습 모델에 의존하는 것과 달리, 본 연구에서는 로컬 얼굴 특징을 점진적으로 통합하여 speaker representation을 형성하고, 성별 및 인종과 같은 특성에 대한 추가적 지도학습(supervised learning)을 적용하였습니다. 또한, 동일 화자의 다양한 얼굴 각도 이미지를 음성과 매칭하는 데이터 증강 기법을 도입하여, 특정 화자의 얼굴 이미지에서 목소리를 예측할 수 있었습니다. [연구의 의미] 본 연구는 얼굴 이미지를 기반으로 화자의 목소리를 예측하고, 이를 활용하여 음성을 합성할 수 있음을 입증함으로써, 새로운 보조 기술 개발의 가능성을 제시합니다. [연구결과의 진행 상태 및 향후 계획] 아예 말을 하지 못하는 사람을 대상으로, 얼굴 근육 신호를 음성으로 생성하는 보조기술 연구를 진행하고자 합니다. [성과와 관련된 실적] EMNLP 2025 Findings Accept/ 전예진, 김영재, 이지현, 김형훈, 이근배 / Progressive Facial Granularity Aggregation with Bilateral Attribute-based Enhancement for Face-to-Speech Generation [성과와 관련된 이미지]
이근배, 김형훈 교수 2025.09.04 830 -
[이근배, 옥정슬 교수] MiLQ: Benchmarking IR Models for Bilingual Web Search with Mixed Language Queries
[연구의 필요성] 실세계에서 이중언어 사용자가 웹 검색이나 AI 에이전트와 소통할 때 언어를 혼합하여 쓰는 것은 자연스러운 현상이며, 이는 검색 시스템의 사용자 경험을 좌우하는 핵심 요소이다. 하지만 이러한 혼합 언어 질의(Mixed-language Query) 환경을 반영하고 검색 모델의 성능을 평가할 공개 벤치마크 데이터셋은 전무했다. 이로 인해 검색 모델이 실제 혼합 언어 질의를 효과적으로 처리하는지 평가할 데이터와 방법이 부재했고, 이중언어 사용자의 검색 경험을 개선하는 모델 개발에 직접적인 한계로 작용했다. 이는 다양한 언어를 자유롭게 구사하는 다국어 화자의 혼합 언어 질의에 강건하게 반응하는 정보 검색 시스템 개발을 위한 기반 연구의 중요성과 필요성을 시사한다. [포스텍이 가진 고유의 기술] 본 연구에서는 최초로 실제 이중언어 사용자가 제작한 Mixed-Language Query 벤치마크(MiLQ)를 구축했다. 8개 언어권의 이중언어 사용자들에게 정교한 지시 사항과 기존 모국어 및 영어로 구성된 질의 데이터셋을 제공하고, 이를 바탕으로 가장 자연스럽고 현실적인 혼합 언어 질의를 생성하도록 했다. 이렇게 구축된 MiLQ는 GPT-Eval과 Human-Eval 등 지표를 통해 높은 품질을 검증받았으며, 별도의 선호도 조사에서는 실제 다른 이중언어 사용자들이 기존 단일 언어 질의보다 혼합 언어 질의를 더 선호하는 것으로 나타났다. 나아가, 구축한 벤치마크를 기반으로 최신 다국어 정보 검색 모델들의 초기 성능 기준(baseline)을 제시했다. 또한, 인공적으로 생성한 코드 스위칭 데이터로 학습시킨 'Mixed-Distill' 모델을 통해, 이러한 코드스위칭 데이터가 강건한 다국어 검색 시스템 개발에 기여할 수 있다는 가능성을 입증했다. [연구의 의미] 본 연구는 그동안 공개 벤치마크의 부재로 다뤄지지 못했던 혼합 언어 정보 검색(MQIR) 분야의 기준이 되는 연구라는 점에서 큰 의미를 가진다. 이번에 구축한 MiLQ 벤치마크는 향후 관련 연구를 촉진하고, 여러 모델의 성능을 객관적으로 비교하는 기준을 제공한다. 또한, 본 연구는 이중언어 사용자가 의도적으로 영어를 혼용하는 것이 영어 문서 검색에 효과적인 전략임을 실험으로 확인했으며, 토큰 수준의 분석을 통해 그 원인을 밝혔다. 이 연구 결과는 실제 이중언어 사용자의 다양한 언어 표현 방식을 반영하여 더 현실적이고 안정적인 정보 검색 시스템을 개발하는 데 기여할 수 있다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 자연어처리 분야 최우수 국제학술대회인 EMNLP 2025에 소개될 예정이며, 구축된 MiLQ 데이터셋은 ELRA(ELRA Language Resources Association)를 통해 무료 평가 라이선스(Free Evaluation License)로 공개하기 위한 등록 절차를 진행 중이다. 추후에는 혼합 언어 범위를 확장하고 언어별 특성을 분석할 계획이다. 또한, 사용자의 질의가 모국어, 영어, 혼합 언어 등 어떤 형태이든 일관되고 강건한(robust) 성능을 보이는 검색 방법론을 연구해 나갈 예정이다. [성과와 관련된 실적] Jonghwi Kim, Deokhyung Kang, Seonjeong Hwang, Yunsu Kim, Jungseul Ok, Gary Geunbae Lee, MiLQ: Benchmarking IR Models for Bilingual Web Search with Mixed Language Queries, EMNLP 2025 [성과와 관련된 이미지] [그림1] 문제 상황 [그림 2] 토큰 수준의 분석 결과
이근배, 옥정슬 교수 2025.09.04 920 -
[이근배, 김형훈 교수] PanicToCalm: A Proactive Counseling Agent for Panic Attacks
[연구의 필요성] 공황발작은 예측 불가능하고 갑작스럽게 찾아와 즉각적이고 안정적인 개입이 필요하지만, 실제 상담 데이터를 수집하기 어렵습니다. 따라서 공황 상황에 특화된 AI 기반 심리적 응급처치(PFA) 모델이 요구됩니다 [포스텍이 가진 고유의 기술] PFA(심리적 응급처치)에 기반한 PACE 데이터셋 구축 LoRA 기반 PACER 모델 개발 (공황 발작 상황에서 공감적이면서도 지시적인 개입 제공). 특히 학습 과정에서 시뮬레이터로 부터 preference signal을 받아 선호 학습 진행 위기 개입 평가를 위한 PANICEVAL 프레임워크 제안 [연구의 의미] 기존의 일반 상담/CBT 모델들이 고강도 위기 상황에서는 적합하지 못한 한계를 극복하고, 공황발작 환자에게 즉각적이고 실질적인 도움을 제공할 수 있는 최초의 PFA 기반 AI 상담 체계를 제시했습니다. 이는 위기 상황에서의 AI 활용 가능성을 크게 확장하는 의미를 가집니다. [연구결과의 진행 상태 및 향후 계획] 현재: PACE 데이터셋 구축 및 PACER 모델 학습, PANICEVAL 평가로 효과 검증 완료. 결과: PACER는 기존 모델(GPT-4o, CBT 모델 등) 대비 안정화와 지시적 개입 측면에서 우수한 성능을 입증.향후 계획: 실제 환자 대상의 실시간 평가, 멀티모달 입력(음성·표정) 확장, 임상 환경 적용 가능성 검증. [성과와 관련된 실적] 2025 EMNLP Main Accept/ 이지현, 민예진, 김산, 전예진, 양성준, 김형훈, 이근배 /PanicToCalm: A Proactive Counseling Agent for Panic Attacks [성과와 관련된 이미지]
이근배, 김형훈 교수 2025.09.04 978 -
[이근배, 김형훈 교수] KOBLEX: Open Legal Question Answering with Multi-hop Reasoning
[연구의 필요성] 최근 대규모 언어 모델(LLM)이 법률 분야에서도 탁월한 성능을 보이고 있지만, 여전히 한계가 존재한다. 기존의 법률 벤치마크들은 대부분 객관식이나 이진 분류에 치중되어 있어, 여러 법 조항을 종합적으로 추론해야 하는 개방형 질문에 대한 LLM의 능력을 제대로 평가하지 못한다. 특히, 법률 분야에서는 부정확하거나 허위적인 정보가 심각한 결과를 초래할 수 있으므로, 답변의 정확성과 근거 조항에 대한 신뢰성 확보가 매우 중요하다. 이러한 문제를 해결하기 위해서는 법 조항에 기반한 심층적인 다단계 추론 능력을 평가할 수 있는 새로운 벤치마크와 방법론이 필요하다. [포스텍이 가진 고유의 기술] 우리 연구팀은 법률 AI의 한계를 극복하기 위해 새로운 한국어 법률 질의응답 벤치마크를 개발했고, 이에 대응하는 방법론 또한 연구했다. - KoBLEX 벤치마크: 법률 전문가와 LLM이 협력하여 구축한 한국 법률 질의응답 벤치마크이며, 다수의 법 조항을 연결해 추론해야 하는 226개의 시나리오 기반 질문과 정답, 그리고 관련 법 조항으로 구성되어 있다. 특히, 기존 벤치마크와 달리 정답의 근거가 되는 법 조항을 명확히 제시해야하는 과제에 초점을 맞추고 있다. - ParSeR 방법론: 복잡한 법률 질문에 대한 관련 법 조항을 효과적으로 검색하는 새로운 방법론이며, LLM의 내재된 지식을 활용하여 '매개변수적 법 조항(parametric provisions)'을 생성하고, 이를 검색 쿼리로 사용해 실제 법 조항 코퍼스에서 가장 관련성 높은 조항을 찾아낸다. 이후 3단계(검색-재순위화-선택) 검색 과정을 통해 신뢰할 수 있는 법적 근거를 확보하고, 이를 바탕으로 정확한 답변을 생성한다. [연구의 의미] KoBLEX benchmark는 LLM이 법 조항에 근거하여 논리적이고 정확한 답변을 생성하는 능력을 평가하는 새로운 표준을 제시한다. 또한, ParSeR는 다단계 추론이 필요한 복잡한 법률 문제에 대해 기존 방법론보다 훨씬 뛰어난 성능을 보인다. 이는 법률 AI 연구의 새로운 방향성을 제시하는 데 크게 기여할 것이다. [연구결과의 진행 상태 및 향후 계획] 현재 코드 및 데이터셋의 공개가 완료되었으며, 추후 질의응답 시스템을 더 개선할 예정이다. [성과와 관련된 실적] Jihyung Lee*, DaeHee Kim*, Seonjeong Hwang, Hyounghun Kim, Gary Lee/ KOBLEX: Open Legal Question Answering with Multi-hop Reasoning EMNLP 2025 Main Accept [성과와 관련된 이미지]
이근배, 김형훈 교수 2025.09.04 1155



