최신연구
-
[한욱신 교수] SAFE: Schema-Driven Approximate Distance Join for Efficient Knowledge Graph Querying
[연구의 필요성] 대규모 지식그래프(KG)를 활용한 질문응답 시스템은 신뢰할 수 있는 답변을 주기 위해 두 가지가 동시에 필요하다. 하나는 사용자의 질문을 그래프 형태로 정확하게 바꾸는 것이고, 다른 하나는 그 그래프와 맞는 부분을 거대한 지식그래프 속에서 빠르게 찾아내는 것이다. 지금까지 연구들은 크게 세 가지 방식으로 접근해왔다. 첫째, 질문을 SPARQL 같은 쿼리 언어로 변환하는 방식은 잘못된 변환이 이루어지면 전체 과정이 무너진다는 문제가 있다. 둘째, LLM이 직접 그래프를 탐색하는 에이전트 방식은 질문에 포함된 핵심 개체를 미리 알아야 하고, LLM을 여러 번 불러야 하므로 비효율적이다. 셋째, 질문을 그래프로 바꾼 뒤 그대로 지식그래프에 대입하는 방식은 실제 지식그래프와 구조가 조금만 달라도 매칭이 어렵다. 따라서 기존 방법들은 모두 대규모 지식그래프 환경에서 정확도와 효율성을 동시에 만족시키기 어렵다는 공통의 한계를 가진다. [포스텍이 가진 고유의 기술] 본 연구진은 SAFE(Schema-Driven Approximate Distance Join)라는 새로운 프레임워크를 제안하였다. SAFE의 핵심은 스키마 그래프를 활용해 질문을 그래프로 표현하는 과정에서 생기는 불완전함을 보정하고, 효율적으로 정답 후보를 찾는 것이다. SAFE는 네 단계로 이루어진다. 먼저 LLM이 질문을 바탕으로 초기 그래프를 생성하고, 이후 스키마 그래프에서 근사 탐색을 통해 이 구조를 보정한다. 이때, 질문을 해석하는 과정에서 중요한 연결이 빠지거나 불필요한 노드가 들어가는 실수가 생기더라도 SAFE는 이를 근사적인 경로로 대체해 자연스럽게 연결한다. 이렇게 하면 질문 해석 과정의 오류가 있어도 관련 있는 후보를 여전히 찾을 수 있다. 또한 방대한 지식그래프 전체를 탐색하는 대신, 그 구조를 단순화한 스키마 그래프에서 미리 거리 정보를 계산해 두어 훨씬 빠르고 가볍게 탐색을 진행한다. 다음 단계에서는 타입 제약과 의미적 유사도를 함께 고려해 후보들을 순위화한다. 마지막으로 LLM이 이렇게 좁혀진 후보 그래프를 근거로 최종 답변을 생성한다. [연구의 의미] 본 연구는 기존 방법들이 가진 구조적 불일치와 비효율 문제를 동시에 해결할 수 있는 새로운 패러다임을 제시했다는 점에서 의미가 크다. SAFE는 WebQSP, CWQ, GrailQA 같은 대표적인 벤치마크에서 최신 기법들을 안정적으로 뛰어넘는 성능을 보였다. 특히 새로운 유형의 질문이나 처음 보는 조합에 대해서도 정확도가 높게 유지되었다. 예를 들어 CWQ에서는 79.4%, WebQSP에서는 90.6%, GrailQA 전체에서는 85.5%라는 높은 성능을 기록하였다. 또한 SAFE는 효율성에서도 강점을 보였다. 기존 기법들이 질문 하나를 처리할 때 평균 6회 이상 LLM 호출이 필요했다면, SAFE는 단 두 번의 호출만으로 충분했다. 그 결과 토큰 사용량과 응답 시간 모두 절반 이상 줄어들었다. 단계별 분석 결과, 전체 응답 지연의 대부분은 LLM이 초기 질의 그래프를 만드는 과정에서 발생했으며, 그 이후의 근사 탐색과 매칭 과정은 안정적이고 빠르게 동작하였다. 아울러 모듈별 실험을 통해 근사 거리 탐색, 의미 기반 매칭, 타입 제약 모두가 정확한 답변 생성에 필수적임을 확인하였다. [연구결과의 진행 상태 및 향후 계획] 본 연구진은 SAFE가 현재 ORDER BY, LIMIT, UNION, 복잡한 FILTER와 같은 고급 연산 처리까지 확장하여 더 복잡한 질문에도 대응할 수 있도록 발전시킬 계획이다. 또한 응답 지연의 주요 원인이 되는 초기 질의 그래프 생성 과정을 더 효율적으로 만들기 위해, 프롬프트 최적화와 LLM 추론 경량화를 연구 중이다. 향후에는 더 다양한 유형의 질문과 실제 대규모 지식그래프 환경에서의 실시간 응용을 목표로 하고 있다. [성과와 관련된 실적] Sangoh Lee, Sungho Park, Wook-Shin Han. “SAFE: Schema-Driven Approximate Distance Join for Efficient Knowledge Graph Querying”, EMNLP 2025 Main Conference [성과와 관련된 이미지] 그림 1. 기존 방법들이 질의와 관련된 서브그래프를 정확히 검색하지 못하는 세 가지 사례를 보여주는 예시그림 2. SAFE 프레임워크의 전반적인 동작 과정
한욱신 교수 2025.09.03 986 -
[한욱신 교수] LILaC: Late Interacting in Layered Component Graph for Open-domain Multimodal Multihop Retrieval
[연구의 필요성] 멀티모달 문서(웹페이지·PDF 등)에서 문단·표·이미지처럼 서로 연결된 구성요소를 찾아주는 검색기는, (1) 고정된 단일 단위로만 검색해 불필요한 내용이 섞이는 ‘그라뉼러리티(단위) 문제’와 (2) 하이퍼링크·동일 페이지 등 구성요소 사이의 구조적 연결을 살리지 못해 ‘멀티홉 추론 문제’가 동시에 발생한다. 텍스트 요약 기반(TextRAG) 접근은 시각 정보를 텍스트로 바꾸는 과정에서 핵심 단서가 누락되기 쉽고, 스크린샷 기반(VisRAG) 접근은 보통 ‘페이지 전체’처럼 거친 단위로 임베딩해 질의와 무관한 부분이 많이 섞이며 구성요소 간 링크를 잃어버린다. 이로 인해 정밀 검색과 다단계 추론이 모두 제한된다. [포스텍이 가진 고유의 기술] 본 연구진은 LILaC이라는 새로운 검색 프레임워크를 제안한다. 핵심은 두 가지이다. (1) 이층(layered) 구성요소 그래프: 문단·표·이미지를 ‘문단/표/이미지(거친 단위)’와 ‘문장/표-행/이미지-객체(미세 단위)’의 2계층으로 표현하고, 문서 내·문서 간 관계(하이퍼링크 등)는 상층 간의 엣지로, 상·하층 간 포함 관계는 계층 하향 엣지로 명시한다. 이렇게 하면 후보 생성은 거친 단위에서 빠르게, 최종 판단은 미세 단위에서 정밀하게 할 수 있다. (2) ‘지연 상호작용(late interaction)’ 기반 서브그래프 검색: 온라인 단계에서 질의를 하위 질의로 분해하고(모달리티 분류 포함), 상층 노드에서 후보를 찾은 뒤 빔 서치로 연결 엣지를 따라 확장한다. 각 엣지 점수는 엣지 양 끝의 ‘미세 하위 구성요소(문장·표-행·객체)’와 하위 질의 간 최대 유사도를 합산해 동적으로 계산한다(엣지 임베딩을 전수 계산하지 않아도 됨). 고립 노드·편측 매칭 같은 특수 경우도 처리한다. 요약하면, LILaC은 ‘이층 그래프 표현 + 지연 상호작용 서브그래프 탐색’으로 멀티모달·다단위 정보를 효율적이면서도 정밀하게 결합한다 [연구의 의미] LILaC은 추가 파인튜닝 없이 5개 벤치마크 모두에서 SOTA 성능을 달성했다. 특히 VisRAG-Ret·ColPali 대비 평균 Recall@3은 각각 12.39%p·9.85%p, MRR@10은 14.45%p·10.49%p 크게 향상됐다. 데이터셋 중에서도 미세 단위·멀티홉 추론이 중요한 MultimodalQA·MMCoQA에서 상대 개선이 두드러진다. 엔드투엔드 QA에서도 Qwen2.5-VL 7B 조합 기준 평균 EM 52.00, F1 58.79로 기존 최적 VisRAG 설정 대비 EM 17.40%p, F1 18.47%p 상승을 보였다. 이는 요약 과정에서 시각 정보가 손실되는 TextRAG의 한계를 넘어, 시각·표·텍스트를 구조적으로 유지한 채 정밀 검색을 수행한 효과로 해석된다. 효율성 측면에서도, 전체 평균 실행 시간은 VisRAG 대비 약 20.76% 느리지만 ColPali보다는 18.24% 빠르며, 생성 단계는 두 방법보다 더 짧다(VisRAG 1.70×, ColPali 1.15×의 생성 시간 소요). [연구결과의 진행 상태 및 향후 계획] 현재 논문 버전은 이층 그래프·엣지 지연 상호작용·질의 분해를 갖춘 LILaC의 전체 파이프라인을 구현·평가했으며, 코드/데이터 산출물은 깃헙 저장소로 공개되어 재현성을 갖췄다. 아울러, 본 연구진은 라일락이 검색 과정에서 실시간으로 질의를 세분화하지 않고 사전에 고정된 정적 질의 분해(static query decomposition)를 사용하고 있으며, 지연 상호작용 또한 멀티홉 추론을 효과적으로 풀지 못하는 경우가 있는 것을 실험적으로 확인하였다. 이를 극복하기 위해 모달리티 간 단서를 단계적으로 추론하며 필요 시 질의를 재분해·재구성하는 동적 추론(dynamic reasoning) 기반의 멀티모달 검색 기법을 개발 중이다. [성과와 관련된 실적] Joohyung Yun, Doyup Lee, Wook-Shin Han. “LILaC: Late Interacting in Layered Component Graph for Open-domain Multimodal Multihop Retrieval,” EMNLP 2025 Main Conference [성과와 관련된 이미지] 그림 1. 기존 방법들이 멀티모달 데이터를 문서를 정확히 검색하지 못하는 사례를 보여주는 예시그림 2. LILaC 프레임워크의 전반적인 동작 과정
한욱신 교수 2025.09.03 926 -
[한욱신 교수] TRIAL: Token Relations and Importance Aware Late-interaction for Accurate Text Retrieval
[연구의 필요성] Late-interaction 기반 다중 벡터 검색 시스템은 대규모 문서 검색에서 속도와 정확도를 크게 향상시켰으나, 토큰 레벨 유사도 점수를 단순 합산하는 방식으로 인해 두 가지 주요 한계가 발생한다. 첫째, 의미 단위(단어·구절)가 토큰화로 분리되어 독립적으로 매칭되면, 문맥상 무관한 문서가 높은 점수를 받을 수 있다(예: “Scott Derrickson”이 “scott”, “derrick”, “##son”으로 나뉘어 불필요한 매칭 발생). 둘째, 관사·전치사 같은 저내용 단어의 영향력을 무시하지 못해 관련성 추정이 부정확해진다. 기존 방법들(ColBERT, COIL 등)은 이러한 토큰 분리와 중요도 문제를 고려하지 않아, 특히 다중 토큰 엔티티나 기능어 중심 쿼리에서 검색 정확도가 제한된다. 이는 검색 엔진·질문응답 시스템 등에서 신뢰할 수 있는 결과를 제공하는 데 장애가 되며, 대형 언어 모델 기반 검색 증강 생성(RAG)에서도 관련 컨텍스트 공급의 질을 떨어뜨린다. [포스텍이 가진 고유의 기술] 본 연구진은 TRIAL(Token Relations and Importance Aware Late-interaction)이라는 새로운 Late-interaction 방식을 제안한다. 핵심은 토큰 관계와 중요도를 명시적으로 모델링하여 관련성 점수를 정밀하게 계산하는 것이다. (1) 토큰 관계 점수: 쿼리·문서 토큰 간 관계를 MLP 기반 Rel 함수로 인코딩하고, 도트 프로덕트로 유사도를 측정한다. 이를 통해 다중 토큰 엔티티(예: 명사구)를 일관된 의미 단위로 취급하며, 부분 매칭 노이즈를 줄인다(예: “Ed Wood” vs. “Robert Wood” 구분). (2) 토큰 중요도 가중치: 쿼리 토큰별 Gate 함수(Mish·ReLU 활성화 기반 2층 네트워크)를 통해 중요도를 예측하고, 관련성 점수에 가중한다. 이는 내용 중심 토큰(명사·형용사)을 강조하고 기능어(관사·보조동사)를 억제한다. 점수 함수는 기존 MaxSim에 관계 점수와 중요도 가중치를 통합하며, 훈련 시 KL 발산·교차 엔트로피 손실과 L1 정규화로 최적화한다. 검색 단계에서는 PLAID 알고리즘을 수정해 쿼리 중요도를 유사도 계산 과정에 반영한다. 요약하면, TRIAL은 ‘토큰 관계 인코딩 + 중요도 가중 메커니즘’으로 기존 Late interaction의 한계를 극복하며 정확성과 효율성을 동시에 달성한다. [연구의 의미] TRIAL은 MSMARCO(nDCG@10 46.3), BEIR(평균 nDCG@10 51.09), LoTTE Search(평균 Success@5 72.15) 벤치마크에서 SOTA를 달성하며, 희소·밀집 검색 방법들을 모두 능가했다. 특히 BEIR에서 SPLADE++ 대비 평균 0.39%p, ColBERTv2 대비 1.14%p 향상됐으며, LoTTE Search에서 ColBERTv2 대비 0.24%p 상승을 보였다. 이는 토큰 관계가 다중 토큰 구절의 의미적 의존성을 포착하고, 중요도 가중이 핵심 용어를 우선시한 효과로 해석된다. Ablation study에서 관계·중요도 제거 시 BEIR 평균이 각각 1.24%p·1.21%p 하락해 각 구성의 기여를 확인했다. 질적 분석에서도 부분 매칭 문서를 낮추고 금문서 순위를 높이는 효과가 뚜렷했다. 효율성 측면에서 쿼리 처리 시간은 ColBERTv2 대비 15.4% 증가(603ms vs. 523ms)에 그치며, 최대 200토큰 입력에서도 1200ms 이내 처리되어 대규모 검색 실용성을 유지한다. POS 태그 분석 결과, 내용 토큰(NOUN·ADJ) 점수가 0.8에서 최대 9.74로 증폭돼 정밀 관련성 추정이 가능해짐을 입증했다. [연구결과의 진행 상태 및 향후 계획] 현재 TRIAL은 MSMARCO 훈련 기반으로 세 벤치마크에서 평가를 완료했으며, 어블레이션·질적 분석을 통해 효과성을 검증했다. 코드와 데이터는 공개되어 재현성을 갖췄다. 그러나 관계 모델링으로 인한 계산 오버헤드, 영어 중심 평가, LoTTE Forum 같은 장문·비공식 쿼리에서의 상대적 약점 등이 한계로 확인됐다. 향후 계획으로는 다국어 확장(형태소 풍부 언어 지원)과 계산 최적화(병렬 GPU 활용 강화)를 통해 효율성을 높이고, 도메인 이동 문제를 해결하기 위해 포럼·장문 쿼리 적응 훈련이 있다. [성과와 관련된 실적] Hyukkyu Kang, Injung Kim, Wook-Shin Han. “TRIAL: Token Relations and Importance Aware Late-interaction for Accurate Text Retrieval,” EMNLP 2025 Main Conference. [성과와 관련된 이미지]
한욱신 교수 2025.09.03 912 -
[김원화 교수] MNM: Multi-level Neuroimaging Meta-analysis with Hyperbolic Brain-Text Representations
[연구의 필요성] 뇌 영상 연구는 다양한 신경학적 현상을 밝히는 데 중요한 역할을 하지만, 개별 연구가 보통 소규모 피험자에 기반하기 때문에 통계적 신뢰성이 떨어지는 한계가 있습니다. 이를 보완하기 위해 여러 연구 결과를 통합하는 메타분석(meta-analysis)이 활용되지만, 기존 접근법은 주로 키워드 기반 검색이나 선형적 매핑에 의존하여 뇌의 위계적 구조를 충분히 반영하지 못했습니다. 그러나 실제 뇌는 큰 영역에서 세부 영역으로 점차 분화되는 위계적(hierarchical) 조직을 가지며, 이러한 특성을 고려하지 않으면 텍스트와 뇌 활성화의 정교한 연관성을 포착하기 어렵습니다. 따라서 뇌–텍스트 간 위계적 관계를 동시에 반영할 수 있는 새로운 분석 방법론이 필요합니다. [포스텍이 가진 고유의 기술] 본 연구의 차별성은 단순히 하이퍼볼릭 공간에 임베딩하는 데 그치지 않고, 뇌 영역 간 및 뇌 영역–기능 간 위계적 질서를 정밀하게 반영할 수 있도록 손실 함수를 설계한 것에 있습니다. 구체적으로, 1. 각도 기반 대조 학습(angle-based contrastive loss)을 통해 텍스트–뇌 활성화 쌍 간 의미적 대응성을 강화하면서 위계적 관계를 손상시키지 않도록 조율하였습니다. 2. 중심 정규화(centroid regularization)를 적용하여 뇌 활성화 임베딩이 텍스트 임베딩보다 상위 수준(보다 일반적 계층)에 위치하도록 하여, 뇌–텍스트 간 위계적 관계를 보존하였습니다. 3. 뇌 구조 위계 가이드(hierarchical loss)를 새롭게 제안하여 전역적 활성화(예: 반구 수준)와 국소적 활성화(예: 특정 ROI) 간의 구조적 서열을 올바르게 반영하도록 학습을 유도하였습니다. 이와 같은 손실 설계는 기존 연구들이 단순한 의미 정렬에만 집중했던 것과 달리, 신경영상 데이터의 다층적 구조와 기능적 위계를 동시에 반영할 수 있는 독창적인 접근법입니다. [연구의 의미] 본 연구는 뇌–텍스트 메타분석에서 단순한 임베딩 매칭을 넘어, 뇌 구조 및 기능의 위계적 질서를 학습 과정에 직접 반영하는 새로운 방법론을 제시하였습니다. 이를 통해: 뇌 영역의 전역–국소적 구조와 기능적 위계가 모델 내에서 명시적으로 고려되어, 기존 접근법보다 해석 가능성(interpretability)이 크게 향상되었습니다. 위계적 제약을 반영한 손실 설계를 통해 교차 모달 검색 및 뇌 활성화 예측에서 정확성과 일관성(consistency)을 동시에 확보할 수 있음을 실험적으로 입증했습니다. 뇌 기능 연구에서 중요한 다층적 인과 구조(coarse-to-fine hierarchy)를 자동적으로 재현할 수 있음을 보여주어, 향후 신경과학적 발견과 AI 기반 뇌 연구의 기반을 마련했습니다. 따라서 본 연구는 하이퍼볼릭 임베딩 위에서 위계적 손실을 정교하게 설계하여 신경영상 데이터의 다층적 구조를 실질적으로 반영한 최초의 메타분석 프레임워크라는 점에서 학문적·실용적 의의를 지닙니다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 의료 인공지능 분야 최우수 국제학술대회인 International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2025)에서 조기 수락 논문(조기 수락률: 9%)으로 채택되었다. [성과와 관련된 실적] Seunghun Baek, Jaejin Lee, Jaeyoon Sim, Minjae Jung, Won Hwa Kim, “MNM: Multi-level Neuroimaging Meta-analysis with Hyperbolic Brain-Text Representations”, Medical Image Computing and Computer Assisted Intervention (MICCAI), 2025. [Provisional accept: ~9%] [성과와 관련된 이미지]
김원화 교수 2025.08.27 1061 -
[김원화 교수] Adaptive Adversarial Data Augmentation with Trajectory Constraint for Alzheimer’s Disease Conversion Prediction
[연구의 필요성] 알츠하이머 병이 발병되기 전의 전구 단계로서 경도인지장애(Mild Cognitive Impairment) 단계가 존재한다. 경도인지장애로 진단받은 환자가 3년 이내로 알츠하이머 병 단계로 악화가 될 경우 이를 진행형 경도인지장애(progressive MCI)라 하고, 반대로 알츠하이머로 진행이 되지 않는 경도인지장애 환자는 안정형 경도인지장애(stable MCI)라고 한다. 경도인지장애 환자들 중 실제로 알츠하이머로 전환되는 진행형 환자들을 식별하는 것이 알츠하이머 조기 진단 및 예방에 중요한 문제이다. 하지만 이러한 종적 신경퇴행성 질병의 데이터의 수는 적고, 특히 진행형 환자의 수는 안정형 환자들의 수보다 훨씬 적은 데이터 불균형(class imbalance)문제까지 있기 때문에, 인공지능 모델이 진행형 경도인지장애 환자와 안정형 경도인지장애 환자의 차이를 학습하는데 어려움이 존재한다. 따라서, 본 연구에서는 진행형 경도인지장애 환자의 뇌 데이터를 증강하고 이렇게 증강된 데이터를 기반으로 진행형과 안정형 경도인지장애를 구분할 수 있는 인공지능 모델을 개발하였다. [포스텍이 가진 고유의 기술] (1) 본 연구에서는 데이터 증강부터 알츠하이머병 발병 예측까지 두 가지 task를 end-to-end로 학습하는 새로운 인공지능 모델을 제시하였다. 즉, 데이터 수가 적은 진행형 경도인지장애 환자의 뇌 데이터를 증강하고, 이렇게 증강된 데이터와 실제 진행형/안정형 경도인지장애 환자들의 데이터를 기반으로 이 환자들이 3년 이내로 알츠하이머병으로 진행이 될지 여부를 구분하는 인공지능 모델을 개발하였다. (2) 경도인지장애 환자의 뇌 데이터를 그룹별(진행형/안정형), 환자별, 뇌 영역별로 나누어 각 단계별로 특징을 관찰, 이를 모델 학습에 반영하였다. 알츠하이머와 관련된 바이오마커를 그룹별로 비교했을 때, 일반적으로, 진행형 환자들이 안정형 환자들보다 알츠하이머 단계 환자들의 바이오마커 값과 유사하다. 따라서, 인공지능 모델이 특징공간(feature space)에서 안정형->진행형->알츠하이머 단계를 선형적 진행 경로로 배치 및 구분할 수 있도록 설계하였다. 진행형 경도인지장애 환자들을 개별적으로 관찰하였을 때, 경도인지장애 진단 후 1년 이내로 알츠하이머 병으로 전환되는 환자가 2년 뒤에 전환되는 환자보다 알츠하이머와 관련된 특징이 강했다. 또한, 진행형 경도인지장애 환자 그룹에서 뇌 영역별로 시간의 흐름에 따른 바이오마커 변화 양상이 다른 것을 관찰하였다. 이러한 환자별, 뇌 영역별 특징은 뇌 데이터 증강 시, 적대적 공격(adversarial attack)의 개념을 활용하여 모델 학습에 반영하였다. 구체적으로, 적대적 공격을 가한 데이터를 증강 데이터로 활용하였으며, 적대적 공격 시 공격의 횟수를 알츠하이머 병 전환 기간에 비례하도록 설정하여 특징 공간에서 환자별 차이를 고려하여 데이터 증강을 수행하였다. 또한, 적대적 공격의 강도는 학습 가능한 파라미터로 설계하였고, 이를 뇌의 각 국소 영역별로 다르게 학습되도록 구성하여 뇌의 영역별 차이를 고려하여 데이터 증강이 가능하다. (3) 증강된 진행형 경도인지장애 데이터가 실제 질병 진행 경로 상에 존재하도록 강제하는 경로 규제(trajectory constraint) 목적 함수를 고안하였다. 이를 통해 관측되지 않은 시점의 경도인지장애 뇌 데이터를 실제 데이터와 유사하게 생성할 수 있다. [연구의 의미] 데이터의 수가 적은 경도인지장애 환자의 뇌 데이터를 생성함으로써, 알츠하이머병 연구에 있어 데이터 부족 문제를 완화하고, 질병 진행 예측의 정밀도 향상에 기여하였다. 특히, 안정형과 진행형 경도인지장애 환자의 특성을 그룹별, 환자별, 뇌의 국소 영역별로 구분하고, 적대적 공격 기법을 사용하여 이러한 특징을 모두 고려한 데이터 증강 방법론을 고안하였다. 이를 통해 기존 연구들이 간과하기 쉬운 데이터의 단계별 특징을 포착할 수 있었다. 또한, 증강된 데이터가 실제 질병 진행 경로 상에 존재하도록 유도하는 경로 기반 제약(trajectory constraint)을 도입함으로써, 관측되지 않은 시점의 뇌 데이터를 생물학적으로 타당한 방식으로 생성할 수 있었다. 본 연구는 희귀하고 불균형한 임상 데이터를 보완하고 이를 기반으로 실제 알츠하이머 예측을 수행할 수 있는 인공지능 모델을 제시함으로써, 향후 알츠하이머 조기 진단 및 예후 예측 모델 개발에 활용 가능성을 제시한다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 의료 인공지능 분야 최우수 국제학술대회인 International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2025)에서 조기 수락 논문(조기 수락률: 9%)으로 채택되었다. 향후 파킨슨병 등 타 퇴행성질환 데이터셋에 본 연구에서 제시한 인공지능 모델을 도입해 의료 분야에서 데이터 부족 문제를 완화하는데 기여할 수 있도록 후속 연구를 진행할 계획이다. [성과와 관련된 실적] Hyuna Cho, Hayoung Ahn, Guorong Wu, Won Hwa Kim, “Adaptive Adversarial Data Augmentation with Trajectory Constraint for Alzheimer’s Disease Conversion Prediction”, Medical Image Computing and Computer Assisted Intervention (MICCAI), 2025. [Provisional accept: ~9%] [성과와 관련된 이미지]
김원화 교수 2025.08.27 923 -
[김원화 교수] MindLink: Subject-agnostic Cross-Subject Brain Decoding Framework
[연구의 필요성] 뇌 디코딩 (Brain Decoding)은 fMRI와 같은 뇌 영상 데이터를 활용하여 인간의 인지·지각 과정을 해석하고, 이를 통해 외부 자극(예: 이미지)을 재구성하는 기술로, 뇌과학과 인공지능 융합 연구에서 핵심적인 위치를 차지한다. 그러나 기존 방법은 개별 피험자별로 별도의 모델을 학습하는 구조를 사용하거나, 3D fMRI 데이터를 1D로 평탄화하여 공간 정보를 손실시키는 문제가 있다. 이러한 한계는 모델의 일반화 성능과 확장성을 저해하며, 특히 다수 피험자를 대상으로 하는 실제 활용에서 제약이 크다. 따라서 공간 구조를 보존하면서 피험자 간 변이를 극복할 수 있는 범용적이고 확장 가능한 뇌 디코딩 프레임워크의 개발이 필요하다. [포스텍이 가진 고유의 기술] 본 연구에서 제안하는 MindLink는 피험자 불변 (subject-agnostic) 특성을 추출하면서 3D fMRI의 공간 구조를 유지하는 범용 뇌 디코딩 프레임워크이다. (1) ROI 추출·제로패딩·패칭 과정을 통해 3D fMRI를 표준화된 정육면체 패치로 분할하고, 이를 3D 비전 트랜스포머에 입력하여 fMRI의 공간 정보를 보존한다. (2) 도메인 적대적 학습 (domain adversarial training)을 적용하여 피험자 고유의 신경 패턴을 제거하고, 다양한 피험자 데이터로부터 공통 표현을 학습한다. (3) fMRI와 이미지 임베딩 간의 간극을 메우기 위해 인스턴스 수준과 토큰 수준의 2단계 정렬 (two-level alignment) 전략을 제안한다. 인스턴스 수준에서는 fMRI 임베딩을 이미지 임베딩과 스케일과 방향을 동시에 정렬해 사전 학습된 확산 모델 (diffusion model)과의 호환성을 확보한다. 토큰 수준에서는 크로스 어텐션 (cross-attention)을 이용해 유연한 토큰 매칭을 수행함으로써 시각적 문맥을 반영한다. [연구의 의미] 본 연구는 인간의 뇌 활동을 기반으로 외부 자극을 해석·재구성하는 뇌 디코딩 분야의 발전에 기여한다. 특히, 다양한 피험자의 데이터를 하나의 모델로 통합 처리할 수 있는 범용적 접근을 제시함으로써, 뇌과학과 인공지능 간의 융합 연구를 한층 가속화할 수 있다. 이러한 기술은 인지과학, 신경과학뿐만 아니라 뇌-기계 인터페이스 (BMI), 보조 의사소통 장치 등 다양한 영역으로 확장 가능하다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 의료 머신러닝 분야 최우수 국제학술대회인 Medical Image Computing and Computer Assisted Intervention (MICCAI 2025)에서 포스터로 발표되었다. 향후 계획으로는 대규모·다도메인 fMRI 데이터셋에 대한 확장 실험을 수행하고, 다양한 감각 자극(예: 청각·촉각) 복원으로의 연구를 추진할 것이다. [성과와 관련된 실적] Sungyoon Jung, Donghyun Lee, Won Hwa Kim, “MindLink: Subject-agnostic Cross-Subject Brain Decoding Framework”, Medical Image Computing and Computer Assisted Intervention (MICCAI), 2025. [성과와 관련된 이미지]
김원화 교수 2025.08.27 1326 -
[김원화 교수] DISCLOSE: Neurodegeneration Dynamics for Alzheimer's Disease Precision Medicine
[연구의 필요성] 알츠하이머병(AD)의 진행을 모니터링하는 것은 환자 치료에 매우 중요하다. 그러나 기존의 연구들은 뇌의 여러 영역에서 발생하는 복잡하고 상호 연관된 신경 퇴행을 간과하며, AD 병리 및 유전자형이 신경 퇴행에 미치는 영향을 제대로 모델링하지 못한다는 한계점을 가지고 있다. 또한, 경도인지장애(MCI) 환자 중 알츠하이머병으로 악화될 가능성이 높은 환자를 식별하는 것은 중요하며, 이를 위해 신경 퇴행의 동역학을 모델링하는 것이 필요하다. [포스텍이 가진 고유의 기술] 본 연구는 알츠하이머병 환자 치료에 필수적인 경도인지장애(MCI-AD)의 진행을 모니터링하는 데 중점을 둔다. 우리는 뇌의 여러 영역에 걸쳐 복잡하게 상호 연관된 신경 퇴행을 모델링하는 새로운 접근 방식인 '신경 퇴행 동역학'을 제시한다. 이를 위해DISCLOSE (Dynamics Individualized by Static Covariates without Longitudinal Screening) 프레임워크를 제안한다. 이 프레임워크는 오직 기준선(baseline)의 아밀로이드-베타 침착과 APOE4 대립유전자 수 정보만으로 환자별 신경 퇴행 동역학을 예측하며, 상미분 방정식(ODE)을 사용하여 모델링한다. 우리는 알츠하이머병 신경영상(ADNI) 데이터셋의 종단 MRI 샘플을 사용하여 DISCLOSE를 평가했으며, 그 결과 DISCLOSE가 장기적인 궤적 예측에서 기존 방법을 능가함을 입증했다. 특히 3년 이상에 대한 예측에서 우수한 성능을 보였다. 이 연구는 개인화된 질병 궤적 모델링에 중요한 진전을 제시하며, 알츠하이머병 관련 유전자형과 병리가 지역별 위축 진행에 미치는 영향을 정량적으로 해석할 수 있도록 제안한다. [연구의 의미] 이 연구는 신경 퇴행 동역학이라는 개념을 도입하여 뇌 영역 간의 관계를 보여주고, 심각한 신경 퇴행의 시작을 예측할 수 있게 한다. 또한, DISCLOSE 프레임워크는 기준선 데이터만을 사용하여 개인별 신경 퇴행 동역학을 도출하여 종단적 모니터링 및 시뮬레이션을 지원한다. APOE4 유전자형 및 초기 아밀로이드 부담 데이터를 통합함으로써, DISCLOSE는 위축 추정 정확도를 크게 향상시키며, 아밀로이드 부담, APOE4 상태 및 진행성 뇌 위축 사이의 복잡한 상호 작용을 포착한다. 이러한 개인별 질병 진행 패턴에 대한 이해는 신경 퇴행성 질환을 개념화하고, 모니터링하며, 궁극적으로 치료하는 방식을 근본적으로 변화시킬 수 있다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 의료영상처리 분야 최우수 국제학술대회인 The Medical Image Computing and Computer Assisted Intervention Society (MICCAI) 2025에 Oral Presentation으로 선정되어 발표될 예정이다. 향후 보다 더 많은 데이터셋에 적용하고 환자별 최적화를 더욱 효과적으로 할 수 있도록 방법론을 고도화 시키는 방법으로 연구를 진행할 예정이다. [성과와 관련된 실적] Wooseok Jung*, Joonhyuk Park*, Won Hwa Kim, “DISCLOSE the Neurodegeneration Dynamics: Individualized ODE Discovery for Alzheimer’s Disease Precision Medicine”, Medical Image Computing and Computer Assisted Intervention (MICCAI), 2025. [*: equal contribution, Oral presentation: 76/3447 = ~2.2%] [성과와 관련된 이미지]
김원화 교수 2025.08.27 783 -
[김원화 교수] Conditional Graph Diffusion with Topological Constraints for Brain Network Generation
[연구의 필요성] 구조적 뇌 네트워크 데이터는 확산 텐서 영상(DTI)의 높은 비용과 트랙토그래피(tractography)와 같은 복잡한 데이터 처리 과정 때문에 확보하기 어렵다. 또한, 의료 데이터셋은 건강한 사람의 표본 크기가 환자보다 훨씬 많은 심각한 클래스 불균형 문제를 흔히 겪는다. 최근의 그래프 생성 모델들이 해결책을 제시할 수 있지만, 필수적인 바이오마커인 위상학적 특징을 보존하는 것을 간과하는 경우가 많아 뇌 네트워크에 적용하기에는 연구가 부족했다. [포스텍이 가진 고유의 기술] 본 연구는 위상학적 동질성(persistent homology)을 활용하여 고충실도 그래프 생성을 보장하는 조건부 그래프 확산 모델(conditional graph diffusion model)을 제안함으로써 이러한 한계에 대처한다. 우리는 특히 클래스 및 구조적 조건화를 통해 뇌 네트워크의 표적 합성을 가능하게 하는 조건 주입형 어텐션(Condition Infused Attention, CIA) 모듈과, 위상학적 일관성을 강화하는 위상 정렬(Topology Aligning, TA) 정규화 기법을 사용하는 조건부 그래프 확산(Conditional Graph Diffusion, ConGD) 모델을 제안한다. 알츠하이머병 신경영상 이니셔티브(ADNI) 데이터셋에 대한 실험 결과, 우리의 접근 방식은 라벨 조건에 따라 고충실도 합성 뇌 네트워크를 생성하며, 이는 다운스트림 그래프 분류 작업에서 예측 성능을 향상시키는 것으로 입증하였다. [연구의 의미] 이 연구는 위상학적 제약 조건이 있는 조건부 그래프 확산 프레임워크인 ConGD를 도입하여 알츠하이머병 단계별 뇌 네트워크를 생성한다. 질병 라벨 및 위상 구조와 같은 조건적 요인을 생성 과정에 통합함으로써, 이 모델은 조건과 매우 관련이 있고 실제 뇌 네트워크와 유사한 뇌 네트워크를 성공적으로 합성한다. ADNI 데이터셋을 사용한 실험 결과는 ConGD가 표적 증강을 통해 클래스 불균형을 효과적으로 완화하고, 결과적으로 다운스트림 분류 성능을 향상시킴을 보여준다. 이 연구는 뇌 네트워크 합성에 있어 위상학적 인식 학습의 중요성을 강조하며, 신경 영상 분석을 향상시키고 의료 응용 분야에서 생성 모델의 활용도를 확장하는 유망한 방향을 제시한다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 의료영상처리 분야 최우수 국제학술대회인 The Medical Image Computing and Computer Assisted Intervention Society (MICCAI) 2025에 포스터로 발표될 예정이다. 향후 연구 계획으로는 다양한 의료데이터에 해당 방법론을 적용하여 데이터를 생성하여 이후에 질병진단모델과 같은 연구에 활용하여 성능을 높이는 등의 연구를 진행할 예정이다. [성과와 관련된 실적] Joonhyuk Park, Donghyun Lee, Guorong Wu, Won Hwa Kim, “Conditional Graph Diffusion with Topological Constraints for Brain Network Generation”, Medical Image Computing and Computer Assisted Intervention (MICCAI), 2025. [성과와 관련된 이미지]
김원화 교수 2025.08.27 752 -
[이원열 교수] Floating-Point Neural Networks Can Represent Almost All Floating-Point Functions
[연구의 필요성] - 인공신경망의 이론적인 표현력에 대한 많은 연구가 있었으며, 이 중 대표적으로 보편근사정리(universal approximation theorem)들이 있다. 특히 완전연결(fully connected) 신경망의 경우, 임의의 연속함수를 원하는 정확도만큼 근사할 수 있음이 잘 알려져있다. - 하지만 이러한 결과들은 모두 "정확한 실수 값과 실수 연산을 다룰 수 있다"는 비현실적인 가정을 하고 있다. 실제 인공신경망은 부동소수점(floating-point) 값과 부동소수점 연산을 이용하여 구현되기에, 실제 상황에는 전혀 적용되지 않는 결과들이다. [포스텍이 가진 고유의 기술] - 부동소수점을 이용하여 정의된 인공신경망이 임의의 부동소수점 함수를 정확히 표현하기 위해서는, 활성화 함수(activation function)의 구별가능성(distinguishability) 조건이 반드시 필요하다는 것을 증명했다. - 위 결과의 역 또한 성립함을 증명했다. 즉, 구별가능성 조건(+ 추가적인 약한 조건)만 만족되면, 부동소수점 인공신경망이 임의의 부동소수점 함수를 정확히 표현할 수 있음을 보인 것이다. - 실제로 널리 사용되는 활성화 함수(예: ReLU, tanh) 중 대다수가 구별가능성 조건을 만족함을 수학적으로 보였다. [연구의 의미] - 지금까지 알려진 "부동소수점 인공신경망의 표현력"에 관한 결과들 중 가장 좋은 결과이다. - 부동소수점 인공신경망이 모든 함수를 표현하기 위한 필요충분 조건을 세계 최초로 찾아냈다. - 널리 쓰이고 있는 활성화 함수에 거의 모두 적용가능한, 강력한 결과이다. [연구결과의 진행 상태 및 향후 계획] - 기계학습 분야 최고학회 중 하나인 ICML에 채택되었고, 학회에서 포스터 발표되었다. [성과와 관련된 실적] Geonho Hwang, Yeachan Park, Wonyeol Lee, Sejun Park. "Floating-Point Neural Networks Can Represent Almost All Floating-Point Functions", ICML 2025. [성과와 관련된 이미지]
이원열 교수 2025.08.18 722



