최신연구
-
[김슬배 교수] SwarmBox: A Plug-and-Play Drone Swarm Framework for Streamlined Development and Comprehensive Analysis
[연구의 필요성] 군집 드론(Drone Swarm)은 단일 드론으로는 수행할 수 없는 고난이도 및 협력적 임무를 가능하게 하는 기술로, 물류, 정찰, 재난 대응 등 다양한 실전 분야에서 차세대 핵심 플랫폼으로 주목받고 있다. 하지만 군집 드론 연구는 기존의 파편화된 개발 생태계로 인해 발전이 지연되어 왔다. 기존 환경에서는 고수준의 군집 제어 알고리즘과 저수준의 통신 및 비행 제어기 계층 간의 명확한 추상화가 부재하여, 연구자가 군집 로직 자체의 설계와 검증보다는 전체 시스템 스택의 통합에 더 많은 엔지니어링 역량을 투입해야 했다. 그 결과, 새로운 군집 알고리즘을 개발하고 검증할 때마다 매번 맞춤형 테스트베드를 새롭게 구축해야 하는 엔지니어링 오버헤드가 발생했으며, 서로 다른 환경에서 도출된 선행 연구들 간의 공정한 비교와 재현 역시 쉽지 않았다. 또한, 군집 시스템은 다수 에이전트의 상호작용으로 인해 창발적 행동(Emergment Behavior)과 비국소적 결함이 나타날 수 있다는 점에서, 단일 기체 중심의 기존 분석 방법만으로는 이상 현상의 원인을 체계적으로 추적하고 분석하는 것이 거의 불가능하다. [포스텍이 가진 고유의 기술] 본 연구팀은 Plug-and-Play 방식의 오픈소스 군집 드론 프레임워크인 SwarmBox를 제안한다. SwarmBox는 고수준의 군집 행동 논리와 저수준의 비행 제어 및 하드웨어 종속성을 분리하는 논리-환경 격리(Logic-Environment Isolation) 아키텍처를 설계 및 도입하여 구현 복잡성을 낮추고 시뮬레이션-현실 간 충실도(fidelity)를 높였다. 또한, 파편화된 개별 드론의 로그를 단일 타임라인으로 통합 및 동기화하는 군집 수준 통합 로거 및 분석기반을 개발하여, 전체 시스템 계층에 걸친 인과관계의 재구성이 가능하도록 설계하였다. 이는 군집의 창발적 행동을 분석하고 진단할 수 있게 하며, 동일한 조건에서 구성요소의 성능을 엄밀하게 비교할 수 있는 표준화된 벤치마킹 환경을 제공한다. [연구의 의미] - SwarmBox는 군집드론 구축에 있어 반복적으로 시행되던 하드웨어 연동 및 통신 관리 등 보일러플레이트 코드 작성을 배제함으로써 군집 알고리즘 구현에 필요한 엔지니어링 노력을 비약적으로 감소시킨다. - 군집드론 개발 및 연구의 실용성을 제한하는 물리적 시험 한계를 최소화할 수 있도록 순수 소프트웨어 시뮬레이션 (SITL)부터 하드웨어 기반 시뮬레이션 (SIH), 실제 기체 비행까지 어떠한 코드 수정 없이 동일한 로직으로 실행이 가능하여 시뮬레이션과 현실 간의 구현 간극 (Sim-to-Real Gap)을 구조적으로 제거하고 검증하였다. - 기존의 단일 기체 로그 분석으로는 원인을 찾기 힘들었던 에이전트 간 통신 지연이나 센서 오류 등 복잡하게 얽혀 있는 분산 시스템 오동작 원인 분석 및 오류 진단을 효과적으로 이루어낼 수 있다. - 통제된 실험 환경을 통해 다양한 알고리즘의 공정한 벤치마킹을 지원하며, 커뮤니티 주도의 재현 가능한 로보틱스 연구를 위한 실질적인 표준 기반을 확립했다. - 에이전트 간 상호 의존성, 동적 환경 변화, 그리고 다양한 제어 아키텍처를 요구하는 서로 다른 임무 시나리오를 테스트하며 범용성과 더불어 최대 36대 규모의 대규모 군집 운용에 대한 확장성을 입증하였다. [연구결과의 진행 상태 및 향후 계획] - 본 연구는 소프트웨어 공학 분야 최고 권위의 국제 학술대회인 FSE 2026 (ACM International Conference on the Foundations of Software Engineering)에 게재 승인되었으며, 해당 논문은 Proceedings of the ACM on Software Engineering (PACMSE)의 Issue FSE 2026으로 출판될 예정이다. - 실제 개발자 커뮤니티 주도의 혁신을 촉진하기 위해 프레임워크의 전체 소스 코드, 결과 데이터셋, 벤치마크 시나리오 등을 오픈소스의 형태로 공개하였다. - 향후 다양한 네트워크 구조 및 비행 제어 스택과 기체 유형을 대상으로 구조적 지원 범위를 넓히고 검증을 확장해 나갈 계획이다. [성과와 관련된 실적] Minki Lee, Seojin Lee, and Seulbae Kim. "SwarmBox: A Plug-and-Play Drone Swarm Framework for Streamlined Development and Comprehensive Analysis", Proceedings of the ACM on Software Engineering (PACMSE), Volume 3, Issue FSE, 2026. (To Appear) [성과와 관련된 이미지] 그림 1. SwarmBox 전체 구조도
김슬배 교수 2026.04.07 342 -
[한욱신 교수] SPARTA: Scalable and Principled Benchmark of Tree-Structured Multi-hop QA over Text and Tables
[연구의 필요성] 표(Table)와 텍스트(Text)가 혼합된 데이터에서 복잡한 질문에 답하는 기술은 현대 AI의 핵심 역량 중 하나이다. 하지만 기존의 벤치마크 데이터셋(HybridQA, OTT-QA 등)은 세 가지 치명적인 한계를 지니고 있다. 첫째, 사람이 수작업으로 문제를 만들다 보니 오류율이 최대 21~30%에 달할 정도로 데이터 품질이 낮다. 둘째, 추론 과정이 단순한 선형 구조에 그치며, 데이터 규모 또한 평균 15행 내외의 소규모 '장난감(Toy)' 수준에 머물러 있다. 셋째, 실제 비즈니스 환경에서 필수적인 집계(Aggregation)나 그룹화(Grouping)와 같은 고차원적인 분석 연산이 거의 포함되지 않았다. 따라서 LLM의 진정한 복잡 추론 능력을 평가하기 위해서는 대규모의 정교하고 신뢰할 수 있는 새로운 벤치마크 생성 프레임워크가 절실히 필요한 실정이다. [포스텍이 가진 고유의 기술] 본 연구진은 이러한 한계를 극복하기 위해, 대규모의 트리 구조 다중 단계(Tree-structured Multi-hop) 질의응답 데이터를 자동으로 생성하는 혁신적인 프레임워크 SPARTA를 제안하였다. SPARTA는 먼저 비정형 텍스트를 원자적 사실로 분해하여 표 형태의 '그라운딩 테이블'로 변환하고, 이를 기존 소스 표와 통합하여 모든 정보를 SQL로 조회 가능한 '참조 사실 데이터베이스(Reference Fact Database)'를 구축한다. 이후 LLM이 복잡한 SQL 쿼리를 생성할 때, 실행 결과가 없는 오류를 방지하기 위해 '근거 기반 정제(Provenance-Based Refinement)' 기술을 적용한다. 이는 결과가 나오지 않는 원인(Why-not provenance)을 분석해 질의 조건을 자동으로 수정함으로써 쿼리의 실행 가능성을 보장한다. 또한, 실제 분석가의 사고방식을 모방하는 '실제 구조 강제(Realistic-Structure Enforcement)' 기법을 통해 사람이 질문한 것과 같은 자연스러운 질의응답 쌍을 생성해낸다. [연구의 의미] 본 연구는 기존 수작업 방식 대비 주석 작업 시간을 4분의 1로 단축하면서도, 100개 질의 샘플링 검사 결과 오류율 0%라는 압도적인 데이터 신뢰도를 달성했다. SPARTA는 수천 행 이상의 대규모 데이터를 다루며, 단순한 나열을 넘어 집계 및 그룹화가 포함된 복잡한 트리 구조 추론을 요구한다. 실험 결과, 기존 벤치마크에서 우수한 성능을 보였던 최첨단(SOTA) 모델들이 SPARTA에서는 F1 점수가 30점 이상 급락하는 모습을 보였다. 이는 현재의 AI 모델들이 복잡한 교차 모달(Cross-modal) 추론에서 여전히 큰 한계를 가지고 있음을 정밀하게 타격하여 보여준 것으로, 향후 더욱 강력하고 견고한 QA 시스템 개발을 위한 새로운 이정표를 제시했다는 점에서 그 의의가 매우 크다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 인공지능 분야 세계 최고 권위의 학술 대회인 ICLR 2026에 게재되어 발표될 예정이다. SPARTA는 현재 NBA, 영화, 의료 등 다양한 도메인을 지원하고 있으며, 연구진은 향후 이 프레임워크를 더욱 확장하여 금융, 법률 등 전문 지식이 필요한 복잡한 산업 분야나 이미지, 비디오와 같은 새로운 모달리티를 지원하도록 방법론의 적용 범위를 넓힐 계획이다. 또한, 본 연구를 통해 드러난 LLM의 추론 취약점을 보완할 수 있는 새로운 모델 구조 및 학습 방법론에 대한 후속 연구를 활발히 진행하고있다. [성과와 관련된 실적] Park, S., Kim, J., and Han, W., “SPARTA: Scalable and Principled Benchmark of Tree-Structured Multi-hop QA over Text and Tables,” In Proc., the 14th International Conference on Learning Representations, ICLR, Rio de Janeiro, Brazil, April 2026. (관련 홈페이지) https://sparta.postech.ac.kr/ [성과와 관련된 이미지] 그림 1. 표와 텍스트를 아우르는 다중 단계 추론을 보여주는 SPARTA 벤치마크의 질의 예시 그림 2. 참조 사실 DB 구축, 질의 생성 및 구어화로 이어지는 SPARTA 프레임워크의 전반적 과정 그림 3. 근거 기반 정제(Provenance-based Refinement) 기술을 통한 질의 생성 및 오류 수정 과정
한욱신 교수 2026.03.23 392 -
[한욱신 교수] Batcher: Learning to Construct Cost-Efficient Batches of Small Queries in Big Data Processing Platforms
[연구의 필요성] Spark, Flink, Snowflake와 같은 빅데이터 처리 플랫폼은 대규모 데이터 분석에 강점을 가지지만, 최근 실제 서비스 환경에서는 대량의 소형 질의(small queries)가 빠르게 유입되는 워크로드가 중요한 비중을 차지하고 있다. 이러한 소형 질의는 개별 연산량은 작지만 질의마다 발생하는 설정(setup) 및 입출력(I/O) 오버헤드의 비중이 커서 전체 처리 지연이 크게 증가하는 문제가 있다. 기존에는 여러 소형 질의를 하나의 큰 질의로 합치는 방식이 제안되었으나, 단순 병합은 실행 구조가 다른 질의들을 함께 묶어 짧은 질의가 긴 질의를 기다리게 만드는 새로운 병목을 유발한다. 따라서 소형 질의들을 비용과 구조를 고려해 효율적으로 배치(batch) 구성·스케줄링 하는 기술이 필요하다 [포스텍이 가진 고유의 기술] 포스텍 연구진이 개발한 Batcher는 소형 질의들을 무작위로 합치지 않고, 질의 처리 시간과 실행 계획의 DAG 구조를 함께 고려해 최적의 배치를 구성하는 지능형 배치 기술이다. Batcher는 먼저 질의별 실행 비용을 예측하고, 이후 질의 실행 시간과 DAG 기반 실행 구조의 유사성을 기준으로 질의들을 2단계로 군집화한다. 이어 반복적 개선(iterative refinement)을 통해 평균 turnaround time을 최소화하는 배치 구성을 찾고, 배치별 비용 추정과 비용 기반 배치 스케줄링으로 처리 순서를 정한다. 또한 배치 내부에서는 공통 서브쿼리 결과를 재사용하여 중복 연산을 줄임으로써 추가 성능 향상을 달성한다. 이 과정에서 배치 비용 추정에 경량 MLP 모델을 적용하고, 증분형 군집 갱신 기법을 활용해 높은 질의 유입 환경에서도 낮은 오버헤드로 의사결정을 수행할 수 있도록 설계한 것이 핵심이다. [연구의 의미] 본 연구는 빅데이터 플랫폼에서 문제가 되는 소형 질의 워크로드를 대상으로, 단순 질의 병합을 넘어 배치 구성–비용 예측–스케줄링–공통 연산 재사용을 통합한 실용적 처리 체계를 제시했다는 점에서 의미가 크다. Batcher는 실제 거래 데이터 기반 평가에서 기존 Spark 처리 방식과 최신 소형 질의 처리 기법(QaaD) 대비 일관된 성능 향상을 보였으며, Spark 환경에서 최대 5.4배의 성능 개선을 달성했다. 또한 혼합 우선순위 워크로드에서도 높은 우선순위의 소형 질의를 효과적으로 우선 처리했으며, Flink 기반 대규모 스트림 환경으로 확장한 실험에서도 네이티브 방식 대비 최대 100.2배 빠른 성능을 보여, 다양한 빅데이터 처리 플랫폼에 대한 확장 가능성과 실용성을 입증했다. [연구결과의 진행 상태 및 향후 계획] 본 연구 성과는 데이터베이스 분야 최상위 학술대회인 ICDE 2026에 게재가 확정되었다. 현재 Batcher는 Spark 상에서 설계·구현과 실증 평가를 완료한 상태이며, 실제 거래 데이터셋(BRA, eBay) 기반 실험에서 성능 향상을 확인하였다. 또한 Flink 환경에서도 대규모 스트림 워크로드에 대한 확장 가능성을 검증하였다. 향후에는 이러한 결과를 바탕으로 다른 빅데이터 처리 환경으로의 적용 범위를 넓히고, 배치 구성 및 실행 효율을 더욱 고도화하는 방향으로 후속 연구를 추진할 수 있다. [성과와 관련된 실적] Park, Y., Lee, T., Tak, B., and Han, W., “Batcher: Learning to Construct Cost-Efficient Batches of Small Queries in Big Data Processing Platforms,” In Proc., the 42nd IEEE International Conference on Data Engineering, IEEE ICDE, Montreal, Canada, May 2026 [성과와 관련된 이미지]그림 1. Batcher 의 아키텍처 및 질의 처리 과정
한욱신 교수 2026.03.23 270 -
[한욱신 교수] TurboLynx: Schemaless Graph Engine Strikes Back for General-Purpose Analytics
[연구의 필요성] 그래프 데이터베이스 관리 시스템(GDBMS)은 복잡한 관계를 자연스럽게 표현하고 탐색할 수 있어, 소셜 네트워크, 지식 그래프, 금융 거래망 등 다양한 분야에서 널리 활용되고 있다. 최근에는 사전에 고정된 스키마 없이도 노드와 엣지에 자유롭게 속성을 부여할 수 있는 '스키마리스(schemaless)' 프로퍼티 그래프 모델(PGM)이 주목받고 있다. Neo4j, Memgraph 등의 주요 GDBMS들이 이를 지원하며, 데이터 구조가 사전에 완전히 정해지지 않은 환경이나 빠른 변경이 잦은 환경에서 특히 유용하다. 그러나 이러한 스키마리스 그래프를 지원하는 기존 GDBMS들은 그룹화, 집계, 복합 분석 질의에서 성능 저하가 크다는 한계가 있다. 이는 스키마리스 처리가 저장, 질의 처리, 질의 최적화 전 계층에서 일관되게 반영되지 않은 점이 주요한 원인이다. 특히 기존 시스템은 행 기반 저장으로 인해 튜플 단위의 스키마 해석 오버헤드가 크고, 다양한 스키마가 혼재되어 벡터화 적용이 어렵고, 자체 질의 최적화기의 성숙도도 충분하지 않아 복잡한 분석 질의에서 비효율이 발생한다. [포스텍이 가진 고유의 기술] 포스텍 연구진은 이러한 한계를 해결하기 위해 스키마리스 그래프 데이터를 저장부터 질의 최적화까지 통합적으로 처리하는 그래프 분석 엔진 TurboLynx를 제안하고 구현하였다. 핵심 기술은 세 가지다. 첫째, CGC(Cost-based Graphlet Chunking)를 통해 유사한 속성 집합을 가진 데이터를 그래플릿 단위로 묶고 컬럼형으로 저장함으로써, 스키마 해석 비용과 null 오버헤드를 줄이면서 벡터화 효율을 높였다. 둘째, SSRF(Shared Schema Row Format)를 통해 다중 홉 탐색과 조인 과정에서 발생하는 중간 스키마 폭발과 희소 컬럼 문제를 완화하였다. 셋째, GEM(Graphlet Early Merge) 기반 최적화를 적용해 그래플릿 수 증가에 따른 실행 계획 탐색 공간의 폭증을 줄이고, 보다 효율적인 조인 순서를 찾을 수 있도록 하였다. [연구의 의미] 본 연구의 의의는 스키마리스 그래프 처리의 병목을 저장 구조, 실행 엔진, 질의 최적화기를 분리해 보지 않고 하나의 통합된 시스템 설계 문제로 다뤘다는 점에 있다. TurboLynx는 그래프 탐색 질의와 분석 질의를 하나의 엔진에서 함께 효율적으로 처리할 수 있음을 보였고, LDBC SNB Interactive, TPC-H, DBpedia 평가에서 최신 GDBMS 대비 최대 183.9배, 주요 RDBMS 대비 최대 41.27배의 성능 향상을 달성했다. 또한 실제 지식그래프인 DBpedia에서는 스키마 다양성이 매우 큰 환경에서도 최고 경쟁 시스템 대비 18.88배 빠른 성능을 보여, 실세계 대규모 스키마리스 그래프 분석에 대한 실용성을 입증하였다. [연구결과의 진행 상태 및 향후 계획] 본 연구 성과는 데이터베이스 분야 최고 학술대회인 VLDB 2026에 게재가 확정되었으며, 전체 소스 코드를 공개하여 학계와 산업계의 후속 연구 및 활용을 지원할 수 있도록 할 예정이다. 향후에는 병렬 환경으로의 확장과 트랜잭션 지원 기능 추가를 목표로 하고 있으며, 대규모 그래프 분석 응용을 위한 연구를 지속할 계획이다. [성과와 관련된 실적] Lee, T., Ha, J., Tak, B., and Han, W., “TurboLynx: Schemaless Graph Engine Strikes Back for General-Purpose Analytics,” In 52nd Int’l Conf. on Very Large Data Bases (VLDB) / Proc. the VLDB Endowment (PVLDB), Vol. 19, No. 6, pp. 1250-1263, August 2026 [성과와 관련된 이미지] 그림 1. TurboLynx 시스템 아키텍처 및 대표적인 워크플로우 예시
한욱신 교수 2026.03.23 269 -
[배경민 교수] PROMELA 언어의 실행가능한 의미구조 정립
[연구의 필요성] PROMELA는 분산/동시성 시스템을 기술하기 위한 대표적인 모델링 언어로, 암호 프로토콜/항공 소프트웨어/운영체제 등 다양한 시스템의 신뢰성 향상에 핵심적 역할을 해왔다. 그러나 PROMELA 언어의 의미구조는 SPIN 검증기의 구현체에 의존하여, 언어 차원의 정확한 의미 이해나 도구 독립적인 분석 확장이 어려웠다. 이에 따라 PROMELA 프로그램에 대해 SPIN 검증기가 제공하는 모델체킹 외의 분석 기법(예를 들어, 코드 수준의 연역적 검증 등)을 적용하는 데 근본적인 제약이 존재하였다. [포스텍이 가진 고유의 기술] 본 연구는 PROMELA 언어의 실행가능한 의미구조의 수학적 정의 및 그의 기계적 구현을 제공하여 모델체킹뿐 아니라 PROMELA 코드 기반의 연역적 검증의 토대를 마련한다. 특히, PROMELA 언어의 비결정성(nondeterminism), 원자성(atomicity), 발동가능성(enabledness) 등 고수준 선언적 언어의 특성을 저수준 실행가능한 의미구조로 해석하기 위한 의미구조 디자인 패턴 Load-and-Fire를 제안하였다. 이는 PROMELA 프로그램을 실행시키는 과정에서 먼저 복잡한 비결정적 계산구조를 트리로 분해(Load)하여 국소적으로 비결정성을 없앤 후, 트리의 개별 분기에 대해 부수효과를 국소적으로 발동(Fire)하도록 강제하는 패턴이다. 이를 통해 PROMELA 언어의 실행가능한 의미구조를 마치 비결정성이 존재하지 않는 순차적 프로그래밍 언어와 같이 정의할 수 있게 된다. [연구의 의미] 본 연구는 특정 도구(SPIN)에 종속되어 있던 PROMELA 언어의 기존 한계를 극복하고, 다양한 분석기술을 적용할 수 있는 범용 검증 프레임워크를 제공했다는 점에서 중요한 의의를 가진다. 이러한 분석기술의 확장성은 Load-and-Fire 패턴에 따라 기술된 PRPOMELA 의미구조의 실행가능성에 기반한다. 특히, PROMELA의 실행가능한 의미구조를 기계적으로 구현 및 코드기반 연역적 검증 기능을 도구화하여, 기존의 검증 기술(SPIN)로는 불가능한 PROMELA 모델의 무한 상태공간 안전성 검증이 가능함을 사례연구를 통해 실증하였다. 제안한 Load-and-Fire 패턴은 PROMELA에 국한되지 않고, 향후 다른 동시성 언어의 의미구조 설계에도 활용될 수 있는 일반적인 방법론을 제공한다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 정형검증 분야 우수 국제학술대회 VMCAI 2026에 발표되었으며, 그 우수성을 입증받아 Distinguished Paper Award를 수상하였다. 향후에는 PROMELA의 코드기반 연역적 검증 기능을 확장하여 더 복잡한 모델(매개화된 동시성 시스템)에 대한 더 복잡한 성질(시제논리성질)의 검증에 적용할 예정이다. [성과와 관련된 실적] Byoungho Son and Kyungmin Bae. A Formal Executable Semantics of PROMELA. International Conference on Verification, Model Checking, and Abstract Interpretation (VMCAI), 2026. [성과와 관련된 이미지] 그림1. 다양한 분석을 제공하는 PROMELA 언어의 실행가능한 의미구조 개념도
배경민 교수 2026.02.25 418 -
[전명재 교수] OrbitFlow: SLO-Aware Long-Context LLM Serving with Fine-Grained KV Cache Reconfiguration
[연구의 필요성] 최근 GPT-4나 Claude와 같은 대규모 언어 모델(LLM)은 수십만에서 수백만 토큰에 이르는 긴 문맥(Long-context)을 처리하는 능력이 핵심 경쟁력이 되었다. 이러한 긴 문맥을 실시간으로 처리하기 위해서는 방대한 양의 'KV 캐시(Key-Value Cache)'를 GPU 메모리에 저장해야 하는데, 문맥이 길어질수록 메모리 요구량이 기하급수적으로 증가하여 GPU 용량을 초과하는 문제가 발생한다. 이를 해결하기 위해 메모리 부족 시 KV 캐시 일부를 CPU로 이동시키는 '오프로딩(Offloading)' 기법이 사용되지만, 기존의 정적이고 획일적인 오프로딩 방식은 실시간으로 급변하는 메모리 수요와 요청(Request)마다 다른 처리 단계를 유연하게 반영하지 못한다. 이로 인해 CPU와 GPU 간의 과도한 데이터 전송이 발생하여 지연 시간(Latency)이 급증하고, 결과적으로 사용자에게 약속된 응답 속도 목표(Service-Level Objectives, SLO)를 빈번하게 위반하는 한계가 있었다. 따라서 제한된 GPU 자원 내에서 긴 문맥을 처리하면서도, 사용자 경험을 저해하지 않도록 지연 시간을 엄격히 준수할 수 있는 새로운 서빙 시스템이 필요하다. [포스텍이 가진 고유의 기술] 본 연구팀은 긴 문맥 LLM 서빙을 위한 세밀하고 적응적인 KV 캐시 관리 시스템인 OrbitFlow를 개발하였다. OrbitFlow의 핵심은 기존의 레이어(Layer) 단위가 아닌, 각 사용자 요청(Request) 단위로 KV 캐시의 위치(GPU 또는 CPU)를 결정하는 '세밀한(Fine-grained) 오프로딩 전략'에 있다. 연구팀은 경량화된 정수 선형 계획법(ILP) 솔버를 도입하여, 현재 처리 중인 모든 요청의 상태와 남은 GPU 메모리, 통신 대역폭을 고려해 최적의 캐시 배치 계획을 실시간으로 수립한다. 만약 추론 과정에서 계획이 더 이상 유효하지 않게 되면 즉시 재설정을 수행하여 변화에 대응한다. 또한, 시스템 과부하 시에도 전체적인 SLO 준수를 위해 '토큰 예치(Token Deposit)'와 '일시 정지-재개(Pause-Resume)' 메커니즘을 고안했다. 이는 생성된 토큰을 즉시 전송하지 않고 버퍼에 담아두었다가 일정한 속도로 내보냄으로써 사용자가 지연을 느끼지 못하게 하고, 그 사이 메모리를 많이 차지하는 작업을 일시 정지시켜 시스템의 안정성을 확보하는 독창적인 기술이다. [연구의 의미] 본 연구는 LLM 서비스의 핵심 난제인 '긴 문맥 처리'와 '응답 속도 보장'이라는 두 마리 토끼를 동시에 잡은 획기적인 프레임워크를 제시했다는 점에서 큰 의의가 있다. OrbitFlow는 기존의 고정된 오프로딩 방식이 갖는 비효율성을 타파하고, 동적인 런타임 환경에 맞춰 GPU 자원 활용을 극대화하였다. 실험 결과, OrbitFlow는 기존 최고 성능의 베이스라인 모델들(FlexGen, DeepSpeed 등) 대비 토큰당 지연 시간(TPOT)과 토큰 간 지연 시간(TBT)의 SLO 달성률을 각각 최대 66%, 48% 향상시켰다. 또한 꼬리 지연 시간(95 Percentile Latency)을 38% 감소시키면서도 처리량(Throughput)은 최대 3.3배 높이는 압도적인 성능을 입증했다. 이는 고가의 GPU 증설 없이도 긴 문맥을 다루는 챗봇, 문서 분석, 실시간 번역 등의 고성능 AI 서비스를 안정적으로 제공할 수 있는 기반 기술이 될 것으로 기대된다. [연구결과의 진행 상태 및 향후 계획] 본 연구 성과는 데이터베이스 및 시스템 분야의 최우수 국제학술대회인 VLDB(International Conference on Very Large Data Bases) 2026에 게재 승인되었다. 향후에는 더욱 거대한 모델과 복잡한 워크플로우를 가진 다중 에이전트 환경에서도 안정적인 서빙이 가능하도록 고도화할 계획이다. [성과와 관련된 실적] Xinyue Ma, Heelim Hong, Taegeon Um, Jongseop Lee, Seoyeong Choy, Woo-Yeon Lee, and Myeongjae Jeon, "OrbitFlow: SLO-Aware Long-Context LLM Serving with Fine-Grained KV Cache Reconfiguration", Proceedings of the VLDB Endowment (PVLDB), Vol. 19, No. 5, 2026. [성과와 관련된 이미지]
전명재 교수 2026.02.05 468 -
[전명재 교수] REP: Resource-Efficient Prompting for Rehearsal-Free Continual Learning
[연구의 필요성] 연속 학습(continual learning, CL)은 모델이 순차적인 태스크를 학습하며 지식을 축적할 수 있게 하나, 새로운 데이터를 학습할 때 기존 지식을 손실하는 ‘치명적 망각(catastrophic forgetting)’ 현상이 여전한 난제로 남아있다. 특히 온디바이스(on-device) 환경은 보안을 위한 로컬 학습이 필수적임에도 불구하고, 1~8GB 수준의 제한된 메모리와 전력 소모 제약으로 인해 실질적인 도입에 큰 어려움이 있다. 기존의 프롬프트 기반 학습은 파라미터 효율성을 높여 망각을 억제하는 효과가 있으나, 학습 과정의 연산 부하와 메모리 점유율은 여전히 엣지 디바이스의 하드웨어 한계를 위협하며 시스템 충돌이나 저장 장치 수명 단축을 초래한다. 이에 따라 모델의 정확도는 유지하면서도 연산 자원을 획기적으로 절감하여, 실질적인 온디바이스 배포를 가능케 하는 '자원 효율적(resource-efficient) 연속 학습 기법'의 필요성이 대두되었다. [포스텍이 가진 고유의 기술] 본 연구팀은 비전 트랜스포머(ViT)를 기반으로 자원 효율성을 극대화한 REP(Resource-Efficient Prompting) 프레임워크를 제안하였다. 제안한 방법은 학습 전 과정을 '프롬프트 선택'과 '프롬프트 업데이트' 단계로 최적화하는 이원화 전략을 채택하였다. 먼저 프롬프트 선택 단계에서는 무거운 메인 모델 대신 초경량 대리 모델(surrogate model)과 랜덤 투영(random projection)을 활용한 고속 추출 기법을 도입하였다. 프롬프트 업데이트 단계에서는 입력 데이터 특성에 따라 연산을 줄이는 적응형 토큰 병합(AToM)과, 태스크 민감도가 낮은 레이어를 선택적으로 연산에서 제외하는 적응형 레이어 드롭(ALD) 기술을 도입하였다. 이러한 설계를 바탕으로 연속 학습 환경에서 연산을 비균일(non-uniform)하게 생략함으로써, 정확도 손실을 최소화하면서도 높은 자원 효율성을 확보하였다. [연구의 의미] 본 연구는 온디바이스 연속 학습의 병목 구간인 자원 효율성 문제를 정교한 비용-정확도 트레이드오프 분석을 통해 해결했다는 점에서 중요한 의의를 갖는다. 특히 제안된 REP 프레임워크는 7가지 최신 기법에 즉시 적용 가능한 높은 범용성을 갖추었으며, 프롬프트를 사용하지 않는 연속학습 기법에서도 학습 시간 최대 51%, 메모리 사용량 최대 41% 절감이라는 탁월한 성능을 입증하였다. 이는 향후 로보틱스, 스마트 모빌리티 및 개인화 엣지 컴퓨팅 등 실시간성과 효율성이 동시에 요구되는 차세대 산업 분야에서 안정적인 AI 학습을 수행할 수 있는 실질적인 기술적 토대가 될 것으로 기대된다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 기계학습 분야 최우수 국제학술대회인 NeurIPS 2025에서 포스터로 발표되었다. 향후 멀티모달 분야로의 확장 연구를 진행 중이다. [성과와 관련된 실적] Sungho Jeon, Xinyue Ma, Kwang In Kim, Myeongjae Jeon, “REP: Resource-Efficient Prompting for Rehearsal-Free Continual Learning”, Neural Information Processing Systems (NeurIPS), 2025. [성과와 관련된 이미지]
전명재 교수 2026.02.05 406 -
[배경민 교수] 물리환경과 통신을 고려한 PLC 제어 시스템의 엄밀한 검증 기술
[연구의 필요성] 프로그래머블 로직 컨트롤러(PLC)는 선박, 발전소, 공장 자동화 설비 등 다양한 산업 현장에서 사용되는 산업 제어용 컴퓨터이다. 산업 현장에 직접 투입되는 특성 상 작은 오류도 대형 사고로 이어질 수 있어 매우 높은 수준의 안정성과 신뢰성이 요구된다. 기존의 기술은 개별 PLC 프로그램에 초점을 맞추어, 제어기들이 서로 통신하며 물리 환경과 상호작용하는 실제 산업 시스템의 복잡성을 고려하지 못하는 한계가 있었다. 이에 따라 프로그램·통신·물리환경을 통합적으로 고려한 새로운 검증 기술이 필요하다. [포스텍이 가진 고유의 기술] 본 연구진은 PLC 프로그램의 실행, PLC 사이의 통신, 그리고 물리 환경의 연속적인 변화를 하나의 통합된 수학적 의미구조(정형명세)로 표현하는 기술을 개발하였다. 이를 통해 실제 산업 현장의 PLC 시스템을 보다 현실에 가깝게 모델링할 수 있다. 물리적인 환경과 통신을 고려하는 PLC 정형명세에 대한 검증 알고리즘은 매우 방대한 상태 공간을 생성하는 문제가 있으나, 본 연구진은 PLC의 실행 특성과 통신 구조를 활용한 상태 공간 축소 기법을 함께 적용하여, 검증 효율성을 크게 향상시켰다. [연구의 의미] 본 연구는 PLC 프로그램, 네트워크 통신, 물리 환경의 연속적 동작을 하나의 통합된 의미구조로 동시에 다룬 최초 수준의 연구로, 기존에 분리되어 다루어지던 산업 제어 시스템 분석의 한계를 근본적으로 극복하였다. 이러한 통합 모델에서 필연적으로 발생하는 검증 복잡도 문제를 해결하기 위해, PLC 실행 구조와 통신 특성을 활용한 상태 공간 축소 기법을 함께 제안함으로써, 이론적 정합성과 실용적 분석 가능성을 동시에 달성하였다. 실제 산업 현장에서 발생하는 복합적인 상호작용을 정밀하게 분석할 수 있는 새로운 PLC 검증 패러다임을 제시하였으며, 향후 다양한 안전 필수 시스템의 신뢰성 검증에 폭넓게 활용될 수 있는 기반을 마련하였다. [연구결과의 진행 상태 및 향후 계획] 후속 연구로, 현재 제안한 통합 의미구조를 다중작업(multitasking) PLC 시스템으로 확장하고, 이러한 확장에 따라 증가하는 검증 복잡도를 완화하기 위해 다중작업 PLC 환경에 적합한 상태 공간 축소 기법을 고도화하는 연구를 수행하고 있다. [성과와 관련된 실적] Jaeseo Lee and Kyungmin Bae. Formal Analysis of Networked PLC Controllers Interacting with Physical Environments. Static Analysis Symposium (SAS), 2025. [성과와 관련된 이미지] 그림1. 대표적인 PLC 벤치마크 모델 SWaT의 도식 그림2. PLC 자체 언어로 명세된 복잡한 통신 행동
배경민 교수 2026.01.21 458 -
[곽수하 교수] Improving Target Presence and Plurality Recognition for Generalized Referring Image Segmentation
[연구의 필요성] 참조 영상 분할(Referring Image Segmentation, RIS)은 자연어 표현으로 기술된 영상 내 영역을 분할하는 기술로, 인간-컴퓨터 상호작용, 영상 편집, 로봇 비전 등 다양한 응용 분야에서 중요한 역할을 한다. 기존 RIS 모델들은 단일 객체만을 분할하는 것을 목표로 설계되어, 실제 환경에서 자주 발생하는 다중 객체 참조나 객체 부재 상황을 처리하지 못하는 한계를 가진다. 최근 일반화된 RIS(Generalized RIS)가 제안되어 단일 객체뿐 아니라 다중 객체 및 객체 부재 시나리오를 다루게 되었으나, 선행 연구들은 분할 특징과 객체 존재 여부 판단을 위한 특징을 동일하게 사용하여 두 작업 간 충돌이 발생하고, 객체 존재 여부 분류 성능이 크게 저하되는 문제를 보였다. 또한 데이터셋 내 객체 부재 및 다중 객체 샘플의 비중이 단일 객체 샘플에 비해 현저히 낮아(각각 9.14%, 25.53%), 모델이 이러한 시나리오를 효과적으로 학습하기 어려운 데이터 불균형 문제도 존재한다. 이에 따라 객체 존재 여부와 복수성(단일/다중)을 명시적으로 인식하고, 데이터 불균형을 해소할 수 있는 새로운 방법론의 필요성이 대두되었다. [포스텍이 가진 고유의 기술] 본 연구에서는 일반화된 RIS를 위한 새로운 아키텍처와 데이터 증강 전략을 제안하였다. 먼저 아키텍처 측면에서, 객체 존재 여부 분류를 위해 특별히 설계된 학습 가능한 쿼리인 '타겟 쿼리(target query)'를 도입하였다. 이 타겟 쿼리는 픽셀 디코더의 중간 특징들로부터 크로스 어텐션을 통해 정보를 집약하여 분할 특징과 독립적으로 객체 존재 여부를 판단한다. 또한 타겟 쿼리에 복수성 분류 헤드를 부착하여 텍스트 특징으로부터 직접 단일/다중 객체 여부를 학습하도록 하였다. 이를 통해 모델이 복수성 단서를 명시적으로 포착하고 복잡한 참조 시나리오에서도 정확한 마스크를 생성할 수 있도록 하였다. 데이터 증강 측면에서는 객체 부재 샘플과 다중 객체 샘플을 합성적으로 생성하는 전략을 개발하였다. 객체 부재 샘플은 배치 내 다른 영상의 텍스트 설명을 현재 영상과 쌍을 이루도록 교체하여 생성하고, 다중 객체 샘플은 최대 4개의 단일 객체 샘플을 2×2 그리드로 배열하고 텍스트를 "and"로 연결하여 생성한다. 이러한 간단하면서도 효과적인 증강 전략을 통해 데이터 불균형 문제를 완화하고 모델의 일반화 능력을 향상시켰다. [연구의 의미] 본 연구는 일반화된 RIS에서 객체 존재 여부와 복수성 인식을 명시적으로 다루는 새로운 프레임워크를 제시했다는 점에서 중요한 의의를 갖는다. 특히 기존 방법들이 분할과 존재 여부 판단을 위해 동일한 특징을 사용하여 발생하는 성능 저하 문제를 근본적으로 해결하였으며, 타겟 쿼리라는 전용 학습 가능 임베딩을 통해 두 작업을 효과적으로 분리하였다. 또한 복수성 분류를 통해 텍스트로부터 직접 단일/다중 정보를 추출하여 마스크 생성에 활용함으로써, 모델이 다양한 참조 시나리오를 보다 정확하게 이해할 수 있도록 하였다. 제안한 데이터 증강 전략은 추가적인 인간 주석 없이도 객체 부재 및 다중 객체 샘플을 효과적으로 생성하여 데이터 불균형 문제를 해소하고, 모델 아키텍처와 무관하게 적용 가능하여 범용성이 높다. 실험 결과, gRefCOCO 데이터셋의 모든 평가 지표에서 기존 최고 성능 방법들(ReLA, LISA, GSVA 등)을 크게 상회하였으며, 특히 대규모 멀티모달 모델 기반 방법들보다 적은 파라미터로 우수한 성능을 달성하였다. 이는 향후 영상-언어 이해, 인터랙티브 영상 편집, 로봇 비전 등으로 확장될 수 있는 중요한 기술적 토대를 제공한다. [연구결과의 진행 상태 및 향후 계획] 본 연구는 인공지능 분야 최우수 국제학술대회 AAAI 2026에 게재 승인되었다. 향후에는 더욱 복잡한 공간 관계를 다루는 다중 객체 시나리오 처리 능력 향상, 정교한 데이터 증강 기법 개발, 그리고 비디오 도메인으로의 확장 연구를 계획 중에 있다. 또한 제안한 타겟 쿼리 메커니즘을 다른 비전-언어 작업에 적용하는 연구도 진행할 예정이다. [성과와 관련된 실적] Namyup Kim, Jinsung Lee, Suha Kwak, "Improving Target Presence and Plurality Recognition for Generalized Referring Image Segmentation", AAAI Conference on Artificial Intelligence (AAAI), 2026. [성과와 관련된 이미지]
곽수하 교수 2025.12.16 587



