최신연구
[곽수하 교수] Exploring State-Space Models for Data-Specific Neural Representations
- 등록일2026.05.27
- 조회수39
-

교수곽수하
[연구의 필요성]
생성형 AI, 영상 스트리밍, 메타버스 등 초대용량 시각 데이터 활용이 증가하면서, 데이터를 더 효율적으로 압축하고 복원할 수 있는 AI 기반 표현 기술의 중요성이 커지고 있다. 기존 신경망 기반 압축 기술은 데이터의 연속적인 구조를 충분히 반영하지 못하는 한계가 있었다.
[포스텍이 가진 고유의 기술]
연구팀은 최근 주목받는 상태공간모델(SSM)을 시각 데이터 압축 문제에 처음으로 접목하고, 이를 다차원 데이터에 적용 가능한 구조인 S3K(Structured State-Space Kernel)로 확장했다. 특히 라플라시안 피라미드 기반 LPNet-S3K 구조를 통해 이미지·동영상·3차원 데이터 압축 성능을 동시에 향상시켰다.
[연구의 의미]
이번 연구는 상태공간모델이 단순한 시퀀스 처리 모델을 넘어 데이터 압축과 연속 신호 표현에도 효과적으로 활용될 수 있음을 처음으로 체계적으로 제시했다는 데 의미가 있다. 또한 기존 CNN·Transformer 중심의 압축 구조와 차별화된 새로운 AI 압축 패러다임을 제안했다.
[연구결과의 진행 상태 및 향후 계획]
현재 이미지·동영상·3차원 데이터셋에서 기존 최신 기법 대비 우수한 복원 성능을 검증했으며, 국제학회 ICLR 2026에 채택됐다. 향후에는 연산 효율 최적화와 전용 디코더 개발을 통해 실제 영상 스트리밍 및 생성형 AI 시스템에 적용 가능한 방향으로 연구를 확장할 계획이다.
[성과와 관련된 실적]
- - ICLR 2026 논문 채택
- - Kodak, CLIC2020, UVG, DAVIS, Objaverse 등 다양한 벤치마크에서 성능 검증
- - 기존 NeRV 계열 모델 대비 높은 영상 복원 성능 및 압축 효율 달성
- [요약]
- 본 연구는 생성형 AI 시대에서 중요성이 커지는 ‘효율적 데이터 표현’ 문제를 다루고 있으며, 향후 AI 영상 압축, 실시간 스트리밍, 메타버스 및 멀티모달 AI 시스템 등 다양한 산업 분야로의 확장 가능성이 높다.
[성과와 관련된 이미지]




