Cost aggregation is all we need

2022-02-28
  • 1,786

Abstract: 컴퓨터 비전 분야에서 가장 중요한 문제 중에 하나인 영상 정합 기술은 크게 특징 표현자 추출(Feature Extraction), 코스트 어그리게이션(Cost Aggregation), 그리고 정합 흐름 예측(Flow Estimation)의 단계로 나뉜다. 이러한 파이프라인 중 코스트 어그리게이션은 최적의 정합을 예측하는데 가장 중요한 부분 중 하나로 전통적으로 수많은 논문들이 이를 해결하기 위하여 연구되어 왔다. 컨볼루션(Convolution) 기반 딥러닝 기술을 활용하여 이를 해결하려는 연구들이 많이 되어 왔지만 성능적 한계를 보였다. 본 강연에서는 최근 인공지능 분야에서 가장 널리 활용되는 구조 중 하나인 트랜스포머(Transformers) 구조를 활용하여 코스트 어그리게이션을 수행하는 연구를 소개하고 그 우수성에 대해서 논의하고자 한다. 또한 이러한 기법은 영상 정합을 활용한 다양한 적용 분야에 활용될 수 있는데 대표적으로 Few-shot Segmentation 분야에서 이러한 기술이 어떻게 사용될 수 있을지 논의하고자 한다.

Biography: Seungryong Kim received the B.S. and Ph.D. degrees from the School of Electrical and Electronic Engineering from Yonsei University, Seoul, Korea, in 2012 and 2018, respectively.From 2018 to 2019, he was Post-Doctoral Researcher in Yonsei University, Seoul, Korea.From 2019 to 2020, he has been Post-Doctoral Researcher in School of Computer and Communication Sciences at Ecole Polytechnique F\’ed\’erale de Lau-\’sanne (EPFL), Lausanne, Switzerland.Since 2020, he has been an assistant professor with the Department of Computer Science and Engineering, Korea University, Seoul.His current research interests include 2D/3D computer vision, computational photography, and machine learning.

====================================================================

Spring 2022 GSAI/CSE Seminar Series

-Zoom Meeting ID: 977 5406 0329 / Passcode: 251664

-Link: https://postech-ac-kr.zoom.us/j/97754060329?pwd=TUlkdjlqVGV6U1BiZzl4aEZVL2Y3Zz09

====================================================================

LIST