뉴스

지능형 미디어 연구실 ICDAR 2015의 문서 인식 경쟁 부문 수상

2015-08-27
6,045

지능형 미디어 연구실 ICDAR 2015의 문서 인식 경쟁 부문 수상

포스텍 지능형 미디어 연구실 (지도교수 김대진)과 포스텍 컴퓨터공학과 출신 대학원생들이 창업한 () 스트라드비젼 (전봉진 대표) 연합팀이 821-23일 동안 프랑스 낭시에서 매 2년마다 열리고 올해로 13회를 맞이하는 국제 패턴 인식 협회 (IAPR) 주관 국제 문서 분석 및 인식 학술 대회 (ICDAR 2015)의 도전적인 배경에서 강인한 문서 인식 경쟁 (Robust Reading of Text in Challenging Contexts) 부문 7개 분야 중 6개 분야에 참가하여 5개 분야에서 1등을 하여 참가 기관 중 최고의 수상 실적을 보였다.경쟁이 벌어진 7개 분야는 Task3.1 (비디오 영상내 문자 영역 추적), Task4.1 (구글 글래스 입력 영상내 문자 영역 추적), Task4.3 (구글 글래스 입력 영상내 문자 인식), 올해 처음 실시하는 Task1.4, Task2.4, Task3.4, 그리고 Task4.4 (각각 디지털 생성 영상, 일반 영상, 비디오 영상, 그리고 구글 글래스 입력 영상 내에서 문자 영역 탐지에서부터 인식까지를 포함하는 end-to-end 수행)이다.이번 경쟁에는 구글, 퀄컴을 포함하는 여러 글로벌 IT 업체와 세계 유명 대학 등 전체 52개국 1,056개팀이 5,292번의 참여 횟수를 기록한 가운데 본 연합팀은 Task4.1, Task1.4, Task2.4, Task3.4, Task4.4 5개 분야에서 1, 그리고 Task3.1에서는 5등을 차지하여 본 연합팀의 기술력을 전 세계에 유감없이 과시하였다. 나아가. 지난 12년간 계속되어온 공개 경쟁 분야인 Task1.1, Task1.2, 그리고 Task2.2 분야에서도 세계 최고 수준의 문서 검출 및 인식 성능을 보이고 있다.본 연합팀은 BK+21 사업의 장학금 지원을 받아오면서 배출된 우수한 대학원생들에 오랜 기간 얼굴 검출 및 인식 분야에서 쌓아온 알고리즘과 노하우를 문자 인식 분야에 확장 적용해서 위의 우수한 성적을 거두었으며, 현재는 개발한 검출 및 인식 기술들을 최근 자동차 업계에서 큰 관심을 가지는 보행자 검출에 적용하여서도 세계 최고 수준의 검출 성능을 보이고 있으며, 향후 사람, 자동차, 번호판 등 다양한 객체 검출 및 인식 분야에서 세계 최고 수준의 기술을 확보하고 이를 상용화 하여 세계적인 객체 인식 전문 기업이 되고자 한다.

 

 

목록