딥러닝 기반의 음성통신기술

세미나안내

2017-02-27

3,313

장준혁 교수(한양대학교) / 2017.03.02

-Biograpy
1998년 2월 : 경북대학교 전자공학과 학사
2000년 2월 : 서울대학교 전기공학부 석사
2004년 2월 : 서울대학교 전기컴퓨터공학부 박사
2000년 3월~2005년 4월 : ㈜넷더스 연구소장
2004년 5월~2005년 4월 : 캘리포니아 주립대학, 산타바바라 (UCSB) 박사후연구원
2005년 5월~2005년 8월 : 한국과학기술연구원 (KIST) 연구원
2005년 9월~2010년 : 인하대학교 전자공학부 교수
2011년 3월~현재 : 한양대학교 공과대학 융합전자공학부 교수

-Abstract
최근 빅데이터 시대의 도래와 함께 컴퓨팅 파워의 발전 및 깊은 신경망의 학습을 가능하게 하는 학습 알고리즘의 개발과 함께 등장한 딥러닝은 다양한 분야에서 기존의 기계학습 방식을 뛰어넘는 성능을 보이고 있다. 이러한 딥러닝 기반 모델의 가장 큰 강점은 입력 데이터에 가해지는 비선형변환을 통한 특징벡터 추출 및 합성으로 기존의 얕은 모델로는 표현할 수 없는 복잡한 특징공간에 대한 강력한 모델링 커패시터일 것이다. 본 강연에서는 딥러닝 기반의 음성통신기술로서 두 가지 기술을 소개한다. 첫 번째는 패킷손실은닉 기술로 패킷 기반의 음성통화 환경에서 손실된 패킷을 딥러닝을 이용하여 복구하는 알고리즘을 소개한다. 딥러닝은 손실된 패킷 이전의 정보들을 기반으로 손실된 패킷의 정보를 추정하는 역할을 하며 기존 기계학습 방식에 비해 뛰어난 성능을 보인다. 두 번째로는 음성 대역폭확장 기술로서 기존 이동통신 통화 환경의 주를 이루고 있는 적응형 다중 비트율 (Adaptive Multi-Rate, AMR) 코덱 기반의 협대역 신호를 광대역 신호로 변환하는 알고리즘을 소개한다. 이 때, 딥러닝을 이용하여 협대역 신호의 주파수 성분을 기반으로 광대역 신호의 주파수 성분을 추정하게 된다. 마지막으로 딥러닝 기반의 각 기술에 대한 자세한 설명을 실험 결과와 함께 제시한다.