최신연구

[유환조 교수] Noisy Label Detection by Discriminative Dynamics with Label Corruption

2024-03-12
  • 1,437

[연구의 필요성]
딥러닝 모델을 효과적으로 학습하기 위해서는 정확한 라벨을 가진 대규모 데이터셋을 확보하는 것이 매우 중요하다. 그러나 현실에서는 사용되는 데이터의 라벨이 오염되는 경우가 많은데, 이는 딥러닝 모델의 성능에 부정적인 영향을 미친다. 따라서, 오염된 라벨을 가진 샘플을 식별하고 수정함으로써, 원본 데이터 세트의 품질을 향상시키거나, 오염된 라벨에 강건한 모델을 개발하는것은 매우 중요하다.

[포스텍이 가진 고유의 기술]
본 연구에서는 오염된 라벨 감지를 위해 라벨을 인위적으로 손상시킨 데이터를 추가 후, 정확한 라벨을 가진 샘플과 오염된 라벨을 가진 샘플의 학습 다이나믹스 차이를 학습하는 새로운 프레임워크를 제시한다. 구체적으로, 제시하는 모델은 학습 다이나믹스의의 잠재적 표현을 클러스터링하여 오염된 라벨을 식별한다. 이를 위해 먼저 원본 샘플들과 인위적으로 손상된 샘플의 학습 다이나믹스을 생성한다. 이후 다이나믹스 인코더를 사용해 훈련 궤적 내에서 판별 패턴을 인코딩하는 역학 표현을 계산하고 분류한다.

[연구의 의미]
본 연구는 지도학습 기반의 딥러닝 모델 개발을 위해 필수적인 정확한 데이터를 확보하는 데 도움을 준다. 또한, 이 연구를 통해 데이터셋에 포함된 오염된 샘플을 식별하고 개선할 수 있다.

[연구결과의 진행 상태 및 향후 계획]
본 연구는 컴퓨터 비전 분야 최우수 국제학술대회인 The IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2024) 에 발표될 예정이다. 추후 본 연구 결과를 그래프 도메인에 접목시켜, 분자 그래프와 관련된 응용 분야에서의 활용 가능성을 탐구할 것이다.

[성과와 관련된 실적]
SY Kim, SK Kang, SK Chae, SH Jang, D Lee, H Yu, ” Learning Discriminative Dynamics with Label Corruption for Noisy Label Detection” The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024.

[성과와 관련된 이미지]

목록