최신연구

[이근배 교수] Tracking Must Go On : Dialogue State Tracking with Verified Self-Training

2023-06-05
  • 1,414

[연구의 필요성]
목적 지향 대화 (Task Oriented Dialgoue) 에서 대화 상태 추적(Dialogue State Tracking)은 사용자의 목적에 따라 구체적인 정보를 식별하는 중요한 구성 요소입니다. 그러나 DST 데이터의 주석 작업은 상당한 인력 투입을 필요로 하기 때문에 라벨링이 없는 대화 로그 자체를 이용하는 방법이 필요합니다.

[포스텍이 가진 고유의 기술]
이에 대응하기 위해, 우리는 검증 모델 (Verification model) 과 함께 새로운 자기 학습(Self-training) 프레임워크를 제안합니다. 기존의 자기 학습 방법과 달리, 우리의 검증 방법론은 고정된 임계값 (threshold) 을 사용하지 않고도 생성된 데이터의 정확성과 유효성을 보장합니다. 또한, 과적합을 완화하기 위해 다양한 사용자 발화를 생성하여 데이터셋을 보강합니다.

[연구의 의미]
실험 결과 라벨이 있는 데이터의 10%만 사용해도, 우리의 접근 방실은 라벨이 전체 있는 것과 MultiWOZ2.0 데이터셋과 비교 가능한 결과를 얻을 수 있습니다. 확장성 평가에서는 보여주며, 학습 데이터에서 보지 못한 값도 예측이 가능하다는 결과를 얻었습니다.
Jihyun Lee, Chaebin Lee, Yunsu Kim, Gary Geunbae Lee

[성과와 관련된 이미지]

목록