최신연구
[이근배/옥정슬 교수] Revisiting Early Detection of Sexual Predators via Turn-level Optimization
[연구의 필요성]
온라인 그루밍(Online grooming)은 성범죄자가 아동 피해자를 온라인 상에서 교묘하게 조종하고, 오프라인으로 유인하는 심각한 사회적 위협입니다. 따라서 이를 예방하기 위해 조기 탐지 (eSPD: early Sexual Predator Prediction) 가 필수적입니다. 하지만 기존 eSPD 방법들은 대화 단위 (chat-level)의 위험 라벨에 의존하여, 대화 내부 각각의 발화 (turn)에 대한 올바른 representation을 만들지 못했습니다. 이는 위험 발화에 대한 weak supervision이 발생하고, 최적 조기 탐지 시점을 효과적으로 결정하지 못하는 문제를 안고 있습니다.
따라서, 우리는 발화 단위(turn-level) 위험 라벨을 사용하고, 최적의 조기 탐지 시점을 결정하기 위해 강화학습 기반 방법론을 도입하고자 합니다.
[포스텍이 가진 고유의 기술]
이 테스크를 수행하기 위해 크게 2가지를 진행했습니다. 첫째로 유혹 커뮤니케이션 이론 (LCT: Luring Communication Theory)에서 도출된 발화 단위 전략을 활용하여 발화 단위 위험 라벨 (turn-level risk label)을 정의했습니다. 이를 바탕으로 발화 단위의 새로운 벤치마크 데이터셋, 평가지표인 Turn-level eSPD를 정의했습니다. 둘째로 우리는 최적의 조기 탐지 시점을 효과적으로 식별하기 위해 새로운 속도 조절 강화학습 (SCoRL: Speed-Control Reinforcement Learning) 방법을 제안했습니다. SCoRL 프레임워크는 Turn-level eSPD 데이터셋과 속도 조절 보상 함수 (Speed-Control Reward)를 활용하여 탐지의 신속성과 정확성 간의 균형을 맞춥니다.
[연구의 의미]
본 연구는 크게 2가지 의미가 있습니다. 우선 이 연구는 기존 eSPD가 가지고 있는 위험 발화에대한 weak supervision 문제를 지적했습니다. 이는 대화 단위 위험 라벨이 원인으로 LCT 이론을 바탕으로 발화 단위 위험 라벨을 정의하고, 이를 기반으로 한 벤치마크를 제안했습니다. 그리고 이 연구는 eSPD task에서 최초로 신속성과 정확성 모두 최적화 시킬 수 있는 방법론을 제안했습니다. 특히 speed라는 값을 기반으로 한 속도 조절 보상 함수를 제안하며, 기존 naïve 방식의 보상 함수와의 차별성을 보여주었고, 구체적인 학습 방법 및 코드를 공개하였습니다.
[연구결과의 진행 상태 및 향후 계획]
본 연구는 NAACL 2025 main long paper로 accept 되었습니다. 조기감지가 필요한 다른 분야로도 연구를 확장할 계획입니다.
[성과와 관련된 실적]
본 연구는 NAACL 2025 main long paper로 accept 되었습니다.
[성과와 관련된 이미지]