최신연구

[한욱신 교수] 부하 불균형을 해결한 GPU 데이타베이스 시스템의 개발

2024-11-06
  • 140

[연구의 필요성]
최근 GPU의 병렬 처리 성능이 급속히 발전하고 있으며, 이에 따라 데이터 분석을 위한 관계형 질의를 GPU에서 병렬 처리하는 새로운 기술이 제안되고있다. 그러나 이 기술들은 GPU 스레드 간에 발생하는 부하 불균형 문제로 인해 GPU의 병렬 처리 능력을 완전히 활용하지 못하는 한계를 지니고 있다. 세부적으로, 이 기술들은 관계형 질의 처리라는 태스크를 GPU 스레드들에게 분배하지만, 각 GPU 스레드에게 할당된 태스크의 수행 시간이 기하급수적으로 큰 차이가 나는 문제를 갖고 있다.
그리고, 큰 태스크를 할당 받은 GPU 스레드가 태스크를 수행하는 동안, 작은 크기의 태스크를 할당 받은 GPU 스레드는 태스크를 빨리 처리하고 낭비가되는 문제가 발생한다.

[포스텍이 가진 고유의 기술]
본 기술의 핵심 아이디어는, 관계형 질의 처리라는 태스크를 아주 작은 단위의 서브태스크로 나누어 표현하고, 서브태스크들을 GPU 스레드들에게 동적으로 분배하는 것이다. 각 서브태스크 수행의 시간 복잡도는 O(1)이며, 그로 인해 서브태스크 간 크기 차이는 매우 작다.
그리고, 이러한 특성을 통해, 본 기술은 남은 수행 시간이 가장 긴 스레드를, 남은 서브태스크의 수로 특정할 수 있고, 해당 스레드의 서브태스크 절반을 서브태스크가 남아 있지 않은 스레드에게 동적으로 재할당하는 방식을 통해 스레드의 낭비를 줄인다.
만약 남은 서브태스크의 수가 별로 없는 스레드의 서브테스크를 분배하였다면, 서브태스크를 분배한 스레드와 분배받은 스레드 모두 금방 서브태스크들을 처리하고 낭비가 될 것이다.
또한, 본 기술은 데이터 분석 벤치마크에서 기존 기술 대비 379배 빠른 성능을 보인다.

[연구의 의미]
제안된 기술을 활용하면, 데이터 분석을 위한 관계형 질의들을 GPU를 통해 빠르게 처리할 수 있어, 비즈니스 인텔리전스, 소셜 네트워크 분석 등을 포함한 산업 전반에서 활용이 가능한 유용한 기술이다.

[연구결과의 진행 상태 및 향후 계획]
본 연구는 데이터베이스 분야 최고 학술대회인 VLDB 2025에 발표될 예정이며, 이번 연구의 핵심 기술을 기반으로 GPU 기반 그래프 데이터 처리 연구에 접목하고자 하는 것이 향후 계획이다.

[성과와 관련된 실적]
1. Hong, K., Kim, K., Lee, Y., Moon, S., Bhowmick, S., Han, W., Themis: A GPU-accelerated Relational Query Execution Engine” Proceedings of the VLDB Endowment 18.2 (2024) (Corresponding author)

[성과와 관련된 이미지]

목록