반응형 SLT1 Neural Sign Language Translation based on Human Keypoint Estimation KETI에서 쓴 논문이다. 우리나라의 수화 영상 데이터셋을 구축하고, 이를 keypoint 기반으로 번역하는 알고리즘을 구축하였다. # Abstract - 본 논문은 Human Keypoint 추정 기반의 SLT(수화 번역) 알고리즘을 제안함 - KETI dataset 소개 (11578 개의 비디오) - 얼굴, 손, 몸에 대한 keypoint를 추출 - human keypoint vector는 keypoint의 평균과 표준편차로 normalization 수행 - sequence to sequence 모델을 베이스로 번역 진행 ( 모델 설명 : https://blog.naver.com/sooftware/221784419691) - training 하는 dataset이 작아도 robust한 결과를 얻는다. .. 2021. 9. 16. 이전 1 다음 반응형