반응형 논문 정리42 [STMC] Spatial-Temporal Multi-Cue Network for Continuous Sign Language Recognition [수화번역] 을 위한 논문 https://arxiv.org/abs/2002.03187 Spatial-Temporal Multi-Cue Network for Continuous Sign Language Recognition Despite the recent success of deep learning in continuous sign language recognition (CSLR), deep models typically focus on the most discriminative features, ignoring other potentially non-trivial and informative contents. Such characteristic heavily constr arxiv.org ## Abst.. 2021. 8. 19. 저자가 직접 리뷰하는 YOLOv5 + Optical Flow 보행자 위험 예측 내 논문 내가 리뷰!! 논문 링크 : https://www.dbpia.co.kr/Journal/articleDetail?nodeId=NODE10583405 딥러닝과 Optical Flow를 활용한 보행자 사고 방지 모델 논문, 학술저널 검색 플랫폼 서비스 www.dbpia.co.kr 만약 DBpia 아이디가 없고 돈 내야한다면 https://github.com/winston1214/My_paper/blob/master/Pedestrian%20Accident%20Prevention%20Model%20Using%20Deep%20Learning%20and%20Optical%20Flow.pdf GitHub - winston1214/My_paper: My paper My paper. Contribute to wi.. 2021. 8. 15. Better Sign Language Translation with STMC-Transformer 논문 링크 : https://arxiv.org/pdf/2004.00588v2.pdf 수화 번역(SLT)을 위한 알고리즘. 측정 지표 BELU(현재 SOTA) ## Abstract 수화 번역은 수화 인식 시스템을 사용하여 비디오에서 수화를 추출한다. 그리고 번역 시스템은 수화로부터 자연어를 생성한다. 본 논문은 수화 번역을 위한 시스템을 제안하고 이를 STMC-Transformer라고 정의한다. 본 논문은 이전 논문인 Sign2Gloss2Text 의 번역보다 더 뛰어나다고 한다. ## Introduction 본 논문의 contribution은 다음과 같다. 1. video -> text로 번역하는 STMC-Transformer는 번역 성능이 이전 모델보다 좋다 2. SLT(Sign-Language-Tran.. 2021. 8. 11. Learning to Estimate Hidden Motions with Global Motion Aggregation(GMA) GMA는 Supervised Learning에서 Sintel 데이터셋(Sintel-final, Sintel-clean) 모두에서 SOTA를 달성한 논문이다. 논문 링크 : https://arxiv.org/pdf/2104.02409v3.pdf ## Abstract Occlusion(영상처리에서 겹침의 의미)은 Optical Flow 추정에서 중요한 문제이다. 따라서 GMA는 Occlusion point를 효율적으로 추정하는 방법에 대해 말한다. 본 논문에선, occlusion 문제를 해결하기 위해 이미지 자기 유사도 방법을 제시한다. 이는 transformer 기반의 모듈로 픽셀과 첫 프레임 간의 의존도를 찾고 대응되는 모션 feature 에 대해 global aggregation를 수행한다. 그래서 본 .. 2021. 8. 4. RAFT - Recurrent All-Pairs Field Transforms for Optical Flow 본 글은 https://www.youtube.com/watch?v=OnZIDatotZ4 이 동영상을 참고하여 작성하였습니다. RAFT는 ECCV2020에서 베스트 논문상을 받은 논문이다. Optical Flow와 Transformer를 결합하면서 SOTA를 달성한 논문이다. RAFT는 엄청난 성능을 보이면서 SOTA를 달성하는 Contribution을 주는 네트워크이다. RAFT에 대해 설명하기 전에 Optical Flow의 dataset에 대해서 간단하게 알아보겠다. Flying Chair와 Flying Things 같은 경우는 2021.07.21 - [논문 정리] - FlowNet : Learning Optical Flow with Convolutional Networks(Optical Flow~Fl.. 2021. 7. 23. MaskFlowNet : Asymmetric Feature Matching with Learnable Occlusion Mask MaskFlowNet은 2021년 7월 기준 Sintel-clean dataset 기준으로 End-point-error 2.52로 3등을 기록하였다. 본 논문은 CVPR2020에 발표된 논문이다. optical flow에 대한 설명은 2021.07.21 - [논문 정리] - FlowNet : Learning Optical Flow with Convolutional Networks(Optical Flow~FlowNet2.0) FlowNet : Learning Optical Flow with Convolutional Networks(Optical Flow~FlowNet2.0) 본 글은 https://www.youtube.com/watch?app=desktop&v=Z_t0shK98pM 기반으로 작성되었습니다... 2021. 7. 23. 이전 1 2 3 4 5 6 7 다음 반응형