반응형 논문 정리42 FlowNet : Learning Optical Flow with Convolutional Networks(Optical Flow~FlowNet2.0) 본 글은 https://www.youtube.com/watch?app=desktop&v=Z_t0shK98pM 기반으로 작성되었습니다. ## Optical Flow란? Optical Flow는 연속한 두 Frame 사이에서 각 Pixel의 Motion을 타나내는 Vector Map이다. 그림으로 설명하자면 다음과 같다. 이는 비디오의 인접한 두 프레임(t-1 frame, t frame)이 있을 때 t-1 frame의 픽셀을 빨간점이라고 하자 이 빨간점이 다음 프레임(t frame)에서의 빨간점으로 옮겨진 벡터(화살표 표시)가 나온다. 이 벡터를 t-1의 위치에 빨간점에 할당을 시킨다. 이를 한 점이 아닌 모든 픽셀에 대해서 계산을 하고 할당을 한 map을 Optical Flow라고 한다. ### Visua.. 2021. 7. 21. Object Detection 정리(RCNN, FastRNN,FasterRCNN 중심으로) 전체적인 글 내용은 나동빈님의 유튜브를 참고하였습니다.(대신 홍보해요! 구독과 좋아요 눌러주세요..ㅎㅎ) https://www.youtube.com/watch?v=jqNCdjOB15s&t=865s ## Object Detection 개념 Object Detection은 다수의 사물이 존재하는 상황에서 각 사물의 위치와 클래스를 찾는 작업이다. - Classification : 한 이미지가 있을 때 그 클래스가 무엇인지 - Object Detection : 한 이미지가 있을 때 그 안에 클래스가 무엇인지 + 그 위치는 어떻게 되는지 - Segmentation : 한 이미지가 있을 때 그 안에 클래스가 무엇인지 + 그 위치는 어떻게 되는지 + 픽셀단위로 ## Object Detection의 두가지 방식 - .. 2021. 6. 21. TransGAN : Two Transformers Can Make One Strong GAN 원 논문 : https://arxiv.org/pdf/2102.07074.pdf 퀄리티 높은 포스팅을 위해 논문을 1차적으로 읽고 여러 리뷰를 통해 완벽히 이해하고 논문 리뷰를 진행하였는데.. 이번 논문은 전혀 리뷰가 없어서(있어도 외국..있으나 마나이다..) 내가 쌩으로 읽고 쌩으로 이해한 것을 바탕으로 포스팅한다. 따라서..틀린 점이 있을 수도 있다...! 하지만 난 이걸 갖고 발표도 해야하므로..최대한 완벽하게 읽고 이해하고 포스팅을 진행한다.(주관적 기준..) 요즘 Comuputer Vision 분야에서 CNN이 살아남을 수 있을까라는게 큰 이슈이다. 최근에는 Transformer 기반의 Networks 구조가 각광을 받고 있고 심지어 더 최근에는 MLP가 더 발전을 해서 Computer Visio.. 2021. 5. 15. A Style Based Generator Architecture for Generative Adversarial Networks(StyleGAN) 원 논문 : arxiv.org/abs/1812.04948 A Style-Based Generator Architecture for Generative Adversarial Networks We propose an alternative generator architecture for generative adversarial networks, borrowing from style transfer literature. The new architecture leads to an automatically learned, unsupervised separation of high-level attributes (e.g., pose and identit arxiv.org 참고 링크 : www.youtube.com/wa.. 2021. 5. 9. Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks(CycleGAN) 원 논문 : arxiv.org/abs/1703.10593 Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks Image-to-image translation is a class of vision and graphics problems where the goal is to learn the mapping between an input image and an output image using a training set of aligned image pairs. However, for many tasks, paired training data will not be a arxiv.org 참고 링크 : www.youtube.. 2021. 4. 29. Generative Adversarial Nets(GAN) 원 논문 arxiv.org/pdf/1406.2661.pdf 참고 자료 www.youtube.com/watch?v=AVvlDmhHgC4 나동빈님의 유튜브를 참고하여 진행하였는데 정말 갓동빈님이시다...설명을 이렇게 쉽게 해주시는 분은 거의 처음본다..역시 갓동빈님이시다.. 위 논문은 무려 NIPS2014 에 개제된 대단한 논문이다. 사실 Image Generation 이라고 하면 GAN 알고리즘을 떠올릴 만큼 Image Generation의 대명사인 알고리즘이다. ## Abstract 기존의 생성 모델은 Markov chain이나 unrolled approximate inference network를 사용하였지만 GAN 알고리즘은 전혀 이런 과정이 필요하지 않고 오직 Neural Network만으로 구성한.. 2021. 4. 4. 이전 1 ··· 3 4 5 6 7 다음 반응형