전체 글56 [논문 리뷰]HRformer: High-Resolution Transformer for Dense Prediction 0.Abstract -생략 1. Introduction - Vision Transformer (ViT) 은 imageNet classification tasks에서 전도 유망한 성능을 보이고 있었다. - 몇몇의 연구들은 더 넓은 Vision tasks(e.g object detection,semantic segmentation, pose estimation, video understanding)를 위해 transformer를 확장하려는 시도가 있었다. - Vision Transformer는 이미지를 크기가 16*16인 일련(sequence)의 이미지 패치로 분할(split)하고, 그리고 각각의 image patch의 feature representation을 extracts한다. 따라서, Vision T.. 2022. 3. 11. [논문 리뷰] Uformer: A General U-shaped Transformer for Image Restoration 0. Abstract - 생략 1. Introduction - 최근의 state-of-the-art methods는 대부분 convNets-based로 되어 있는데, 이는 인상적인 results를 얻을 수 있었지만, long-range dependencies를 capture하는데 한계가 있었다. - 이 문제를 해결하기 위해, 몇몇의 최근의 연구는 단일한 혹은 몇개의 self-attention layers를 low resolution feature maps에 이용하는 방법을 이용했는데, 왜 low resolution에 적용을 하나면, self-attention의 computational complexity가 feature map size의 제곱이 되기 때문이다. - 본 논문에서는, 더욱 다양한 이미지 de.. 2022. 3. 10. [논문 리뷰] Densely Connected Convolutional Networks 0. Abstract - 생략 1. Introduction - CNNs가 점점 deep해지면서, input 혹은 gradient passes 가 많은 layers 지나면서, 이것이 vanish되거나 "wash out"되는 새로운 research problem 부상하였다. - 최근에 많은 논문들이 이러한 문제를 다루고 있다. 예를 들어 ResNets와 Highway Networks의 경우 one-layer에서 다음 layer로 독립적인 connection을 통해 신호를 by-pass(우회)하거나, FactalNets은 반복적으로 평행한 layer sequence를 결합한다. - 이러한 다른 방법들은 모두 하나의 key characteristic을 공유하고 있는데, 바로 early layers과 later .. 2022. 3. 9. [딥러닝 용어 정리] Structure from motion, sfM * SFM은 Structure From Motion의 약자로, 2차원으로 촬영한 이미지의 모션 정보를 이용해 촬영된 이미지의 카메라 위치와 방향을 역추적한 후 이미지들과 카메라들의 관계를 구조화하는 알고리즘이다. SFM을 이용해, 각 촬영 이미지의 고유한 특징점(Feature Point)을 얻고 각 촬영 장면마다 특징점들과 관계를 서로 매칭하고 계산해 카메라의 위치를 얻을 수 있다. 2022. 3. 6. 이전 1 ··· 6 7 8 9 10 11 12 ··· 14 다음