아카이브 논문 리뷰를 통해 급변하는 컴퓨터 비전 연구 트렌드를 살펴봅니다.
2023년 12월 25일. 68개 논문 제출.
1. Global Occlusion-Aware Transformer for Robust Stereo Matching
KEYWORDS: Occlusion, Transformer, Stereo matching, NVS, NeRF, GOAT
GOAT(Global Occlusion-Aware Transformer를 제안. (또 당신입니까...)
Stereo-Matching 시 occlusion 영역, 텍스쳐가 없는 영역에 대한 성능 개선을 목표로 함.
키 아이디어는 같은 물체 경계 내에 있는 disparity는 연속적이어야 한다는 것.
아키텍쳐는 PDO(parallel disparity and occlusion estimation module)과 OGA(occlusion-aware global aggregation module)으로 구성되었음.
우선 PDO 모듈은 초기 disparity map과 occlusion mask를 동시에 추적함.
이후 OGA 모듈은 가려진 영역의 불일치를 정제함.
2. PlatoNeRF: 3D Reconstruction in Plato's Cave via Single-View Two-Bounce Lidar
KEYWORDS: NeRF, 3D Reconstructin, Single-View, LiDAR, Plato's Cave, SPAD(Single-Photon Avalanche Diode)
플라톤의 동굴: …… 지하의 동굴에 살고 있는 사람들을 상상해 보자. 빛으로 향한 동굴의 좁은 통로가 입구까지 달하고 있다. 사람들은 어릴 적부터 손과 발, 목이 속박되고 있어 움직이지도 못하고, 쭉 동굴의 안쪽을 보면서, 되돌아 보는 것도 할 수 없다. 입구의 아득한 위쪽에 불이 불타고 있고, 사람들을 뒤로부터 비추고 있다. 불과 사람들의 사이에 길이 있어, 길을 따라서 낮은 벽이 만들어져 있다. …… 벽을 따라서, 여러가지 종류의 도구, 나무나 돌 등으로 만들어진 인간이나 동물의 상이 벽 위에 옮겨져 간다. 옮겨 가는 사람들 속에는 소리를 내는 것도 있으며, 입 다물고 있는 것도 있다. ……
플라톤의 동굴 우화에서 아이디어를 얻었다고 한다. NeRF, 3D Reconstruction, SPAD 모두 내가 가장 관심있는 주제이니 눈길이 안 갈수가 없어 논문을 자세히 읽어봤다. 저자들은 MIT, META 소속으로 코드는 Facebook Research 의 깃허브 계정에 업로드됐다.
'Computer Vision' 카테고리의 다른 글
3D Gaussian Splatting이란? 볼륨 렌더링과 스플래팅 개념 중심으로 (0) | 2024.01.12 |
---|---|
3D Gaussian Splatting 이란 무엇인가? (0) | 2024.01.11 |
Matrix Decomposition, 행렬 분해란 무엇인가? (1) | 2024.01.07 |
23.12.15 Daily Computer Vision Paper arXiv (0) | 2023.12.17 |
23.11.10 Daily Computer Vision Paper arXiv (0) | 2023.11.09 |