Computer Vision

23.12.25 Daily Computer Vision Paper arXiv

ai4man 2023. 12. 27. 14:04
반응형

아카이브 논문 리뷰를 통해 급변하는 컴퓨터 비전 연구 트렌드를 살펴봅니다.

2023년 12월 25일. 68개 논문 제출.


1. Global Occlusion-Aware Transformer for Robust Stereo Matching

KEYWORDS: Occlusion, Transformer, Stereo matching, NVS,  NeRF, GOAT

 

GOAT(Global Occlusion-Aware Transformer를 제안. (또 당신입니까...)

Stereo-Matching 시 occlusion 영역, 텍스쳐가 없는 영역에 대한 성능 개선을 목표로 함.

 

키 아이디어는 같은 물체 경계 내에 있는 disparity는 연속적이어야 한다는 것.

 

아키텍쳐는 PDO(parallel disparity and occlusion estimation module)과 OGA(occlusion-aware global aggregation module)으로 구성되었음.

 

우선 PDO 모듈은 초기 disparity map과 occlusion mask를 동시에 추적함.

이후 OGA 모듈은 가려진 영역의 불일치를 정제함.

 

2. PlatoNeRF: 3D Reconstruction in Plato's Cave via Single-View Two-Bounce Lidar

KEYWORDS: NeRF, 3D Reconstructin, Single-View, LiDAR, Plato's Cave, SPAD(Single-Photon Avalanche Diode)

 

플라톤의 동굴:  …… 지하의 동굴에 살고 있는 사람들을 상상해 보자. 빛으로 향한 동굴의 좁은 통로가 입구까지 달하고 있다. 사람들은 어릴 적부터 손과 발, 목이 속박되고 있어 움직이지도 못하고, 쭉 동굴의 안쪽을 보면서, 되돌아 보는 것도 할 수 없다. 입구의 아득한 위쪽에 불이 불타고 있고, 사람들을 뒤로부터 비추고 있다. 불과 사람들의 사이에 길이 있어, 길을 따라서 낮은 벽이 만들어져 있다. …… 벽을 따라서, 여러가지 종류의 도구, 나무나 돌 등으로 만들어진 인간이나 동물의 상이 벽 위에 옮겨져 간다. 옮겨 가는 사람들 속에는 소리를 내는 것도 있으며, 입 다물고 있는 것도 있다. ……

 

Plato's Cave

 

플라톤의 동굴 우화에서 아이디어를 얻었다고 한다. NeRF, 3D Reconstruction, SPAD 모두 내가 가장 관심있는 주제이니 눈길이 안 갈수가 없어 논문을 자세히 읽어봤다. 저자들은 MIT, META 소속으로 코드는 Facebook Research 의 깃허브 계정에 업로드됐다.

반응형