End-to-End Object Detection with Transformers

End-to-End Object Detection with Transformers

arxiv.org

DETRs Beat YOLOs on Real-time Object Detection

arxiv.org

이 논문은 "End-to-End Object Detection with Transformers" (DETR)입니다. DETR는 객체 탐지를 직접적인 집합 예측(set prediction) 문제로 간주하여, 기존의 탐지 기법에서 사용되던 NMS(Non-Maximum Suppression) 및 anchor boxes를 제거한 End-to-End Transformer 기반 모델을 제안합니다.

논문의 주요 내용 요약:

  1. 기존 객체 탐지의 문제점
  2. DETR의 핵심 아이디어
  3. 모델 구조
  4. DETR의 성능 및 장점
  5. 한계점

학습 방향

  1. Transformer를 어떻게 적용했는가?
  2. Bipartite Matching Loss는 어떻게 작동하는가?
  3. DETR의 한계를 극복하기 위한 후속 연구

Abstract

우리는 객체 탐지를 직접적인 set prediction problem 으로 간주하는 새로운 방법을 제안한다. 우리의 접근 방식은 탐지 파이프라인을 단순화하여, NMS(Non-Maximum Suppression) 과정이나 앵커(anchor) 생성과 같은 수작업 설계 요소들을 제거한다.