1 minute read

📢 RCNN 논문 읽고 정리 Keywords: R-CNN, Region proposla, Selective Search, pre-trained & fine tuning

1. About Paper

  • 제목: Rich feature hierarchies for accurate object detection and semantic segmentation
  • 저자: Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik
  • 기타 정보: CVPR 2014 UC Berkeley
  • 링크: https://arxiv.org/abs/1311.2524

2. Intoduction

  • R-CNN은 주로 Object Detection에 대해 다룬다. Object Detection이 무엇이고 어떤 방법으로 진행되어 왔는지, 그리고 R-CNN의 의의에 대해 간략하게 살펴본다.

01. Object Detection?

Object Detection Object Detection

  • Obejct detection이란 주어진 이미지에서 객체와 그 크기에 대한 bounding box와 객체의 클래스를 예측하는 task이다.
  • Image classification과 달리 객체가 이미지에서 어디에 위치하는지 알아야하기에, object detection은 여러 물체에 대해 classfication과 loacalization을 진행하는 것이라 할 수 있다.

02. 기존 방법

Sliding Window 1 Sliding Window 2 Sliding Window

  • OverFeat 알고리즘 같은 기존의 sliding window를 통한 object detection은 patch가 pixel 단위로 이미지 전체를 돌며 candidate를 만들고, 각 patch candidate들에 대해 classification을 진행하고 scoreing 한다.

    Sliding window란 사각형 상자 모양의 window를 이용해 전체 이미지에 대해 sliding 시키고 모든 사각형 영역에 대해 자동차가 포함되는지 분류하는 것을 의미한다.

  • 이는 매우 많은 개수의 window 영역에 대해 예측을 진행해야하기에 window 개수만큼 계산량이 늘고, 물체의 크기가 다양해지면 단일 크기의 window로 이를 커버할 수 없기에 계산비용이 너무 많이 든다는 단점이 있다.

03. 그 한계와 R-CNN의 의의

3. Main Idea

01. Contribution

  • 본 논문의 특징은 크게 두가지 이다.
    1. 객체 탐지를 위한 영역 제안(region proposal)에 CNN을 적용
    2. Pre-training(사전 훈련)과 fine-tuning을 적용해서 훈련 데이터가 적은 상황에서 성능을 끌어올림

02. Model Architecture

  • Region Proposals

03. Training

Region Proposal

NVM(Nom-Maximum…

IoU(Interest over Union)

  • Finetuning

    04. Test Time

4. Experiments

01. PASCAL VOC

PASCAL VOC 데이터셋?

Hyperparameter settings

Results

02. ILSVRC2013

ILSVRC2013 데이터셋?

Hyperparameter settings

Results

5. Conclusion

Reference

#형광펜

개인 공부 기록용 블로그 입니다.