[Paper Review] R-CNN 논문 리뷰
📢 RCNN 논문 읽고 정리 Keywords: R-CNN, Region proposla, Selective Search, pre-trained & fine tuning
1. About Paper
- 제목: Rich feature hierarchies for accurate object detection and semantic segmentation
- 저자: Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik
- 기타 정보: CVPR 2014 UC Berkeley
- 링크: https://arxiv.org/abs/1311.2524
2. Intoduction
- R-CNN은 주로 Object Detection에 대해 다룬다. Object Detection이 무엇이고 어떤 방법으로 진행되어 왔는지, 그리고 R-CNN의 의의에 대해 간략하게 살펴본다.
01. Object Detection?
Object Detection
- Obejct detection이란 주어진 이미지에서 객체와 그 크기에 대한 bounding box와 객체의 클래스를 예측하는 task이다.
- Image classification과 달리 객체가 이미지에서 어디에 위치하는지 알아야하기에, object detection은 여러 물체에 대해 classfication과 loacalization을 진행하는 것이라 할 수 있다.
02. 기존 방법
Sliding Window
- OverFeat 알고리즘 같은 기존의 sliding window를 통한 object detection은 patch가 pixel 단위로 이미지 전체를 돌며 candidate를 만들고, 각 patch candidate들에 대해 classification을 진행하고 scoreing 한다.
Sliding window란 사각형 상자 모양의 window를 이용해 전체 이미지에 대해 sliding 시키고 모든 사각형 영역에 대해 자동차가 포함되는지 분류하는 것을 의미한다.
- 이는 매우 많은 개수의 window 영역에 대해 예측을 진행해야하기에 window 개수만큼 계산량이 늘고, 물체의 크기가 다양해지면 단일 크기의 window로 이를 커버할 수 없기에 계산비용이 너무 많이 든다는 단점이 있다.
03. 그 한계와 R-CNN의 의의
3. Main Idea
01. Contribution
- 본 논문의 특징은 크게 두가지 이다.
- 객체 탐지를 위한 영역 제안(region proposal)에 CNN을 적용
- Pre-training(사전 훈련)과 fine-tuning을 적용해서 훈련 데이터가 적은 상황에서 성능을 끌어올림
02. Model Architecture
- Region Proposals
03. Training
Region Proposal
Selective Search
NVM(Nom-Maximum…
IoU(Interest over Union)
- Finetuning
04. Test Time
4. Experiments
01. PASCAL VOC
PASCAL VOC 데이터셋?
Hyperparameter settings
Results
02. ILSVRC2013
ILSVRC2013 데이터셋?
Hyperparameter settings
Results
5. Conclusion
Reference
- https://bkshin.tistory.com/entry/%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-R-CNN-%ED%86%BA%EC%95%84%EB%B3%B4%EA%B8%B0
- https://wikidocs.net/142645
#형광펜
개인 공부 기록용 블로그 입니다.