Fast R-CNN
Category
Fast R-CNN
RoI pooling layer라고 SPP layer의 간단 버전. single level scale만 받음. 그래서 여기선 SPPnet은 (예를 들어, VGG16 모델을 사용했을때) 3-layer softmax classifer만 fine-tuning이 가능한데, 그이유는 convoulutional features가 offline으로 작동함. 그래서 Back-propagation이 안되서 첫 l3 layers만 초기값으로 고정되고, 마지막 3 layer만 업데이트. 그래서 SPPnet은 R-CNN에서 개발한 ROI-centric하게 training가능함. RoI에 대해서 계산하는데 보통 RoI 크기가 원본 image 만함. 그래서 느리고 메모리도 너무 많이든다. 하지만 FRCN에서는 image-centric임. mini-batches들이 hierarchically 샘플되는데, 이미지 그다음 그 이미지의 RoI들에 대해서. 한 image에 대한 RoI들은 computation, memory 공유함.
전체적인 아이디어는 SPPnet과 비슷한데, 더 나은 방식으로 Back Propogation 알고리즘을 설계해서 기존의 SPPnet이 Conv layers들을 학습시키지 못한 단점을 보완한 것으로 보인다.
Documentation
- Fast R-CNN (Ross Girshick, Microsoft Research)
- https://github.com/rbgirshick/fast-rcnn
-
1504.08083v2.pdf
Favorite site
- Microsoft Research: Fast R-CNN
- Fast R-CNN / Object detection with Caffe 1
- [추천] Object Detection and Classification using R-CNNs
References
-
Caffe-cvpr15-detection.pdf ↩