Faster-RCNN 논문 정리

Posted by JudeLee on May 11, 2016

Faster R-CNN 논문 정리

Recap

Object detection 은 region proposal methods 와 region-based CNN(R-CNNs) 를 잘 구현하는 것 으로부터 이루어질 수 있음.

Drawback of Fast R-CNN

  • Region proposal method 는 CPU 연산을 사용하여서 처리 속도 느림. => GPU 연산을 사용하여 처리 속도를 빠르게 하고 싶음.

The idea to overcome this drawback

  • R-CNN 같이 region-based detectors 에 사용되는 convolution feature maps 를 이용하여 RPN 을 구성할 수 있다.
  • 기존의 RPN 방식은 [아래 그림 a,b]과 같이 scale이나 filter size 를 multiple 하게 pyramid 형식으로 구성하였는데, 이 논문에서는 [그림 c]와 같이 regression reference 들을 pyramid 형식으로 구성함으로써 single-scale image를 사용하여 train, test 를 가능하도록 했고 이로인해 running speed 의 향상을 이루어냈다.



  • RPN 과 Fast-RCNN 이 서로 convolutional layers 를 공유하도록 함.

Architecture of Faster R-CNN

Faster-CNN 의 궁극적인 목적은 Resion proposal network 와 Fast R-CNN object detection network 간의 computation 을 share 하는것임.

  • Faster R-CNN 은 두개의 module 로 구성이 된다.

    • Region 을 proposal 하는 deep fully convolutional network.
    • Proposed 된 region 을 이용하는 Fast R-CNN detector.
  • Region Proposal Networks

    • Region proposals 을 하기위해, 각 sliding-window 위치에서 k reference boxes(k anchors) 에 relative 한 방법으로 최대 k 개를 proposal 할 수 있다.
      • 각 sliding-window 는 lower-dimensional feature(intermediate layer) 로 매핑되고, 이 feature 들은 box-regression layer(reg) 와 box-classification layer(cls) 에 fed 된다.
  • Sharing Features for RPN and Fast R-CNN

    • Alternating training
      • RPN 을 training 한 후 이를 이용하여 Fast R-CNN 을 training 한다. 이후 Fast R-CNN 에 의해 tuned 된 network 는 RPN 을 intialize 하는대에 이용되는 방식으로 반복된다.
    • Approximate joint training
    • Non-approximate joint training

Reference

  • http://arxiv.org/abs/1506.01497