강의확인

객체탐지(object detection)

  • 물체분류(classification)와 더불어 물체의 위치를 탐지

이전기술들

  • sliding window
    • 특정 크기의 윈도우가 돌아다니면서 탐지
  • selective search
    • 물체가 있을만한 영역에대한 후보지를 활용

딥러닝의 객체탐지

  • 2stage
    • 2단계로 물체가있을만한 영역을 추천, 후보영역에서 객체가 있을지 어떤객체인지 구별
    • rcnn ~ faster rcnn
  • 1stage
    • 이미지에서 바로 객체의 위치, 클래스를 한번에 예측
    • yolo

2stage model

  • rcnn
    • selective search로 2000개의 roi추출
    • 크기를 다 동일한 사이즈로 warping
    • 각자 cnn을 통해 svm으로 분류를 진행
  • SPPNet
    • 이미지를 convolution을 거치고 roi추출
    • spatial pyramid pooling
      • 어떤이미지 크기라도 동일하게 pooling하는것
    • cnn먼저 계산으로 여러번의 cnn계산이 필요없어졌다.
    • 아직 end-to-end가 아니다.
  • fast rcnn
    • roi projection으로 featrue map에서 roi를 계산
    • roi pooling으로 일정 크기의 feature추출
  • faster rcnn
    • selective search가 아닌 RPN(region proposal network)을 사용
    • RPN
      • sliding window에 고정된 k개의 anchor box를 사용
      • 각 ancor box마다 물체유무, 물체위치를 찾아내는 layer가 존재
    • NMS
      • 유사한 RPN proposal들을 제거
    • end-to-end가된다.

1stage model

  • yolo
    • 이미지를 s*s로 나눈다
    • 각 그리드마다 bounding box를 만들고 물체유무, 어떤물체 인지 예측
    • 백본으로 7730이 만들어진다.
      • 하나의 그리드마다 두개의 bbox가 존재할때
      • 박스의 위치(4),물체포함을 하는지 confidence(1)가 두개
      • 나머지 20개는 클래스 점수
    • 그리드별로 bbox를 만들어서 그리드보다 작은것은 검출 불가능
    • 백본을 거쳐서 나온 ouput을 사용하기때문에 정확도가 낮음

실습

  • mmdet라이브러리

피어세션

  • 밀 대회
    • 색에대해서
  • class mix augmentation

오늘한일

  • yolov3학습

어떻게했는지

  • mmdet를 이용하여 yolov3학습진행

좋았던점

  • mmdet라는 라이브러리가 많은 모델을 내장해있어 모델실험은 간단해보입니다.

아쉬웠던점

  • mmdet의 사용법이 좀 복잡하게 되어있어 사용하는데 익숙치 않았습니다.