P-S3-DET_SEG2-10

May 10, 2021

강의확인

객체탐지(object detection)

물체분류(classification)와 더불어 물체의 위치를 탐지

이전기술들

sliding window
- 특정 크기의 윈도우가 돌아다니면서 탐지
selective search
- 물체가 있을만한 영역에대한 후보지를 활용

딥러닝의 객체탐지

2stage
- 2단계로 물체가있을만한 영역을 추천, 후보영역에서 객체가 있을지 어떤객체인지 구별
- rcnn ~ faster rcnn
1stage
- 이미지에서 바로 객체의 위치, 클래스를 한번에 예측
- yolo

2stage model

rcnn
- selective search로 2000개의 roi추출
- 크기를 다 동일한 사이즈로 warping
- 각자 cnn을 통해 svm으로 분류를 진행
SPPNet
- 이미지를 convolution을 거치고 roi추출
- spatial pyramid pooling
  - 어떤이미지 크기라도 동일하게 pooling하는것
- cnn먼저 계산으로 여러번의 cnn계산이 필요없어졌다.
- 아직 end-to-end가 아니다.
fast rcnn
- roi projection으로 featrue map에서 roi를 계산
- roi pooling으로 일정 크기의 feature추출
faster rcnn
- selective search가 아닌 RPN(region proposal network)을 사용
- RPN
  - sliding window에 고정된 k개의 anchor box를 사용
  - 각 ancor box마다 물체유무, 물체위치를 찾아내는 layer가 존재
- NMS
  - 유사한 RPN proposal들을 제거
- end-to-end가된다.

1stage model

yolo
- 이미지를 s*s로 나눈다
- 각 그리드마다 bounding box를 만들고 물체유무, 어떤물체 인지 예측
- 백본으로 7730이 만들어진다.
  - 하나의 그리드마다 두개의 bbox가 존재할때
  - 박스의 위치(4),물체포함을 하는지 confidence(1)가 두개
  - 나머지 20개는 클래스 점수
- 그리드별로 bbox를 만들어서 그리드보다 작은것은 검출 불가능
- 백본을 거쳐서 나온 ouput을 사용하기때문에 정확도가 낮음

실습

mmdet라이브러리

피어세션

밀 대회
- 색에대해서
class mix augmentation

오늘한일

yolov3학습

어떻게했는지

mmdet를 이용하여 yolov3학습진행

좋았던점

mmdet라는 라이브러리가 많은 모델을 내장해있어 모델실험은 간단해보입니다.

아쉬웠던점

mmdet의 사용법이 좀 복잡하게 되어있어 사용하는데 익숙치 않았습니다.