강의확인
객체탐지(object detection)
- 물체분류(classification)와 더불어 물체의 위치를 탐지
이전기술들
- sliding window
- selective search
딥러닝의 객체탐지
- 2stage
- 2단계로 물체가있을만한 영역을 추천, 후보영역에서 객체가 있을지 어떤객체인지 구별
- rcnn ~ faster rcnn
- 1stage
- 이미지에서 바로 객체의 위치, 클래스를 한번에 예측
- yolo
2stage model
- rcnn
- selective search로 2000개의 roi추출
- 크기를 다 동일한 사이즈로 warping
- 각자 cnn을 통해 svm으로 분류를 진행
- SPPNet
- 이미지를 convolution을 거치고 roi추출
- spatial pyramid pooling
- 어떤이미지 크기라도 동일하게 pooling하는것
- cnn먼저 계산으로 여러번의 cnn계산이 필요없어졌다.
- 아직 end-to-end가 아니다.
- fast rcnn
- roi projection으로 featrue map에서 roi를 계산
- roi pooling으로 일정 크기의 feature추출
- faster rcnn
- selective search가 아닌 RPN(region proposal network)을 사용
- RPN
- sliding window에 고정된 k개의 anchor box를 사용
- 각 ancor box마다 물체유무, 물체위치를 찾아내는 layer가 존재
- NMS
- end-to-end가된다.
1stage model
- yolo
- 이미지를 s*s로 나눈다
- 각 그리드마다 bounding box를 만들고 물체유무, 어떤물체 인지 예측
- 백본으로 7730이 만들어진다.
- 하나의 그리드마다 두개의 bbox가 존재할때
- 박스의 위치(4),물체포함을 하는지 confidence(1)가 두개
- 나머지 20개는 클래스 점수
- 그리드별로 bbox를 만들어서 그리드보다 작은것은 검출 불가능
- 백본을 거쳐서 나온 ouput을 사용하기때문에 정확도가 낮음
실습
피어세션
- 밀 대회
- class mix augmentation
오늘한일
어떻게했는지
좋았던점
- mmdet라는 라이브러리가 많은 모델을 내장해있어 모델실험은 간단해보입니다.
아쉬웠던점
- mmdet의 사용법이 좀 복잡하게 되어있어 사용하는데 익숙치 않았습니다.