강의확인
앙상블 기법들
- bias, variance
- model averaging(voting)
- 서로다른 모델은 서로다른 에러를 만든다고 생각
- hard voting
- soft voting
- cross validation
- 훈련셋과 검증셋을 분리하지만 검증셋을 활용하기
- stratified k-fold cross validation
- validation이 되는 모든 경우를 고려
- class분포고려하여 분리
- TTA(test time augmentation)
- augmentation한 이미지들을 test한 결과들을 앙상블
- 시간이 오래걸린다.
hyperparameter optimization
- 다양한 hyperparameter을 확인하고 실험
- 많은 시간이 걸린다.
- optuna
training visualizatino
- tensorboard
- torch.util에 존재
- log에 있는 파일을 읽어서 웹으로 표현
- tensorboard –logdir path(log경로) –host addr(서버주소) –port port(포트번호)
- weight and bias(wandb)
- 로그의 깃허브느낌이라한다.
- 원격저장소에 저장된다.
machine learning project
- jupyter와 python idle
- jupyter
- python
- 간편한 코드 재사용
- 디버깅!
- 실험핸들링이 쉽다!
피어세션
- cv보다 pil이 좋았다.
- focalloss는 써라
- 꼭! labelsmoothing을 해라
- 나이에서 신경써야된다.
- 모델은 하나로 하는게 좋을거같다고한다.
오피스아워
오늘 한일
- 아직 부족하다 생각한 데이터 다루는거 처음부터 코드 뜯어보기
어떻게 했는지
- 하나씩 몰랐던 함수는 작성하면서 진행
- 작성하고 몰랐던 부분은 따로 디버깅으로 확인
좋았던 점
아쉬운 점
- 많이 아쉬운 한주다.
- 아직 제대로 공부가 안되어서 전체적으로 이해를 못하였다.
- 차근차근 따라가지만 아직 따라갔다고 생각이 안든다.
- 너무 조급하진 않게 너무 조급해서 이상한 방향이 되지 않게 스테이지1를 진행해야할듯하다.