강의확인

앙상블 기법들

  • bias, variance
    • high variance는 bagging
  • model averaging(voting)
    • 서로다른 모델은 서로다른 에러를 만든다고 생각
    • hard voting
      • one-hot을통해 다수결로 결정
    • soft voting
      • 확률을보고 결정
  • cross validation
    • 훈련셋과 검증셋을 분리하지만 검증셋을 활용하기
  • stratified k-fold cross validation
    • validation이 되는 모든 경우를 고려
    • class분포고려하여 분리
  • TTA(test time augmentation)
    • augmentation한 이미지들을 test한 결과들을 앙상블
  • 시간이 오래걸린다.

hyperparameter optimization

  • 다양한 hyperparameter을 확인하고 실험
  • 많은 시간이 걸린다.
  • optuna
    • 파라미터 범위를 주고 그 범위 안에서 실험

training visualizatino

  • tensorboard
    • torch.util에 존재
    • log에 있는 파일을 읽어서 웹으로 표현
    • tensorboard –logdir path(log경로) –host addr(서버주소) –port port(포트번호)
  • weight and bias(wandb)
    • 로그의 깃허브느낌이라한다.
    • 원격저장소에 저장된다.

machine learning project

  • jupyter와 python idle
  • jupyter
    • 셀단위 실행!
    • EDA가 좋아!
  • python
    • 간편한 코드 재사용
    • 디버깅!
    • 실험핸들링이 쉽다!
      • config사용

피어세션

  • cv보다 pil이 좋았다.
  • focalloss는 써라
  • 꼭! labelsmoothing을 해라
  • 나이에서 신경써야된다.
  • 모델은 하나로 하는게 좋을거같다고한다.

오피스아워

  • 시드를 고정

오늘 한일

  • 아직 부족하다 생각한 데이터 다루는거 처음부터 코드 뜯어보기
    • augmentatino
    • dataset

어떻게 했는지

  • 하나씩 몰랐던 함수는 작성하면서 진행
  • 작성하고 몰랐던 부분은 따로 디버깅으로 확인

좋았던 점

  • 없다.

아쉬운 점

  • 많이 아쉬운 한주다.
  • 아직 제대로 공부가 안되어서 전체적으로 이해를 못하였다.
  • 차근차근 따라가지만 아직 따라갔다고 생각이 안든다.
  • 너무 조급하진 않게 너무 조급해서 이상한 방향이 되지 않게 스테이지1를 진행해야할듯하다.