오늘 한일
- pstage 세팅
- EDA란?
- exploratory data anlysis
- 데이터 분석
- 데이터의 특징을 파악하기
- 파이썬으로 시작해서 분석하는 연습은?
- competition데이터셋(마스크쓴얼굴 데이터)를 이용해 EDA수행해보기
- 샘플코드 실행
어떻게 했는지
- pandas의 pandas_profiling적용해보기
- 직접 각 클래스별로 분포를 확인하기
- pandas와 python기술이 필요
- 샘플 코드 실행하여 나온 결과를 리더보드에 적용해보았다.
- 11%로 제대로된 학습은 안되었다.
좋았던 점
- 피어세션이 많이 어색할줄 알았지만, 정보공유가 적절히 이루어졌다.
- EDA에 대한 대략적인 기본개념을 알 수 있었다.
아쉬운 점
- EDA의 개념을 알아도 완벽하게 이걸 통해 어떤 이점이 있을지에대한 모델링의 과정이 있어야 이해할수 있을거 같다.
- EDA분석으로 어떤 모델링의 변화가 있는지?
- 아직 파이썬에 익숙치 않아서 코딩이 어렵다.