강의확인
두문장 관계분류
- sep토큰으로 나뉜 두문장의 자연어 추론과 의미론적인 유사성을 측정
 - 데이터
    
- natural language inference(NLI)
        
- 자연어의 맥락을 이해하는지 검증
 
 - semantic text pair
        
- 두문장의 의미가 서로 같은 문장인지 검증
 
 
 - natural language inference(NLI)
        
 
피어세션
- roberta 좋다.
    
- xlm-roberta-large
 
 - 코일렉트라 좋다.
    
- 50이나…
 
 - k폴드?
 - torch native로 변경하니 좋다고 한다.
 
오늘 한일
- 새로운 토큰 추가해보기
 - kykim모델 20epoch시도
 
어떻게 했는지
- 새로운 토큰을 추가하는것으로 sentence에서 해당 단어를 e1,e2로 감싸는 방식을 적용하려함
 - epoch를 더 높이면 성능 향상을 기대함
 
좋았던 점
- 새로운 토큰을 추가하는 방식을 공부함
 
아쉬운 점
- 새로운 토큰을 넣는거 뿐만 아니라 새로운 embedding layer를 추가해야하는데 아직 더 나아가야할게 많다
    
- entity토큰으로 표시한 부분만 1로 나타나게 해야한다.
 
 - 20epoch로 했는데 오히려 떨어졌다.