P-S3-수식인식-2

강의확인

pixellink
- pixel단위로 글자인지 아닌지 확인
- 연결됐는지 확인하는 부분도 존재
  - seglink는 박스단위면, pixellink는 pixel단위로 계산
textsnake
- 휘어진 원 모양의 텍스트 인식을 위해

textFuseNet
- semantic segmentation으로 텍스트영역을 찾아낸다. global level
- detection으로 word레벨 탐지
- mask branch로 character레벨 탐지
- multi path fusion(여러 feature를 융합)

Synthetically Supervised Feature Learning for Scene Text Recognition
- 슈퍼바이즈 러닝을 적용했다.
- 왜곡된 이미지들을 잘 처리하기위해?
What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis
- 좋지않다 좋은 훈련과 평가
- 3가지 어려움을 공헌
- 1. 훈련과 평가데이터의 불일치조사, 불일치에서 성능차이를 조사
- 1. four-stage STR framework 사용
- 1. 일관된 훈련과 평가 데이터 세트로 정확, 속도, 메모리 측면의 성능측정을 했다.
Aggregation Cross-Entropy for Sequence Recognition
- ACE소개
- ACE loss function소개
  - CTC, attention
ESIR: End-to-end Scene Text Recognition via Iterative Image Rectification(수정?)
- 원근(관점)에따라 이미지가 변형이라는 문제가많다.
- 최근엔 이미지와 텍스트스타일 변형하여 학습을한다(?) 하지만 원근과 휘어진것엔 약하다
- ESIR은 휘어진것과 원근으로 변형된것을
그외 논문
- 다는 안봤는데 수식은 안보이는딩?