• P-S3-수식인식-9

    강의확인 bag of tricks outlier data 수정 및 삭제 이미지 resize 현재는 정사각, 직사각형으로 해보면? rectify 이미지 뒤틀린 정보 augmentation 외부 데이터 기본구조 cnn backbone교체 satrn논문대로 구현수정 모델구조변경 cstr, transformer beam search decoding
  • P-S3-수식인식-8

    오늘한거 200epoch 기본 코드 확인 50단위로 이상해지는지? 아무 이상 없음 그냥 쭉 완만한 그래프가 그려짐 재학습으로 인해 러닝레이트/스케줄러가 이상해지는듯
  • P-S3-수식인식-7

    강의확인 SATRN이 원본과 다르다고 한다. encode할때 transpose를 적용함 [b,c,h,w] -> [b, h*w, c] 원래대로 하면 좋다고… 왜? shallow cnn에 dense net을사용 positionalencoding2d도 다름 원래 with, hieht각각 positional를 적용하여 alpha, beta를 곱해주고 둘을 더하는 형태 alpha, beta는 feature 맵에서 global avg pooling으로 alpha beta를 regression으로 구해준다고한다. 간단하게 50,50으로 만들었다고한다. 어케 구현?
  • P-S3-수식인식-6

    강의확인 advanced model
  • P-S3-수식인식-5

    오피스아워 코드설명
  • P-S3-수식인식-4

    피어세션 멘토님만남 박규민 데이터 가공업체 어떻게 방향을 잡아야 할지… 대회나 솔루션은? 단순 OCR로 보는중 캐글말고 icdar 비슷한 자료가 많은데, 수식인식은 정리된것도 많이 없고, 논문도 2017년이 최근, self attention같은게 적용안된 논문, 하지만 최신기술에 대한 이야기가 없으면최신기술에대해 성능이 안나왔다고 생각해야하는지? 대부분 검색을 더 해야한다. transformer가 적용되어있을것이다. 아니면 성능이 최신기술없이도 충분할경우에도 따로 내용이 없을지도 모른다. img2code?
  • P-S3-수식인식-3

    강의확인 코드확인
  • P-S3-수식인식-2

    강의확인
  • P-S3-수식인식-1

    강의확인 대회개요 수식인식 수식이미지를 입력받아 Latex포맷으로 출력 OCR중에 text recognition에 속함 평가방법 문장 단위 정확도(sentence accuracy)와 단어 오류율(word error rate)의 가중합
  • P-S3-DET_SEG2-19

    다른팀 피어세션 떡락한팀 public 오버피팅? 앙상블은 잘맞추는게 아니고 박스를 많이 만들어주는거같다. ocr은 v100 mmocr이 있다. 깃은 다들 똑같이 폴더로 나눠서 진행 unviersenet이 0.56로 나왔다고한다.