- 2024.01.24 ~ 2024.02.01
- 네이버 커넥트 재단 및 Upstage에서 주관하는 비공개 대회
공통 : EDA, Annotation 가이드 제작, 리라벨링, 모델 학습
김세진: 학습데이터 피클화를 통한 모델 학습시간 경량화
박혜나: 추론 결과 분석, Noise Data Augmentation
이동우: Valid set, DetEval 연구 및 코드 제작
진민주: CVAT 세팅, 외부 데이터셋 학습 진행
허재영: Pepper noise Augmentation, Noise Reduction
스마트폰으로 카드를 결제하거나, 카메라로 카드를 인식할 경우 자동으로 카드 번호가 입력되는 경우가 있습니다. 또 주차장에 들어가면 차량 번호가 자동으로 인식되는 경우도 흔히 있습니다. 이처럼 OCR (Optimal Character Recognition) 기술은 사람이 직접 쓰거나 이미지 속에 있는 문자를 얻은 다음 이를 컴퓨터가 인식할 수 있도록 하는 기술로, 컴퓨터 비전 분야에서 현재 널리 쓰이는 대표적인 기술 중 하나입니다.
이번 프로젝트에서는 OCR을 이용해 의료 영수증의 글자 영역을 Detecting하는 것이 목표입니다.
Public 5등 | Private 2등
- 전체 이미지 개수 : Train set 100장, Test set 100장
- 이미지 종류 : 진료비 영수증
- 이미지 크기 : Various
- F1 score
- EAST
- Github
- Notion
- Slack
- Wandb
- CIE Ich Noise
- Median Blur
- 명도 확산
- Pepper Noise