사진에서 쓰레기를 Detection 하는 모델을 만들어 잘못 분리배출되는 문제점을 해결해보고자 합니다. 문제 해결을 위한 데이터셋으로는 일반 쓰레기, 플라스틱, 종이, 유리 등 10 종류의 쓰레기가 찍힌 사진 데이터셋이 제공됩니다.
- Input : 쓰레기 객체가 담긴 이미지와 COCO format의 bbox annotation
- 전체 데이터셋 중 약 50%(4883장)는 학습 데이터셋으로 활용됩니다.
- Output : 모델은 bbox 좌표, 카테고리, score 값을 리턴합니다. 이를 submission 양식에 맞게 csv 파일을 만들어 제출합니다. (submission format에 대한 설명은 평가방법을 참고해주세요.)
Evaluation
류건 | 심건희 | 윤태준 | 이강희 | 이예라 |
---|---|---|---|---|
Blog | Blog | Blog | Blog | Blog |
level2_objectdetection_cv-level2-cv-11
└── baseline
└── UniverseNet # MMDetection 기반 패키지
└── detectron2
└── detrex # Detectron2 기반 패키지
└── faster_rcnn
└── mmdetection
└── yolov7 # 자체 라이브러리
└── notebooks # EDA, ensemble, pseudo labeling 등
모든 실험은 아래의 환경에서 진행되었다.
- Ubuntu 18.04.5 LTS
- Intel(R) Xeon(R) Gold 5120 CPU @ 2.20GHz
- NVIDIA Tesla V100-PCIE-32GB
최종 모델: 1stage, 2 stage 각각 앙상블 후 다시 앙상블
잘한 점
- Github Convention을 정하여 협업 결과 공유 및 정리에 큰 도움이 되었다.
- Github 이슈, PR 등의 기능을 적극적으로 사용해보았다.
- 힘든 일정에도 서로를 격려하고 팀 분위기를 긍정적으로 유지하였다.
- 다양한 SOTA object detector 에 대해 공부하고 실험했다.
- 함께 디버깅하여 빠른 문제 대응을 할 수 있었다.
- PR-Curve 등 Wandb 기능을 커스텀하여 다양한 메트릭을 볼 수 있었다.
- Wandb를 사용하여 실시간 모니터링 및 팀원들과의 결과 공유가 용이했다.
아쉬운 점:
- 추가한 코드에 대해 코드 내에서 설명이 부족했다.
- 모델 및 기법들에 대해 이론적인 공부와 결과분석이 부족했다.
- 대회 종료까지 Bounding Box의 크기, 비율을 고려하지 않은 데이터셋 분할을 사용해서 모델 학습과 검증이 잘 안되었다.
- augmentation 에 대한 실험이 부족했다.
- Kaggle competition 의 토론글들을 모델 외의 method 선정에 활용하지 못했다.
- 팀원간의 방향성 공유가 부족했다.
- data 근거에 기반해서 실험계획이 수립되지 않았다.
개선할 점:
- 주어진 시간 내에 다양한 변수를 모두 고려하여 균형 잡힌 실험 계획을 할 것이다.
- Kaggle competition의 인기 토론글들을 좀 더 적극 활용 해볼 것이다.
- 팀 적 활동을 더 많이 하도록 노력해야겠다.
- 팀 내의 문제점과 목표를 서로 공유하고 다같이 다듬어 나갈 수 있는 방안을 강구해야겠다
- 쉬운 것부터 단계적으로 실험해나갔으면 좋겠다.