git clone https://github.com/boostcampaitech2/semantic-segmentation-level2-cv-08.git .
conda create -n segmentation python=3.8 -y
conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch -y
pip install -r requirements.txt # smp 0.1.3
pip install pytorch-segmentation-model # smp 0.2.0
서희수 |
황원상 |
조혜원 |
홍요한 |
박준혁 |
박범수 |
한건우 |
바야흐로 대량 생산, 대량 소비의 시대. 우리는 많은 물건이 대량으로 생산되고, 소비되는 시대를 살고 있습니다. 하지만 이러한 문화는 '쓰레기 대란', '매립지 부족'과 같은 여러 사회 문제를 낳고 있습니다.
분리수거는 이러한 환경 부담을 줄일 수 있는 방법 중 하나입니다. 잘 분리배출 된 쓰레기는 자원으로서 가치를 인정받아 재활용되지만, 잘못 분리배출 되면 그대로 폐기물로 분류되어 매립 또는 소각되기 때문입니다.
따라서 우리는 사진에서 쓰레기를 Detection 하는 모델을 만들어 이러한 문제점을 해결해보고자 합니다. 문제 해결을 위한 데이터셋으로는 일반 쓰레기, 플라스틱, 종이, 유리 등 10 종류의 쓰레기가 찍힌 사진 데이터셋이 제공됩니다.
여러분에 의해 만들어진 우수한 성능의 모델은 쓰레기장에 설치되어 정확한 분리수거를 돕거나, 어린아이들의 분리수거 교육 등에 사용될 수 있을 것입니다. 부디 지구를 위기로부터 구해주세요! 🌎
- Input : 쓰레기 객체가 담긴 이미지와 bbox 정보(좌표, 카테고리)가 모델의 인풋으로 사용됩니다. bbox annotation은 COCO format으로 제공됩니다. (COCO format에 대한 설명은 학습 데이터 개요를 참고해주세요.)
- Output : 모델은 bbox 좌표, 카테고리, score 값을 리턴합니다. 이를 submission 양식에 맞게 csv 파일을 만들어 제출합니다. (submission format에 대한 설명은 평가방법을 참고해주세요
- 시각화
①Class Dependency
- 전단지의 경우 일반 쓰레기와 종이 두 가지로 annotation되어 있음
- 유리와 투명 플라스틱이 매끈한 표면, 투명함 등 이미지상에서 유사한 특징을 보임
- 얇은 물체(노끈이나 줄 등)에 대한 background Error가 아주 높은 경향을 보임
- 봉투안에 담긴 물체들은 형체가 보이나 따로 annotation되어있지 않고 plastic bag으로 표기 되어있음
② Class Imbalance
- Figure 1 에서 처럼 Class 별 annotation 수의 불균형이 많이 나타남
- 배터리의 경우, 데이터가 63개로 다른 class에 비해 현저히 적음.
④ Various Dataset Environment
- Figure 2 와 같이 다양한 환경에서 촬영된 이미지
① Data Augmentation : Class Imbalance 및 Image의 촬영 환경 보완을 위한 다양한 Augmentation 기법 시도 → Rotate, RandomResizedCrop, MotionBlur, GridDistortion, HueSaturationValue, RandomBrightnessContrast, ImageCompression, Hor/VerFlip
② Model Selection : 최적의 모델을 찾기 위해 다양한 모델로 실험
③ Generalization : 여러 Augmentation과 Noise를 넣어 시도
④ Pseudo Labeling : 학습한 모델로 test 데이터를 inference한 후, 그 결과로 추가 학습
⑤ CRF(Conditional Random field) : denseCRF 후처리를 통해 픽셀단위의 정확도 향상 도모
⑥ Ensemble : 여러 모델을 Ensemble(soft or hard voting) 함으로서 Robust한 모델 개선 시도
⑦ YohanMix : 클래스 불균형 해소를 위해 적은 개수의 클래스의 image를 기존 dataset에 CutMix와 같은 방식으로 이어붙이는 방식.
⑧ TTA(Test Time Augmentation) : 학습 때와 다른 input image를 통해 inference 하는 방법 / Multiscale