2021 빅콘테스트 퓨처스리그 [ECO제주]
├── code
├── 0_미세먼지_데이터가공.ipynb
├── 1_데이터가공.ipynb
├── 2_EDA_및_시각화.ipynb
├── 3_for_granger_test.ipynb
├── 4_모델링_1911이후RFID종량제시행지역으로_해당지역예측.ipynb
├── 5_모델링_전체 지역 데이터로_1911이후RFID종량제시행지역예측.ipynb
├── 6_모델링_1911이전RFID종량제시행지역예측.ipynb
├── 7_평가데이터(2021_0708) 예측_1911이후RFID종량제시행지역만.ipynb
└── 8_평가데이터(2021_0708) 예측_1911이전RFID종량제시행지역예측.ipynb
- 0_미세먼지_데이터가공.ipynb
미세먼지 raw 데이터를 가공하여 본 프로젝트에서 사용하기 적절한 형식으로 (지 역별, 월별 집계) 가공하는 파이썬 코드
- 1_데이터가공.ipynb
빅콘테스트 주최에서 제공한 데이터에 대해 본 프로젝트에서 사용하기 적절한 형 식으로 (지역별, 월별 집계 및 3개월 간의 변동성 데이터 추가) 가공하는 파이썬 코드
- 2_EDA_및_시각화.ipynb
빅콘테스트 주최에서 제공한 데이터에 대해 EDA를 진행하고 발표시 사용한 시각 화 자료들을 제작하기 위한 파이썬 코드
- 3_for_granger_test.ipynb
본 프로젝트에 맞게 가공한 데이터에 대해 종속변수에 대한 인과관계를 파악하기 위해
먼저 정상성 확보를 위한 Dickey Fuller Test를 진행하여 데이터의 정상성을 확보한 뒤 Granger Test를 진행하여 각각의 변수에 대해 인과관계를 파악한 파이썬 코드
- 4_모델링_1911이후RFID종량제시행지역으로_해당지역예측.ipynb
2019.11 이후 RFID 기반 음식물쓰레기 종량제 시행 지역 4군데 ('구좌읍', '조천 읍', '한경면', '한림읍')에 대해
해당 지역의 데이터들만 사용하여 해당 지역의 음식 물쓰레기 배출량을 예측하는 모델을 제작한 파이썬 코드
- 5_모델링_전체 지역 데이터로_1911이후RFID종량제시행지역예측.ipynb
전체 지역 데이터를 사용하여 2019.11 이후 RFID 기반 음식물쓰레기 종량제 시행 지역 4군데
('구좌읍', '조천읍', '한경면', '한림읍')의 음식물쓰레기 배출량 예측 모델을 제작한 파이썬 코드
- 6_모델링_1911이전RFID종량제시행지역예측.ipynb
2019.11 이전 RFID 기반 음식물쓰레기 종량제 시행 지역 37 군데
('남원읍', '대정읍', '성산읍', '안덕면', '애월읍', '표선면', '건입동', '노형동', '대륜동',
'대천동', '도두동', '동홍동', '봉개동', '삼도1동', '삼도2동', '삼양동', '서홍동', '송산동',
'아라동', '연 동', '영천동', '예래동', '오라동', '외도동', '용담1동', '용담2동', '이도1동',
'이도2동', '이호동', '일도1동', '일도2동', '정방동', '중문동', '중앙동', '천지동', '화북동', '효돈동')의 데이터를 활용하여 해당 지역의 음식물쓰레기 배출량 예측 모델을 제작한 파이썬 코드
- 7_평가데이터(2021_0708) 예측_1911이후RFID종량제시행지역만.ipynb
전체 지역 데이터를 사용하여 2019.11 이후 RFID 기반 음식물쓰레기 종량제 시행 지역 4군데
('구좌읍', '조천읍', '한경면', '한림읍')의 음식물쓰레기 배출량을 예측 하는 모델을 활용하여 2021.07, 2021.08 음식물쓰레기 배출량을 예측하는 파이썬 코드
- 8_평가데이터(2021_0708) 예측_1911이전RFID종량제시행지역예측.ipynb
2019.11 이전 RFID 기반 음식물쓰레기 종량제 시행 지역 37 군데
('남원읍', '대정읍', '성산읍', '안덕면', '애월읍', '표선면', '건입동', '노형동', '대륜동',
'대천동', '도두동', '동홍동', '봉개동', '삼도1동', '삼도2동', '삼양동', '서홍동', '송산동',
'아라동', '연동', '영천동', '예래동', '오라동', '외도동', '용담1동', '용담2동', '이도1동',
'이도2동', '이호동', '일도1동', '일도2동', '정방동', '중문동', '중앙동', '천지동', '화북동', '효돈동')의 데이터를 활용하여
해당 지역의 음식물쓰레기 배출량 예측 모델을 활용하여 2021.07, 2021.08 음식물쓰레기 배출량을 예측하는 파이썬 코드
[결과]
1차 > 통과
2차 > 탈락
- 데이터 가공 시 종속변수와 독립변수 사이의 시간 격차 상당하여 모델 성능에 악영향 주었을 가능성 있음
- 날씨 데이터의 경우 예측하고자 하는 날짜 당일의 데이터 활용함 (시간격차를 반영하지 못함)
- 시계열적 특징을 갖는 데이터에 대해 시계열적 특징을 많이 반영하지 못한 모델 제작
- 모델 성능 부족