Shift+Enter by Changellenge
Shift+Enter by Changellenge >> — это бесплатная платформа IT-практики. Здесь компании выкладывают задачи, с которыми сталкиваются ежедневно.
В ходе виртуальной стажировки, была решена задача от компании Schlumberger, которая разделена на 3 подзадачи.
Описание подзадач: "Тебе предстоит изучить данные, содержащие параметры резервуара и работ по гидроразрыву пласта (ГРП). Технология основана на закачивании в пласт жидкости гидроразрыва, содержащей проппант, при давлении, достаточном для создания трещин гидроразрыва."
- Заполнить недостающие данные;
- Проверить гипотезу о связи Reservoir Pressure(давление в резервуаре) и Total Prop Mass(общая масса закачанного проппанта);
- Прогноз массы проппанта, которую следует закачать в рассматриваемый пласт.
Более подробное описание подзадач в файле Problems.docx.pdf
- Заполнение пропусков с использованием алгоритма KNNImputer;
- Применение критерия Спирмена, для проверки гипотезы о связи Reservoir Pressure и Total Prop Mass;
- Обучение XGBRegressor и CatBoostRegressor и последующий усредненный прогноз массы проппанта, которую следует закачать в рассматриваемый пласт.
Оценка качества моделей осуществлялась с использованием метрики Mean Absolute Percentage Error.
Результаты моделей на отложенной валидационной выборке:
- XGB:
MAPE = 0.1187
- CatBoost:
MAPE = 0.0990
- Усреднение:
MAPE = 0.0913