Машинное обучение 4 курс

Репозиторий создан для выполнения работ по машинному обучению. Выполнение работ предполагает применение алгоритмов задачи классификации и линейной регрессии к выбранному датасету.

Датасет и название задачи

Для выполнения работ выбран датасет Real/Fake Job Description Prediction.

Этот датасет содержит 18 тысяч описаний должностей, из которых около 800 - поддельные. Данные состоят из текстовой информации и метаинформации о вакансиях. Набор данных можно использовать для создания моделей классификации, которые могут изучить мошеннические описания должностных обязанностей.

Необходимо создать модель классификации, которая использует функции текстовых данных и мета-функции и предсказывает, какие описания вакансий являются мошенническими или настоящими. Также необходимо определить ключевые черты / особенности (слова, сущности, фразы) описания должностных обязанностей, которые являются мошенническими по своему характеру.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
ML_Lab_1.ipynb		ML_Lab_1.ipynb
ML_Lab_2.ipynb		ML_Lab_2.ipynb
README.md		README.md
fake_job_postings.csv		fake_job_postings.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Машинное обучение 4 курс

Датасет и название задачи

About

Releases

Packages

Languages

Sirotin-D/MachineLearning

Folders and files

Latest commit

History

Repository files navigation

Машинное обучение 4 курс

Датасет и название задачи

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages