Die folgende Projektmappe baut auf dem Kaggle Datensatz 'Smoking and Drinking Dataset with body signal' auf.
Erläuterungen und weitere Aspekte werden in der Dokumentation dargelegt.
Gegliedert wurde das Projekt in die Mindestanforderungen im Ordner 'DataAnalytics > Projekt > Anforderungen' und in ein finales Notebook 'Projektmappe.ipynb' für unseren UseCase.
DataAnalytics
Beinhaltet GitHub-relevante Dateien und den Projekt Ordner
DataAnalytics > Projekt
Beinhaltet die Projektmappe (unser finaler Use-Case des Moduls), sowie die Ordner Daten und Anforderungen
DataAnalytics > Projekt > Daten
Im Repository ist der Ordner 'Daten' leer. Dieser muss mit dem Dataset (smoking_driking_dataset_Ver01.csv) befüllt werden, sodass die Notebooks funktionieren. Weitere Details hierzu im nächsten Kapitel, der Bedienungsanleitung.
DataAnalytics > Projekt > Anforderungen
Dieser Ordner beinhaltet die Notebooks zu allen Anforderungen, eine requirements.txt Datei zum Definieren der Pipeline, ein init_notebook für globale Funktionen sowie die Ordner Logs und Modelle.
DataAnalytics > Projekt > Anforderungen > Logs
Beinhaltet Log-Dateien aus den Anforderungen.
DataAnalytics > Projekt > Anforderungen > Modelle
Beinhaltet trainierte Modelle aus den Anforderungen.
Dass die Jupyter Notebooks dieses Repositories funktionieren, müssen zunächst wenige Schritte durchgeführt werden:
-
Download des Datasets und speichern im Ordner DataAnalytics > Projekt > Daten mit dem Namen 'smoking_driking_dataset_Ver01.csv'.
-
Starten der Codezellen des Notebooks 0_StartUp.ipynb.
Nun können die Notebooks ausgeführt werden.