GitHub - 2694927131/data_mining: 《Python数据挖掘入门与实践》代码，数据以及教程

教程系列简介

系列地址：https://www.cnblogs.com/xiaohuiduan/category/1661541.html

该教程为入门教程，为博主学习数据挖掘的学习路径步骤。教程为入门教程，从最简单的开始。使用的编程语言为Python3.8.1，使用JupyterNotebook作为开发环境（使不使用JupyterNotebook都没有关系）。

在学习本教程之前，你需要：

有一点python编程基础
会用百度 or 谷歌
数学知识还是要一点的（但是要多少呢？我也不知道，我也是刚开始学）

我也是刚学，如有任何问题，可以邮箱联系我：[email protected]

本项目会涉及如下：

在项目中，一般每一部分只由一篇博客构成，但是如果比较难的话会分为两个部分，前一部分为python代码实现，后面一部分为介绍。

从无到有，陆陆续续一个数据挖掘入门系列的教程就写了18篇博客了，这个是我没有想到的，本来以为可能写10篇博客就结束了，但是写着写着写着写着就写了这么多。

总的来说，这个系列的博客写的不是很满意，因为不知为何自己就把侧重点放到到机器学习上面去了，使得这个系列的博客越来越像机器学习的入门博客┑(￣Д ￣)┍，对数据具体如何处理反而没有做什么介绍。但是，这个也不能怪我，实在是《Python数据挖掘入门与实践》这本书到后面就开始介绍神经网络了，然后呢我又对其进行了补充（补充了CNN的内容以及介绍）。同时书中的**“图”和“mapreduce”的内容没有做介绍！！！**emm，我嫌麻烦就懒得弄了。

是新手的我，刚开始以为数据挖掘和机器学习很难，但是机缘巧合的接触到了《Python数据挖掘入门与实践》这本书，在书中，刚开始以一个很简单的算法：数据挖掘入门系列教程（一）之亲和性分析让我顿时觉得，哇！怎么这么简单。尽管这本书很老了，但是却让我以一种无脑的方式开始了我的学习之旅。但是到后面就有一点坑（比如说使用SVM，但是却不告诉我SVM是什么🤮）。

尽管这个教程目前来说我不是很满意，但是同时系列也不会再进行更新（纠错除外）。想了想，尽管这个教程作为一个数据挖掘的教程明显是不合格的，但是对于入门教程来说，自我感觉还是🆗的，因为对于入门的我们来说，并不需要去深入去了解数据挖掘及其算法，它只需要告诉我们：

而只有当我们提起兴趣之后，我们才能够更好的进行学习。因此看完这教程的时候，就更应该继续看书了，更加深入的去了解数据挖掘。

长路漫漫唯键盘作伴，数据挖掘没有这么简单，但是当我们对其产生兴趣的时候，也许它也就变得简单了。我们寻找一个个数据背后所蕴含的规律，跟随前人的步伐甚至突破，最后得到满意的结果时，看着自己掉落的头发，emm好像也值得了？？

Talk is cheap, show me the code.

如果有任何问题，欢迎私信或mail。

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
CNN		CNN
DNN		DNN
SVM		SVM
imgs		imgs
k-means		k-means
亲和性分析		亲和性分析
决策树		决策树
抽取特征		抽取特征
朴素贝叶斯twitter文本		朴素贝叶斯twitter文本
欧式距离电离层		欧式距离电离层
电影亲和性分析		电影亲和性分析
神经网络		神经网络
简单分类问题_OneR算法		简单分类问题_OneR算法
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

教程系列简介

About

Releases

Packages

Languages

2694927131/data_mining

Folders and files

Latest commit

History

Repository files navigation

教程系列简介

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages