- 这是我做的主要的课题,基于循环神经网络对产品质量参数进行预测
- 本质来说属于回归预测任务
- 关于这部分之前汇报了很多,这里不展开了
-
数据挖掘 可以直观的从名字理解,就是从数据中挖掘出有价值的信息
-
这里的数据通常是 结构化数据 可以简单理解为二维数据表
-
通常数据挖掘的任务可以有一下几种:
- 分类:根据给定数据确定样本属于特定类别
- 回归:根据给定数据计算样本某一属性具体数值
- 聚类:把若干相似数据按某种方式分为若干子集,每一子集具有相似性,不同子集具有互斥性
- 降维:降低数据维度,排除相关度较弱的数据属性
-
有无监督的区别主要在于已知数据是否有确定标签
- 关键概念:信息熵
- 每次分割使得系统整体的信息熵减少最多
- 条件概率
- 多用于自然语言处理
- Vote
- 三个臭皮匠定个诸葛亮
- 天鹅、梭子蟹和鲤鱼
- 无监督降维方法
- 语音
- 语意(自然语言处理)
- 图像
- 卷积核
- 步长
- 填充值