Skip to content

Latest commit

 

History

History
109 lines (75 loc) · 4.85 KB

presentation.md

File metadata and controls

109 lines (75 loc) · 4.85 KB

由质量预测引出的许多话题

质量预测

  • 这是我做的主要的课题,基于循环神经网络对产品质量参数进行预测
  • 本质来说属于回归预测任务
  • 关于这部分之前汇报了很多,这里不展开了

数据挖掘

  • 数据挖掘 可以直观的从名字理解,就是从数据中挖掘出有价值的信息

  • 这里的数据通常是 结构化数据 可以简单理解为二维数据表

  • 通常数据挖掘的任务可以有一下几种:

    1. 分类:根据给定数据确定样本属于特定类别
    2. 回归:根据给定数据计算样本某一属性具体数值
    3. 聚类:把若干相似数据按某种方式分为若干子集,每一子集具有相似性,不同子集具有互斥性
    4. 降维:降低数据维度,排除相关度较弱的数据属性
  • 前两种称为有监督学习 ,后两种称为无监督学习

  • 有无监督的区别主要在于已知数据是否有确定标签

举个栗子

example

分类

classify

回归

regression

聚类

cluster

降维

dimenssion reduction

十大算法


  • 关键概念:信息熵
  • 每次分割使得系统整体的信息熵减少最多
  • 一堆决策树
    forest
  • 对线性回归再加一层非线性函数
    LR

LR1

  • 获取线性超平面
    SVM1
  • 核函数核方法
  • 条件概率
  • 多用于自然语言处理
  • Vote
  • 无监督聚类算法
    Kmeans
  • 三个臭皮匠定个诸葛亮
  • 天鹅、梭子蟹和鲤鱼
  • 无监督降维方法

PCA
PCA1

深度学习

  • 语音
  • 语意(自然语言处理)
  • 图像

CNN
重要参数:

  • 卷积核
  • 步长
  • 填充值

IBM Cloud

RNN

IBM Lab