Skip to content

hqye-123/data-analysis-with-r

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

data-analysis-with-r

课程简介

  • 数据科学是综合了统计学、计算机科学和专业领域的交叉学科,具体内容就是用数据的方法研究科学,用科学的方法研究数据。
  • R 语言是统计编程的第一语言,集统计分析与图形显示于一体。通过学习和掌握语言的语法,可以编制自己的函数来扩展现有的语言。
  • 2019 年国际统计学年会将考普斯总统奖(统计学界的诺贝尔奖)颁给 R 语言宏包 tidyverse 的作者 Hadley Wickham,说明 R 语言得到了学术界的充分认可。
  • 由于统计分析能力突出、作图功能强大、拓展与开发能力强等特点,在国际上,R 语言在自然科学和社会科学研究领域,得到了越来越广泛的应用。

本课程将以 R 语言作为数据科学学习之旅的新起点,讲解 R 语言入门基础、数据可视化、数据处理、探索性分析、统计建模、案例解析以及在代表性领域的应用,适用于研究生和博士生。

课程目标

训练数据思维、提升编程技能、培养创新能力

课程内容

编号 标题 主要内容
0 Why R? R是什么?R能干什么?为什么是R?
1 安装与环境配置 了解数据科学流程,配置运行环境,安装R和Rstudio,以及如何安装所需要的宏包
2 R语言基础 基本运算、数据类型、数据结构、常用统计函数等,了解脚本、宏包以及如何获取帮助
3 可重复性文档 Rmarkdown语法,生成html格式报告、生成pdf格式报告、生成word格式报告
4 运算符及向量运算 算术运算符,关系运算符,逻辑运算符,以及向量化操作
5 函数 基础函数、自定义函数,函数调用,使用宏包函数
6 子集选取 向量、列表、矩阵、数据框
7 读取数据 项目管理,文件命名,读取外部文件
8 数据处理 dplyr数据处理
9 数据处理进阶 各种数据处理技巧,案例讲解
10 数据可视化1 ggplot2基本语法、映射、设置、图片保存
11 数据可视化2 几何图形
12 数据可视化3 标度体系
13 数据可视化4 主题风格
14 数据规整 长表格、宽表格以及相互转化
15 行方向 数据框中的行方向和列方向操作
16 因子类型数据 因子型变量及其在可视化中的应用
17 可视化探索 用ggplot2重复一张图
18 数据可视化5 统计图层
19 数据可视化6 可视化中的图形组合、字体、配色等
20 代码规范 代码书写规范及可读性
21 字符串处理 正则表达式,文本信息提取
22 线性回归 一元回归、多元回归模型,重点是分析和解释模型输出、拟合与预测
23 列表列 增强型数据框及其应用
24 迭代 高效迭代技术及其在建模中的应用
25 探索性数据分析1 结合案例数据,综合运用数据处理、可视化探索技能
26 基础统计分析 基本描述统计,假设检验,方差分析,以及与线性回归的等价性
27 广义线性回归 logistic regression, poisson regression
28 多层模型 多层线性模型, pooling model, no-pooling model, partially pooled model
29 探索性数据分析2 结合具体案例,完成数据分析和建模,训练数据思维
30 模拟 理解模型最好的方法就是模拟

关于考核

结合所在学科,找一篇与自己研究方向相关的文献,用课堂上学到的 R 统计编程技能,重复文献的数据分析和可视化过程。

参考书目

我会努力的

愿 R 语言成为你构建知识大厦的脚手架!

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published