Skip to content

Latest commit

 

History

History
24 lines (18 loc) · 807 Bytes

README.md

File metadata and controls

24 lines (18 loc) · 807 Bytes

黄金舆情数据分析

项目流程

(1)舆情数据获取

爬取尽量多的新闻、点评以及行情播报等内容。

(2)舆情数据分类

以按照数据来源、数据内容分类。

(3)情绪分类

对每一条舆情进行舆情分类,可分为乐观、悲观、中性三类,可使用人工字典分类法或者机器学习自动分类法。

(4)构建变量

两种变量构建思路: a. 对舆情分类进行加工,构建情绪指标。 b. 对每一条新闻进行加工,构建词频变量。

(5)数据训练及结果分析

使用机器学习等方法对训练集进行训练,并进行结果分析。

(6)因子测试

使用情绪指标进行因子测试

(7)策略构建

根据训练结果构建黄金交易策略。