阶段报告
项目简介
- 通过使用过往股票交易数据对模型训练,使它可以对下一天的股票价格进行预测。
一、数据清洗
首先需要对从网易财经获得上证综值进行清洗,具体包括:
1)填补日期,并对非交易日的数据进行剔除; 2)除去股票中不需要的属性;
二、模型训练
分为以下几步:
1. 将股票数据标准化,并分为训练集和测试集。
训练集:测试集 = 9:1
标准化公式:
为处理后数据
为处理前数据
为处理窗口的第一个数据
2. 构建神经网络模型
采用两层LSTM结构,每层LSTM层后接Dropout层用来防治过拟合
第一层输出维度为50,第二层为100
准确率计算公式:
![公式](http://latex.codecogs.com/gif.latex?acc=1- | \frac{y_t-y_p}{y_t+1} | ) |
损失函数采用的是MSE(均方误差),优化器采用的是RMSProp
3.训练结果
在训练集上迭代500次:
训练集损失图如下:
验证集准确率:
测试集结果:
测试集误差:
- 误差0.01以内:81.5126%
- 误差0.02以内:96.2185%
- 误差0.05以内:100.0000%
三、后续工作
利用训练好的模型对个股的情况进行预测