最简洁的Python时间序列可视化:数据科学分析价格趋势,预测价格,探索价格
发布时间:2020-07-14 15:07:03
阅读:352
时间序列数据在数据科学领域无处不在,在量化金融领域也十分常见,可以用于分析价格趋势,预测价格,探索价格行为等。
学会对时间序列数据进行可视化,能够帮助我们更加直观地探索时间序列数据,寻找其潜在的规律。
【工具】Python 3
【数据】Tushare
【注】示例注重的是方法的讲解,请大家灵活掌握。
01
单个时间序列
首先,我们从tushare.pro获取指数日线行情数据,并查看数据类型。
import tushare as ts
import pandas as pd
pd.set_option(‘expand_frame_repr’, False) # 显示所有列
ts.set_token(‘your token’)
pro = ts.pro_api()
df = pro.index_daily(ts_code=’399300.SZ’)[[‘trade_date’, ‘close’]]
df.sort_values(‘trade_date’, inplace=True)
df.reset_index(inplace=True, drop=True)
print(df.head())
trade_date close
0 20050104 982.794
1 20050105 992.564
2 20050106 983.174
3 20050107 983.958
4 20050110 993.879
print(df.dtypes)
trade_date object
close float64
dtype: object
交易时间列’trade_date’ 不是时间类型,而且也不是索引,需要先进行转化。
df[‘trade_date’] = pd.to_datetime(df[‘trade_date’])
df.set_index(‘trade_date’, inplace=True)
print(df.head())
close
trade_date
2005-01-04 982.794
2005-01-05 992.564
2005-01-06 983.174
2005-01-07 983.958
2005-01-10 993.879
接下来,就可以开始画图了,我们需要导入matplotlib.pyplot【2】,然后通过设置set_xlabel()和set_xlabel()为x轴和y轴添加标签。
import matplotlib.pyplot as plt
ax = df.plot(color=”)
ax.set_xlabel(‘trade_date’)
ax.set_ylabel(‘399300.SZ close’)
plt.show()
02
设置更多细节
上面画出的是一个很简单的折线图,其实可以在plot()里面通过设置不同参数的值,为图添加更多细节,使其更美观、清晰。
figsize(width, height)设置图的大小,linewidth设置线的宽度,fontsize设置字体大小。然后,调用set_title()方法设置标题。
ax = df.plot(color=’blue’, figsize=(8, 3), linewidth=2, fontsize=6)
ax.set_title(‘399300.SZ close from 2005-01-04 to 2019-07-04’, fontsize=8)
plt.show()
如果想要突出图中的某一日期或者观察值,可以调用.axvline()和.axhline()方法添加垂直和水平参考线。
ax = df.plot(color=’blue’, fontsize=6)
ax.axvline(‘2019-01-01′, color=’red’, linestyle=’–‘)
ax.axhline(3000, color=’green’, linestyle=’–‘)
plt.show()
03
移动平均时间序列
有时候,我们想要观察某个窗口期的移动平均值的变化趋势,可以通过调用窗口函数rolling来实现。下面实例中显示的是,以250天为窗口期的移动平均线close,以及与移动标准差的关系构建的上下两个通道线upper和lower。
ma = df.rolling(window=250).mean()
mstd = df.rolling(window=250).std()
ma[‘upper’] = ma[‘close’] + (mstd[‘close’] * 2)
ma[‘lower’] = ma[‘close’] – (mstd[‘close’] * 2)
ax = ma.plot(linewidth=0.8, fontsize=6)
ax.set_xlabel(‘trade_date’, fontsize=8)
ax.set_ylabel(‘399300.SZ close from 2005-01-04 to 2019-07-04’, fontsize=8)
ax.set_title(‘Rolling mean and variance of 399300.SZ cloe from 2005-01-04 to 2019-07-04’, fontsize=10)
plt.show()
调用.plot.area()方法可以生成时间序列数据的面积图,显示累计的总数。
ax = df.plot.area(fontsize=12)
ax.set_xlabel(‘trade_date’)
ax.legend(fontsize=15)
plt.show()
05
总结
文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树数据分析时间序列208944 人正在系统学习中 相关资源:ExWinner成套 价软件
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!