---数据分析师---
八、时间序列分析

🔸时间序列原理
时间序列及其应用
- 时间序列(TIME SERIES)挖掘是数据挖掘中的一个重要研究分支,有着广泛的应用价值
- 近年来,时间序列挖掘在宏观的经济预测、市场营销、客流量分析、太阳黑子数、月降水量、河流流量、股票价格等众多领域得到应用。事实上,社会、科学、经济、技术等领域中广泛存在着大量的时间序列数据有待进一步的分析和处理。
- 时间序列数据挖掘通过研究信息的时间特性,深入洞悉事物进化的机制,是获得知识的有效途径。
时间序列分析
- 时间序列亦称为动态数列或时间数列(TIME SERIES),就是把反映某一现象的同一指标在不同时间上的取值,按时间的先后顺序排列形成的数列。
- 分析时间序列的目的
- 描述事物在过去时间的状态
- 分析事物发展变化的规律
- 对事物的发展变化趋势进行预测
时间序列示例
- GDP即国内生产总值,它是对一国(地区)经济在核算期内所有常住单位生产的最终产品总量的度量,常常被看成反映一个国家(地区)经济状况的重要指标。本列给出1998-2021年GDP数据时间序列图

🔸常用时间序列模型
时间序列的构成要素
长期趋势:线性趋势、非线性趋势
- 线性趋势:移动平均法、移动中位数法、线性模型法
- 非线性趋势:二次曲线、指数曲线、修正指数曲线、Gompertz曲线、Logistic曲线
季节变动:按月(季)平均法、趋势剔除法
循环波动:剩余法
不规则波动
时间序列的数学模型
设Tt表示长期趋势,St表示季节变动趋势,Ct表示循环变动趋势,Rt表示随机干扰项,Yt是观测目标的观测记录。则常见的确定性时间序列模型有以下几种:
加法模型:yt = Tt + St + Ct + Rt
- 各个影响因素对时间序列的影响是可加的,并且是互相独立的。
乘法模型:yt = Tt St Ct * Rt
- 各个影响因素对时间序列的影响是互相不独立的。
*混合模型:yt = Tt St + Ct Rt 或 yt = Tt + St Ct Rt
常用模型选择
- 绘制原始数据的时间散点图,分不同情况选择不同模型
- 平滑、线性趋势:选指数平滑法中的线性趋势模型,如Holts
- 平滑、季节性:选指数平滑法中的季节模型,如Winters
- 不稳定、季节性或受多变量影响:ARIMA
- 不确定那种模型好:专家模型
--END--