一种基于季节分解和曲线拟合的混合模型

2022-05-12 版权声明 我要投稿

摘要:针对时间序列预测与曲线拟合预测的优缺点,提出了一种季节分解与曲线拟合相结合的混合预测模型,解决了曲线拟合精度与高阶次震荡性强的矛盾,提高预测的精度和模型对数据的适应能力。同时针对具有时间周期特性的物流量,该模型在预测时充分考虑了上期物流量及近期预测物流量对本期的影响。最后将该模型与其他预测方法相比较,证明该模型的有效性和可行性。

关键词:物流量预测;季节分解;曲线拟合;自变量偏差

物流量预测是物流领域的重要环节之一,其预测的准确度影响着后续所有物流工作的作业安排。目前,物流量常用的预测方法有加权平均法、指数平滑法、ARIMA统计模型、曲线拟合模型及线性回归模型等。影响物流量变化的因素越来越多,各因素对结果的影响程度难以定量,因此预测精度时常不佳。ARIMA统计模型对数据的分布有线性要求,对于非线性数据的拟合优度效果不佳,曲线拟合则面临拟合精度与高次阶数震荡性强的矛盾。

张璐等[1]系统地概述了物流预测方法,总结各方法的优缺点。杨荣英等[2]在移动平均值的基础上,提出了物流预测技术中的移动平均线方法。唐伟鸿等[3]提出了一种基于时间序列的支持向量机(SVM)的物流预测方法。王宣承等[4]提出了季节分解和神经网络相结合的物流预测混合模型。

在时间序列分析法中,利用季节因子分解可以有效减少已有数据之间的数值差异,经过季节因子分解后建立自回归积分滑动平均模型(ARIMA),对物流量进行预测,但缺点是要求季节分解后的数据是稳定的,本质上只能捕捉线性关系,不能捕捉非线性关系。在实际运用过程中,部分数据经过季节因子分解后仍无法建立ARIMA模型。曲线拟合可以有效建立波动数据组的拟合方程,将物流量预测问题转化为数学函数关系问题,对数据的拟合适应性较强。但曲线拟合的拟合优度与拟合方程的阶数正相关,拟合方程过高的阶数固然可以提高拟合优度,但方程震荡性较强,因变量对自变量的变化过于敏感。在实际应用中对之后月份的预测值变动大,预测精度难以把控[5-7]。

因此,本文将时间序列分析方法中的季节因素分解与曲线拟合预测法相结合,并做出改进,提出一种基于季节因素分解与曲线拟合的混合预测模型,利用SPSS与MATLAB软件实现具体模型的计算。通过实证研究,与目前已有预测方法相比较,证明本预测模型的有效性与可行性。

问题分析与建模思路

在物流量预测中,通常是以历史数据为基础,预测未来几个月的物流量,但实际上,影响物流量变化的因素较多,例如市场、季节、政策等,这些因素难以量化,且相互影响。

此外,物流量的变化又存在着周期性和延续性。在预测一种产品物流量的变化时,不仅要考虑到上一周期同期量的变化趋势,还要考虑近期该产品物流量的变化趋势。例如,服装类商品物流量变化在遵循季节周期的同时,也受近期的促销活动与时尚风向的影响。为考虑这两者影响,本文将物流量预测分为两个阶段。第一阶段中,设时间为自变量,物流量为因变量,根据上一周期已有数据建立曲线拟合方程。第二阶段,先把本期已知因变量代入上述曲线拟合方程,反解相应自变量,与原有自变量进行对比,求出偏差,并对所需预测时间段对应的自变量进行修正;最后,将自变量修正值代入曲线拟合方程,得到最终预测值。

基于季节分解与曲线拟合的混合预测模型

2.1定义预测周期

通常,物流量的预测往往以月份为单位,以年为周期,但实际生活中,难以做到以1月为开始、12月为结束的理想周期,因此,本文提出只要预测周期满足12个月份,无论从几月开始,都视为一个预测周期。一个预测周期中,所需预测月份应为该周期中最后的几个月份。

定义预测周期后,将该周期中的月份由远及近上的历史数据进行季节分解。

Ⓒ计算各季节周期中数据的平均值A.

Ⓒ计算所有季节周期中数据的平均值B.

④利用平均值A与平均值B计算季节指数C=A/B.

对物流量预测时,通过季节性分解能够克服大量已知或未知因素的影响,仅仅考量月份因素对物流量的影响,找出月份与物流量之间的函数关系。

2.3曲线拟合

利用多项式对季节因子分解后的数据进行拟合,数据波动明显减少,表现出一定的规律性,缓和了拟合精度与高阶拟合曲线震荡性强的矛盾,有效地控制了多项式幂次。

设月份为自变量x,物流量y为因变量,用n次多项式进行拟合,p为相关系数,则对应函数关系表达式为:  y=f(x)=pxn+pxn-1+pxn-2+…+pnx+pn+1(3)

2.4混合预测模型

(1)记x(0)={x(0),x(0),x(0),…,x(0)}为上一周期中月份自变量,其对应的物流量因变量为y(0)={y(0),y(0),y(0),…,y(0)},用已知数据得到拟合方程y(0)=f(x(0))。

(2)记y(1)={y(1),y(1),y(1),…,y(1)}为预测依次定义为12,3…,12,在曲线拟合中,1代表周期中时间最远月份,12代表周期中最近月份,由此期中时间最远月份,12代表周期中最近月份,由此期中时间最远月份,12代表周期中最近月份,由此周期,其中y(1)至y(1)

为该周期已知数据,y(1)、将月份之间的顺序关系转换为数学中1至12的递为所需预测数据。

2季节因子分解

季节因子分解可将一个周期序列分解成长期趋势(T)、季节变动(S)、循环变动(C)和不规则变

(3)利用MATLAB中solve函数将{y(1)}(i=1,2,3,…,9)代入y(0)=f(x(0))中求解,得到一组x'(0),i=1,2,3,…,9.

(4)与{x(0)}对比,该组数据的偏差程度为:  x'(0)-x(0)  动(I)。这四个因素互相作用。通常有两种组合方式:

其一,四种因素相互独立,即时间序列是四种因素直接叠加而成的,可用加法模型表示:  Y=T+S+C+I(1)

其二,四种因素相互影响,即时间序列是四种

因素相互综合的结果,可用乘法模型表示:  α=ii×100%,i=1,2,3,…,9(4) i

(5)求解平均偏差程度:

9  _∑αi  α=i=1,(5)

(6)确定带有偏差修正的自变量表示为:

(1)  (0)_  Y=T*S*C*I(2)

季节因子的分解步骤如下:

x'i=xi×(1+α),i=10,11,12.(6)(7)所求预测月份物流量

Ⓒ确定历史数据的季节周期,整理三个周期以

(1)  i  =f(x'(1)),i=10,11,12.

实证分析

1基础数据

本文以某电商配送中心好丽友蘑菇力商品的月物流量为例验证混合模型的可行性。已有该产品2014年9月至2018年8月共计48个月的物流数据,如图1.需要对之后的9、10、11三个月进行物流量预测。

图1好丽友蘑菇力商品2014年9月至  2018年8月物流量数据图

3.2季节因子分解

通过直接观察发现该商品在11月与12月的物流量相比其他月份有明显突变,其余月份则上下波动较小,总体呈现一种缓慢上升的趋势。利用SPSS软件,将数据进行季节性分解后,得到季节因子如表1:

表1季节因子数据表

图2显示季节因子分解的误差在0.95至1.05之间,误差极小,证明分解效果较好。图3可以看出好丽友蘑菇力商品的季节因子对商品波动影响较大,剔除季节因子后数据波动较小,总体变化呈现为上升趋势。

3.3曲线拟合

对于提出季节因子的数据,利用MATLAB软件  图2ERR误差序列图

图3SAS剔除季节因素数据图

进行多项式拟合,本文针对论证数据采用三次多项式拟合,在95%的置信度下,得到拟合方程为y=0.030x3-0.759x2+8.582x+219.600.拟合方差为126.5,相关系数为0.921,调整后相关系数为0.891.拟合曲线如图4:

图4拟合曲线图

3.4混合模型求解

将2017年12月至2018年8月的物流量数据代入拟合曲线,反解自变量,观察自变量的偏差程度,得到其平均偏差值为11.62.

表2自变量x偏差表

将平均偏差值与预测月份变量值组合,代入拟合方程,加入季节因子,最终得出6月、7月、8月的物流量预测值为283、284、903.

3.5预测精度检验

利用后残差检验法检验预测精度,根据已知数据,计算得知,在预测月份中,真实数据的均值-(1)

3.6预测结果比对

为验证本文混合预测模型的有效性,将混合模型与其他三种预测模型进行对比。

首先,剔除季节因子后采用ARIMA模型建模,得出ARIMA(0,0,0)(1,2,0)模型,其模型拟合度统计平稳R方为0.446,杨博克斯Q(18)显著性为0.328,其R方值仅属于可以接受的结果,拟合程度不高,显著性大于0.05则无法证明该模型大概率可用。

其次,单纯的曲线拟合预测,由于数据之间差距较大,使用4次幂多项式拟合,其拟合优度中方差为21710,相关系数为0.9077,调整后相关系数0.8549,虽然相关系数与混合模型差距不大,但其方差过大,且拟合函数震荡性较强,如图5所示,造成无法考虑近期物流量对预测量的综合影响。

为493,预测值与真实值的绝对误差均值e为21,真实值的标准差S1为316,真实值与预测值的绝对误  S2  差标准差S2为11.计算方差比c==0.035.  1

计算小误差概率p={|e(k)-  -e|<0.6745  S1},从表3中查询可知,该混合模型预测精度等级较高,达到“好”标准,可以用于预测。

最后,与传统的指数平滑法的预测模型相比较。结果显示在预测结果中,在平均绝对误差(MAE)及均方根误差(RMSE)上,混合模型相较于ARIMA模型及曲线拟合预测、指数平滑预测上都较小,其预测准确性较好。

表4不同预测方法所得预测结果比对表

结论

通过分析曲线拟合及季节分解的优点,将二者

的优势结合,提出基于季节分解与曲线拟合的混合模型,利用季节因子分解解决了曲线拟合精度与拟合方程高阶的震荡性矛盾,并利用曲线拟合拓展了数据模型建立的适用范围。同时,本文提出的混合模型在进行物流量的预测时,采用曲线拟合方程,将预测月份因变量代入上一期拟合方程之中,基于本期与上期已知物流量对自变量x的偏移影响,不仅考虑到同期物流量的综合影响,还考虑到近期物流量发展趋势对预测量的影响。数据证明其预测效果优于目前的部分预测方法。因此,该混合模型对于物流量的预测是可行的,对企业中物流预测工作有一定的参考价值。

参考文献:

[1]张璐,木仁.物流需求预测方法概述[J].物流科技,2015,38(7):104-106.

[2]王宣承,刘恩猛,程展兴.基于季节分解和神经网络的物流预测混合模型[J].统计与决策,2014(11):80-82.

[3]唐伟鸿,李文锋.基于时间序列的支持向量机在物流预测中的应用[J].物流科技,2005(1):8-11.

[4]杨荣英,张辉,苗张木.物流预测技术中的移动平均线方法[J].武汉理工大学学报:交通科学与工程版,2001(3):  353-355.

[5]张强,王毅,李鼎睿.基于X-12-ARIMA季节分解与年度电量校正的月度电量预测[J].电力建设,2017,38(1):76-83.

[6]王婉娜,石慧,曾建潮.基于模糊神经网络的齿轮剩余寿命预测模型研究[J].太原科技大学学报,2018,39(6):424-430.

上一篇:网络隐私行政法保护探讨下一篇:工业设计CAD技术的发展现状和趋势