本发明涉及的宇电力负荷预测
技术领域:
,尤其涉及一种基于arima-lstm组合模型的楼宇短期负荷预测方法。
背景技术:
:随着我国城镇化建设的高速发展,楼宇建筑能耗的比重也将持续上升;为了缓解能源危机和改善环境恶化,降低楼宇能耗、提高能效管理已受到业界的重点关注,进而使得楼宇负荷预测成为泛在电力物联网建设的一项重要研究内容;精确的负荷预测,为楼宇能效管理系统制定用电需求响应和负荷调度规划提供决策依据,有利于优化供需平衡,提高用电设备的利用率,对智能电网的节能调度和稳定运行具有重要意义。目前,对短期负荷预测模型的研究主要分为两类:一类是线性模型,例如有运用协整理论并考虑带输入变量温度序列,建立arimax模型来进行短期负荷预测,极大提高了预测精度;也有采用regarima模型对消除离群值影响的月负荷数据进行预测,改善了预测效果;上述模型的研究对象均为地区负荷,其变化规律具有较强的周期性,若细化到单个楼宇负荷时,由于样本数据的波动性和随机性较大,采用线性模型将会增大预测误差;另一类是非线性模型,有采用dbn-svm组合模型来预测未来小时负荷,其预测精度较高,但忽略了不同时间序列负荷数据间的关系;也有将注意力机制(attention)与长短期神经网络(lstm)相结合,突出对负荷预测起关键作用的输入特征,建立多步长、多变量的短期负荷预测模型,有效提高了预测精度;上述研究皆对非线性模型进行优化,其预测效果良好,但作为时间序列的楼宇负荷,由于预测模型的误判、拟合不足或过度拟合等问题,采用单一人工神经网络进行建模的效果不一定最好。因此,组合线性和非线性模型可以提高系统的准确性。同时,在利用线性和非线性组合模型预测过程中,采用组合预测方法分别处理时间序列和误差序列,提高了预测的精度,其中误差序列是通过原始序列和线性预测之间的差异获得的;由于误差序列中不存在线性关系,利用非线性模型来处理误差序列中存在一些可能的非线性关系是合理的。技术实现要素:本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。鉴于上述现有基于arima-lstm组合模型的楼宇短期负荷预测方法存在楼宇短期负荷预测精度单一且不精确问题,提出了本发明。因此,本发明目的是提供一种基于arima-lstm组合模型的楼宇短期负荷预测方法。为解决上述技术问题,本发明提供如下技术方案:一种基于arima-lstm组合模型的楼宇短期负荷预测方法,包括步骤,通过数据采集器采集影响因素数据,并将负荷数据和各影响因素数据进行最大最小归一化处理后得到无量纲数据集;选取关键影响因素;计算余弦相似度,获取相似日样本数据作为训练集;将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果;其中,所述影响因素数据包括负荷数据、气象数据和日期类型数据。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:无量纲数据集为:式中,x*为归一化后的值,x为样本序列值,xmax为x中的最大值,xmin为x中的最小值。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:所述关键影响因素采用灰色关联度分析法选取。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:所述灰色关联度分析法选取步骤:求得两极最大差z、最小差z,其公式为:式中,yj为待预测日特征向量,xij为历史日特征向量;记βij为yj在xij处的关联系数,其公式为:式中,δzij=|yj-xij|;ρ为分辨系数;计算各影响因子的灰色关联权重μj,其公式为:计算灰色关联度ri,并进一步选取关键影响因素,其公式为:作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:余弦相似度采用余弦距离计算;其中,所述余弦相似度公式为:式中,cosinfpq为两负荷日之间的余弦距离,lp、lq分别为某两天关键影响因素数据。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果的步骤包括:将相似日负荷训练集数据输入到arima模型中,得到线性负荷预测值;比较负荷训练数据和线性拟合数据,得到拟合误差序列;结合相似日的关键气象因素数据,并利用lstm模型预测拟合误差序列;将线性拟合预测值与非线性误差预测值相加,得出最终负荷预测结果。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:将相似日负荷训练集数据输入到arima模型中得到线性负荷预测值,公式为:式中:l为滞后阶数,yt为当前值,λi为对应p阶的自回归系数,βi为对应q阶的移动平均系数,d为差分阶数,εt为随机误差项。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:比较负荷训练数据和线性拟合数据得到拟合误差序列,其计算公式为:δai=hi-ai,i=1,2,…,n式中:δa为拟合误差序列,h为原始负荷数据序列,a为arima线性模型拟合序列。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:结合相似日的关键气象因素数据,利用lstm模型预测拟合误差序列,其计算公式为:δlt=f(δat-1,δat-2,…,δat-n) εt式中:ft为遗忘门,it为输入门,ot为输出门,gt为备选状态,ct为当前输入更新后的单元状态,ht为当前的预测或输出状态;wf为遗忘门的权重矩阵,wi为输入门的权重矩阵,wo为输出门的权重矩阵,wg为备选状态的权重矩阵;bf为遗忘门的偏移量,bi为输入门的偏移量,bo为输出门的偏移量,bg为备选状态的偏移量;σ为sigmoid激活函数;tanh为双曲正切激活函数;·为向量中元素按位相乘;f(·)表示为lstm的非线性建模,εt为随机误差。作为本发明所述基于arima-lstm组合模型的楼宇短期负荷预测方法的一种优选方案,其中:将线性拟合预测值与非线性误差预测值相加得出最终负荷预测结果,其计算公式为:palt=pt δlt式中,palt为最终负荷预测值,pt为arima模型线性负荷预测值。本发明的有益效果:本发明在分析筛选楼宇负荷预测的训练样本数据时,考虑气象因素及日期类型序列的灰色关联度来选取相似日数据序列,有效提高了预测精度;同时通过对样本数据进行归一化处理,提高了模型的收敛速度;采用线性和非线性模型组合的方法来预测楼宇负荷,利用线性模型arima拟合时间序列的负荷数据,最大程度地消除数据中的线性成分,然后再通过非线性模型lstm来预测线性模型无法拟合的误差序列并以此来校正最终预测结果,充分发挥了线性模型和非线性模型的预测性能,有效提高了预测精度。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:图1为本发明基于arima-lstm组合模型的楼宇短期负荷预测方法的整体步骤流程示意图。图2为本发明基于arima-lstm组合模型的楼宇短期负荷预测方法所述的将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果步骤流程示意图。图3为本发明基于arima-lstm组合模型的楼宇短期负荷预测方法所述的相似日选择流程图;图4为本发明基于arima-lstm组合模型的楼宇短期负荷预测方法所述的标准的lstm网络记忆单元;图5为本发明基于arima-lstm组合模型的楼宇短期负荷预测方法所述的arima-lstm组合模型预测流程图;图6为本发明基于arima-lstm组合模型的楼宇短期负荷预测方法所述的arima模型、lstm模型、arima-svm组合模型和arima-lstm组合模型的负荷预测日平均绝对误差对比;图7为本发明基于arima-lstm组合模型的楼宇短期负荷预测方法所述的arima模型、lstm模型、arima-svm组合模型和arima-lstm组合模型的绝对百分比误差对比。具体实施方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。再其次,本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。实施例1参照图1和图2,提供了一种基于arima-lstm组合模型的楼宇短期负荷预测方法的整体结构示意图,如图1,一种基于arima-lstm组合模型的楼宇短期负荷预测方法包括通过数据采集器采集影响因素数据,并将负荷数据和各影响因素数据进行最大最小归一化处理后得到无量纲数据集;选取关键影响因素;计算余弦相似度,获取相似日样本数据作为训练集;将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果;其中,所述影响因素数据包括负荷数据、气象数据和日期类型数据。具体的,本发明主体包括s1:通过数据采集器采集影响因素数据,并将负荷数据和各影响因素数据进行最大最小归一化处理后得到无量纲数据集;其中,影响因素数据包括负荷数据、气象数据和日期类型数据;需说明的是,无量纲数据集为:式中,x*为归一化后的值,x为样本序列值,xmax为x中的最大值,xmin为x中的最小值。s2:选取关键影响因素,其关键影响因素采用灰色关联度分析法选取;需说明的是,灰色关联度分析法选取步骤:s21:求得两极最大差z、最小差z,其公式为:式中,yj为待预测日特征向量,xij为历史日特征向量;s22:记βij为yj在xij处的关联系数,其公式为:式中,δzij=|yj-xij|;ρ为分辨系数,一般在[0,1]之间取值,通常取ρ=0.5;s23:计算各影响因子的灰色关联权重μj,其公式为:s24:计算灰色关联度ri,并进一步选取关键影响因素,其公式为:s3:计算余弦相似度,获取相似日样本数据作为训练集;需说明,余弦相似度采用余弦距离计算;其中,所述余弦相似度公式为:式中,cosinfpq为两负荷日之间的余弦距离,lp、lq分别为某两天关键影响因素数据s4:将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果;进一步的,将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果的步骤包括:s41:将相似日负荷训练集数据输入到arima模型中,得到线性负荷预测值;其中,将相似日负荷训练集数据输入到arima模型中得到线性负荷预测值,公式为:式中:l为滞后阶数,yt为当前值,λi为对应p阶的自回归系数,βi为对应q阶的移动平均系数,d为差分阶数,εt为随机误差项;s42:比较负荷训练数据和线性拟合数据,得到拟合误差序列;需说明,比较负荷训练数据和线性拟合数据得到拟合误差序列,其计算公式为:δai=hi-ai,i=1,2,…,n式中:δa为拟合误差序列,h为原始负荷数据序列,a为arima线性模型拟合序列;s43:结合相似日的关键气象因素数据,并利用lstm模型预测拟合误差序列;其中,结合相似日的关键气象因素数据,利用lstm模型预测拟合误差序列,其计算公式为:δlt=f(δat-1,δat-2,…,δat-n) εt式中:ft为遗忘门,it为输入门,ot为输出门,gt为备选状态,ct为当前输入更新后的单元状态,ht为当前的预测或输出状态;wf为遗忘门的权重矩阵,wi为输入门的权重矩阵,wo为输出门的权重矩阵,wg为备选状态的权重矩阵;bf为遗忘门的偏移量,bi为输入门的偏移量,bo为输出门的偏移量,bg为备选状态的偏移量;σ为sigmoid激活函数;tanh为双曲正切激活函数;·为向量中元素按位相乘;f(·)表示为lstm的非线性建模,εt为随机误差;s44:将线性拟合预测值与非线性误差预测值相加,得出最终负荷预测结果。需说明,将线性拟合预测值与非线性误差预测值相加得出最终负荷预测结果,其计算公式为:palt=pt δlt式中,palt为最终负荷预测值,pt为arima模型线性负荷预测。实施例2本实施例是对本方法中采用的技术效果加以验证说明,本实施例选择的不同方法和采用本方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。首先通过数据采集器采集楼宇负荷影响因素数据,采集包含负荷数据、气象数据和日期类型数据,其中数据的采样间隔均为1小时,每日记录24个数据点;然后在分析筛选楼宇负荷预测的训练样本数据时,对负荷影响因素进行分析,再对原始序列数据进行预处理,最后根据灰色关联度及余弦距离选取出相似日序列数据。其中,如图1所示,对采集到的数据进行分析及操作步骤描述如下:1)由于气象因素对楼宇短期负荷预测有着重要影响,其主要影响因素有:气温、风速、相对湿度、降雨量等;对于楼宇建筑负荷而言,日期类型也是另一个重要影响因素,如工作日、非工作日(周六、周日和节假日)的电力负荷量也是差异显著。2)选择日特征相关因素:日期类型d、最高气温tmax、最低气温tmin、风速w、相对湿度h、降雨量r作为计算灰色关联度的样本,对上述序列数据进行模糊化聚类映射处理,日特征量映射表如下表所示:3)采用最大最小归一化处理,将各影响因素样本数据转换到[0,1]区间内,其计算公式如下:式中,x*为归一化后的值,x为样本序列值,xmax为x中的最大值,xmin为x中的最小值。4)采用灰色关联度分析法来选取关键影响因素。设待预测日的特征向量为yj=(y1,y2,…,ym),j=1,2,…,m,第i个历史日的特征向量为xij=(xi1,xi2,…,xim),i=1,2,…,n,其中m为影响因子个数,n为历史记录天数。以待预测日特征向量yj为参考序列,历史日特征向量xij为比较序列;其中,灰色关联度的计算步骤为:计算灰色关联系数,首先,求两极最大差、最小差,计算公式分别为:然后,记βij为yj在xij处的关联系数,则:其中δzij=|yj-xij|;ρ为分辨系数,一般在[0,1]之间取值,通常取ρ=0.5。43)计算各影响因子的灰色关联权重:44)计算灰色关联度:各影响因素的灰色关联度结果如下表:序号影响因素名称数据范围灰色关联度1气温[0,1]0.60312日期类型[0,1]0.19853降雨量[0,1]0.06764风速[0,1]0.06145相对湿度[0,1]0.03795)挑选出关键影响因素后,以该因素数据序列为对象来选择楼宇负荷预测的相识日;本发明选用余弦距离进行相似度量,选出与预测日的日期类型和气温情况最相近的15个历史日作为相似日,并将所选取的15个相似的日期类型数据、气温数据和负荷数据作为组合预测模型的训练集,具体操作如下:设某两天关键影响因素数据序列为:lp=[lp1,lp2,…,lpt];lq=[lq1,lq2,…,lqt],则余弦相似度计算如下:式中,cosinfpq为两负荷日之间的余弦距离,cosinfpq数值越大,则影响因素序列曲线形态差异越小,相似度越高。相似日选择结果如下表所示:日期余弦距离日期余弦距离日期余弦距离2017/03/081.90242017/03/051.73572017/02/291.60252017/02/281.88522017/03/011.70862017/02/231.58462017/03/021.86412017/02/201.68042017/03/071.55492017/03/091.82942017/03/061.65362017/02/241.53082017/02/161.75622017/03/121.62312017/02/221.5128进一步的,构建线性arima模型,其具体步骤如下:arima(p,d,q)模型由p阶自回归模型ar(p)、q阶移动平均模型ma(q)和产生平稳序列的差分次数d组成,通过差分处理将非平稳的时间序列平稳化,然后对因变量的滞后值以及随机误差项的当前值和滞后值进行回归。本发明根据赤池信息准则(aic)来确定模型最佳阶次,最终建立arima(2,1,2)模型,满足了模型平稳性要求,并有效地消除预测中存在的随机波动。基于图4原理,分析构建非线性lstm模型,其具体原理及步骤如下:神经网络是一种用于逼近任何非线性函数的非常有效的工具,在处理非线性问题时受到广泛使用。其中循环神经网络主要用于处理和预测时间序列数据,通过时间反向传播或实时循环学习算法进行训练。由于实际中序列过长会导致优化时出现梯度消失或爆炸的问题,经常造成训练结果较差;本发明采用一种长短期记忆(lstm)神经网络,作为rnn的变体,专门用于克服梯度消失问题,能够长时间存储信息。lstm网络由输入层,输出层和介于其间的多个隐藏层构成。其中隐藏层被构造成具有记忆功能的单元,每个单元包含了三个门,分别是输入门(inputgate),遗忘门(forgetgate),输出门(outputgate);标准的lstm网络记忆单元如图2所示,在遗忘门中,每个输入xt、前一时刻单元输出ht-1、前一时刻单元状态ct-1共同决定状态记忆单元的遗忘部分;输入门中,在sigmoid和tanh函数的激活下,将单元状态ct-1更新到ct;输出门中,更新后的单元状态ct再一次通过sigmoid和tanh函数,有选择地输出ht。lstm网络单元可以用以下方程组定义:δlt=f(δat-1,δat-2,…,δat-n) εt式中:ft为遗忘门,it为输入门,ot为输出门,gt为备选状态,ct为当前输入更新后的单元状态,ht为当前的预测或输出状态;wf为遗忘门的权重矩阵,wi为输入门的权重矩阵,wo为输出门的权重矩阵,wg为备选状态的权重矩阵;bf为遗忘门的偏移量,bi为输入门的偏移量,bo为输出门的偏移量,bg为备选状态的偏移量;σ为sigmoid激活函数;tanh为双曲正切激活函数;·为向量中元素按位相乘;f(·)表示为lstm的非线性建模,εt为随机误差。设定lstm网络的隐藏层有50个神经元,训练块大小(batch_size)为32,训练次数(epochs)为50。基于图5具体操作步骤描述如下:1)设原始负荷数据集为h=[h1,h2,…,hn],利用arima线性模型得到h的历史数据拟合序列a=[a1,a2,…,an]和预测序列pa=[p1,p2,…,pt],将拟合值与负荷实际值相比较,得到拟合误差序列δa=[δa1,δa2,…,δan],计算公式为:δai=hi-ai,i=1,2,…,n2)拟合误差序列δa在一定程度上减少了线性分量的影响,非线性特性较强。神经网络模型的非线性学习性能适用于拟合误差序列的预测校正,因此本发明利用长短期记忆神经网络(lstm)对拟合误差序列δa进行预测,得到非线性误差预测项δl,其计算公式为:δlt=f(δat-1,δat-2,…,δat-n) εt式中:f(·)表示为lstm的非线性建模,εt为随机误差,无法预测。3)将预测值δlt作为负荷误差预测结果,进一步学习误差序列的非线性特征,输出一个稳定有效的预测结果并进行误差校正,最后得到arima-lstm组合模型的预测结果,其计算公式为:palt=pt δlt选用平均绝对误差(mae)、均方根误差(rmse)和平均绝对百分比误差(mape)等统计指标对模型的负荷预测性能进行评价。其计算公式如下:式中,n为预测点总个数,为负荷实际值,pt为负荷预测值。为比较不同模型的预测效果,本发明采用arima模型、lstm神经网络模型、arima-svm组合模型和arima-lstm组合模型分别对某办公楼宇2012年3月13日至19日中每天24个时刻(时间间隔1h)的负荷进行预测,并计算出每天的平均绝对误差emape,各模型的预测结果误差曲线如图6所示,本发明方法在预测连续7天负荷的平均绝对误差均小于其他三种方法,预测效果最好。为进一步分析模型的性能,本发明再利用arima模型、lstm模型、arima-svm组合模型和arima-lstm组合模型分别对2012年3月下旬的某一天进行负荷预测,通过将各负荷模型的预测值与实际负荷数据进行比较,计算出各个时刻负荷预测的绝对误差百分比,如图7所示。根据图7中各模型负荷预测的误差百分比分布,分别统计出各时刻预测误差小于3%的概率;本发明方法的预测误差小于3%的概率要远高于其他三种模型,从而得出本发明方法在负荷预测上的准确度更高;同时,本文采用的arima-lstm组合模型的平均绝对误差emape为2.02%,与armia模型、lstm模型及arima-svm模型相比,分别低于3.13%、1.42%、0.8%,且平均绝对误差emae、均方根误差ermse也均小于其他模型,故本发明方法在控制预测误差时,效果更理想。应理解的是,在任何实际实施方式的开发过程中,如在任何工程或设计项目中,可做出大量的具体实施方式决定。这样的开发努力可能是复杂的且耗时的,但对于那些得益于此公开内容的普通技术人员来说,不需要过多实验,所述开发努力将是一个设计、制造和生产的常规工作。应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。当前第1页1 2 3 
技术特征:1.一种基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:包括步骤,
通过数据采集器采集影响因素数据,并将负荷数据和各影响因素数据进行最大最小归一化处理后得到无量纲数据集;
选取关键影响因素;
计算余弦相似度,获取相似日样本数据作为训练集;
将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果;
其中,所述影响因素数据包括负荷数据、气象数据和日期类型数据。
2.如权利要求1所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述无量纲数据集为:
式中,x*为归一化后的值,x为样本序列值,xmax为x中的最大值,xmin为x中的最小值。
3.如权利要求1或2所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述关键影响因素采用灰色关联度分析法选取。
4.如权利要求3所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述灰色关联度分析法选取步骤:
求得两极最大差z、最小差z,其公式为:
式中,yj为待预测日特征向量,xij为历史日特征向量;
记βij为yj在xij处的关联系数,其公式为:
式中,△zij=|yj-xij|;ρ为分辨系数;
计算各影响因子的灰色关联权重μj,其公式为:
计算灰色关联度ri,并进一步选取关键影响因素,其公式为:
5.如权利要求4所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述余弦相似度采用余弦距离计算;
其中,所述余弦相似度公式为:
式中,cosinfpq为两负荷日之间的余弦距离,lp、lq分别为某两天关键影响因素数据。
6.如权利要求4或5所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述将相似日负荷训练集输入到arima-lstm组合模型中,得到负荷预测结果的步骤包括:
将相似日负荷训练集数据输入到arima模型中,得到线性负荷预测值;
比较负荷训练数据和线性拟合数据,得到拟合误差序列;
结合相似日的关键气象因素数据,并利用lstm模型预测拟合误差序列;
将线性拟合预测值与非线性误差预测值相加,得出最终负荷预测结果。
7.如权利要求6所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述将相似日负荷训练集数据输入到arima模型中得到线性负荷预测值,公式为:
式中:l为滞后阶数,yt为当前值,λi为对应p阶的自回归系数,βi为对应q阶的移动平均系数,d为差分阶数,εt为随机误差项。
8.如权利要求7所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述比较负荷训练数据和线性拟合数据得到拟合误差序列,其计算公式为:
△ai=hi-ai,i=1,2,…,n
式中:△a为拟合误差序列,h为原始负荷数据序列,a为arima线性模型拟合序列。
9.如权利要求8所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述结合相似日的关键气象因素数据,利用lstm模型预测拟合误差序列,其计算公式为:
△lt=f(△at-1,△at-2,…,△at-n) εt
式中:ft为遗忘门,it为输入门,ot为输出门,gt为备选状态,ct为当前输入更新后的单元状态,ht为当前的预测或输出状态;wf为遗忘门的权重矩阵,wi为输入门的权重矩阵,wo为输出门的权重矩阵,wg为备选状态的权重矩阵;bf为遗忘门的偏移量,bi为输入门的偏移量,bo为输出门的偏移量,bg为备选状态的偏移量;σ为sigmoid激活函数;tanh为双曲正切激活函数;·为向量中元素按位相乘;f(·)表示为lstm的非线性建模,εt为随机误差。
10.如权利要求8或9所述的基于arima-lstm组合模型的楼宇短期负荷预测方法,其特征在于:所述将线性拟合预测值与非线性误差预测值相加得出最终负荷预测结果,其计算公式为:
palt=pt △lt
式中,palt为最终负荷预测值,pt为arima模型线性负荷预测值。
技术总结本发明公开了一种基于ARIMA‑LSTM组合模型的楼宇短期负荷预测方法,包括步骤,通过数据采集器采集影响因素数据,并将负荷数据和各影响因素数据进行最大最小归一化处理后得到无量纲数据集;选取关键影响因素;计算余弦相似度,获取相似日样本数据作为训练集;将相似日负荷训练集输入到ARIMA‑LSTM组合模型中,得到负荷预测结果;其中,所述影响因素数据包括负荷数据、气象数据和日期类型数据;本发明在分析筛选楼宇负荷预测的训练样本数据时,考虑气象因素及日期类型序列的灰色关联度来选取相似日数据序列,有效提高了预测精度。
技术研发人员:崔承刚;李鹏辉;官乐乐;马波;杨宁;陈辉
受保护的技术使用者:上海电力大学
技术研发日:2020.01.17
技术公布日:2020.06.09