一种基于BOA-SVR和模糊聚类的分时段精细化短期负荷预测方法与流程

专利2022-06-29  152


本发明涉及电力系统的负荷预测技术领域,特别是一种基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法。



背景技术:

科学的负荷预测对电力系统许多部门有着重要的作用和意义,如今智能电网技术在不断地飞速发展,复杂的电网规模增大了电力数据的复杂程度,这就对负荷预测的准确性和实时性有更高的要求,所以这成为人们不断深入研究并发展电力系统负荷预测理论的终极目标。

目前,国内外的学者对负荷预测的最优预测方法进行了深入的研究,提出了较多优化的负荷预测方法:一类是传统的统计学方法,包括线性回归法、相关性分析法、时间序列和灰色系统方法。这些预测方法运用简单,但对于一些非线性的影响因素不能很好地适用;另一类是机器学习法,包括模糊推理系统、人工神经网络、小波变换和支持向量机等。与传统的统计方法相比,机器学习法能综合分析负荷历史数据和影响因素的关系,预测精度有所提升。在这些方法中,支持向量回归svr具有学习能力强、适应性好且适用于小样本数据学习的优点,但其预测效果受模型参数的影响较大,若参数选择不当则导致svr的预测精度较低,预测效率也下降。蝙蝠算法(ba)是一种具有“生成 检验”特征的迭代搜索优化群智能算法,具有较强的局部搜索能力和良好全局寻优能力,适用于预测模型参数优化等方面;但其也存在易陷入局部最优解、收敛精度不高、算法收敛速度不均衡等缺点。另一方面,在研究影响负荷变化的因素时,只是考虑和分析历史数据的相似性,而且在考虑气象因素的影响时,利用气象因素对负荷的相似性来处理每日的特征气象因素,但仅仅考虑气象因素的相似性不能全面分析负荷特性,且由于影响负荷变化的因素复杂,不同因素对负荷的影响呈现非线性的特点,这样会导致预测方法精度的降低甚至失效。如今,现代负荷预测方法新的发展趋势是将数据挖掘技术用于历史负荷数据的筛选并结合机器学习方法来进行预测。



技术实现要素:

为了克服上述不足,本发明的目的是要提供一种基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法。

为达到上述目的,本发明是按照以下技术方案实施的:

一种基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,包括以下步骤:

s1,根据地区的历史负荷数据和特性来分析影响负荷变化的因素,并考虑实时影响因素提出分时段综合预测法;

s2,利用模糊c均值聚类方法将历史数据聚类得到不同的类型,并评价其聚类效果;

s3,利用动态自适应权重的方法和柯西分布逆累积部分函数对蝙蝠算法进行改进;

s4,利用改进的蝙蝠算法对svr的参数进行寻优,寻找最优参数建立svr分时段精细化模型,将待预测各个时段平均负荷值作为svr的输出得到预测结果;

进一步的,对s1中的历史负荷数据进行处理包括:第一步,数据预处理;第二步,归一化处理;所述数据预处理为:采用比较法处理历史负荷数据中的不良数据,对于单个的不良数据,将该点前后时刻的负荷数据取平均值得到该点的负荷值;对于连续出现多个的不良数据,对比某时刻的负荷值与同时刻前后不同日期的负荷平均值,若无法找到则剔除数据;所述归一化处理为:在数据预处理后,将负荷数据xi按下列公式进行归一化处理:

式中:yi表示归一化处理过的负荷数据;xi为初步处理后输入的负荷数据;xmax为初步处理后样本中最大负荷数据;xmin为初步处理后样本中最小负荷数据;

进一步的,根据处理过的有效负荷数据情况,利用皮尔森相关性分析法来定量分析主要影响因素和负荷之间的相关度,所述主要影响因素包括温度、湿度、风速和降水量;根据历史负荷数据日特性可以看出不同时段的负荷组成和特性变化,根据变化规律将日负荷分为若干个时段组合而成;

进一步的,步骤s2中,利用模糊c均值聚类的具体方法为:设c个聚类中心为v={v1,v2,…,vc},全部n个样本的聚类情况由一个隶属度矩阵u来描述,即

上述式中,uij为第j个样本归属于第i类的隶属度,模糊c均值聚类按照以下规则和约束条件聚类,得到最优的分类:

其中的参数设置如下:

上述式中:m>1是加权指数,m越大则聚类中心越靠近隶属度较高的元素,m一般取值为2;||vi-xj||为样本xj与聚类中心vi之间的距离,其次,为了求出式中泛函jm(u,v;x)的极小值,将得到的局部最优点的必要条件进行轮换寻优,即

采用类内距离指标评价聚类后的效果,该指标表征各类别的聚类中心和其对应类中的所有元素的距离的平均值;假设聚类得到k类不同负荷特性,ck表示各个类别中的样本集合,pik表示样本中的全部元素,nk表示各个类别中的样本数,各个类别的ctk为聚类中心,其中k=1,2,…k。mia的公式如下:

其中,聚类效果的评价与mia的值密切相关,值越小,得到的效果越好;mia最小值对应的聚类数目就是模糊c均值聚类的输入聚类数,即为得到的聚类结果;

进一步的,骤s3中,利用svr构建模型的具体过程为:设训练样本集的样本数设为n,因此训练样本集可以表示为(x1,y1),(x2,y2),…(xn,yn),其中xi(xi∈rd)是i个样本的输入向量xi=[xi1,xi2,…,xid]t其输出值为yi(yi∈r)。将训练样本集利用非线性函数映射到高维空间,从而形成高维空间的线性函数,表达式见下式:

式中:x为输入向量,xi∈rn;w为权值矢量,w∈rn;b为偏置值,b∈r;通过引入不敏感损失函数来评价模型的预测效果,表达式见下式:

式中:f(x)为预测值;ε为不敏感损失函数;y为真实值;若y与f(x)的关系满足|y-f(x)|≤ε,则表示该不敏感损失在可接受的范围内,并近似地用数值0来表示;利用最小结构风险函数对高维空间的线性函数中w和b求解,计算公式见下式,

式中:ξi,均为松弛变量;c为惩罚因子;

在训练样本集时,当预测误差大于回归函数f(x)对训练误差的要求ε时,对样本的惩罚因子c会随着预测误差的增大而增大,同时f(x)的误差变化也会影响ε的值;然后,利用拉格朗日函数式将上述计算公式转换成对偶形式,所述拉格朗日函数式为:

式中:ai,ai*,aj,aj*为拉格朗日乘子,ai,ai*,aj,aj*∈[0,c];k(xi,xj)为核函数,根据高精度高运算效率的要求,选用rbf函数作为svr的核函数,rbf核函数见下式:

式中:g为核函数的参数;根据以上分析可以得到回归函数f(x),见下式:

式中:xi为支持向量;

进一步的,步骤s3中,利用动态自适应权重的方法对蝙蝠算法改进的具体过程为:采用动态自适应权重的方法将蝙蝠算法中蝙蝠个体的速度公式改进为:

式中:ωi(t)为动态自适应权重,所述动态自适应权重ωi(t)的表达式为:

式中:t为当前迭代次数,tmax为最大迭代次数;

进一步的,步骤s3中,利用柯西分布逆累积部分函数改进蝙蝠算法的具体过程为:利用柯西分布函数式将蝙蝠算法中蝙蝠种群个体的位置公式改进为:

式中,f-1是柯西分布逆累积分函数,表示变异前第i只蝙蝠的位置,其中r是区间[0,1]内一个均匀分布的随机值,为系数向量,表达式见下式:

式中,是区间[2,0]的线性递减向量,是区间[0,1]内均匀分布的随机向量;

进一步的,步骤s4中,根据改进的蝙蝠算法对最优参数g、c的寻优过程如下:

第一步:设定svr中的参数g和c的取值范围;

第二步:随机初始化蝙蝠算法中的相关参数,参数有蝙蝠种群个体数n、蝙蝠i的位置xi、脉冲频率的最大值fmax和最小值fmin、蝙蝠i的位置xi的维数d、蝙蝠发出的响度ai、脉冲波发射率ri、最大迭代次数ni,以及算法结束的条件;

第三步:初始化蝙蝠种群中各个蝙蝠的起始位置初始飞行速度发出的脉冲频率fi;

第四步:计算初始蝙蝠种群中每个蝙蝠的适应度fitnesss,各个蝙蝠所在位置xi的横纵坐标,分别表示的参数g、c,然后选取训练集进行训练和测试,fitnesss能反应负荷预测的准确率;

第五步:更新蝙蝠种群中各个蝙蝠的脉冲发射频率、飞行速度和位置,采用改进的动态惯性自适应和柯西分布的逆累积分布函数的方法来改善寻优过程;

第六步:更新蝙蝠位置,第一次更新时产生第1个随机数rand1,若rand1>ri,说明搜索时是以当前蝙蝠的位置为局部最优位置,在后面的搜索中生成蝙蝠的新位置xnew;

第七步:计算蝙蝠新位置xnew的适应度fitnesssnew,并生成随机数rand2,若rand2>ri,且fitnesssnew<fitnesss,则更新t 1时刻蝙蝠的脉冲音量和脉冲波发射率rit 1,脉冲音量更新公式中,通过调整α的的适应度,来增加ba搜索的多样性的,并更新最优解及其适应度。

第八步:重复迭代过程,输出最优解和适应度;即若算法满足结束条件或达到最大迭代次数,则输出当前蝙蝠所在位置的最优解和适应度;若不满足,则转回第五步继续计算,重复过程,直到满足时停止计算过程。

与现有技术相比,本发明的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法具有以下有益效果:

(1)本发明利用模糊c均值聚类对历史数据样本进行聚类并评价其聚类效果,对预测日负荷分别建立考虑实时影响因素的分类型分时段的方法,可有效的提高数据的精度,对于不同类型日的预测精度均可达到96%以上,同时降低预测模型的规模,减少了模型训练的时间。

(2)本发明以预测精度为判断依据,为了优化svr模型的参数,提出了改进的动态自适应权重的方法和柯西分布逆累积分布函数的蝙蝠算法(boa)对svr模型相关参数寻优,减少了svr模型中参数不合理对负荷预测结果准确率的影响,明显的提高了预测的精度。

(3)蝙蝠算法的搜索性能和稳定性比其他传统群智能优化算法要优异,但是在不断增加优化问题的维数后,发现蝙蝠算法的性能会下降。针对蝙蝠算法的这个缺点,为了提高其优化性能,本发明提出了采用动态自适应权重的方法来改善,通过引入余弦函数来增加蝙蝠速度更新方式的灵活性,从而改变了更新速度的更新系数僵化在1的状态,整体的蝙蝠速度提高;又由于余弦函数的最大值为1,从而限制了蝙蝠在寻觅猎物时的速度过快。综上这样可以保持蝙蝠的更新系数为区间[0,2]的动态值,使得蝙蝠算法在局部以及全局搜索时得到平衡。

(4)为了进一步解决蝙蝠算法易陷入局部极值的问题,本发明选取柯西逆累积分布函数对蝙蝠进行变异,使得蝙蝠个体附近生成更大的扰动,有利于蝙蝠个体在广阔的范围内及时更新位置并跳出局部极值。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本实施例的典型日负荷曲线图;

图2为本实施例的聚类效果评价指标值与聚类数目变化曲线;

图3为本实施例中两种模型在寻优过程中的收敛性能对比图;

图4为本实施例的第一天负荷预测结果对比图;

图5为本实施例的第二天负荷预测结果对比图;

图6为本实施例的第三天负荷预测结果对比图。

具体实施方式

下面结合附图以及具体实施例对本发明作进一步描述,在此发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。

本实施例选用国家电网河南省某地区供电公司的负荷数据,气象数据来自该地区的气象台,负荷数据来自该区域的21个变电站,其中110kv厂站6个,35kv厂站12个,水电站3个,采样的时间间隔为15min,24小时为96个采样点;气象数据包括该地区2016-2018年的温度、湿度、降水量和风速等,采样的时间间隔为1h,共24个采样点,后利用三次样条插值法处理天气数据,从而实现svr预测模型中的多点负荷数据对应多点天气数据。

负荷数据处理:

第一步,数据预处理。对于历史负荷数据,由于会出现各种原因造成数值不合理的不良数据,样本数据的质量很大程度上影响了负荷的预测精度;因此需要对采集到的不良数据进行处理,但是为了避免数据失真,应该少修改,尽量使用原数据,本实施例采用比较法处理不良数据,对于单个的不良数据,将该点前后时刻的负荷数据取平均值得到该点的负荷值;对于连续出现多个的不良数据,对比某时刻的负荷值与同时刻前后不同日期的负荷平均值,若无法找到则剔除数据。

第二步,归一化处理;为了避免模型训练的复杂化,方便计算,应在数据预处理后,将负荷数据xi按下列公式(1)进行归一化处理,

式中:yi表示归一化处理过的负荷数据;xi为初步处理后输入的负荷数据;xmax为初步处理后样本中最大负荷数据;xmin为初步处理后样本中最小负荷数据。

影响因素分析:

在电力系统短期负荷预测问题中,影响负荷变化的因素复杂多样,且根据地区的不同,相同的方法也有不同的预测效果,因此负荷预测的方法要根据充分分析该地区的负荷规律特性,才能得到较好的预测效果,本实施例选择的预测地区属于温带季风气候,气候特点为日照充足、四季分明、其中温度是七月最热,一月最冷,因此独特的气候使其影响着负荷的变化。

在充分研究分析地区的历史负荷数据后,发现负荷除了具有日期类型规律特性外,还受到温度、湿度、风速、降水量等气象因素的影响。本实施例利用皮尔森相关性分析法来定量分析主要影响因素和负荷之间的相关度,选取了该地区近两年全年的负荷和天气数据进行分析,负荷与各个影响因素之间的相关度见下表1。

表12016—2018年负荷与影响因素的相关性

通过表1分析可以发现温度、湿度、风速和降水量与负荷的相关系数均大于0.1,相比于其他因素,温度和湿度对负荷变化有较大的影响,因此气象因素的影响不能忽略,要在预测模型中考虑。

另外气象因素有实时变化的特性,若天气因素发生剧烈变化则会严重影响发生突变时段的负荷值,对于只考虑日特征气象的影响而整体修正全天逐点负荷数据的方法,不同时段的突变气象因素没有考虑,会影响预测精度,因此本实施例在模型输入样本时,考虑实时因素的影响,在数据预处理时已将气象数据利用三次样条插值法处理,使得采样频率为15min的多点负荷数据与多点气象数据一一对应,保证影响因素在输入预测模型时若发生突变可及时对点负荷修正,达到更好的预测效果。

分时段综合预测法:

根据地区的负荷数据,得到该地区的典型日负荷曲线见图1,发现该地区是根据当地的生产和生活规律,出现午高峰和晚高峰,从0点~6点负荷处于低谷阶段,最低负荷出现在凌晨4点左右,6点后呈现直线上升的趋势,直到9点负荷开始稳定,直到11:30达到了高峰,之后又直线下降后趋于稳定,在16点左右开始上升,在17:45达到峰值,随后下降,特有的地域和长久的生活工作规律,使该地区每日出现的负荷高峰和负荷峰值基本固定,这些规律对研究该地区的负荷预测提供了便利。

对该地区进行负荷预测时,根据前面对其负荷数据日特性分析可以看出不同时段的负荷组成和特性变化,所以根据变化规律将96点日负荷分为以下7个0:00-5:00,5:00-8:00,8:00-11:00,11:00-14:00,14:00-17:00,17:00-21:00,21:00-24:00时段,分段情况可见图1,经过分析可得每个时段的负荷规侓性强且具有强相似性,而对于不同时段的负荷利用时间序列理论的自相关系数法分析发现,它们之间在概率意义上表现出的相关性不明显,因此在对该地区的历史期负荷数据聚类后,采用在不同时段考虑实时影响因素的分时段精细化的预测模型,由于各时段的权值不同的模型形成不同的预测模型,最后组合七个预测模型的预测结果就得到预测日的负荷数据。

本实施例提出的分时段预测某种程度上将不同类型的负荷包括工业负荷、商业负荷和民用负荷加以区分,且粗线条地划分了气象因素对负荷的影响程度,使得各个时段的预测模型更符合实际系统的负荷分布规律,组合的预测结果更精准,此外分时段预测模型,大大减小了建立改进支持向量机模型的规模,以及降低了训练的难度和时间。

利用模糊c均值聚类处理数据样本:

模糊c均值聚类是对硬聚类算法的改进,在其基础上引入了模糊隶属度的概念,根据目标函数获得各样本点对所有类中心的隶属度,根据隶属度来决定样本点的类属,使样本数据能够自动分类,该算法能够客观地反映实际问题,目前应用较为广泛。由于电力负荷变化特性具有周期性以及随气象因素变化的规律,因此进行聚类时选择气象、日期类型等因素作为状态特征变量,与待预测日相似度高的同类数据作为预测模型的训练样本,可以保证数据的统一性和相似性;因此选择模糊c均值聚类对负荷数据进行分析。根据前面对负荷特性和主要影响负荷变化因素的相关性分析,首先对样本数据聚类,然后根据得到的不同类型分别建立模型预测,可得到较好的预测效果。

设c个聚类中心为v={v1,v2,…,vc},全部n个样本的聚类情况由一个隶属度矩阵u来描述,即

式中,uij为第j个样本归属于第i类的隶属度。

模糊c均值聚类按照以下规则和约束条件聚类,得到最优的分类,

其中的参数设置如下:

式中:m>1是加权指数,m越大则聚类中心越靠近隶属度较高的元素,m一般取值为2;||vi-xj||为样本xj与聚类中心vi之间的距离,本实施例利用欧氏距离计算[15]。其次,为了求出式(3)中泛函jm(u,v;x)的极小值,本实施例将得到的局部最优点的必要条件进行轮换寻优,即

当对历史负荷数据进行模糊c均值聚类后,评价所得到的聚类效果。本实施例采用的评价指标为类内距离(mutualinformationaccuracy,mia)指标,该指标表征各类别的聚类中心和其对应类中的所有元素的距离的平均值。假设聚类得到k类不同负荷特性,ck表示各个类别中的样本集合,pik表示样本中的全部元素,nk表示各个类别中的样本数,各个类别的ctk为聚类中心,其中k=1,2,…k。mia的公式如下:

其中,聚类效果的评价与mia的值密切相关,值越小,得到的效果越好。

根据以上聚类评价指标选取聚类数目,利用模糊c均值聚类(fuzzyc-means,fcm)对历史数据进行分类,本实施例选用的是河南省某地区2017.12.01-2019.2.28的负荷数据。

在一定的选取范围(2~10)内对每个聚类数目进行fcm,计算聚类效果评价指标mia,mia最小值对应的聚类数目就是fcm的输入聚类数,即为得到的聚类结果,通过以方法对样本数据进行聚类,绘制聚类效果评价函数曲线,如图2所示当k=9时评价指标为最小值,所以确定聚类的类型为9;这9类分别为:工作日的周二、周三、周四;周末;周末的前一天;周末的后一天;法定节假日(元宵节等);节假日的前一天;节假日的后一天;其他节日(圣诞节等);重要特殊日(检修日)。这9类聚类结果都包含一定数量的样本,描述了较为全面的特性指标。

改进的boa-svr预测模型:

支持向量应用在函数回归上就形成了svr,根据已确定的非线性映射将输入向量映射的一个高维特征空间中进行线性回归,得到空间中非线性回归的效果。在进行回归运算时,通过在构建中引入不敏感损失函数,从而寻找一个最优分类面,使训练样本与此分类面的综合误差最小。

训练样本集的样本数设为n,因此训练样本集可以表示为(x1,y1),(x2,y2),…(xn,yn),其中xi(xi∈rd)是i个样本的输入向量xi=[xi1,xi2,…,xid]t其输出值为yi(yi∈r)。将训练样本集利用非线性函数映射到高维空间,从而形成高维空间的线性函数,表达式见式(9):

式中:x为输入向量,xi∈rn;w为权值矢量,w∈rn;b为偏置值,b∈r。

本实施例通过引入不敏感损失函数来评价模型的预测效果,表达式见式(10):

式中:f(x)为预测值;ε为不敏感损失函数;y为真实值。若y与f(x)的关系满足|y-f(x)|≤ε,则表示该不敏感损失在可接受的范围内,并近似地用数值0来表示。

本实施例利用最小结构风险函数对式(9)中的w和b求解,计算公式见式(11),

式中:ξi,均为松弛变量;c为惩罚因子。

在训练样本集时,当预测误差大于回归函数f(x)对训练误差的要求ε时,对样本的惩罚因子c会随着预测误差的增大而增大,同时f(x)的误差变化也会影响ε的值。然后,利用拉格朗日函数式(12)将式(11)转换成对偶形式。

式中:ai,ai*,aj,aj*为拉格朗日乘子,ai,ai*,aj,aj*∈[0,c];k(xi,xj)为核函数,

根据高精度高运算效率的要求,本实施例选用rbf函数作为svr的核函数。rbf核函数见式(13)。

式中:g为核函数的参数,g值的取值影响着模型的效果,取值过大模型会出现过拟合的情况,取值过小模型的泛化能力将会减弱。

根据以上分析可以得到回归函数f(x),见式(14):

式中:xi为支持向量。

综上过程,svr构建模型过程中要解决的重要问题就是参数g值、c值的最优取值,因此本文利用改进的蝙蝠算法(boa)来对svr模型参数寻优,建立最优预测模型。

改进的蝙蝠算法boa:

蝙蝠算法(ba)的启发来源于微蝙蝠的回声定位能力,它使用不同频率,响度和脉冲率的声波,来逃避障碍物或发现猎物,是一种寻优的仿生算法。相比其它算法,ba表现出的准确性和有效性有更加优异的效果,且不需要调整大量参数。

在蝙蝠种群的飞行中,每次个体的脉冲频率、速度和位置的更新公式见式(15)~(17):

fi=fmin (fmax-fmin)α(15)

式中:fmin和fmax分别为脉冲频率的最小值和最大值;v和x分别为速度和位置;α为服从均匀分布的随机变量,α∈[0,1]。

在局部搜索的过程中,个体会不断更新最佳方案,则会随机在最佳方案附近产生新方案,新方案见式(18):

xnew=xold εat,ε∈[-1,1](18)

式中:ε为随机数;是蝙蝠种群个体在第t次迭代时的平均响度值。

在迭代过程中,发射脉冲的发射速率ri和响度ai更新为下式(19)、(20):

rit 1=rit[1-exp(-γt)](19)

式中:γ为脉冲频度增强系数;α为脉冲音响衰减系数。当0<α<1和γ>0时,随着t→∞,和rit=ri0

根据以上蝙蝠算法的探索过程,可得其搜索性能和稳定性比其他传统群智能优化算法要优异,但是在不断增加优化问题的维数后,发现ba算法的性能会下降。针对ba算法的这个缺点,为了提高其优化性能,许多传统文献提出了增加样本搜索的多样性问题,但在性能得到优化的同时会带来计算复杂的问题。因此,本实施例提出了采用动态自适应权重的方法来改善,将公式(16)更新的为式(21):

式中:ωi(t)为动态自适应权重,它影响着寻优的过程,也影响着收敛行为,本文提出新型的动态自适应权重ωi(t)的表达式见式(22):

式中:t为当前迭代次数,tmax为最大迭代次数。通过引入余弦函数来增加蝙蝠速度更新方式的灵活性,从而改变了更新速度的更新系数僵化在1的状态,整体的蝙蝠速度提高;又由于余弦函数的最大值为1,从而限制了蝙蝠在寻觅猎物时的速度过快。综上这样可以保持蝙蝠的更新系数为区间[0,2]的动态值,使得蝙蝠算法在局部以及全局搜索时得到平衡。

为了进一步解决蝙蝠算法易陷入局部极值的问题,本实施例选取柯西逆累积分布函数对蝙蝠进行变异,使得蝙蝠个体附近生成更大的扰动,有利于蝙蝠个体在广阔的范围内及时更新位置并跳出局部极值;柯西分布是一个数学期望不存在的连续型概率分布,特点是原点处概率密度大,分布紧凑,然而两端密度小,分布较长。柯西分布函数见式(23)

f-1(p;x0,γ)=x0 γ·tan(π·(p-1/2))(23)

将式(17)更新为式(24),

式中,f-1是柯西分布逆累积分函数,表示变异前第i只蝙蝠的位置,其中r是区间[0,1]内一个均匀分布的随机值。为系数向量,表达式见式(25),

式中,是区间[2,0]的线性递减向量,是区间[0,1]内均匀分布的随机向量。

改进的boa-svr的算法寻优过程:

根据ba的计算过程,算法中最优位置参数g、c的寻优过程如下:

第一步:设定svr中的参数g和c的取值范围;

第二步:随机初始化ba中的相关参数,参数有蝙蝠种群个体数n、蝙蝠i的位置xi、脉冲频率的最大值fmax和最小值fmin、蝙蝠i的位置xi的维数d、蝙蝠发出的响度ai、脉冲波发射率ri、最大迭代次数ni,以及算法结束的条件。

第三步:初始化蝙蝠种群中各个蝙蝠的起始位置初始飞行速度发出的脉冲频率fi。

第四步:计算初始蝙蝠种群中每个蝙蝠的适应度fitnesss,各个蝙蝠所在位置xi,的横纵坐标,分别表示的参数g、c,然后选取训练集进行训练和测试,fitnesss能反应负荷预测的准确率。

第五步:更新蝙蝠种群中各个蝙蝠的脉冲发射频率、飞行速度和位置,采用改进的动态惯性自适应和柯西分布的逆累积分布函数的方法来改善寻优过程。

第六步:更新蝙蝠位置,第一次更新时产生第1个随机数rand1,若rand1>ri,说明搜索时是以当前蝙蝠的位置为局部最优位置,在后面的搜索中生成蝙蝠的新位置xnew。

第七步:计算蝙蝠新位置xnew的适应度fitnesssnew,并生成随机数rand2,若rand2>ri,且fitnesssnew<fitnesss,则更新t 1时刻蝙蝠的脉冲音量和脉冲波发射率rit 1,脉冲音量更新公式中,通过调整α的的适应度,来增加ba搜索的多样性的,并更新最优解及其适应度。

第八步:重复迭代过程,输出最优解和适应度。即若算法满足结束条件或达到最大迭代次数,则输出当前蝙蝠所在位置的最优解和适应度;若不满足,则转回第五步继续计算,重复过程,直到满足时停止计算过程。

本实施例的算例验证及结构分析:

通过前面对负荷影响因素的分析聚类结果,选择日期类型、温度、湿度、风速、降水量数据构成svr的输入特征集合。为了更高预测的精度,考虑天气的实时变化因素对负荷的影响,选择预测时间点之前9个输入特征集,包括待预测时刻对应的日期类型dy、时刻值h、前1h的温度th-1、湿度humh-1、风速wsh-1、降水量rlh-1、以及前3h的负荷值rph-1、rph-2、rph-3。选取2018.2.23-2018.2.28的分时段负荷预测平均值构建测试集,首先对其进行fcm聚类,将得到的与预测日同类型的历史负荷日数据和分时段特征集输入预测模型构建训练集。

对于训练样本的选择与构建,根据前面对负荷的9类聚类结果,分时段分别建立不同类型日的训练样本,利用改进的boa算法对svr参数寻优,从而得到预测的结果。

负荷预测对精度的要求体现在性能指标的值,因此本实施例选取均方根误差(rootmeansquareerror,rmse)和平均绝对百分比误差(meanabsolutepercentageerror,mape)来评估预测精度。计算见式(26)、(27):

式中:yi为真实值,y'i为预测值,n为样本总数。

在建立svr模型的过程中,参数c的寻优范围是[10,1000],参数g的寻优范围是[0.01,10]。设置蝙蝠算法的参数:种群大小n=20,脉冲频率的最大值fmax=2,最小值fmin=0,解的维数d=2,脉冲音量ai=0.25,脉冲发射率ri=0.5,更新常量α,γ=0.9,最大迭代次数ni=200[24]。然后根据前面所选取的训练集来训练改进的boa-svr模型。

根据以上预测模型,选择评估性能指标rmse、mape来评价预测结果,且根据文献“钱志、基于改进型svr的电网短期负荷预测”选择粒子群(pso)优化支持向量回归pso-svr预测模型与本实施例改进的boa-svr两种模型做对比,收敛性能如图3所示,评估性能指标rmse、mape可见表2:

表2不同预测模型的评估性能指标

根据图3可以看出在相同种群数量和迭代次数的情况下与pso-svr模型相比,改进的boa-svr模型在寻优过程中,更早地趋于平稳,这说明boa-svr模型收敛性能更平稳且速度更快,预测效果更好。

由表2可见两种模型的评价指标值,rmse可以衡量预测值与原值之间的偏差,改进的boa-svr模型rmse值为0.636,而pso-svr模型rmse值为1.845,表明改进的boa-svr模型的预测结果与原值之间的偏差最小,整体的非线性拟合能力更强更能预测精确;从mape指标可以看出改进的boa-svr模型mape值为1.98%,而pso-svr模型的mape值为4.69%;说明改进的boa-svr模型的整体预测精度要高,且整个模型的预测误差相对较低。

为了进一步验证该方法的预测性能,在充分分析地区负荷特性后,采用本实施例提出考虑实时影响因素的c-boa-svr精细化负荷预测模型,选择河南省某地区2017.12.01-2019.02.28的负荷进行聚类,利用提出的预测模型对2019.03.01—2019.03.03的96点负荷进行预测,得到的聚类结果为2019.03.01为第三类,2019.03.02和2019.03.01为第二类,得到聚类结果后将类样本数据输入c-boa-svr精细化预测模型得到预测结果,且与pso-svr预测模型对比,预测误差见表3,预测结果曲线见图4、5、6:

表3预测日不同预测法的预测误差对比

由表3预测误差值可以看出,改进的boa-svr预测方法在不同类型日有着较好的预测效果,与负荷真实值更接近,且最大误差、最小误差以及平均误差值都较小,且对不同类型日的预测平均误差分别为3.31%、2.95%、3.76%,预测误差很好的控制在4%以内,相比于无参数优化的svr预测模型以及粒子群(pso)算法优化svr模型的预测方法预测精度明显提升。

从预测结果图4、5、6中可以看出,本实施例提出的改进boa-svr方法在单点时刻的预测值较为精准,以及整体预测效果的平稳性较好,这是由于本实施例提出的在预测前利用聚类算法进行聚类,将负荷特性区分保持数值上的稳定,且又在预测模型中考虑实时的影响因素进行分时段精细化预测,以保证不确定因素对其的影响过大,这充分显示了本文提出的考虑实时影响因素分类型分时段的改进boa-svr预测方法的有效性。

本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。


技术特征:

1.一种基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,包括以下步骤:

s1,根据地区的历史负荷数据和特性来分析影响负荷变化的因素,并考虑实时影响因素提出分时段综合预测法;

s2,利用模糊c均值聚类方法将历史数据聚类得到不同的类型,并评价其聚类效果;

s3,利用动态自适应权重的方法和柯西分布逆累积部分函数对蝙蝠算法进行改进;

s4,利用改进的蝙蝠算法对svr的参数进行寻优,寻找最优参数建立svr分时段精细化模型,将待预测各个时段平均负荷值作为svr的输出得到预测结果。

2.根据权利要求1所述的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,对s1中的历史负荷数据进行处理包括:第一步,数据预处理;第二步,归一化处理;所述数据预处理为:采用比较法处理历史负荷数据中的不良数据,对于单个的不良数据,将该点前后时刻的负荷数据取平均值得到该点的负荷值;对于连续出现多个的不良数据,对比某时刻的负荷值与同时刻前后不同日期的负荷平均值,若无法找到则剔除数据;所述归一化处理为:在数据预处理后,将负荷数据xi按下列公式进行归一化处理:

式中:yi表示归一化处理过的负荷数据;xi为初步处理后输入的负荷数据;xmax为初步处理后样本中最大负荷数据;xmin为初步处理后样本中最小负荷数据。

3.根据权利要求2所述的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,根据数据处理得到的有效负荷数据情况,利用皮尔森相关性分析法来定量分析主要影响因素和负荷之间的相关度,所述主要影响因素包括温度、湿度、风速和降水量;根据历史负荷数据日特性可以看出不同时段的负荷组成和特性变化,根据变化规律将日负荷分为若干个时段组合而成。

4.根据权利要求1所述的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,步骤s2中,利用模糊c均值聚类的具体方法为:设c个聚类中心为v={v1,v2,…,vc},全部n个样本的聚类情况由一个隶属度矩阵u来描述,即

上述式中,uij为第j个样本归属于第i类的隶属度,模糊c均值聚类按照以下规则和约束条件聚类,得到最优的分类:

其中的参数设置如下:

上述式中:m>1是加权指数,m越大则聚类中心越靠近隶属度较高的元素,m一般取值为2;||vi-xj||为样本xj与聚类中心vi之间的距离,其次,为了求出式中泛函jm(u,v;x)的极小值,将得到的局部最优点的必要条件进行轮换寻优,即

采用类内距离指标评价聚类后的效果,该指标表征各类别的聚类中心和其对应类中的所有元素的距离的平均值;假设聚类得到k类不同负荷特性,ck表示各个类别中的样本集合,pik表示样本中的全部元素,nk表示各个类别中的样本数,各个类别的ctk为聚类中心,其中k=1,2,…k。mia的公式如下:

其中,聚类效果的评价与mia的值密切相关,值越小,得到的效果越好;mia最小值对应的聚类数目就是模糊c均值聚类的输入聚类数,即为得到的聚类结果。

5.根据权利要求1所述的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,步骤s3中,利用svr构建模型的具体过程为:设训练样本集的样本数设为n,因此训练样本集可以表示为(x1,y1),(x2,y2),…(xn,yn),其中xi(xi∈rd)是i个样本的输入向量xi=[xi1,xi2,…,xid]t其输出值为yi(yi∈r)。将训练样本集利用非线性函数映射到高维空间,从而形成高维空间的线性函数,表达式见下式:

式中:x为输入向量,xi∈rn;w为权值矢量,w∈rn;b为偏置值,b∈r;通过引入不敏感损失函数来评价模型的预测效果,表达式见下式:

式中:f(x)为预测值;ε为不敏感损失函数;y为真实值;若y与f(x)的关系满足|y-f(x)|≤ε,则表示该不敏感损失在可接受的范围内,并近似地用数值0来表示;利用最小结构风险函数对高维空间的线性函数中w和b求解,计算公式见下式,

式中:ξi,ξi*均为松弛变量;c为惩罚因子;

在训练样本集时,当预测误差大于回归函数f(x)对训练误差的要求ε时,对样本的惩罚因子c会随着预测误差的增大而增大,同时f(x)的误差变化也会影响ε的值;然后,利用拉格朗日函数式将上述计算公式转换成对偶形式,所述拉格朗日函数式为:

式中:ai,ai*,aj,aj*为拉格朗日乘子,ai,ai*,aj,aj*∈[0,c];k(xi,xj)为核函数,根据高精度高运算效率的要求,选用rbf函数作为svr的核函数,rbf核函数见下式:

式中:g为核函数的参数;根据以上分析可以得到回归函数f(x),见下式:

式中:xi为支持向量。

6.根据权利要求5所述的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,步骤s3中,利用动态自适应权重的方法对蝙蝠算法改进的具体过程为:采用动态自适应权重的方法将蝙蝠算法中蝙蝠个体的速度公式改进为:

式中:ωi(t)为动态自适应权重,所述动态自适应权重ωi(t)的表达式为:

式中:t为当前迭代次数,tmax为最大迭代次数。

7.根据权利要求6所述的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,步骤s3中,利用柯西分布逆累积部分函数改进蝙蝠算法的具体过程为:利用柯西分布函数式将蝙蝠算法中蝙蝠种群个体的位置公式改进为:

式中,f-1是柯西分布逆累积分函数,表示变异前第i只蝙蝠的位置,其中r是区间[0,1]内一个均匀分布的随机值,为系数向量,表达式见下式:

式中,是区间[2,0]的线性递减向量,是区间[0,1]内均匀分布的随机向量。

8.根据权利要求7所述的基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法,其特征在于,步骤s4中,根据改进的蝙蝠算法对最优参数g、c的寻优过程如下:

第一步:设定svr中的参数g和c的取值范围;

第二步:随机初始化蝙蝠算法中的相关参数,参数有蝙蝠种群个体数n、蝙蝠i的位置xi、脉冲频率的最大值fmax和最小值fmin、蝙蝠i的位置xi的维数d、蝙蝠发出的响度ai、脉冲波发射率ri、最大迭代次数ni,以及算法结束的条件;

第三步:初始化蝙蝠种群中各个蝙蝠的起始位置初始飞行速度发出的脉冲频率fi;

第四步:计算初始蝙蝠种群中每个蝙蝠的适应度fitnesss,各个蝙蝠所在位置xi的横纵坐标,分别表示的参数g、c,然后选取训练集进行训练和测试,fitnesss能反应负荷预测的准确率;

第五步:更新蝙蝠种群中各个蝙蝠的脉冲发射频率、飞行速度和位置,采用改进的动态惯性自适应和柯西分布的逆累积分布函数的方法来改善寻优过程;

第六步:更新蝙蝠位置,第一次更新时产生第1个随机数rand1,若rand1>ri,说明搜索时是以当前蝙蝠的位置为局部最优位置,在后面的搜索中生成蝙蝠的新位置xnew;

第七步:计算蝙蝠新位置xnew的适应度fitnesssnew,并生成随机数rand2,若rand2>ri,且fitnesssnew<fitnesss,则更新t 1时刻蝙蝠的脉冲音量和脉冲波发射率rit 1,脉冲音量更新公式中,通过调整α的的适应度,来增加ba搜索的多样性的,并更新最优解及其适应度。

第八步:重复迭代过程,输出最优解和适应度;即若算法满足结束条件或达到最大迭代次数,则输出当前蝙蝠所在位置的最优解和适应度;若不满足,则转回第五步继续计算,重复过程,直到满足时停止计算过程。

技术总结
本发明公开了一种基于BOA‑SVR和模糊聚类的分时段精细化短期负荷预测方法,包括以下步骤:S1,根据地区的历史负荷数据和特性来分析影响负荷变化的因素,并考虑实时影响因素提出分时段综合预测法;S2,利用模糊C均值聚类方法将历史数据聚类得到不同的类型,并评价其聚类效果;S3,利用动态自适应权重的方法和柯西分布逆累积部分函数对蝙蝠算法进行改进;S4,利用改进的蝙蝠算法对SVR的参数进行寻优,寻找最优参数建立SVR分时段精细化模型,将待预测各个时段平均负荷值作为SVR的输出得到预测结果;本发明可有效的提高预测精度,对于不同类型日的预测精度均可达到96%以上,且改进的蝙蝠算法有效降低预测模型的规模,明显的提高了预测模型的性能。

技术研发人员:王瑞;逯静;陈诗雯;王福忠;韩素敏
受保护的技术使用者:河南理工大学
技术研发日:2020.01.10
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-15254.html

最新回复(0)