本发明属于光伏预测
技术领域:
,具体涉及一种基于数据漂移的太阳辐射在线动态预测方法。
背景技术:
:由于化石能源使用带来的环境污染和气候变化,可再生能源越来越受到人们的关注,尤其是风能和太阳能。随着技术的发展和国家政策的支持,光伏产业发展迅速。而在光伏系统设计中,太阳辐射在线预测是光伏电站发电并网的前提。因此,现在急需发展太阳辐射的在线预测技术。对于太阳辐射在线动态预测公开的文章,目前主要是针对预测模型的设计,本质上为离线设计和调试预测模型,在线使用预测模型,而并没有明确提出一种通用的可根据站点情况变化对预测模型进行在线训练更新的动态预测方法。另外,公开的专利方面,目前没有对于太阳辐射在线动态预测公开的专利,只有cn106815659a专利中提到一种基于混合模型的超短期太阳辐射预测方法及其装置,但该专利中也只是给出了太阳辐射数据的处理和对应的预测模型,并不能实现预测模型的在线更新,因此一定程度上限定了该方法的使用范围和精度。技术实现要素:本发明要解决的技术问题是提供一种基于数据漂移的太阳辐射在线动态预测方法,可以满足分布式或者独立式太阳能系统出力预测的需要,充分考虑了太阳辐射数据长期和短期规律变化的不同和数据衰减特性,利用数据漂移技术对预测模型在线切换,实现太阳辐射的在线动态预测和模型更新。为了解决上述技术问题,本发明采用的技术方案为:一种基于数据漂移的太阳辐射在线动态预测方法,包括以下步骤:(1)测量时间段ti内太阳辐射值的平均值i(t)和对应气象参数的平均值x(t),与ti前连续收集的l-1个太阳辐射值i(t1)、i(t2)、i(t3)……i(tl-1)和对应气象参数值x(t1)、x(t2)、x(t3)……x(tl-1);共形成l个数据样本,分别为:i(t1)与x(t1)组成样本x′(t1),i(t2)与x(t2)组成样本x′(t2),i(t3)与x(t3)组成样本x′(t3),……,i(tl-1)与x(tl-1)组成样本x′(tl-1),i(t)与x(t)组成样本x′(t),将l个数据样本分为n1、n2两段;(2)计算n1、n2两段中的太阳辐射值的平均值i(u1)和i(u2);当|i(u1)-i(u2)|>阈值td时,发生辐射数据漂移,采用异常预测模型mb预测,否则采用常规预测模型ma进行预测;其中,异常预测模型mb预测为:若i(t)时第一次发生数据漂移,清空临时数据集dc,判断异常数据集db样本数是否达到上限,为否时将样本x′(t)添加到异常数据集db中,训练更新异常预测模型mb,为是时计算异常数据集db中所有数据样本间差异度sb(t),以及x′(t)与异常数据集db中所有数据样本间差异度s(t),当sb(t)中最小值<s(t)中最小值时,x′(t)替换异常数据集db中sb(t)对应的两个样本中与其他样本差异度和较小的样本数据,根据新的异常数据集db训练更新异常预测模型mb;常规预测模型ma预测为:若i(t)为l个样本内连续发生的数据漂移,则将x′(t)存储到临时数据集dc中,直至临时数据集dc中样本数达到设定数目,将数据集dc中样本替换常规数据集da中所有样本;若i(t)时未发生数据漂移,判断常规数据集da中样本数是否达到上限,为否时x′(t)直接添加到常规数据集da中,更新常规数据集da;为是时x′(t)替换到常规数据集da中收集最早的数据值,更新常规数据集da;根据新的常规数据集da训练更新常规预测模型ma;(3)输出预测结果,并回到步骤(1),进入下一个时间段ti 1的太阳辐射数据预测和模型更新。所述的基于数据漂移的太阳辐射在线动态预测方法,连续长度为l的太阳辐射样本分为n1、n2两段,为不重叠分割,即n1 n2=l;也可为有重叠分割,即n1 n2>l。所述的基于数据漂移的太阳辐射在线动态预测方法,所述l-1个样本x′(t1)、x(t2)、x′(t3)……x′(tl-1)为连续收集到的l-1个样本。所述的基于数据漂移的太阳辐射在线动态预测方法,所述l-1个样本x′(t1)、x(t2)、x′(t3)……x′(tl-1)为连续时间段tl-1过程中收集到的样本。所述的基于数据漂移的太阳辐射在线动态预测方法,所述样本间差异度定义为两个多维样本间的欧式距离。所述的基于数据漂移的太阳辐射在线动态预测方法,所述气象参数为光伏电站或辐射数据站点对应的温度、湿度、风速、风向、气溶胶或云量中部分或全部的气象变量。有益效果:与现有的技术相比,本发明的优点包括:本发明根据当前太阳辐射与之前一段时间的太阳辐射数据之间特性变化,将数据样本分为常规数据和异常数据,并构造常规预测模型和异常预测模型,且结合数据漂移技术选择不同预测模型,从而实现了太阳辐射的在线动态预测和模型更新,提高预测精度。附图说明图1是本发明基于数据漂移的太阳辐射在线动态预测方法的执行预测并输出结果流程示意图;图2是本发明基于数据漂移的太阳辐射在线动态预测方法中常规数据集da和异常数据集db、以及常规预测模型ma和异常预测模型mb在线动态更新流程示意图。具体实施方式以下所述为本发明的一个较佳实施实例,并不因此而限定本发明的保护范围。实施例1一种基于数据漂移的太阳辐射在线动态预测方法,执行的主要过程流程如图1和图2所示,具体过程如下:测量时间段ti太阳辐射值的平均值i(t)和对应气象参数的平均值x(t),与ti前连续收集的l-1个的太阳辐射值i(t1)、i(t2)、i(t3)……i(tl-1)和对应气象参数值x(t1)、x(t2)、x(t3)……x(tl-1),共形成l个太阳辐射样本,分别为:i(t1)与x(t1)组成样本x′(t1),i(t2)与x(t2)组成样本x′(t2),i(t3)与x(t3)组成样本x′(t3),……,i(tl-1)与x(tl-1)组成样本x′(tl-1),i(t)与x(t)组成样本x′(t),共l个太阳辐射样本,将l个太阳辐射样本分为n1、n2两段;其中数据长度l可根据预测尺度确定,如当进行超短期预测时(每15分钟一个预测点,预测未来4小时的辐射值),l优选设置为16;当进行短期预测(每小时一个预测点,预测未来一天的辐射量),l优选设置为24;当进行中长期预测(以3小时、每天或每个月一个预测点,预测未来一周、一个月或一年的辐射量),l优选设置为50以上的常数。以预测尺度为超短期预测(每15分钟一个预测点,预测未来4小时的辐射值)为例。预测时,检测当前15分钟内太阳直接辐射值的平均值,记做i(t),对应气象参数的平均值,记为x(t);将之前的15个样本和当前测量的数据,共16个样本,不重叠地分为n1=10和n2=6两段,并计算这两段的样本的平均值i(u1)和i(u2);当|i(u1)-i(u2)|>阈值td时,采用异常预测模型mb进行预测,否则采用常规预测模型ma进行预测,得到全天太阳辐射的预测结果,完成对提前15分钟的太阳直接辐射的预测。这里阈值td可人为根据经验设置,也可以根据一定比例设置,本案例中优选阈值td设置为i(u1)和i(u2)中小的一半值。当|i(u1)-i(u2)|≤td,且常规数据集da中样本个数小于设定上限na时,当前测量值x′(t)直接添加到常规数据集da中,并训练更新常规预测模型ma;当|i(u1)-i(u2)|≤td,且常规数据集da中样本个数大于或等于设定上限na时,当前测量值x′(t)替换到常规数据集da中收集最早的数据样本,并训练更新常规预测模型ma;当|i(u1)-i(u2)|>td,且是l个样本内发生地连续数据漂移时,当前测量值x′(t)存储到临时数据集dc中;当临时数据集dc中样本个数达到设定数目nc时,临时数据集dc中样本替换到常规数据集da中所有样本,并根据新的常规数据集da训练更新常规预测模型ma;当|i(u1)-i(u2)|>td,l个样本内发生地第一次数据漂移,清空临时数据集dc;若异常数据集db中样本个数没有达到设定上限nb时,当前测量值x′(t)直接添加到异常数据集db形成新的异常数据集db,并根据新的异常数据集db训练更新异常预测模型mb;若异常数据集db中样本个数达到设定上限nb时,计算当前测量值x′(t)与异常数据集db中样本之间的差异度,记做s(t);计算异常数据集db中样本两两之间的差异度,记做sb(t);若s(t)中最小值大于sb(t)中最小值,那么当前测量值x′(t)替换异常数据集db中最小差异度两个数据中与其他数据差异度之和小的数据样本,并训练更新异常预测模型mb;两个数据x’(tm)和x’(tn)差异度定义为其中d为x’中元素的个数。预测完下个时刻,即未来15分钟的太阳直接辐射平均值后,在线更新对应数据库和预测模型,重复上述过程,进行下个时刻的预测。本发明中的常规预测模型ma,异常预测模型mb可以根据需要选择现有模型,也可以自行构造;在本实施例中,常规预测模型ma优选线性模型,异常预测模型mb优选非线性模型。实施例2采用实施例1的方法,以美国国家新能源实验室数据库(nrel)中2013年的白天太阳直接辐射数据实验,验证本发明提出的基于数据漂移的太阳辐射在线动态预测方法预测性能,并和现有的方法对比,结果如表1所示。表1不同预测方法的提前15分钟预测结果性能统计表方法相对绝对平均误差(%)相对均方根误差(%)持续模型20.9431.10ar线性模型19.0730.12ann非线性模型18.2129.23本发明的方法16.4726.67注:持续模型:marquezr,coimbracfm.intra-hourdniforecastingbasedoncloudtrackingimageanalysis[j].solarenergy,2013,91:327-336.ar线性模型:dimitrisn.politis.model-basedpredictioninautoregression[m]//model-freepredictionandregression.2015.ann非线性模型:魏海坤.神经网络结构设计的理论与方法[m].2005.通过分析表1,可见本发明所提出的预测方法相对其他预测模型,就相对均方根误差指标而言,相对提高了8.7%~14%。以上描述的一种基于数据漂移的太阳辐射在线动态预测方法,以提前预测15分钟的太阳直接辐照度为例,也可以预测1分钟、1小时、一天甚至一周等不同时间尺度任意太阳辐射数据。以上是对本发明的一种描述,并非仅限定于此,基于本发明的其他实施形式,均在本发明的保护范围。当前第1页1 2 3 
技术特征:1.一种基于数据漂移的太阳辐射在线动态预测方法,其特征在于,包括以下步骤:
(1)测量时间段ti内太阳辐射值的平均值i(t)和对应气象参数的平均值x(t),与ti前连续收集的l-1个太阳辐射值i(t1)、i(t2)、i(t3)……i(tl-1)和对应气象参数值x(t1)、x(t2)、x(t3)……x(tl-1),共形成l个数据样本,分别为:i(t1)与x(t1)组成样本x′(t1),i(t2)与x(t2)组成样本x′(t2),i(t3)与x(t3)组成样本x′(t3),……,i(tl-1)与x(tl-1)组成样本x′(tl-1),i(t)与x(t)组成样本x′(t),将l个数据样本分为n1、n2两段;
(2)计算n1、n2两段中的太阳辐射值的平均值i(u1)和i(u2);当|i(u1)-i(u2)|>阈值td时,发生辐射数据漂移,采用异常预测模型mb预测,否则采用常规预测模型ma进行预测;
其中,异常预测模型mb预测为:
若i(t)时第一次发生数据漂移,清空临时数据集dc,判断异常数据集db样本数是否达到上限,为否时将样本x′(t)添加到异常数据集db中,训练更新异常预测模型mb,为是时计算异常数据集db中所有数据样本间差异度sb(t),以及x′(t)与异常数据集db中所有数据样本间差异度s(t),当sb(t)中最小值<s(t)中最小值时,x′(t)替换异常数据集db中sb(t)对应的两个样本中与其他样本差异度和较小的样本数据,根据新的异常数据集db训练更新异常预测模型mb;
常规预测模型ma预测为:
若i(t)为l个样本内连续发生的数据漂移,则将x′(t)存储到临时数据集dc中,直至临时数据集dc中样本数达到设定数目,将数据集dc中样本替换常规数据集da中所有样本;若i(t)时未发生数据漂移,判断常规数据集da中样本数是否达到上限,为否时x′(t)直接添加到常规数据集da中,更新常规数据集da;为是时x′(t)替换到常规数据集da中收集最早的样本,更新常规数据集da;根据新的常规数据集da训练更新常规预测模型ma;
(3)输出预测结果,并回到步骤(1),进入下一个时间段ti 1的太阳辐射数据预测和模型更新。
2.根据权利要求1所述的基于数据漂移的太阳辐射在线动态预测方法,其特征在于,连续长度为l的太阳辐射样本分为n1、n2两段,为不重叠分割,即n1 n2=l;也可为有重叠分割,即n1 n2>l。
3.根据权利要求1所述的基于数据漂移的太阳辐射在线动态预测方法,其特征在于,所述l-1个样本x′(t1)、x(t2)、x′(t3)……x′(tl-1)为连续收集到的l-1个样本。
4.根据权利要求1所述的基于数据漂移的太阳辐射在线动态预测方法,其特征在于,所述l-1个样本x′(t1)、x(t2)、x′(t3)……x′(tl-1)为连续时间段tl-1过程中收集到的样本。
5.根据权利要求1所述的基于数据漂移的太阳辐射在线动态预测方法,其特征在于,所述样本间差异度定义为两个多维样本间的欧式距离。
6.根据权利要求1所述的基于数据漂移的太阳辐射在线动态预测方法,其特征在于,所述气象参数为光伏电站或辐射数据站点对应的温度、湿度、风速、风向、气溶胶或云量中部分或全部的气象变量。
技术总结本发明公开了一种基于数据漂移的太阳辐射在线动态预测方法,属于光伏预测技术领域。将测量的L个样本分为两段,计算两段平均值I(u1)和I(u2);|I(u1)‑I(u2)|>Td采用MB预测,若I(t)为连续发生的数据漂移,将X′(t)存储到DC中,若DC数据个数达上限,DC替换DA,并训练更新MA;若I(t)时第一次发生数据漂移,清空DC,并将X′(t)添加或替换到DB中,并训练更新MB;|I(u1)‑I(u2)|≤Td采用MA预测,将X′(t)添加或替换到DA中,训练更新MA;输出结果进入下个循环。本发明实现太阳辐射在线动态预测和模型更新。
技术研发人员:朱婷婷;过奕任;倪超;邹红艳
受保护的技术使用者:南京林业大学
技术研发日:2020.01.06
技术公布日:2020.06.05