本发明涉及一种光伏组件故障诊断方法,尤其是一种基于动态加权深度森林的光伏组件故障诊断方法。
背景技术:
能源短缺以及污染问题已经成为影响工业生产以及环境保护的重要因素。开发清洁能源已经成为全球性的议题。太阳能作为清洁能源被广泛的应用于光伏发电系统中,作为可再生能源不仅可以避免传统石化能源造成的环境污染问题,而且给工业制造,以及生产生活带来了新的变革思路。
虽然太阳能正在广泛地代替日益短的传统的能源,但是由于光伏发电的太阳能板需要架设在自然环境中或者房屋顶部,所以部分光伏组件会受到乌云,树叶等的遮挡,造成电池组件的损坏。为了避免光伏组件故障导致的损失,提高光伏发电的效率,需要对光伏系统中太阳能板的各类故障的进行判断并做出处理。现有技术主要采用一些智能算法对故障类型进行建模,通过模型训练样本来判断光伏组件发生故障的类型。
申请号为cn201810907602.3的专利申请公开了一种基于改进随机森林算法的光伏阵列故障诊断方法,其通过光伏阵列总干路和各个支路的参数反映光伏阵列中各条支路的运行状态,通过不同支路之间的阵列间电压差反映支路中各个光伏电池组件的运行状态,从而实现对光伏阵列的故障定位,同时利用包外样本在决策树赋权投票、平局处理和故障特征的重要性度量三个部分进行优化改进;但是,该专利需要通过将随机森林算法、决策树赋权、投票平局处理和变量重要性度量进行一系列的处理,因此,训练时间比较长。
申请号为cn201810766919.x的专利申请公开了一种基于最优旋转森林的智能光伏阵列故障诊断方法,其通过先采集各种工况条件下的光伏电气特性数据,然后利用选择算法对其进行重要性权重排序,获得最重要的故障特征,再利用改进旋转森林算法对其进行处理获得基分类器的输入变量,并采用遍历法获取最优模型参数,最后采用旋转森林算法与极限学习机相结合的混合算法对训练集中的每个样本进行训练,得到最优旋转森林故障诊断训练模型;最后,利用训练模型对光伏阵列进行故障检测和分类;但是,该方法需要先采集各种工况条件下的光伏电气特性数据,因此,准备条件比较苛刻,并且由于权重排序法因此将使得诊断结果可能出现非预期的偏差。
技术实现要素:
本发明的目的在于:提供一种基于动态加权深度森林的光伏组件故障诊断方法,能够提高诊断的效率与准确率。
为了实现上述发明目的,本发明提供了一种基于动态加权深度森林的光伏组件故障诊断方法,包括如下步骤:
步骤1,建立光伏组件的等效电路模型,收集光伏组件模型输出的各类数据,筛选出代表故障类型的故障数据,并设定部分故障数据作为训练样本集r;
步骤2,将所述训练样本采用不同维度的采样滑窗进行多粒度扫描,再经过级联森林结构进行逐级训练,得到多粒度级联森林诊断模型;
步骤3,对所述步骤2的所述多粒度级联森林中的每棵子树进行动态加权;
步骤4,计算子树在训练样本集r上预测的故障类别n的概率向量和预测结果;
步骤5,计算级联森林各个层级在训练样本集r上的预测结果,并计算光伏组件的第i类故障最终的结果;
步骤6,判断准确率是否提升,直到获得准确最高时的训练模型或者增加级联森林的层数继续训练森林的决策树,最终得到动态加权深度森林的光伏组件故障分类模型;
步骤7,输入测试样本,直到完成故障数据到故障状态的映射,输出故障类型结果,从而实现光伏组件故障诊断。
作为本发明的进一步限定,所述步骤1是以若干个电池串联的光伏组件为检测目标,采集工作状态下的最大功率点、最大功率点电压、最大功率点电流、开路电压、短路电流、填充因子、温度和辐照度8个参数作为输入样本。
作为本发明的进一步限定,所述步骤2的多粒度扫描具体为:首先向故障诊断系统输入采集参数个数为8的训练样本集r,然后通过三种不同维度d的采样滑窗对所述训练样本集r进行单位化滑动采样,得到一个维度为d的新特征向量集,向量集个数si为:si=9-d;其中,i=3,维度d的取值范围为d=2、3、4。
作为本发明的进一步限定,所述步骤3中级联森林的第e级森林第c类的动态加权的概率为:
dec=ω1ep1c ω2ep2c ··· ωkepkc ··· ωteptc;
式中,dec为第e级森林第c类的概率,ωke为e级森林第k棵树的权重值,pkc为第k个子树第c类的概率。
作为本发明的进一步限定,所述步骤4中当训练样本集r的采集个数为i,诊断结果类别个数为c时,某个森林第k棵子树rk,则某个故障类别的预测概率向量为:gx(rk)=[pi1,pi2,···,pic]。
作为本发明的进一步限定,所述步骤5中级联森林第e层级的森林中随机森林和完全随机森林的组合ce,在训练样本集r上,光伏组件的第i类故障的预测结果为:
作为本发明的进一步限定,通过n层级的森林f,得到最终森林对光伏组件的第i类故障的预测概率为:
作为本发明的进一步限定,在所述步骤6中当级联森林不再扩展时,则在已扩展的级中,找出在训练样本集r上预测准确率最高值所对应的级数n,将该级森林组合作为最终分类器模型,在测试样本集e上,使用训练获得的分类器模型作为整个动态加权深度森林的预测模型。
作为本发明的进一步限定,在所述步骤7中光伏组件故障诊断类型包括正常、开路故障、短路故障、阴影热斑故障以及老化故障。
本发明的有益效果在于:
1、本发明通过将深度学习算法与光伏组件的故障诊断相结合,引用动态加权优化决策结果,改善传统方法在故障类型诊断方面的困难,将深度学习分类算法的优点引进故障诊断领域,与传统的深度学习算法分析光伏组件故障类型相比,动态加权深度森林分类算法的参数设置简单,能够自动学习特征,能自动确定级联森林的层数,诊断的精度高,诊断的结果更直接。
2、本发明的故障诊断方法通过加权深度森林可以利用修正森林的预测概率向量,将修正的概率向量作为下一级的输入能够使得下一级森林在训练过程中不断优化并提高其预测精度,在一定程度上,不仅能提高最终预测精度,还可以减少扩展级数,极大减少训练的时长和计算资源消耗。
附图说明
图1为本发明的基于动态加权深度森林的光伏组件故障诊断方法的流程框图;
图2为本发明的基于动态加权深度森林的光伏组件故障诊断方法的光伏组件电池等效电路模型;
图3为本发明的基于动态加权深度森林的光伏组件故障诊断方法中单个森林动态加权示意图;
图4为本发明的基于动态加权深度森林的光伏组件故障诊断方法的多粒度扫描过程的示意图;
图5为本发明的基于动态加权深度森林的光伏组件故障诊断方法的级联森林过程的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明提供了一种动态加权深度森林的光伏组件故障诊断方法,包括如下步骤:
步骤1,建立光伏组件的等效电路模型,收集光伏组件模型输出的各类数据,筛选出代表故障类型的故障数据,并设定部分故障数据作为训练样本集r;
步骤2,将所述训练样本采用不同维度的采样滑窗进行多粒度扫描,再经过级联森林结构进行逐级训练,得到多粒度级联森林诊断模型;
步骤3,对所述步骤2的所述多粒度级联森林中的每棵子树进行动态加权;
步骤4,计算子树在训练样本集r上预测的故障类别n的概率向量和预测结果;
步骤5,计算级联森林各个层级在训练样本集r上的预测结果,并计算光伏组件的第i类故障最终的结果;
步骤6,判断准确率是否提升,直到获得准确最高时的训练模型或者增加级联森林的层数继续训练森林的决策树,最终得到动态加权深度森林的光伏组件故障分类模型;
步骤7,输入测试样本,直到完成故障数据到故障状态的映射,输出故障类型结果,从而实现光伏组件故障诊断。
为了采集光伏组件的重要参数,减少其他因素对电气参数采集的干扰,建立光伏组件电池的等效电路模型,如图2所示。
考虑电阻损耗,根据基尔霍夫定律,光伏电池组件的输出特性方程表示为:
ipv=iph-id-irsh(1)
式中,ipv为模型负载端输出电流;iph为光感电流,表示由入射辐射引起的pv电池的半导体层中的电荷载流子产生;id为二极管电流;损耗电阻上的电流irsh。
当步骤1中以若干个电池串联的光伏组件为检测目标时,采集工作状态下的最大功率点、最大功率点电压、最大功率点电流、开路电压、短路电流、填充因子、温度和辐照度8个参数作为输入样本;也即步骤1的训练样本和步骤7的测试样本都是输入样本,都是采用这8个参数。
进一步地,步骤2中的多粒度扫描过程可以描述为:步骤2的多粒度扫描具体为:首先向故障诊断系统输入采集参数个数为8的训练样本集r,然后通过三种不同维度d的采样滑窗对所述训练样本集r进行单位化滑动采样,得到一个维度为d的新特征向量集,向量集个数si可以使用公式(2)表示:
si=9-d(2)
其中,i=3,维度d的取值范围为d=2、3、4;经过扫描之后会生成si个数据子集。
以8维的特征向量为例,多粒度扫描过程用图4表示。由图4可以看出,原始特征大小为8,经过维度d为3的滑动窗口扫描采样后,会生成6个子特征样本。将这些子样本输入到随机森林中,每个森林会生成一个2维的类分布向量(假设是二分类),那么原来大小为8的特征向量就会变成大小为24维的特征向量,然后再用于级联森林的训练。当然,这里可以选用不同维度d的扫描窗口,从而实现真正意义上的多粒度扫描。
深度森林中每个森林的子树预测的类概率大小不同,对分类结果所起到的作用也不同,本发明通过动态加权后,作为该森林的预测结果。由于各个子树的预测精度存在一定差异,不经过数据分配处理,直接进行算术平均将导致该森林的预测精度下降,进而影响下一级森林的预测效果,同时会增加级联森林的级数。因此本发明针对各子树的预测概率,结合动态加权进行改进,建立一种动态加权深度森林的光伏组件故障诊断模型。
所述步骤3中每个森林的结构如图3所示;第e级森林第c类的动态加权的概率为:
dec=ω1ep1c ω2ep2c ··· ωkepkc ··· ωteptc(3)
式中,dec为第e级森林第c类的概率,ωke为e级森林第k棵树的权重值,pkc为第k个子树第c类的概率。
上述公式(3)中,e级森林第k棵树的权重值ωke通过以下方式计算得出:
由于最小二乘法可以求得与真实数据之间误差平方和最小的未知数据,来达到获得最优函数的目的,因此,选择单个森林的权重值利用最小二乘法以误差的平方和最小为目标:
其中,
将公式(3)带入式(4)得:
求取q对组合系数ωke的偏导:
令偏导得0,即可计算得到ωke的值。
上述公式(3)中,第k个子树第c类的概率pkc通过以下方式计算得出:预测概率pkc为当前子树节点数量最多的一类cj与当前样本集rc的比例,即:pkc=cj/rc。
当预测e 1级森林时,下一级森林的预测结果更新,重新计算组合权值,进而实现权值的动态调整。将获得的新的组合权值带入公式(3),便可以得到下一级森林的预测结果。
进一步地,步骤4中当训练样本集r的采集个数为i,诊断结果类别个数为c时,假设某个森林有t棵子树,则第k棵子树记为rk(k∈[1,t]),在训练样本集r上预测第n个故障类别的概率向量如下所示:
gx(rk)=[pi1,pi2,···,pic](7)
为了获得更佳的分类结果,使用函数max获取预测向量gx(rk)中最大值的数值,记训练样本得到的预测结果为qt(rk),则在训练样本集r上,子树rk对某一类故障的预测结果如下公式所示:
qt(rk)=max(gx(rk))=pi(8)
在步骤5中为了对光伏组件的故障特征进行提取,使用级联森林对故障特征进行表征学习。级联森林各个层级是由随机森林和完全随机森林两种以级联结构组成的,而随机森林是由各个故障类别的决策树集成构成的。
级联森林的结构示意图如图5所示,假设级联森林中第e层级有h个森林,那么在训练样本集r上,该级森林中随机森林和完全随机森林的组合ce对光伏组件的第i类故障的预测结果为:
则,通过n层级的森林f,得到最终森林对光伏组件的第i类故障的预测概率为:
最后,通过动态加权后,取最大值得到第i类故障最终的结果为:
qt(cn)=max(gx(fi))(11)
而当在步骤6中当级联森林不再扩展时,则在已扩展的级中,找出在训练样本集r上预测准确率最高值所对应的级数n,将该级森林组合作为最终分类器模型。在测试样本集e上,使用训练获得的分类器模型作为整个动态加权深度森林的预测模型。
进一步地,步骤7中光伏组件故障诊断类型包括正常、开路故障、短路故障、阴影热斑故障以及老化故障。
通过采用本发明公开的上述技术方案,将深度学习算法与光伏组件的故障诊断相结合,引用动态加权优化决策结果,改善传统方法在故障类型诊断方面的困难,将深度学习分类算法的优点引进故障诊断领域,与传统的深度学习算法分析光伏组件故障类型相比,动态加权深度森林分类算法的参数设置简单,能够自动学习特征,能自动确定级联森林的层数,诊断的精度高,诊断的结果更直接。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
1.一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于,包括如下步骤:
步骤1,建立光伏组件的等效电路模型,收集光伏组件模型输出的各类数据,筛选出代表故障类型的故障数据,并设定部分故障数据作为训练样本集r;
步骤2,将所述训练样本采用不同维度的采样滑窗进行多粒度扫描,再经过级联森林结构进行逐级训练,得到多粒度级联森林诊断模型;
步骤3,对所述步骤2的所述多粒度级联森林中的每棵子树进行动态加权;
步骤4,计算子树在训练样本集r上预测的故障类别n的概率向量和预测结果;
步骤5,计算级联森林各个层级在训练样本集r上的预测结果,并计算光伏组件的第i类故障最终的结果;
步骤6,判断准确率是否提升,直到获得准确最高时的训练模型或者增加级联森林的层数继续训练森林的决策树,最终得到动态加权深度森林的光伏组件故障分类模型;
步骤7,输入测试样本,直到完成故障数据到故障状态的映射,输出故障类型结果,从而实现光伏组件故障诊断。
2.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:所述步骤1是以若干个电池串联的光伏组件为检测目标,采集工作状态下的最大功率点、最大功率点电压、最大功率点电流、开路电压、短路电流、填充因子、温度和辐照度8个参数作为输入样本。
3.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:所述步骤2的多粒度扫描具体为:首先向故障诊断系统输入采集参数个数为8的训练样本集r,然后通过三种不同维度d的采样滑窗对所述训练样本集r进行单位化滑动采样,得到一个维度为d的新特征向量集,向量集个数si为:si=9-d;其中,i=3,维度d的取值范围为d=2、3、4。
4.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:所述步骤3中级联森林的第e级森林第c类的动态加权的概率为:
dec=ω1ep1c ω2ep2c ··· ωkepkc ··· ωteptc;
式中,ωke为e级森林第k棵树的权重值,pkc为第k个子树第c类的概率,dec为第e级森林第c类的概率。
5.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:所述步骤4中当训练样本集r的采集个数为i,诊断结果类别个数为c时,某个森林第k棵子树rk,则某个故障类别的预测概率向量为:gx(rk)=[pi1,pi2,···,pic]。
6.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:所述步骤5中级联森林第e层级的森林中随机森林和完全随机森林的组合ce,在训练样本集r上,光伏组件的第i类故障的预测结果为:
7.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:通过n层级的森林f,得到最终森林对光伏组件的第i类故障的预测概率为:
8.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:在所述步骤6中当级联森林不再扩展时,则在已扩展的级中,找出在训练样本集r上预测准确率最高值所对应的级数n,将该级森林组合作为最终分类器模型,在测试样本集e上,使用训练获得的分类器模型作为整个动态加权深度森林的预测模型。
9.根据权利要求1所述一种基于动态加权深度森林的光伏组件故障诊断方法,其特征在于:在所述步骤7中光伏组件故障诊断类型包括正常、开路故障、短路故障、阴影热斑故障以及老化故障。
技术总结