本发明涉及变压器油色谱在线监测技术领域,具体地说是一种变压器在线监测大数据分布模型构建方法及装置。
背景技术:
变压器作为重要的输变电设备,其运行可靠性直接关系到整个电力系统的安全运行。目前,变压器的各种在线监测系统通过实时监测变压器的某些状态量来实现故障预警。当监测到的某种状态量超过或低于预先设定的某一个值时,监测系统给出相应的报警信息。因此,设定合理的报警值,能够有效地避免发生误报、漏报等情况,并且对提高在线监测系统的预警准确性具有重要的意义。
近年来,利用变压器在线监测状态量进行统计分析并构建变压器的状态分布模型方面有过大量的研究。
以变压器的油中溶解气体在线监测状态量为例,文章《基于历史数据概率分布的变压器在线预警研究》根据经验认为在运变压器的油中溶解氢气数据符合卡方分布,基于分布模型的累积概率函数给出了预警区间和预警等级,并用一台在运变压器验证了方法的可行性。该文献从经验角度出发认为数据符合卡方分布并划分预警区间,主观性较大,预警区间偏差较大,易导致误报或漏报(华北电力大学,臧利川)。文章《基于显著性差异的油浸倒置式电流互感器氢气阈值分析》利用k-s(kolmogorov-smirnov)检验论证某区域电网内倒置式电流互感器的油中溶解氢气体积分数符合正态分布,并基于显著性差异方法给出了氢气的阈值。该文献中k-s检验方法在确定分布时存在误判可能(国网浙江省电力公司电力科学研究院,孙翔)。文章《基于现场油色谱数据的变压器诊断阈值的研究》使用分布概率图验证油中溶解气体符合威布尔分布,给出了最小错误概率和最小损失概率的油中溶解气体临界值,文献侧重研究油中溶解气体临界值(华北电力大学,宋安琪)。文献《conditionalprobability-basedinterpretationofdissolvedgasanalysisfortransformerincipientfaults》研究各气体的体积分数不同时变压器发生故障的概率,并通过实例验证方法的可行性。该文献侧重于单台变压器的故障概率研究,没有分析多台变压器的数据分布规律(tahaibm)。文章《基于分布模型的变压器差异化预警值计算方法》中认为油中溶解气体的分布模型符合威布尔分布,并基于威布尔分布的逆累计分布模型给出了对变压器进行预警的阈值。该文献没有直接验证数据的威布尔分布特性,且缺少对模型参数的进一步研究(华北电力大学,齐波)。
在专利方面,《一种资源量参数分布模型的过滤方法》(中国石油化工股份有限公司,李军)公开了针对资源量参数分布模型进行筛选的方法,该方法可以筛选出较为准确的分布模型,侧重于不同分布模型之间的选取,并不涉及分布模型参数的优化过程。《海杂波pareto分布模型的参数估计范围拓展方法》(西安电子科技大学,罗丰)公开了一种海杂波pareto分布模型的参数估计范围拓展方法,通过推导n次观测的pareto分布海杂波观测值z的r阶矩,完成参数估计范围的扩展。该专利侧重于pareto分布模型参数范围的扩展,通过相应的处理方法使得海杂波形状参数的估计范围扩大,提高了估计效率,并不涉及分布模型参数的优化过程。《一种获取可采资源量分布模型的方法》(中国石油化工股份有限公司,马晓娟)公布了一种获取可采资源量分布模型的方法,方法通过对原始分布模型进行截断处理从而获取更符合实际地址情况的分布模型,该方法侧重于对数据的截取操作,没有针对参数计算方法进行改进。《一种高炉内表面温度分布模型建立方法及装置》(燕山大学,华长春)公开了一种高炉内表面温度分布模型建立方法,通过建立二维传热机理模型获取高炉内表面温度,从而建立分布模型,该专利的侧重点在于二维传热机理模型,参数计算方法仍然沿用传统方法。《风机叶片振动位移及其威布尔分布拟合方法》(上海电力学院,张建平)公开了一种风机叶片振动位移及其威布尔分布拟合方法,通过力学软件fluent模拟近海风场作用下叶片表面风压分布,之后计算出不同平均风速作用下风力机叶片叶尖处的振动位移,最后利用最小二乘法进行威布尔拟合。该专利仍然是利用传统方法计算分布模型参数,并没有涉及计算方法的改进。其他的相关专利《一种基于混合威布尔分布的航空发动机可靠性监测方法》(中国人民解放军军械工程学院,高军)、《基于分布参数模型的不对称交流输电线路相参数测量方法》(武汉大学,胡志坚)、《基于经验加速模型的退化量分布参数建模外推方法》(北京航空航天大学,党香俊)等等,均是通过采取相应的方法对特定领域的数据或者系统模型进行改进、完善等操作,从而借助于更加准确的数据或者更加完善的系统模型构建更加准确的分布模型,而从未涉及到对于本身分布模型参数计算方法的修改和完善,即跟本专利均存在显著却别。
此外,在实际计算中,传统方法会出现无法计算或者计算不收敛等异常情况。由于油色谱在线技术的广泛使用,溶解气体的在线监测数据量快速正常,已经达到tb规模,且每天的增长量达到gb的数量级,形成了典型的油中溶解气体大数据。在针对这些海量数据进行分析时,传统方法受限于计算资源和计算时间,不得不牺牲计算的精度。
综上所述,目前尚未提出有效的解决方案来处理变压器油色谱大数据。
技术实现要素:
本发明实施例提供了一种变压器在线监测大数据分布模型构建方法及装置,以至少解决相关技术中在对变压器在线监测大数据进行分布模型构建时,由于数据量过大,而造成的分布模型参数计算异常及计算时间冗长的技术问题。
为了解决上述技术问题,本发明提供了一种针对变压器海量在线监测数据的分布模型构建方法,包括:获取变压器在线监测大数据;将变压器在线监测大数据进行等间距分组;用分组端点数据代替变压器在线监测大数据;利用最小二乘法计算分组端点数据的初始分布模型参数;将初始分布模型参数作为初值,利用极大似然估计法计算变压器在线监测大数据的最终分布模型参数。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明所提供的一种变压器在线监测大数据分布模型构建方法的流程图。
图2为变压器油中溶解氢气的威布尔概率图。
图3为变压器油中溶解氢气统计直方图和拟合曲线图。
图4为变压器油中溶解气体数据计算时间随着数据量变化的曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种变压器在线监测大数据分布模型构建方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的变压器在线监测大数据分布模型构建方法的流程图,如图1所示,该方法包括如下步骤。
s102,获取变压器在线监测大数据。
s104,将变压器在线监测大数据进行等间距分组。
s106,用分组端点数据代替变压器在线监测大数据。
s108,利用最小二乘法计算分组端点数据的初始分布模型参数。
s110,将初始分布模型参数作为初值,利用极大似然估计法计算变压器在线监测大数据的最终分布模型参数。
通过本发明实施例,采用分组最小二乘法和极大似然估计法相结合的方法,通过对变压器在线监测大数据进行等间距分组,用分组端点数据替代变压器在线监测大数据,再利用最小二乘法计算分组端点数据的初始分布模型参数,之后,将初始分布模型参数作为初值,利用极大似然估计法计算变压器在线监测大数据的最终分布模型参数。因此可以构建更加准确的变压器在线监测状态量分布模型,这样,可以提高模型准确性以及降低计算时间。
具体的,在上述步骤s102中,选取2160126条变压器油中溶解氢气数据{ti,i=1,2,…,2160126},进一步地,在上述步骤s104中,获取变压器油中溶解氢气数据的最小值tmin=0.0300和最大值tmax=300.9302,设置分组距离d=(tmax-tmin)/100=3.0090,将变压器海量在线监测数据划分为100个小区间:[0.0300,0.0300 3.0090),[0.0300 3.0090,0.0300 2×3.0090),[0.0300 2×3.0090,0.0300 3×3.0090),……,[0.0300 97×3.0090,0.0300 98×3.0090),[0.0300 98×3.0090,0.0300 99×3.0090),[0.0300 99×3.0090,300.9302],选取分组端点数据qi=0.0300 (i-1)×3.0090,i=1,2,…,100用作下一步计算。
进一步地,在上述步骤s106中,用分组端点数据qi=0.0300 (i-1)×3.0090,i=1,2,…,100代替2160126条变压器油中溶解氢气数据。
进一步地,在上述步骤s108中,利用最小二乘法计算分组端点数据的初始分布模型参数。基于变压器油中溶解氢气数据的威布尔概率图确定分布模型为威布尔分布,如图2所示,统计分析获得直方图和拟合曲线图如图3所示。利用最小二乘法计算分组端点数据的初始分布模型参数。
计算
其中n(qi)表示分组端点数据中小于等于ti的数据的个数。
计算初始威布尔分布模型尺度参数。
计算初始威布尔分布模型形状参数:。
进一步地,在上述步骤s110中,将初始分布模型参数作为初值,利用极大似然估计法计算变压器在线监测大数据的最终分布模型参数。对于变压器油中溶解氢气数据{ti,i=1,2,…,2160126},获得似然方程。
使用牛顿-拉夫逊迭代法迭代求解,在计算过程中,将初始分布模型尺度参数8.5524和初始分布模型形状参数0.6303作为初值,计算得到最终的分布模型尺度参数为19.6251和最终的分布模型形状参数1.1761,如图3所示。
进一步的,从获取到的2160126条变压器油中溶解气体在线监测数据中,随机抽取数据,并按照10000条/次的增量逐次增加,分别使用传统方法和变压器在线监测大数据分布模型构建方法,在保证两种方法的计算误差小于10-7的前提下,绘制计算时间随着数据量变化的曲线如图4所示。
1.一种变压器在线监测大数据分布模型构建方法,其特征在于,包括:
获取变压器在线监测大数据;
将变压器在线监测大数据进行等间距分组;
用分组端点数据代替变压器在线监测大数据;
利用最小二乘法计算分组端点数据的初始分布模型参数;
将初始分布模型参数作为初值,利用极大似然估计法计算变压器在线监测大数据的最终分布模型参数。
2.如权利要求1所述的方法,其特征在于,所述获取变压器在线监测大数据,包括:
获取变压器在线监测大数据,其中所述变压器在线监测数据包括但不限定于变压器油中溶解气体在线监测数据、变压器铁心接地电流在线监测数据、变压器局部放电在线监测数据、变压器顶层油温在线监测数据、变压器套管介损在线监测数据。
3.如权利要求1所述的方法,其特征在于,所述将变压器在线监测大数据进行等间距分组,包括:
在对所述变压器在线监测大数据进行分组时,应该设置分组数为100;
获取所述的变压器在线监测大数据{ti,i=1,2,…,n}的最小值tmin和最大值tmax,设置分组距离d=(tmax-tmin)/100,将变压器海量在线监测数据划分为100个小区间:[tmin,tmin d),[tmin d,tmin 2d),[tmin 2d,tmin 3d),……,[tmin 97d,tmin 98d),[tmin 98d,tmin 99d),[tmin 99d,tmax],选取分组端点数据qi=tmin (i-1)×d,i=1,2,…,100用作下一步计算。
4.如权利要求1所述的方法,其特征在于,所述用分组端点数据代替变压器在线监测大数据,包括:
取各个分组端点数据{qi,i=1,2,…,100}代替原始变压器在线监测大数据。
5.如权利要求1所述的方法,其特征在于,所述利用最小二乘法计算分组端点数据的初始分布模型参数,包括:
使用{qi,i=1,2,…,100}作为输入数据集,利用最小二乘法计算初始分布模型参数;
所述分布模型包括但不限定于威布尔分布模型、正态分布模型、卡方分布模型中的至少一种。
6.如权利要求1所述的方法,其特征在于,所述将初始分布模型参数作为初值,利用极大似然估计法计算变压器在线监测大数据的最终分布模型参数,包括:
将所述最小二乘法计算得到的初始分布模型参数作为极大似然估计法的初始参数;
将所述权利要求1中获取到的变压器在线监测大数据作为样本数据;
在所述极大似然估计法中使用牛顿-拉夫逊迭代法进行迭代求解得到最终分布模型参数。
技术总结