本发明涉及电能计量领域,具体来说涉及一种低压用户串户检测方法及存储介质。
背景技术:
供电公司在开展业务扩展新装以及电能表故障更换时,为了便于集中管理,通常是开展批量装表操作。作业时,电力职工会因为作业疏忽,导致电表串户,即用户a的电表实际计量的是用户b的电量,用户b的电表实际计量的是用户a的电费,因此及时发现电表串户,对于维护电力营销市场秩序、保护用户公平合法利益、减少用电纠纷具有重要的利益。
针对上述的电表串户问题,现有技术采取如下方案:
如专利cn201610074892.9电表串户监管系统,通过设置于用户母线的现场检测单元以及所述现场检测单元通信连接的电力监控中心检查用户电表串户状态。
如专利cn201710502776.7基于tdr的电表串户检测装置,通过提供tdr能力的检测装置,检测电表信息与用户信息是否正确对应,从而判定用户是否串户。
如专利cn201620749294.2一种电表串户检测装置,通过提供了一种电表串户检测装置,从而实现同时对多个用户进行串户检测。
目前电表串户检测的现有解决方案,都需要开发独立于计量电表的硬件装置,然后通过硬件装置本身的信号发射和信号接收等方法,来实现对串户用户的识别,这种解决方案适用于小范围串户嫌疑用户的精确排查。但是针对大规模用户场景下的常态化监测排查,就会显得力不从心。
技术实现要素:
为了克服现有技术的不足,本发明的目的在于提供一种低压用户串户检测方法及存储介质,不再依赖于某种特殊的硬件装置,能实现对大规模的用户进行快速、准确的串户检测,解决现有技术需开发独立于计量电表的硬件装置,无法针对大规模用户场景下进行常态化监测排查的问题。
本发明的目的通过以下技术方案实现:
一种低压用户串户检测方法,包括:
获取用户换表日前n天及换表日后n天的日用电量时间序列;其中,n为自然数;
基于用户换表日前n天及换表日后n天的日用电量时间序列,得到所有电量突变用户;
对电量突变用户进行相似匹配度计算,得到电量突变用户之间的相似匹配度;
根据电量突变用户之间的相似匹配度,判断电量突变用户之间是否存在串户嫌疑;
获取所有存在串户嫌疑的用户对。
进一步的,根据电量突变用户之间的相似匹配度,判断电量突变用户之间是否存在串户嫌疑的步骤包括:
若两个电量突变用户之间相似匹配度大于第二设定阈值时,判断该两个电量突变用户之间存在串户嫌疑。
进一步的,通过电力公司的用电信息采集系统获取用户换表日前n天及换表日后n天的日用电量时间序列。
进一步的,基于用户换表日前n天及换表日后n天的日用电量时间序列,得到所有电量突变的用户的步骤包括:对用户换表日前n天及换表日后n天的日用电量时间序列进行电量时序跃迁型突变度计算,在某用户的电量时序跃迁型突变度大于第一设定阈值时,判断该用户发生电量突变,该用户为电量突变的用户。
进一步的,电量时序跃迁型突变度计算公式满足:
突变度mutation=|mean(x1)-mean(x2)|/max(std(x1),std(x2));
其中,x1表示用户换表日前n天的时序向量,x2表示用户换表日后n天的时序向量,mean表示对时序向量求均值,std表示对时序向量求方差。
进一步的,所述第一设定阈值为2.0。
进一步的,对电量突变用户进行相似匹配的计算公式满足:
相似匹配度similarity=g(sim(a1,b2),sim(a2,b1));
其中,函数g(x)表示二元聚合函数,函数sim(a1,b2)表示a1和b2两个时序向量的相似度函数,函数sim(a2,b1)表示a2和b1两个时序向量的相似度函数,a1为用户a换表日前n天的日用电量时间序列,a2为用户a换表日后n天的日用电量时间序列,b1为用户b换表日前n天的日用电量时间序列,b2为用户b换表日后n天的日用电量时间序列。
进一步的,所述第二设定阈值为0.7。
进一步的,所述二元聚合函数为max函数或mean函数。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现所述的低压用户串户检测方法。
与现有技术相比,本发明具有如下有益效果:
本发明通过构建电量突变用户检测 电量突变用户相似匹配的电表串户的算法框架,可以实现在大用户量场景下,快速准确检测电表串户,并不涉及任何额外地硬件设备,就可以进行实际应用,部署成本低,方便推广和移植。
附图说明
图1为本发明一种低压用户串户检测方法实施例的流程示意图;
图2为本发明一种低压用户串户检测方法具体应用实施例的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
如图1-2所示,一种低压用户串户检测方法,请参考图1所示,包括:
步骤s10:获取用户换表日前n天及换表日后n天的日用电量时间序列;其中,n为自然数;作为具体优选实施例,n的范围可取10≤n≤15间的自然数。
具体的,可通过网络,也可通过电力公司的用电信息采集系统获取用户换表日前n天及换表日后n天的日用电量时间序列。电力公司的用电信息采集系统存储各用户每天的日用电量以及各用户更换电表的换表日。
例如,以每个用户的换表时间为基准,分别获取换表时间前n天的日用电量数据,和换表时间后n天的日用电量数据,生成一个2*n 1维的行向量,作为用户换表日前后n天的日用电量时间序列向量(简称时序向量)。
步骤s20:基于用户换表日前n天及换表日后n天的日用电量时间序列,得到所有电量突变用户;
具体的,对用户换表日前n天及换表日后n天的日用电量时间序列进行电量时序跃迁型突变度计算,在某户的电量时序跃迁型突变度大于第一设定阈值时,判断该用户发生电量突变,该用户为电量突变的用户。
作为实施例,第一设定阈值可设置为2.0。
进一步的,电量时序跃迁型突变度计算公式满足:
突变度mutation=|mean(x1)-mean(x2)|/max(std(x1),std(x2));
其中,x1表示用户换表日前n天的时序向量,x2表示用户换表日后n天的时序向量,mean表示对时序向量求均值,std表示对时序向量求方差。
步骤s30:对电量突变用户之间进行相似匹配度计算,得到电量突变用户之间的相似匹配度;
在该步骤中,通过对电量突变用户的换表日前n天及换表日后n天的日用电量时间序列进行相似匹配度计算,得到电量突变用户之间的相似匹配度。
具体的,电量突变用户之间的相似匹配度similarity=g(sim(a1,b2),sim(a2,b1));
其中,函数g(*)表示二元聚合函数,函数sim(a1,b2)表示a1和b2两个时序向量的相似度函数,函数sim(a2,b1)表示a2和b1两个时序向量的相似度函数,a1为用户a换表日前n天的日用电量时间序列,a2为用户a换表日后n天的日用电量时间序列,b1为用户b换表日前n天的日用电量时间序列,b2为用户b换表日后n天的日用电量时间序列。
在这里,二元聚合函数可为count(*)统计所有列、max(*)统计最大值、min(*)统计最小值、avg(*)统计平均值、sum(*)统计和等二元聚合函数,在这里不作具体限制。
作为具体实施例,二元聚合函数可为但不局限于max(*)、mean(*)函数。
在这里,函数sim(.,.)表示两个时序向量的相似度函数,可以是但不局限于高斯核函数,均值、相对偏差函数等。
步骤s40:根据电量突变用户之间的相似匹配度,判断电量突变用户之间是否存在串户嫌疑;
具体的,若两个电量突变用户相似匹配度大于第二设定阈值时,判断该两个电量突变用户之间存在串户嫌疑;
作为实施例,第二设定阈值可设定为0.7。
例如,假设用户a和用户b为两个电量突变用户,获取用户a换表日前n天的日用电量时间序列a1、用户a换表日后n天的日用电量时间序列a2、用户b换表日前n天的日用电量时间序列b1和用户b换表日后n天的日用电量时间序列b2。二元聚合函数采用max(*)函数,若用户a和用户的相似匹配度similarity=max(sim(a1,b2),sim(a2,b1))大于0.7时,判定用户a和用户b之间存在串户嫌疑。
步骤s50:获取所有存在串户嫌疑的用户对。
本发明基于算法和用采大数据(即用电信息采集系统)而不依赖于额外特殊硬件装置对电表串户进行检测,通过构建电量突变用户检测 电量突变用户相似匹配的电表串户的算法框架,可以实现在大用户量场景下,快速准确检测电表串户,并不涉及任何额外地硬件设备,利用电力公司现有的数据资源,就可以进行实际应用,部署成本低,方便推广和移植。
下面对本发明具体应用实施例进行说明,请参考图2所示,包括:
一、获取用户换表前后日用电量时间序列
在用电信息采集系统(简称用采数据库)中,记录每个用户电表更换的日期,以及用户对应电表的日用电量数据。
例如,现在要对某地市五月份所有更换电表的电表,进行电表串户的检测,首先通过电力用采数据库的用户档案信息表,筛选出所有属于某地市,而且在五月份发生过更换电表的用户。然后以每个用户的换表时间为基准,分别截取换表时间前n天的日用电量数据,和换表时间后n天的日用电量数据,生成一个2*n 1维的行向量,作为用户换表前后日用电量时间序列向量(简称时序向量)。例如,n取15天,一个用户在5月16日换表,那么把用户在5月1日到5月31日这31天(2*n 1天)的日用电量提取出来,生成一个31维度的日用电量时序向量,作为用户换表日前后n天的日用电量时间序列,这样,用户换表日前后n天的日用电量时间序列包括用户换表日前n天及换表日后n天的日用电量时间序列,即包括用户换表时间前n天的时序向量x1和用户换表时间后n天的时序向量x2。
二、进行电量突变用户检测
本发明检测电表串户的基本出发点是基于如下的假设:用户彼此之间的用电行为存在显著差异性,反应在用电量上,就是日用电量的时间序列存在显著差异性。因此,如果一个用户的电表发生串户,为了方便说明,假设用户a,用户b在5月16日进行了换表,由于电工疏忽,造成了用户a和用户b发生了串户,这意味着,换表后用户a的用电量,其实是记录的用户b的用电量,而用户b的用电量则是记录的用户a的用电量,所以如果观察用户a,b的换表前后日用电量时间序列曲线,会发现在5月16日这天,两个用户用电量都发生了跃迁型的突变。因此,可以通过计算用户在换表当天的时序跃迁型突变度,来判定用户是否出现电量突变,筛出所有发生了电量突变的用户。时序跃迁型突变度计算公式如下:
mutation=|mean(x1)-mean(x2)|/max(std(x1),std(x2))......(1)
其中,x1表示用户换表时间前n天的时序向量,x2表示用户换表时间后n天的时序向量,mean表示对向量求均值,std表示对向量求方差。通过公式(1)可以计算得到每个用户换表日期的突变度mutation,如果mutation大于某个阈值(例如,第一设定阈值2.0),就认为该用户存在电量突变。另外,公式(1)只是作为时序跃迁型突变度的计算示例,完全可以用其他时序跃迁型突变度算法替代公式(1)。
三、对电量突变用户进行相似匹配
得到所有电量突变用户后,现在要得到所有串户的用户对。例如,假设在5月16日换表,用户a、b发生了串户,用户c、d发生了串户,通过上面的电量突变用户检测,可以得到用户a、b、c、d均发生了电量突变。假设a1、b1、c1、d1表示用户a、b、c、d的换表日前n天的日用电量时间序列;a2、b2、c2、d2表示用户a、b、c、d的换表日后n天的日用电量时间序列,由于用户a、b发生了串户,时序向量b2实际表示的是用户a换表后的用电数据,所以时序向量a1和b2相似,类似,有时序向量a2和b1相似。同理有时序向量c1和d2相似,时序向量c2和d1相似。因此,可以定义相似匹配算法如下(以用户a,b为例):
similarity=g(sim(a1,b2),sim(a2,b1))......(2)
其中,函数g(.,.)表示二元聚合函数,可以是但不局限于max,mean等。函数sim(.,.)表示两个时序向量的相似度函数,可以是但不局限于高斯核函数、均值、相对偏差等函数。通过公式(2)计算在同一个表箱里面的电量突变用户两两之间的相似匹配度,相似匹配度大于某个阈值的(例如第二设定阈值0.7),认为两个电量突变用户之间存在串户嫌疑。
本发明基于模型算法角度,充分利用现有的用电信息采集系统的信息,不再依赖于某种特殊的硬件装置,能实现对大规模的用户进行快速、准确的串户检测,
本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。
本发明的实施方式不限于此,按照本发明的上述内容,利用本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,本发明还可以做出其它多种形式的修改、替换或变更,均落在本发明权利保护范围之内。
1.一种低压用户串户检测方法,其特征在于,包括:
获取用户换表日前n天及换表日后n天的日用电量时间序列;其中,n为自然数;
基于用户换表日前n天及换表日后n天的日用电量时间序列,得到所有电量突变用户;
对电量突变用户进行相似匹配度计算,得到电量突变用户之间的相似匹配度;
根据电量突变用户之间的相似匹配度,判断电量突变用户之间是否存在串户嫌疑;
获取所有存在串户嫌疑的用户对。
2.根据权利要求1所述的低压用户串户检测方法,其特征在于,根据电量突变用户之间的相似匹配度,判断电量突变用户之间是否存在串户嫌疑的步骤包括:
若两个电量突变用户之间相似匹配度大于第二设定阈值时,判断该两个电量突变用户之间存在串户嫌疑。
3.根据权利要求1所述的低压用户串户检测方法,其特征在于,通过电力公司的用电信息采集系统获取用户换表日前n天及换表日后n天的日用电量时间序列。
4.根据权利要求1所述的低压用户串户检测方法,其特征在于,基于用户换表日前n天及换表日后n天的日用电量时间序列,得到所有电量突变的用户的步骤包括:对用户换表日前n天及换表日后n天的日用电量时间序列进行电量时序跃迁型突变度计算,在某用户的电量时序跃迁型突变度大于第一设定阈值时,判断该用户发生电量突变,该用户为电量突变的用户。
5.根据权利要求4所述的低压用户串户检测方法,其特征在于,电量时序跃迁型突变度计算公式满足:
突变度mutation=|mean(x1)-mean(x2)|/max(std(x1),std(x2));
其中,x1表示用户换表日前n天的时序向量,x2表示用户换表日后n天的时序向量,mean表示对时序向量求均值,std表示对时序向量求方差。
6.根据权利要求4所述的低压用户串户检测方法,其特征在于,所述第一设定阈值为2.0。
7.根据权利要求1所述的低压用户串户检测方法,其特征在于,
对电量突变用户进行相似匹配的计算公式满足:
相似匹配度similarity=g(sim(a1,b2),sim(a2,b1));
其中,函数g(x)表示二元聚合函数,函数sim(a1,b2)表示a1和b2两个时序向量的相似度函数,函数sim(a2,b1)表示a2和b1两个时序向量的相似度函数,a1为用户a换表日前n天的日用电量时间序列,a2为用户a换表日后n天的日用电量时间序列,b1为用户b换表日前n天的日用电量时间序列,b2为用户b换表日后n天的日用电量时间序列。
8.根据权利要求2所述的低压用户串户检测方法,其特征在于,所述第二设定阈值为0.7。
9.根据权利要求7所述的低压用户串户检测方法,其特征在于,所述二元聚合函数为max函数或mean函数。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-9任一项所述的低压用户串户检测方法。
技术总结