本申请涉及大数据领域,具体而言,涉及一种数据完整性的确定方法和装置、存储介质及电子装置。
背景技术:
1、随着《电力现货市场交易规则》的实施,我国电力现货市场正处于快速建设阶段,各类交易主体和交易品种不断增多。这使电力交易数据的数量和复杂性大幅提高,对数据的完整性和一致性提出了更高要求。但是目前电力交易数据来源多样,特征分布不均,数据缺失、异常现象时有发生。若不能准确评估数据完整性,将直接影响交易结算及运营决策,带来经济损失和市场风险。
2、目前,最常用的电力交易数据完整性评估方法是基于数据编辑的规则引擎技术。该方法通过人工制定数据过滤规则,将异常数据标记出来。但这需要大量人工工作量,且规则难以覆盖所有情况,导致评估电力数据的完整性的效率低。还有一种方法是基于主成分分析的统计学评估模型。这种方法可以自动提取数据特征,但是仅考虑了线性关系,未能充分挖掘数据间的非线性潜在关联,导致评估准确性不高。
3、针对现有技术中通过电力数据之间的线性关系确定电力数据的完整性,导致的确定电力数据的完整性的准确率低的问题,尚未得到有效方案。
技术实现思路
1、根据本申请实施例的一个实施例,提供了一种数据完整性的确定方法,包括:根据多个电力数据属性的依赖关系建立有向图,其中,所述多个电力数据属性用于指示第一电力数据的数据特征,所述有向图的第一顶点用于指示所述电力数据属性,所述有向图的第一边用于指示所述依赖关系;确定所述有向图的路径完整性,并根据所述路径完整性确定所述第一电力数据的完整性。
2、在一个示例性实施例中,确定所述有向图的路径完整性,包括:确定步骤:确定所述有向图的任一第一路径中的多个第二边;确定每一第二边的完整性,并根据所述每一第二边的完整性确定所述任一第一路径的完整性;循环执行所述确定步骤,直至确定所述有向图中的每一第一路径的完整性;根据所述有向图中的每一第一路径的完整性确定所述有向图的路径完整性。
3、在一个示例性实施例中,确定每一第二边的完整性,包括:确定所述每一第二边中的多个第二顶点;确定每一第二顶点的完整性,并根据所述每一第二顶点的完整性确定所述每一第二边的完整性。
4、在一个示例性实施例中,确定每一第二顶点的完整性,至少包括以下之一:确定任一第二顶点对应的第一电力数据属性,其中,所述多个电力数据属性包括:所述第一电力数据属性;确定所述第一电力数据中是否存在与所述第一电力数据属性对应的第二电力数据;在存在所述第二电力数据的情况下,确定所述任一第二顶点完整;在不存在所述第二电力数据的情况下,确定所述任一第二顶点不完整。
5、在一个示例性实施例中,根据所述路径完整性确定所述第一电力数据的完整性,包括:根据所述路径完整性确定所述有向图中完整路径的第一数量;以及确定所述有向图中所有路径的第二数量;根据所述第一数量和所述第二数量确定第一电力数据的完整性。
6、在一个示例性实施例中,在根据所述路径完整性确定所述第一电力数据的完整性之后,包括:在确定所述第一电力数据完整的情况下,根据实际负荷和发电量的大小关系确定目标权重,以及确定所述实际负荷对应的第一数值与所述发电量对应的第二数值的差值,其中,所述多个电力数据属性包括:所述实际负荷和所述发电量;根据所述差值与所述目标权重的乘积确定第一值,并根据竞价价格对应的第三数值与所述发电量对应的第四数值确定第二值,其中,所述多个电力数据属性包括:所述竞价价格;根据所述第一值和所述第二值的和值确定所述第一电力数据对应的电力价格。
7、根据本申请实施例的另一个实施例,还提供了一种数据完整性的确定装置,包括:建立模块,用于根据多个电力数据属性的依赖关系建立有向图,其中,所述多个电力数据属性用于指示第一电力数据的数据特征,所述有向图的第一顶点用于指示所述电力数据属性,所述有向图的第一边用于指示所述依赖关系;确定模块,用于确定所述有向图的路径完整性,并根据所述路径完整性确定所述第一电力数据的完整性。
8、根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述方法。
9、根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的方法。
10、根据本申请实施例的又一方面,还提供了一种计算机程序产品,包括计算机程序,其中,上述计算机程序被处理器执行上述方法。
11、在本申请实施例中,通过用于指示第一电力数据的数据特征的多个电力数据属性之间的依赖关系建立有向图。其中,有向图的第一顶点用于指示电力数据属性,第一边用于指示第一电力数据之间的依赖关系。确定有向图的路径完整性,进而根据路径完整性确定第一电力数据的完整性。也就是说,本申请通过建立有向图确定第一电力数据的数据特征(即本申请的多个电力数据属性)之间的依赖关系,进而确定有向图的多个因素的完整性,以此确定第一电力数据的完整性。解决了现有技术中通过电力数据之间的线性关系确定电力数据的完整性,导致的确定电力数据的完整性的准确率低的问题。达到提高确定电力数据的完整性的准确率的效果。
1.一种数据完整性的确定方法,其特征在于,包括:
2.根据权利要求1所述的数据完整性的确定方法,其特征在于,确定所述有向图的路径完整性,包括:
3.根据权利要求2所述的数据完整性的确定方法,其特征在于,确定每一第二边的完整性,包括:
4.根据权利要求3所述的数据完整性的确定方法,其特征在于,确定每一第二顶点的完整性,至少包括以下之一:
5.根据权利要求1所述的数据完整性的确定方法,其特征在于,根据所述路径完整性确定所述第一电力数据的完整性,包括:
6.根据权利要求1所述的数据完整性的确定方法,其特征在于,在根据所述路径完整性确定所述第一电力数据的完整性之后,包括:
7.一种数据完整性的确定装置,其特征在于,包括:
8.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6任一项中所述的方法。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行所述权利要求1至6任一项中所述的方法。
