本发明涉及水务数据处理领域,尤其涉及一种分流数据处理系统。
背景技术:
目前,工业领域内数据存储和处理基本都是采用单一的数据库结构,其中包括:关系型数据库(oracle、mysql、sqlserver、db2、postgres)、非关系型数据库(gp、redis、mongodb、memcache、cassandra)和工业实时数据库(pspace、ihistorian、historian),但是上述任一单一数据库均无法满足水务企业对于海量水务数据的处理需求:以一套设备100个测点,有1000套设备为例,则测点数达到10万,其中若假设测点每2秒上传一次采集数据,一天则需上传216000次供21.6亿条数据,一条数据4字节(4b),则数据量一天达到86.4亿b,约8gb,一年就将达到2.8t的数据量。
同时,现有的单一数据库在数据量为tb级数据时,读取速度将会变慢,容易频繁宕机,并且不支持机器学习自主分析,也不支持分布式部署和负载均衡,导致迸发能力差,无法满足水务数据处理的现实需求,需要通过对数据处理结构进行与需求相匹配的改进。
技术实现要素:
针对现有技术中存在的上述问题,现提供一种分流数据处理系统,具体技术方案如下所示:
一种分流数据处理系统,具体包括:
多个采集端,每个采集端对应一外部的水务设备,用于采集每个水务设备的工况数据并作为原始数据进行输出;
后台终端,分别连接每个采集端,用于对原始数据进行接收、处理和存储,后台终端进一步包括:
分流单元,用于接收并对原始数据进行分类和预处理,输出实时运算结果,统计数据和冗余数据;
第一存储单元,连接分流单元,用于接收并存储实时运算结果;
第二存储单元,连接分流单元,用于接收并存储统计数据;
第三存储单元,连接分流单元,用于接收并存储冗余数据;
判断单元,连接第一存储单元,用于根据实时运算结果,判断对应的水务设备是否处于异常工况,并输出相应的判断结果;
第一处理单元,连接第二存储单元,用于根据外部的第一用户指令,提取相应的统计数据并进行统计处理,输出统计报表;
第二处理单元,连接第三存储单元,用于根据外部的第二用户指令,提取相应的冗余数据并进行大数据统计处理,输出大数据统计结果;
多个交互终端,每个交互终端均连接后台终端,用于接收并向后台终端发送第一用户指令和第二用户指令,同时实时接收并实时显示原始数据、实时运算结果、判断结果、统计报表和大数据统计结果。
优选的,该种分流数据处理系统,其中原始数据包括水务设备的实时开关量数据、实时模拟量数据和基础参数数据。
优选的,该种分流数据处理系统,其中冗余数据包括除非追溯型开关量数据外的所有原始数据。
优选的,该种分流数据处理系统,其中每个采集端均按一预设频率采集对应的水务设备的工况数据并将原始数据实时传输至后台终端;
分流单元按预设频率对接收到的原始数据进行分类和预处理。
优选的,该种分流数据处理系统,其中统计报表包括秒级统计报表、分级统计报表、时级统计报表、日级统计报表和月度统计报表。
优选的,该种分流数据处理系统,其中第三存储单元包括多个子存储模块,每个子存储模块均连接分流单元;
于多个子存储模块中设置一个作为主存储模块,其余子存储模块均作为从存储模块,主存储模块实时监控所有从存储模块的存储状态,并根据存储状态对第三存储单元进行负载均衡控制。
优选的,该种分流数据处理系统,其中第二处理单元包括一自学习模块;
自学习模块用于提升大数据统计处理的效率。
优选的,该种分流数据处理系统,其中第二处理单元包括多个子处理模块,每个子处理模块均连接第三存储单元;
于多个子处理模块中设置一个作为主处理模块,其余子处理模块均作为从处理模块,主处理模块实时监控所有从处理模块的处理工况,并根据处理工况对第二处理单元进行负载均衡控制。
通过本技术方案,能够在面对数量庞杂的水务数据时,通过对原始水务数据进行预处理和分流,减少单一数据库的存储和处理压力,从而满足水务企业对于数据存储的现实需求;同时增加对于水务数据的数据处理速度,实现高效安全的大数据分析,并且支持机器学习、负载均衡以及冗余备份。
附图说明
图1为本发明一种分流数据处理系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
针对现有技术中存在的上述问题,现提供一种分流数据处理系统,应用于水务数据处理领域,具体技术方案如下所示:
一种分流数据处理系统,如图1所示,具体包括:
多个采集端1,每个采集端1对应一外部的水务设备,用于采集每个水务设备的工况数据并作为原始数据进行输出;
后台终端2,分别连接每个采集端1,用于对原始数据进行接收、处理和存储,后台终端2进一步包括:
分流单元21,用于接收并对原始数据进行分类和预处理,输出实时运算结果,统计数据和冗余数据;
第一存储单元22,连接分流单元21,用于接收并存储实时运算结果;
第二存储单元23,连接分流单元21,用于接收并存储统计数据;
第三存储单元24,连接分流单元21,用于接收并存储冗余数据;
判断单元25,连接第一存储单元22,用于根据实时运算结果,判断对应的水务设备是否处于异常工况,并输出相应的判断结果;
第一处理单元26,连接第二存储单元23,用于根据外部的第一用户指令,提取相应的统计数据并进行统计处理,输出统计报表;
第二处理单元27,连接第三存储单元24,用于根据外部的第二用户指令,提取相应的冗余数据并进行大数据统计处理,输出大数据统计结果;
多个交互终端3,每个交互终端3均连接后台终端2,用于接收并向后台终端2发送第一用户指令和第二用户指令,同时实时接收并实时显示原始数据、实时运算结果、判断结果、统计报表和大数据统计结果。
作为优选的实施方式,该种分流数据处理系统,其中原始数据包括水务设备的实时开关量数据、实时模拟量数据和基础参数数据。
在本发明的另一较佳实施例中,对本技术方案中的原始数据作出了进一步的限定和阐释,前述原始数据代表每一个水务设备的运行工况,
作为优选的实施方式,该种分流数据处理系统,其中冗余数据包括除非追溯型开关量数据外的所有原始数据。
在本发明的另一较佳实施例中,冗余数据被限定为除去非追溯型开关量数据外的所有原始数据,保证了所有的立式数据都能尽可能的得以保存。在此需要注意的是,在实际运行监控过程中,水务设备的开关量数据的整体规模是比较大的且其中的大多数开关量数据并不具备可追溯的特性,因而在数据处理过程中给予直接剔除丢弃的处理;而对于诸如水务设备机房门禁系统的开关量等需要长久追溯的数据而言,由于其具有存储价值以及后期的追溯性,因而将这类开关量数据划分为追溯型开关量数据并于第三存储单元24中予以保存。
作为优选的实施方式,该种分流数据处理系统,其中每个采集端1均按一预设频率采集对应的水务设备的工况数据并将原始数据实时传输至后台终端2;
分流单元21按预设频率对接收到的原始数据进行分类和预处理。
作为优选的实施方式,该种分流数据处理系统,其中统计报表包括秒级统计报表、分级统计报表、时级统计报表、日级统计报表和月度统计报表。
作为优选的实施方式,该种分流数据处理系统,其中第三存储单元24包括多个子存储模块,每个子存储模块均连接分流单元21;
于多个子存储模块中设置一个作为主存储模块,其余子存储模块均作为从存储模块,主存储模块实时监控所有从存储模块的存储状态,并根据存储状态对第三存储单元进行负载均衡控制。
作为优选的实施方式,该种分流数据处理系统,其中第二处理单元27包括一自学习模块;
自学习模块用于提升大数据统计处理的效率。
作为优选的实施方式,该种分流数据处理系统,其中第二处理单元27包括多个子处理模块,每个子处理模块均连接第三存储单元24;
于多个子处理模块中设置一个作为主处理模块,其余子处理模块均作为从处理模块,主处理模块实时监控所有从处理模块的处理工况,并根据处理工况对第二处理单元进行负载均衡控制。
综上所述,通过本技术方案,能够在面对数量庞杂的水务数据时,通过对原始水务数据进行预处理和分流,减少单一数据库的存储和处理压力,从而满足水务企业对于数据存储的现实需求;同时增加对于水务数据的数据处理速度,实现高效安全的大数据分析,并且支持机器学习、负载均衡以及冗余备份。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
1.一种分流数据处理系统,其特征在于,包括:
多个采集端,每个所述采集端对应一外部的水务设备,用于采集每个所述水务设备的工况数据并作为原始数据进行输出;
后台终端,分别连接每个所述采集端,用于对所述原始数据进行接收、处理和存储,所述后台终端进一步包括:
分流单元,用于接收并对所述原始数据进行分类和预处理,输出实时运算结果,统计数据和冗余数据;
第一存储单元,连接所述分流单元,用于接收并存储所述实时运算结果;
第二存储单元,连接所述分流单元,用于接收并存储所述统计数据;
第三存储单元,连接所述分流单元,用于接收并存储所述冗余数据;
判断单元,连接所述第一存储单元,用于根据所述实时运算结果,判断对应的所述水务设备是否处于异常工况,并输出相应的判断结果;
第一处理单元,连接所述第二存储单元,用于根据外部的第一用户指令,提取相应的所述统计数据并进行统计处理,输出统计报表;
第二处理单元,连接所述第三存储单元,用于根据外部的第二用户指令,提取相应的所述冗余数据并进行大数据统计处理,输出大数据统计结果;
多个交互终端,每个交互终端均连接所述后台终端,用于接收并向所述后台终端发送所述第一用户指令和所述第二用户指令,同时实时接收并实时显示所述原始数据、所述实时运算结果、所述判断结果、所述统计报表和所述大数据统计结果。
2.如权利要求1所述的分流数据处理系统,其特征在于,所述原始数据包括所述水务设备的实时开关量数据、实时模拟量数据和基础参数数据。
3.如权利要求1所述的分流数据处理系统,其特征在于,所述冗余数据包括除非追溯型开关量数据外的所有所述原始数据。
4.如权利要求1所述的分流数据处理系统,其特征在于,每个所述采集端均按一预设频率采集对应的所述水务设备的工况数据并将所述原始数据实时传输至所述后台终端;
所述分流单元按所述预设频率对接收到的所述原始数据进行分类和预处理。
5.如权利要求1所述的分流数据处理系统,其特征在于,所述统计报表包括秒级统计报表、分级统计报表、时级统计报表、日级统计报表和月度统计报表。
6.如权利要求1所述的分流数据处理系统,其特征在于,所述第三存储单元包括多个子存储模块,每个所述子存储模块均连接所述分流单元;
于多个所述子存储模块中设置一个作为主存储模块,其余所述子存储模块均作为从存储模块,所述主存储模块实时监控所有所述从存储模块的存储状态,并根据所述存储状态对所述第三存储单元进行负载均衡控制。
7.如权利要求1所述的分流数据处理系统,其特征在于,所述第二处理单元包括一自学习模块;
所述自学习模块用于提升所述大数据统计处理的效率。
8.如权利要求1所述的分流数据处理系统,其特征在于,所述第二处理单元包括多个子处理模块,每个所述子处理模块均连接所述第三存储单元;
于多个所述子处理模块中设置一个作为主处理模块,其余所述子处理模块均作为从处理模块,所述主处理模块实时监控所有所述从处理模块的处理工况,并根据所述处理工况对所述第二处理单元进行负载均衡控制。
技术总结