一种数据资源管理平台及方法与流程

专利2022-06-29  57


本发明属于计算机技术领域,具体涉及一种数据资源管理平台及方法。



背景技术:

21世纪是数据时代,随着“大云物移智”等新技术的推广和应用,大数据的采集、存储和应用已直接影响着我们的工作和生活。电力企业也不可避免地面临大数据信息浪潮的冲击。近年来,电力企业信息化建设迅猛发展,积累了大量的结构化、半结构化、非结构化数据,经过多年的努力,取得了很大的成果和效益。但是面对电力企业巨大的数据资源,能有效利用的只是冰山一角。电力业务涉及运检、营销、调控等多个专业,知识点多、业务庞杂。当需要研究和分析其他业务或数据信息时,通常仅有打电话沟通、上门咨询专家、人工调取数据、查找纸质资料等途径,耗时费力,而且数据获取不够精准、不够全面。

随着信息化水平不断提高,数据资源不断积累,电力系统和数据呈烟筒式发展,大数据快速发展对数据资源要求也越来越高。但是当前跨专业数据获取多需线下协调,链条多、时间长、效率低,数据变现成本高,大数据价值挖掘和发展面临很大的阻碍。



技术实现要素:

针对现有技术的不足,本发明的目的在于提供一种数据资源管理平台及方法,以解决现有技术中存在的电力系统业务数据协调性差的问题。

为解决上述技术问题,本发明采用以下技术方案:

一种数据资源管理平台,所述平台包括数据资源层、数据服务层、应用支撑层、应用层和用户层;

所述用户层用于获取用户的检索目标;

所述数据资源层用于获取各业务模块的业务数据;

所述数据服务层用于对数据资源层获取的业务数据进行处理;

所述应用支撑层用于根据数据服务层处理后的业务数据建立检索服务;

所述应用层根据检索目标、检索服务实现对业务数据的检索。

进一步的,所述业务数据包括非结构化数据和结构化数据。

进一步的,所述非结构化数据包括音频、视频和文档;所述结构化数据包括运检、物资和营销。

一种数据资源管理方法,所述方法包括如下步骤:

通过数据资源层获取电力系统各业务模块的业务数据;

根据所述业务数据建立数据的关键词条;

根据用户层输入的关键词条实现业务数据的检索;

根据检索结果构建宽表;

根据宽表建立业务数据的展示。

进一步的,所述检索的过程如下:

对业务数据的源数据进行搜集清洗;

构建分布式索引信息库;

根据检索关键词和分布式索引信息库对搜集清洗后的业务数据进行检索。

进一步的,所述检索的过程中一张表的一条记录对应搜索引擎的一个document,每个字段对应搜索引擎的一个field。

进一步的,所述方法还包括:

建立业务间、源表间、业务与源表间的关系拓扑图;

通过关系拓扑图实现对业务数据的可视化处理。

进一步的,所述关系拓扑图根据电力系统的业务模块的分割链接建立。

与现有技术相比,本发明有以下有益效果:

本发明根据电力系统业务数据的情况,建立数据资源层、数据服务层、应用支撑层、应用层和用户层,通过上述各层对业务数据的分层处理,可以实现对业务数据之间实现可视化管理和各数据之间的溯源,强化各业务之间的协调性。

附图说明

图1为本发明平台的结构示意图;

图2为本发明方法流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面结合附图及具体实施例对本发明的技术方案做进一步的详细说明。

针对目前电力系统数据资源应用及数据资源价值变现面临的困境,在大力推进大数据建设应用的背景下,以数据资源的快速检索、智能应用、安全管理等为目标,通过调研分析创新研究了数据资源智能搜索平台,实现数据快速检索、关系溯源,满足各层级、各专业数据需求,促进数据流通融合、全面互联、开放共享和协同共治,激活数据价值。

数据资源智能搜索平台从以下几个方面解决数据应用问题。

一、解决数据不清。大数据挖掘或监测分析是以跨部门、跨业务、跨领域融合为基础,揭示不同专业之间的业务协调问题,形成高价值的大数据应用成果。但是大部分数据使用者业务领域单一,对领域外的业务和数据理解不深、掌握不清,且不同系统多头数据,多留在部门、专业“自转”为主,数据应用困难,理不清、理还乱。

二、解决无从追数。当前电力行业数据资源和业务流程脱节,对于数据应用者来说,数据挖掘、监测分析等应用场景的建设是基于业务流程、管理、制度等方面的内容,但是由于业务数据“黑匣子”、数据存在多源异构的问题,数据信息碎片化,存在查询效率底、使用麻烦、交互性较差,不能快速追溯应用场景所需的数据项及数据来源。

三、解决有数不懂。数据多以源表和字段形式代码存储,对数据使用者来说,仅仅通过源表和字段而没有关联业务,是不能理解数据的含义及内容。同时由于各系统开发厂商提供的资料残次不齐,系统中很多数据存在中文注释缺失或者数据字典和数据不一致等情况,对于使用者来说犹如“天书”,不经“翻译”,即使获取到数据,也无法理解数据定义。限制了数据应用的拓展和提升。

四、解决用数困难。各业务系统设计复杂、源表繁多、数据可读性差、表间关联关系复杂,对于数据使用者来说,存在从数源层到应用层的数据预处理阶段工作困难,数据获取受限,数据处理耗时长,很大程度上限制了数据应用的建设和创新。同时数据应用多以excel、wps等office工具为主,数据统计、制图、计算功能不强,数据应用耗时费力,难以满足当前多元化工作需求。

如图1所示,一种数据资源管理平台,所述平台包括数据资源层、数据服务层、应用支撑层、应用层和用户层;

所述用户层用于获取用户的检索目标;

所述数据资源层用于获取各业务模块的业务数据;

所述数据服务层用于对数据资源层获取的业务数据进行处理;

所述应用支撑层用于根据数据服务层处理后的业务数据建立检索服务;所述检索服务包括目录服务、索引服务、安全管理、日志服务、系统维护、基础信息管理和数据库组件。

所述应用层根据检索目标、检索服务实现对业务数据的检索。

数据资源层:主要从数据来源方面分为非结构化数据(音频、视频、文档等)、结构化数据(运检、物资、营销等应用系统对应数据库),数据来源于内网资源的文档服务器、数据库服务器、web服务器以及其他数据存储服务器等。

数据服务层:主要从平台对应目录库、索引库、词条库,以及获取相应数据库数据库、文档、web数据对应的数据挖掘服务、文档爬取服务、网络爬取服务等。以及数据检索对应的数据缓存服务。

应用支撑层:主要支撑智能检索而建立的数据目录、索引服务、安全管理、日志服务、系统维护、基础信息管理等,以及为数据连接及数据下载而建立的数据库组件。

应用层:应用层主要采用关键字、目录检索等方式,用于业务检索、资源检索、关系检索、数据检索、应用检索等功能,高效的为用户展现出检索结果。

用户层:用户层主要包括现系统使用人员,并根据不同人员的不同需求提供不同的界面展示。

如图2所示,一种数据资源管理方法,所述方法包括如下步骤:

通过数据资源层获取电力系统各业务模块的业务数据;

根据所述业务数据建立数据的关键词条;

根据用户层输入的关键词条实现业务数据的检索;

根据检索结果构建宽表;

根据宽表建立业务数据的展示。

平台业务数据来源各个业务系统,检索数据信息通过批量导入、录入的形式进入系统并对该部分数据建立倒排序索引,基于检索结果构建宽表并自动生成建表、抽取语句,基于宽表在上层建立应用展示,并可配置专题看板展示宽表数据。

所述检索的过程如下:

对业务数据的源数据进行搜集清洗;

构建分布式索引信息库;

根据检索关键词和分布式索引信息库对搜集清洗后的业务数据进行检索。

所述检索的过程中一张表的一条记录对应搜索引擎的一个document,每个字段对应搜索引擎的一个field。

所述方法还包括:

建立业务间、源表间、业务与源表间的关系拓扑图;

通过关系拓扑图实现对业务数据的可视化处理。

所述关系拓扑图根据电力系统的业务模块的分割链接建立。

源数据搜集清洗:各业务系统存储在关系数据库中的结构化数据作为源数据,包含但不限于通过系统录入的数据信息、数据项信息、业务信息、系统信息、关系数据信息等。

构建分布式索引信息库:搜索引擎数据加载模块读取数据库数据,数据库中的一张表的一条记录对应搜索引擎的一个document,数据库的每个字段对应搜索引擎的一个field。数据加载时,读取每条数据库记录并对每个字段进行分词,建立索引库的倒排序索引文件,并把文件存储在服务器文件目录系统中。增量更新索引信息库,当数据库数据有变更,触发索引更新事件,数据加载模块加载增量数据,并对该部分数据建立索引,形成增量索引,并定时同步更新索引信息库进行索引合并。

检索过程:前端界面接受用户输入检索关键词,并传输至检索引擎模块,检索引擎模块通过分词器对检索关键词进行智能化分词,比如“国家电网青年创新大赛”,分词后为:国家、电网、国家电网、青年、创新、大赛、国家电网青年、创新大赛、青年创新大赛、青年创新;分词后的每项词条在索引库中进行检索,并根据一定的算法评定匹配度和匹配度得分。

排序模块接收检索结果,根据每条记录的匹配度得分,按照由高到低进行排序。关键词渲染模块对检索结果中出现的关键词进行高亮、颜色区别、加粗能样式设置,以重点突出和显示检索关键词。

本发明依托数据与业务对应关系图谱,形成了以数据为中心的电力行业知识体系,首次实现了数据定义、结构、来源以及关联关系的深度融合,一键即可查到数据关联的所有信息;依托“全文信息检索”强大的信息处理和分秒级检索能力,首次构建电力数据资源百科,只需几秒即可查找数据定义、数据单元、应用报告等,填补了电力专业搜索空白。应用sql封装,打破了数据调取的“黑匣子”,改变了原始人工干预的数据获取方式,让我们在数据迷宫中可以准确定位查找数据,推动数据获取由后台走向前台,由专业领域走向全民应用。

以上对本申请进行了详细介绍,本发明中应用了具体个例对本申请的原理及实施方式进行了阐释,以上实施例的说明只是用于帮助理解本申请的方法及核心思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明不应理解为对本申请的限制。


技术特征:

1.一种数据资源管理平台,其特征在于,所述平台包括数据资源层、数据服务层、应用支撑层、应用层和用户层;

所述用户层用于获取用户的检索目标;

所述数据资源层用于获取各业务模块的业务数据;

所述数据服务层用于对数据资源层获取的业务数据进行处理;

所述应用支撑层用于根据数据服务层处理后的业务数据建立检索服务;

所述应用层根据检索目标、检索服务实现对业务数据的检索。

2.根据权利要求1所述的一种数据资源管理平台,其特征在于,所述业务数据包括非结构化数据和结构化数据。

3.根据权利要求2所述的一种数据资源管理平台,其特征在于,所述非结构化数据包括音频、视频和文档;所述结构化数据包括运检、物资和营销。

4.一种数据资源管理方法,其特征在于,所述方法包括如下步骤:

通过数据资源层获取电力系统各业务模块的业务数据;

根据所述业务数据建立数据的关键词条;

根据用户层输入的关键词条实现业务数据的检索;

根据检索结果构建宽表;

根据宽表建立业务数据的展示。

5.根据权利要求4所述的一种数据资源管理方法,其特征在于,所述检索的过程如下:

对业务数据的源数据进行搜集清洗;

构建分布式索引信息库;

根据检索关键词和分布式索引信息库对搜集清洗后的业务数据进行检索。

6.根据权利要求5所述的一种数据资源管理方法,其特征在于,所述检索的过程中一张表的一条记录对应搜索引擎的一个document,每个字段对应搜索引擎的一个field。

7.根据权利要求4所述的一种数据资源管理方法,其特征在于,所述方法还包括:

建立业务间、源表间、业务与源表间的关系拓扑图;

通过关系拓扑图实现对业务数据的可视化处理。

8.根据权利要求7所述的一种数据资源管理方法,其特征在于,所述关系拓扑图根据电力系统的业务模块的分割链接建立。

技术总结
本发明公开了一种数据资源管理平台及方法,所述平台包括数据资源层、数据服务层、应用支撑层、应用层和用户层;所述用户层用于获取用户的检索目标;所述数据资源层用于获取各业务模块的业务数据;所述数据服务层用于对数据资源层获取的业务数据进行处理;所述应用支撑层用于根据数据服务层处理后的业务数据建立检索服务;所述应用层根据检索目标、检索服务实现对业务数据的检索。本发明可以实现对业务数据之间实现可视化管理和各数据之间的溯源,强化各业务之间的协调性。

技术研发人员:代作松;张玮;梁明;汤宁;刘坤
受保护的技术使用者:南京南瑞信息通信科技有限公司
技术研发日:2019.12.20
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-51152.html

最新回复(0)