自动处理次要告警的系统、方法及相关设备与流程

专利2022-06-30  70


本发明涉及运维技术领域,尤其涉及一种自动处理次要告警的系统、方法及相关设备。



背景技术:

随着信息技术的快速发展及其与银行业务的深度融合,银行业务涉及的计算机设备数量越来越多。计算机设备的健康状态对于业务正常运转至关重要。通常计算机设备上都会部署监控装置来监测设备的健康状态,若系统状态与监控系统中设置的阈值标准不同,则主动发出告警信息,提示设备运维人员关注。

告警信息根据监控指标偏离阈值标准的程度可区分为主要告警和次要告警。传统的告警处理方式为人工处理。次要告警的特点为紧急程度低且数量非常庞大,对于次要告警而言,人工处理的效率低,且成本高。

如何高效地处理次要告警,使次要告警充分发挥预期的作用是亟待解决的技术问题。



技术实现要素:

本发明实施方式提供一种自动处理次要告警的系统、方法及相关设备,以解决现有技术中次要告警处理效率低的问题。

本发明实施方式的第一方面提供一种自动处理次要告警的系统,所述系统包括:

次要告警接收模块,用于接收监控设备发送的次要告警信息;

告警原因获取模块,用于根据所述次要告警信息获取所述次要告警的告警原因;

处理策略获取模块,用于根据所述次要告警的告警原因获取所述次要告警的处理策略;

自动处理模块,用于在获取所述次要告警的处理策略时,调用所述处理策略的处理脚本对所述次要告警进行自动处理;

人工处理提醒模块,用于在无法获取所述次要告警的告警原因或处理策略时,查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。

在本发明的一种实施方式中,所述告警原因获取模块包括:

第一获取单元,用于从预先存储的次要告警信息与告警原因的映射表中查询所述次要告警信息对应的告警原因;

第二获取单元,用于在第一获取单元没有查询到告警原因时,从预先存储的次要告警信息与告警分析脚本的映射表中查询所述次要告警信息对应的告警分析脚本,调用所述告警分析脚本检查所述次要告警的告警原因。

在本发明的一种实施方式中,所述根据所述次要告警的告警原因获取所述次要告警的处理策略包括:

根据所述次要告警的告警原因从预先存储的告警原因与处理策略的映射表中查询所述次要告警的处理策略。

在本发明的一种实施方式中,所述系统还包括:

人工审批检测模块,用于检测人工审批模块是否开启,若是,则获取所述次要告警信息和处理策略发送给人工审批模块;

人工审批模块,用于人工审批所述次要告警的处理策略,在审批通过时触发自动处理模块调用所述处理策略的处理脚本对所述次要告警进行自动处理,在审批未通过时进行人工处理。

在本发明的一种实施方式中,所述系统还包括:

人工审批开启确定模块,用于执行以下处理:获取所述次要告警的第一属性的属性值;判断所述属性值是否为预设属性值,若是,则确定开启人工审批模块;

其中,所述次要告警的第一属性包括:发生所述次要告警的设备名称、发生所述次要告警的时间。

本发明实施方式的第二方面提供一种自动处理次要告警的方法,所述方法包括:

接收监控设备发送的次要告警信息;

根据所述次要告警信息获取所述次要告警的告警原因;

根据所述次要告警的告警原因获取所述次要告警的处理策略;

在获取到所述次要告警的处理策略时,调用所述处理策略的处理脚本对所述次要告警进行自动处理;

在无法获取到所述次要告警的告警原因或处理策略时,查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。

在本发明的一种实施方式中,所述根据所述次要告警信息确定所述次要告警的告警原因包括:

从预先存储的次要告警信息与告警原因的映射表中查询所述次要告警信息对应的告警原因;

在没有查询到告警原因时,从预先存储的次要告警信息与告警分析脚本的映射表中查询所述次要告警对应的告警分析脚本,调用所述告警分析脚本检查所述次要告警的告警原因。

在本发明的一种实施方式中,所述根据所述次要告警的告警原因获取所述次要告警的处理策略包括:

根据所述次要告警的告警原因从预先存储的告警原因与处理策略的映射表中查询所述次要告警的处理策略。

在本发明的一种实施方式中,所述方法还包括:

检测人工审批模块是否开启,若是,则将所述次要告警信息和处理策略发送给人工审批模块以人工审批所述次要告警的处理策略;

在审批通过时触发所述处理策略的处理脚本对所述次要告警进行自动处理,在审批未通过时进行人工处理。

在本发明的一种实施方式中,所述方法还包括:

获取所述次要告警的第一属性的属性值;

判断所述属性值是否为预设属性值,若是,则开启人工审批模块;

其中,所述次要告警的第一属性包括:发生所述次要告警的设备名称、发生所述次要告警的时间。

本发明实施方式的第三方面提供一种计算机存储介质,其上存储有计算机指令,该计算机指令能够被处理器执行以实现上述任意一种实施方式所述的自动处理次要告警的方法。

本发明实施方式的第四方面提供一种计算机设备,所述设备包括:

存储器,其上存储有计算机程序;

处理器,用于执行所述计算机程序以实现上述任意一种实施方式所述的自动处理次要告警的方法。

本实施方式提供的自动处理次要告警的系统、方法可以根据次要告警信息获取告警原因及处理策略,按照各次要告警对应的处理策略对各次要告警进行自动处理。在无法获取次要告警的处理策略进行自动处理时,再进行人工处理,可以极大的提高次要告警的处理效率,节约人工成本。

附图说明

图1是根据本发明一种实施方式的自动处理次要告警的系统模块示意图;

图2是根据本发明一种实施方式的自动处理次要告警的方法流程图;

图3是根据本发明一种实施方式的自动处理次要告警的处理示例。

具体实施方式

为了便于理解本发明技术方案的各个方面、特征以及优点,下面结合附图对本发明进行具体描述。应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。

本发明实施方式的第一方面提供一种自动处理次要告警的系统。图1示出了根据本发明一种实施方式的自动处理次要告警的系统模块示意图。如图1所示,自动处理次要告警的系统10包括:次要告警接收模块11、告警原因获取模块12、处理策略获取模块13、自动处理模块14以及人工处理提醒模块15。

其中,次要告警接收模块11,用于接收监控设备发送的次要告警信息;

告警原因获取模块12,用于根据所述次要告警信息获取所述次要告警的告警原因;

处理策略获取模块13,用于根据所述次要告警的告警原因获取所述次要告警的处理策略;

自动处理模块14,用于在获取所述次要告警的处理策略时,调用所述处理策略的处理脚本对所述次要告警进行自动处理;

人工处理提醒模块15,用于在无法获取所述次要告警的告警原因或处理策略时,查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。

本实施方式提供的自动处理次要告警的系统可以根据次要告警信息获取告警原因及处理策略,按照各次要告警对应的处理策略对各次要告警进行自动处理。在无法获取次要告警的处理策略进行自动处理时,再进行人工处理,可以极大的提高次要告警的处理效率,节约人工成本。

在一些实施方式中,可以为每类次要告警信息编写告警分析脚本,并将次要告警信息和告警分析脚本的对应关系配置在次要告警信息和告警分析脚本的映射表中。在接收到次要告警信息时,可以查询次要告警信息对应的告警分析脚本,然后调用查询到的告警分析脚本来检查引发该次要告警的告警原因。

对于同一次要告警信息而言,在系统的历史运行过程中,该次要告警信息可能曾经出现过,其告警原因可能查询过。或者,在系统设计时,已经预先配置了次要告警信息与告警原因的对应关系。为提高获取告警原因的效率,可以将已知的次要告警信息与其对应的告警原因配置在次要告警信息与告警原因的映射表中。在接收到次要告警信息时,可以先查询预先存储的次要告警信息与告警原因的映射表,获取所述次要告警信息对应的告警原因。在无法从预先存储的次要告警信息与告警原因的映射表中查询到告警原因时,再从预先存储的次要告警信息与告警分析脚本的映射表中查询该次要告警对应的告警分析脚本,然后调用查询到的告警分析脚本检查该次要告警信息对应的告警原因。

因此,进一步地,告警原因获取模块12进一步地可以包括第一获取单元121和第二获取单元122。其中,第一获取单元121用于从预先存储的次要告警信息与告警原因的映射表中查询所述次要告警信息对应的告警原因。第二获取单元122用于在第一获取单元121没有查询到告警原因时,从预先存储的次要告警信息与告警分析脚本的映射表中查询所述次要告警信息对应的告警分析脚本,调用所述告警分析脚本来检查所述次要告警的告警原因。

例如,在第一获取单元121没有获取次要告警信息a的告警原因时,第二获取单元122可以从预先存储的次要告警信息与告警分析脚本的映射表中查询到次要告警信息a对应的告警分析脚本为1,然后可以调用告警分析脚本1来检查所述次要告警的告警原因,根据告警分析脚本的执行结果可以明确告警原因,继而从预先存储的告警原因与处理策略的映射表中查询所述次要告警的处理策略。

在一些实施方式中,从预先存储的次要告警信息与告警分析脚本的映射表中无法查询到次要告警信息对应的告警分析脚本,或者次要告警信息对应的告警分析脚本无法检查出所述次要告警的告警原因。此时,可以查询所述次要告警对应的责任人,提醒该责任人人工查询该次要告警的告警原因。次要告警的紧急程度较低,可以向该责任人发送短信或邮件,并在短信或邮件中设置该次要告警的处理时限。接收到通知后,责任人可以对所述次要告警进行人工处理。此外,责任人也可以人工查询到该次要告警的告警原因,并可以将该次要告警与告警原因的对应关系存储到所述次要告警与告警原因的映射表中,以便再接收到该次要告警时可以自动查询该次要告警的告警原因。

进一步地,可以将告警原因与其对应的处理策略预先配置在告警原因与处理策略的映射表中并预先存储。在查询到次要告警的告警原因后,可以从预先存储的告警原因与处理策略的映射表中查询该告警原因对应的处理策略,然后根据查询到的处理策略处理所述次要告警。所述处理策略可以是调用处理脚本来处理引起所述次要告警的问题,也可以是调用通知脚本来通知相关人员来人工处理引起所述次要告警的问题,对此本发明不做限定。

在一些实施方式中,从预先存储的告警原因与处理策略的映射表中无法查询到所述次要告警的处理策略。此时,人工处理提醒模块15可以查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。

对于银行业务而言,安全性要求很高。对于某些承载重要业务的设备,或者某些关键的时间节点,需要进行人工审批。在本发明的一些实施方式中,自动处理次要告警的系统可以嵌入人工审批模块,以对一些次要告警的处理策略进行人工审批。

自动处理次要告警的系统10进一步可以包括:人工审批检测模块16以及人工审批模块17。在处理策略获取模块13获取次要告警的处理策略后,可以触发人工审批检测模块16检测人工审批模块17是否开启,若开启,则可以将接收的次要告警以及次要告警对应的处理策略发送给人工审批模块17。人工审批模块17可以提供人工审批接口,以对所述次要告警的处理策略进行人工审批。审批通过时,人工审批模块17可以触发自动处理模块14调用所述处理策略的处理脚本对所述次要告警进行自动处理。在审批未通过时,可以进行人工处理。

人工审批模块17可以根据用户的需求人工开启,也可以根据接收到的次要告警来自动开启。进一步地,本实施方式所述的自动处理次要告警的系统10可以包括人工审批开启确定模块18,用于根据接收到的次要告警来确定是否开启人工审批模块。人工审批开启确定模块18可以通过以下处理来确定是否开启人工审批模块:获取所述次要告警的第一属性的属性值,然后判断所述属性值是否为预设属性值,若是,则确定开启人工审批模块17。所述次要告警的第一属性可以包括:发生所述次要告警的设备名称,发生所述次要告警的时间。

例如,人工审批开启确定模块18可以从次要告警接收模块11获取次要告警信息,然后从所述次要告警信息中获取发生所述次要告警的设备名称,根据该设备名称判断该设备是否属于预设的重点设备。如果该设备属于重点设备,则可以开启人工审批模块17。又例如,人工审批开启确定模块18可以从次要告警接收模块11获取次要告警信息,然后从所述次要告警信息中获取发生所述次要告警的时间,如果发生所述次要告警设备的时间属于预设的关键时间,则可以开启人工审批模块17。此外,人工审批开启确定模块18还可以从次要告警信息中同时获取发生所述次要告警的设备名称和发生所述次要告警的时间,在所述设备名称和所述时间均满足预设值的条件下开启人工审批模块17。所述第一属性也可以为其他属性,具体获取次要告警信息的哪些属性可以根据需要设置。

对应于上述自动处理次要告警的系统,本发明实施方式的另一方面提供一种自动处理次要告警的方法。图2示出了根据本发明一种实施方式的自动处理次要告警的方法流程图。如图2所示,本实施方式所述的自动处理次要告警的方法可以包括如下处理:

s101:接收监控设备发送的次要告警信息;

s102:根据所述次要告警信息获取所述次要告警的告警原因;

s103:根据所述次要告警的告警原因获取所述次要告警的处理策略;

s104:在获取到所述次要告警的处理策略时,调用所述处理策略的处理脚本对所述次要告警进行自动处理;

s105:在无法获取到所述次要告警的告警原因或处理策略时,查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。

进一步地,所述根据所述次要告警信息确定所述次要告警的告警原因包括:

从预先存储的次要告警信息与告警原因的映射表中查询所述次要告警信息对应的告警原因;

在没有查询到告警原因时,从预先存储的次要告警信息与告警分析脚本的映射表中查询所述次要告警对应的告警分析脚本,调用所述告警分析脚本检测所述次要告警的告警原因。

进一步地,所述根据所述次要告警的告警原因获取所述次要告警的处理策略包括:

根据所述次要告警的告警原因从预先存储的告警原因与处理策略的映射表中查询所述次要告警的处理策略。

进一步地,所述方法还包括:

检测人工审批模块是否开启,若是,则将所述次要告警信息和处理策略发送给人工审批模块以人工审批所述次要告警的处理策略;

在审批通过时触发所述处理策略的处理脚本对所述次要告警进行自动处理,在审批未通过时进行人工处理。

进一步地,所述方法还包括:

获取所述次要告警的第一属性的属性值;

判断所述属性值是否为预设属性值,若是,则开启人工审批模块;

其中,所述次要告警的第一属性包括:发生所述次要告警的设备名称、发生所述次要告警的时间。

本领域技术人员应当理解,为了描述的方便和简洁,本实施方式所述的自动处理次要告警的方法的处理过程可以参照上述自动处理次要告警的装置的对应处理过程,在此不再赘述。

下面以一个具体例子来进一步说明本发明实施方式所述的自动处理次要告警的装置及方法。

图3示出了根据本发明一种实施方式的自动处理次要告警的流程示意图。如图3所示,接收到次要告警信息后,可以从预先存储的次要告警信息与告警原因的映射表中查询该次要告警的告警原因。若没有查询到,则从预先存储的次要告警信息与告警分析脚本的映射表中查询该次要告警对应的告警分析脚本,并使用查询到的告警分析脚本来检查告警原因。在告警分析脚本没有检测到告警原因时,可以给该次要告警的责任人发送人工处理消息,由该次要告警的责任人对该次要告警进行人工处理。

在查询到告警原因或告警分析脚本检查到告警原因后,可以根据该告警原因从预先存储的告警原因与处理策略的映射表中查询该次要告警对应的处理策略。

如果查询到该次要告警对应的处理策略,则可以检测人工审批模块是否开启,如果没有开启,则调用该次要告警的处理策略的处理脚本对该次要告警进行自动处理。如果开启了,就将该次要告警及该次要告警对应的处理策略发送给人工审批模块进行人工审批,在人工审批通过时,调用该次要告警的处理策略的处理脚本对该次要告警进行自动处理。如果人工审批没有通过,就对该次要告警进行人工处理。

如果没有查询到对应的处理策略,则可以向该次要告警的责任人发送人工处理消息,由该责任人进行人工处理。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分所述的方法。

本发明实施方式的再一方面提供了一种计算机存储介质,如rom/ram、磁碟、光盘等,其上存储有计算机指令,该计算机指令能够被处理器执行以实现前述任意一种实施方式所述的自动处理次要告警信息的方法。

本发明实施方式的又一方面提供了一种计算机设备,该计算机设备包括:存储器,其上存储有计算机程序;处理器,其可以执行所述计算机程序以实现前述任意一种实施方式所述自动处理次要告警信息的方法。

本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的保护范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。


技术特征:

1.一种自动处理次要告警的系统,其特征在于,所述系统包括:

次要告警接收模块,用于接收监控设备发送的次要告警信息;

告警原因获取模块,用于根据所述次要告警信息获取所述次要告警的告警原因;

处理策略获取模块,用于根据所述次要告警的告警原因获取所述次要告警的处理策略;

自动处理模块,用于在获取所述次要告警的处理策略时,调用所述处理策略的处理脚本对所述次要告警进行自动处理;

人工处理提醒模块,用于在无法获取所述次要告警的告警原因或处理策略时,查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。

2.根据权利要求1所述的系统,其特征在于,所述告警原因获取模块包括:

第一获取单元,用于从预先存储的次要告警信息与告警原因的映射表中查询所述次要告警信息对应的告警原因;

第二获取单元,用于在第一获取单元没有查询到告警原因时,从预先存储的次要告警信息与告警分析脚本的映射表中查询所述次要告警信息对应的告警分析脚本,调用所述告警分析脚本检查所述次要告警的告警原因。

3.根据权利要求1所述的系统,其特征在于,所述根据所述次要告警的告警原因获取所述次要告警的处理策略包括:

根据所述次要告警的告警原因从预先存储的告警原因与处理策略的映射表中查询所述次要告警的处理策略。

4.根据权利要求3所述的系统,其特征在于,所述系统还包括:

人工审批检测模块,用于检测人工审批模块是否开启,若是,则获取所述次要告警信息和处理策略发送给人工审批模块;

人工审批模块,用于人工审批所述次要告警的处理策略,在审批通过时触发自动处理模块调用所述处理策略的处理脚本对所述次要告警进行自动处理,在审批未通过时进行人工处理。

5.根据权利要求1所述的系统,其特征在于,所述系统还包括:

人工审批开启确定模块,用于执行以下处理:获取所述次要告警的第一属性的属性值;判断所述属性值是否为预设属性值,若是,则确定开启人工审批模块;

其中,所述次要告警的第一属性包括:发生所述次要告警的设备名称、发生所述次要告警的时间。

6.一种自动处理次要告警的方法,其特征在于,所述方法包括:

接收监控设备发送的次要告警信息;

根据所述次要告警信息获取所述次要告警的告警原因;

根据所述次要告警的告警原因获取所述次要告警的处理策略;

在获取到所述次要告警的处理策略时,调用所述处理策略的处理脚本对所述次要告警进行自动处理;

在无法获取到所述次要告警的告警原因或处理策略时,查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。

7.根据权利要求6所述的方法,其特征在于,所述根据所述次要告警信息确定所述次要告警的告警原因包括:

从预先存储的次要告警信息与告警原因的映射表中查询所述次要告警信息对应的告警原因;

在没有查询到告警原因时,从预先存储的次要告警信息与告警分析脚本的映射表中查询所述次要告警对应的告警分析脚本,调用所述告警分析脚本检查所述次要告警的告警原因。

8.根据权利要求6所述的方法,其特征在于,所述根据所述次要告警的告警原因获取所述次要告警的处理策略包括:

根据所述次要告警的告警原因从预先存储的告警原因与处理策略的映射表中查询所述次要告警的处理策略。

9.根据权利要求8所述的方法,其特征在于,所述方法还包括:

检测人工审批模块是否开启,若是,则将所述次要告警信息和处理策略发送给人工审批模块以人工审批所述次要告警的处理策略;

在审批通过时触发所述处理策略的处理脚本对所述次要告警进行自动处理,在审批未通过时进行人工处理。

10.根据权利要求6所述的方法,其特征在于,所述方法还包括:

获取所述次要告警的第一属性的属性值;

判断所述属性值是否为预设属性值,若是,则开启人工审批模块;

其中,所述次要告警的第一属性包括:发生所述次要告警的设备名称、发生所述次要告警的时间。

11.一种计算机存储介质,其特征在于,其上存储有计算机指令,该计算机指令能够被处理器执行以实现权利要求6-10中任意一项权利要求所述的方法。

12.一种计算机设备,其特征在于,所述设备包括:

存储器,其上存储有计算机程序;

处理器,用于执行所述计算机程序以实现权利要求6-10中任意一项权利要求所述的方法。

技术总结
本发明提供了一种自动处理次要告警的系统、方法及相关设备,涉及运维技术领域,所述系统包括:次要告警接收模块,用于接收监控设备发送的次要告警信息;告警原因获取模块,用于根据所述次要告警信息获取所述次要告警的告警原因;处理策略获取模块,用于根据所述次要告警的告警原因获取所述次要告警的处理策略;自动处理模块,用于在获取所述次要告警的处理策略时,调用所述处理策略的处理脚本对所述次要告警进行自动处理;人工处理提醒模块,用于在无法获取所述次要告警的告警原因或处理策略时,查询所述次要告警对应的责任人,向所述责任人发送人工处理消息。本发明能提高处理次要告警的效率。

技术研发人员:王思文;张玮红
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:2019.12.30
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-59044.html

最新回复(0)