一种集群的日志采集方法、系统、设备以及介质与流程

专利2022-06-29  71


本发明涉及日志采集领域,具体涉及一种集群的日志采集方法、系统、设备以及存储介质。



背景技术:

容器技术是一种比虚拟机技术更加节省计算资源也更加灵活的虚拟化技术。随着容器技术的发展,出现了很多容器编排引擎,用于对容器进行管理,kubernetes技术脱颖而出成为了容器编排领域的事实标准。在将容器技术应用到实际生产环境中时,由于技术门槛的缘故,仅仅使用kubernetes进行应用系统部署显得比较困难,为此需要开发对kubernetes集群进行管理的软件系统。

日志作为应用的一个关键环节,尤其是在使用容器编排工具进行容器调度的动态环境下,程序的排错和健康状态的分析很多都依赖日志信息的收集。在容器平台这种动态的环境下,如何在应用的容器化过程中,方便快捷的自动发现和采集日志是将传统应用容器化部署的一个重要方面。

在管理kubernates集群的软件系统中,对所部署容器的标准日志的采集,是他们了解自己的系统运行状态与排除错误的一种手段,是系统管理中,必不可少的一部分。

目前的采集工具都需要事先手动配置好日志采集方式和路径等信息,由于它无法自动感知到容器的生命周期变化或者动态漂移,所以它无法动态地去配置。



技术实现要素:

有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种集群的日志采集方法,包括以下步骤:

注册事件监听并全量扫描;

利用所述事件监听获取的信息和所述全量扫描得到的信息生成容器列表;

根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器;

获取与所述进行日志采集的容器对应的采集参数;

利用所述采集参数生成采集配置文件;

将所述采集配置文件部署到采集工具中以进行日志采集。

在一些实施例中,利用所述事件监听获取的信息和扫描得到的信息生成容器列表,进一步包括:

接收每一个宿主机节点发送的容器事件的监听数据;

根据预设接口扫描并获取所有容器的信息;

根据所述监听数据和所述所有容器的信息生成容器列表。

在一些实施例中,获取与所述进行日志采集的容器对应的采集参数,进一步包括:

获取所述进行日志采集的容器的元数据信息;

获取所述进行日志采集的容器的环境变量中的日志路径。

在一些实施例中,利用所述采集参数生成采集配置文件,进一步包括:

利用所述元数据信息和所述日志路径生成所述采集配置文件;或,

利用所述元数据信息生成所述采集配置文件。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种集群的日志采集系统,包括:

采集模块,所述采集模块配置为注册事件监听并全量扫描;

第一生成模块,所述第一生成模块配置为利用所述事件监听获取的信息和所述全量扫描得到的信息生成容器列表;

识别模块,所述识别模块配置为根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器;

获取模块,所述获取模块配置为获取与所述进行日志采集的容器对应的采集参数;

第二生成模块,所述第二生成模块配置为利用所述采集参数生成采集配置文件;

部署模块,所述部署模块配置为将所述采集配置文件部署到采集工具中以进行日志采集。

在一些实施例中,所述第一生成模块还配置为:

接收每一个宿主机节点发送的容器事件的监听数据;

根据预设接口扫描并获取所有容器的信息;

根据所述监听数据和所述所有容器的信息生成容器列表。

在一些实施例中,所述获取模块还配置为:

获取所述进行日志采集的容器的元数据信息;

获取所述进行日志采集的容器的环境变量中的日志路径。

在一些实施例中,所述第二生成模块还配置为

利用所述元数据信息和所述日志路径生成所述采集配置文件;或,

利用所述元数据信息生成所述采集配置文件。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:

至少一个处理器;以及

存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如上所述的任一种集群的日志采集方法的步骤。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行如上所述的任一种集群的日志采集方法的步骤。

本发明具有以下有益技术效果之一:本发明提出的方案能够以最轻量级,最高效,声明式的配置进行容器日志的采集,解决了传统容器日志采集时的高冗余,高耗能,管理困难的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为本发明的实施例提供的集群的日志采集方法的流程示意图;

图2为本发明的实施例提供的集群的日志采集系统的结构示意图;

图3为本发明的实施例提供的计算机设备的结构示意图;

图4为本发明的实施例提供的计算机可读存储介质的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。

需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。

需要说明的是,在本发明的实施例中,集群可以是kubernetes集群或者其他集群。

根据本发明的一个方面,本发明的实施例提出一种集群的日志采集方法,如图1所示,其可以包括步骤:s1,注册事件监听并全量扫描;s2,利用所述事件监听获取的信息和所述全量扫描得到的信息生成容器列表;s3,根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器;s4,获取与所述进行日志采集的容器对应的采集参数;s5,利用所述采集参数生成采集配置文件;s6,将所述采集配置文件部署到采集工具中以进行日志采集。

本发明提出的方案能够以最轻量级,最高效,声明式的配置进行容器日志的采集,解决了传统容器日志采集时的高冗余,高耗能,管理困难的问题。

在一些实施例中,在步骤s1注册事件监听并全量扫描中,采用先注册事件监听后全量扫描的方式,可以很好地规避容器事件丢失的问题。

具体的,若采用先全量扫描后事件监听的方式,比如采集工具进程在开始运行的时候,会先去全量扫描一遍所有宿主机上的所有容器列表,然后依据容器的声明式配置来进行日志采集配置文件的动态生成,然后再注册事件监听,那么这样可能会导致一个问题,在全量扫描配置的过程中并且在注册事件监听之前,这个窗口期的容器事件就有可能会丢失,因此采用先注册事件监听,然后再全量扫描,这样就可以很好地规避容器事件丢失的问题。

在一些实施例中,利用所述事件监听获取的信息和扫描得到的信息生成容器列表,进一步包括:

接收每一个宿主机节点发送的容器事件的监听数据;

根据预设接口扫描并获取所有容器的信息;

根据所述监听数据和所述所有容器的信息生成容器列表。

具体的,在注册事件监听时,每台宿主机上都有docker服务在运行,docker提供了一个用来监听事件的api:/events,运行这个命令后,会监听dockerdaemon的事件并打印出来,监听是持续进行的,这个api会以数据流的形式将相应的信息返回。这样,通过持续接收数据流,然后判断流中的4种【action】:”start”、”restart”、”destory”、”die”,即可感知宿主机上容器的创建删除事件以及生命周期信息,进而可以动态配置容器日志采集配置文件。在一些实施例中,可以通过dockerapi:/containers/json接口,获取所有宿主局上正在运行的所有容器的列表。

在一些实施例中,事件监听可以预先在每一个宿主机上注册并运行,或者通过管理平台的指令进行事件监听的运行。

需要说明的是,全量扫描只能获取到正在运行的所有容器的信息,若存在容器处于创建期,则有可能全量扫描无法获取到该容器的信息,因此先进行事件监听,然后进行全量扫描,这样,只要有容器事件的发生均可进行记录,即便是全量扫描无法获取到的容器信息,也可以通过事件监听获取到。最后,对事件监听获取到的数据以及全量扫描获取的数据进行整合以生成容器列表,该容器列表可以在最大程度上保证不会遗漏容器。

在一些实施例中,全量扫描可以定期进行,例如可以每隔24小时进行扫描一次,这样可以进一步保证容器列表的准确性。

在一些实施例中,在生成容器列表后,可以进行步骤s3根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器。

具体的,在本发明的实施例中可以采用声明式日志采集配置,即通过配置容器的环境变量,识别需日志采集的容器。动态感知服务是针对所有容器进行的,因此要过滤出需要进行日志采集的容器,而侵入性最小,最轻量级的方式,便是给容器环境变量打上标识,在获取容器环境变量信息的同时,便可获知此容器是否进行日志采集。

例如,可以将需要采集的日志路径通过容器的环境变量的方式配置,环境变量的key以特定的前缀开始,该特定的前缀即为标识,而value则是日志路径。

在一些实施例中,步骤s4,获取与所述进行日志采集的容器对应的采集参数,进一步包括:

获取所述进行日志采集的容器的元数据信息;

获取所述进行日志采集的容器的环境变量中的日志路径。

具体的,采集容器日志的时候,可以同时收集容器的元数据信息,包括容器的名称,容器所属的服务名称以及容器所属的应用名称,同时在kubernetes里面也会采集容器所属的pod信息,包括pod的名称,pod所属的namespace以及pod所在的节点信息。这样,通过元数据信息可以确定日志对应的节点或应用(也即日志是哪个节点或应用生成的)。日志路径信息可以通过在环境变量中获取,例如环境变量的key表示标识,而value则是日志路径,获取到value对应的信息即可得到日志路径。

在一些实施例中,利用所述采集参数生成采集配置文件,进一步包括:

利用所述元数据信息和所述日志路径生成所述采集配置文件;或,

利用所述元数据信息生成所述采集配置文件。

具体的,容器日志可以分为标准输出日志和容器内文本日志,都可以根据dockerapi获取日志在宿主机中的路径,将路径配置到采集工具中,便可以进行动态采集。

需要说明的是,标准输出日志和容器内文本日志是两种不同类型的日志,其中若输出容器内文本日志,则需要获取value对应的信息(也即路径信息),若输出标准输出日志,则无需利用value对应的信息。

在一些实施例中,可以根据value对应的信息判断输出的日志的类型,即当value对应的信息为路径信息时,则说明该容器输出的日志的类型为容器内文本日志;当value对应的信息为其他预设的特定信息时,则说明该容器输出的日志的类型为标准输出日志,则按照标准输出日志的方式获取相应的日志。

在一些实施例中,当获取采集参数到后,则进行步骤s5和s6,即进行s5,利用所述采集参数生成采集配置文件以及s6,将所述采集配置文件部署到采集工具中以进行日志采集。

具体的,可以根据采集信息,生成采集配置文件,然后将采集配置文件热部署到filebeat采集工具中,以使filebeat采集工具根据采集配置文件进行采集。

本发明提出的方案可以使得集群管理软件能够以最轻量级,最高效,声明式的配置进行容器日志的采集,解决了传统容器日志采集时的高冗余,高耗能,管理困难的问题。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种集群的日志采集系统400,如图2所示,包括:

采集模块401,所述采集模块401配置为注册事件监听并全量扫描;

第一生成模块402,所述第一生成模块402配置为利用所述事件监听获取的信息和所述全量扫描得到的信息生成容器列表;

识别模块403,所述识别模块403配置为根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器;

获取模块404,所述获取模块404配置为获取与所述进行日志采集的容器对应的采集参数;

第二生成模块405,所述第二生成模块405配置为利用所述采集参数生成采集配置文件;

部署模块406,所述部署模块配置406为将所述采集配置文件部署到采集工具中以进行日志采集。

在一些实施例中,所述第一生成模块402还配置为:

接收每一个宿主机节点发送的容器事件的监听数据;

根据预设接口扫描并获取所有容器的信息;

根据所述监听数据和所述所有容器的信息生成容器列表。

在一些实施例中,所述获取模块404还配置为:

获取所述进行日志采集的容器的元数据信息;

获取所述进行日志采集的容器的环境变量中的日志路径。

在一些实施例中,所述第二生成模块405还配置为:

利用所述元数据信息和所述日志路径生成所述采集配置文件;或,

利用所述元数据信息生成所述采集配置文件。

基于同一发明构思,根据本发明的另一个方面,如图3所示,本发明的实施例还提供了一种计算机设备501,包括:

至少一个处理器520;以及

存储器510,存储器510存储有可在处理器上运行的计算机程序511,处理器520执行程序时执行如上的任一种集群的日志采集方法的步骤。

基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机可读存储介质601,计算机可读存储介质601存储有计算机程序指令610,计算机程序指令610被处理器执行时执行如上的任一种集群的日志采集方法的步骤。

最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(rom)或随机存储记忆体(ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。

此外,典型地,本发明实施例公开的装置、设备等可为各种电子终端设备,例如手机、个人数字助理(pda)、平板电脑(pad)、智能电视等,也可以是大型终端设备,如服务器等,因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。

此外,根据本发明实施例公开的方法还可以被实现为由cpu执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被cpu执行时,执行本发明实施例公开的方法中限定的上述功能。

此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。

此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦写可编程rom(eeprom)或快闪存储器。易失性存储器可以包括随机存取存储器(ram),该ram可以充当外部高速缓存存储器。作为例子而非限制性的,ram可以以多种形式获得,比如同步ram(dram)、动态ram(dram)、同步dram(sdram)、双数据速率sdram(ddrsdram)、增强sdram(esdram)、同步链路dram(sldram)、以及直接rambusram(drram)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。

结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里功能的下列部件来实现或执行:通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,dsp和微处理器的组合、多个微处理器、一个或多个微处理器结合dsp和/或任何其它这种配置。

结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在ram存储器、快闪存储器、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在asic中。asic可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。

在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、dsl或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。

以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。

应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。

上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。


技术特征:

1.一种集群的日志采集方法,其特征在于,包括以下步骤:

注册事件监听并全量扫描;

利用所述事件监听获取的信息和所述全量扫描得到的信息生成容器列表;

根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器;

获取与所述进行日志采集的容器对应的采集参数;

利用所述采集参数生成采集配置文件;

将所述采集配置文件部署到采集工具中以进行日志采集。

2.如权利要求1所述的方法,其特征在于,利用所述事件监听获取的信息和扫描得到的信息生成容器列表,进一步包括:

接收每一个宿主机节点发送的容器事件的监听数据;

根据预设接口扫描并获取所有容器的信息;

根据所述监听数据和所述所有容器的信息生成容器列表。

3.如权利要求1所述的方法,其特征在于,获取与所述进行日志采集的容器对应的采集参数,进一步包括:

获取所述进行日志采集的容器的元数据信息;

获取所述进行日志采集的容器的环境变量中的日志路径。

4.如权利要求3所述的方法,其特征在于,利用所述采集参数生成采集配置文件,进一步包括:

利用所述元数据信息和所述日志路径生成所述采集配置文件;或,

利用所述元数据信息生成所述采集配置文件。

5.一种集群的日志采集系统,其特征在于,包括:

采集模块,所述采集模块配置为注册事件监听并全量扫描;

第一生成模块,所述第一生成模块配置为利用所述事件监听获取的信息和所述全量扫描得到的信息生成容器列表;

识别模块,所述识别模块配置为根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器;

获取模块,所述获取模块配置为获取与所述进行日志采集的容器对应的采集参数;

第二生成模块,所述第二生成模块配置为利用所述采集参数生成采集配置文件;

部署模块,所述部署模块配置为将所述采集配置文件部署到采集工具中以进行日志采集。

6.如权利要求5所述的系统,其特征在于,所述第一生成模块还配置为:

接收每一个宿主机节点发送的容器事件的监听数据;

根据预设接口扫描并获取所有容器的信息;

根据所述监听数据和所述所有容器的信息生成容器列表。

7.如权利要求5所述的系统,其特征在于,所述获取模块还配置为:

获取所述进行日志采集的容器的元数据信息;

获取所述进行日志采集的容器的环境变量中的日志路径。

8.如权利要求7所述的系统,其特征在于,所述第二生成模块还配置为

利用所述元数据信息和所述日志路径生成所述采集配置文件;或,

利用所述元数据信息生成所述采集配置文件。

9.一种计算机设备,包括:

至少一个处理器;以及

存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如权利要求1-4任意一项所述的方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1-4任意一项所述的方法的步骤。

技术总结
本发明公开了一种集群的日志采集方法,包括以下步骤:注册事件监听并全量扫描;利用所述事件监听获取的信息和所述全量扫描得到的信息生成容器列表;根据所述容器列表中的每一个容器的环境变量的预设标识识别进行日志采集的容器;获取与所述进行日志采集的容器对应的采集参数;利用所述采集参数生成采集配置文件;将所述采集配置文件部署到采集工具中以进行日志采集。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案能够以最轻量级,最高效,声明式的配置进行容器日志的采集,解决了传统容器日志采集时的高冗余,高耗能,管理困难的问题。

技术研发人员:崔润兴
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:2020.02.14
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-28217.html

最新回复(0)