一种服务器的自适应配置方法、装置、设备及存储介质与流程

专利2022-06-29  70


本发明涉及服务器技术领域。本发明进一步涉及一种服务器的自适应配置方法、装置、设备及存储介质。



背景技术:

当前gpu(graphicsprocessingunit,图形处理器)在服务器领域大量应用,gpu专为执行复杂的数学和几何计算而设计,用于图形渲染。gpu削减了服务器对cpu(centralprocessingunit,中央处理器)的依赖,承担了部分原本是cpu的工作,尤其是gpu不再局限于3d图形处理。在浮点运算、并行计算等方面,gpu可以提供数十倍乃至于上百倍于cpu的性能。它可以大幅加速深度学习模型的训练,在相同精度下能提供更快的处理速度、更少的服务器投入以及更低的功耗。

多gpu使用离不开pcie(peripheralcomponentinterfaceexpress,总线和接口标准)switch(切换)的配合,基于pcieswitch扩展gpu的gpubox(gpu盒子)产品也是层出不穷,但当前市面产品配置比价单一,出厂后形态就是一个固定的形态,无法根据现场或者客户的实际需求进行灵活改配,要么硬件无法支持,要么必须升级固件才可以实现。

现有的技术方案主要有两种,其一是通过jtag(jointtestactiongroup,联合测试行动组)烧录器烧录对应fw(firmware,固件)进行pcieswitch参数调整;其二是更换部件,更换成与配置相同的硬件板卡。然而,这两种方式均存在一定的缺陷。其中方式一的可操作性不强,现场操作过于繁琐,需要运维人员到达现场,机箱下架,拆机进行更新,易出错,不利于板卡管控。方式二运营成本较高,需多套板卡支持客户的不同需求,根据客户需求进行板卡选配,或者改配。

因此,需要提出一种能够进行自适应配置切换技术,无需做板卡的更换、硬件的变更及固件烧录等,而是根据所搭配的硬件自动确定配置需求、加载相应的固件,从而使服务器实现自适应地进行配置。



技术实现要素:

一方面,本发明基于上述目的提出了一种服务器的自适应配置方法,其中该方法包括以下步骤:

识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个pcie槽位的端口;

使bmc读取各个pcie槽位的端口的类型标记以确定当前的配置需求;

使bmc将当前的配置需求发送至pcieswitch芯片;

使pcieswitch芯片根据当前的配置需求为各个接口加载相应的固件,以使各个接口的功能分别匹配于当前所连接的元件。

根据本发明的服务器的自适应配置方法的实施例,其中使bmc将当前的配置需求发送至pcieswitch芯片进一步包括:

bmc向pcieswitch芯片发送复用命令将pcieswitch芯片的jtag管脚复用为执行通用输入输出功能;

响应于接收到复用反馈,bmc通过复用的jtag管脚将当前的配置需求发送至pcieswitch芯片。

根据本发明的服务器的自适应配置方法的实施例,其中使bmc将当前的配置需求发送至pcieswitch芯片进一步包括:

bmc向pcieswitch芯片发送总线占用命令以通过twi总线建立与pcieswitch芯片的通信;

响应于接收到总线占用反馈,bmc通过twi总线将当前的配置需求发送至pcieswitch芯片。

根据本发明的服务器的自适应配置方法的实施例,其中识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个pcie槽位的端口进一步包括:

分别识别各个pcie槽位当前所连接的元件的类型;

根据元件的类型确定相应的类型标记;

将相应的类型标记写入各个pcie槽位的端口中的配置文件和/或id类数据中。

另一方面,本发明还提出了一种服务器的自适应配置装置,其中该装置包括:

连接识别模块,该连接识别模块配置为识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个pcie槽位的端口;

配置确定模块,该配置确定模块配置为使bmc读取各个pcie槽位的端口的类型标记以确定当前的配置需求;

内部通信模块,该内部通信模块配置为使bmc将当前的配置需求发送至pcieswitch芯片;

固件加载模块,该固件加载模块配置为使pcieswitch芯片根据当前的配置需求为各个接口加载相应的固件,以使各个接口的功能分别匹配于当前所连接的元件。

根据本发明的服务器的自适应配置装置的实施例,其中内部通信模块进一步配置为:使bmc向pcieswitch芯片发送复用命令将pcieswitch芯片的jtag管脚复用为执行通用输入输出功能;响应于接收到复用反馈,bmc通过复用的jtag管脚将当前的配置需求发送至pcieswitch芯片。

根据本发明的服务器的自适应配置装置的实施例,其中内部通信模块进一步配置为:使bmc向pcieswitch芯片发送总线占用命令以通过twi总线建立与pcieswitch芯片的通信;响应于接收到总线占用反馈,bmc通过twi总线将当前的配置需求发送至pcieswitch芯片。

根据本发明的服务器的自适应配置装置的实施例,其中连接识别模块进一步配置为:分别识别各个pcie槽位当前所连接的元件的类型;根据元件的类型确定相应的类型标记;将相应的类型标记写入各个pcie槽位的端口中的配置文件和/或id类数据中。

又一方面,本发明还提出了一种设备,其中设备包括:

至少一个处理器;和

存储器,该存储器存储有处理器可运行的程序指令,该程序指令在被处理器运行时执行前述任一项的服务器的自适应配置方法的实施例的步骤。

此外,本发明还提出了一种存储介质,其中该存储介质存储有处理器可运行的程序指令,该程序指令在被处理器运行时执行前述任一项的服务器的自适应配置方法的实施例的步骤。

采用上述技术方案,本发明至少具有如下有益效果:基于bmc实现了配置切换技术,无需做板卡的更换、硬件的变更及固件烧录等,而是根据所搭配的硬件自动确定配置需求、加载相应的固件,所搭配硬件支持bmc访问pcieswitch芯片对pcieswitch参数进行调整,从而使服务器实现了自适应地进行配置。

本发明提供了实施例的各方面,不应当用于限制本发明的保护范围。根据在此描述的技术可设想到其它实施方式,这对于本领域普通技术人员来说在研究以下附图和具体实施方式后将是显而易见的,并且这些实施方式意图被包含在本申请的范围内。

下面参考附图更详细地解释和描述了本发明的实施例,但它们不应理解为对于本发明的限制。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对现有技术和实施例描述中所需要使用的附图作简单地介绍,附图中的部件不一定按比例绘制,并且可以省略相关的元件,或者在一些情况下比例可能已经被放大,以便强调和清楚地示出本文描述的新颖特征。另外,如本领域中已知的,结构顺序可以被不同地布置。

图1示出了根据本发明的服务器的自适应配置方法的实施例的示意性框图;

图2示出了根据本发明的服务器的自适应配置装置的实施例的示意图;

图3示出了根据本发明的服务器的自适应配置的实施例的单机头模式的示意图;

图4示出了根据本发明的服务器的自适应配置的实施例的双(多)机头模式的示意图。

具体实施方式

虽然本发明可以以各种形式实施,但是在附图中示出并且在下文中将描述一些示例性和非限制性实施例,但应该理解的是,本公开将被认为是本发明的示例并不意图将本发明限制于所说明的具体实施例。

在下文就本发明的实施例的说明中需要注意的是,其中提到的步骤的编号在没有特殊说明的情况下,仅用于便捷明确地指示该步骤,并不限定步骤的顺序。

图1示出了根据本发明的服务器的自适应配置方法的实施例的示意性框图。在如图1所示的实施例中,该方法至少包括以下步骤:

s1:识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个pcie槽位的端口;

s2:使bmc读取各个pcie槽位的端口的类型标记以确定当前的配置需求;

s3:使bmc将当前的配置需求发送至pcieswitch芯片;

s4:使pcieswitch芯片根据当前的配置需求为各个接口加载相应的固件,以使各个接口的功能分别匹配于当前所连接的元件。

为了实现本发明的服务器自适应配置的目的,首先,s1识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个pcie槽位的端口。也就是说,确定当前的硬件连接架构。然后s2中使bmc读取各个pcie槽位的端口的类型标记以确定当前的配置需求,即根据当前的硬件连接架构确定当前的配置需求。随后s3中使bmc将当前的配置需求发送至pcieswitch芯片,即bmc告知pcieswitch芯片当前的硬件连接架构对应的配置需求。最后,s4中使pcieswitch芯片根据当前的配置需求为各个接口加载相应的固件使各个接口的功能分别匹配于当前所连接的元件。也就是说,根据当前的硬件连接架构对应的配置需求从预置在系统中的固件中选择相应的固件以在各个接口中加载,实现接口的自适应配置,从而完成整个服务器的自适应配置。

在本发明的服务器的自适应配置方法的一些实施例中,s3使bmc将当前的配置需求发送至pcieswitch芯片进一步包括:

s311:bmc向pcieswitch芯片发送复用命令将pcieswitch芯片的jtag管脚复用为执行通用输入输出功能;

s312:响应于接收到复用反馈,bmc通过复用的jtag管脚将当前的配置需求发送至pcieswitch芯片。

bmc访问pcieswitch芯片告知其当前的配置需求时,一方面可以使用pcieswitch芯片的通用输入输出接口直接访问。为了不对pcieswitch芯片的管脚造成浪费,在本发明的实施例中采取复用jtag管脚的方式,将pcieswitch芯片的jtag管脚复用为执行通用输入输出功能。首先s311中bmc向pcieswitch芯片发送复用命令将pcieswitch芯片的jtag管脚复用为执行通用输入输出功能,优选地,bmc向jtag管脚的使能信号管脚发送相应的复用电平信号。随后,当bmc接收到复用设置完成的反馈时,s312中bmc通过复用的jtag管脚将当前的配置需求发送至pcieswitch芯片。

在本发明的服务器的自适应配置方法的一些实施例中,s3使bmc将当前的配置需求发送至pcieswitch芯片进一步包括:

s321:bmc向pcieswitch芯片发送总线占用命令以通过twi总线建立与pcieswitch芯片的通信;

s322:响应于接收到总线占用反馈,bmc通过twi总线将当前的配置需求发送至pcieswitch芯片。

bmc访问pcieswitch芯片告知其当前的配置需求的另一方面是通过总线建立与pcieswitch芯片的通信,从而告知pcieswitch芯片当前的配置需求。其中,s321中bmc向pcieswitch芯片发送总线占用命令以通过twi总线建立与pcieswitch芯片的通信。当bmc接收到总线占用反馈,即通信渠道已经建立后,s322中bmc通过twi(两线串行通信协议,two-wireserialinterface)总线将当前的配置需求发送至pcieswitch芯片。

在本发明的服务器的自适应配置方法的一些实施例中,s1识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个pcie槽位的端口进一步包括:

s11:分别识别各个pcie槽位当前所连接的元件的类型;

s12:根据元件的类型确定相应的类型标记;

s13:将相应的类型标记写入各个pcie槽位的端口中的配置文件和/或id类数据中。

硬件连接完成后,gpubox上电,此时s11会分别识别各个pcie槽位当前所连接的元件的类型,例如cpu(机头)、网卡、硬盘(nvme)等等。识别到元件的类型后,s12会根据所识别的元件的类型确定相应的类型标记。由于不同类型的元件与pcie槽位相连接后为了正常使用需要在pcie槽位的接口进行相应的配置,例如配置id类数据标识和/或配置文件。因此,s13将相应的类型标记写入各个pcie槽位的端口中的配置文件和/或id类数据中,以备随后bmc读取。

另一方面,本发明还提出了一种服务器的自适应配置装置。图2示出了根据本发明的服务器的自适应配置装置的实施例的示意图,在所示的实施例中该装置100至少包括:

连接识别模块m10,该连接识别模块m10配置为识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个pcie槽位的端口;

配置确定模块m20,该配置确定模块m20配置为使bmc读取各个pcie槽位的端口的类型标记以确定当前的配置需求;

内部通信模块m30,该内部通信模块m30配置为使bmc将当前的配置需求发送至pcieswitch芯片;

固件加载模块m40,该固件加载模块m40配置为使pcieswitch芯片根据当前的配置需求为各个接口加载相应的固件,以使各个接口的功能分别匹配于当前所连接的元件。

在本发明的服务器的自适应配置装置100的一些实施例中,内部通信模块m30进一步配置为:使bmc向pcieswitch芯片发送复用命令将pcieswitch芯片的jtag管脚复用为执行通用输入输出功能;响应于接收到复用反馈,bmc通过复用的jtag管脚将当前的配置需求发送至pcieswitch芯片。

在本发明的服务器的自适应配置装置100的一些实施例中,内部通信模块m30进一步配置为:使bmc向pcieswitch芯片发送总线占用命令以通过twi总线建立与pcieswitch芯片的通信;响应于接收到总线占用反馈,bmc通过twi总线将当前的配置需求发送至pcieswitch芯片。

在本发明的服务器的自适应配置装置100的一些实施例中,连接识别模块m10进一步配置为:分别识别各个pcie槽位当前所连接的元件的类型;根据元件的类型确定相应的类型标记;将相应的类型标记写入各个pcie槽位的端口中的配置文件和/或id类数据中。

下面基于图3和图4进一步举例说明根据本发明的自适应配置。在如图3、4所示的服务器cpu、gpu系统中,以可实现4个上行(即单机头)与8个上行(双机头,机头a 机头b)两种配置为例,分别对应图3和图4。图3为单个机头、gpubox4个上行的配置,此时空闲的pcieslot可以连接其它元件,例如但不限于网卡、nvme或者nvme的池化等。图4为双机头、gpubox8个上行的配置,预留的pcieslot分别连接至两个机头。pcieswitch支持通过twi总线或预留连接至bmc的jtag总线进行参数配置或通信等。此外,pcieswitch芯片的fw不需要现场升级或者进行重新烧录,所有可能需要的fw已经预置在芯片中,仅需通过bmc告知pcieswitch需要加载的不同fw,就可以实现改配,可大大节省运维成本。

又一方面,本发明还提出了一种设备,其中设备包括:至少一个处理器;和存储器,该存储器存储有处理器可运行的程序指令,该程序指令在被处理器运行时执行前述任一项的服务器的自适应配置方法的实施例的步骤。

此外,本发明还提出了一种存储介质,其中该存储介质存储有处理器可运行的程序指令,该程序指令在被处理器运行时执行前述任一项的服务器的自适应配置方法的实施例的步骤。

本发明实施例公开所述的装置、设备等可为各种电子终端设备,例如手机、个人数字助理(pda)、平板电脑(pad)、智能电视等,也可以是大型终端设备,如服务器等,因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开所述的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。

本文所述的计算机可读存储介质(例如存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦写可编程rom(eeprom)或快闪存储器。易失性存储器可以包括随机存取存储器(ram),该ram可以充当外部高速缓存存储器。作为例子而非限制性的,ram可以以多种形式获得,比如同步ram(dram)、动态ram(dram)、同步dram(sdram)、双数据速率sdram(ddrsdram)、增强sdram(esdram)、同步链路dram(sldram)、以及直接rambusram(drram)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。

采用上述技术方案,本发明至少具有如下有益效果:基于bmc实现了配置切换技术,无需做板卡的更换、硬件的变更及固件烧录等,而是根据所搭配的硬件自动确定配置需求、加载相应的固件,所搭配硬件支持bmc访问pcieswitch芯片对pcieswitch参数进行调整,从而使服务器实现了自适应地进行配置。

应当理解的是,在技术上可行的情况下,以上针对不同实施例所列举的技术特征可以相互组合,从而形成本发明范围内的另外实施例。此外,本文所述的特定示例和实施例是非限制性的,并且可以对以上所阐述的结构、步骤及顺序做出相应修改而不脱离本发明的保护范围。

在本申请中,反意连接词的使用旨在包括连接词。定或不定冠词的使用并不旨在指示基数。具体而言,对“该”对象或“一”和“一个”对象的引用旨在表示多个这样对象中可能的一个。然而,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。此外,可以使用连接词“或”来传达同时存在的特征,而不是互斥方案。换句话说,连接词“或”应理解为包括“和/或”。术语“包括”是包容性的并且具有与“包含”相同的范围。

上述实施例,特别是任何“优选”实施例是实施方式的可能示例,并且仅仅为了清楚理解本发明的原理而提出。在基本上不脱离本文描述的技术的精神和原理的情况下,可以对上述实施例做出许多变化和修改。所有修改旨在被包括在本公开的范围内。


技术特征:

1.一种服务器的自适应配置方法,其特征在于,所述方法包括以下步骤:

识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入所述各个pcie槽位的端口;

使bmc读取所述各个pcie槽位的端口的所述类型标记以确定当前的配置需求;

使所述bmc将所述当前的配置需求发送至pcieswitch芯片;

使所述pcieswitch芯片根据所述当前的配置需求为各个接口加载相应的固件,以使所述各个接口的功能分别匹配于所述当前所连接的元件。

2.根据权利要求1所述的方法,其特征在于,使所述bmc将所述当前的配置需求发送至pcieswitch芯片进一步包括:

所述bmc向所述pcieswitch芯片发送复用命令将所述pcieswitch芯片的jtag管脚复用为执行通用输入输出功能;

响应于接收到复用反馈,所述bmc通过所述复用的jtag管脚将所述当前的配置需求发送至所述pcieswitch芯片。

3.根据权利要求1所述的方法,其特征在于,使所述bmc将所述当前的配置需求发送至pcieswitch芯片进一步包括:

所述bmc向所述pcieswitch芯片发送总线占用命令以通过twi总线建立与所述pcieswitch芯片的通信;

响应于接收到总线占用反馈,所述bmc通过twi总线将所述当前的配置需求发送至所述pcieswitch芯片。

4.根据权利要求1所述的方法,其特征在于,所述识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入所述各个pcie槽位的端口进一步包括:

分别识别各个pcie槽位当前所连接的元件的类型;

根据所述元件的类型确定所述相应的类型标记;

将所述相应的类型标记写入所述各个pcie槽位的端口中的配置文件和/或id类数据中。

5.一种服务器的自适应配置装置,其特征在于,所述装置包括:

连接识别模块,所述连接识别模块配置为识别各个pcie槽位当前所连接的元件的类型,并将相应的类型标记分别写入所述各个pcie槽位的端口;

配置确定模块,所述配置确定模块配置为使bmc读取所述各个pcie槽位的端口的所述类型标记以确定当前的配置需求;

内部通信模块,所述内部通信模块配置为使所述bmc将所述当前的配置需求发送至pcieswitch芯片;

固件加载模块,所述固件加载模块配置为使所述pcieswitch芯片根据所述当前的配置需求为各个接口加载相应的固件,以使所述各个接口的功能分别匹配于所述当前所连接的元件。

6.根据权利要求5所述的装置,其特征在于,所述内部通信模块进一步配置为:使所述bmc向所述pcieswitch芯片发送复用命令将所述pcieswitch芯片的jtag管脚复用为执行通用输入输出功能;响应于接收到复用反馈,所述bmc通过所述复用的jtag管脚将所述当前的配置需求发送至所述pcieswitch芯片。

7.根据权利要求5所述的装置,其特征在于,所述内部通信模块进一步配置为:使所述bmc向所述pcieswitch芯片发送总线占用命令以通过twi总线建立与所述pcieswitch芯片的通信;响应于接收到总线占用反馈,所述bmc通过twi总线将所述当前的配置需求发送至所述pcieswitch芯片。

8.根据权利要求5所述的装置,其特征在于,所述连接识别模块进一步配置为:分别识别各个pcie槽位当前所连接的元件的类型;根据所述元件的类型确定所述相应的类型标记;将所述相应的类型标记写入所述各个pcie槽位的端口中的配置文件和/或id类数据中。

9.一种设备,其特征在于,所述设备包括:

至少一个处理器;和

存储器,所述存储器存储有处理器可运行的程序指令,所述程序指令在被处理器运行时执行前述权利要求1至4所述的服务器的自适应配置方法的步骤。

10.一种存储介质,其特征在于,所述存储介质存储有处理器可运行的程序指令,所述程序指令在被处理器运行时执行前述权利要求1至4所述的服务器的自适应配置方法的步骤。

技术总结
本发明涉及了一种服务器的自适应配置方法、装置、设备及存储介质,其中方法包括:识别各个PCIE槽位当前所连接的元件的类型,并将相应的类型标记分别写入各个PCIE槽位的端口;使BMC读取各个PCIE槽位的端口的类型标记以确定当前的配置需求;使BMC将当前的配置需求发送至PCIE Switch芯片;使PCIE Switch芯片根据当前的配置需求为各个接口加载相应的固件,以使各个接口的功能分别匹配于当前所连接的元件。本发明的实施例基于BMC实现了配置切换技术,无需做板卡的更换、硬件的变更及固件烧录等,而是根据所搭配的硬件自动确定配置需求、加载相应的固件,所搭配硬件支持BMC访问PCIE Switch芯片对PCIE Switch参数进行调整,从而使服务器实现了自适应地进行配置。

技术研发人员:赵伟涛
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:2020.02.05
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-28729.html

最新回复(0)