一种PCIE卡异常恢复装置及PCIE卡、PCIE扩展系统的制作方法

专利2022-06-29  73


本实用新型涉及pcie卡控制技术领域,更具体地,涉及一种pcie卡异常恢复装置及pcie卡、pcie扩展系统。



背景技术:

pcie(peripheralcomponentinterconnectexpress,外部组件互联协议)总线作为一种高速串行计算机扩展总线,被广泛的应用在诸多领域,如存储、服务器等领域。基于pcie协议的各种pcie卡应用在存储设备或者服务器设备中,这些pcie卡被作为前端卡或者后端卡连接着硬盘和服务器,作为扩展卡被集成在主板上,或者以插卡的形式与主板进行连接。

现有的pcie卡一般包括处理器以及flash存储器,处理器可以是fpga(field-programmablegatearray,现场可编程门阵列)或者soc(systemonchip,片上系统)或者asic(applicationspecificintegratedcircuit,特殊应用集成电路)等,pcie卡的程序固化在pcie卡的flash存储器内部。在现有的带pcie卡的计算机系统中,在pcie卡正常工作时,计算机系统主板cpu(centralprocessingunit,中央处理器)可以通过pcie总线接口对pcie卡进行业务数据交互、flash程序升级等操作。但在pcie卡出现异常时,比如因flash存储器中的内容被异常改写、pcie程序异常运行、pcie接口时序异常等,会导致cpu无法与pcie卡进行通信,此时就必须掉电重启计算机,甚至需要从计算机机中取出pcie卡,人工进行故障恢复。

smbus(systemmanagementbus,系统管理总线)是pcie协议中的一个接口,pcie协议仅提供了该接口的物理定义,但未规定其用途。现有的pcie卡中,smbus通常仅用于温度、电压等参数的监控,不负责其他的工作。



技术实现要素:

本实用新型旨在克服上述现有技术的至少一种缺陷(不足),提供一种pcie卡异常恢复装置及pcie卡、pcie扩展系统,可以无需人工干预,使得异常的pcie卡自动恢复正常工作,提高系统的可靠性。

本实用新型采取的技术方案是:

一种pcie卡异常恢复装置,用于对与系统处理器连接的pcie卡进行异常恢复,所述pcie卡包括相互连接的存储器和第一处理器,所述第一处理器通过pcie接口与所述系统处理器连接,包括第二处理器,所述第二处理器设有第一接口、第二接口和smbus接口,所述第二处理器通过第一接口与所述存储器连接、通过第二接口与所述第一处理器连接、通过smbus接口与所述系统处理器连接。

当pcie卡出现异常时,系统处理器无法通过pcie接口与第一处理器进行业务数据交互或者对存储器所存储的程序进行升级。此时,系统处理器可以通过第二处理器的smbus接口发送恢复程序至第二处理器,第二处理器通过其第一接口将恢复程序写入存储器中或者替换存储器中异常的程序,然后第二处理器通过其第二接口触发第一处理器重新从存储器中读取恢复程序进行运行,由此可以自动完成pcie卡的异常恢复,无需人工干预,有效提升整个系统的可靠性。

进一步地,所述第二处理器还设有第三接口,所述第二处理器通过第三接口与所述第一处理器连接。

当系统处理器无法通过pcie接口与第一处理器通信时,第二处理器通过其第三接口读取第一处理器的状态信息,并通过smbus接口将状态信息反馈给系统处理器。系统处理器可以通过接收到的第一处理器的状态信息判断pcie卡的异常类型,并根据判断结果配合第二处理器进行相应的恢复操作。

当系统处理器检测到无法通过pcie接口与pcie卡进行通信时,还可以通过第二处理器的smbus接口触发第二处理器通过第三接口读取第一处理器的状态信息。

进一步地,所述pcie卡还设有用于监控所述pcie卡运行并输出运行参数的监控模块,所述第二处理器还通过smbus接口与所述监控模块连接。

监控模块可以监控pcie卡的运行温度、当前电流大小或电压大小等运行情况并输出相应的运行参数,第二处理器可以将监控模块输出的运行参数通过其smbus接口转发至系统处理器,让系统处理器可以更好地运维pcie卡。

进一步地,所述第一接口为cfi接口。

进一步地,所述第二接口为cfg接口。

进一步地,所述第三接口为spi接口。

一种pcie卡,包括存储器、第一处理器和如上所述的pcie卡异常恢复装置。

一种pcie扩展系统,包括系统处理器和如上所述的pcie卡。

与现有技术相比,本实用新型的有益效果为:通过第二处理器分别与第一处理器、系统处理器之间的连接,在pcie卡出现异常时,可以无需人工干预,自动实现pcie卡的异常恢复,使得整个系统的可靠性得到有效提升;而且可以使得系统处理器能快速判断pcie卡具体的异常类型,为系统运维提供有利信息。

附图说明

图1为本实用新型实施例的硬件架构框图。

具体实施方式

本实用新型附图仅用于示例性说明,不能理解为对本实用新型的限制。为了更好说明以下实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。

如图1所示,本实施例提供一种pcie卡异常恢复装置,用于对与系统处理器20连接的pcie卡10进行异常恢复。

pcie卡10包括相互连接的第一处理器11和存储器12,存储器12用于存储程序,第一处理器11可以对存储器12所存储的程序进行读写和运行;第一处理器11通过pcie接口与系统处理器20连接,第一处理器11可以通过pcie接口与系统处理器20通信。

所述pcie卡异常恢复装置包括第二处理器13,第二处理器13设有第一接口、第二接口和smbus接口;第二处理器13通过第一接口与存储器12连接、通过第二接口与第一处理器11连接、通过smbus接口与系统处理器20连接。

在pcie卡10上,第一处理器11是主器件,负责主要的业务数据处理,并且通过pcie接口与系统处理器20进行业务数据交互,第一处理器11可以是fpga或soc或asic等。存储器12可以是flash存储器,存储了第一处理器11需要运行的程序。第一处理器11可以通过cfi接口(commonflashinterface,通用闪存接口)从存储器12中读取程序进行运行,也可以通过cfi接口对存储器12存储的程序进行升级。

若本实施例应用在计算机系统中,则系统处理器20为计算机系统中的cpu。

在正常情况下,系统处理器20可以通过pcie接口与第一处理器11进行业务数据交互、控制存储器12中的程序升级等。

而当pcie卡10出现异常时,比如存储器12中的程序被异常改写,或者第一处理器11运行程序时发生异常,或者pcie接口时序异常等,会导致系统处理器20无法通过pcie接口与pcie卡10进行通信。此时,系统处理器20可以通过第二处理器13的smbus接口发送恢复程序至第二处理器13,第二处理器13通过其第一接口将恢复程序写入存储器12中或者替换存储器12中异常的程序,然后第二处理器13通过其第二接口触发第一处理器11重新从存储器12中读取恢复程序进行运行,由此完成pcie卡10的异常恢复。

在具体实施过程中,第二处理器13可以是mcu(microcontrollerunit,微控制单元)。

在具体实施过程中,第二处理器13可以集成在pcie卡10上,也可以设置在pcie卡10外。

通过第二处理器13及其连接接口的设置,并结合系统处理器20,可以自动实现pcie卡10的异常恢复,无需人工干预,有效提升整个系统的可靠性。

在一个实施例中,第二处理器13还设有第三接口,第二处理器13通过第三接口与第一处理器11连接。

当系统处理器20无法通过pcie接口与第一处理器11通信时,第二处理器13通过其第三接口读取第一处理器11的状态信息,如第一处理器11内部的寄存器信息等,并通过其smbus接口将状态信息反馈给系统处理器20,系统处理器20可以根据第二处理器13反馈回来的第一处理器11的状态信息,判断具体pcie卡10的异常情况。

如果第二处理器13能通过其第三接口读取到第一处理器11的状态信息,也即系统处理器20能通过第二处理器的smbus接口接收到第二处理器13反馈的第一处理器11的状态信息,则系统处理器20可以根据第一处理器11反馈的状态信息判断出第一处理器11的异常类型,根据异常类型可以有针对性地配合第二处理器13对第一处理器11进行异常恢复操作,发送相应的恢复程序至第二处理器13。

如果第二处理器13不能通过其第三接口读取到第一处理器11的状态信息,也即系统处理器20不能通过第二处理器的smbus接口接收到第二处理器13反馈的第一处理器11的状态信息,则系统处理器20可以判断第一处理器11整体失效了。

因此,无论第二处理器13能否通过其第三接口读取到第一处理器11的状态信息,第二处理器13都可以获取到有利于判断pcie卡10的异常类型的信息反馈给系统处理器20。

第二处理器13还可以通过smbus接口接收系统处理器20发送的异常类型请求,根据接收到的所述异常类型请求触发通过第三接口读取所述第一处理器11的状态信息。

当系统处理器20检测到无法通过pcie接口与pcie卡10进行通信时,可以通过第二处理器13的smbus接口将异常类型请求发送至第二处理器13,第二处理器13根据接收到的异常类型请求,通过第三接口读取第一处理器11的状态信息。

在一个实施例中,第一接口可以为cfi接口(commonflashinterface,通用闪存接口),第二接口可以为cfg接口(configuration,配置接口),第三接口可以为spi接口(serialperipheralinterface,串行外设接口)。

在一个实施例中,pcie卡10还设有用于监控pcie卡10运行并输出运行参数的监控模块14;第二处理器13通过smbus接口与监控模块14连接。

监控模块14可以监控pcie卡10的运行温度、当前电流大小或电压大小等运行情况并输出相应的运行参数,第二处理器13可以将监控模块14输出的运行参数通过smbus接口转发至系统处理器20,让系统处理器20可以更好地运维pcie卡10。

在另一个实施例中,监控模块14也可以直接通过smbus接口与系统处理器20连接,将运行参数发送至系统处理器20。

具体实施过程可以是:当系统处理器检测到无法通过pcie接口与pcie卡进行通信时,系统处理器通过第二处理器的smbus接口向第二处理器发送异常类型请求;第二处理器接收到系统处理器发送的异常类型请求后,通过其第三接口读取第一处理器的状态信息,并通过其smbus接口将第一处理器的状态信息反馈给系统处理器;系统处理器根据第一处理器的状态信息判断pcie卡的异常情况,通过第二处理器的smbus接口向第二处理器发送恢复程序;第二处理器接收到系统处理器发送的恢复程序后,通过其第一接口将恢复程序写入存储器中或者替换存储器中异常的程序,并且通过其第二接口触发第一处理器重新从存储器中读取恢复程序进行运行,从而完成pcie卡的异常恢复。

本实施例还提供一种pcie卡,包括存储器、第一处理器和如上所述的pcie卡异常恢复装置。

本实施例还提供一种pcie扩展系统,包括系统处理器20和如上所述的pcie卡。

显然,本实用新型的上述实施例仅仅是为清楚地说明本实用新型技术方案所作的举例,而并非是对本实用新型的具体实施方式的限定。凡在本实用新型权利要求书的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本实用新型权利要求的保护范围之内。


技术特征:

1.一种pcie卡异常恢复装置,用于对与系统处理器连接的pcie卡进行异常恢复,所述pcie卡包括相互连接的存储器和第一处理器,所述第一处理器通过pcie接口与所述系统处理器连接,其特征在于,包括第二处理器,所述第二处理器设有第一接口、第二接口和smbus接口,所述第二处理器通过第一接口与所述存储器连接、通过第二接口与所述第一处理器连接、通过smbus接口与所述系统处理器连接。

2.根据权利要求1所述的一种pcie卡异常恢复装置,其特征在于,所述第二处理器还设有第三接口,所述第二处理器通过第三接口与所述第一处理器连接。

3.根据权利要求1或2所述的一种pcie卡异常恢复装置,其特征在于,所述pcie卡还设有用于监控所述pcie卡运行并输出运行参数的监控模块,所述第二处理器还通过smbus接口与所述监控模块连接。

4.根据权利要求1所述的一种pcie卡异常恢复装置,其特征在于,所述第一接口为cfi接口。

5.根据权利要求1所述的一种pcie卡异常恢复装置,其特征在于,所述第二接口为cfg接口。

6.根据权利要求2所述的一种pcie卡异常恢复装置,其特征在于,所述第三接口为spi接口。

7.一种pcie卡,其特征在于,包括相互连接的存储器和第一处理器,还包括如权利要求1至6任一项所述的pcie卡异常恢复装置。

8.一种pcie扩展系统,其特征在于,包括系统处理器和如权利要求7所述的pcie卡。

技术总结
本实用新型涉及一种PCIE卡异常恢复装置及PCIE卡、PCIE扩展系统,用于对与系统处理器连接的PCIE卡进行异常恢复,所述PCIE卡包括相互连接的存储器和第一处理器,所述第一处理器通过PCIE接口与所述系统处理器连接,其中装置包括第二处理器,所述第二处理器设有第一接口、第二接口和SMBUS接口,所述第二处理器通过第一接口与所述存储器连接、通过第二接口与所述第一处理器连接、通过SMBUS接口与所述系统处理器连接。本实用新型可以无需人工干预,使得异常的PCIE卡自动恢复正常工作,提高系统的可靠性。

技术研发人员:冼启源;张东闯;颜然;余叶超
受保护的技术使用者:京信通信系统(中国)有限公司
技术研发日:2019.09.23
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-36432.html

最新回复(0)