本发明属于服务器技术领域,具体涉及一种服务器主板防烧系统及方法。
背景技术:
服务器运行过程中,由于板卡设计及运行环境的因素,会导致服务器存在短路、器件损坏及温度过高等情况,当多种异常情况发生时,会引起板卡的烧毁。服务器运行过程中出现板卡烧毁现象时,一方面会造成运行服务的中断,另一方面,板卡烧毁引起的火灾对机房的安全造成一定的隐患。
由于烧板现象是随机的,且发生之后板卡已被损坏,对问题分析造成了极大的困难。因此,在板卡出现短路等异常状态时,板卡设计时通过实时地电流监控,并及时地采取措施,保证在板卡烧毁之前中断通电线路,从而保证板卡处于断路状态,从而保证板卡的安全。
现有的服务器主板设计中,通过会使用bmc、cpld和监控芯片的组合设计进行板卡的监控及保护设计。功耗监控芯片监测psu输出的12v是否出现过流问题,当出现过流时,功耗监控芯片拉高shutdown信号,通过cpld进行事件触发,bmc接受到alert_n信号后,通过i2c总线读取功耗监控芯片的日志信息,如确认存在过流现象,bmc通过i2c指令关闭功耗监控芯片,从而中断12v的后续输出。
现有的技术方案中,依靠bmc通过i2c进行切断功耗监控芯片的输出,从而实现板卡的防烧板设计。但是,当bmc工作异常时,cpld触发中断后,bmc不能正常中断功耗监控芯片,从而使主板仍然存在烧板的可能。
技术实现要素:
针对现有技术的上述不足,本发明提供一种服务器主板防烧系统及方法,以解决上述技术问题。
本发明提供一种服务器主板防烧系统,所述系统包括:
cpld,所述cpld与bmc通信连接,所述cpld的输入端连接功耗监控芯片的信号输出端,所述cpld的输出端连接功耗监控芯片的功耗阈值设定管脚;
所述bmc连接功耗监控芯片;
所述功耗监控芯片连接主板的电源。
进一步的,所述bmc通过i2c总线连接功耗监控芯片。
进一步的,所述主板包括多个电源,每个电源均连接一个功耗监控芯片。
本发明还提供一种服务器主板防烧方法,所述方法包括:
所述cpld确认bmc故障;
所述cpld根据接收的功耗监控芯片的异常中断信号拉低功耗阈值控制信号;
所述cpld将低位功耗阈值控制信号发送至功耗监控芯片的功耗阈值设定管脚,控制功耗监控芯片切断电源输出。
进一步的,所述cpld确认bmc异常,包括:
所述cpld接收bmc发送的喂狗信号并监控所述喂狗信号状态;
若所述喂狗信号为方波,则所述cpld判定bmc正常;
若所述喂狗信号的电平持续不变,则所述cpld判定bmc故障。
进一步的,所述方法还包括:
所述cpld从接收到功耗监控芯片发送的异常中断信号开始计时;
所述cpld判断在预设等待时间内接收的异常中断信号是否消除:
若是,则判定为干扰因素;
若否,则将发送至功耗监控芯片的功耗阈值控制信号拉低。
进一步的,所述方法还包括:
所述cpld接收到所述异常中断信号后生成异常事件;
所述cpld将所述异常事件存储至ufm;
所述cpld在服务器重启后读取所述ufm的异常事件并将所述异常事件发生至bmc。
进一步的,所述方法还包括:
所述cpld确认bmc正常;
所述cpld根据所述异常中断信号向所述bmc发送异常事件信号,控制所述bmc通过i2c总线向功耗监控芯片发送电源切断指令。
本发明的有益效果在于,
本发明提供的服务器主板防烧系统及方法,通过令cpld的输出端连接功耗监控芯片的功耗阈值设定管脚,在bmc故障后,cpld立即根据功耗监控芯片发送的异常中断信号将向功耗监控芯片发送的功耗阈值控制信号拉低,从而控制功耗监控芯片切断电源的输出。本发明能够解决bmc在不工作的情况下,当出现板卡过流等异常情况时,可以对板卡进行下电保护,提高了板卡过流保护的安全性,同时cpld能够在bmc故障的情况下记录异常数据,保证断电数据不丢失,从而能够快速定位问题原因。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例的系统的结构示意图。
图2是本申请一个实施例的方法的示例性流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
下面将参考附图并结合实施例来详细说明本发明。
实施例1
参考图1,本实施例提供一种服务器主板防烧系统,所述系统包括以下部件和连接关系:
cpld与bmc通信连接,此外,cpld与功耗监控芯片形成一个连接回路,具体为:cpld的输入端连接功耗监控芯片的信号输出端,cpld的输出端连接功耗监控芯片的功耗阈值设定管脚。bmc连接功耗监控芯片,功耗监控芯片连接主板的电源。
实施例2
本实施例提供一种服务器主板防烧系统,所述系统包括以下部件和连接关系:
本实施例服务器有三个接入电源,每个电源均连接一个功耗监控芯片(max34411芯片),因此本实施例有三个功耗监控芯片。三个功耗监控芯片与cpld和bmc的连接关系都是相同的,具体连接关系如下:
cpld与bmc通信连接,此外,cpld与功耗监控芯片形成一个连接回路,具体为:cpld的输入端连接功耗监控芯片的信号输出端,cpld的输出端连接功耗监控芯片的功耗阈值设定管脚。bmc通过i2c总线连接功耗监控芯片的i2c管脚。
实施例3
本实施例提供一种服务器主板防烧方法,所述方法包括以下步骤:
s1、cpld确认bmc故障;
s2、cpld根据接收的功耗监控芯片的异常中断信号拉低功耗阈值控制信号;
s3、cpld将低位功耗阈值控制信号发送至功耗监控芯片的功耗阈值设定管脚,控制功耗监控芯片切断电源输出。
实施例4
参考图2,本实施例提供一种服务器主板防烧方法,所述方法包括以下步骤:
cpld通过看门狗信号(wdt)监控bmc的工作状态,当wdt为方波信号时,表示bmc正常工作;当wdt持续高电平或者持续低电平时,表示bmc工作异常。
bmc工作正常阶段,cpld关闭防烧板功能,在出现电源过流时,由bmc控制功耗监控芯片切断电源输出。
bmc工作异常时,cpld通过功耗阈值控制信号实现防烧板功能,具体过程为:
cpld通过逻辑设计控制功耗控制信号,当板卡功耗正常时,cpld输出高电平,将功耗监控芯片的功耗值设定为800w,此时电源可以输出电流。
cpld可以监控max34411的异常中断(shutdown)信号,当max34411出现异常中断时,cpld延时确认异常情况,避免由于信号干扰引起的误触发。其中延时确认异常情况的过程为:当出现异常中断时,cpld持续监测50ms,避免由于干扰等因素导致的系统误触发。若50ms后仍然存在异常中断,则cpld判定电源出现过流情况,需要启动防烧控制。
cpld确认电源出现过流情况后,将异常事件记录到ufm内部,同时,cpld向功耗监控芯片的功耗阈值设定管脚输出低电平功耗阈值控制信号,从而将功耗监控芯片的功耗阈值设定为0w,此时功耗监控芯片实际监测功耗大于功耗设定值,从而会自动切断电源输出,从而保证板卡不被烧毁。
服务器再次上电启动后,cpld读取ufm存储的异常事件数据并将读取的异常事件数据发送至bmc,从而定位问题原因。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
1.一种服务器主板防烧系统,其特征在于,所述系统包括:
cpld,所述cpld与bmc通信连接,所述cpld的输入端连接功耗监控芯片的信号输出端,所述cpld的输出端连接功耗监控芯片的功耗阈值设定管脚;
所述bmc连接功耗监控芯片;
所述功耗监控芯片连接主板的电源。
2.根据权利要求1所述的系统,其特征在于,所述bmc通过i2c总线连接功耗监控芯片。
3.根据权利要求1所述的系统,其特征在于,所述主板包括多个电源,每个电源均连接一个功耗监控芯片。
4.一种服务器主板防烧方法,其特征在于,所述方法包括:
所述cpld确认bmc故障;
所述cpld根据接收的功耗监控芯片的异常中断信号拉低功耗阈值控制信号;
所述cpld将低位功耗阈值控制信号发送至功耗监控芯片的功耗阈值设定管脚,控制功耗监控芯片切断电源输出。
5.根据权利要求4所述的方法,其特征在于,所述cpld确认bmc异常,包括:
所述cpld接收bmc发送的喂狗信号并监控所述喂狗信号状态;
若所述喂狗信号为方波,则所述cpld判定bmc正常;
若所述喂狗信号的电平持续不变,则所述cpld判定bmc故障。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述cpld从接收到功耗监控芯片发送的异常中断信号开始计时;
所述cpld判断在预设等待时间内接收的异常中断信号是否消除:
若是,则判定为干扰因素;
若否,则将发送至功耗监控芯片的功耗阈值控制信号拉低。
7.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述cpld接收到所述异常中断信号后生成异常事件;
所述cpld将所述异常事件存储至ufm;
所述cpld在服务器重启后读取所述ufm的异常事件并将所述异常事件发生至bmc。
8.根据权利要求5所述的方法,其特征在于,所述方法还包括:
所述cpld确认bmc正常;
所述cpld根据所述异常中断信号向所述bmc发送异常事件信号,控制所述bmc通过i2c总线向功耗监控芯片发送电源切断指令。
技术总结