本发明涉及存储设备扩展,具体涉及存储设备外插卡的降带宽修复方法及系统。
背景技术:
1、在大数据时代,对存储阵列可靠性、高性能提出更高要求,尤其是在高端存储设备中,要求存储设备的读写速率、每秒进行读写操作的次数均达到高基线标准,如高端存储要求每秒进行读写操作的次数100w以上,终端存储要求每秒进行读写操作的次数40w以上,并且能够以该速率进行持续的数据读写工作,以应对当前互联网公司数据量级逐渐提升的需求。为此,存储设备的中央处理器不断更新换代,中央处理器的带宽资源不断翻倍、提升,存储设备支持的外插卡数量由之前的2张/控,逐渐提升到14张/控,且支持的外插卡也由之前的16gb pcie3.0外插卡,升级到pcie 4.0 32g、64g、100g外插卡等,这些硬件上的升级能保证存储设备整机每秒进行读写操作的次数达到更高的要求。
2、然而,在硬件升级整机每秒进行读写操作的次数提升的同时,系统的性能会相对不稳定,尤其是传输高速信号的外插卡单元,随着传输速率的提升,概率性的会出现外插卡降带宽、降速率的问题,可能由之前的x8带宽降为x4,传输速率瞬间降为之前的50%,在整个存储系统中,各个模块是协同工作的,当一个模块突然出现性能异常会影响到其他模块,从而造成存储设备整机的运行不稳定,严重时甚至出现系统宕机问题。
3、鉴于此,需要解决上述外插卡的降带宽带来的性能降低问题。
技术实现思路
1、有鉴于此,本发明提供了一种存储设备外插卡的降带宽修复方法及系统,以解决存储设备正常运行过程中外插卡的高速链路降带宽带来的性能降低问题。
2、第一方面,本发明提供了一种存储设备外插卡的降带宽修复方法,方法包括:获取主控中央处理器以及对控中央处理器的数据处理速率,以确定数据处理速率是否异常;若数据处理速率异常,则获取存储设备中外插卡的状态信息;若状态信息表征外插卡的状态发生变化,则基于外插卡的当前业务量对外插卡进行业务量分配;基于业务量分配的结果,对主控中央处理器以及对控中央处理器进行带宽分配。
3、第二方面,本发明提供了一种存储设备外插卡的降带宽修复系统,系统包括:中央处理器监测单元,用于获取主控中央处理器以及对控中央处理器的数据处理速率,以确定数据处理速率是否异常;外插卡监测单元,用于若数据处理速率异常,则获取存储设备中外插卡的状态信息;逻辑处理单元,用于若状态信息表征外插卡的状态发生变化,则基于外插卡的当前业务量对外插卡进行业务量分配;基于业务量分配的结果,对主控中央处理器以及对控中央处理器进行带宽分配。
4、第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的数控机床的轴状态预测方法。
5、第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的数控机床的轴状态预测方法。
6、第五方面,本发明提供了一种计算机程序产品,包括计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的数控机床的轴状态预测方法。
7、本发明一个或者多个实施方式提供的技术方案,在硬件层面上包含了外插卡降带宽修复拓扑结构,在软件层面上包含了外插卡速率自恢复算法。其中硬件上的拓扑结构包含了外插卡监测单元、中央处理器状态监控单元、逻辑控制单元以及被监测及修复的对象外插卡与中央处理器,其中逻辑控制单元包括逻辑控制单元和基板管理控制器管理单元,外插卡监测单元会在硬件层面上实时监控外插卡的状态,同时在软件层面上读取当前业务数据业务量,中央处理器状态监控单元实时监控中央处理器当前直出的每一条带宽的状态信息,以及软件层面上每一部分带宽上的业务量;基板管理控制器与单元负责执行外插卡自恢复算法,通过软件算法对当前业务量、外插卡状态等信息进行具体分析,分析完成后执行前/后端修复策略;在软件上包含了外插卡速率自恢复算法流程,流程中还包含了外插卡端速率恢复算法以及中央处理器端带宽补齐算法,向较于以往的策略中发送复位信号,本发明从外插卡端与中央处理器端通过业务量转移、带宽均衡优化的方式在不影响业务的情况下进行修复,在中央处理器端根据各直连带宽上通过的数据量大小比较,进而对各模块对应带宽重新分配,逻辑上通过部分加压的方式达到二次分配的结果;在外插卡端结合当前业务量分析目前外插卡状态,若业务量高于当前阈值则逻辑上优先执行业务转移均分操作,若业务上低于当前阈值会通过基板管理控制器单元对外插卡各模块进行解耦,解耦后按模块顺序一一进行修复。
8、可见,本发明提供的技术方案,可以通过外插卡端、中央处理器端的协同修复策略,保证外插卡降带宽问题从根本上能够被解决,系统监测出存在降带宽可能性后就会执行外插卡速率自恢复算法,将隐患解决,同时对中央处理器端进行一个协同修复,保证外插卡降带宽问题修复完成后,中央处理器端不会产生性能问题,从而彻底解决了外插卡降带宽问题带来的影响,提高了存储设备的性能。
1.一种存储设备外插卡的降带宽修复方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述外插卡的当前业务量对所述外插卡进行业务量分配,包括:
3.根据权利要求2所述的方法,其特征在于,所述获取所述外插卡的业务阈值,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于比较结果对所述外插卡进行业务量分配,包括:
5.根据权利要求2所述的方法,其特征在于,所述基于比较结果对所述外插卡进行业务量分配,还包括:
6.根据权利要求2所述的方法,其特征在于,所述基于比较结果对所述外插卡进行业务量分配,还包括:
7.根据权利要求1所述的方法,其特征在于,所述基于所述业务量分配的结果,对所述主控中央处理器以及对控中央处理器进行带宽分配,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述性能预测结果对所述主控中央处理器以及对控中央处理器进行带宽分配,包括:
9.根据权利要求7所述的方法,其特征在于,所述基于所述性能预测结果对所述主控中央处理器以及对控中央处理器进行带宽分配,还包括:
10.一种存储设备外插卡的降带宽修复系统,其特征在于,所述系统包括:
