数据中心智能节能调控方法、装置、设备及存储介质

专利2023-04-08 16

1.本发明涉及云计算技术领域，尤其涉及一种数据中心智能节能调控方法、装置、设备及存储介质。

背景技术：

2.随着云计算和大数据产业的迅猛发展，作为其重要基础设施平台的数据中心在数量和规模上也在迅速增长；同时，数据中心带来的巨大能耗和环保压力也日益引起全世界的关注，因此，加强对数据中心能效指标的监测与评估，对数据中心用能方案进行优化，对于提高能源利用效率和减轻环保压力具有重要意义，在众多的数据中心能效评价指标中，现阶段使用较为广泛的是电能使用效率(power usage effectiveness，pue)。
3.现有的数据中心节能调控方法十分依赖人工经验进行调节，未充分利用数据之间关联关系，且调节后的pue很难达到最优值，造成了能源的浪费。

技术实现要素：

4.本发明的主要目的在于提供一种数据中心智能节能调控方法、装置、设备及存储介质，旨在解决现有技术中数据中心节能调控方法十分依赖人工经验进行调节，未充分利用数据之间关联关系，且调节后的pue很难达到最优值，造成了能源的浪费的技术问题。
5.第一方面，本发明提供一种数据中心智能节能调控方法，所述数据中心智能节能调控方法包括以下步骤：
6.利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；
7.根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；
8.根据所述最优行为策略对所述数据中心的能耗进行调控。
9.可选地，所述利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型，包括：
10.将数据中心基于电源使用效率pue值的历史数据进行空值数据消除和过精细化，获得历史调控数据，并获取自动机器学习auto ml模型的预设训练数据；
11.根据所述历史调控数据和所述预设训练数据构建参数训练模型；
12.根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型。
13.可选地，所述根据所述历史调控数据和所述预设训练数据构建参数训练模型，包括：
14.获取auto ml模型的算法集和所述数据中心的调节参数；
15.利用k折交叉验证将所述历史调控数据划分为k个训练集，利用k折交叉验证将所述预设训练数据划分为k个测试数据；
16.根据所述算法集、所述调节参数、所述k个训练集和所述k个测试数据通过下式构建参数训练模型：
[0017][0018]
其中，a＝{a
(1)
,
…
,a
(r)
}表示auto ml模型的算法集，其中的每个元素表示不同的分类算法，λ为数据中心的调节参数，为所述历史调控数据通过k折交叉验证划分为的k个训练数据集，为所述预设训练数据通过k折交叉验证划分为的k个测试数据集，l为此时的loss值。
[0019]
可选地，所述根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型，包括：
[0020]
采集所述数据中心的当前输入数据，根据所述参数训练模型对所述auto ml模型进行训练，获得对应所述历史调控数据训练获得的历史数据auto ml模型，并获得对应所述当前输入数据的当前数据训练auto ml模型；
[0021]
获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重；
[0022]
根据所述历史数据auto ml模型、所述当前数据训练auto ml模型、所述第一权重和所述第二权重通过下式对所述历史数据auto ml模型和所述当前数据训练auto ml模型进行微调，获得微调后的auto ml模型，并将微调后的auto ml模型作为训练完成的目标auto ml模型：
[0023]
m＝wim
origin
+wjm
current
[0024]
其中，m为微调后的auto ml模型，m
origin
为所述历史数据auto ml模型，所述当前数据训练auto ml模型，wi为所述第一权重，wj为所述第二权重。
[0025]
可选地，所述获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重，包括：
[0026]
获取所述历史调控数据的平均值，并获取所述当前输入数据的平均值；
[0027]
根据所述历史调控数据的平均值和所述当前输入数据的平均值通过下式获得所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重：
[0028][0029][0030]
其中，wi为所述第一权重，wj为所述第二权重，为所述历史调控数据的平均值，为所述当前输入数据的平均值。
[0031]
可选地，所述根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略，包括：
[0032]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数；
[0033]
根据所述策略衡量函数通过下式确定最优行为策略：
[0034][0035]
其中，μ为最优行为策略，j为策略衡量函数。
[0036]
可选地，所述根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数，包括：
[0037]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg通过下式获得每个时刻pue值最小值的策略衡量函数：
[0038][0039]qu
(s
t
，a
t
)＝e[r(s
t
，a
t
)+γqu(s
t+1
，μ(s
t+1
))]
[0040]
其中，j为策略衡量函数，q为ddpg中的q网络，s
t
为t时刻的环境状态，a
t
为t时刻采取的行为动作，r为环境在状态s
t
在执行a
t
动作后的单步奖励值，γ为预设衰变系数，β为用于引入随机噪声的行为策略。
[0041]
第二方面，为实现上述目的，本发明还提出一种数据中心智能节能调控装置，所述数据中心智能节能调控装置包括：
[0042]
训练模块，用于利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；
[0043]
策略生成模块，用于根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；
[0044]
调控模块，用于根据所述最优行为策略对所述数据中心的能耗进行调控。
[0045]
第三方面，为实现上述目的，本发明还提出一种数据中心智能节能调控设备，所述数据中心智能节能调控设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据中心智能节能调控程序，所述数据中心智能节能调控程序配置为实现如上文所述的数据中心智能节能调控方法的步骤。
[0046]
第四方面，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有数据中心智能节能调控程序，所述数据中心智能节能调控程序被处理器执行时实现如上文所述的数据中心智能节能调控方法的步骤。
[0047]
本发明提出的数据中心智能节能调控方法，通过利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；根据所述最优行为策略对所述数据中心的能耗进行调控，能够实时提供每个时刻的最优参数调控组合，有效降低数据中心能耗，解决了现有的数据中心pue调节方式不能实现全自动的实时调节策略输出的缺陷，节省了数据中心智能节能调控消耗的时间，提升了数据中心智能节能调控的速度和效率。
附图说明
[0048]
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图；
[0049]
图2为本发明数据中心智能节能调控方法第一实施例的流程示意图；
[0050]
图3为本发明数据中心智能节能调控方法第二实施例的流程示意图；
[0051]
图4为本发明数据中心智能节能调控装置第一实施例的功能模块图。
[0052]
本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。
具体实施方式
[0053]
应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
[0054]
本发明实施例的解决方案主要是：通过利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；根据所述最优行为策略对所述数据中心的能耗进行调控，能够实时提供每个时刻的最优参数调控组合，有效降低数据中心能耗，解决了现有的数据中心pue调节方式不能实现全自动的实时调节策略输出的缺陷，节省了数据中心智能节能调控消耗的时间，提升了数据中心智能节能调控的速度和效率，解决了现有技术中数据中心节能调控方法十分依赖人工经验进行调节，未充分利用数据之间关联关系，且调节后的pue很难达到最优值，造成了能源的浪费的技术问题。
[0055]
参照图1，图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
[0056]
如图1所示，该设备可以包括：处理器1001，例如cpu，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[0057]
本领域技术人员可以理解，图1中示出的设备结构并不构成对该设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。
[0058]
如图1所示，作为一种存储介质的存储器1005中可以包括操作装置、网络通信模块、用户接口模块以及数据中心智能节能调控程序。
[0059]
本发明设备通过处理器1001调用存储器1005中存储的数据中心智能节能调控程序，并执行以下操作：
[0060]
利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；
[0061]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；
[0062]
根据所述最优行为策略对所述数据中心的能耗进行调控。
[0063]
本发明设备通过处理器1001调用存储器1005中存储的数据中心智能节能调控程序，还执行以下操作：
[0064]
将数据中心基于电源使用效率pue值的历史数据进行空值数据消除和过精细化，获得历史调控数据，并获取自动机器学习auto ml模型的预设训练数据；
[0065]
根据所述历史调控数据和所述预设训练数据构建参数训练模型；
[0066]
根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型。
[0067]
本发明设备通过处理器1001调用存储器1005中存储的数据中心智能节能调控程序，还执行以下操作：
[0068]
获取auto ml模型的算法集和所述数据中心的调节参数；
[0069]
利用k折交叉验证将所述历史调控数据划分为k个训练集，利用k折交叉验证将所述预设训练数据划分为k个测试数据；
[0070]
根据所述算法集、所述调节参数、所述k个训练集和所述k个测试数据通过下式构建参数训练模型：
[0071][0072]
其中，a＝{a
(1)
,
…
,a
(r)
}表示auto ml模型的算法集，其中的每个元素表示不同的分类算法，λ为数据中心的调节参数，为所述历史调控数据通过k折交叉验证划分为的k个训练数据集，为所述预设训练数据通过k折交叉验证划分为的k个测试数据集，l为此时的loss值。
[0073]
本发明设备通过处理器1001调用存储器1005中存储的数据中心智能节能调控程序，还执行以下操作：
[0074]
采集所述数据中心的当前输入数据，根据所述参数训练模型对所述auto ml模型进行训练，获得对应所述历史调控数据训练获得的历史数据auto ml模型，并获得对应所述当前输入数据的当前数据训练auto ml模型；
[0075]
获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重；
[0076]
根据所述历史数据auto ml模型、所述当前数据训练auto ml模型、所述第一权重和所述第二权重通过下式对所述历史数据auto ml模型和所述当前数据训练auto ml模型进行微调，获得微调后的auto ml模型，并将微调后的auto ml模型作为训练完成的目标auto ml模型：
[0077]
m＝wim
origin
+wjm
current
[0078]
其中，m为微调后的auto ml模型，m
origin
为所述历史数据auto ml模型，所述当前数据训练auto ml模型，wi为所述第一权重，wj为所述第二权重。
[0079]
本发明设备通过处理器1001调用存储器1005中存储的数据中心智能节能调控程序，还执行以下操作：
[0080]
获取所述历史调控数据的平均值，并获取所述当前输入数据的平均值；
[0081]
根据所述历史调控数据的平均值和所述当前输入数据的平均值通过下式获得所
述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重：
[0082][0083][0084]
其中，wi为所述第一权重，wj为所述第二权重，为所述历史调控数据的平均值，为所述当前输入数据的平均值。
[0085]
本发明设备通过处理器1001调用存储器1005中存储的数据中心智能节能调控程序，还执行以下操作：
[0086]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数；
[0087]
根据所述策略衡量函数通过下式确定最优行为策略：
[0088][0089]
其中，μ为最优行为策略，j为策略衡量函数。
[0090]
本发明设备通过处理器1001调用存储器1005中存储的数据中心智能节能调控程序，还执行以下操作：
[0091]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg通过下式获得每个时刻pue值最小值的策略衡量函数：
[0092][0093]qu
(s
t
，a
t
)＝e[r(s
t
，a
t
)+γqu(s
t+1
，μ(s
t+1
))]
[0094]
其中，j为策略衡量函数，q为ddpg中的q网络，s
t
为t时刻的环境状态，a
t
为t时刻采取的行为动作，r为环境在状态s
t
在执行a
t
动作后的单步奖励值，γ为预设衰变系数，β为用于引入随机噪声的行为策略。
[0095]
本实施例通过上述方案，通过利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；根据所述最优行为策略对所述数据中心的能耗进行调控，能够实时提供每个时刻的最优参数调控组合，有效降低数据中心能耗，解决了现有的数据中心pue调节方式不能实现全自动的实时调节策略输出的缺陷，节省了数据中心智能节能调控消耗的时间，提升了数据中心智能节能调控的速度和效率。
[0096]
基于上述硬件结构，提出本发明数据中心智能节能调控方法实施例。
[0097]
参照图2，图2为本发明数据中心智能节能调控方法第一实施例的流程示意图。
[0098]
在第一实施例中，所述数据中心智能节能调控方法包括以下步骤：
[0099]
步骤s10、利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基
于电源使用效率pue值的训练，获得训练完成的目标auto ml模型。
[0100]
需要说明的是，利用数据中心记录的历史调控数据可以进行基于电能使用效率(power usage effectiveness，pue)值预测的自动机器学习(auto machine learning，auto ml)模型训练，得到预测精度较高的auto ml模型，即获得训练完成的目标auto ml模型。
[0101]
步骤s20、根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略。
[0102]
可以理解的是，根据所述目标auto ml模型结合深层确定性策略梯度(deep deterministic policy gradient，ddpg)可以得到每个时刻pue结果最小的参数组合对应的最优行为策略，所述最优行为策略为所述数据中心的最优参数组合，一般为不同场景对应的pue结果最小的设置参数对应的组合。
[0103]
进一步的，所述步骤s20具体包括以下步骤：
[0104]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数；
[0105]
根据所述策略衡量函数通过下式确定最优行为策略：
[0106][0107]
其中，μ为最优行为策略，j为策略衡量函数。
[0108]
应当理解的是，基于ddpg的参数输出方法为根据得到的pue值auto ml模型，利用ddpg构建pue最小化参数组合输出建模，这一部分根据得到的数据中心pue智最小化参数的设置参数，通过所述设置参数，所述最优行为策略为所述数据中心的最优的设置参数组合。
[0109]
进一步的，所述步骤根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数，具体包括以下步骤：
[0110]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg通过下式获得每个时刻pue值最小值的策略衡量函数：
[0111][0112]qu
(s
t
，a
t
)＝e[r(s
t
，a
t
)+γqu(s
t+1
，μ(s
t+1
))]
[0113]
其中，j为策略衡量函数，q为ddpg中的q网络，s
t
为t时刻的环境状态，a
t
为t时刻采取的行为动作，r为环境在状态s
t
在执行a
t
动作后的单步奖励值，γ为预设衰变系数，β为用于引入随机噪声的行为策略。
[0114]
需要说明的是，根据微调后的最优数据中心pue预测模型结合ddpg构建参数优化的最优行为策略，进而可以获得每个时刻pue结果最小的参数设置，实现数据中心节能的智能全自动实时调控，γ为预设衰变系数，一般可以设置为0-1之间的一个值，β为行为策略，可以用于随机噪声的引入。
[0115]
步骤s30、根据所述最优行为策略对所述数据中心的能耗进行调控。
[0116]
应当理解的是，在获得了所述最优行为策略后，可以根据所述最优行为策略对应的设置参数对所述数据中心的能耗按照对应的参数进行调控，从而实现数据中心节能的智能调控，有效降低了数据中心的能耗。
[0117]
本实施例通过上述方案，通过利用数据中心记录的历史调控数据对自动机器学习
auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；根据所述最优行为策略对所述数据中心的能耗进行调控，能够实时提供每个时刻的最优参数调控组合，有效降低数据中心能耗，解决了现有的数据中心pue调节方式不能实现全自动的实时调节策略输出的缺陷，节省了数据中心智能节能调控消耗的时间，提升了数据中心智能节能调控的速度和效率。
[0118]
进一步地，图3为本发明数据中心智能节能调控方法第二实施例的流程示意图，如图3所示，基于第一实施例提出本发明数据中心智能节能调控方法第二实施例，在本实施例中，所述步骤s10具体包括以下步骤：
[0119]
步骤s11、将数据中心基于电源使用效率pue值的历史数据进行空值数据消除和过精细化，获得历史调控数据，并获取自动机器学习auto ml模型的预设训练数据。
[0120]
需要说明的是，将数据中心基于电源使用效率pue值的历史数据进行空值数据消除和过精细化，可以获得历史调控数据，即将输入的数据中心pue值的历史数据进行数据预处理消除空值数据和过精细化数据之后，可以获得对应的历史调控数据，所述预设训练数据为auto ml模型预先设置的对模型进行训练的测试数据。
[0121]
步骤s12、根据所述历史调控数据和所述预设训练数据构建参数训练模型。
[0122]
可以理解的是，通过所述历史调控数据和所述预设训练数据可以构建对auto ml模型进行进度高精度预测的参数训练模型。
[0123]
进一步的，所述步骤s12具体包括以下步骤：
[0124]
获取auto ml模型的算法集和所述数据中心的调节参数；
[0125]
利用k折交叉验证将所述历史调控数据划分为k个训练集，利用k折交叉验证将所述预设训练数据划分为k个测试数据；
[0126]
根据所述算法集、所述调节参数、所述k个训练集和所述k个测试数据通过下式构建参数训练模型：
[0127][0128]
其中，a＝{a
(1)
,
…
,a
(r)
}表示auto ml模型的算法集，其中的每个元素表示不同的分类算法，λ为数据中心的调节参数，为所述历史调控数据通过k折交叉验证划分为的k个训练数据集，为所述预设训练数据通过k折交叉验证划分为的k个测试数据集，l为此时的loss值。
[0129]
需要说明的是，为了找出loss最小情况下对应的算法a和数据中心参数，可以在给定数据中心历史调控数据的基础上，利用auto-sklearn框架，通过迭代的方式获得问题的最优解，并得到此时对应的算法a和参数，最终输出最优的auto ml模型，通过上述公式利用数据中心记录的历史调控数据和训练数据进行基于pue值预测的auto ml模型训练，可以得到预测精度较高的auto ml模型，通过k折交叉验证可以将所述历史调控数据划分为k个训练数据集，通过k折交叉验证可以将所述预设训练数据划分为k个测试数据集。
[0130]
步骤s13、根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型。
[0131]
应当理解的是，构建所述参数训练模型可以对所述auto ml模型进行训练和微调，从而获得微调后的模型，即可以认定模型训练完成，将微调后的模型作为目标auto ml模型。
[0132]
进一步的，所述步骤s13具体包括以下步骤：
[0133]
采集所述数据中心的当前输入数据，根据所述参数训练模型对所述auto ml模型进行训练，获得对应所述历史调控数据训练获得的历史数据auto ml模型，并获得对应所述当前输入数据的当前数据训练auto ml模型；
[0134]
获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重；
[0135]
根据所述历史数据auto ml模型、所述当前数据训练auto ml模型、所述第一权重和所述第二权重通过下式对所述历史数据auto ml模型和所述当前数据训练auto ml模型进行微调，获得微调后的auto ml模型，并将微调后的auto ml模型作为训练完成的目标auto ml模型：
[0136]
m＝wim
origin
+wjm
current
[0137]
其中，m为微调后的auto ml模型，m
origin
为所述历史数据auto ml模型，所述当前数据训练auto ml模型，wi为所述第一权重，wj为所述第二权重。
[0138]
需要说明的是，auto ml模型的具体微调方法为：根据数据中心当前的调控数据通过上式计算获得微调后的auto ml模型。
[0139]
进一步的，所述步骤获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重，包括：
[0140]
获取所述历史调控数据的平均值，并获取所述当前输入数据的平均值；
[0141]
根据所述历史调控数据的平均值和所述当前输入数据的平均值通过下式获得所述历史数据auto ml模型对应的第一权重和所述当前数据训练automl模型对应的第二权重：
[0142][0143][0144]
其中，wi为所述第一权重，wj为所述第二权重，为所述历史调控数据的平均值，为所述当前输入数据的平均值。
[0145]
应当理解的是，通过历史调控数据的平均值和当前输入数据的平均值可以通过上述公式确定根据历史调控数据得到的模型对应的权重和所述当前数据输入得到的模型，进而根据所述历史数据auto ml模型、所述当前数据训练auto ml模型、所述第一权重和所述第二权重计算获得微调后的auto ml模型。
[0146]
本实施例通过上述方案，通过将数据中心基于电源使用效率pue值的历史数据进
行空值数据消除和过精细化，获得历史调控数据，并获取自动机器学习auto ml模型的预设训练数据；根据所述历史调控数据和所述预设训练数据构建参数训练模型；根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型，能够获得预测精度较高的auto ml模型，保证了数据中心智能节能调控的精确度，提升了数据中心智能节能调控的速度和效率。
[0147]
相应地，本发明进一步提供一种数据中心智能节能调控装置。
[0148]
参照图4，图4为本发明数据中心智能节能调控装置第一实施例的功能模块图。
[0149]
本发明数据中心智能节能调控装置第一实施例中，该数据中心智能节能调控装置包括：
[0150]
训练模块10，用于利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型。
[0151]
策略生成模块20，用于根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略。
[0152]
调控模块30，用于根据所述最优行为策略对所述数据中心的能耗进行调控。
[0153]
所述训练模块10，还用于将数据中心基于电源使用效率pue值的历史数据进行空值数据消除和过精细化，获得历史调控数据，并获取自动机器学习auto ml模型的预设训练数据；根据所述历史调控数据和所述预设训练数据构建参数训练模型；根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型。
[0154]
所述训练模块10，还用于获取auto ml模型的算法集和所述数据中心的调节参数；利用k折交叉验证将所述历史调控数据划分为k个训练集，利用k折交叉验证将所述预设训练数据划分为k个测试数据；根据所述算法集、所述调节参数、所述k个训练集和所述k个测试数据通过下式构建参数训练模型：
[0155][0156]
其中，a＝{a
(1)
,
…
,a
(r)
}表示auto ml模型的算法集，其中的每个元素表示不同的分类算法，λ为数据中心的调节参数，为所述历史调控数据通过k折交叉验证划分为的k个训练数据集，为所述预设训练数据通过k折交叉验证划分为的k个测试数据集，l为此时的loss值。
[0157]
所述训练模块10，还用于采集所述数据中心的当前输入数据，根据所述参数训练模型对所述auto ml模型进行训练，获得对应所述历史调控数据训练获得的历史数据auto ml模型，并获得对应所述当前输入数据的当前数据训练auto ml模型；获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重；根据所述历史数据auto ml模型、所述当前数据训练auto ml模型、所述第一权重和所述第二权重通过下式对所述历史数据auto ml模型和所述当前数据训练auto ml模型进行微调，获得微调后的auto ml模型，并将微调后的auto ml模型作为训练完成的目标auto ml模型：
[0158]
m＝wim
origin
+wjm
current
[0159]
其中，m为微调后的auto ml模型，m
origin
为所述历史数据auto ml模型，所述当前数据训练auto ml模型，wi为所述第一权重，wj为所述第二权重。
[0160]
所述训练模块10，还用于获取所述历史调控数据的平均值，并获取所述当前输入数据的平均值；根据所述历史调控数据的平均值和所述当前输入数据的平均值通过下式获得所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重：
[0161][0162][0163]
其中，wi为所述第一权重，wj为所述第二权重，为所述历史调控数据的平均值，为所述当前输入数据的平均值。
[0164]
所述策略生成模块20，还用于根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略，包括：根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数；
[0165]
根据所述策略衡量函数通过下式确定最优行为策略：
[0166][0167]
其中，μ为最优行为策略，j为策略衡量函数。
[0168]
所述策略生成模块20，还用于根据所述目标auto ml模型结合深层确定性策略梯度ddpg通过下式获得每个时刻pue值最小值的策略衡量函数：
[0169][0170]qu
(s
t
，a
t
)＝e[r(s
t
，a
t
)+γqu(s
t+1
，μ(s
t+1
))]
[0171]
其中，j为策略衡量函数，q为ddpg中的q网络，s
t
为t时刻的环境状态，a
t
为t时刻采取的行为动作，r为环境在状态s
t
在执行a
t
动作后的单步奖励值，γ为预设衰变系数，β为用于引入随机噪声的行为策略。
[0172]
其中，数据中心智能节能调控装置的各个功能模块实现的步骤可参照本发明数据中心智能节能调控方法的各个实施例，此处不再赘述。
[0173]
此外，本发明实施例还提出一种存储介质，所述存储介质上存储有数据中心智能节能调控程序，所述数据中心智能节能调控程序被处理器执行时实现如下操作：
[0174]
利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；
[0175]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；
[0176]
根据所述最优行为策略对所述数据中心的能耗进行调控。
[0177]
进一步地，所述数据中心智能节能调控程序被处理器执行时还实现如下操作：
[0178]
将数据中心基于电源使用效率pue值的历史数据进行空值数据消除和过精细化，获得历史调控数据，并获取自动机器学习auto ml模型的预设训练数据；
[0179]
根据所述历史调控数据和所述预设训练数据构建参数训练模型；
[0180]
根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型。
[0181]
进一步地，所述数据中心智能节能调控程序被处理器执行时还实现如下操作：
[0182]
获取auto ml模型的算法集和所述数据中心的调节参数；
[0183]
利用k折交叉验证将所述历史调控数据划分为k个训练集，利用k折交叉验证将所述预设训练数据划分为k个测试数据；
[0184]
根据所述算法集、所述调节参数、所述k个训练集和所述k个测试数据通过下式构建参数训练模型：
[0185][0186]
其中，a＝{a
(1)
,
…
,a
(r)
}表示auto ml模型的算法集，其中的每个元素表示不同的分类算法，λ为数据中心的调节参数，为所述历史调控数据通过k折交叉验证划分为的k个训练数据集，为所述预设训练数据通过k折交叉验证划分为的k个测试数据集，l为此时的loss值。
[0187]
进一步地，所述数据中心智能节能调控程序被处理器执行时还实现如下操作：
[0188]
采集所述数据中心的当前输入数据，根据所述参数训练模型对所述auto ml模型进行训练，获得对应所述历史调控数据训练获得的历史数据auto ml模型，并获得对应所述当前输入数据的当前数据训练auto ml模型；
[0189]
获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重；
[0190]
根据所述历史数据auto ml模型、所述当前数据训练auto ml模型、所述第一权重和所述第二权重通过下式对所述历史数据auto ml模型和所述当前数据训练auto ml模型进行微调，获得微调后的auto ml模型，并将微调后的auto ml模型作为训练完成的目标auto ml模型：
[0191]
m＝wim
origin
+wjm
current
[0192]
其中，m为微调后的auto ml模型，m
origin
为所述历史数据auto ml模型，所述当前数据训练auto ml模型，wi为所述第一权重，wj为所述第二权重。
[0193]
进一步地，所述数据中心智能节能调控程序被处理器执行时还实现如下操作：
[0194]
获取所述历史调控数据的平均值，并获取所述当前输入数据的平均值；
[0195]
根据所述历史调控数据的平均值和所述当前输入数据的平均值通过下式获得所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重：
[0196][0197][0198]
其中，wi为所述第一权重，wj为所述第二权重，为所述历史调控数据的平均值，为所述当前输入数据的平均值。
[0199]
进一步地，所述数据中心智能节能调控程序被处理器执行时还实现如下操作：
[0200]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数；
[0201]
根据所述策略衡量函数通过下式确定最优行为策略：
[0202][0203]
其中，μ为最优行为策略，j为策略衡量函数。
[0204]
进一步地，所述数据中心智能节能调控程序被处理器执行时还实现如下操作：
[0205]
根据所述目标auto ml模型结合深层确定性策略梯度ddpg通过下式获得每个时刻pue值最小值的策略衡量函数：
[0206][0207]qu
(s
t
，a
t
)＝e[r(s
t
，a
t
)+γqu(s
t+1
，μ(s
t+1
))]
[0208]
其中，j为策略衡量函数，q为ddpg中的q网络，s
t
为t时刻的环境状态，a
t
为t时刻采取的行为动作，r为环境在状态s
t
在执行a
t
动作后的单步奖励值，γ为预设衰变系数，β为用于引入随机噪声的行为策略。
[0209]
本实施例通过上述方案，通过利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；根据所述最优行为策略对所述数据中心的能耗进行调控，能够实时提供每个时刻的最优参数调控组合，有效降低数据中心能耗，解决了现有的数据中心pue调节方式不能实现全自动的实时调节策略输出的缺陷，节省了数据中心智能节能调控消耗的时间，提升了数据中心智能节能调控的速度和效率。
[0210]
需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0211]
上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
[0212]
以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技
术领域，均同理包括在本发明的专利保护范围内。

技术特征：
1.一种数据中心智能节能调控方法，其特征在于，所述数据中心智能节能调控方法包括：利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；根据所述最优行为策略对所述数据中心的能耗进行调控。2.如权利要求1所述的数据中心智能节能调控方法，其特征在于，所述利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型，包括：将数据中心基于电源使用效率pue值的历史数据进行空值数据消除和过精细化，获得历史调控数据，并获取自动机器学习auto ml模型的预设训练数据；根据所述历史调控数据和所述预设训练数据构建参数训练模型；根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型。3.如权利要求2所述的数据中心智能节能调控方法，其特征在于，所述根据所述历史调控数据和所述预设训练数据构建参数训练模型，包括：获取auto ml模型的算法集和所述数据中心的调节参数；利用k折交叉验证将所述历史调控数据划分为k个训练集，利用k折交叉验证将所述预设训练数据划分为k个测试数据；根据所述算法集、所述调节参数、所述k个训练集和所述k个测试数据通过下式构建参数训练模型：其中，a＝{a
(1)
,
…
,a
(r)
}表示auto ml模型的算法集，其中的每个元素表示不同的分类算法，λ为数据中心的调节参数，为所述历史调控数据通过k折交叉验证划分为的k个训练数据集，为所述预设训练数据通过k折交叉验证划分为的k个测试数据集，l为此时的loss值。4.如权利要求2所述的数据中心智能节能调控方法，其特征在于，所述根据所述参数训练模型对所述auto ml模型进行训练和微调，获得训练完成的目标auto ml模型，包括：采集所述数据中心的当前输入数据，根据所述参数训练模型对所述auto ml模型进行训练，获得对应所述历史调控数据训练获得的历史数据auto ml模型，并获得对应所述当前输入数据的当前数据训练auto ml模型；获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重；根据所述历史数据auto ml模型、所述当前数据训练auto ml模型、所述第一权重和所
述第二权重通过下式对所述历史数据auto ml模型和所述当前数据训练auto ml模型进行微调，获得微调后的auto ml模型，并将微调后的auto ml模型作为训练完成的目标auto ml模型：m＝w
i
m
origin
+w
j
m
current
其中，m为微调后的auto ml模型，m
origin
为所述历史数据auto ml模型，所述当前数据训练auto ml模型，w
i
为所述第一权重，w
j
为所述第二权重。5.如权利要求4所述的数据中心智能节能调控方法，其特征在于，所述获取所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重，包括：获取所述历史调控数据的平均值，并获取所述当前输入数据的平均值；根据所述历史调控数据的平均值和所述当前输入数据的平均值通过下式获得所述历史数据auto ml模型对应的第一权重和所述当前数据训练auto ml模型对应的第二权重：ml模型对应的第二权重：其中，w
i
为所述第一权重，w
j
为所述第二权重，为所述历史调控数据的平均值，为所述当前输入数据的平均值。6.如权利要求1所述的数据中心智能节能调控方法，其特征在于，所述根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略，包括：根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数；根据所述策略衡量函数通过下式确定最优行为策略：其中，μ为最优行为策略，j为策略衡量函数。7.如权利要求6所述的数据中心智能节能调控方法，其特征在于，所述根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻pue值最小值的策略衡量函数，包括：根据所述目标auto ml模型结合深层确定性策略梯度ddpg通过下式获得每个时刻pue值最小值的策略衡量函数：q
u
(s
t
，a
t
)＝e[r(s
t
，a
t
)+γq
u
(s
t+1
，μ(s
t+1
))]其中，j为策略衡量函数，q为ddpg中的q网络，s
t
为t时刻的环境状态，a
t
为t时刻采取的行为动作，r为环境在状态s
t
在执行a
t
动作后的单步奖励值，γ为预设衰变系数，β为用于引入随机噪声的行为策略。
8.一种数据中心智能节能调控装置，其特征在于，所述数据中心智能节能调控装置包括：训练模块，用于利用数据中心记录的历史调控数据对自动机器学习auto ml模型进行基于电源使用效率pue值的训练，获得训练完成的目标auto ml模型；策略生成模块，用于根据所述目标auto ml模型结合深层确定性策略梯度ddpg获得每个时刻的pue值最小值，生成最优行为策略；调控模块，用于根据所述最优行为策略对所述数据中心的能耗进行调控。9.一种数据中心智能节能调控设备，其特征在于，所述数据中心智能节能调控设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据中心智能节能调控程序，所述数据中心智能节能调控程序配置为实现如权利要求1至7中任一项所述的数据中心智能节能调控方法的步骤。10.一种存储介质，其特征在于，所述存储介质上存储有数据中心智能节能调控程序，所述数据中心智能节能调控程序被处理器执行时实现如权利要求1至7中任一项所述的数据中心智能节能调控方法的步骤。

技术总结
本发明公开了一种数据中心智能节能调控方法、装置、设备及存储介质，所述方法通过利用数据中心记录的历史调控数据对自动机器学习Auto ML模型进行基于电源使用效率PUE值的训练，获得训练完成的目标Auto ML模型；根据所述目标Auto ML模型结合深层确定性策略梯度DDPG获得每个时刻的PUE值最小值，生成最优行为策略；根据所述最优行为策略对所述数据中心的能耗进行调控，能够实时提供每个时刻的最优参数调控组合，有效降低数据中心能耗，解决了现有的数据中心PUE调节方式不能实现全自动的实时调节策略输出的缺陷，节省了数据中心智能节能调控消耗的时间，提升了数据中心智能节能调控的速度和效率。的速度和效率。的速度和效率。

技术研发人员：曾军江昊陈琪美
受保护的技术使用者：武汉大学
技术研发日：2022.08.05
技术公布日：2022/12/1

转载请注明原文地址: https://bbs.8miu.com/read-334510.html

专利

最新回复(0)