技术领域
[0001] 本发明涉及节能控制技术领域 ,尤其涉及一种数据中心节能冷却控制方法及系统。
相关背景技术
[0002] 对人工智能和云计算的需求日益增长,导致数据中心(DC)的能耗暴涨。目前的行业实践涉及人工操作人员,同时也提出了许多数据驱动的方法。然而,人为干预往往会导致不 必要的能源消耗,特别是在面对波动的服务器负载时,而现有的数 据驱动方法在实践中难以保持热安全。
[0003] 预计到2030年,直流电的用电量将增加两倍甚至四倍。能源需求的大幅增长不仅对环境的可持续性提出了挑战,也增加了商业直流供应商的运营成本。目前,空气冷却装置(ACU)最常用的控制设置是其入口温度设定点。为了达到给定的设定点,ACU利用比例‑积分‑导数(PID)控制。为了选择设定点,目前的行业实践依赖于人类操作员根据经验选择一个值,而许多数据驱动的方法也被提出,这些方法需要学习如何从历史数据中心轨迹中计算动态负载下的温度设定点。但是现有技术都不能达到在热安全范围内降低数据中心冷却能量的目标。由于服务器负载对操作人员来说是未 知的,人为干预无法提供最佳的冷却能量。冷却供应和服务 器负载之间的不匹配会导致不必要的冷却能耗。现有的数据驱动方法,虽然负载敏感,但由于忽略了空气冷却装置PID控制器的动态特性,难以满足热安全约束。它们以热安全约束下的冷却能量最小化作为优化目标。这种设置激励ACU在约束的边界处操作。因此,往往会发生冷却中断。设定点高于实际入口温度,这样PID控制器认为它已经超过了设定目标,冷空气以降低或零速率输送。这种现象不符合制冷和空调工程师协会规定的直流冷却 标准。当这种情况发生时,由于服务器以较低的速率被移除所产生的热量整个数据中心内的温度会迅速上升。即使冷空气再次开始以更快的速度传递,也需要更长的时间来撤销增加,这使得以前的数据驱动方法无法生成一 个设定值来及时抑制温度上升,导致数据中心温度控制难度大,能源消耗成本高。
具体实施方式
[0021] 为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0022] 下面结合图1描述本发明的一种数据中心节能冷却控制方法,包括:步骤100、获取空气冷却装置的初始温度设定值和热安全温度目标。
[0023] 在本发明中, 在有限的时间序列范围内,预测了数据中心温度变化情况以及在给定的初始温度设定值下相关的空气冷却装置功率,基于预测结果,选择一个在当前时间步长执行的温度设定值,在任何传感器捕获的预测冷通道温度不超过热安全温度目标的约束下,使预测的空气冷却装置功率最小化。除了空气冷却装置功率最小化之外,优化目标还包括依次实现冷却中断最小化以遏制有可能违反热安全的温升。
[0024] 步骤200、基于所述初始温度设定值通过预训练的数据中心时间序列模型预测空气冷却装置功率。
[0025] 本发明中,数据中心时间序列模型使用四个模块来预测数据中心温度和空气冷却装置功率。在数据中心时间序列模型的第一阶段建立了一个功率预测模块来预测下一阶段的平均服务器功率;第二阶段使用进气温度预测模块根据给定的初始温度设定值和功率预测模块的输出来预测空气冷却装置的实际进气温度;在第三阶段,功率预测模块和进气温度模块显示了数据中心产生和排出的热量,通过数据中心温度预测模块预测了不同机架上传感器捕获的未来数据中心的温度,在第四阶段,对于空气冷却装置功率的预测,使用一个冷却能量预测模块,以预测的空气冷却装置的进气温度和初始温度设定值作为输入,进行空气冷却装置功率的预测。
[0026] 具体地,在设定周期内通过所述数据中心时间序列模型预测空气冷却装置附近服务器的平均功率;基于服务器的平均功率预测空气冷却装置的进气口温度;
将空气冷却装置的进气口温度和初始温度设定值进行比对确定温度差值,根据所述温度差值计算空气冷却装置功率。
[0027] 其中,在设定周期内通过数据中心时间序列模型预测空气冷却装置附近服务器的平均功率,具体包括:通过数据中心时间序列模型中的功率预测模块对设定周期内从开始时间到结束时间服务器的总功率进行预测,基于总功率和设定周期的时间参数求取空气冷却装置附近服务器的平均功率;
其中,数据中心时间序列模型中的功率预测模块是基于历史设定周期内服务器功率变化情况对预设第一线性模型训练得到的。
[0028] 将空气冷却装置的进气口温度和初始温度设定值进行比对确定温度差值,根据所述温度差值预测空气冷却装置功率,具体包括:将获取的空气冷却装置的进气口温度和初始温度设定值作差,获取温度差值;
基于所述温度差值通过数据中心时间序列模型中的冷却能量预测模块对空气冷却装置功率进行预测;
其中,数据中心时间序列模型中的冷却能量预测模块是基于历史温度差值对应的冷却装置功率数据对预设第二线性模型进行训练得到的。
[0029] 在本发明中,通过功率预测模块来预测下一阶段的平均服务器功率,服务器功率表示数据中心内部产生热量的速率。然而,每台服务器的功耗可能会突然变化,由于未知的上层工作负载,很难预测。为了解决这个问题,根据数据中心布局预测空气冷却装置附近服务器的平均功率聚合,因为多台服务器同时改变其功耗的可能性小于单个服务器。
[0030] 步骤300、在所述热安全温度目标的约束下通过预设的贝叶斯优化器确定空气冷却装置功率最小值对应的理想温度设定值。
[0031] 具体地,在所述热安全温度目标的约束下通过预设的贝叶斯优化器进行误差优化,从数据集中选取空气冷却装置功率的最小值;其中,数据集是通过数据中心时间序列模型预测设定范围内多个温度设定值下的空气冷却装置功率数据构建得到的;根据空气冷却装置功率的最小值确定对应的理想温度设定值。
[0032] 在本发明中,数据中心时间序列模型建立了给定的温度设定值如何在有限的时间范围内影响数据中心不同位置的数据中心温度。基于模型的预 测,使用优化器在不违反热安全温度约束的情况下找到能量最优设值。然而,优化器需要意识到数据中心时间序列模型的建模误差,尽管已经通过纳入外源输入的影响来降低其泛化误差。泛化误差只是一个平均的度量。因此,仍然可能出现较 大的偏差。当它们发生时,后续的温度设定值优化是基于错误的预测进行的,这使得数据中心可能容易受到热安全违规和次优节能的影响。
[0033] 在设定周期内形成如下的优化问题。
[0034] 。
[0035] 其中, 表示真实目标函数在第 到第 步上的输出; 表示真实约束函数在第 到第 步上的输出; 为根据时间序列模型计算的目标函数在第 到第 步上的输出; 为根据时间序列模型计算的约束函数在第 到
第 步上的输出;为真实目标函数输出与预测值的差异;为真实约束函数输出与预测值的差异; 为最小/最大空气冷却装置设定温度值; 表示在 时间步的
设定温度,其他带不同上下角标的根据位置同理代换; 表示空气冷却装置在第 到第 步上的设定温度。
[0036] 贝叶斯优化器将目标函数 最大化,该目标函数包含受约束函数 约束的真实冷却能量,如果约束函数为正,则表明真正的热安全违规。然而,只有预测版本和 可以直接通过数据中心时间序列模型获得。为了避免温度设定值变化带来的能量影响,贝叶斯优化器在时间序列内的所有时间步共用同一个设定点,即。 和 分别是空气冷却装置中给出的 PID控制器可实
现的最小和最大温度设定值。
[0037] 将数据中心时间序列模型预测的空气冷却装置功率和热安全温度目标下的冷却中断纳入优化目标。
[0038] 因为冷却中断会导致数据中心温度快速上升。此外,根据现有的数据中心冷却标准,数据中心冷却中断的持续时间是根据其可用性规格限制的。虽然冷却中断提供了一种节能激励,但它与这一要求相冲突。在本发明中选择贝叶斯优化器,在优化低维黑箱函数(如分别从 到 和 的映射)方面效果显著。 根据数据中心时间序列模型的输出,贝叶斯优化器从目标函数和约束函数的分布中采样值。使用一个建模误差感知的贝叶斯优化器来寻找最优可行设值。为了构造目标函数和约束函数的分布,需要对目标函数和约束函数进行不确定性估计。使用在线预测误差监视器,跟踪数据中心时间序列模型在过去一天内的预测误差,这是数据中心负载上升和下降的典型时间段。不确定性估计是使用拔靴法(bootstrapping)从监测器中获得的。在贝叶斯优化器计算出一个设定点后,将其发送到平滑缓冲器,其输出最终由空气冷却装置的PID控 制器执行。
[0039] 步骤400、将所述理想温度设定值传送至平滑缓冲器,通过平滑缓冲器向空气冷却装置的控制器发送控制指令,调节空气冷却装置功率。
[0040] 具体包括:将所述理想温度设定值传送至设定长度的平滑缓冲器,通过所述平滑缓冲器进行低通滤波,消除高频变化,生成缓速变化的控制指令;基于所述控制指令调节空气冷却装置功率。
[0041] 在本发明中,贝叶斯优化器计算出理想温度设定值,需要处理后送到空气冷却装置的PID控制器执行。原因是理想温度设定值的转换需要时间,这取决于服务器的功率和之前的温度设定值。因此,当空气冷却装置还没有稳定在前几个温度设定值附近时,定期执行温度设定值必然会有一些温度设定值被执行。这种类型的执行有额外的能量消耗的可能,为了避免这种情况,添加了一个设定长度的平滑缓冲器来存储贝叶斯优化器计算出的理想温度设定值。最后发送给空气冷却装置的PID控制器,理想温度设定值是存储在平滑缓冲器中的值的运行平均值。平滑缓冲器起到低通滤波器的作用,消除计算的设定点中的高频变 化,从而降低不必要的功率峰值。
[0042] 通过本发明提供的一种数据中心节能冷却控制方法,通过数据中心时间序列模型预测空气冷却装置功率,根据热安全温度约束进行贝叶斯优化优化后能够计算出空气冷却装置功率最小值对应的理想温度设定值,降低数据中心的冷却功耗,并且通过设置平滑缓冲器能够缓速调节空气冷却装置功率,避免数据中心温度值突变超出热安全约束。
[0043] 本发明还公开了一种数据中心节能冷却控制系统,所述系统包括:数据获取模块110,用于获取空气冷却装置的初始温度设定值和热安全温度目标;
预测模块120,用于基于所述初始温度设定值通过预训练的数据中心时间序列模型预测空气冷却装置功率;
设定值输出模块130,用于在所述热安全温度目标的约束下通过预设的贝叶斯优化器确定空气冷却装置功率最小值对应的理想温度设定值;
调节模块140,用于将所述理想温度设定值传送至平滑缓冲器,通过平滑缓冲器向空气冷却装置的控制器发送控制指令,调节空气冷却装置功率。
[0044] 其中,基于所述初始温度设定值通过预训练的数据中心时间序列模型预测空气冷却装置功率,具体包括:在设定周期内通过所述数据中心时间序列模型预测空气冷却装置附近服务器的平均功率;
基于服务器的平均功率预测空气冷却装置的进气口温度;
将空气冷却装置的进气口温度和初始温度设定值进行比对确定温度差值,根据所述温度差值计算空气冷却装置功率。
[0045] 在设定周期内通过数据中心时间序列模型预测空气冷却装置附近服务器的平均功率,具体包括:通过数据中心时间序列模型中的功率预测模块对设定周期内从开始时间到结束时间服务器的总功率进行预测,基于总功率和设定周期的时间参数求取空气冷却装置附近服务器的平均功率;
其中,数据中心时间序列模型中的功率预测模块是基于历史设定周期内服务器功率变化情况对预设第一线性模型训练得到的。
[0046] 将空气冷却装置的进气口温度和初始温度设定值进行比对确定温度差值,根据所述温度差值预测空气冷却装置功率,具体包括:将获取的空气冷却装置的进气口温度和初始温度设定值作差,获取温度差值;
基于所述温度差值通过数据中心时间序列模型中的冷却能量预测模块对空气冷却装置功率进行预测;
其中,数据中心时间序列模型中的冷却能量预测模块是基于历史温度差值对应的冷却装置功率数据对预设第二线性模型进行训练得到的。
[0047] 在所述热安全温度目标的约束下通过预设的贝叶斯优化器确定空气冷却装置功率最小值对应的理想温度设定值,具体包括:在所述热安全温度目标的约束下通过预设的贝叶斯优化器进行误差优化,从数据集中选取空气冷却装置功率的最小值;其中,数据集是通过数据中心时间序列模型预测设定范围内多个温度设定值下的空气冷却装置功率数据构建得到的;
根据空气冷却装置功率的最小值确定对应的理想温度设定值。
[0048] 将所述理想温度设定值传送至平滑缓冲器,通过平滑缓冲器向空气冷却装置的控制器发送控制指令,调节空气冷却装置功率,具体包括:将所述理想温度设定值传送至设定长度的平滑缓冲器,通过所述平滑缓冲器进行低通滤波,消除高频变化,生成缓速变化的控制指令;
基于所述控制指令调节空气冷却装置功率。
[0049] 基于本发明提供的一种数据中心节能冷却控制方法,通过数据中心时间序列模型预测空气冷却装置功率,根据热安全温度约束进行贝叶斯优化优化后能够计算出空气冷却装置功率最小值对应的理想温度设定值,降低数据中心的冷却功耗,并且通过设置平滑缓冲器能够缓速调节空气冷却装置功率,避免数据中心温度值突变超出热安全约束。
[0050] 图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行数据中心节能冷却控制方法,该方法包括:获取空气冷却装置的初始温度设定值和热安全温度目标;基于所述初始温度设定值通过预训练的数据中心时间序列模型预测空气冷却装置功率;在所述热安全温度目标的约束下通过预设的贝叶斯优化器确定空气冷却装置功率最小值对应的理想温度设定值;将所述理想温度设定值传送至平滑缓冲器,通过平滑缓冲器向空气冷却装置的控制器发送控制指令,调节空气冷却装置功率。
[0051] 此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0052] 另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的数据中心节能冷却控制方法,该方法包括:获取空气冷却装置的初始温度设定值和热安全温度目标;基于所述初始温度设定值通过预训练的数据中心时间序列模型预测空气冷却装置功率;在所述热安全温度目标的约束下通过预设的贝叶斯优化器确定空气冷却装置功率最小值对应的理想温度设定值;将所述理想温度设定值传送至平滑缓冲器,通过平滑缓冲器向空气冷却装置的控制器发送控制指令,调节空气冷却装置功率。
[0053] 又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的数据中心节能冷却控制方法,该方法包括:获取空气冷却装置的初始温度设定值和热安全温度目标;基于所述初始温度设定值通过预训练的数据中心时间序列模型预测空气冷却装置功率;在所述热安全温度目标的约束下通过预设的贝叶斯优化器确定空气冷却装置功率最小值对应的理想温度设定值;将所述理想温度设定值传送至平滑缓冲器,通过平滑缓冲器向空气冷却装置的控制器发送控制指令,调节空气冷却装置功率。
[0054] 以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0055] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0056] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。