技术领域
[0001] 本申请涉及基础设施技术领域,尤其涉及一种机房能效评估方法、装置、介质、产品及设备。
相关背景技术
[0002] 在现有技术中,机房能效综合评估方案通常需要基于机房与能效相关的历史数据来进行统一运算,以针对机房的历史状态及其对应的在设定指标下的历史数据做出评估得到机房历史能效评估结果。但是,现有技术难以实时评估机房的当前能效状态,且评估所使用的指标通常都是在过去时间内提前设定好以便收集历史数据的。
具体实施方式
[0069] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0070] 在本申请描述中,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本申请的描述中,术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“根据”是“至少部分地根据”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。
[0071] 在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
[0072] 在本申请的描述中,需要说明的是,除非另有定义,本申请所使用的所有的技术和科学术语与属于本技术领域的技术人员通常理解的含义相同。本申请中说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请,对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
[0073] 下面对本申请实施例涉及的一些术语概念做解释说明:
[0074] PUE(Power Usage Effectiveness,电源使用效率)。
[0075] KL散度(Kullback‑Leibler Divergence),也称为相对熵(Relative Entropy),是一种衡量两个概率分布之间差异的非对称性指标。
[0076] 参见图1,示出了本申请实施例提供的一种机房能效评估方法的流程示意图,该方法包括步骤S101‑S104,具体如下:
[0077] S101,获取待评估机房的多个指标分别对应的指标数据;
[0078] 在一个示例中,多个指标分别对应的指标数据可以包括与该待评估机房相关联的能耗数据、环境数据和/或算力数据,其中,能耗数据和环境数据主要利用测点传感器检测读取得到,例如通过数据中心基础设施管理平台对接机房内的设备FSU(Field Supervision Unit,现场监控单元)的B接口进行集中采集和存储;算力数据可以使用数据中心云管系统通过部署监控工具或指定通讯协议的探针进行收集,例如使用设备嵌入式探针程序及Telemetry协议,其中,Telemetry协议是一种网络监控技术的核心组件,其被设计为用于从网络设备或其他远程物理及虚拟设备中高效、实时地收集大量数据。
[0079] 可选地,该指标数据可以是经过规范化操作处理的数据,其中,该规范化操作处理包括同类指标的单位统一换算、进制统一换算、异常测点数据清洗和/或时间空间维度转换等操作。
[0080] 需要说明的是,本实施例中的多个指标可以包括预先设定好的若干指标以及因应实际情况而由用户实时调整设定的若干指标,相应的,每一指标对应的指标数据均可以根据该指标的特性而包括:其对应的实时数据,或者其对应的实时数据和历史数据。
[0081] S102,根据所述多个指标分别对应的指标数据,从所述多个指标中选取出至少一个关键评估指标;
[0082] 在一个示例中,可以预先通过确定待评估机房内的试验区域、设置实验处理、进行实验观测能耗、数据收集分析方式,将采集到的多组实验数据(即多个指标分别对应的指标数据)进行比对分析,并筛选出对当前待评估机房的能效影响较大的业务过程,从而从多个指标中筛选出至少一个关键评估指标。
[0083] 在一个示例中,可以按照预设关键评估指标选取规则来选取出关键评估指标,该规则可以根据输入的需求指令确定,例如,可以将该规则配置为按各个指标对应的指标数据的数据量大小来对指标进行排序以便于选取。
[0084] S103,确定每一关键评估指标对应的理想解;
[0085] 需要说明的是,本实施例中的理想解可以用于指示在相应关键评估指标下机房能效理想情况。在一个示例中,由于关键评估指标是从多个指标中选取出的,因此可以预先为不同指标分别配置对应的理想解,以使得关键评估指标对应的理想解也可以是预先设定好的。
[0086] S104,基于所述至少一个关键评估指标各自对应的指标数据及理想解,对所述待评估机房进行能效状态评估。
[0087] 在一个示例中,对于每一关键评估指标,可以计算该关键评估指标对应的指标数据所指示的指标值与理想解之间的相似度,以通过所有关键评估指标各自对应的相似度来综合评估待评估机房的能效状态。
[0088] 在一种可选的实施方式中,所述根据所述多个指标分别对应的指标数据,从所述多个指标中选取出至少一个关键评估指标,包括:
[0089] 根据所述多个指标分别对应的指标数据,进行基于随机森林的特征选择处理;
[0090] 根据所述特征选择处理的结果,从所述多个指标中选取出至少一个关键评估指标。
[0091] 需要说明的是,本实施例中的基于随机森林的特征选择处理能够用于识别数据集中哪些特征对于预测目标变量最为重要。
[0092] 在一个示例中,可以将多个指标分别对应的指标数据作为用于训练的训练特征集,以使用训练特征集训练随机森林模型,其中,随机森林模型通过构建多个决策树,并在每个节点上随机选取一部分特征来分裂,可以减少模型的过拟合风险、提高泛化能力。在训练完成后,随机森林模型会提供一个feature_importances_属性(一个数组),表示模型认为各个特征的重要性。重要性通常是基于特征在所有决策树中的平均减熵或者基尼不纯度减少来计算的。数组中的值越大,说明该特征在模型中的重要性越高。特征重要性可以通过降序排列来查看。根据特征重要性排序,可以选择保留最重要的特征子集,通常可以设定一个阈值,只保留高于该阈值的特征。另一个示例是递归地移除最不重要的特征,重新训练模型并评估性能,直到达到满意的特征数量或性能不再显著提升。此外,还可以使用递归特征消除等方法结合随机森林进行特征选择。
[0093] 在一种可选的实施方式中,所述多个指标包括机房电源使用效率PUE指标、能耗质量指标、环境质量指标及算力质量指标,所述根据所述多个指标分别对应的指标数据,进行基于随机森林的特征选择处理,包括:
[0094] 以所述机房PUE指标对应的指标数据作为第一样本标签,且以所述能耗质量指标、所述环境质量指标及所述算力质量指标各自对应的指标数据作为第一样本特征,对第一随机森林模型进行多次迭代训练以进行所述特征选择处理;
[0095] 其中,所述特征选择处理的结果为所述第一随机森林模型满足第一停止迭代条件后输出的特征变量重要性。
[0096] 在一个示例中,参见图2,能耗质量指标可以包括列头柜能耗、机柜能耗和/或空调能耗;环境质量指标可以包括机房PUE、室外温湿度、机房温湿度和/或机柜测点温度;算力质量指标可以包括计算服务器CPU利用率和/或计算服务器内存利用率等。
[0097] 具体的,本实施例中可以使用Python以及sklearn框架构建随机森林(Random Forest,RF),以构建出第一随机森林模型的模型训练及特征分析程序。在训练时,可以通过随机森林算法判断变量重要性度量并对样本特征变量进行排序,每次从样本特征集合中去掉一个最不重要的特征,并逐次进行迭代,计算分类正确率。最终,得到特征变量个数较少、分类正确率最高的特征集合(即第一随机森林模型满足第一停止迭代条件后输出的特征变量重要性)作为特征选择处理的结果,即机房能效特征选择结果、重要能效评估指标集。作为示例,第一停止迭代条件可以包括迭代次数达到预设第一迭代次数阈值和/或第一随机森林模型收敛。
[0098] 在一种可选的实施方式中,所述对第一随机森林模型进行多次迭代训练,包括:
[0099] 在每一次迭代训练的过程中,利用K折交叉验证对所述第一随机森林模型进行训练。
[0100] 在一个示例中,参见图3,该K折交叉验证可以采用10折交叉验证。在本实施例中,单次迭代通过10折交叉验证方法可以增加可靠性。即在每一次迭代中,将数据集等分成10份,利用其中的9份作为训练集用于构建随机森林分类器,剩余的1份作为验证集数据进行验证。在交叉验证过程中,选择测试集上accuracyScore(分类准确率)最高的一次迭代产生的变量重要性排序作为删除特征的依据,将全部迭代的平均分类准确率作为该轮迭代的分类精度。当迭代的分类精度出现环比下降时,停止迭代输出最终指标集合。
[0101] 在一种可选的实施方式中,所述理想解包括正理想解及负理想解,所述确定每一关键评估指标对应的理想解,包括:
[0102] 至少基于所述至少一个关键评估指标各自对应的指标数据,构建第一关键评估指标矩阵;
[0103] 对所述第一关键评估指标矩阵依次进行第一正向化处理及第一标准化处理,得到第二关键评估指标矩阵;
[0104] 从所述第二关键评估指标矩阵的各个元素中,分别选取所述至少一个关键评估指标各自对应的正理想解及负理想解。
[0105] 其中一个示例可以是根据各个关键评估指标各自对应的指标数据利用TOPSIS法来确定正理想解及负理想解。具体实施如下:
[0106] 首先,根据各个关键评估指标各自对应的指标数据,定义第一关键评估指标矩阵的第i行第j列元素为xij,其中,第一关键评估指标矩阵中的行向量和列向量中的一者指示关键评估指标、且另一者指示待评估的对象(例如,所采用的不同能效方案)。
[0107] 然后,依次利用第一正向化处理及第一标准化处理对第一关键评估指标矩阵中的各个元素xij进行处理,其中,第一标准化处理可以包括归一化处理(将所有数据压缩在0到1之间)、区间化处理(将所有数据压缩在自己设定的区间)和/或均值化处理(当前值/平均值),以便于提升数据转化的维度和科学性。具体而言,针对第一关键评估指标矩阵中的各个元素xij,如果其全部都大于0,可使用“均值化”方式;如果元素中有负数或者0,可使用做“区间化”让数据限定在一个区间内,同时,也可以使用“归一化”,让数据全部介于0~1之间。
[0108] 最后,从所述第二关键评估指标矩阵的各个元素中,分别选取所述至少一个关键评估指标各自对应的正理想解及负理想解,可以包括:针对每一关键评估指标,从所述第二关键评估指标矩阵的各个元素中,选取出与所述关键评估指标对应的最大值作为与所述关键评估指标对应的正理想解,并选取出与所述关键评估指标对应的最小值作为与所述关键评估指标对应的负理想解。
[0109] 需要说明的是,正理想解可以用于指示在相应关键评估指标下机房能效理想最优情况,负理想解可以用于指示在相应关键评估指标下机房能效理想最劣情况。
[0110] 在一种可选的实施方式中,所述第二关键评估指标矩阵指示若干待评估方案,所述基于所述至少一个关键评估指标各自对应的指标数据及理想解,对所述待评估机房进行能效状态评估,包括:
[0111] 基于所述第二关键评估指标矩阵及所述至少一个关键评估指标各自对应的正理想解,计算所述若干待评估方案各自对应的正向K‑L散度;
[0112] 基于所述第二关键评估指标矩阵及所述至少一个关键评估指标各自对应的负理想解,计算所述若干待评估方案各自对应的负向K‑L散度;
[0113] 基于每一待评估方案对应的正向K‑L散度及负向K‑L散度,计算每一待评估方案对应的相对接近度;
[0114] 基于所述若干待评估方案各自对应的相对接近度,对所述待评估机房进行能效状态评估。
[0115] 在部分现有技术中,传统TOPSIS法采用欧式距离度量各个评价方案与理想方案间的距离,但因评价指标间通常存在一定非线性关联,导致其会产生计算结果不可信问题。
[0116] 针对上述现有技术中所存在的问题,本实施例改进使用“双向K‑L散度”进行理想方案间的偏差计算,以优化非线性关联。本实施例中,由于传统K‑L散度本身具有不对称性(即KL(P|Q)≠KL(Q|P)),使用双向K‑L散度通过交换这两种分布的位置以间接使用整体对称的K‑L散度,能够解决不对称性问题。
[0117] 定义指标集合(即第二关键评估指标矩阵)为X,最优指标集合(即至少一个关键评+估指标各自对应的正理想解)为X ,最劣指标集合(即至少一个关键评估指标各自对应的负‑
理想解)为X,另外,为便于解释说明,下面以一列向量来表示一个关键评估指标。
[0118] 最优指标集X+可以由X中每列元素的最大值构成:
[0119]
[0120] 最劣指标集X‑由X每列元素的最小值构成:
[0121]
[0122] 其中,xi′j表示第二关键评估指标矩阵的各个元素,i=1,2,3,...,n。
[0123] 一个具体的示例中,基于所述第二关键评估指标矩阵及所述至少一个关键评估指标各自对应的正理想解,利用夹角余弦算法计算所述若干待评估方案各自对应的正向K‑L散度 具体可以表示为:
[0124]
[0125] 一个具体的示例中,基于所述第二关键评估指标矩阵及所述至少一个关键评估指标各自对应的负理想解,利用夹角余弦算法计算所述若干待评估方案各自对应的负向K‑L散度 具体可以表示为:
[0126]
[0127] 一个具体的示例中,相对接近度Ci可以通过如下公式计算:
[0128]
[0129] 需要说明的是,本实施例中的相对接近度可以用于指示待评估方案与理想优劣解决方案的接近程度。而通过上式计算得到的相对接近度Ci,其值越大表示越优、越小表示越差,但应理解,也可以取Ci的倒数来表示相对接近度,在此不作严格限定。
[0130] 在一种可选的实施方式中,所述基于所述若干待评估方案各自对应的相对接近度,对所述待评估机房进行能效状态评估,包括:
[0131] 基于所述若干待评估方案各自对应的相对接近度,对所述若干待评估方案进行分类,以形成至少一个分类结果;
[0132] 利用所述至少一个分类结果及所述至少一个关键评估指标各自对应的指标数据,对第二随机森林模型进行多次迭代训练,得到机房能效评分预测模型;
[0133] 通过所述机房能效评分预测模型对所述待评估机房进行能效状态评估。
[0134] 需要说明的是,本实施例中若以一列向量来表示一个关键评估指标,则本实施例可以用一行向量来表示一个待评估方案,该待评估方案可以
[0135] 在一个示例中,基于所述若干待评估方案各自对应的相对接近度,对所述若干待评估方案进行分类,以形成至少一个分类结果,可以包括:按相对接近度的大小,将若干待评估方案进行排序,并将排序后的待评估方案进行分类。
[0136] 可选地,可以将至少一个分类结果转换为分段评分“优秀”、“良好”、“一般”、“较差”(例如,依次分别对应于相对接近度大小的Top 10%,Top 10~30%,Top 30~50%,后50%),并进行可视化呈现与展示,以便于让数据运营运维人员更直观的了解数据中心各能效方案间的优劣。
[0137] 在一种可选的实施方式中,所述利用所述至少一个分类结果及所述至少一个关键评估指标各自对应的指标数据,对第二随机森林模型进行多次迭代训练,得到机房能效评分预测模型,包括:
[0138] 以所述至少一个分类结果作为第二样本标签,且以所述至少一个关键评估指标各自对应的指标数据作为第二样本特征,对所述第二随机森林模型进行多次迭代训练,直至满足第二停止迭代条件,得到所述机房能效评分预测模型;
[0139] 其中,在每一次迭代训练的过程中,利用K折交叉验证对所述第二随机森林模型进行训练。
[0140] 在本实施例中,参见图4,可以再一次应用上述用于进行特征筛选的机器学习算法的随机森林来建立预测模型。随机森林算法是一种重要的基于Bagging的集成学习方法,通过对数据集的自助法(Bootstrap)重采样生成多个不同的数据集,并在每一个数据集上训练一棵分类树,最终结合每一棵分类树的预测结果作为随机森林的预测结果。
[0141] 本实施例中的随机森林算法是通过训练多个决策树并生成模型,然后综合利用多个决策树进行分类。本实施例中随机森林算法主要调整的参数有:
[0142] (1)构建的决策树个数ntree;
[0143] (2)决策树的每个结点进行分裂时需的输入特征的个数k(k可以取为log2n,其中n表示的是原数据集中特征的个数)。
[0144] 在每一次迭代训练的过程中,可以利用K折交叉验证(例如10折交叉验证)方法进行多次训练比对后,得到准确度最高的模型,使用其作为最终得到的机房能效评分预测模型。其中测试验证数据划分、10折交叉法与上述进行特征选择处理的部分雷同,在此不做重复描述。
[0145] 在一个示例中,第二停止迭代条件可以包括迭代次数达到预设第二迭代次数阈值和/或第二随机森林模型收敛。
[0146] 在一种可选的实施方式中,所述方法还包括:
[0147] 确定所述至少一个关键评估指标各自对应的主观权重;
[0148] 确定所述至少一个关键评估指标各自对应的客观权重;
[0149] 基于每一关键评估指标对应的主观权重及客观权重,计算每一关键评估指标对应的组合权重;
[0150] 所述至少基于所述至少一个关键评估指标各自对应的指标数据,构建第一关键评估指标矩阵,包括:
[0151] 基于所述至少一个关键评估指标各自对应的组合权重及指标数据,构建第一关键评估指标矩阵。
[0152] 在本实施例中,可以进一步将关键评估指标的数据与组合权重相乘来构建出相应的更准确的第一关键评估指标矩阵。具体示例可以为:首先定义组合权重系数(wj),再将带有权重的第一关键评估指标矩阵中的各个元素x′ij表示为:x′ij=wj*xij,其中,xij为不带权重的第一关键评估指标矩阵中的各个元素。
[0153] 可以理解的是,本实施例中的至少部分关键评估指标的主观权重和/或客观权重可以为预先设定好的。
[0154] 在部分现有技术中,机房能效综合评估方案一般采用层次分析法依据专家经验对机房能效参数的权重进行主观评估操作,从而容易受到决策专家主观判断和偏好的影响,导致结果的不确定性。
[0155] 针对上述现有技术,本实施例可以通过引入客观权重来对主观权重进行修正,从而在不忽略专家的主观评估权重的同时还能确保权重的客观性,降低专家主观偏好的影响。
[0156] 在一种可选的实施方式中,所述至少一个关键评估指标具体为至少两个关键评估指标,所述确定所述至少一个关键评估指标各自对应的主观权重,包括:
[0157] 获取所述至少两个关键评估指标各自对应的专家评价得分,以构建模糊互补判断矩阵,其中,所述模糊互补判断矩阵的元素可以用于指示所述至少两个关键评估指标两两之间的相对重要性标度,该相对重要性标度可以由相应的两个关键评估指标各自对应的专家评价得分确定(例如,如下表1,其中,元素i与元素j分别表示该相应的两个关键评估指标各自对应的专家评价得分);
[0158]
[0159]
[0160] 表1
[0161] 此时,评分表达式Sij可以具体表示为:0≤Sij≤1,Sii=0.5且Sij+Sij=1,(i,j=1,2,...,n)。
[0162] 可以理解的是,对于专家评价得分,若是已有指标,则可以选取预先存储的与该指标对应的专家评价得分,若是新增指标,则可以通过用户实时输入一个得分或者通过随机赋予一个得分来替代该指标对应的专家评价得分。
[0163] 基于所述模糊互补判断矩阵,计算所述至少两个关键评估指标各自对应的初始主观权重;
[0164] 一个具体示例中,首先,定义模糊互补判断矩阵为R=(rij)n*n,并定义W=(W1,W2,...,Wi,...,Wn)为R的权重向量,而后结合以下公式进行模糊互补判断矩阵的权重求解,其表达式如下:
[0165]
[0166] 其中,n为关键评估指标的个数,Wi为因素ri(即关键评估指标i)的初始主观权重。
[0167] 基于所述至少两个关键评估指标各自对应的初始主观权重,更新所述模糊互补判断矩阵;
[0168] 一个具体示例中,根据模糊互补判断矩阵计算结果(即所计算出的初始主观权重),进一步进行模糊特征矩阵运算以对模糊互补判断矩阵进行更新,其表达式如下:
[0169] W*=(Wij)n*n
[0170]
[0171] 其中,W*表示更新后的模糊互补判断矩阵。
[0172] 基于设定的校验阈值,对更新后的模糊互补判断矩阵进行整体一致性校验;
[0173] 需要说明的是,参见图5,本实施例中进行整体一致性校验,即对最终求解出的CI值的大小进行比较判定。根据FAHP(Fuzzy analytic hierarchy process,模糊层次分析法)的一致性判定规则,当CI的值越小时,说明该矩阵数据的一致性越优,本实施例中可以设定当CI<0.1时,校验数据可满足模糊一致性要求。
[0174] 在下面的算法中A=(aij)表征更新后的模糊互补判断矩阵,B=(bij)表征该更新后的模糊互补判断矩阵的特征矩阵,其表达式如下:
[0175]
[0176] 若校验不通过,则调整所述专家评价得分以重复上述步骤直至校验通过;
[0177] 若校验通过,则采用至少一种矩阵矫正法,分别对所述更新后的模糊互补判断矩阵进行矫正处理,得到至少一个矫正矩阵,并基于所述至少一个矫正矩阵,计算得到所述至少一个关键评估指标各自对应的主观权重,其中,所述至少一种矩阵矫正法包括算术平均法、几何平均法和/或特征值法。
[0178] 一个具体示例中,以下使用矩阵矫正法包括算术平均法、几何平均法和特征值法的情况来进行示例性的阐述,此时,至少一个关键评估指标各自对应的主观权重可以通过计算各个矫正矩阵的均值来表示,例如,当专家评价得分所对应的总评分人数为N时,假设有5个等级的关键评估指标,5个等级对应的评分人数依次表示为N1、N2、N3、N4、N5,则终评分的权重S的各级隶属关系评分人数总和应该与总参与打分人数相等,整个过程需满足公式:N1+N2+N3+N4+N5=N。则S=(S1,S2,S3,S4,S5)=[N1/N,N2/N,N3/N,N4/N,N5/N][0179] 在一种可选的实施方式中,所述确定所述至少一个关键评估指标各自对应的客观权重,包括:
[0180] 对所述至少一个关键评估指标各自对应的指标数据进行第二正向化处理,得到正向化数据,并对所述正向化数据进行第二标准化处理得到标准化数据;
[0181] 基于所述标准化数据,计算每一关键评估指标对应的信息熵;
[0182] 基于所述至少一个关键评估指标各自对应的信息熵,计算每一关键评估指标对应的客观权重。
[0183] 需要说明的是,本实施例可以使用采集的算力、能耗、环境数据,及专家输入指标正、负、适度范围,通过Pyhton程序自动化计算关联熵权重实现。熵权法在运算过程中可对指标数据本身的熵信息量进行分析评估,利用各指标的熵值大小来确定体系中各指标的客观权重。参见图6,本实施例的一个具体示例如下:
[0184] 首先,进行指标正向化处理(即第二正向化处理)。在能效评估体系中各类指标含义均存在差异,首先需将指标越大越好的划分为正向指标,指标越小越好的划分为负向指标,指标在某点或者某区间最好的划分为适度指标并定义适度值。
[0185] 通过算法公式将正向、负向、适度指标进行统一正向化处理,其表达式如下:
[0186] (1)正向指标处理:x′ij=xij
[0187] (2)负向指标处理:x′ij=max(xij)‑xij
[0188] (3)适度指标处理:
[0189] 其中,xij表示处理前的指标数据的值,x′ij表示处理后的指标数据的值。
[0190] 然后,所述第二标准化处理至少包括离差标准化法。使用离差标准化法对正向化数据进行标准化、归一化处理,以去除量纲的影响,使不同单位或量级指标能够进行比较、加权,标准化数据的值 的表达式如下:
[0191]
[0192] 此外,在数据进行归一化处理后,部分可能会出现等于0的情况,导致在利用熵值法求权重时取对数值无意义,影响评判结果。所以还可以对评价指标进行非负化处理,本实施例中使用的平移值为“最小值的绝对值加上0.01”。
[0193] 再者,进行指标信息熵计算。本实施例采用信息论中对于信息熵的定义进行计算,信息熵公式为:
[0194] 一组数据的信息熵
[0195] 其中
[0196] 如果Pij=0,则:
[0197] 其中,Yij可以表示标准化数据中第i行第j列的元素的值。
[0198] 最后,通过信息熵计算第j个关键评估指标的客观权重。定义t为指标个数。
[0199] 其表达式如下:
[0200]
[0201] 相应地,本申请实施例还提供一种机房能效评估装置,能够实现上述实施例提供的机房能效评估方法的所有流程。
[0202] 参见图7,示出了本申请实施例提供的机房能效评估装置的结构示意图,包括:
[0203] 指标数据获取模块701,用于获取待评估机房的多个指标分别对应的指标数据;
[0204] 关键评估指标选取模块702,用于根据所述多个指标分别对应的指标数据,从所述多个指标中选取出至少一个关键评估指标;
[0205] 理想解确定模块703,用于确定每一关键评估指标对应的理想解;
[0206] 评估模块704,用于基于所述至少一个关键评估指标各自对应的指标数据及理想解,对所述待评估机房进行能效状态评估。
[0207] 在一种可选的实施方式中,所述根据所述多个指标分别对应的指标数据,从所述多个指标中选取出至少一个关键评估指标,包括:
[0208] 根据所述多个指标分别对应的指标数据,进行基于随机森林的特征选择处理;
[0209] 根据所述特征选择处理的结果,从所述多个指标中选取出至少一个关键评估指标。
[0210] 在一种可选的实施方式中,所述多个指标包括机房电源使用效率PUE指标、能耗质量指标、环境质量指标及算力质量指标,所述根据所述多个指标分别对应的指标数据,进行基于随机森林的特征选择处理,包括:
[0211] 以所述机房PUE指标对应的指标数据作为第一样本标签,且以所述能耗质量指标、所述环境质量指标及所述算力质量指标各自对应的指标数据作为第一样本特征,对第一随机森林模型进行多次迭代训练以进行所述特征选择处理;
[0212] 其中,所述特征选择处理的结果为所述第一随机森林模型满足第一停止迭代条件后输出的特征变量重要性。
[0213] 在一种可选的实施方式中,所述对第一随机森林模型进行多次迭代训练,包括:
[0214] 在每一次迭代训练的过程中,利用K折交叉验证对所述第一随机森林模型进行训练。
[0215] 在一种可选的实施方式中,所述理想解包括正理想解及负理想解,所述确定每一关键评估指标对应的理想解,包括:
[0216] 至少基于所述至少一个关键评估指标各自对应的指标数据,构建第一关键评估指标矩阵;
[0217] 对所述第一关键评估指标矩阵依次进行第一正向化处理及第一标准化处理,得到第二关键评估指标矩阵;
[0218] 从所述第二关键评估指标矩阵的各个元素中,分别选取所述至少一个关键评估指标各自对应的正理想解及负理想解。
[0219] 在一种可选的实施方式中,所述第二关键评估指标矩阵指示若干待评估方案,所述基于所述至少一个关键评估指标各自对应的指标数据及理想解,对所述待评估机房进行能效状态评估,包括:
[0220] 基于所述第二关键评估指标矩阵及所述至少一个关键评估指标各自对应的正理想解,计算所述若干待评估方案各自对应的正向K‑L散度;
[0221] 基于所述第二关键评估指标矩阵及所述至少一个关键评估指标各自对应的负理想解,计算所述若干待评估方案各自对应的负向K‑L散度;
[0222] 基于每一待评估方案对应的正向K‑L散度及负向K‑L散度,计算每一待评估方案对应的相对接近度;
[0223] 基于所述若干待评估方案各自对应的相对接近度,对所述待评估机房进行能效状态评估。
[0224] 在一种可选的实施方式中,所述基于所述若干待评估方案各自对应的相对接近度,对所述待评估机房进行能效状态评估,包括:
[0225] 基于所述若干待评估方案各自对应的相对接近度,对所述若干待评估方案进行分类,以形成至少一个分类结果;
[0226] 利用所述至少一个分类结果及所述至少一个关键评估指标各自对应的指标数据,对第二随机森林模型进行多次迭代训练,得到机房能效评分预测模型;
[0227] 通过所述机房能效评分预测模型对所述待评估机房进行能效状态评估。
[0228] 在一种可选的实施方式中,所述利用所述至少一个分类结果及所述至少一个关键评估指标各自对应的指标数据,对第二随机森林模型进行多次迭代训练,得到机房能效评分预测模型,包括:
[0229] 以所述至少一个分类结果作为第二样本标签,且以所述至少一个关键评估指标各自对应的指标数据作为第二样本特征,对所述第二随机森林模型进行多次迭代训练,直至满足第二停止迭代条件,得到所述机房能效评分预测模型;
[0230] 其中,在每一次迭代训练的过程中,利用K折交叉验证对所述第二随机森林模型进行训练。
[0231] 在一种可选的实施方式中,所述装置还包括:
[0232] 主观权重确定模块,用于确定所述至少一个关键评估指标各自对应的主观权重;
[0233] 客观权重确定模块,用于确定所述至少一个关键评估指标各自对应的客观权重;
[0234] 组合权重确定模块,用于基于每一关键评估指标对应的主观权重及客观权重,计算每一关键评估指标对应的组合权重;
[0235] 所述至少基于所述至少一个关键评估指标各自对应的指标数据,构建第一关键评估指标矩阵,包括:
[0236] 基于所述至少一个关键评估指标各自对应的组合权重及指标数据,构建第一关键评估指标矩阵。
[0237] 在一种可选的实施方式中,所述至少一个关键评估指标具体为至少两个关键评估指标,所述确定所述至少一个关键评估指标各自对应的主观权重,包括:
[0238] 获取所述至少两个关键评估指标各自对应的专家评价得分,以构建模糊互补判断矩阵;
[0239] 基于所述模糊互补判断矩阵,计算所述至少两个关键评估指标各自对应的初始主观权重;
[0240] 基于所述至少两个关键评估指标各自对应的初始主观权重,更新所述模糊互补判断矩阵;
[0241] 基于设定的校验阈值,对更新后的模糊互补判断矩阵进行整体一致性校验;
[0242] 若校验不通过,则调整所述专家评价得分以重复上述步骤直至校验通过;
[0243] 若校验通过,则采用至少一种矩阵矫正法,分别对所述更新后的模糊互补判断矩阵进行矫正处理,得到至少一个矫正矩阵,并基于所述至少一个矫正矩阵,计算得到所述至少一个关键评估指标各自对应的主观权重,其中,所述至少一种矩阵矫正法包括算术平均法、几何平均法和/或特征值法。
[0244] 在一种可选的实施方式中,所述确定所述至少一个关键评估指标各自对应的客观权重,包括:
[0245] 对所述至少一个关键评估指标各自对应的指标数据进行第二正向化处理,得到正向化数据,并对所述正向化数据进行第二标准化处理得到标准化数据;
[0246] 基于所述标准化数据,计算每一关键评估指标对应的信息熵;
[0247] 基于所述至少一个关键评估指标各自对应的信息熵,计算每一关键评估指标对应的客观权重。
[0248] 本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的机房能效评估方法的步骤。
[0249] 本申请实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述任一项所述的机房能效评估方法的步骤。
[0250] 本申请实施例还提供了一种计算机设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的机房能效评估方法的步骤。
[0251] 参见图8,该实施例的计算机设备包括:处理器801、存储器802以及存储在所述存储器802中并可在所述处理器801上运行的计算机程序,例如机房能效评估程序。所述处理器801执行所述计算机程序时实现上述各个机房能效评估方法实施例中的步骤,例如图1所示的步骤S101‑S104。
[0252] 示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器802中,并由所述处理器801执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述计算机设备中的执行过程。
[0253] 所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可包括,但不仅限于,处理器801、存储器802。本领域技术人员可以理解,所述示意图仅仅是计算机设备的示例,并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机设备还可以包括输入输出设备、网络接入设备、总线等。
[0254] 所述处理器801可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field‑Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器801也可以是任何常规的处理器等,所述处理器801是所述计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分。
[0255] 所述存储器802可用于存储所述计算机程序和/或模块,所述处理器801通过运行或执行存储在所述存储器802内的计算机程序和/或模块,以及调用存储在存储器802内的数据,实现所述计算机设备的各种功能。所述存储器802可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器802可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0256] 其中,所述计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器801执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
[0257] 参见图9所示的流程图,是基于本公开中的任一部分或全部的描述而给出的一个具体的实施例。
[0258] 综上,本申请实施例至少具有以下有益效果:
[0259] 采用本申请实施例,在需要评估机房的能效时,获取待评估机房的多个指标分别对应的指标数据,以确保不会遗漏机房当前的数据及新增数据指标;根据多个指标分别对应的指标数据,从多个指标中选取出至少一个关键评估指标,以因应数据所指示的实际情况而实时选取关键的评估指标;确定每一关键评估指标对应的理想解;基于至少一个关键评估指标各自对应的指标数据及理想解,对待评估机房进行能效状态评估,从而能够准确评估出机房的当前能效状态,且可以对与机房能效相关的新增数据指标进行动态推理。
[0260] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本申请的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
[0261] 以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本申请的保护范围。