首页 / 中长期电力负荷预测方法

中长期电力负荷预测方法有效专利 发明

技术领域

[0001] 本发明属于电气自动化技术领域,具体涉及一种中长期电力负荷预测方法。

相关背景技术

[0002] 随着经济技术的发展和人们生活的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。因此,保障电能的稳定可靠供应,就成为了电力系统最重要的任务之一。
[0003] 电力负荷预测电力系统的重要任务之一。电力负荷预测结果,能够用于指导电力系统运行方式和发电计划的制定。在节能环保的大趋势下,精确的预测电力负荷有助于降低发电成本,提升能源利用效率,同时也能改善电力系统稳定性。
[0004] 传统的负荷预测方法主要包括回归分析法、趋势外推法、时间序列法等;虽然这些方法模型简单,容易理解,但是,对于非平稳的电力负荷拟合效果并不理想。近年来,随着人工智能算法的发展和不断完善,已引起国内外专家的关注,并发表了一系列研究成果。其中,决策树、支持向量机、长短期记忆网络、卷积神经网络等被广泛应用于电力负荷预测。然而,浅层神经网络结构简单,对电力负荷的拟合能力不足;深度学习具有复杂函数强表征能力,但对于样本数量和质量要求高,且有大量的模型超参数需要调整以保证预测精度,限制了其在电力负荷预测中的应用。

具体实施方式

[0056] 如图1所示为本发明方法的方法流程示意图:本发明提供的这种中长期电力负荷预测方法,包括如下步骤:
[0057] S1.获取电力负荷历史数据;
[0058] 具体实施时,可以采用的电力负荷历史数据包括:输入特征和对应的输出电力负荷;
[0059] 输入特征包括历史日的高峰时段负荷值、从历史日电力负荷曲线中提取的负荷指标、历史日最低/最高温度、历史日总监测人口数、历史日净迁入/迁出人口数和预测日的最低/最高温度;其中,负荷指标包括最大负荷值、最小负荷值、24整点负荷平均值、峰谷差、最小负荷率、峰谷差率、24整点负荷累加值;
[0060] 通过选取与预测日相似的历史日作为XGBoost模型的训练集,其所隐藏的负荷变化规律更为一致,降低了数据挖掘难度,有助于提升XGBoost模型的预测性能;
[0061] S2.根据步骤S1获取的电力负荷历史数据,构建电力负荷数据集;具体为采用灰色关联算法,计算步骤S1获取的电力负荷历史数据中各历史日与预测日的相似度,并选取相似度大于设定阈值的历史日所对应的电力负荷历史数据构成电力负荷数据集;
[0062] 具体实施时,采用灰色关联算法,计算步骤S1获取的电力负荷历史数据中各历史日与预测日的相似度,具体包括如下步骤:
[0063] A.采用如下算式,对历史日和预测日的数据进行标准化处理:
[0064]
[0065] 式中x'j为标准化处理后的数据特征变量,且x'j=[x'j,1,x'j,2,...,x'j,i,...,x'j,n],x'j,i,为标准化处理后的第j日第i个数据的值;xj为标准化处理前的数据特征变量,且xj=[xj,1,xj,2,...,xj,i,...,xj,n],xj,i为标准化处理前第j日第i个数据的值;μ为标准化处理前第i个数据的均值;σ为标准化处理前第i个数据的方差;
[0066] B.采用如下算式,计算第j个历史日的特征变量x'j与预测日对应的特征变量x'0的关联系数:
[0067]
[0068] 式中ε'j,k为第j个历史日的第k个特征变量与预测日的第k个特征变量的关联系数;ρ为分辨系数,一般取为0.5;
[0069] C.对步骤B得到的关联系数进行求和,得到各历史日与预测日的相似度;
[0070] S3.基于XGBoost集成学习模型构建中长期电力负荷初步预测器;具体包括如下步骤:
[0071] a.设定电力负荷数据集表示为D={(xi,yi):i=1,2,...,n},其中包括n个样本,每个样本包括m个特征且对应的值为yi,并设定存在K棵回归树;则模型为 式中fk表示一棵回归树,fk(xi)表示第k棵树对数据集中第i个样本的计算分数;
[0072] b.设定目标函数为 式中l为误差函数,Ω(fk)为正则化惩罚项且 γ和λ为模型的惩罚系数,T为第k棵树的叶
子数目,wj为第k棵树的第j片叶子的权重;
[0073] c.利用前向分步算法对目标函数进行训练,设 为第i个样本在第t次迭代时的预测值,并添加ft以最优化以下目标函数:
[0074]
[0075] 式中ft(xi)为表示第t次迭代时对第i个样本的计算分数;
[0076] d.使用二阶泰勒展开,将步骤c中的目标函数简化并去掉常数项后得到:
[0077]
[0078] 式中gi为损失函数的一阶导数, 为求导函数;hi为损失函数的二阶导数,
[0079] e.最终得到目标函数为:
[0080]
[0081] 式中Ij表示叶子j的样本组;
[0082] f.最终,将目标函数转换为一个关于wj的一元二次方程求最小值的问题;设定树的结构固定,计算出叶子j的最优权重 为 Gj为损失函数的一阶导数和且 Hj为损失函数的二阶导数和且
[0083] h.最后,计算得到最优目标值Obj*为
[0084] S4.采用步骤S2构建的电力负荷数据集,对步骤S3构建的中长期电力负荷初步预测器进行训练和测试,从而得到电力负荷预测模型,以及得到电力负荷预测误差库;
[0085] 具体实施时,训练数据和测试数据不能交叉重复,而且训练数据选取的时间段先于测试数据选取的时间段;
[0086] 同时,得到电力负荷预测误差库具体包括如下步骤:
[0087] (1)将步骤S2构建的电力负荷数据集输入到电力负荷预测模型中,得到预测值;
[0088] (2)采用如下算式计算准确率Iacc:
[0089]
[0090] 式中yture为真实值,ypred为预测值;
[0091] (3)预测误差为真实值与预测值的差值,从而构建电力负荷预测误差库;
[0092] S5.采用核密度估计算法对步骤S4得到的电力负荷预测误差库进行概率建模,得到电力负荷预测误差的累积概率分布,从而进一步得到电力负荷预测误差区间;
[0093] 具体实施时,核密度估计算法具体包括如下步骤:
[0094] 核函数有多种结构,可以分为不平滑内核和平滑内核:不平滑核函数下的核密度估计无法体现相邻负荷数据间的差异性,为了得到较为平滑的模型,依次本发明中的核密度估计采用高斯函数核,核密度估计表达式为 e为负荷预测误差,ei为负荷预测值,h为窗宽,n为负荷预测误差的样本数;
[0095] 核密度估计的平滑度主要由窗宽h决定,如果窗宽h选择太小,核密度估计的局部波动性增加,从而影响整体分布情况,核密度估计的曲线很不平滑;如果窗宽h选择太大,数据会过于均值化而丢失信息,核密度估计的曲线过于平滑,且无法反映实际的概率密度分布;因此,采用平均积分平方误差法(Mean Integrated Squared Error,MISE),计算得到核密度估计的最优窗宽hAMISE为 式中K(e)为高斯核函数,k为2
中间变量且k=∫eK(e)de;f(e)为负荷预测误差的真实概率密度函数;
[0096] 电力负荷预测误差区间具体为:电力负荷预测误差区间为 式中eL为负荷预测误差的下置信分点,eH为负荷预测误差的上置信分点,α为设定的常数值且取值为
0~1;
[0097] S6.将预测日前若干时间(优选为5~10天)的电力负荷数据,输入到步骤S4得到的电力负荷预测模型中得到负荷预测值,并结合步骤S5得到的电力负荷预测误差区间,计算得到最终的预测日的电力负荷预测结果;具体为将预测日前若干时间的电力负荷数据,输入到步骤S4得到的电力负荷预测模型中得到负荷预测值,并将负荷预测值加上步骤S5得到的电力负荷预测误差区间,计算得到最终的具有设定置信水平下的电力负荷预测的区间值。
[0098] 以下结合一个具体实施例,对本发明方法进行进一步说明:
[0099] 首先分别构建A市居民电力负荷数据集以及B市和C市一般工商业电力负荷数据集,并利用灰色关联算法计算所述电力负荷数据集中各历史日与预测日的相似度,进而选取相似度大于预设阈值的样本组成相似日数据集;其中,设定的阈值分别为0.78(A市)、0.65(B市)、0.90(C市),使得在相似日数据集中的测试数据进行测试时,中长期电力负荷预测器所得平均准确率92.62%、94.45%、94.45%;
[0100] 然后,利用基于XGBoost集成学习模型构建中长期电力负荷初步预测器;
[0101] 接下来,利用数据集中的训练数据(A市:2020年01月01日至12月31日,B、C市:2020年01月01日至2021年3月31日),训练中长期电力负荷初步预测器,得到中长期电力负荷预测器;
[0102] 利用数据集中的测试数据(A市:2021年01月01日至01月31日,B、C市:2021年04月01日至04月30日),分别测试中长期电力负荷预测器的准确率(结果如表1所示),并建立电力负荷预测误差库;
[0103] 表1实施例1的中长期电力负荷预测器的准确率示意表
[0104]
[0105] 利用核密度估计对电力负荷预测误差进行概率建模,得电力负荷预测误差的累积概率分布(分别如图3、4、5所示),再基于设定的置信水平,获取电力负荷预测误差区间(如图2所示);
[0106] 最后,将预测日隔周前历史时间段(A市:预测日:2021年大年三十至大年初七,当预测日为2021年大年三十时,历史时间段为:2021年01月25日至02月03日,以此类推,B、C市:预测日:2021年5月1日至5月5日,当预测日为2021年5月1日时,历史时间段为:2021年04月14日至04月23日,以此类推)电力负荷数据集输入到预测模型,得到电力负荷预测值,再与电力负荷预测误差区间相加,求得一定置信水平(置信水平分别为:80%(A市)、80%(B市)和85%(C市))下电力负荷的不确定区间(分别如图6、7、8所示)。
[0107] 由图3~5可知,A市的预测误差在区间[‑10,‑3.5]和[3,10.5]的概率密度较大,B市的预测误差在区间[0,3.5]和[7,10.5]的概率密度较大,而C市的预测误差在区间[‑1.2,‑0.4]的概率密度较大,呈现出尖峰特性;说明本发明预测方法所采用的核密度估计KDE具有适应性强、形状灵活等优点,较好地拟合了负荷预测误差的概率密度分布。
[0108] 由图6~8可知,对2021年春节期间A市的居民负荷最大值、五一期间B市和C市的一般工商业负荷最大值进行区间预测,预测区间基本上能够在全局范围内完全包络住波动的居民/一般工商业负荷最大值曲线,且预测区间宽度能随着居民负荷/一般工商业负荷的波动大小进行动态调整。
[0109] 对比例1~3:
[0110] 本对比例与实施例1的区别仅在于:分别将所使用的XGBoost集成学习模型替换为典型的机器学习方法:长短期记忆网络(long short term memory,LSTM)(对比例2)、梯度提升树(gradient boosting decision tree,GBTD)(对比例3)、决策树(decision tree,DT)(对比例4)。所得准确率如表2所示。
[0111] 表2实施例1与对比例1~3的中长期电力负荷预测器的准确率对比表
[0112]
[0113] 由表2可知,实施例1中采用本发明使用的XGBoost模型具有更优异的泛化能力,能获得更佳的预测精度;提前一周预测A市的居民负荷最大值时,平均准确率为92.62%;预测B市、C市的一般工商业负荷最大值时,平均准确率均为94.45%;借助于优异的数据挖掘能力,XGBoost的预测误差也有所保障,预测A市居民负荷最大值所得最低准确率为84.09%,分别比LSTM、GBTD和DT高了3.49%、5.68%和9.96%;预测C市一般工商业负荷最大值所得最低准确率为87.19%,分别比LSTM、GBTD和DT高了3.11%、2.74%和3.52%。因此可以看到,本发明方法的预测准确度更高,可靠性更好。

当前第1页 第1页 第2页 第3页