首页 / 一种基于数据挖掘的企业用电量分析与预测方法

一种基于数据挖掘的企业用电量分析与预测方法公开 发明

技术领域

[0001] 本发明涉及直流电源监测技术领域,更具体地说,涉及一种基于数据挖掘的企业用电量分析与预测方法。

相关背景技术

[0002] 电力行业是整个国家的一个非常重要的基础性行业,对整个国家的安全、社会的稳定以及人民的各方面生活有着重大的意义,电力能源不像其他产品一样可以存放,而是具有随发随用的特殊性,不能得到存储,这就对电能的产生、传输以及销售的过程提出了更高的要求,不能供大于求,浪费能量资源,也不能供不应求,满足不了用电客户的用电需要,因此,电量预测也就随之而来,通过对历史电量的分析,得到后期电量情况来提前制定发电、输电及供电的计划,电力需求量的预测决定发电、输电、配电系统新增容量的大小和发电设备的装机类型,如何完善电力规划进行,最大限度地提高规划质量做好电量预测工作,正逐渐成为电力行业的热门课题;但是在实际的使用过程中,随着新能源如风能和太阳能的快速发展,这些能源的
波动性给电力系统带来了额外的复杂性,而且企业的数据采集可能存在缺失或不连续的问题,特别是在老旧的工业设施中,数据采集设备的不足或故障可能导致数据不完整,预测技术的挑战也随之增加,需要更精准的量价预测技术来应对这种不确定性;
不同行业的用电模式和用电需求存在显著差异,如制造业、数据中心和商业楼宇
的用电特征各不相同,现有的预测模型很难适应这些行业特定的用电模式。

具体实施方式

[0016] 应用场景:在实际的使用过程中,随着新能源如风能和太阳能的快速发展,这些能源的波动性给电力系统带来了额外的复杂性,而且企业的数据采集可能存在缺失或不连续的问题,特别是在老旧的工业设施中,数据采集设备的不足或故障可能导致数据不完整,预测技术的挑战也随之增加,需要更精准的量价预测技术来应对这种不确定性;不同行业的用电模式和用电需求存在显著差异,如制造业、数据中心和商业楼宇
的用电特征各不相同,现有的预测模型很难适应这些行业特定的用电模式。
[0017] 如图1所示:一种基于数据挖掘的企业用电量分析与预测方法,具体步骤如下:步骤一:获取历史用电量数据,并根据历史用电量数据,从多方向进行用电特征分
析,挖掘得到用电规律信息和季节变化特征;需要说明的是,在本实施例中,可以利用历史用电量数据,从全市、区域、行业和规上工业企业四个方向进行用电特征分析,挖掘用电规律和季节变化特征;
通过采集这些信息,可以考虑不同行业的用电模式和用电需求存在显著差异,如
制造业、数据中心和商业楼宇的用电特征各不相同的问题,有利于后续预测的稳定性;
步骤二:分析代理购电用户规模、增速以及代理购电量的年度变化趋势,得到代理
购电的发展运行信息;
需要说明的是,代理购电用户指的是那些尚未直接参与电力市场交易的工商业用
户,由电网企业代表这些用户从电力市场中购电,确保用户的用电需求得到满足,电网企业需要定期预测代理购电工商业用户的用电量及典型负荷曲线,有助于电网公司及时跟踪代购电市场趋势变化,在进行用电量预测时,需要添加代理购电的发展运行信息;
需要说明的是,在本实施例中,还可以结合新能源发展和利用占比信息,减少对后
续预测的波动性;
步骤三:基于历史电量数据,构建指数平滑、ARIMA、SARIMA和LSTM神经网络多重时
序预测模型,并进行比较以选择最优模型;
步骤四:对所选模型进行残差分析和交叉验证,使用MSE、RMSE、MAE指标衡量模型
准确性,并确保模型预测趋势与实际趋势一致;
步骤五:使用验证后的最优模型,根据多方向进行用电特征分析,挖掘得到用电规
律信息和季节变化特征和代理购电的发展运行信息进行用电量预测,得到预测结果。
[0018] 需要说明的是,通过采用多方向用电特征分析,本方案能够深入挖掘不同行业如制造业、数据中心和商业楼宇的独特用电模式和季节性变化特征,这种细致的分析有助于构建更为精确的预测模型,从而提高用电量预测的准确性,同时,考虑到新能源发展和利用占比的信息,方案能够减少预测结果的波动性,增强模型对新能源波动性的适应能力。这种综合考虑多因素的方法,使得预测结果更加稳定,为企业电力规划和管理提供了可靠的数据支撑;通过精确的用电量预测,帮助企业优化电力资源配置,提前规划电力采购工作,降
低企业的电力成本,尤其是在电力市场波动较大的情况下,通过预测代理购电用户规模和增速,企业可以更好地理解市场动态,制定相应的购电策略,从而在保证用电稳定性的同时,进一步降低购电成本;
需要说明的是,电力行业是整个国家的一个非常重要的基础性行业,对整个国家
的安全、社会的稳定以及人民的各方面生活有着重大的意义,电力能源不像其他产品一样可以存放,而是具有随发随用的特殊性,不能得到存储,这就对电能的产生、传输以及销售的过程提出了更高的要求,不能供大于求,浪费能量资源,也不能供不应求,满足不了用电客户的用电需要,因此,电量预测也就随之而来,通过对历史电量的分析,得到后期电量情况来提前制定发电、输电及供电的计划,电力需求量的预测决定发电、输电、配电系统新增容量的大小和发电设备的装机类型,如何完善电力规划进行,最大限度地提高规划质量做好电量预测工作,正逐渐成为电力行业的热门课题;
但是在实际的使用过程中,随着新能源如风能和太阳能的快速发展,这些能源的
波动性给电力系统带来了额外的复杂性,而且企业的数据采集可能存在缺失或不连续的问题,特别是在老旧的工业设施中,数据采集设备的不足或故障可能导致数据不完整,预测技术的挑战也随之增加,需要更精准的量价预测技术来应对这种不确定性;
不同行业的用电模式和用电需求存在显著差异,如制造业、数据中心和商业楼宇
的用电特征各不相同,现有的预测模型很难适应这些行业特定的用电模式。
[0019] 作为可选的实施例:所述获取历史用电量数据的具体步骤如下:获取历史用电量数据,包括全市、区域、行业和规上工业企业的用电量信息;需要
说明的是,历史用电量数据通过供电公司的历史数据获得;
将收集到的数据进行整合,形成统一的数据集;
对收集到的数据进行清洗,处理缺失值,确保数据的质量和完整性,得到历史用电
量数据;
需要说明的是,企业的数据采集可能存在缺失或不连续的问题,特别是在老旧的
工业设施中,数据采集设备的不足或故障可能导致数据不完整;
本技术方案可以处理收集到数据的缺失值,减少对后续特征提取的影响。
[0020] 作为可选的实施例:所述对收集到的数据进行清洗,处理缺失值的具体步骤为:对收集到的数据按照时间顺序进行排列,确定哪些时间点的数据缺失;
对于每个方向,包括全市、区域、行业和规上工业企业,分别计算已知用电量数据
的均值,根据公式 ,计算获得,其中 是每个方向中已知的用电量数据点,是已
知数据点的数量,计算得到的均值来填补相应方向中的缺失值;
对于每个缺失的数据点,用其对应方向的均值进行替换。
[0021] 可以有效地处理电力历史数据中的缺失值,确保数据集的完整性,为进一步的分析和预测提供准确的数据基础。
[0022] 作为可选的实施例:所述根据历史用电量数据,从多方向进行用电特征分析,挖掘得到用电规律信息和季节变化特征的具体步骤如下:首先以年为单元,获取当前时间点前固定时间段的全市、区域、行业和规上工业企
业的用电量信息,得到固定时间段内的年度用电量数据;
将固定时间段内的年度用电量数据等分为若干阶段;例如,如果有20年的数据,可
以将其分为5个阶段,每个阶段包含4年的数据;
对于每个阶段的用电量数据点,计算其与其他所有阶段数据点之间的欧几里得距
离;由于数据点是二维的,可以直接应用欧几里得公式进行计算;
对于每个阶段的用电量数据点,确定其k个最近邻点,并计算这些最近邻点的欧几
里得距离的平均值,然后取该平均值的倒数得到局部可达密度LRD;
对于每个阶段的用电量数据点,计算其k个最近邻点的局部可达密度LRD的平均
值,并与该数据点的LRD进行比较,得到局部离群因子LOF;
确定一个异常阈值,用于区分异常和非异常数据点,如果某一阶段数据点的LOF值
大于这个阈值,则将其标记为异常阶段;否则,标记为正常阶段;
根据LOF值和异常阈值的比较结果,去除被标记为异常的阶段,保留被标记为正常
的阶段,得到正常阶段数据。
[0023] 经过上述步骤,我们可以得到正常阶段内的年度用电量数据,这些数据将用于进一步的分析和预测;需要说明的是,一个城市内的用电量数据,按年的单位来看,也会受到多种环境的
影响,例如疫情三年,某些城市发展停滞,用电量不增反减,这在大的周期来看是不正常的,如何基于长期预测,比如,挑选当前时间点前20年内每年的用电量,将20年等分成5个或者
10个阶段,对每个阶段进行分析,去除异常的阶段,再按照剩余的阶段进行预测,计算同比增长率等数据;
在本实施例中,对每个阶段的年度用电量数据进行分析,去除异常的阶段,得到正
常阶段内的年度用电量数据的具体方式如下:
对于每个数据点,即第i阶段的用电量 ,计算它与其他所有数据点(即其他阶段
的用电量)的欧几里得距离,在本实施例中,数据点是二维的,可以直接用欧几里得公式计算得到;
对于每个数据点,即第i阶段的用电量  ,计算其k个最近邻点的欧几里得距离的
平均值,然后取倒数得到局部可达密度LRD;
对于每个数据点,即第i阶段的用电量 ,计算其k个最近邻点的局部可达密度LRD
的平均值与第i个数据点的LRD的比值,得到局部离群因子LOF值;
确定一个异常阈值,在本实施例中,对于LOF算法,1.5或2这样的阈值常用于区分
异常和非异常数据点,如果某一阶段数据点的局部离群因子LOF值大于异常阈值,则标记为异常阶段,其余的标记为正常阶段;
可以从一段时间内的数据中识别并去除异常阶段,得到正常阶段内的年度用电量
数据,为进一步的分析和预测提供准确的数据基础;
例如:假设有20年的年度用电量数据,具体数值如下:从2000年到2019年,每年的
用电量分别为50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88和90亿千瓦时。将这20年的数据等分成5个阶段,每个阶段包含4年的数据;
首先,分析每个阶段的用电量数据,以识别是否存在异常阶段。在本例中,将使用
局部离群因子(LOF)算法来识别异常阶段,LOF算法通过计算每个数据点与其邻近点的密度偏差来识别异常。具体步骤如下:
对于每个阶段的用电量数据,计算它与其他所有阶段用电量数据的欧几里得距
离,这将帮助确定每个阶段相对于其他阶段的位置;
接着,确定每个阶段的k个最近邻点,并计算这些最近邻点的欧几里得距离的平均
值,然后,取这个平均值的倒数,得到每个阶段的局部可达密度(LRD);
计算每个阶段的局部离群因子(LOF)值,这是通过比较其k个最近邻点的LRD平均
值与该阶段的LRD得到;
设定一个异常阈值,例如1.5,如果某个阶段的LOF值大于这个阈值,将其标记为异
常阶段。
[0024] 作为可选的实施例:对于正常阶段的年度用电量数据,计算其每年同比增长率,通过同比增长率识别年度用电量的增长或下降趋势;需要说明的是,在本实施例中,同比增长率通过本期用电量减去上一期的用电量再除以上一期的用电量得到;对于正常阶段的年度用电量数据,进一步分析月度用电量数据,识别月度间的用
电量波动,包括季节性波动和非季节性波动;需要说明的是,具体步骤包括确定季节性变化的期间(如以月为单位的周期性),使用移动平均的方法分离趋势,分离季节性成分;
对于正常阶段的年度用电量数据,进一步提取工作日与周末的用电量数据,计算
两者之间的差异,作为识别工作日和非工作日的用电规律;
对于正常阶段的年度用电量数据,进一步分析一天内不同时间段的用电量变化,
得到日内用电高峰和低谷时段;需要说明的是,对比工作日与周末的用电量数据,分析两者之间的差异,以识别工作日和非工作日的用电规律。可以通过计算工作日与周末的平均用电量,并比较其差异来实现;
将上述数据作为用电规律信息和季节变化特征。
[0025] 作为可选的实施例:所述步骤二的具体工作方式如下:基于当前代理购电用户档案数据,分析全市代理购电用户数量、占所有参与市场
化购电用户的比例;需要说明的是,在本实施例中,具体的计算方式为代理购电用户的数量除以市场化购电用户总数获得;
基于当前历史代理购电用户年度新增数据,分析全市代理购电用户年度新增用户
数及同比增速情况;
将上述数据作为代理购电的发展运行信息;需要说明的是,在本实施例中,可以通
过当前年份新增用户数量减去上一年新增用户数量再除以上一年新增用户数量获得;
需要说明的是,可以系统地分析代理购电用户数量、比例以及年度新增用户数和
购电量的变化趋势,为电力市场管理和决策提供数据支持;
还包括收集新能源发电量,将固定时间段内新能源发电量除以总发电量得到新能
源发电量占比。需要说明的是,在本实施例中,固定时间段可以为当前时间段前一年。
[0026] 作为可选的实施例:所述步骤三的具体工作方式如下:基于用电规律信息、季节变化特征、代理购电的发展运行信息和新能源发电量占
比,划分训练集和测试集,构建指数平滑预测模型;需要说明的是,指数平滑法的基本公式:
St=a*yt+(1‑a)*St‑1,其中St为时间的平滑值,yt为时间的实际值,St‑1为时间t‑1的平滑值,a为平滑常数,其取值范围为[0.1]
据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑和三次指数平
滑法等,具体依据实际情况进行模型选择;
基于用电规律信息、季节变化特征、代理购电的发展运行信息和新能源发电量占
比,划分训练集和测试集,构建ARIMA预测模型;需要说明的是,在本实施例中,时间序列挖掘-自回归积分滑动平均模型ARIMA模型即自回归积分滑动平均模型,适用于各种领域的时间序列分析,其建模思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,构成该时序的单个序列虽然具有不确定性,但整个序列的变化却有一定的规律性,ARIMA(p,d,q)中,AR是“自回归”,I是“差分法”,MA为“滑动平均”;p为自回归项数,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数);
具体步骤为,使用单位根检验(如ADF检验)来确定时间序列的平稳性;
如时间序列非平稳,进行一阶或多阶差分,直至序列平稳;
识别合适的ARIMA模型参数(p,d,q):
p:自回归项数,通过自相关函数(ACF)图确定。
[0027] d:差分次数,通过平稳性检验确定;q:移动平均项数,通过偏自相关函数(PACF)图确定;
根据识别的参数,建立ARIMA(p,d,q)模型;
基于用电规律信息、季节变化特征、代理购电的发展运行信息和新能源发电量占
比,划分训练集和测试集,构建SARIMA预测模型;需要说明的是,季节性差分自回归滑动平均模型,是ARIMA模型的扩展,可以支持带有季节性成分的时间序列数据。在ARIMA(p,d,q)基础上又增加了3个超参数(P,D,Q),季节性自回归系数(P)、季节差分系数(D)和季节性移动平均系数(Q),以及一个额外的季节性周期参数S;
基于用电规律信息、季节变化特征、代理购电的发展运行信息和新能源发电量占
比,划分训练集和测试集,构建LSTM的神经网络模型;需要说明的是,长短期记忆网络通过3种门结构:遗忘门,输入门和输出门来控制神经元对历史信息的记忆;
具体为,将数据划分为特征集(X)和标签(y),其中特征集包含时间序列的输入变
量,标签为预测目标变量;
进一步将数据集划分为训练集和测试集;
设计LSTM网络结构,确定网络层数、隐藏单元数、学习率等超参数;
使用深度学习框架(如TensorFlow或PyTorch)构建LSTM模型;
使用训练集数据对LSTM模型进行训练;
通过反向传播算法和优化器(如Adam或RMSprop)调整模型权重。
[0028] 作为可选的实施例:所述步骤四的具体步骤如下:指数平滑模型验证,对模型预测结果进行残差分析和交叉验证来衡量模型的准确
性;需要说明的是,其中交叉验证包含均方误差(MSE)、均方根误差(RMSE)或确定系数(R^2)指标,进行交叉验证,分析模型预测的趋势与实际趋势的一致性,确保模型能够捕捉到时间序列的主要特征;
ARIMA模型验证,对模型预测结果进行残差分析和计算平均绝对误差(MAE)、均方
根误差(RMSE)来衡量模型的准确性;需要说明的是,对ARIMA模型的预测结果与实际值进行比较,计算残差,并检查残差是否接近白噪声分布,计算平均绝对误差(MAE)和均方根误差(RMSE);SARIMA模型验证,对模型预测结果进行残差分析和计算平均绝对误差(MAE)、均方根误差(RMSE)来衡量模型的准确性;
SARIMA模型验证,对模型预测结果进行残差分析和计算平均绝对误差(MAE)、均方
根误差(RMSE)来衡量模型的准确性;需要说明的是,与ARIMA模型类似,对SARIMA模型的预测结果进行残差分析,计算MAE和RMSE,公式同ARIMA模型验证,分析模型预测的趋势与实际趋势的一致性,确保模型能够适应季节性变化;
LSTM的神经网络模型验证,对模型预测结果进行均方误差(MSE)、均方根误差
(RMSE)、R‑squared(R_)、平均绝对误差(MAE)来衡量模型的准确性。需要说明的是,对LSTM模型的预测结果与实际值进行比较,计算残差,计算均方误差(MSE)、均方根误差(RMSE)、R‑squared(R^2)和平均绝对误差(MAE):MSE、RMSE、MAE:如指数平滑模型中的定义,R^2:如指数平滑模型中的定义,分析LSTM模型预测的趋势与实际趋势的一致性,确保模型能够捕捉到时间序列的长期依赖关系。
[0029] 作为可选的实施例:所述步骤五中,选择使用验证后的最优模型的具体步骤为:对每个模型,通过衡量预测值与实际值之间差异的平方和的平均值得到均方误差
(MSE);
通过均方误差(MSE)的平方根,得到均方根误差(RMSE);用于衡量预测误差的大
小;
通过预测值与实际值之间差异的绝对值的平均值,平均绝对误差(MAE);
对每个模型的残差(实际值-预测值)进行分析,检查残差是否接近白噪声分布,
即均值为0,方差为常数的正态分布;
选择误差指标最小且残差分析均值最接近0的模型作为最优模型。
[0030] 需要说明的是,通过以上步骤,可以系统地比较不同模型的预测性能,并选择最适合实际数据特征的最优模型进行用电量预测。
[0031] 作为可选的实施例:所述步骤五的具体步骤方案如下:全市用电量预测,根据所选择的模型,结合历史月度用电量数据,预测全市未来固
定时间周期的用电量;固定时间周期可以为一个月或一年等设定的周期,分析预测电量时间变化趋势及同环比变化情况,为公司整体配电网增容和改建计划提供数据支撑;
区域用电量预测,根据所选择的模型,结合历史月度用电量数据,预测各区县公司
辖区内未来固定时间周期的用电量;分析各区县预测电量变化情况,为各区县根据自身用电量需求变化情况,合理开展配电网建设的规划和指导工作提供数据支撑。
[0032] 行业用电量预测,根据所选择的模型,结合历史月度用电量数据,预测各行业未来固定时间周期的用电量;分析各行业预测电量变化情况,为保障各行业未来用电稳定性提供数据支撑;规上工业企业用电量预测,根据所选择的模型,结合规上工业企业历史的月用电
量数据,预测规上工业企业未来固定时间周期的用电量;分析规上工业企业预测电量变化情况,协助规上工业企业优化电力资源配置、提前规划电力采购工作、保障用电稳定;
代理购电量预测,根据所选择的模型,结合,预测未来固定时间周期代理购电量;
分析预测购电量变化情况,支撑电网公司及购电企业与发电企业签署中长期购售电合同,保障居民用电稳定的同时进一步降低购电成本。
[0033] 工作原理通过采用多方向用电特征分析,本方案能够深入挖掘不同行业如制造业、数据中
心和商业楼宇的独特用电模式和季节性变化特征,这种细致的分析有助于构建更为精确的预测模型,从而提高用电量预测的准确性,同时,考虑到新能源发展和利用占比的信息,方案能够减少预测结果的波动性,增强模型对新能源波动性的适应能力。这种综合考虑多因素的方法,使得预测结果更加稳定,为企业电力规划和管理提供了可靠的数据支撑;
通过精确的用电量预测,帮助企业优化电力资源配置,提前规划电力采购工作,降
低企业的电力成本,尤其是在电力市场波动较大的情况下,通过预测代理购电用户规模和增速,企业可以更好地理解市场动态,制定相应的购电策略,从而在保证用电稳定性的同时,进一步降低购电成本。
[0034] 以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术员工来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本模板的保护范围。

当前第1页 第1页 第2页 第3页