首页 / 一种基于辐照度数据对光伏出力预测的方法

一种基于辐照度数据对光伏出力预测的方法实质审查 发明

技术领域

[0001] 本发明涉及光伏发电技术领域,特别是涉及一种基于辐照度数据对光伏出力预测的方法。

相关背景技术

[0002] 光伏发电系统能够充分利用太阳能转化为电能。相较其他类型的发电产业,光伏板工作直接受光照影响,受其他环境因素影响较弱,因此光伏出力值与辐照度数据呈强相关,输出电压受气温影响大,导致光伏出力值具有较强的随机性。
[0003] 现有技术方案有主要有两种,一种是结合多种类型的气象数据对光伏功率进行预测,该方法的不足在于对数据种类以及关键特征的提取要求较为苛刻,对多项数据的精确要求会增加生产与运维成本。另一种是直接使用机器学习算法,该方法无法排除气象因素对实际光伏功率的影响,不同的天气情况数据特征存在差异,将不同类型的数据放在一起训练会导致噪声较大,对实际预测值产生影响。另外机器学习对数据量要求较大,会导致模型训练效率较低。
[0004] 因此,亟需设计一种基于辐照度数据对光伏出力预测的方法来克服上述一种或多种现有技术的不足。

具体实施方式

[0024] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
[0025] 在本发明实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语、“连接”、“安装”应做广义理解,例如,“连接”可以是可拆卸地连接,也可以是不可拆卸地连接;可以是直接连接,也可以通过中间媒介间接连接。此外“连通”可以是直接连通,也可以通过中间媒介间接连通。其中,“固定”是指彼此连接且连接后的相对位置关系不变。本发明实施例中所提到的方位用语,例如,“内”、“外”、“顶”、“底”等,仅是参考附图的方向,因此,使用的方位用语是为了更好、更清楚地说明及理解本发明实施例,而不是指示或暗指所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明实施例的限制。
[0026] 本发明实施例中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
[0027] 在本发明实施例中,“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0028] 在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本发明的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。因此本发明不受下面公开的具体实施例的限制。
[0029] 如图1所示,本发明提供一种基于辐照度数据对光伏出力预测的方法,其特征在于,包括以下步骤:
[0030] S1、读取历史数据中所有需要进行预测的风区涉及的风场对应的辐照度数据和光伏实测功率;
[0031] S2、处理空值数据,将获取的辐照度和功率数据进行卡尔曼滤波,记录辐照度为0的夜间数据所在时间段,将该时间段数据对应的辐照度与功率数据转换为0;
[0032] S3、根据步骤S2处理的多天辐照度数据,计算辐照度日均值,并进行聚类,根据辐照度均值分为晴天和阴天两种日类别,保存日类别结果;
[0033] S4、构建神经网络分位数回归模型,将步骤S3中获得的日类别数据导入神经网络分位数回归模型中进行训练,通过神经网络分位数回归模型,计算两种日类别的光伏出力值;其中,神经网络分位数回归模型会再次重复步骤S1、S2的过程,计算待预测辐照度日均值,然后导入模型中,根据辐照度数据的日均值判断天气形势,在所有的辐照度数据预测完毕后,整合预测得到的功率数据计算置信区间作为模型最终的光伏功率预测结果,并输出可视化的结果。
[0034] 进一步的,神经网络分位数回归模型的表达式为:
[0035] QY(τ|X)=f[X,V(τ),W(τ)]
[0036] 其中,V(τ)={vij(τ)}i=1,2…s;j=1,2…t是输入层到隐含层的连接权向量;W(τ)={wij(τ)}i=1,2…s;j=1,2…t为隐含层和输出层之间的连接权向量;
[0037] 将式展开可得:
[0038]
[0039] 其中,隐含层的输出通过将输入层的输出与V(τ)相乘,再通过g1激活函数来计算;输出层的输出则是隐含层输出与W(τ)相乘,再通过g2激活函数来计算;vij(τ)是输入层到隐含层的连接权值;wjk(τ)是隐含层到输出层的连接权值;xi表示输入向量X的第i个元素。
[0040] 进一步的,在本实施例中,神经网络分位数回归模型的构建包括:指定神经元数量、激活函数、正则化方式、训练轮数、参数样本数量,并定义分位数损失函数;其中,指定神经元数量和参数样本数量根据项目实际的数据情况以及训练的准确率、模型训练运行效率来调整。
[0041] 进一步的,在本实施例中,所述神经网络分位数回归模型的训练包括以下步骤:a、前向传播:输入数据通过神经网络的层,计算每个层的输出;b、计算损失:使用损失函数计算预测输出与真实值之间的差异;c、反向传播:根据损失函数的梯度,调整每个权重和偏置;d、权重更新:根据学习率,更新权重和偏置;e、重复前述步骤,直至模型的损失函数值收敛或达到预设的训练轮数;
[0042] 进一步的,在本实施例中,所述激活函数为ReLu激活函数,表达式为f(x)=max(0,x);
[0043] 进一步的,在本实施例中,所述分位数损失函数为:
[0044] L(ytrue,ypred)=mean(max(tau×e,(tau‑1)×e))
[0045] 其中,ypred是神经网络输出的预测值,ytrue是实际观测到的真实值,e是真实值和预测值之间的误差,tau表示分位数的标量,取值范围为[0,1],其中0.5对应于中位数;
[0046] 具体的,首先获取所需要进行预测的风区风场历史一年内逐小时的辐照度数据和光伏实测功率,随后处理获取的数据中的空值数据,空值数据的处理可以是删除、填充、插值、模型处理、使用特殊值等,再将辐照度数据和光伏功率数据采用卡尔曼滤波进行优化;其中,卡尔曼滤波的处理包括预测和更新,预测是根据系统的动态模型预测下一时刻的状态估计和误差协方差,其包括:
[0047] 状态预测,表达式为:
[0048] 误差协方差预测,表达式为:
[0049] 式中, 是在时刻K的状态预测,Φk是状态转移矩阵,Bk是控制矩阵,uk是控制输入,Pk|k‑1是预测的误差协方差,Qk是过程噪声协方差矩阵;
[0050] 更新是根据新的预测数据来修正预测的状态,并更新误差协方差,其包括:
[0051] 卡尔曼增益计算,表达式为:
[0052]
[0053] 状态更新,表达式为:
[0054] 误差协方差更新,表达式为:Pk=(I‑KkHk)Pk|k‑1;式中,Kk是卡尔曼增益,zk是观测值,Hk是观测矩阵,Rk是观测噪声协方差矩阵;
[0055] 随后记录辐照度为0的夜间数据所在段,将该时间段数据对应的辐照度与光伏功率数据转换为0,再根据处理后的多天辐照度数据,计算出每天的辐照度日均值,并将计算出的辐照度日均值通过KMeans聚类进行聚类,总体归类为两类分别是晴天和阴天,并保存聚类结果,其中将天气形势分为晴天和阴天是因为不同的天气形势对应不同的数据特征,环境温度、阴影遮挡均会对光伏发电效率产生影响,模型在预测时无法排除其他因素对功率的影响,不区分不同的天气形势,相近辐照度可能对应差距较大的不同功率值,因此将天气形势分为晴天和阴天有助于减少不同种天气形势数据中的噪声对模型训练的影响,且区分晴天阴天可以一定程度上排除其他环境因素对功率的影响;其中晴天或阴天的判断是根据当天的光照幅度值,晴天的光照幅度均值大,阴天的光照幅度均值小;
[0056] 需要指出的是,本申请为便于说明,将聚类的类目归为两类,在实际的操作过程中,可根据实际场景与天气形势分为更多类别,且聚类的方式可根据使用需求更换。
[0057] 最后构建神经网络分位数回归模型,并导入聚类模型聚类得到的晴天(或阴天)对应的训练数据对神经网络分位数回归模型进行训练,模型的训练分为两种,一种是晴天数据训练的模型,另一种是阴天数据训练的模型,通过对应的训练模型计算聚类出的两种日类别的光伏出力值,导入的训练数据包括输入数据辐照度和输出数据光伏出力。
[0058] 其中神经网络分位数回归模型的主体框架结构部分与传统神经网络模型相同,包含对输入层、隐含层与输出层的构建与训练;
[0059] 输入层(Input Layers)接受外部数据作为神经网络的输入,没有任何计算或变换,它主要负责将外部数据转换为神经网络可处理的格式后,传递给神经网络的下一层,作为神经网络的初始输入;
[0060] 隐含层(Hidden Layers)作为神经网络的核心部分,负责对输入层传递的数据进行复杂的非线性变换和特征提取,每个隐含层由多个神经元(或节点)组成,每个神经元都有一组可调节的权重和阈值,隐含层通过使用激活函数对输入进行加权求和以及非线性变换,生成新的特征表示,通过多个隐含层的串联,神经网络可以学习提取更高层次、更抽象的特征;
[0061] 输出层(Output Layers)负责将网络的最终预测结果呈现给外部环境。输出层的神经元数目通常与任务的类别或输出维度相对应。输出层通过激活函数将隐含层的特征转换为最终的输出结果。
[0062] 神经网络分位数回归模型针对光伏厂实际数据特征与业务场景,使用拟合非线性模式和特征的激活函数ReLu,其定义为F(x)=max(0,x),ReLU的输出在非负区域为常数值,只有在输入大于0的情况下才激活。这导致部分神经元对输入信号不敏感,可以使网络具备稀疏激活的特性。稀疏激活可以提高模型的泛化能力,减少过拟合的风险。ReLU的导数在正区域为常数1,在负区域则为0,这意味着ReLU在正区域能够更好地传递梯度。相比于Sigmoid或Tanh等函数,ReLU可以缓解梯度消失,即梯度逐渐变小并趋近于零的问题,有利于训练深层神经网络。ReLU函数在大于0的区域梯度恒定为1,这使得神经网络的梯度更加稳定,在反向传播时能够更好地更新权重参数。而对于小于0的输入,ReLU的梯度为0,这也有助于稀疏性和减少冗余计算。
[0063] 神经网络分位数回归模型使用分位数损失函数,其训练与预测结果直接受损失函数分位数拟合结果的影响,训练过程中可通过计算数据损失衡量模型在训练数据上的拟合程度。
[0064] 分位数损失函数计算了预测值和目标值之间的差异e(即误差),然后根据预定义的分位数tau对误差进行加权,通过不同的分位点得到不同的参数估计。具体来说,该函数首先计算了e乘以tau和e乘以tau‑1的最大值,然后取其平均值作为损失值。这种分位数损失函数的特点是对不同的分位数采取不同的加权策略,通过调节分位数tau的值可以控制模型对不同分位数数据的关注程度。例如,如果tau取0.5,则相当于计算中位数损失(50th分位数),如果tau取0.9,则相当于计算90th分位数损失;
[0065] 其中,参数估计可通过优化损失函数来获得最佳的模型参数值,其中损失函数包含了数据损失和正则化项。神经网络分位数回归模型的V(τ),W(τ)权重参数的估计可以转化为如下的优化问题:
[0066]
[0067] 该函数由数据损失项和正则化项这两部分组成。数据损失项是模型的主要损失,它衡量模型预测的分位数与实际观测到的分位数之间的差异。这里使用了绝对值|Yi‑f(Xi,V,W)|来度量这种差异。正则化项为了防止模型过拟合。它包含两个部分:L1正则化项:权重向量的绝对值之和,它鼓励权重的稀疏性,即权重中有很多零值。L2正则化项:
λ2∑jwj,权重向量的平方和,鼓励权重的较小值。
[0068] 函数中min表示最小化,(V,W)表示权重参数的集合,τ|Yi‑f(Xi,V,W)|表示每个样本的损失项,(1‑τ)|Yi‑f(Xi,V,W)|表示预测分位数与真实分位数之间的差异的绝对值,(1‑τ)是一个缩放因子,用于调整损失函数的形状,λ1和λ2控制正则化项的强度。
[0069] 神经网络参数估计是一种用于训练神经网络的方法,它旨在根据输入数据和目标输出来估计神经网络中各个权重和偏差的值。权重参数是神经网络中连接不同神经元的权重值。权重参数的估计过程涉及到迭代优化算法,模型算法中使用梯度下降等方法来不断调整权重参数的值。在模型的训练过程中,神经网络会根据给定的数据和损失函数,使用反向传播算法来调整权重参数,以最小化损失函数。因此,为防止模型出现过拟合情况,矫正损失函数得到局部最优解或全局最优解,模型加入正则化函数并指定惩罚因子来控制模型的复杂度和泛化能力。
[0070] 正则化包括L1、L2两种方式,其中L1为模型参数的绝对值之和乘惩罚因子λ,L2为模型参数的平方和的平方根乘惩罚因子λ。正则化函数中式中惩罚因子即为公式中λ1λ2,模型中将惩罚因子均设为1。惩罚因子通过对权重参数进行约束,惩罚不满足约束条件的个体,解决约束优化问题。通过增加惩罚因子,可以鼓励权重参数趋向于较小的值,从而控制模型的复杂度。通过引入惩罚因子,可以限制权重参数的取值范围,并降低过拟合的风险。在神经网络中,权重参数越大,模型的复杂度和灵活性越高。算法通过使用正则化函数、设定合适的正则化惩罚因子数值,提高了模型整体的性能与预测准确度。
[0071] 模型通过构建基础的神经网络模型、分位数损失函数与设定正则化函数生成基础神经网络分位数回归模型。之后进入模型训练部分,该模型将针对每一个的辐照度预测模型数据分别进行训练与预测。模型选择一个辐照度模型预测得到的历史辐照度数据和实测出力数据作为训练数据,从训练数据中选择对应的聚类得到的日类别(晴天或阴天)训练数据,进行多次训练。得到所有训练后的神经网络模型后就可以对待预测时刻辐照度数据进行预测。模型通过读取预测时刻对应的和辐照度模型和聚类日类别结果选择合适的神经网络分位数回归模型进行光伏出力预测。最终可得到所有辐照度模型对应的光伏出力预测结果。
[0072] 以下提供一具体的案例分析:
[0073] 以新疆哈密天润石城子光伏电站652272号光伏厂1月20日0点‑1月21日0点,经度93.6054纬度43.041401为例,通过光学传感器获取的光照强度数据,并将实际的功率数据,进行步骤S1、S2、S3的过程,再将数据导入神经网络分位数回归模型中进行预测,预测的结果如图2所示;
[0074] 由于实际光伏出力值变化较为复杂,为尽量消除单点预测带来的难以消除的计算误差,实现对未来光伏出力值更为转缺的短期预测,案例使用辐照度数据为多个不同算法的预测得到的辐照度数据,模型针对每个辐照度模型的数据分别进行预测,最后计算这多个模型结果的置信区间,得到光伏出力的数值范围。
[0075] 综上所述,本申请采用卡尔曼滤波对数据进行处理,提升了模型的预测的精度与准度,且采用KMeans聚类对不同天气形势的归类,减少了气象因素对光伏出力值的影响,并且即通过找到同类型数据减少模型训练成本,提高运行效率,使用神经网络分位数回归模型对光伏出力进行预测,通过构建特殊的损失函数、根据数据情况调整分位数数值,实现对功率数据的精准预测。
[0076] 本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和修改,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示例。

当前第1页 第1页 第2页 第3页
相关技术
对光出力相关技术
度数对光相关技术
刘大贵发明人的其他相关专利技术