首页 / 预测方法和预测装置

预测方法和预测装置无效专利 发明

技术领域

[0001] 本公开涉及计算机领域,特别涉及一种预测方法和预测装置。

相关背景技术

[0002] 随着科学技术的发展及预测需求的增大,越来越多的预测模型被提出并且应用。预测模型的目标是预测值尽可能的等于实际值。然而,现实的情况是,预测值与实际值经常不相等。预测值与实际值的差值就是这些预测模型的预测误差。

具体实施方式

[0028] 下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。
[0029] 为了提高预测的准确性,提出本公开。
[0030] 图1为本公开预测方法一个实施例的流程示意图。
[0031] 如图1所示,本实施例的预测方法10包括:
[0032] 步骤110,根据预测模型的预测值和真实值确定预测误差序列。
[0033] 其中,预测模型例如包括:神经网络模型、移动平均模型、梯度提升决策树、随机森林决策树等,但不限于所举示例。通常情况下,预测模型先经过训练,然后再被用来预测。预测模型的训练和预测可以参考现有技术。
[0034] 其中,预测值与实际值的差值就是这些预测模型的预测误差。多组预测值与实际值的差值序列就是这些预测模型的预测误差序列。预测误差序列通常可以是历史预测误差数据,即根据预测模型的历史预测值和历史真实值确定历史预测误差序列。
[0035] 步骤120,去除预测误差序列中的异常值。
[0036] 在预测误差序列中,与大部分的预测误差表现不同的少数预测误差,可以视为预测误差序列中的异常值。因此,根据大部分的正常预测误差确定预测误差的一个合理范围,将合理范围之外的预测误差确定为异常值,并去除。
[0037] 步骤130,计算剩余的预测误差序列的均值。
[0038] 假设n个预测误差的序列ε1,ε2,...,εn去除异常值后剩余m个预测误差ε'1,ε'2,...,ε'm。根据中心极限定理,随着剩余的预测误差序列的样本足够多时,剩余的预测误差序列是服从正态分布的,可以参考后续的公式1和公式2,计算剩余的预测误差序列的均值(设为μ')和标准差(设为σ')。
[0039] 步骤140,利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。
[0040] 在一个实施例中,预测模型的待预测值减去剩余的预测误差序列的均值作为预测模型补偿后的待预测值。
[0041] 本实施例利用历史预测误差数据,对待预测值进行补偿,提高预测的准确性。
[0042] 本公开还提出两种示例性的去除预测误差序列中的异常值的方法。
[0043] 图2为本公开去除预测误差序列中的异常值的一个实施例的流程示意图。
[0044] 如图2所示,该实施例去除预测误差序列中的异常值的方法20包括:
[0045] 步骤210,假设获得了n个预测误差的序列ε1,ε2,...,εn,根据中心极限定理,每次的预测误差均是互相独立的随机变量,随着预测误差序列的样本足够多时,预测误差序列是服从正态分布的,可以据此计算预测误差序列的均值(设为μ)和标准差(设为σ)。
[0046]
[0047]
[0048] 此外,根据大数定理,随着预测误差序列的样本足够多时,样本的均值接近总体的均值,据此可以用预测误差序列的均值来代表预测误差的均值。
[0049] 步骤220,根据预测误差序列的均值和标准差确定预测误差的合理范围。
[0050] 其中,预测误差的合理范围为预测误差序列的均值加上或减去根据预测误差序列的标准差所确定的浮动范围。公式表示如下:
[0051] μ-p×σ<ε<μ+p×σ  (公式3)
[0052] 其中,p×σ表示根据预测误差序列的标准差所确定的浮动范围,p为浮动系数,其数值例如为0.5,1,1.5,2,3等,但先不限于所举示例,p越大,预测误差的合理范围越大,去除的预测误差越少,可根据业务需要设置p的值。例如,p=1时,约去除35%的预测误差,约65%的预测误差被保留下来。
[0053] 步骤230,去除预测误差序列中在合理范围之外的预测误差。
[0054] 例如,ε1,ε2,...,εn中不在公式3所示合理范围中的预测误差将被去除。
[0055] 从而,根据中心极限定理和大数定理,去除了预测误差序列中的异常值。
[0056] 图3为本公开去除预测误差序列中的异常值的再一个实施例的流程示意图。
[0057] 如图3所示,该实施例去除预测误差序列中的异常值的方法30包括:
[0058] 步骤310,利用预测误差序列确定线性回归模型。
[0059] 例如,利用预测误差序列,利用预测误差序列,可以尝试使用前n个预测误差作为变量x1,x2,...,xn,后一个预测误差作为目标值y,即线性回归方程为y=w1×x1+w2×x2+...wn×xn+b,其中w1,w2,...,wn,b为未知变量,利用最小二乘法去拟合线性回归方程,获得未知变量的值,从而获得线性回归方程(即线性回归模型)。
[0060] 步骤320,去除预测误差序列中偏离线性回归模型超过预设范围的预测误差。
[0061] 从而,利用线性回归方法,去除了预测误差序列中的异常值。
[0062] 图4为本公开预测装置一个实施例的结构示意图。
[0063] 如图4所示,本实施例的预测装置40包括:
[0064] 误差序列模块410,用于根据预测模型的预测值和真实值确定预测误差序列。
[0065] 序列处理模块420,用于去除预测误差序列中的异常值。
[0066] 补偿模块430,用于计算剩余的预测误差序列的均值,利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。
[0067] 其中,补偿模块430,用于将预测模型的预测值减去剩余的预测误差序列的均值作为预测模型补偿后的预测值。
[0068] 本实施例利用历史预测误差数据,对待预测值进行补偿,提高预测的准确性。
[0069] 图5为本公开预测装置另一个实施例的结构示意图。
[0070] 如图5所示,本实施例的预测装置50中的序列处理模块420包括:第一序列处理单元421或第二序列处理单元422。
[0071] 第一序列处理单元421,用于计算预测误差序列的均值和标准差。根据预测误差序列的均值和标准差确定预测误差的合理范围,去除预测误差序列中在合理范围之外的预测误差。
[0072] 其中,预测误差的合理范围为预测误差序列的均值加上或减去根据预测误差序列的标准差所确定的浮动范围。
[0073] 第二序列处理单元422,用于利用预测误差序列确定线性回归模型。去除预测误差序列中偏离线性回归模型超过预设范围的预测误差。
[0074] 本实施例提出两种示例性的去除预测误差序列中的异常值的方法。
[0075] 图6为本公开预测装置再一个实施例的结构示意图。
[0076] 如图6所示,本实施例的预测装置60包括:存储器610以及耦接至该存储器610的处理器620,处理器620被配置为基于存储在存储器610中的指令,执行前述任意一个实施例中的预测方法。
[0077] 其中,存储器610例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
[0078] 装置60还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630,640,650以及存储器610和处理器620之间例如可以通过总线660连接。其中,输入输出接口630为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为SD卡、U盘等外置存储设备提供连接接口。
[0079] 根据本公开的又一方面,提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的预测方法的步骤。
[0080] 本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0081] 本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0082] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0083] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0084] 以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

当前第1页 第1页 第2页 第3页