首页 / 基于改进BP神经网络的机场离港行李流量长时预测方法

基于改进BP神经网络的机场离港行李流量长时预测方法实质审查 发明

技术领域

[0001] 本发明涉及机场流量数据分析技术领域,特别是涉及基于改进BP神经网络的机场离港行李流量长时预测方法。

相关背景技术

[0002] 机场是实现航班、行李、旅客三者高效分离聚散过程的场所。一直以来,衡量机场或航空公司发展水平的标准都是以客流量或货运流量等作为评价指标,鲜有提及行李流量的影响。然而,行李作为机场最基本的要素,其在机场运行过程中出现的问题日益突出,根据国际航空电信协会SITA发布的《行李IT洞察报告》显示,2019年全球航空业客运量高达45.4亿人次,托运行李量超过43亿件,较上一年增长10%,其中错运行李超过0.2亿件,因行李问题一年给民航业造成至少23亿美元的直接损失。此外,行李处理系统作为机场最大的单体系统,其主要功能是对旅客托运的行李进行收集和分拣,行李的流量大小直接决定了该系统的设计研发、资源配置和流程优化等多个环节。由此可见,随着民航业的发展,托运行李量的增长,行李的相关问题已逐渐成为制约民航业高效发展的关键问题。
[0003] 影响机场行李流量的因素众多,比如社会经济因素、自然天气状况、机场软硬件水平、竞争因素等等,不同的影响因素对行李流量的影响程度不尽相同。从宏观层面看,地区GDP水平、产业结构、机场辐射区域的人口数量与机场流量是紧密相关的。不同交通方式如飞机运输与铁路、公路、船舶运输之间存在的竞争关系也会影响机场行李的流量大小。从微观层面看,旅游人数、不同日期(例如:工作日、节假日、寒暑假等)、天气情况、航班类型、航线数量等指标对行李流量都有不同程度的促进作用。
[0004] 行李流量预测属于机场流量数据分析技术领域,目前针对流量预测按性质主要分为两类:定性预测和定量预测。定性预测主要以“人”为中心的“主观判断”作为依据,方法包括调查预测法、类比法、头脑风暴法等。定性预测的缺点非常明显,如无法量化、精度低等,难以对事物发展做出科学地、准确地描述。定量预测分为线性预测和非线性预测,其中非线性预测是主要的研究方向,多采用时间序列法、因果预测法、计量经济法、回归分析、深度学习等多种方法,机场的行李流量预测主要采用非线性预测。
[0005] 机场的行李流量预测按时间跨度分为长时预测和短时预测,长时预测以月度为单位,短时预测以天或当天某些时间段为单位。目前针对机场离港行李流量的预测还非常缺乏,且少数研究集中在短时预测领域,鲜有对长时预测进行研究。虽然有研究建议将机场离港客流量的预测结果直接转化为行李流量的预测结果,但相关研究并未给出科学的定量转化公式。因为行李的流量大小并非受到单一因素的影响,而是多种因素共同作用的结果,单纯地以机场客流量的预测结果来预测行李流量,可能导致预测结果偏差较大。此外,有研究通过机器学习如采用BP神经网络、支持向量机、灰色模型等算法模型对机场行李流量进行预测,这类方法能大幅度提升预测精度,但单一算法的局限性依然较大,如灰色预测、支持向量机等模型应用于短时预测具有较好的效果,但对于多分类问题解决效果并不理想,对于复杂数据内部的复杂相关性无法较为全面和正确地表达,计算过程可能会丢失数据间反映的某些重要信息,不太适合作为长时预测工具。BP神经网络虽然具有优秀的非线性映射能力,但如果初始权值、阈值选取不当,容易使BP神经网络陷入局部极小值或大幅增加计算时长。
[0006] 目前的机场离港行李流量预测方法存在以单一算法为主,缺乏预测精度和计算效率不高的问题、现有技术中还未有机场离港行李流量的长时预测方法的问题和缺乏一套有效地针对机场离港行李流量及其影响因素等数据的系统性分析方法的问题。

具体实施方式

[0111] 下面结合附图对本发明的实施例进行详细说明。
[0112] 实施例1:
[0113] 如图1和图2所示,图1和图2结合为本发明完整的流程框架图,本实施例公开了基于改进BP神经网络的机场离港行李流量长时预测方法,包括以下步骤:
[0114] S1:确定机场离港行李流量长时预测的主要影响因素;
[0115] S2:数据采集;
[0116] S3:数据预处理;
[0117] S4:对缺失数据进行数据插补;
[0118] S5:对数据集进行相关性分析,提取影响离港行李流量长时预测的核心因素;
[0119] S6:对数据集进行主成分分析,以确定BP神经网络的输入变量;
[0120] S7:确定BP神经网络拓扑结构;
[0121] S8:对BP神经网络的输入变量进行归一化处理,以将输入变量映射到[0,1]范围内;
[0122] S9:通过粒子群算法优化BP神经网络的初始权值和阈值,以提高BP神经网络的预测效率和预测精度;
[0123] S10:判断训练结果;
[0124] S11:通过训练好的BP神经网络对机场离港行李流量进行长时预测。
[0125] 优选的是,步骤S1具体为:通过调研国内外文献资料,总结出主要影响因素包括:机场离港客流量、航班起降架次、不同月份、月度非工作日天数、社会消费品零售总额、铁路客流量和公路客流量。
[0126] 优选的是,步骤S2具体为:
[0127] 以月度为单位按时采集上述数据以整合成原始数据集;
[0128] 其中,机场离港行李流量、机场离港客流量、航班起降架次的数据通过机场行李处理系统获取;
[0129] 不同月份、月度非工作日天数、社会消费品零售总额、铁路客流量、公路客流量的数据通过地方政府统计局官网获取;
[0130] 需要说明的是,每种影响因素称为影响因子,表达式为:
[0131] X=(x1,x2,…,xj)
[0132] 将影响因子按时间序列整理成数据向量,将所有数据向量整理成机场离港行李流量影响因子数据矩阵,简称原始数据集或原始数据矩阵,表达式为:
[0133]
[0134] 其中,X为机场离港行李流量单个影响因子数据向量;x1,x2,…,xj为X的具体数值,称为元素;Xij为原始数据矩阵,xij为原始数据矩阵的元素,ij指代数据在矩阵中的具体位置。
[0135] 优选的是,步骤S3包括以下步骤:
[0136] S31:对原始数据集进行清洗,过滤掉噪声数据;
[0137] S32:判断数据是否有缺失;
[0138] 若存在数据缺失,则需要计算数据缺失率,计算式为:
[0139]
[0140] 需要说明的是,一般认为数据缺失率占总量20%及以上,数据的分析价值将大幅度降低,不再具有利用价值;
[0141] 因此,需要存在数据缺失,且数据缺失率低于总量20%时,才进行步骤4:对缺失数据进行数据插补;
[0142] 若原始数据集无缺失,则跳过步骤4,直接进行步骤5:对数据集进行相关性分析,提取影响离港行李流量长时预测的核心因素;
[0143] 其中,Q为数据缺失率;n为单个影响因子缺失数据数量;j为单个影响因子数据数量。
[0144] 优选的是,步骤S4具体为:
[0145] 由于插补方法不同,插补值与真实值的误差亦不同,因此采用四种插补方法进行对比择优;
[0146] 插补方法包括:回归插补、EM插补、多重插补和均值插补;
[0147] 对插补方法的评价指标采用均方根误差和平均绝对百分比误差;
[0148] 均方根误差的计算式为:
[0149]
[0150] 平均绝对百分比误差的计算式为:
[0151]
[0152] 其中,E1为均方根误差;E2为平均绝对百分比误差; 为第a个缺失位置的插补值,ya为第a个缺失位置的真实值,a=1,2,...,n,n<j,j为单个影响因子数据数量;h为缺失值数量,n<j。
[0153] 优选的是,步骤S5的目的是在后续进行BP神经网络预测时减少输入层的维度,提高BP神经网络的运行效率;
[0154] 其中,数据集包括原始数据集或插补后数据集;
[0155] 相关性分析采用皮尔逊相关系数法,并选取相关系数大于等于|0.3|的影响因素作为影响离港行李流量长时预测的核心因素。
[0156] 优选的是,步骤S6包括以下步骤:
[0157] S61:对数据集进行标准化,以将输入变量映射到[‑1,1]范围内,消除数据之间的量纲和数量级影响,标准化计算式为:
[0158]
[0159] 得到标准化矩阵,表达式为:
[0160]
[0161] 其中,Xij′为单个影响因子中对应位置标准化后的值;X′为所有影响因子组成的标准化矩阵;xij为原始数据集中第i行j列位置的值;xjmax、xjmin分别为第j列的影响因子数据向量中的最大值和最小值;
[0162] S62:通过标准化矩阵X′计算相关系数矩阵R,计算式为:
[0163]
[0164]
[0165] 其中,R为标准化矩阵X′的相关系数矩阵;rpp为X′中Xij′对应的相关系数;rij为R中第i行j列的值,i、j=1,2,...,p;Xki′为X′中第k行i列的标准化值,k=1,2,...,n,n≤p;Xkj′为X′中第k行j列的标准化值; 为X′中第i列的均值; 为X′中第j列的均值;
[0166] S63:计算R的特征根λ和与其对应的特征向量μ;
[0167] 其中,特征根λ1≥λ2≥…≥λp;特征向量μ1≥μ2≥…≥μp;
[0168] S64:计算各主成分的累计方差贡献率Em,其解释了每个主成分包含的信息占原始数据集或插补后数据集总体信息量的比例;
[0169] 计算式为:
[0170]
[0171]
[0172] 其中,em为第m个主成分的方差贡献率,Em为前m个主成分的累计贡献率,m≤p;λm为第m个主成分的特征根,λi为第i个主成分的特征根,i=1,2,…,p;
[0173] S65:确定主成分个数,选取累计方差贡献率大于等于80%,且特征值大于等于1的成分作为主成分;
[0174] S66:计算主成分得分,以确定BP神经网络的输入变量;
[0175] 计算式为:
[0176]
[0177] γi=xiβi
[0178] 其中,βi为主成分载荷;γi为主成分载荷对应的得分;λi为第i个主成分的特征根,i=1,2,…,p;μi为第i个特征根对应的特征向量;xi为第i个主成分对应的数值。
[0179] 优选的是,步骤S7包括以下步骤:
[0180] S71:确定BP神经网络的层数,BP神经网络结构为三层结构,即1个输入层、1个隐含层、1个输出层;
[0181] S72:确定BP神经网络各层的神经元个数;输入层神经元数量由主成分个数决定;输出层神经元为1个,即机场离港行李流量;隐含层神经元个数通过计算得出,计算式为:
[0182]
[0183] 其中,m为隐含层神经元数量;n为主成分个数;b为大于1小于10的常数;
[0184] S73:BP神经网络的激活函数采用Sigmoid函数;
[0185] 步骤S8具体为:
[0186] 对BP神经网络的输入变量进行归一化处理,以将输入变量映射到[0,1]范围内,计算式为:
[0187]
[0188] 其中,Yi为归一化处理后的γi;max(γi)、min(γi)分别为第i个主成分载荷对应的得分向量中的最大值和最小值,i=1,2,…,p;
[0189] 其中,标准化为步骤S61中进行的和归一化为步骤S8中进行的,标准化和归一化是两个不同的内容,属于不同的公式,其中,标准化是用在主成分分析中,归一化是用在BP神经网络中。
[0190] 优选的是,步骤S9包括以下步骤:
[0191] S91:初始化BP神经网络权值和阈值,初始化粒子群算法;
[0192] S92:将权值、阈值作为粒子代入粒子群算法,计算每个粒子的适应度值;
[0193] S93:比较粒子适应度值,确定粒子的个体极值和全局极值;
[0194] S94:通过个体极值和全局极值更新粒子速度和位置,以得到本次的最优权值和阈值;
[0195] S95:将最优权值、阈值赋予BP神经网络,并对BP神经网络进行训练。
[0196] 优选的是,步骤S10具体为:
[0197] 判断预测结果是否小于预设误差,若是,则终止训练,开始步骤11;
[0198] 若否,判断迭代次数是否大于预设误差;
[0199] 若是,则终止训练,开始步骤11;
[0200] 若否,则回到步骤S91重复上述步骤;
[0201] 其中,判断训练结果的评价指标采用平均绝对误差和决定系数;
[0202] 平均绝对误差计算式为:
[0203]
[0204] 决定系数表达式为:
[0205]2
[0206] 其中,E3为平均绝对误差;R 为决定系数; 为预测值,yj为真实值, 为真实值的均值,j=1,2,...,n,n为预测值的数量。
[0207] 本发明是一种基于改进PSO‑BP神经网络对机场离港行李流量长时预测方法,即基于改进BP神经网络的机场离港行李流量长时预测方法,本发明在使用时,确定机场离港行李流量长时预测的主要影响因素;以月度为单位对每个影响因子进行数据采集,整理成原始数据集;对数据集进行预处理,计算数据缺失率;对缺失数据采用四种方法进行数据插补,对比择优;对原始数据集或插补后数据集进行相关性分析提取影响离港行李流量长时预测的核心影响因素;对核心影响因素的数据集进行主成分分析,以确定BP神经网络的输入变量;确定BP神经网络的拓扑结构;对BP神经网络的输入变量进行归一化处理;通过粒子群算法优化BP神经网络的初始权值和阈值;通过训练好的BP神经网络对机场离港行李流量进行长时预测。
[0208] 本发明填补了机场离港行李流量长时预测方法的空白,解决了现有机场离港行李流量预测方法存在的预测精度不高、计算效率偏低的不足,以及提出了一套有效地针对机场离港行李流量影响因素相关数据的系统性分析方法,为机场的行李流量分析和行李处理系统的优化设计提供理论和借鉴,具有较高的使用价值和应用场景。
[0209] 解决了目前还未有机场离港行李流量的长时预测方法,且现有的机场离港行李流量预测方法以单一算法为主,缺乏预测精度和计算效率的问题和同时缺乏一套有效地针对机场离港行李流量及其影响因素等数据的系统性分析方法的问题。
[0210] 实施例2:
[0211] 如图1至图3所示,其中图1和图2结合为本发明方法完整的流程框架图,图3本发明的方案与传统BP神经网络方案之间的效果对比示意图,本实施例公开了基于改进BP神经网络的机场离港行李流量长时预测方法,包括以下步骤:
[0212] S1:确定机场离港行李流量长时预测的主要影响因素;通过调研国内外文献资料,总结出主要影响因素包括:机场离港客流量、航班起降架次、不同月份、月度非工作日天数、社会消费品零售总额、铁路客流量和公路客流量。
[0213] S2:数据采集;以月度为单位按时采集上述数据以整合成原始数据集;其中,机场离港行李流量、机场离港客流量、航班起降架次的数据通过机场行李处理系统获取;不同月份、月度非工作日天数、社会消费品零售总额、铁路客流量、公路客流量的数据通过地方政府统计局官网获取;需要说明的是,每种影响因素称为影响因子,表达式为:
[0214] X=(x1,x2,…,xj)
[0215] 将影响因子按时间序列整理成数据向量,将所有数据向量整理成机场离港行李流量影响因子数据矩阵,简称原始数据集或原始数据矩阵,表达式为:
[0216]
[0217] 其中,X为机场离港行李流量单个影响因子数据向量;x1,x2,…,xj为X的具体数值,称为元素;Xij为原始数据矩阵,xij为原始数据矩阵的元素,ij指代数据在矩阵中的具体位置。
[0218] S3:数据预处理;
[0219] 步骤S3包括以下步骤:
[0220] S31:对原始数据集进行清洗,过滤掉噪声数据;
[0221] S32:判断数据是否有缺失;
[0222] 若存在数据缺失,则需要计算数据缺失率,计算式为:
[0223]
[0224] 需要说明的是,一般认为数据缺失率占总量20%及以上,数据的分析价值将大幅度降低,不再具有利用价值;
[0225] 因此,需要存在数据缺失,且数据缺失率低于总量20%时,才进行步骤4:对缺失数据进行数据插补;
[0226] 若原始数据集无缺失,则跳过步骤4,直接进行步骤5:对数据集进行相关性分析,提取影响离港行李流量长时预测的核心因素;
[0227] 其中,Q为数据缺失率;n为单个影响因子缺失数据数量;j为单个影响因子数据数量;
[0228] 结果如表1所示,本实施例数据缺失率为11.43%<20%,符合要求。
[0229] 表1
[0230]
[0231] S4:对缺失数据进行数据插补;
[0232] 步骤S4具体为:
[0233] 由于插补方法不同,插补值与真实值的误差亦不同,因此采用四种插补方法进行对比择优;
[0234] 插补方法包括:回归插补、EM插补、多重插补和均值插补;
[0235] 对插补方法的评价指标采用均方根误差和平均绝对百分比误差;
[0236] 均方根误差的计算式为:
[0237]
[0238] 平均绝对百分比误差的计算式为:
[0239]
[0240] 其中,E1为均方根误差;E2为平均绝对百分比误差; 为第a个缺失位置的插补值,ya为第a个缺失位置的真实值,a=1,2,...,n,n<j,j为单个影响因子数据数量;h为缺失值数量,n<j;
[0241] 本实施例的结果见表2,根据结果,最终选取多重插补方法得到的插补值作为原始数据集的插补后数据集。
[0242] 表2
[0243]
[0244] S5:对数据集进行相关性分析,提取影响离港行李流量长时预测的核心因素;其目的是在后续进行BP神经网络预测时减少输入层的维度,提高BP神经网络的运行效率;其中,数据集包括原始数据集或插补后数据集;相关性分析采用皮尔逊相关系数法,并选取相关系数大于等于|0.3|的影响因素作为影响离港行李流量长时预测的核心因素;
[0245] 如表3所示,根据表3中所示结果,最终选取不同月份、机场离港客流量、航班起降架次、非工作日天数、铁路客流量、公路客流量共6个影响因素作为离港行李流量长时预测的核心因素;
[0246] 表3
[0247]
[0248]
[0249]
[0250] S6:对数据集进行主成分分析,以确定BP神经网络的输入变量;
[0251] 步骤S6包括以下步骤:
[0252] S61:对数据集进行标准化,以将输入变量映射到[‑1,1]范围内,消除数据之间的量纲和数量级影响,标准化计算式为:
[0253]
[0254] 得到标准化矩阵,表达式为:
[0255]
[0256] 其中,Xij′为单个影响因子中对应位置标准化后的值;X′为所有影响因子组成的标准化矩阵;xij为原始数据集中第i行j列位置的值;xjmax、xjmin分别为第j列的影响因子数据向量中的最大值和最小值;
[0257] 如表4所示,因数据量较大,表4中仅展示部分标准化结果;
[0258] 表4
[0259]
[0260]
[0261] S62:通过标准化矩阵X′计算相关系数矩阵R,计算式为:
[0262]
[0263]
[0264] 其中,R为标准化矩阵X′的相关系数矩阵;rpp为X′中Xij′对应的相关系数;rij为R中第i行j列的值,i、j=1,2,...,p;Xki′为X′中第k行i列的标准化值,k=1,2,...,n,n≤p;Xkj′为X′中第k行j列的标准化值; 为X′中第i列的均值; 为X′中第j列的均值;
[0265] S63:计算R的特征根λ和与其对应的特征向量μ;
[0266] 其中,特征根λ1≥λ2≥…≥λp;特征向量μ1≥μ2≥…≥μp;
[0267] 在本实施例中:λ1≥λ2≥λ3,μ1、μ2、μ3;
[0268] 得到λ1=2.631;λ2=1.266;λ3=1.029;
[0269] μ1=(0.097,0.97,0.973,0.133,0.414,‑0.738)T
[0270] μ2=(‑0.763,0.064,‑0.01,0.292,0.662,0.395)T
[0271] μ3=(0.169,0.063,0.012,‑0.868,0.444,0.214)T
[0272] S64:计算各主成分的累计方差贡献率Em,其解释了每个主成分包含的信息占原始数据集或插补后数据集总体信息量的比例;
[0273] 计算式为:
[0274]
[0275]
[0276] 其中,em为第m个主成分的方差贡献率,Em为前m个主成分的累计贡献率,m≤p;λm为第m个主成分的特征根,λj为第i个主成分的特征根,i=1,2,…,p;
[0277] 计算结果如表5所示;
[0278] 表5
[0279]
[0280]
[0281] S65:确定主成分个数,选取累计方差贡献率大于等于80%,且特征值大于等于1的成分作为主成分;
[0282] 本实施例中,根据表5中记载的结果,选取成分1、2、3作为主成分,即前三个成分的信息包含了所有数据82.103%的信息;
[0283] S66:计算主成分得分,以确定BP神经网络的输入变量;
[0284] 计算式为:
[0285]
[0286] γi=xiβi
[0287] 其中,βi为主成分载荷;γi为主成分载荷对应的得分;λi为第i个主成分的特征根,i=1,2,…,p;μi为第i个特征根对应的特征向量;xi为第i个主成分对应的数值。
[0288] 计算结果如表6所示;
[0289] 表6
[0290]
[0291]
[0292] S7:确定BP神经网络拓扑结构;
[0293] 步骤S7包括以下步骤:
[0294] S71:确定BP神经网络的层数,BP神经网络结构为三层结构,即1个输入层、1个隐含层、1个输出层;
[0295] S72:确定BP神经网络各层的神经元个数;输入层神经元数量由主成分个数决定;输出层神经元为1个,即机场离港行李流量;隐含层神经元个数通过计算得出,计算式为:
[0296]
[0297] 其中,m为隐含层神经元数量;n为主成分个数;b为大于1小于10的常数;
[0298] 本实施例中计算出隐含层神经元个数为3个;
[0299] S73:BP神经网络的激活函数采用Sigmoid函数;
[0300] S8:对BP神经网络的输入变量进行归一化处理,以将输入变量映射到[0,1]范围内,计算式为:
[0301]
[0302] 其中,Yi为归一化处理后的γi;max(γi)、min(γi)分别为第i个主成分载荷对应的得分向量中的最大值和最小值,i=1,2,…,p;
[0303] 归一化结果如表7所示,由于其中数据量较大,充分展示页数过多,表7中仅对部分的归一化结果进行展示;
[0304] 表7
[0305]成分1 成分2 成分3
0.500773 0 0.305426
0.885626 0.460674 0.482171
0.927357 0.348315 0.410853
0.714065 0.273408 0.175194
0.741886 0.2397 0.415504
0.846986 0.11236 0.415504
0.646059 0.207865 0.176744
0.887172 0.552434 0.093023
0.692427 1 1
0.867079 0.441948 0.56124
[0306] 其中,标准化和归一化是两个内容,属于不同的公式,标准化用在主成分分析中,归一化用在BP神经网络中。
[0307] S9:通过粒子群算法优化BP神经网络的初始权值和阈值,以提高BP神经网络的预测效率和预测精度;
[0308] 步骤S9包括以下步骤:
[0309] S91:初始化BP神经网络权值和阈值,初始化粒子群算法;
[0310] S92:将权值、阈值作为粒子代入粒子群算法,计算每个粒子的适应度值;
[0311] S93:比较粒子适应度值,确定粒子的个体极值和全局极值;
[0312] S94:通过个体极值和全局极值更新粒子速度和位置,以得到本次的最优权值和阈值;
[0313] S95:将最优权值、阈值赋予BP神经网络,并对BP神经网络进行训练。
[0314] S10:判断训练结果;
[0315] 步骤S10具体为:
[0316] 判断预测结果是否小于预设误差,若是,则终止训练,开始步骤11;
[0317] 若否,判断迭代次数是否大于预设误差;
[0318] 若是,则终止训练,开始步骤11;
[0319] 若否,则回到步骤S91重复上述步骤;
[0320] 其中,判断训练结果的评价指标采用平均绝对误差和决定系数;
[0321] 平均绝对误差计算式为:
[0322]
[0323] 决定系数表达式为:
[0324]
[0325] 其中,E3为平均绝对误差;R2为决定系数; 为预测值,yj为真实值, 为真实值的均值,j=1,2,...,n,n为预测值的数量。
[0326] 在本实施例中,预设误差下限设置为:1e‑6,迭代次数上限设置为:1e3;
[0327] S11:通过训练好的BP神经网络对机场离港行李流量进行长时预测;
[0328] 如图3所示,通过对比传统BP神经网络预测方法,需要说明的是,迭代次数越小,表明方案的计算效率越高;平均绝对误差越小,决定系数越接近1,表明方案的预测精度更佳。
[0329] 因此本实施例结果表明本发明在计算效率和预测精度上较传统BP神经网络的预测效果更优。
[0330] 本发明原理:
[0331] 本发明在使用时,确定机场离港行李流量长时预测的主要影响因素;以月度为单位对每个影响因子进行数据采集,整理成原始数据集;对数据集进行预处理,计算数据缺失率;对缺失数据采用四种方法进行数据插补,对比择优;对原始数据集或插补后数据集进行相关性分析提取影响离港行李流量长时预测的核心影响因素;对核心影响因素的数据集进行主成分分析,以确定BP神经网络的输入变量;确定BP神经网络的拓扑结构;对BP神经网络的输入变量进行归一化处理;通过粒子群算法优化BP神经网络的初始权值和阈值;通过训练好的BP神经网络对机场离港行李流量进行长时预测。
[0332] 在进行机场离港行李流量长时预测时,需要确定影响行李流量的主要影响因素,即影响因子。对主要影响因素的相关数据进行采集、预处理、对缺失数据进行数据插补,以保证数据的连续性、准确性和可靠性。不同影响因子之间可能有着一定相关性,在反映行李流量上存在信息重叠,直接将不同影响因子作为BP神经网络的输入向量,则有可能使网络陷入局部极小值而非全局最小值,导致预测精度不佳,计算耗时较大等情况。因此需对原始数据集或数据插补后的数据集进行主成分分析,将与行李流量关联的多个影响因子进行简化,削弱变量间的耦合,消除冗余信息,达到降低BP神经网络输入层维度的目的。通过输入、输出层确定隐含层神经元个数,将BP神经网络的拓扑结构最佳化。通过对BP神经网络的输入变量进行数据归一化,将输入变量映射到指定范围内,消除量纲影响。通过粒子群算法优化BP神经网络的初始权值和阈值,以提高BP神经网络的预测效率和预测精度。将构建好的、具有最优权、阈值的BP神经网络用于对机场离港行李流量的长时预测。
[0333] 以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

当前第1页 第1页 第2页 第3页