首页 / 一种家庭多日出行距离累计分布预测方法

一种家庭多日出行距离累计分布预测方法无效专利 发明

技术领域

[0001] 本发明属于出行行为预测领域,具体涉及一种以家庭为多位的多日出行距离累计分布的预测方法。

相关背景技术

[0002] 假日期间内爆炸式的交通出行与以小汽车为主的家庭弹性出行结构给城市交通带来了重大挑战,道路安全、环境污染、交通拥堵等问题日渐突出,合理的交通政策制定和交通规划,需要对未来出行进行预测,所以对以家庭为多位的多日出行距离的预测就显得格外重要。
[0003] 现阶段,对于出行的预测方法研究目标集中于城市居民个体,主要对交通参与者个体通勤行为进行分析和预测,缺乏对于群体出行行为的预测。
[0004] 文献《居民出行分布中的电子云现象》,王殿海等,物理学报,2007.7,公开了基于氢原子基态电子在核外出现概率密度的模拟电子云居民出行分布的模型,并利用调查数据进行了拟合验证。该文中提到:电子的能量越大,其所形成的电子云的半径越大,也就是其出现在离核较远位置的概率越大;当居民的收入增加,出行方式有所改善时,其出行的距离会有所增加,相当于电子的能量增加。但文中并没有给出居民收入如何影响电子能量,以及具体如何影响出行的距离。

具体实施方式

[0035] 为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的具体实施案例做说明。
[0036] 如图1所示,本发明公开了一种家庭多日出行距离累计分布预测方法,包括建立家庭多日出行距离累计分布预测模型和对家庭多日出行距离累计分布进行预测两个步骤,建立家庭多日出行距离累计分布预测模型包括如下步骤1~4:
[0037] 步骤1、采集家庭多日出行数据,并将采集到的数据进行结构化作为样本;设采集到的样本数为m,每个样本有l个观测变量;
[0038] 本发明采用问卷调查的方式采集家庭多日出行数据,所述家庭多日出行数据包括被访者年龄、被访者职业、家庭就业人数、家庭拥有驾照人数、家庭拥有私家车数、家庭类型、被访者学历、家庭常住城市等级、家庭年收入、出行目的、出行次数、出行距离、出行时长、出行费用、出行方式,共15个观测变量。本实施例中,采用访谈、调查问卷和网络问卷的方式对多个城市进行调查,对采集到的数据剔除不完整和不合理的样本后共获得2419份样本,其中1949份样本作为建立家庭多日出行距离累计分布预测模型的样本,其余样本用于预测验证;即m=1949;不完整样本是指观测变量有缺失的样本,不合理样本是指观测变量中有矛盾的样本,比如:家庭类型为夫妻家庭,但家庭拥有的驾照数量大于2。
[0039] 对样本进行结构化,将所有文字变量和大数值变量转化成区间化分类变量表示,结构化方法见表1。结构化后,得到样本数量为1949的样本集,样本集中每个样本为15维向量,向量元素分别对应表1中的观测变量。
[0040] 表1结构化数据类别表示
[0041]
[0042]
[0043] 步骤2、对样本数据应用因子分析法降维,提取特征值大于1的k个公共因子和对应的因子得分矩阵B;设降维后每个样本保留n个观测变量,n
[0044] 本实施例中采用SPSS 24软件进行因子分析,提取到特征值大于1的5个公共因子,分别为PC1~PC5;根据公因子旋转后的载荷矩阵可以得到每个公共因子影响到的观测变量;本实施例中,PC1综合了出行时长、出行距离、出行费用和出行方式四种观测变量,PC2综合了家庭就业人数、家庭拥有驾照人数、家庭拥有私家车数和家庭类型数据,PC3综合了被访者学历、家庭常住城市等级、家庭年收入数据,PC4综合了被访者年龄和职业数据,PC5综合了出行次数和出行目的数据。
[0045] 利用SPSS因子分析,得到公因子PC2-PC5与观测变量之间的成分得分系数矩阵B B={βjq},j=1,2,...,n,q=1..k-1,具体矩阵如表2所示。
[0046] 表2因子得分系数矩阵B
[0047]
[0048] 步骤3、在提取的k个公共因子中,以其中包含出行距离的因子作为内生潜变量,其余k-1个公共因子作为外生潜变量,构建结构方程,计算外生潜变量和内生潜变量间的标准化路径系数Γ;
[0049] 本实施例中,内生潜变量为PC1,外生潜变量为PC2、PC3、PC4、PC5,采用AMOS 24软件分析各潜变量之间的影响关系,得到如图2所示的结构方程模型图,计算外生潜变量和内生潜变量间的标准化路径系数Γ,得到Γ=(0.18,0.35,0.08,0.45);
[0050] 计算每个样本的家庭多日出行活跃度ηi,步骤为:
[0051] (3-1)计算第i个样本所对应的k-1个外生潜变量:
[0052]
[0053] 其中βjq为因子得分矩阵B中的第j行q列的元素,xij为第i个样本保留的第j个观测变量结构化后的值;
[0054] 本实施例中,第i个样本所对应的外生潜变量计算如下:
[0055] 具体计算过程如下:
[0056]
[0057] (3-2)计算第i个样本出行活跃度ηi:
[0058] ηi=Γξi+ζ;
[0059] 其中 T表示向量的转置,ζ为结构方程的残差;i=1..m;
[0060] 步骤4、对所有样本的家庭多日出行活跃度ηi进行分级,设分为M个等级;统计每个活跃度等级Eu下样本的出行距离累计分布概率pu;u=1..M;
[0061] 本实施例中,家庭多日出行活跃度平均划分为5级,如表3所示;出行距离分为4个等级,如表4中所示。统计活跃度等级Eu下样本数Nu,统计这Nu个样本中每个出行距离等级对应的样本数nq,计算出行距离累计概率pu,
[0062] 表3多日家庭弹性出行活跃度分级
[0063]  区间1 区间2 区间3 区间4 区间5
下限 -2.0216 -1.2394 -0.4285 0.3681 1.1586
上限 -1.2394 -0.4285 0.3681 1.1586 1.9614
[0064] 表4不同家庭出行活跃度区间的出行距离累计概率
[0065]活跃度 区间1 区间2 区间3 区间4 区间5
市内出行 0.583 0.275 0.218 0.217 0.25
省内出行 0.917 0.621 0.563 0.561 0.596
国内出行 1 0.978 0.942 0.958 0.962
国际出行 1 1 1 1 1
[0066] 用量子模型的累计概率密度分别拟合活跃度等级Eu下的样本的出行距离累计分布概率pu与结构化后出行距离的关系,计算出量子模型的参数,得到每个活跃度等级下家庭多日出行距离累计分布预测模型;
[0067] 本发明选用的量子模型的累计概率密度为:
[0068]
[0069] 其中a为量子模型的参数。
[0070] 也可以采用如下简化的量子模型的累计概率密度为:
[0071] F2(x)=1-(bx+1)e-bx,b>0
[0072] 其中b为量子模型的参数。
[0073] 本实施例中,采用MATLAB 2015b中的curve fitting工具拟合活跃度等级Eu下的样本的出行距离累计分布概率pu与出行距离的关系。
[0074] 分别采用两种量子模型对累计概率进行拟合,得到的模型参数如表5所示。
[0075] 表5标定模型参数
[0076]活跃度等级区间 量子模型F1(x)的参数a 简化量子模型F2(x)的参数b
区间1 0.6684 1.983
区间2 1.194 1.073
区间3 1.33 0.9574
区间4 1.257 1.014
区间5 1.033 1.239
[0077] 用R2、RMSE指标评价拟合效果。当R2>0.98,RMSE<0.05时,认为模型拟合效果较好,具体模型评价数据如表6。
[0078] 表6模型拟合评价表
[0079]
[0080] 由表6可得,量子模型与简化量子模型在各个活跃度区间上的R2、RMSE指标均达标准,拟合效果良好。
[0081] 对家庭出行距离累计分布进行预测,步骤为:
[0082] 步骤5、以步骤3中外生潜变量所对应的观测变量为属性,获取待预测家庭的观测变量,进行结构化,计算其家庭多日出行活跃度η*,并根据η*的值判断对应的活跃度等级E*以及E*所对应的家庭多日出行距离累计分布预测模型,得到待预测家庭的家庭多日出行距离累计分布概率预测值。
[0083] 本实施例采用预留的200个样本数据进行模型验证。将数据结构化,计算家庭多日出行活跃度,根据步骤4建立的家庭多日出行距离预测模型预测每个样本的出行距离累计分布概率,与这些样本真实的出行距离累计分布概率进行比较,计算误差,结果如表7所示。
[0084] 表7不同出行距离的出行分布预测误差
[0085]模型 市内 省内 国内 国际 平均误差
量子模型F1(x) 3.81% 8.00% 4.80% 0.61% 4.31%
简化量子模型F2(x) 1.62% 1.23% 7.37% 4.53% 3.69%
[0086] 由表7可知,简化量子模型对样本数据的预测结果表现较好,各出行距离范围分布概率的平均误差仅为3.69%。从误差来看,量子模型在省内出行区段的误差较大,而简化量子模型在国内区段计算误差较大,因此,在实际应用中可综合考虑两种模型的计算结果。

当前第1页 第1页 第2页 第3页
相关技术
分布预测相关技术
家庭日相关技术
何杰发明人的其他相关专利技术