[0044] 本实施例中采用SPSS 24软件进行因子分析,提取到特征值大于1的5个公共因子,分别为PC1~PC5;根据公因子旋转后的载荷矩阵可以得到每个公共因子影响到的观测变量;本实施例中,PC1综合了出行时长、出行距离、出行费用和出行方式四种观测变量,PC2综合了家庭就业人数、家庭拥有驾照人数、家庭拥有私家车数和家庭类型数据,PC3综合了被访者学历、家庭常住城市等级、家庭年收入数据,PC4综合了被访者年龄和职业数据,PC5综合了出行次数和出行目的数据。
[0045] 利用SPSS因子分析,得到公因子PC2-PC5与观测变量之间的成分得分系数矩阵B B={βjq},j=1,2,...,n,q=1..k-1,具体矩阵如表2所示。
[0046] 表2因子得分系数矩阵B
[0047]
[0048] 步骤3、在提取的k个公共因子中,以其中包含出行距离的因子作为内生潜变量,其余k-1个公共因子作为外生潜变量,构建结构方程,计算外生潜变量和内生潜变量间的标准化路径系数Γ;
[0049] 本实施例中,内生潜变量为PC1,外生潜变量为PC2、PC3、PC4、PC5,采用AMOS 24软件分析各潜变量之间的影响关系,得到如图2所示的结构方程模型图,计算外生潜变量和内生潜变量间的标准化路径系数Γ,得到Γ=(0.18,0.35,0.08,0.45);
[0050] 计算每个样本的家庭多日出行活跃度ηi,步骤为:
[0051] (3-1)计算第i个样本所对应的k-1个外生潜变量:
[0052]
[0053] 其中βjq为因子得分矩阵B中的第j行q列的元素,xij为第i个样本保留的第j个观测变量结构化后的值;
[0054] 本实施例中,第i个样本所对应的外生潜变量计算如下:
[0055] 具体计算过程如下:
[0056]
[0057] (3-2)计算第i个样本出行活跃度ηi:
[0058] ηi=Γξi+ζ;
[0059] 其中 T表示向量的转置,ζ为结构方程的残差;i=1..m;
[0060] 步骤4、对所有样本的家庭多日出行活跃度ηi进行分级,设分为M个等级;统计每个活跃度等级Eu下样本的出行距离累计分布概率pu;u=1..M;
[0061] 本实施例中,家庭多日出行活跃度平均划分为5级,如表3所示;出行距离分为4个等级,如表4中所示。统计活跃度等级Eu下样本数Nu,统计这Nu个样本中每个出行距离等级对应的样本数nq,计算出行距离累计概率pu,
[0062] 表3多日家庭弹性出行活跃度分级
[0063] 区间1 区间2 区间3 区间4 区间5
下限 -2.0216 -1.2394 -0.4285 0.3681 1.1586
上限 -1.2394 -0.4285 0.3681 1.1586 1.9614
[0064] 表4不同家庭出行活跃度区间的出行距离累计概率
[0065]活跃度 区间1 区间2 区间3 区间4 区间5
市内出行 0.583 0.275 0.218 0.217 0.25
省内出行 0.917 0.621 0.563 0.561 0.596
国内出行 1 0.978 0.942 0.958 0.962
国际出行 1 1 1 1 1
[0066] 用量子模型的累计概率密度分别拟合活跃度等级Eu下的样本的出行距离累计分布概率pu与结构化后出行距离的关系,计算出量子模型的参数,得到每个活跃度等级下家庭多日出行距离累计分布预测模型;
[0067] 本发明选用的量子模型的累计概率密度为:
[0068]
[0069] 其中a为量子模型的参数。
[0070] 也可以采用如下简化的量子模型的累计概率密度为:
[0071] F2(x)=1-(bx+1)e-bx,b>0
[0072] 其中b为量子模型的参数。
[0073] 本实施例中,采用MATLAB 2015b中的curve fitting工具拟合活跃度等级Eu下的样本的出行距离累计分布概率pu与出行距离的关系。
[0074] 分别采用两种量子模型对累计概率进行拟合,得到的模型参数如表5所示。
[0075] 表5标定模型参数
[0076]活跃度等级区间 量子模型F1(x)的参数a 简化量子模型F2(x)的参数b
区间1 0.6684 1.983
区间2 1.194 1.073
区间3 1.33 0.9574
区间4 1.257 1.014
区间5 1.033 1.239
[0077] 用R2、RMSE指标评价拟合效果。当R2>0.98,RMSE<0.05时,认为模型拟合效果较好,具体模型评价数据如表6。
[0078] 表6模型拟合评价表
[0079]
[0080] 由表6可得,量子模型与简化量子模型在各个活跃度区间上的R2、RMSE指标均达标准,拟合效果良好。
[0081] 对家庭出行距离累计分布进行预测,步骤为:
[0082] 步骤5、以步骤3中外生潜变量所对应的观测变量为属性,获取待预测家庭的观测变量,进行结构化,计算其家庭多日出行活跃度η*,并根据η*的值判断对应的活跃度等级E*以及E*所对应的家庭多日出行距离累计分布预测模型,得到待预测家庭的家庭多日出行距离累计分布概率预测值。
[0083] 本实施例采用预留的200个样本数据进行模型验证。将数据结构化,计算家庭多日出行活跃度,根据步骤4建立的家庭多日出行距离预测模型预测每个样本的出行距离累计分布概率,与这些样本真实的出行距离累计分布概率进行比较,计算误差,结果如表7所示。
[0084] 表7不同出行距离的出行分布预测误差
[0085]模型 市内 省内 国内 国际 平均误差
量子模型F1(x) 3.81% 8.00% 4.80% 0.61% 4.31%
简化量子模型F2(x) 1.62% 1.23% 7.37% 4.53% 3.69%
[0086] 由表7可知,简化量子模型对样本数据的预测结果表现较好,各出行距离范围分布概率的平均误差仅为3.69%。从误差来看,量子模型在省内出行区段的误差较大,而简化量子模型在国内区段计算误差较大,因此,在实际应用中可综合考虑两种模型的计算结果。