首页 / 一种地理信息数据的处理方法及装置

一种地理信息数据的处理方法及装置实质审查 发明

技术领域

[0001] 本发明涉及智能交通领域,尤其涉及一种地理信息数据的处理方法及装置。

相关背景技术

[0002] 现有的特征选择方法常用的为过滤式方法。具体的,过滤式方法是在模型训练和运算前,对数据进行特征筛选,特征筛选与建模过程不存在交互。该种方式可以避免模型数据对原有数据的污染。过滤式方法的筛选标准主要包括距离准则、信息准则、相关性准则和一致性准则。距离准则采用距离度量数据集中各样本间的相似程度,进而刻画特征集中各个特征对目标特征的贡献程度或作用大小。信息准则采用信息熵等属性衡量数据集中各个特征对于目标特征的不确定性程度,特征所拥有的不确定性程度越高,对目标变量的帮助也越大。相关性准则通过衡量特征与目标特征之间的相关性程度,实现对各个特征的重要性度量。一致性准则采用数据样本的不一致率衡量候选特征子集的分辨能力,不一致率是不一致样本个数与总体样本数的比率。
[0003] 过滤式特征选择方法存在时间和空间复杂度高的问题,不利于卫星星上计算等资源有限的场景。

具体实施方式

[0023] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0024] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0025] 本发明的说明书和权利要求书及上述附图中的术语“ 周期”、“ 时刻”等是用于泛指符合特定条件下的对象,不是特指一个对象,同时应当理解为该类对象使用的数据在适当情况下可以在顺序等方面发生变化,以便这里描述的本发明实施例能够在图示或描述以外的类似场景中实施。
[0026] 本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或装置产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。
[0027] 需要说明的是,本申请所涉及的地理信息(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的获取、传输、存储、使用和处理均遵守相关国家和地区的相关法律法规和标准。
[0028] 需要说明的是,在本申请实施例中,可能提及某些软件、组件、模型等业界已有方案,应当将它们认为是示范性的,其目的仅仅是为了说明本申请技术方案实施中的可行性,但并不意味着申请人已经或者必然用到了该方案。
[0029] 现有技术中,建模用特征选择通常采用过滤式方法,该种方法通过距离准则、信息准则、相关性准则和一致性准则直接对初始特征进行筛选,存在时间和空间复杂度高的问题,不利于卫星星上计算等资源有限的场景。并且该种方法并未考虑特征之间的物理特性,存在冗余特征,进而使得建模效果差的问题。
[0030] 为了解决上述技术问题,本发明提供一种地理信息数据的处理方法,需要说明的是,附图中地理信息数据的处理方法可以在包括诸如可执行指令的计算机系统中执行,在使用计算机模拟的仿真系统中执行,在嵌入式设备中执行,在一套互联的智能设备中执行,在分布式计算系统中执行及其他可执行载体中执行。如图1所示,地理信息数据的处理方法包括:步骤101,获取目标区域在预定时间范围内的地理信息数据。
[0031] 其中,目前区域可根据实际应用区域由用户设定,预定时间范围可根据实际需求由用户设定,本发明对目标区域及预定时间范围不做具体限定。
[0032] 地理信息数据泛指卫星遥感、地理测绘、航空测绘等独立手段及混合手段获取的地理信息数据,地理信息数据包括目标区域中不随时间变化的空间信息以及随时间变化的交通信息。其中,空间信息包括空间边界、区域形状等。交通信息包括道路中车辆相关信息。具体的,地理信息数据包括经度、维度、对象属性等具体条目,数据结构形式包括矢量数据结构、栅格数据结构和矢栅一体数据结构。
[0033] 步骤102,根据地理信息数据,计算得到交通特征集的多个数据集及各数据集的目标特征值。
[0034] 本步骤实施时,先根据地理信息数据提取交通特征,由提取出的交通特征组成交通特征集,本发明中的交通特征为实际交通场景中涉及的所有特征,包括各时刻及各路段的交通运行特征、交通设计特征及交通设施特征。如道路长度、道路宽度、道路车道数、道路限行、道路类型、交通密度、交通流速度、行程时间、交通信号类型、出行方式、交通信号控方式、交叉路口面积等具体交通变量和地理信息变量。
[0035] 交通特征提取过程包括:(1)静态特征提取:静态特征为值不随着时间变化的变量,例如交叉口面积、道路车道数、道路长度等。静态特征的数据集计算方法为采用地理信息数据中的空间数据,根据空间边界和区域形状,通过边界交点坐标,计算或统计静态变量值。
[0036] (2)动态特征提取:动态特征为值随着时间变化的变量,例如交通密度、交通流量、用户数等。动态特征的数据集计算方法分为瞬时采样和时空统计,所述瞬时采样为在某时刻根据空间范围获取变量值,所述时空统计为在某时间区间内计算时空统计量。
[0037] 目标特征为用户根据交通特征预先设置量,例如为预测时刻的路段行程时间或交通状态。其中,交通状态包括:畅行、缓行、拥堵。一具体实施例中,交通状态划分方式如下表1所示:
表1
[0038] 其它具体实施例中,还可根据速度、道路类型以及交通流量对交通状态进行划分。
[0039] 本步骤得到的交通特征集为原始特征集。交通特征集的多个数据集为根据时间戳排列的交通特征条目数据集合,如下表2所示:表2
[0040] 步骤103,利用预先确定的物理知识库,对交通特征集中的特征进行一次筛选得到备用交通特征集,物理知识库如下表3所示,包括具有物理关联关系的多个特征集合。
[0041] 表3
[0042] 本步骤的目的是删除具有物理知识关联的特征,从而减少后续二次筛选的特征量,降低特征冗余量。
[0043] 步骤104,根据备用交通特征集中特征间的强相关性以及备用交通特征集中特征与目标特征间的强相关性,对备用交通特征集中的特征进行二次筛选,得到最优交通特征集。得到最优交通特征集后,即可利用最优交通特征集及目标特征建立目标特征预测模型。本实施例得到的最优交通特征集中的特征为对目标特征有影响,且特征之间不具有相似性的特征。
[0044] 详细的说,强相关性计算方法包括t检验方法及Pearson相关系数分析方法,本方法实施之前,需预先配置t检验方法中强相干对应相关系数下界θt,t检验方法中不相干对应相关系数上界,Pearson相关系数分析方法中强相干对应相关系数下界θp,Pearson相关系数分析方法中不相干对应相关系数上界τp。利用t检验方法及Pearson相关系数分析方法确定强相关性的过程可参考后续实施例,此处不再详述。
[0045] 本步骤实施例,先判断交通特征是否为二值特征,若为二值特征,则利用t检验方法计算强相关性,若不为二值特征,则利用Pearson相关系数分析方法计算强相关性。
[0046] 本实施例通过利用物理知识库对交通特征集中的特征进行一次筛选得到备用交通特征集,根据备用交通特征集中特征间的强相关性以及所述备用交通特征集中特征与目标特征间的强相关性,对备用交通特征集中的特征进行二次筛选得到最优交通特征集,能够降低地理信息数据的交通特征选择算法复杂度,提高特征提取精度,增加其适用场景,在有限资源下保证计算精度,减少特征冗余。
[0047] 本发明一实施例中,上述步骤101得到地理信息数据之后,还包括:对地理信息数据进行预处理,其中,预处理包括:对地理信息数据中的非二值数据进行平滑处理;对地理信息数据中的空间数据进行坐标系转化理;对地理信息数据中的时变数据进行时空冗余清洗;对缺省数据进行数据补全处理。
[0048] 本实施例通过对地理信息数据进行预处理,能够提高后续数据分析的效率及精度。
[0049] 本发明一实施例中,上述步骤104根据所述备用交通特征集中特征间的强相关性以及所述备用交通特征集中特征与目标特征间的强相关性,对所述备用交通特征集中的特征进行二次筛选包括:对于所述备用交通特征集中每一第一交通特征,根据所述第一交通特征的数据集及该数据集的目标特征值确定所述第一交通特征与所述目标特征之间的相关性;在所述第一交通特征与所述目标特征不相关时,从所述备用交通特征集中删除所述第一交通特征;
对于所述备用交通特征集中的每两个交通特征,根据所述两个交通特征的数据集确定所述两个交通特征之间的相关性;在所述两个交通特征相关时,从所述两个交通特征中删除其中一交通特征。
[0050] 进一步实施例中,在所述第一交通特征与所述目标特征相关时,从所述备用交通特征集中遍历一第二交通特征;将所述第一交通特征及所述第二交通特征作为所述两个交通特征,计算所述两个交通特征之间的相关性,并在所述两个交通特征相关时,从所述备用交通特征集中删除所述第一交通特征。
[0051] 在所述两个交通特征不相关时,重复从所述备用交通特征集中遍历下个第二交通特征及其之后的步骤,直至无法遍历到第二交通特征时,从所述备用交通特征集中遍历下个第一交通特征并重复确定该第一交通特征与目标特征之间的相关性。
[0052] 本发明一实施例中,如图2所示,上述步骤104根据所述备用交通特征集中特征间的强相关性以及所述备用交通特征集中特征与目标特征间的强相关性,对所述备用交通特征集中的特征进行二次筛选包括:步骤201,从备用交通特征集中随机取出第一交通特征。
[0053] 步骤202,根据第一交通特征的数据集及该数据集的目标特征值确定第一交通特征与目标特征之间的相关性。
[0054] 步骤203,若第一交通特征与目标特征不相关,则从备用交通特征集中删除第一交通特征,返回步骤201继续取出下一第一交通特征,直至所有交通特征均已遍历。
[0055] 步骤204,若第一交通特征与目标特征相关,则从备用交通特征集中随机取出第二交通特征。
[0056] 步骤205,根据第一交通特征的数据集及第二交通特征的数据集确定第一交通特征与第二交通特征之间的相关性。
[0057] 步骤206,若第一交通特征与第二交通特征相关,则从备用交通特征集中删除第一交通特征,并返回步骤201继续取出第一交通特征,直至所有交通特征均已遍历。
[0058] 若第一交通特征与第二交通特征不相关,则返回步骤204继续取出新的第二交通特征,直至所有交通特征均已遍历,即所有交通特征均已作为第二交通特征被取出。
[0059] 本实施例通过先计算交通特征与目标特征的相关性,再计算与目标特征相关的交通特征相关的交通特征,能够分层次快速确定与目标特征相关的交通特征,且能够减少冗余特征。
[0060] 本发明一实施例中,可应用于应急交通调度场景,对应的,该场景中交通特征集合中的交通特征包括:时刻t的路段i对应的交通运行特征,时刻t的路段i对应的交通设计特征及时刻t的路段i对应的交通设施特征。
[0061] 其中,时刻t的路段i对应的交通运行特征包括:时刻t的路段i对应的交通密度 、交通流率 、交通平均速度 、时间占有率 、空间占有率 、行程时间 等。
[0062] 具体的,路段的交通密度:路段的车辆数/(路段长度*车道数);路段的交通流率:道路观测端面的车辆数/观测时间,其中,可通过图像采集设备或遥感GIS对车辆进行观测;
路段的交通速率:道路的长度/车辆通过道路的时间;
路段的交通平均速率:路段的车辆交通速度的均值;
路段的时间占有率:路段有车时间/观测时间占比;
路段的空间占有率:路段有车面积/无车面积。
[0063] 时刻t的路段i对应的交通设计特征包括:时刻t的路段i对应的道路拥堵密度ρm、道路临界密度ρc、道路通行能力qm、道路自由流速度vf等。
[0064] 具体的,先根据观测数据拟合交通密度与交通流率的关系图,即交通流基本图,其中,交通密度为横轴,交通流率为纵轴。然后分析关系图中的交通流率的最大值为道路通行能力,最大交通流率对应的交通密度为道路临界密度,当交通密度为零时的导数为道路自由流速度,与横轴非零的交点为道路拥堵密度。
[0065] 交通设施特征包括:时刻t的路段i对应的道路宽度ηi、道路长度li、道路面积αi、交i i通信号类型s 、区域类型β 等。
[0066] 目标特征为时刻t+1的路段i行程时间 或交通状态。
[0067] 本发明一实施例中,如图3所示,上述步骤103中物理知识库建立过程包括:步骤301,获取交通特征的物理知识信息及目标特征的物理知识信息。
[0068] 本步骤实施时,可由设计人员或相关工作人员预先收集交通特征相关的物理知识信息及目标特征相关的多条物理知识信息,还可根据交通特征及目标特征从已有数据库中自动抓取物理知识信息。本发明对物理知识信息的获取过程不做具体限定。
[0069] 步骤302,对获取的物理知识信息进行去重处理。
[0070] 通过去重处理,能够降低后续步骤处理量,提高物理知识库建立效率。
[0071] 步骤303,从去重后物理知识信息中筛选出目标物理知识信息,目标物理知识信息至少包含两个交通特征,和/或一个交通特征及目标特征。
[0072] 步骤304,从目标物理知识信息中提取物理量间的关联关系。
[0073] 步骤305,将具有物理量关联关系的交通特征,以及具有物理关联关系的交通特征和目标特征构成一物理知识集合。
[0074] 具体实施时,通过上述方法分析出物理知识集合后,还可由专家对分析结果进行复查以及调整,从而形成最终的物理知识库。
[0075] 对于上述应急交通调度场景,形成的物理知识集合如下表4所示:表4
[0076] 本发明一实施例中,如图4所示,上述步骤103利用预先确定的物理知识库,对所述交通特征集中的特征进行一次筛选,包括:步骤401,将交通特征集中的交通特征逐一匹配所述物理知识库的特征集合中的特征,并记录交通特征匹配的次数。
[0077] 步骤402,对于物理知识库中的每一特征集合,若该特征集合存在至少两个匹配的交通特征,则在交通特征集中保留匹配次数最小的交通特征。
[0078] 本发明一实施例中,进行一次筛选之前,还包括:从所述交通特征集中随机选择预定数量的交通特征组成候选特征子集,并将所述候选特征子集中的交通特征从所述交通特征集中删除;
将所述一次筛选及二次筛选过程替换为:
对所述候选特征子集中的特征进行一次筛选以及二次筛选,并记录删除交通特征个数;
在所述候选特征子集中所有特征均已分析且所述交通特征集不为空时,从所述交通特征集中随机选择所述删除交通特征个数的交通特征移动至所述候选特征子集中,并对所述删除交通特征个数进行归零处理,重复对所述候选特征子集进行一次筛选及二次筛选的过程。
[0079] 进一步的,在所述候选特征子集中所有特征均已分析且所述删除交通特征个数为零以及所述交通特征集不为空时,从所述交通特征集中选择至少一个交通特征移动至所述候选特征子集中,并将选择的交通特征从所述交通特征集中删除,重复对所述候选特征子集进行一次筛选及二次筛选的过程。
[0080] 本发明一实施例中,提供另一种地理信息数据的处理方法,如图5所示,包括:步骤501,获取目标区域在预定时间范围内的地理信息数据。
[0081] 步骤502,根据地理信息数据,计算得到交通特征集的多个数据集及各数据集的目标特征值。
[0082] 步骤501至步骤502的实时可参考步骤101至步骤102,此处不再详述。
[0083] 步骤503,从交通特征集中随机选择预定数量的交通特征组成候选特征子集,并将候选特征子集中的交通特征从交通特征集中删除。
[0084] 其中,预定数量可预先配置,例如为4,可根据交通特征集中数据总量确定。
[0085] 步骤504,对候选特征子集中的特征进行一次筛选以及二次筛选,并记录删除交通特征个数。
[0086] 其中,一次筛选以及二次筛选的实时过程可参考前文实施例,此处不再详述。
[0087] 步骤505,判断候选特征子集中所有特征均已分析以及交通特征集是否为空。
[0088] 步骤506,当候选特征子集中所有特征均已分析及交通特征集不为空,且删除交通特征个数不为零时从交通特征集中随机选择删除交通特征个数的交通特征至候选特征子集中,并对删除交通特征个数进行归零处理;当删除交通特征个数为零时,则从交通特征集中至少选择一个交通特征至候选特征子集中,并将选择的交通特征从交通特征集中删除,返回步骤504继续对候选特征子集进行一次筛选及二次筛选。
[0089] 当候选特征子集中所有特征均已分析及交通特征集为空时,结束筛选。
[0090] 本实施例通过候选特征子集的引入,能够提高交通特征分析的效率。具体实施时,为了进一步提高处理效率,可将候选特征子集发送至分布式服务器并行处理。
[0091] 本发明一实施例中,如图6所示,上述步骤503从交通特征集中随机选择预定数量的交通特征组成候选特征子集,包括:步骤601,获取分布式服务器的性能数据。其中,分布式服务器的性能数据包括:
CPU性能、内存性能等。
[0092] 步骤602,根据各服务器的性能数据,确定各服务器的特征处理量。
[0093] 本步骤实施时,可根据特征处理所需CPU性能量以及内存占用量,确定服务器的特征处理量,此处特征处理量指的是服务器能够胜任的工作量。
[0094] 步骤603,根据各服务器的特征处理量,从交通特征集获取特征得到各服务器的候选特征子集。
[0095] 本步骤实施时,从交通特征集中获取特征后,会将交通特征集中的原特征删除,从而避免后续重复获取相同的特征。
[0096] 步骤604,将各服务器的候选特征子集发送至各服务器进行分析,以由各服务器对候选特征子集进行筛选,并统计从候选特征子集中删除交通特征的数量;根据各服务器删除交通特征的数量及各服务器的性能,从交通特征集中获取交通特征。
[0097] 本实施例依据服务器的性能确定特征处理量,能够保证服务器的最大工作效率,提高特征处理效率。且本实施例通过候选特征子集的分发,能够实现特征处理的并行处理,提供特征处理效率。
[0098] 本发明再筛选出上述影响目标变量的最优交通特征集之后,即可根据最优交通特征集的数据集建立目标变量的预测模型,在建立预测模型的基础上,即可利用预测模型根据实时的最优交通特征值预测目标变量值。
[0099] 基于同一发明构思,本发明还提供一种地理信息数据的处理装置,如下面的实施例所述。由于地理信息数据的处理装置解决问题的原理与地理信息数据的处理方法相似,因此,地理信息数据的处理装置的实施可以参见地理信息数据的处理方法,重复之处不再赘述。
[0100] 具体的,如图7所示,地理信息数据的处理装置包括:数据获取单元701,用于获取目标区域在预定时间范围内的地理信息数据。
[0101] 计算单元702,用于根据所述地理信息数据,计算得到交通特征集的多个数据集及各数据集的目标特征值。
[0102] 第一筛选单元703,用于利用预先确定的物理知识库,对所述交通特征集中的特征进行一次筛选得到备用交通特征集,所述物理知识库包括具有物理关联关系的多个特征集合。
[0103] 第二筛选单元704,用于根据所述备用交通特征集中特征间的强相关性以及所述备用交通特征集中特征与目标特征间的强相关性,对所述备用交通特征集中的特征进行二次筛选,得到最优交通特征集,根据所述最优交通特征集及目标特征建立目标特征预测模型。
[0104] 本实施例通过利用物理知识库对交通特征集中的特征进行一次筛选得到备用交通特征集,根据备用交通特征集中特征间的强相关性以及所述备用交通特征集中特征与目标特征间的强相关性,对备用交通特征集中的特征进行二次筛选得到最优交通特征集,能够降低地理信息数据的交通特征选择算法复杂度,增加其适用场景,在有限资源下保证计算精度,减少特征冗余。
[0105] 本发明进一步实施例中,如图8所述,地理信息数据的处理装置还包括:拆分单元705,用于从通特征集中随机选择预定数量的交通特征组成候选特征子集,并将候选特征子集中的交通特征从所述交通特征集中删除。
[0106] 进一步的,第一筛选单元703及第二筛选单元704用于对候选特征子集中的特征进行一次筛选以及二次筛选,同时记录删除交通特征个数。
[0107] 更新控制单元706,用于当候选特征子集中所有特征均已分析,且删除交通特征个数不为零时从交通特征集中随机选择删除交通特征个数的交通特征至候选特征子集中并对删除交通特征个数进行归零处理,当删除交通特征个数为零时,则从交通特征集中至少选择一个交通特征至候选特征子集中,并将选择的交通特征从所述交通特征集中删除,利用第一筛选单元703及第二筛选单元704重复对候选特征子集进行一次筛选及二次筛选的过程;当交通特征集为空时,结束筛选。
[0108] 本发明一实施例中,目标特征为距离目的地的行程时间,可按照前述实施例所述的方法确定目标特征的最优交通特征。在此基础上,利用最优交通特征的数据集及对应的目标特征数据集建立行程时间预测模型,建模时可选用神经网络作为初始模型,本发明对建模的具体实施过程不做限定。
[0109] 在建立行程时间预测模型的基础上,可进行导航应用。本发明一实施例中,提供一种导航系统,如图9所示,包括:无人飞行设备901、卫星服务器902及客户端903。
[0110] 无人飞行设备901及卫星服务器902上安装有行程时间预测模型。其中,无人飞行设备901可以是无人机、飞艇、气球等。
[0111] 客户端903用于供用户输入目的地及检测卫星信号,在检测到卫星信号时,发送目的地信息至卫星服务器902,以由卫星服务器902中的行程时间预测模型计算得到距离目的地的行程时间,并返回至客户端903;在未检测到卫星信号时,发送目的地信息至附近无人飞行设备,以由无人飞行设备901利用行程时间预测模型计算得到距离目的地的行程时间,并返回至客户端903。
[0112] 详细的说,利用行程时间预测模型计算当前位置距离目的地的行程时间,包括:先确定当前位置距离目的地之间的所有道路以及道路的交通特征信息;
将各道路的交通特征信息输入至行程时间预测模型,得到各道路的行程时间;
计算当前位置距离目的地路径所涉及道路的行程时间之和,得到当前位置距离目的地路径的行程时间,将最小的行程时间以及路径返回至客户端。
[0113] 本实施例能够保证无卫星信号时,通过无人飞行设备仍能实现导航,提高用户体验。
[0114] 为了更清楚说明本发明技术方案,下面以应急交通调度为背景场景进行说明,所述应急交通调度的对象指消防车、救护车、道路救援车、警用车辆等应急车辆,调度场景具备高时效、高稳定、专用通信的特点,需要具备快速感知交通状态、保障信息安全等,本发明的算法用于交通状态感知,应用实例例如为交通事故场景,已知交通事故位置以及救援车辆位置,利用本发明提供的预测模型确定交通事故位置与救援车辆之间各道路的交通状态情况,基于道路的交通状态为救援车辆规划路径,从所有救援车辆中选择规划路径最小的救援车辆,通知该规划路径最小的救援车辆前往交通事故位置进行救援。
[0115] 本实施例依托的实施平台为安装Ubuntu系统的AMAX服务器,服务器包含80个2GHZ的Intel Xeon Gold 6138 CPU,5个NVIDIA Quadro GV100 GPU,256G的运行内存及4.2TB的储存硬盘,为了方便进行操作服务器外接了显示器,鼠标及键盘。
[0116] 本实施例以城市街道行程时间预测作为样例场景,其目标特征为时刻t+1的路段i行程时间 ,根据路段行程时间及路段长度计算运行速度,基于运行速度确定道路状态。其交通特征集还包括:时刻t的路段i对应的交通密度 、交通流率 、交通平均速度i i、时间占有率 、空间占有率 ,路段i对应的道路宽度η 、路段i应的道路长度l 、路段i对i
应的道路面积α 、道路拥堵密度ρm、道路临界密度ρc、通行能力qm、自由流速度vf、路段i对应i i
的交通信号类型s 、路段i对应的区域类型β ,时刻t的路段i对应的行程时间 。
[0117] 本实施例的公共数据集采集范围为某地区的局部路网,其包含有35个路段和22个交叉口,涉及3.04平方公里,其采集时段为2019年5月21日至2019年5月26日白天,共产生数据1080多万条。
[0118] 上述地理信息数据的处理过程包括:步骤1:输入并处理上述局部网络的地理信息数据,所述地理信息数据处理包括坐标系转化、平滑处理、时空冗余清洗及数据补全。
[0119] 步骤2:提取交通特征,所述提取方法包括以下步骤:步骤2.1:静态特征计算:计算方法为采用地理信息数据中的空间数据,根据空间边界和区域形状,通过边界交点坐标,计算或统计静态变量。
[0120] 步骤2.2:动态特征计算:计算方法分为瞬时采样和时空统计,所述瞬时采样为在某时刻,根据空间范围,获取变量值,所述时空统计为在某时间区间内,计算时空统计量。
[0121] 步骤3:形成原始交通特征集,其形式为:。
[0122] 步骤4:特征选择,所述特征选择包括以下步骤:步骤4.1:初始化参数,本实施例中参数初始化取值为:
建立待选择特征集Ω并将原始交通特征集ΩI赋值给待选择特征集,即Ω=ΩI;
通过从原始交通特征集Ω中随机选择3个交通特征建立候选特征子集ΩC,具体实施时,可选择其他数量的交通特征组成候选特征子集;
建立选出特征子集ΩS以及最佳特征子集ΩO,并进行如下赋值: , ;
t检验方法中强相干对应的相关系数下界θt=2.581,t检验方法中不相干对应的相关系数上界τt=0.005;
Pearson相关系数分析方法中强相干对应的相关系数下界θp=0.850,Pearson相关系数分析方法中不相干对应的相关系数上界τp=0.300。
[0123] 具体实施时,还可根据实际需求选择其它t检验方法及Pearson相关系数分析的上下界参数。
[0124] 物理知识库中的交通集形式如下表5所示:表5
[0125] 步骤4.2:判断待选择特征集Ω是否为空集,若为空集,则转至步骤4.9,否则,转至步骤4.3。
[0126] 步骤4.3:判断删除交通特征个数NF是否为0,如果是,则从待选择特征集Ω随机选择一个交通中的特征加入候选特征子集ΩC,否则,从待选择特征集Ω中加入删除交通特征个数NF个交通特征。
[0127] 步骤4.4:删除交通特征个数NF归零。
[0128] 步骤4.5:将候选特征子集ΩC中的交通特征从待选择特征集Ω中删除。
[0129] 步骤4.6:根据物理知识库中的交通相关集 更新候选特征子集ΩC和删除交通特征个数NF,所述更新方法为遍历交通相关集 ,选出可由其他特征完整替代的特征,将该特征从候选特征子集ΩC中剔除,并计算剔除特征数作为删除交通特征个数NF的值。
[0130] 步骤4.7:从候选特征子集ΩC中随机选出一个交通特征Fi。
[0131] 步骤4.8:计算交通特征Fi与其他特征的相干性,所述相干性的计算方法包含如下步骤:步骤4.8.1:判断交通特征Fi是否为二值特征,若为二值特征,则执行步骤4.8.2,否则执行步骤4.8.9。
[0132] 本实施例中二值特征为si、βi,其中,si=0时,表示信号控制方法为无信号控制,si=i i1时,表示信号控制方法为有信号控制,而β =0时,表示道路空间为城市路段,β =1时,表示道路空间为交叉口。
[0133] 步骤4.8.2:计算交通特征Fi与目标特征Y的t检验参数t(Fi,Y)和Pi(Fi,Y),所述检验参数t(Fi,Y)的计算如下:(1)
其中, 为交通特征Fi二值特征作用下Y成对样本差值的平均数,μ0为交通特征Fi对应t分布的期望,nF为交通特征Fi包含的成对样本组数,sd为交通特征Fi两值作用下Y成对样本差值的标准偏差,其计算公式如下:
(2)
其中, 为交通特征Fi二值特征作用下Y第j对样本差值。
[0134] 所述Pi(Fi,Y)表示交通特征Fi二值特征作用不显著的发生概率,算法根据检验参i i数t(Fi,Y)的值调用取值表获得对应的实时取值;则在二值特征s 、β 对目标特征Y的检验参数如下表6所示:
表6
[0135] 步骤4.8.3:判断t检验参数t(Fi,Y)与 ,Pi(Fi,Y)与 的关系,如果 或,则说明交通特征Fi与目标特征Y不相关,将交通特征Fi从候选特征子集ΩC中剔除,并令删除交通特征个数NF的值加1,随后,返回步骤4.7,否则,说明交通特征Fi与目标特征Y相关,执行步骤4.8.4。
[0136] 本实施例中,si、βi均对目标特征有显著性影响,具有相关性。
[0137] 步骤4.8.4:判断集合{ΩC‑Fi}是否为空集,如果是,返回步骤4.2,否则,从集合{ΩC‑Fi}中选择交通特征Fk,执行步骤4.8.5。
[0138] 步骤4.8.5:判断交通特征Fk是否为二值特征,如果是,则计算t检验参数t(Fi,Fk)和Pt(Fi,Fk),执行4.8.6,否则,执行4.8.7;i i
本实施例中,s、β 的t(Fi,Fk)和Pt(Fi,Fk)的计算结果如下表7所示:
表7
[0139] 步骤4.8.6:判断t检验参数t(Fi,Fk)与θt,Pt(Fi,Fk)与τt的关系,如果t(Fi,Fk)>θt且Pt(Fi,Fk)<τt,则说明交通特征Fi与Fk相关,将交通特征Fi从候选特征子集ΩC中剔除,并令删除交通特征个数NF的值加1,随后,返回步骤4.7,否则,说明说明交通特征Fi与Fk不相关,返回步骤4.8.4。
[0140] 步骤4.8.7:计算Pearson相关系数Pe(Fi,Fk),并执行步骤4.8.8,所述Pe(Fi,Fk)的计算方法如下:(3)
其中,Cov(Fi,Fk)为两个随机变量(即交通特征Fi,Fk)的协方差,D(Fi)为交通特征Fi的方差,D(Fk)为交通特征Fk的方差。
[0141] 本实施例中,si、βi分别与其他非二值特征的Pearson相关系数计算结果如图10所示。
[0142] 步骤4.8.8:判断 ,如果是,则说明Fi,Fk相关,则将交通特征Fi从候选特征子集ΩC中剔除,并令删除交通特征个数NF的值加1,否则,执行如下判断:判断 ,如果是,则说明Fi,Fk不相关,返回步骤4.8.4。
[0143] 步骤4.8.9计算Pe(Fi,Y),执行步骤4.8.10;本实施例中,非二值特征与目标特征的Pearson相关系数如图11所示。
[0144] 步骤4.8.10:判断 ,如果是,说明不相关,将交通特征Fi从候选特征子集ΩC中剔除,并令删除交通特征个数NF的值加1,随后,返回步骤4.7,否则,执行步骤4.8.11。
[0145] 步骤4.8.11:判断 ,若是,返回步骤4.7,否则,返回步骤4.8.4。
[0146] 步骤4.9:最终得到的候选特征子集 ,令Ω0=Ωs=ΩC 。
[0147] 步骤5:输出候选特征子集ΩC,作为特征选择方法的结果并结束算法。
[0148] 在得道最优交通特征集的基础上,可选用动态图卷积递归网络(DGCRN)作为实验神经网络,根据筛选前的交通特征以及筛选后的交通特征分别建立预测模型,对比两个预测模型的预测精度,来验证特征算法的可行性。其中,DGCRN的神经网络架构如图12所示,DGCRN的神经网络中所述动态图生成器的架构如图13所示,DGCRN的神经网络中所述动态图卷积模块如图14所示。
[0149] 本实施例中DGCRN的输出为 ,所述准确率的评价指标为误差分布,所述效率评价指标为平均计算时间;误差分布图如图15所示。
[0150] 特征选择前后,DGCRN的预测误差无明显变化,且大于12s的高误差区间分布,采用特征选择算法后的输入样本量更低;平均计算时间方面,未采用本发明地理信息数据的处理方法的DGCRN对应计算时间为1.59s,采用本发明地理信息数据的处理方法的DGCRN对应计算时间为1.16s,本发明的实施降低了DGCRN的计算时间;以上结果说明本发明地理信息数据的处理方法进行特征筛选可以保持且提高DGCRN的预测精度并提高计算精度,具有实用价值。
[0151] 本实施例的交通状态预测结果分为畅行、缓行和拥堵,具体划分方式参考表1。
[0152] 在预测各路段的行程时间基础上,可计算得到交通状态预测结果,如图16A及图16B所示,图16A为局部路网示意图,图16B为局部路网的交通状态预测图。
[0153] 本发明在建立上述预测模型的基础上,还可应用于应急救援、大型活动疏散、节假日出行分布等特定城市场景下的星上边缘计算,提供低成本、高可靠解决方案的新思路。
[0154] 本发明用于智能交通系统领域,可以根据实际应用场景,在线或离线对从地理信息数据中获取的交通特征进行筛选。
[0155] 在线的交通特征选择可以用于短时交通预测和实时交通估计需求,针对交通模型的快速训练、交通参数的敏捷更新和交通数据的智能挖掘,可快速获取实时大规模数据的核心交通信息,保证快速准确的交通建模应用并减少冗余数据对模型结果准确性的干扰。
[0156] 离线交通特征选择可以用于交通大数据的压缩存储,在尽量减少信息损失的前提下,实现交通大数据存储规模的小型化和高保真。
[0157] 此外,本发明考虑了交通特征变量间的固有联系,符合宏观交通基本图和交通系统最优等基本规律,兼顾了数据驱动与模型驱动架构,将传统交通流模型引入交通大数据应用场景。
[0158] 本发明是基于地理信息或交通数据的人工智能、交通建模研究及交通估计预测算法的前提条件和基础技术,可提高地理信息数据在相关交通领域应用的可靠性和泛化能力。
[0159] 本发明一实施例中,提供一种计算机设备,如图17所示,计算机设备1702可以包括一个或多个处理器1704,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备1702还可以包括任何存储器1706,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储器1706可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备1702的固定或可移除部件。在一种情况下,当处理器1704执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备1702可以执行相关联指令的任一操作。计算机设备1702还包括用于与任何存储器交互的一个或多个驱动机构1708,诸如硬盘驱动机构、光盘驱动机构等。
[0160] 计算机设备1702还可以包括输入/输出模块1710(I/O),其用于接收各种输入(经由输入设备1712)和用于提供各种输出(经由输出设备1714)。一个具体输出机构可以包括呈现设备1716和相关联的图形用户接口1718(GUI)。在其他实施例中,还可以不包括输入/输出模块1710(I/O)、输入设备1712以及输出设备1714,仅作为网络中的一台计算机设备。计算机设备1702还可以包括一个或多个网络接口1720,其用于经由一个或多个通信链路
1722与其他设备交换数据。一个或多个通信总线1724将上文所描述的部件耦合在一起。
[0161] 通信链路1722可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路1722可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
[0162] 本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法的步骤。
[0163] 本发明实施例还提供一种计算机可读指令,其中当处理器执行所述指令时,其中的程序使得处理器执行前述任一实施例所述的方法。
[0164] 应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0165] 还应理解,在本发明实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本发明中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0166] 本领域普通技术人员可以意识到,结合本发明中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。
专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0167] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0168] 在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
[0169] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0170] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0171] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0172] 本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页 第1页 第2页 第3页
相关技术
地理信息相关技术
处理方法相关技术
师泽宇发明人的其他相关专利技术