首页 / 一种基于集群式联邦学习的城市交通流量预测方法

一种基于集群式联邦学习的城市交通流量预测方法实质审查 发明

技术领域

[0001] 本发明涉及一种基于集群式联邦学习的城市交通流量预测方法,属于智能交通技术领域。

相关背景技术

[0002] 近年来,随着社会经济的蓬勃发展及人民生活水平的不断提高,汽车数量日益增加,城市用车面临着越来越多的交通阻塞问题。如何准确高效地预测城市交通流量,为解决城市道路的交通阻塞问题、减少产生的环境污染及提高交通出行效率都具有重要意义。
[0003] 目前对于交通流量预测任务而言,已有较多的研究工作,主要集中在如何采用集中式机器学习方法提高预测的准确率,如自回归模型(AR)、长短期记忆网络(LSTM)和图神经网络(GNN)等。一部分方法仅考虑了时间相关性,忽略了道路之间的空间依赖性,导致预测准确率较低。大部分方法则仅采用集中式学习预测,可能造成隐私交通数据的泄漏问题。因此,城市交通流量预测任务主要面临两个难点:复杂的时间空间依赖关系及数据安全隐私问题。
[0004] 针对复杂的时空依赖关系,城市交通流量不仅与时间推移密切相关,更是与道路的分流汇合息息相关。时间维度上,工作日与节假日的车流量会有显著不同,而上下班高峰期更是会极大地影响车流量信息。空间维度上,主路与辅路的交汇以及道路的路口连接都会影响到彼此的车流量。而对于上下班高峰期带来的城区和郊区道路流量变化,则涉及到复杂的时间与空间的依赖关系。因此,如何挖掘非线性的时空依赖关系,从而准确地预测城市道路流量是一个具有挑战性的问题。
[0005] 针对数据安全隐私问题,城市交通流量信息的采集在现实生活中往往来自于不同的机构,如政府交通部门及各出行平台等来源。若采用传统的集中式学习方法实现流量预测,则需将所有数据信息进行共享,汇总于中央服务器进行训练,这个过程极大地增加了隐私数据泄露的可能性。因此,如何构建一个安全可靠的模型架构是一个具有现实意义的挑战,从而避免潜在的隐私泄漏问题。

具体实施方式

[0045] 下面结合附图对本发明做进一步详细说明。
[0046] 如图1所示,一种基于集群式联邦学习的城市交通流量预测方法,包括获取城市交通流量数据信息、构建集群拓扑结构、本地客户端预测计算、集群领导者参数聚合,及中央服务器全局参数更新。
[0047] 本方法中所涉及的对象包含中央服务器、集群领导者及本地客户端,这三类对象构成三层结构。如图2所示,三层结构中,本地客户端和集群领导者进行通信传输参数,集群领导者和中央服务器进行通信传输参数。其中,集群领导者是在本地客户端构建集群拓扑结构后,从中选择得到。
[0048] 具体地,本方法的训练过程如图3所示。本地客户端向集群领导者上传参数,集群领导者对参数进行聚合后发送至中央服务器。中央服务器进行聚合更新,将更新后的参数下发至集群领导者,再由集群领导者下发至本地客户端。具体包含以下步骤:
[0049] 步骤1:获取城市交通流量数据信息,对其进行预处理,得到关于城市交通流量的时空序列数据PeMSD7,其中,交通道路的数量n=228,观测窗口w=12672。将其输入至集群式交通流量时空预测模型。
[0050] 步骤2:集群式交通流量时空预测模型根据城市交通流量数据构建集群拓扑结构,从而捕获城市交通流量数据的空间依赖关系。
[0051] 其中,构建集群拓扑结构算法的具体流程如下:
[0052] 步骤2.1:采用变量模糊聚类方法,将本地客户端划分为k=8个集群[C1,C2,…,C8],以便在同一集群中的变量之间的相关性尽可能高,而不同集群的变量之间的相关性尽可能低。具体计算过程如下:
[0053] 步骤2.1.1:根据变量数n=228和集群个数k=8,随机初始化参与度矩阵i和集群中心矩阵V=[C1,…,C8];其中,μij表示变量x在集群Cj
中的参与程度。
[0054] 步骤2.1.2:通过 及 计算得到聚类簇i
中心Cj和变量x 在聚类簇Cj中的参与程度 其中m是模糊度加权指数,计算限定条件为且μij∈[0,1]。Cl表示第l个聚类簇中心,l∈[1,k]。
[0055] 步骤2.1.3:不断更新参与度矩阵U和集群中心矩阵V,使得i
获得最小值,1
[0056] 步骤2.1.4:根据参与度矩阵U获得变量的集群划分结果[C1,C2,…,C8];
[0057] 步骤2.2:基于参与度矩阵U在集群中选定参与度最大的本地客户端作为此集群的领导者节点,共确定8个领导者节点[CH1,...,CH8];
[0058] 步骤3:本地客户端通过卷积递归神经网络分别捕捉时间模式中的局部与全局信息,从而捕获城市交通流量数据的时间依赖关系,得到本地流量数据的预测结果;
[0059] 其中,构建卷积递归神经网络预测算法的具体流程如下:
[0060] 步骤3.1:卷积神经网络使用k个过滤器,获取时间维度上的短期依赖关系信息,其计算方法为: 计算得到输出结果oC,其中*代表卷积运算,RELU表示激活函数,Wi表示权重矩阵,EC表示本地数据的表征结果,bi表示偏置项。
[0061] 步骤3.2:循环神经网络采用Bi‑LSTM网络的门学习,得到时间维度上的长期依赖关系信息。计算过程如下:
[0062] 步骤3.2.1:LSTM网络循环功能表示为:
[0063] ht,ct=LSTM(ht‑1,ct‑1,xt)
[0064] 其中,t表示观测时间点;ht表示隐藏状态,ct表示细胞状态,xt表示时间点t的输入值。
[0065] 步骤3.2.2:LSTM网络的计算过程,展开如下:
[0066] rt=σ(xtWxr+ht‑1Whr+br)
[0067] ut=σ(xtWur+ht‑1Whu+br)
[0068] ct=RELU(xtWxc+rt☉(ht‑1Whc)+bc)
[0069] ht=(1‑ut)⊙ht‑1+ut⊙ct)
[0070] 其中,xt表示时间点t的输入值,σ表示sigmoid函数,⊙表示元素点积,rt表示遗忘门输出,ut表示输入门输出;Wxr、Whr、Wur、Whu、Wxc、Whc均为权重矩阵;br、bc表示偏置项。
[0071] 通过LSTM网络的计算,得到隐藏状态ht。
[0072] 步骤3.2.3:Bi‑LSTM将两个普通LSTM网络组合在一起,同时捕捉正向和反向的依赖关系 和 通过拼接 得到预测生成模块的输出结果。 表示正向隐藏状态, 表示反向隐藏状态。
[0073] 步骤3.3:将卷积神经网络的输出结果oC和循环神经网络的输出结果ht进行拼接,作为本地客户端卷积递归神经网络预测算法的结果;
[0074] 步骤4:本地客户端将本地模型参数发送至给所属集群的领导者节点CHk,CHk采用交叉融合方法聚合同一个集群中本地客户端的模型参数得到聚合结果ωk,将其发送至联邦学习框架中的中央服务器端。
[0075] 其聚合过程如下:
[0076] 步骤4.1:各集群的本地客户端发送参数至领导者节点CHk;
[0077] 步骤4.2:领导者节点CHk采用变量交叉融合方法通过模拟给定实值特征向量的每对变量之间的相互作用来获得集群的聚合结果。在每个 集群中,应用计算得到集群各个客户端参数
之间的相关性,其中,VIR表示获取集群聚合结果的函数,ω0表示整体偏差,ωi表示第i个变i j
量的权重,表示变量x和x 之间的成对交互作用,表示点积。共计得到8个集群聚合结果
[0078] 步骤4.3:领导者节点CHk将聚合后得到的结果发送至中央服务器;
[0079] 步骤5:中央服务器采用Staleness‑aware全局更新算法对中央服务器全局模型进行参数更新,并将融合更新后的参数下发至每个领导者节点CHk。
[0080] 其中,Staleness‑aware全局更新算法的具体流程如下:
[0081] 步骤5.1:由于各个集群聚合是异步完成的,因此自上次全局更新以来每个集群的更新次数是不相同的,将此更新次数定义为陈旧值τ。
[0082] 步骤5.2:根据陈旧值τ,通过公式 计算得到集群k的参数ω(k)在训练次数epoch为t时的权重值 其中a>0,b>0; 作为初始
模型的权重。
[0083] 根据α值的计算,参数ω(k)在训练次数epoch为t时的权重值 的计算方式表达为:
[0084] 步骤5.3:根据参数ω(k)的权重值 通过公式计算得到全局模型更新后的结果ωt,将此结果下发至领导者节点CHk;
[0085] 步骤6:领导者节点CHk获取更新后的参数ωt,分别下发至每个本地客户端;
[0086] 步骤7:本地客户端得到参数后对本地模型参数进行更新;
[0087] 步骤8:重复步骤3‑7,直至获得预期效果,得到最终的城市交通流量预测结果。
[0088] 至此,经过步骤1到步骤8,完成了一种基于集群式联邦学习的城市交通流量预测方法。
[0089] 综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页