一种基于图交互机制的多模态车辆轨迹预测方法

一种基于图交互机制的多模态车辆轨迹预测方法实质审查发明

技术领域

[0001] 本发明属于汽车自动驾驶技术领域，具体涉及一种基于图交互机制的多模态车辆轨迹预测方法。

具体实施方式

[0068] 下面将结合本说明书附图，对本发明的技术方案进行清楚、完整地描述，需要注意的是，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0069] 请参阅图1‑图3，一种基于图交互机制的多模态车辆轨迹预测方法，包括如下步骤：

[0070] S1、构建一个包含车辆轨迹数据的深度学习数据库，并将其划分为训练集和验证集；步骤S1具体如下：

[0071] S1.1、提取目标车辆所处场景内所有车辆的历史行驶轨迹数据，每辆车对应一份数据集，每份数据集均详细记录了对应车辆在过去某一预定时间段内，每个采样时间点的具体位置坐标，这样便能全面掌握场景中每辆车的历史行驶轨迹；

[0072] S1.2、将场景中收集到的历史轨迹信息，通过转换为2D坐标系统的形式进行处理，从而构建出一个适用于深度学习算法的车辆轨迹数据库，这个数据库将作为后续分析和预测车辆行为的基础数据源；

[0073] S1.3、将构建好的车辆轨迹数据库进行划分，一部分作为训练集，用于训练深度学习模型，使其能够学习并理解车辆轨迹的特征和规律；另一部分则作为验证集，用于在模型训练过程中进行性能评估，帮助调整和优化模型参数，确保模型具有良好的泛化能力。

[0074] S2、定义车辆轨迹预测任务，获取并处理交通参与者的历史轨迹信息和目标车辆的车道信息，交通参与者的历史轨迹信息包括车辆在过去一段时间内的轨迹坐标、速度、加速度及横摆角速度属性；而目标车辆的车道信息则是根据其位置信息提取的周围车道线坐标、转向车道及是否为交叉路口；步骤S2具体如下：

[0075] 轨迹预测的目标是根据目标场景车辆及其周围场景车辆的状态特征，预测目标场景车辆未来的多个可能的轨迹，在有N个场景车辆的场景中，状态特征定义为：为第i辆车辆的历史状态，包括车辆i的位置用2D坐标
表示、车辆速度车辆加速度和车辆的横摆角速度即
M为高精地图信息，即通过高精地图的应用
程序接口获取的车道中心线位置，基于该场景中的可用特征，多模态轨迹预测任务可以表示为预测以Tf为预测的时间范围，以

[0076] S3、利用LSTM编码器对输入信息进行编码，采用图多头注意力模型处理车辆交互，得到车辆轨迹的交互特征，使用多模态稀疏注意力模型以提取车道和车辆交互的局部特征，最后使用基于贝塞尔曲线的轨迹解码器进行轨迹解码；步骤S3具体如下：

[0077] S3.1、用LSTM编码器对输入的车辆历史状态信息和高精地图信息进行编码提取特征，对于车辆历史状态，提取观测轨迹的特征和车辆行驶状态特征；对于高精地图，提取的特征信息能够反映空间关系，首先模型的输入经过嵌入层进行升维得到固定长度的嵌入向量然后利用LSTM编码器网络提取隐藏状态特征编码过程如下：

[0078]

[0079]

[0080]

[0081] 式中：φ表示激活函数为Relu的全连接层, 和分别为嵌入层输出结果与LSTM编码器的隐藏层，Wemb、We为嵌入层和LSTM编码器的可学习权重；

[0082] S3.2、首先用图表示车辆间的关系，将图注意力机制和多头注意力机制结合，形成图多头注意力模型来编码车辆之间的交互，节点集V中的每个节点对应一个交通场景中的对象，考虑到每个对象在不同时间步长可能有不同的状态，定义节点集其中n为场景中观察到的对象数量，th为观察到的时
间步长，为第i个车辆在时刻t的隐藏特征，最后计算车辆交互权重，表达式如下：

[0083]

[0084]

[0085]

[0086] 式中：Wqs、Wks和Wvs表示车辆交互中对应矩阵的可学习矩阵,计算第h个注意力头的车辆i在t时刻对观测时刻的注意力值表达式为：

[0087]

[0088] 将多头注意力平行运算h次并且串联，表达式为：

[0089] Ci＝Coni(head1,head2,…,headh)∈RN×d；

[0090] 式中： Con为concat操作，Ci为i时刻的交互特征，再将结果拼接并加权得到观测时域内的交互特征H，表达式为：

[0091]

[0092] S3.3、使用了车辆与车道信息的交互模块，使每个车辆能够收集到局部的静态车道信息，从而产生关心车道信息的预测结果，在车和车道交互编码器中，Q是来自车辆交互编码器的交互特征，K和V是来自地图编码器的特征向量，首先对键矩阵K采样，得到采样后的矩阵然后对查询矩阵Q的第i行qi求关于的M值，

[0093]

[0094] 式中：为评价qi是否重要的指标，的值越大，qi越重要；为的第j行；为缩放因子，d为K的列数，Lk为K的行数，然后找到M值最大的u个qi，将这u个qi组成新的查询矩阵并对求关于K的score值

[0095] 最后求得概率稀疏自注意力：

[0096]

[0097] 将多头稀疏注意力改为多模态稀疏注意力如下式所示，具体来说没有将单个头部的结果连接起来，并将连接的向量投影到低维向量上，而是直接输出单个头部的结果，最终的轨迹输出取决于单个头部，

[0098] Multimodel(Q,K,V)＝(head1，…,headh)；

[0099] 式中：Multimodel(Q,K,V)为多模态稀疏注意力；headh为第h个“头”，headh＝Attention(Qh,Kh,Vh)，Qh,Kh,Vh分别为第h个“头”的Q，K，V矩阵；

[0100] S3.4、在获得车辆交互特征和车图交互特征后与目标车辆的特征进行拼接，并发送给多模态运动解码器以生成对所有行动者的预测，预测了k种可能的未来，并且对于每种模式，应用了一个简单的MLP，它具有轨迹的回归头和分类头，然后是相应概率分数的softmax函数，轨迹回归头使用基于贝塞尔曲线的连续参数化表示。

[0101] 所述S3.4具体包括如下步骤：

[0102] S3.4.1、为了利用参数化轨迹的优势，引入Bernstein基多项式，其中的系数是具有具体空间意义的控制点，从而获得更好的收敛性，具体来说，n次贝塞尔曲线表示为：

[0103]

[0104] 式中：为i阶Bernstein基，为二项式系数，t为参数曲线变量，pi为控制点，对于n阶贝塞尔曲线，总共有n+1个控制点，第一个和最后一个控制点总是曲线的端点，由于贝塞尔曲线定义在t∈[0,1]上，本发明对实际时间τ∈[0,τmax]进行归一化，因此参数曲线可以写成此外由于矢状图的性质，n阶贝塞尔曲线的导数仍然是贝塞尔曲线，其控制点定义为即轨迹的速度剖面可由下式计
算：

[0105]

[0106] S3.4.2、使用一个简单的MLP作为回归头，执行从拼接好的车辆特征到控制点的映T×2 T×(n+1)射，然后每个预测轨迹的位置坐标Ypos∈R 可以通过常数基矩阵B∈R 与相应的预测(n+1)×2
二维控制点P∈R 简单地计算出来，

[0107]

[0108] 其中T为预测轨迹所需的采样时间戳数，为归一化时间点，对于具有非完整约束的智能体，如车辆和自行车，偏航角与轨迹的切向量对齐，我们可以从速度估计中导出每个状态的航向角，最后根据参与者对应的锚定姿态进一步将预测轨迹转换回全局坐标。

[0109] S4、构建损失函数，其中总损失为回归损失与分类损失的加权和，不断计算损失值；步骤S4具体如下：

[0110] S4.1、设置车辆轨迹预测模型的训练参数；其中包括车辆轨迹预测模型的迭代次数、训练的学习率；

[0111] S4.2、构建损失函数，并计算其损失值。

[0112] 所述S4.2具体包括如下步骤：

[0113] S4.2.1、总体损失函数是回归损失和分类损失的加权和：

[0114]

[0115] 其中ω∈[0,1]是平衡这些分量的权重，我们使用WTA策略来处理多模态，对于每个智能体，我们通过选择最终位移误差最小的一个，在k个假设中找到最佳预测轨迹k*；

[0116] S4.2.2、对于分类任务，本专利使用最大边际损失来区分正向模式和其他类似的模式，

[0117]

[0118] S4.2.3、对于轨迹回归任务，除了位置坐标回归之外，本方法还引入了可选的偏航角损失来提供辅助监督，从而得到

[0119]

[0120] 其中ˉY(·)表示地面真实状态，Y k*(·)是WTA模式的预测位置和偏航角。本研究将平滑L1损失作为位置回归损失，将偏航回归损失指定为

[0121]

[0122] 其中cossim(·，·)是余弦相似性度量，对于两个对齐的偏航矢量，其值为1，对于两个相反的偏航矢量，其值为‑1，考虑偏航角损失隐含地增强了连续状态之间的一致性，使预测轨迹具有更高的平滑性和运动学可行性，并产生更真实的轨迹，特别是对于低速车辆。

[0123] S5、循环S3至S4，直至迭代次数达到预设值，然后使用验证集进行评估，选取在验证集上准确率最高的权重，从而获得最终的车辆轨迹预测模型。

[0124] 以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

[0125] 本发明未详述部分为现有技术。

查看完整全部详细技术资料

当前第1页第1页第2页第3页