技术领域
[0001] 本发明涉及智能船舶路径规划技术领域,具体而言,尤其涉及一种考虑安全优化的多目标博弈追越路径规划控制器。
相关背景技术
[0002] 21世纪是海洋的世纪,蕴藏着丰富的生物资源、油气资源和矿物资源,是人类赖以生存的重要物质基础。在海洋资源中,航运业相比于空运和陆运,凭借其运输能力、距离和费用等优势,成为了经济发展的重要一环。随着各个行业领域的信息化智能化进程不断发展,尤其是互联网和人工智能等技术的不断进步,智能船舶以此为背景逐渐成为了提升航运业整体竞争力的主要手段。针对目前航运业中存在的问题,诸如执行任务航行时间较长,船员人工操作安全事故发生较多等,均对智能船舶在航运业的应用提出了新的要求。
[0003] 智能船舶航行在限制性水域安全有效地实现对多艘目标船舶的追越路径规划需要考虑多种约束条件,如在航行过程中与两侧航道边界的距离,与目标船舶的最小安全距离;同时,规划结果依赖于智能船舶的状态信息,还需要考虑可能存在的噪声干扰导致的安全性问题;以及对多艘具有不确定性的目标船舶规划最优追越路径的时效性。针对智能体在追越场景下无碰撞的路径规划问题,相关领域的学者已经提出了多种基于博弈论的路径规划方法。D.Sadigh针对智能汽车利用逆向强化学习中的代价函数,提出了人工操控汽车和智能汽车的两方博弈理论,通过训练学习驾驶员在不同场景下的操作,实现了人工操控汽车的路径规划。A.Liniger针对智能汽车两方协同路径规划问题,提出了利用有限预学习的操作集的方法,通过纳什均衡和斯塔克尔伯格均衡建立了两辆智能车的双矩阵博弈进行路径规划,实现了智能汽车的协同路径规划。D.Zhou针对自由通信的多智能体问题,提出了利用位置测量的缓冲沃罗诺伊单元图方法,实现了在复杂道路环境下智能体对静态障碍物的避碰。然而,上述相关研究大多是在已知操作集和训练学习等为前提,但在不同限制性水域下,之前训练学习的数据集无法适用,给规划的结果增加了不准确性。
[0004] 在现有的智能船舶在限制性水域的路径规划方法中,仍存在着如下问题:第一:在现有的智能体的路径规划方法中,较多的考虑对静态碍航物避碰的路径规划,无法扩展到对多艘动态目标船舶的追越路径规划。第二,在现有的智能船舶的路径规划方法中,较少考虑状态信息存在噪声扰动的问题,在路径规划的过程中,依赖于状态信息的准确性,导致规划结果无法保证安全性。第三:在现有的智能船舶的路径规划方法中,在全局路径规划算法与运动学模型没有利用相关的约束条件进行耦合,导致规划的路径可能不是最优效果。
具体实施方式
[0053] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0054] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0055] s(p)项为最佳迭代响应算法,∑部分为灵敏性分析部分
[0056] 如图1所示,本发明提供了一种考虑安全优化的多目标博弈追越路径规划控制器,智能船舶运动学模块、序列式博弈优化规划器模块,分段多项式路径优化模块和控制障碍函数安全优化模块。
[0057] 所述智能船舶运动学模块的输入端与分段多项式路径优化模块的输出端前向速度、控制障碍函数安全优化模块的艏摇角速度相连,所述智能船舶运动学模块的输出端状态信息与序列式博弈优化规划器模块输入端和控制障碍函数安全优化模块模块输入端相连。所述序列式博弈优化规划器模块的输入端还与多艘目标船舶的状态信息相连,所述序列式博弈优化规划器模块的输出为智能船舶的决策变量与横、纵两方向的路径参数。所述分段多项式路径优化模块的输入端与序列式博弈优化规划器模块的输出相连,所述分段多项式路径优化模块的输出端与控制障碍函数安全优化模块的输入端、智能船舶运动学模块的输入端相连。所述控制障碍函数安全优化模块的输入端与分段多项式路径优化模块的输出端优化艏摇角速度相连,还与智能船舶运动学模块的艏摇角速度相连。
[0058] A:智能船舶运动学模块
[0059] 模块的输入为前向速度Ui,艏摇角速度ri以及智能船舶所受到的噪声干扰ω;模块如下:
[0060]
[0061] 其中,[xi,yi,ψi]T分别为智能船舶的纵向位置、横向位置和艏摇角;模块的输出为T智能船舶的状态信息[xi,yi,ψi]和艏摇角速度ri。
[0062] B:序列式博弈优化规划器模块
[0063] 模块的输入为智能船舶的状态信息[xi,yi,ψi]T和多艘待追越目标船舶的状态信T T息[xj,yj,ψj],[xj,yj,ψj]分别为目标船舶的纵向位置、横向位置和艏摇角,脚标j=1,...,k为k艘不同待追越目标船舶的序列索引,k为目标船舶的总数量索引;模块如下:
[0064]
[0065] s.t.heq(Θi,Ai,Bi)=0,
[0066] gineq(Θi,Ai,Bi)≤0,
[0067] γ(Θi,Θj)≤0. (2)
[0068] 其中, βij为反映耦合程度的可调参数,λij表示约束条件中关联程度的拉格朗日乘子;n=1,2...,N为全局规划的步数索引,N为全局规划的总步数; 为智能船舶的决策变量, 为智能船舶在不同步数索引
下的位置, 为智能船舶在不同索引下的速度; 为目标船舶的决
策变量, 为第j艘待追越目标船舶在不同步数索引下的位置,
为第j艘待追越目标船舶在不同索引下的速度; 表示在纵向的多项式路径
拟合参数, 表示在横向的多项式路径拟合参数,m表示多项式的阶数;heq
(Θi,Ai,Bi)为等式约束,等价于 表示当前和上一步的步数索引对应的
位置和速度的关系,Δt为步长;gineq(Θi,Ai,Bi)为不等式约束条件包括:
和 τ为二阶参数化拟
合的中心航道,n=τ″/||τ″||为中心航道的单位法向量,W表示中心航道与航道边界的距离, 为智能船舶在当前步数索引下对应的距离与中心航道的最短
距离,Umax表示智能船舶的最大限制航速,rmax为智能船舶最大艏摇角速度;γ(Θi,Θj)为交互不等式约束条件,等价于智能船舶与第j艘待追越目标船舶之间的最小安全避碰约束条件 dmin表示智能船舶与第j艘待追越目标船舶之间最小的安全避碰距离;
模块的输出为智能船舶的决策变量Θi和横向、纵向的规划路径参数Ai,Bi。
[0069] C:分段多项式路径优化模块
[0070] 路径优化模块的输入为智能船舶的决策变量Θi和横向、纵向的规划路径参数Ai,Bi,模块如下:
[0071]
[0072] 其中,t∈[(n‑1)Δt,nΔt]为步数索引对应的时域区间;模块的输出为前向速度Ui和优化艏摇角速度ropt。
[0073] D.控制障碍函数安全优化模块
[0074] 模块的输入为优化艏摇角速度ropt,智能船舶的状态信息[xi,yi,ψi]T和艏摇角速T度ri、前向速度Ui,以及第j艘待追越目标船舶的状态信息[xj,yj,ψj] 和速度Uj,以及存在的噪声扰动ω,模块如下:
[0075]
[0076] ri≤|rmax|. (7)
[0077] 其中, 为考虑T T
噪声扰动所构造的控制障碍函数,ηi=[xi,yi,ψi] 为智能船舶的状态信息,pi=[xi,yi] 为T
智能船舶的当前位置,pj=[xj,yj] 为第j艘待追越目标船舶的当前位置,ω≤||ωmax||为所受到的噪声扰动,ω max为噪声扰动的最大值,α(·) 为 类方程 ,
分别表示 在(pi,pj)上关
于f(pi,pj)和g(pi,pj)的李导数,Uj表示目标船舶的前向合速度,ψj表示目标船舶的艏摇角;
模块的输出为艏摇角速度ri。
[0078] 本发明还提供了一种考虑安全优化的多目标博弈追越路径规划方法,基于考虑安全优化的多目标博弈追越路径规划控制器实现,包括如下步骤:
[0079] S1、序列式博弈优化规划器模块接收到智能船舶的状态信息[xi,yi,ψi]T和多艘待T追越目标船舶的状态信息[xj,yj,ψj]并对其进行二次优化和博弈迭代的数学处理后生成了决策变量Θi与横、纵两方向的路径参数Ai,Bi到分段多项式路径优化模块;
[0080] S2、分段多项式路径优化模块接收到博弈优化规划器的决策变量Θi与横、纵两方向的路径参数Ai,Bi,并将其数学转化后生成前向速度Ui到智能船舶和控制障碍函数安全优化模块、优化艏摇角速度ropt到控制障碍函数安全优化模块;
[0081] S3、控制障碍函数安全优化模块接收到分段多项式路径优化模块的优化艏摇角速T度ropt、前向速度Ui,智能船舶的状态信息[xi,yi,ψi] 和艏摇角速度ri、外部噪声干扰ω,并T
结合以及第j艘待追越目标船舶的状态信息[xj,yj,ψj]进行控制障碍函数优化,最后生成艏摇角速度ri到智能船舶;
[0082] S4、智能船舶运动学模块接收分段多项式路径优化模块的前向速度Ui,控制障碍函数安全优化模块的艏摇角速度ri以及外部噪声干扰ω,并将智能船舶的状态信息[xi,yi,Tψi] 输出至序列式博弈优化规划器和控制障碍函数安全优化模块,艏摇角速度ri输出至控制障碍函数安全优化模块。
[0083] 本发明还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时,执行考虑安全优化的多目标博弈追越路径规划方法。
[0084] 本发明还提供了一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器通过所述计算机程序运行执行考虑安全优化的多目标博弈追越路径规划方法。
[0085] 智能船舶运动学设计如公式(1),其中智能船舶的速度信息υi受到的约束包括:前向速度Ui≤|Umax|=1(m/s),艏摇角速度ri≤|rmax|=0.5(rad/s)。
[0086] 序列式博弈优化规划器设计如公式(2),其中智能船舶和各个目标船舶之间的耦合系数:βij∈[0,1],当βij=0时,则表明目标方程不受其他待追越的目标船舶的影响,同理βij越大,则追越博弈过程越具有竞争性,约束条件中的船间最小安全避碰距离dmin≥10(m),智能船舶与航道边界的距离W≤30(m)。
[0087] 分段多项式路径优化模块设计如公式(3),可得到每步索引对应的分段多项式的n n路径可由 表示,当规划路径为直线时,则为x=An,1t+An,0,y
=Bn,1t+Bn,0的线性表达形式,当执行追越任务,规划路径为曲线表达时,则为如下的非线性关系
[0088] xn=An,2t2+An,1t+An,0,yn=Bn,2t2+Bn,1t+Bn,0。
[0089] 本发明的设计目的是使智能船舶路径规划系统在满足式(1)‑(7)的情况下,由序列式博弈优化规划器通过最佳迭代响应算法对智能船舶和多艘目标船舶的位置进行计算,并在算法中利用判断语句,确定不同目标船舶,输出对智能船舶的优化指令位置信息,再通过分段多项式路径优化模块对智能船舶的状态信息进行处理,得到智能船舶所需控制输入,即可以保证智能船舶在限制性水域下实现对多艘目标船舶的全局追越路径规划并保证避碰。
[0090] 图2是在限制性水域下的追越场景效果图,(a),(b),(c),(d)分别表示对第一艘和第二艘目标船舶的跟踪、正在追越和完成追越的分时刻状态效果(白色船为智能船舶船,黑色船为目标船舶)。
[0091] 图3是敏感性提升序列式博弈优化规划器模块采用序列式计算与并列式计算的规划效果对比(白色船为智能船舶船,黑色船为目标船舶),可以看出序列式计算极大地减少迭代规划次数。
[0092] 图4是智能船舶的位置变化效果图,(a)纵向位置表示沿x轴方向的变化,(b)横向位置表示沿y轴方向的变化。
[0093] 图5是智能船舶的艏摇角ψi的效果图,其变化与图2中(a)‑(d)的分时刻追越效果图相匹配。
[0094] 图6是智能船舶的前向速度Ui与最大限制速度Umax的效果图,前向速度Ui与最大限制航速Umax的效果图,可以看出在追越场景下智能船舶以最大限制航速进行运动。
[0095] 图7是智能船舶艏摇角速度ri效果图,图中ri表示的描述了艏摇角ψi变化速率。
[0096] 图8是智能船舶与目标船舶间距的效果图,描述了两船间距的变化,且保证大于最小安全距离。
[0097] 图9是智能船舶与航道边界距离的效果图,描述了智能船舶在整体追越过程中,描述两侧航道边界的距离均在安全距离以内。
[0098] 由仿真结果可知,本发明提出的一种考虑安全优化的多目标博弈追越路径规划设计方法,通过引入欠驱动船舶运动学模型、利用最佳迭代响应算法与灵敏性分析相结合的博弈优化算法,利用迭代算法的明确收敛条件和收敛性,使智能船舶不断地在线逼近计算预测多目标船舶的路径并实现追越。同时将分段式多项式路径规划方法与欠驱动船舶运动学模型相结合,实现对每一时间段进行优化,提高路径规划的准确性。在规划时,利用序列式计算规划路径,减少了迭代规划的总次数,大大提高了规划速度,有效地增加了仿真实验效果的准确性。最后,考虑了当船舶运动学模型存在摄动等不确定性时,通过利用噪声扰动构造新的控制障碍函数,消除了噪声干扰所带了的安全性问题,提高了设计的鲁棒安全性。
[0099] 最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。