技术领域
[0001] 本发明涉及飞行器空域冲突消解技术领域,特别涉及一种大规模空域冲突快速消解方法与系统。
相关背景技术
[0002] 空域的规划在飞行过程中是必不可少的环节,对于空域的合理规划不仅要使得空中飞行的所有飞行器互相之间保持安全距离防止碰撞,更要在飞行器之间产生碰撞可能时能够快速及时地作出调整,从而避免不必要事故的发生。
[0003] 一般情况下,空域的规划采用全局预先规划的算法,即将所有空域通过算法控制器进行合理的排列,使其在空间环境中在时间和空间上产生交错,达到防相撞空域规划的目的。如专利号为CN111210669B、名称为一种基于推演评估的空域冲突解脱规则创建方法及系统的中国发明专利,包括步骤S1根据用空需求提取空域使用信息并建立空域集合;步骤S2检测用空需求冲突;步骤S3创建空域冲突解脱规则;步骤S4执行冲突解脱规则;步骤S5推演评估空域冲突解脱后的空域使用情况,此现有技术根据不同运行需求生成对应的空域冲突解脱规则,并对空域冲突解脱后空域使用的推演评估,可给出适合当前运行活动的空域冲突解脱规则。
[0004] 但在特殊情况下,往往存在突然的空域变化,例如新空域申请临时加入、旧的空域因气象等特殊因素需要更改,这些突发的情况往往牵一发而动全身,尤其在战场环境中,密集性高、随动性大,此时如果重新对所有空域进行全部的调整,根本不能满足时效性的要求,极可能延误战争的有利时机;但是如果仅对局部的模型进行调整,那么调整后可能会与其他临近空域产生冲突,影响飞行的安全性。
[0005] 因此,需要设计一种快速、简便的大规模空域冲突的检测与调解方法,以应对真实战场中的空域环境临时改变的状况。
具体实施方式
[0059] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。
[0060] 参照图1‑7,本发明提供一种大规模空域冲突快速消解方法,包括以下步骤:
[0061] 步骤1:建立三维空域模型1;
[0062] 将空域进行建模抽象为在空间中存在的立体多边形空间101以及空域所需占用时间长度102,设定空域ky在一段时间周期内占用有限空间的数学模型:
[0063] ky={(X,Y),H,T} (1)
[0064] 其中:(X,Y)=[(x1,y2),(x2,y2)...]为空域ky在二维平面中的位置信息,H=[h1,h2]为空域所占用的高度范围,T=[t1,t2]为空域占用时长。
[0065] 步骤2:以三维空域模型1为基础构建双重局部模型2,利用两次局部调整代替全局调整,使得空域冲突消解与空域维度无关;
[0066] 第一步:以L‑局部(以下简称L‑局部202)调整小局部的个别空域,达到个别空域冲突调解的目的;
[0067] (Ⅰ)确定预先规划好的现有空域KY,KY的集合如下:
[0068] KY={ky1,ky2,ky3,...kyk,...,kyn} (2)
[0069] (Ⅱ)确定需要加入的新的空域NKY,NKY的集合如下:
[0070] NKY={Nky1,Nky2,Nky3,...Nkyl,...,Nkyn} (3)
[0071] (Ⅲ)提取NKY中的某一新空域Nky,并寻找与Nky在平面坐标系中距离最近的Near_m个空域Near_m_KY作为L‑局部,使得对于属于空域集合KY中的任意空域ky,其与新空域Nky之间的距离总存在 公式如下:
[0072]
[0073] 其中:Dis(·)为欧式距离函数,kyNear_m表示平面坐标系中距离最近的Near_m个空域, 为kyNear_m空域的补集,表示任意符号。
[0074] (Ⅳ)得到L‑局部冲突消解后的空域Nky2与Near_m_KY2。
[0075] 在L‑局部202空域冲突调解完毕之后,调解之后的L‑局部202空域可能会影响其他的空域,产生新的冲突,此时我们如果再次判断调整之后新的全局的空域,时效性完全无法满足,因此需要引入Partial大局部(以下简称P‑局部203)。
[0076] 第二步:在调整的L‑局部202空域中,其对整体空域范围的影响有限,因此在L‑局部202的邻域外包延伸一个范围内的空域形成P‑局部,作为二次空域冲突调解的范围,以此作为全局空域进行整体空域冲突与否的决策判断。
[0077] 由于L‑局部冲突消解后的空域Nky2与Near_m_KY2对多个空域进行了挪动,无论是平面坐标系上的位置挪动,还是时空坐标系上的时间高度挪动,都可能会对全局的空域产生影响;此时判断全局空域是否有新的冲突虽然可行,但十分影响算法的效率。因此本发明在此处引入二次邻域的概念,即P‑局部。
[0078] 寻找与Nky2在平面坐标系中距离最近的N*Near_m个空域NNear_m_KY,形成P‑局部,使得对于平面坐标系空域Nky中的任意坐标点(x,y),对于空域NNear_m_KY中的任意坐标点(xN,yN),总存在(x,y)≠(xN,yN);同理针对时空坐标系空域Nky中的任意点(t,h),对于空域NNear_m_KY中的任意点(tN,hN),总存在(t,h)≠(tN,hN)。公式如下:
[0079]
[0080] 其中:(x,y)为平面坐标系空域Nky中的任意坐标点,(t,h)为时空坐标系空域Nky中的任意点,(xN,yN)为平面坐标系空域NNear_m_KY中的任意坐标点,(tN,hN)表示时空坐标系空域NNear_m_KY中的任意坐标点。
[0081] 在此步骤中,L‑局部202与P‑局部203的冲突检测与冲突消解均与空域维度无关,即使在空域成千上百的复杂战场环境204中,也能通过少量运算达到最优算法效能,使其与数十空域计算的算法耗时不相上下。
[0082] 步骤3:设计坐标系重叠模型,以坐标系重叠模型的平面坐标系与时空坐标系中的空域矩阵排列对应的区域重叠与否,对整体空域冲突进行判断;
[0083] 在常规的空域规划中,一般是将XYZ三个坐标轴作为空间坐标系,除此之外将时间作为单独的坐标轴进行的思维规划方法,这种思维空域规划方法虽然符合人的思维模式,但以在时间轴上的立体碰撞检测方法,计算时间随着坐标轴的加入,从二维到三维再至四维,算法时间以指数级增长,不仅费时费力,而且十分影响算法效率。
[0084] 本发明设计的平面坐标系与时空坐标系叠加的模型,如图3所示,将传统的循环式空域冲突检测方法,转换为整体式的空域矩阵在坐标系中的叠加方法,即传统的重复的多次空域冲突检测,现仅需一次即可完成,从抽象四维转化为二维坐标系,提高算法效率。
[0085] 要使环境中所有的空域不发生冲突,最简单的方式就是在平面坐标系中将所有的空域进行平面的铺开,使其在平面上两两不相交即可;但在战场上,由于任务的需要或者协同的要求,各类飞机需要在同一平面范围内存在多个空域需求,此时就必须从高度上或者时间上对各空域进行调整,利用本发明构建的坐标系重叠模型,要使环境中所有的空域不发生冲突,只要使得在两个坐标系中的空域矩阵排列对应的区域没有重合即可。
[0086] 如图4所示,虽然S1空域与S2空域在XY平面坐标系中发生了冲突,但是其在TH时空坐标系中在高度上是相互分隔开的,因此可以认为这两个空域在全局环境中并没有冲突,可以正常进行空域的规划。需要注意的是,在时空坐标系中,其所呈现出的空域图形仅有矩形,这是由于高度和时间上的飞机固有属性所限制的。
[0087] 对整体空域有无冲突的存在是以Nky与Near_m_KY的位置关系进行判断,具体如下:
[0088] 1)不存在空域冲突
[0089]
[0090] 当满足公式(6)时,则Nky在平面坐标系中与其距离最近的空域已经有安全距离,不会有冲突的存在;
[0091] 2)可能存在空域冲突
[0092]
[0093] 当满足公式(7)时,在平面坐标系中存在冲突空域,此时空域虽然在平面坐标系中产生了冲突,但是在高度以及时间轴上可能会错开,也可以认为其是未冲突的区域,如下式(7‑1),
[0094]
[0095] 3)一定存在空域冲突
[0096]
[0097] 当满足公式(8)时,则Nky在平面坐标系与时空坐标系均产生冲突,极度影响飞行安全,此时需要对已经冲突的空域进行调解。
[0098] Nky能够产生冲突的空域假设为Cky∈Near_m_KY,此时需要对已经冲突的空域进行合理的调解;对于空域来讲,无论是新加进来的空域NKY还是原本的现有空域KY,均希望以一种最小的空域改变代价来消解空域的冲突,即在原有空域基础上,尽可能少的挪动、升降空域范围,也尽可能少的提前或者推迟空域占用时间。
[0099] 步骤4:通过强化学习算法4对上述判断得到的冲突空域进行最优约束,以寻求最优的冲突调解方案。
[0100] 当新加入的空域NKY与现有空域KY的规则产生冲突时,本发明设计了带有引导性的强化学习算法4,即在尽可能不改变空域平面坐标中位置的情况下,通过更改其余冲突空域的高度和时间,使冲突在时空坐标系中能够调解,但在瞬息万变的战场环境中,尽可能不改变原先所设计好的空域规则,或者尽可能少的改变原有空域规则,达到冲突消解的目的。
[0101] 对冲突空域进行最优约束的方法为:在策略上设计对现有空域在平面坐标系中改变的惩罚值>在时空坐标系中改变的惩罚值,引导空域冲突消解偏向于从高度和时间轴上进行冲突调解。
[0102] 实施例一:
[0103] 如图5所示,初始阶段,S1空域与S2空域是两个相互冲突的空域,此时我们在时空坐标系中改变高度和时间,如调整到S1’空域或者S1”空域,均可以达到冲突消解的目的,但是此时最优的调解策略是调整到S1’空域,这是由于S1”的惩罚值大于S1’,本发明的方法将对空域的调整量化转变为强化学习算法4中的奖惩函数,从而可以达到空域调解的快速最优。
[0104] 具体方法如下:
[0105] 假设当前所冲突的空域作为状态变量Sk=(Ckyk,Nkyk),对空域的操作作为动作变量 其中空域的动作是在四个轴上的行为,用以下公式表示:
[0106] a=(x,y,h,t) (9)
[0107] 在空域进行操作之后形成新的空域Sk+1,其反馈的奖励值rk+1:
[0108] rk+1=rx·Nx+ry·Ny+rt·Nt+rh·Nh (10)
[0109] 其中:rx,ry,rt,rh为每执行一次动作行为所产生的奖励值,Nx,Ny,Nt,Nh为所执行的在平面坐标系中x,y以及时空坐标系中t,h的动作次数。
[0110] 之后选择新的动作行为Ak+1,重复状态变更‑动作执行‑奖励计算‑状态变更,这种行为模式,可以得到多种冲突消解的策略。其中第k种冲突消解策略τ出现的概率为:
[0111]
[0112] 其对空域的强化学习所产生的轨迹回报r(τ)为:
[0113]
[0114] 强化学习的优化目标是需要在所有的碰撞消解之后的空域策略中选择最小的r(τ),使得既可以调解冲突,又对空域的操作行为最少。
[0115] 将调整后新的空域NKY加入到调整之后的原有空域策略中,形成新的未冲突空域策略:
[0116] R_KY={KY2,NKY2} (13)
[0117] 其中: 使得
[0118] 在本实施例中,如图6,利用本发明提出的方法对25个现有空域以及5个新加入的未知碰撞与否的空域进行冲突检测与冲突调解,经过冲突检测与调解,最终算法耗时1.07秒对冲突空域调整完毕。
[0119] 实施例二:
[0120] 如图7所示,利用本发明提出的方法对200个现有空域以及10个新加入未知碰撞与否的空域进行冲突检测与冲突调解,通过冲突检测与调解,最终算法耗时1.78秒对冲突空域调整完毕。
[0121] 因此,本发明提出的方法对空域冲突采取以双重局部调整代替全局调整,使空域冲突消解与维度无关,再通过平面坐标系与时空坐标系叠加的模型使得空域冲突检测一次即可完成,对检测出的空域冲突在尽可能不改变或者少改变原先设计好的现有空域规则的前提下调解,达到了快速消解空域冲突的目的。
[0122] 以上显示描述了本发明的基本原理、主要特征和本发明的优点,任何本领域的技术人员在本发明的领域内,依本发明所做的变化或修饰,例如借鉴双重局部模型、坐标系重叠模型的建立方法,改变平面坐标系或时空坐标系中的空域模型,改变强化学习算法对冲突空域进行最优约束以及将其运用到大规模空域冲突快速调解领域等,皆应属于本发明权利要求所保护的范围,本发明要求保护的范围由所附的权利要求书及其等效物界定。