技术领域
[0001] 本发明涉及固定时间航天器编队飞行控制方法,属于航天器编队控制技术领域。
相关背景技术
[0002] 航天器位置协同控制的目标是使得所有航天器的位置跟踪误差趋于一致,并跟踪各自期望的运动轨迹。
[0003] 航天器动力学的非线性、时变干扰和不确定性增加了控制器设计的困难程度;同时航天器近距离编队飞行还要考虑碰撞避免问题,包括成员航天器之间的碰撞避免,成员航天器与障碍物之间的碰撞避免。现有技术中,关于航天器的编队控制不能进行固定时间的限制,并且人工势函数方法也没有实现多航天器编队飞行的固定时间协同控制。
具体实施方式
[0127] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0128] 需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0129] 下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
[0130] 具体实施方式一、结合图1所示,本发明提供了一种固定时间航天器编队飞行控制方法,包括以下步骤,
[0131] 步骤一:由航天器实际位置与期望位置的误差,得到航天器位置误差动力学模型;
[0132] 步骤二:根据航天器位置误差动力学模型,由第i个航天器和第k个航天器之间的相对位置误差eik得到第i个航天器与邻居航天器总的相对位置误差 并求导得到 的表达式;
[0133] 步骤三:根据航天器位置误差动力学模型,基于参考航天器所在的参考坐标系建立第i个航天器的初始终端滑模面,所述初始终端滑模面在滑动流形建立后使航天器系统状态在固定时间内收敛到原点;
[0134] 步骤四:定义第i个航天器和第k个航天器之间的人工避碰势函数,并计算人工避碰势函数的梯度,进而结合初始终端滑模面变形得到具有安全距离约束的滑模面;
[0135] 步骤五:对成员航天器的外部扰动进行条件假设,设计得到固定时间观测器;
[0136] 基于固定时间观测器,并结合具有安全距离约束的滑模面和 的表达式设计得到采用无向通讯拓扑的编队航天器的滑模面,进而设计得到协同控制器u;
[0137] 步骤六:根据航天器系统中的所有变量有界,以及采用无向通讯拓扑的编队航天器的滑模面在固定时间内收敛到0,对协同控制器u进行修正,得到修正后协同控制器u,采用修正后协同控制器u对航天器进行固定时间的编队飞行控制。
[0138] 本实施方式中,编队航天器的相对运动模型如图2所示。其中,OIXIYIZI为赤道惯性坐标系,记为FI。在编队中每个航天器都是刚体航天器。参考航天器运行在特定的轨道上,令ocxcyczc为参考航天器的轨道坐标系,记作Fc。坐标系Fc的原点位于参考航天器的形心上,坐标轴ocxc沿着当地垂线方向,坐标轴ocyc沿着当地水平线方向,坐标轴oczc与坐标轴ocxc和坐标轴ocyc共同构成右手直角坐标系。本实施方式针对分布式卫星编队协同控制,所以,参考航天器是虚拟的。
[0139] 令ρi=[xi,yi,zi]T表示编队航天器中第i个航天器相对于参考航天器的位置矢量在参考坐标系下的表示。那么,它的相对运动学方程在惯性坐标系下可以表示为:
[0140]
[0141]
[0142] 式中vi表示速度;
[0143] 由于相对运动学方程未作任何近似或者线性化,因此它是精确的,并且当编队成员距离参考航天器的距离不是很远时,适用于任何偏心率轨道。
[0144] 进一步,步骤一中,第i个航天器实际位置与期望位置的误差ei为:
[0145] ei=ρi‑ρid,
[0146] 式中ρi为第i个航天器在参考坐标系下的实际位置,ρid为第i个航天器在参考坐标系下的期望位置;
[0147] 由误差ei得到航天器位置误差动力学模型为:
[0148]
[0149] 式中mi是第i个航天器的质量,Ci为列向量,θc为参考航天器的真近点角,Di为列向量,rc=||rc||为地心到参考航天器形心的距离;gi为列向量,di为第i个航天器受到的外部干扰;通常航天器受到的外部扰动主要有地球的非球形摄动引起的扰动,地球外部稀薄大气带来的扰动,以及其他天体带来的影响等,这些影响通常都是有界的;ui为施加在第i个航天器上的推力;
[0150]
[0151]
[0152] 式中μE为地球引力常数,I为单位矩阵,ri为第i个航天器形心到地心的距离;
[0153]
[0154]
[0155] 式中ni为列向量:
[0156]
[0157] 引理1:如果存在一个连续的径向无界的函数V(x):Rn→R+∪{0}且满足对于任意状态满足约束 其中α,β,p,q,k>0是常数并且pk<1,qk>1。那么,状态在有界的时间内收敛到原点,并且收敛时间方程满足
[0158] 引理2:如果存在一个连续的径向无界的函数V:Rn→R+∪{0},其导数满足*其中a,b, 是正数并且满足μ>1,φ>0也是一个常数。那么函
数V的值将在固定时间内收敛到0附近的小的邻域内,比如V≤2θ,其中θ满足收敛时间的上界为 其中
[0159] 步骤二中,第i个航天器和第k个航天器之间的相对位置误差eik为:
[0160] eik=ei‑ek, (7)
[0161] 式中ek第k个航天器实际位置与期望位置的误差,i≠k,i=1,2,3,……,n;k=1,2,3,……,n;n为编队航天器的总数量;
[0162] 基于无向通讯拓扑图和拉普拉斯矩阵L得到第i个航天器总的相对位置误差[0163]
[0164] 式中aik为无向通讯拓扑图的邻接矩阵的元素,lik为拉普拉斯矩阵L的元素;
[0165] 则 的导数 为:
[0166]
[0167] 令
[0168] 则式(8)和(9)可以表示为:
[0169]
[0170]
[0171] 式中 表示Kronecker乘法,e=[e1;e2;…;en]。
[0172] 接下来介绍固定时间终端滑模面设计。步骤三中,根据航天器位置误差动力学模型(6),令 其中j=x,y,z,是参考坐标系的三轴;建立第i个航天器的初始终端滑模面si,j:
[0173] si,j=arctan(x2i,j)+k1P(x1i,j), (12)
[0174] 式中k1为正数;p(x1i,j)为中间变量:
[0175]
[0176] β为常数,β>0,α为:
[0177] μ为常数,μ>4;
[0178] γ为:
[0179]
[0180] ε为小的正的常数;
[0181] 第一参数l1和第二参数l2的选择使方程P(x1i,j)及其导数连续:
[0182]
[0183]
[0184] 定理1:对于编队航天器相对运动系统式(6),所设计的滑模面式(12)在其滑动流形建立后,可以保证系统状态在固定时间内收敛到原点。收敛时间的上界是Ts,且此时控制输入是非奇异的。
[0185] 证明:选择李雅普诺夫函数为 则其导数满足:
[0186]
[0187] 由于方程 是恒成立的,则式(13)可以重写为下式:
[0188]
[0189] 其中 根据引理1,系统状态在固定时间内收敛到原点,且收敛时间的上界是
[0190] 本实施方式将人工势函数和滑模控制方法结合来研究考虑成员之间安全距离约束的编队航天器队形重构控制问题。通过将滑模面式(12)与人工势函数的梯度函数结合,提出了一种新的滑模面,该滑模面同样可以保证系统状态在固定时间内稳定。使用该滑模面,可以解决人工势函数的极小值问题。
[0191] 接下来介绍避磁势函数。步骤四中,定义第i个航天器和第k个航天器之间的人工避碰势函数Vik为:
[0192]
[0193] 式中rc0为成员航天器之间的安全距离(允许的最小距离),rd为人工避碰势函数开始起作用的成员航天器之间的距离;
[0194] 则人工避碰势函数Vik的梯度为:
[0195]
[0196] 根据人工避碰势函数Vik及其梯度在||ρi‑ρk||=rd是连续的,对初始终端滑模面si,j变形得到具有安全距离约束的滑模面s1i:
[0197] s1i=arctan(x2i)+(k1I3×1+m10fi2)P(x1i), (17)
[0198] 式中x2i为:x2i=[x2i,x;;x2i,yx2i,z];
[0199] x1i为:x1i=[x1i,x;x1i,y;x1i,z];
[0200] m10为大于0的常数;
[0201] fi为第i个航天器与其邻居航天器之间的安全距离约束:
[0202]
[0203] I3×1=[1,1,1]T。
[0204] 一般来说,系统模型式(6)中,航天器质量的消耗以及外部干扰是不能确定的。这些不确定性如果处理不好,会影响控制器的性能,甚至导致系统不稳定。为了更好地处理它们,接下来设计一个固定时间观测器。在继续讨论之前,先做一些假设。
[0205] 步骤五中,假设1:设定第i个航天器受到的外部干扰di满足:
[0206]
[0207] 式中 为每个成员航天器所受的扰动上界,
[0208]
[0209] 式中l为所有扰动上界的最大值;
[0210] 其中 和l均为正数;
[0211] 假设2:编队成员i的系统不确定性主要包含质量的消耗以及外外部扰动,则外部干扰di有界,并且可导,满足 max(Λi)≤Λ,Λi和Λ为已知的正数;
[0212] 此时 为标称量,Δmi为不确定性;
[0213] 则得到固定时间观测器如下:
[0214]
[0215] 式中Z1i为固定时间观测器的状态变量一, 为固定时间观测器的状态变量二,σ1、σ2、σ3和κ均为常数;
[0216] θi为:θi=Z1i‑x2i,κ>1, σ2>0,σ3>4Λ。
[0217] 定理2:对于编队航天器动力学系统(6),如果将观测器设置为式(18)的形式,并且假设2成立,则项 可以通过变量Z2i在固定时间内观测到,观测时间的上界是To。
[0218] 再进一步,步骤五中,所述固定时间观测器观测时间的上限为To:
[0219] 对θi求导得到:
[0220]
[0221] 令 则得到:
[0222]
[0223] 对 求导得到:
[0224]
[0225] 根据成员航天器外部扰动的条件假设,当式(18)中的约束以及假设2成立时,变量θi和 将在固定时间内最终一致收敛到0,收敛时间的上界To为:
[0226]
[0227] 式中ψ为正数,ψ=(σ1/σ2)1/(κ+0.5);
[0228] 根据 的定义得到,Z2i在固定时间内观测到项
[0229] 接下来介绍控制器的设计步骤:
[0230] 步骤五中得到控制器u的方法为:
[0231] 基于固定时间观测器,结合具有安全距离约束的滑模面和 的表达式,得到采用无向通讯拓扑的编队航天器的滑模面S1:
[0232] S1=H1s1, (22)
[0233] 其中s1=[s11;s12;…;s1n],s1i=[s1i,x,s1i,y,s1i,z]T,
[0234] 为了便于控制器设计,定义如下向量或矩阵:
[0235]
[0236] 假设3:编队航天器任意两个成员之间的初始距离都大于最小安全距离rc0。这意味着在控制器开始作用之前,任意两个航天器不发生碰撞。并且任意两个航天器的期望轨迹之间的最小距离也要大于安全距离rc0。
[0237] 则得到控制器u:
[0238]
[0239] 式中A为:A=diag(Ai),
[0240] f为:f=[f1;f2;…;fn],
[0241] P为:P=[P(x11);P(x12);…;P(x1n)]
[0242] Z2为:Z2=[Z21;Z22;…;Z2n];
[0243] τ1为:
[0244] 式中k2和k3是正的常数, 为常数,
[0245] η为正数,η>2。
[0246] 定理3:对于公式(6),如果假设2和假设3成立,那么所设计的控制器式(24)可以保证下面的结论成立。
[0247] 1、系统中所有的变量都是有界的。
[0248] 2、滑模面式(22)在固定时间内收敛到0,收敛时间的上界是T2。位置误差e和速度误差 在固定时间内收敛到0,收敛时间的上界是T3=T2+Ts。
[0249] 3、在队形变换过程中,任意两个编队成员之间都不会发生碰撞。
[0250] 4、编队航天器位置协同控制可以在固定时间内完成。
[0251] 证明:定理3的证明过程可分为两步。第一步是当时间t≥To时系统状态的稳定性。此时, 李雅普诺夫函数仍然选择为 则其导数满足:
[0252]
[0253] 接下来的分析过程和式(12)相似,最终,得到滑模面式(22)是有界的,并且在固定时间内收敛到0,收敛时间的上界是T2=To+Tr1, 其中,λmax(H2)是矩阵H2的最大特征值。则状态e的稳定性可
以描述为:
[0254] 根据式(17),当S1i,j=0,得到:
[0255]
[0256] 对式(26)变形,得到下式的结果:
[0257]
[0258] 则可以证明状态ei,j是有界的。
[0259] 证明:根据式(27),很容易得到|arctan(x2i,j)|≥k1|P(x1i,j)|。如果ei,j是无界的,那么|arctan(x2i,j)|也是无界的。这与 是矛盾的。最终,可以得到ei,j是有界的。
[0260] 根据式(17),状态ei,j在固定时间内收敛到0,收敛时间的上界是T3=T2+Ts。那么,速度跟踪误差 也在固定时间内收敛到0。从上面的证明过程中可以得到fi,j也是有界的,这意味着各编队成员在队形转换的过程中没有发生碰撞。当状态ei,j和 分别收敛到0时,编队航天器位置协同控制任务就完成了。
[0261] 第二步是分析当时间为0<t<To时,系统状态的稳定性。此时,其中Δi是观测误差,且满足max(||Δi||)<Δ,Δ是一个正数。根据对
引理2的证明,可以得到Δ也是有界的。最终可以得到 根据Young不等
式,下式中的结果成立。
[0262]
[0263] 根据定理2,可以得到滑模面S1是有界的。进一步得到状态ei,j也是有界的,并且在这段时间内任意两个编队成员都不会发生碰撞。最终,可以得到在整个时域内,系统状态都是最终一致有界的。
[0264] 说明1:根据定理3的证明过程,可以得到滑模面S1i,j有界可以保证fi,j是有界的。但是, 的表达式非常复杂,不利于工程应用。则对控制器式(24)进行修正。
[0265] 再进一步,步骤六中,修正后协同控制器u为:
[0266]
[0267] 参数K为 的最大值,fi,j为向量f的元素;
[0268] 修正后的(29)同样可以保证定理3中的结论成立。
[0269] 证明:当t≥To时,李雅普诺夫函数选为V2,则其导数满足:
[0270]
[0271] 其中d=[d1;d2;…;dn]。
[0272] 接下来的证明过程与定理3相似,不再赘述。
[0273] 仿真验证:
[0274] 下面通过数值模拟对本发明提出的控制方法的性能进行评估。模拟场景采用一个虚拟领航者和4个跟随者进行编队飞行。在这种情况下,假设航天器执行编队队形重构任务,即从空间中的任意四个位置变为一个矩形结构。虚拟领航者的轨道信息为ar=7178km,er=0.01,Ωr=0rad,ir=π/6rad,ωr=0rad,θr(0)=0rad。虚拟领航者的质量为mr=100kg。需要注意的是,虚拟领航者是用来生成期望位置的,因此虚拟领航者的质量可以是任意值。跟随者的质量设置为mi=100kg。推进器提供的最大推力为10N。外界扰动主要考虑地球非球形扰动的影响。本场景中编队航天器的通讯为无向通讯拓扑,其拓扑图如图3所示。编队成员之间的安全距离设置为rc0=25m。人工势函数起作用的距离设置为rd=100m。
仿真的初始条件如表2所示。系统不确定主要考虑是由质量的变化带来的,设置为其中Rand表示的是0到1之间的随机数。
[0275] 控制器参数设置如表1所示。仿真结果如图4至图13所示。根据前面的陈述,所设计的观测器完全估计不确定性的有界时间为140.5409s,滑模面式(22)收敛到原点的时间上界为1180.7512s。如图4所示,观测器对系统不确定性的实际估计时间为约为100s。根据图5,滑模面式(22)收敛到零的实际时间约为250s。根据图6和图7中的结果可知,系统状态ei,j‑4
和 分别收敛到区域|ei,j|<4×10 和 的实际时间为280s,远远低于计算的时间上界1443.0280s。图8显示,即使控制输入被限制,所提出的控制器也能有效的工作。用参数CPIs来评价控制器的编队跟踪精度和编队同步精度。它们的具体计算方式分别为这两个指标是用来分别评估编队跟踪精度
和编队同步精度的性能。指标 来评估能量消耗。从图9可以看出,
控制器式(29)的跟踪精度要优于其省略协调项的修正形式,尤其是在控制过程的后半段。
由于不确定性Δmi具有随机性,在两次仿真中不完全一样,所以导致控制器式(29)的控制精度不能完全保证优于其忽略协同项的修正形式。从图10可以看出控制器式(29)的位置同步性能较好。图11所示的结果是通过省略人工势函数得到的,这意味将参数设置为m10=0。
从图12可以看出航天器1和航天器2之间发生了碰撞。通过对比图11和图12,可以很容易地推导出在应用本发明方法提出的控制器(29)时,可以保证编队成员航天器之间的相互安全距离约束。图13给出了控制器式(29)的不同形式的能量消耗,由此可以推断避碰和同步需要更多的能量来保证。
[0276] 表1控制器参数设定
[0277]
[0278] 表2控制器式(24)初始条件
[0279]
[0280] 为了验证本发明方法提出的控制器的固定时间收敛特性,采用表2所示的另一组初始状态ρi′进行仿真测试。仿真结果表明滑模面式(22)收敛到0的实际时间约为300s。系‑4统状态ei,j和 分别收敛到区域|ei,j|<4×10 和 的实际时间为350s。同时各编队成员航天器之间的相互安全距离约束是满足的,最小相对距离为25.7121m。因此,这些仿真结果也验证了定理3的正确性。
[0281] 虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其它所述实施例中。