技术领域
[0001] 本发明属于协同控制领域,具体涉及一种多智能体时变线性编队参数估计方法及参数估计器。
相关背景技术
[0002] 利用关联信息计算目标信息是估计的基本思路,近年来,多智能体系统得到了蓬勃发展,多智能体的协同估计问题也映入了人们的眼帘,如基于UWB的协同定位问题,就要求一群智能体根据自身与目标的距离信息,协同确定目标的方位。
[0003] 编队控制作为一种描述多智能体协同协同行为的优雅方式,也存在协同估计的问题,如根据邻居的变化估计现在对队形尺寸参数等。但是尺寸参数是简单的单参数,在近年来被提出的仿射编队控制中,可以利用一个仿射变换矩阵描述队形,该仿射变换矩阵的估计就显得困难了不少,目前还没有相关的估计方法的研究。
具体实施方式
[0037] 下面结合附图对本发明实施例进行详细描述。
[0038] 需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0039] 需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
[0040] 本发明为了描述更丰富的队形形状,使用一个线性变换矩阵描述队形形状,突破了可行队形被限制在预定的仿射像空间内的缺陷,并提出一种分布式估计方法,用于估计该时变线性变换矩阵,进而实现期望的时变编队机动。
[0041] 本申请实施例一种多智能体时变线性编队参数估计方法,具体过程为:
[0042] 步骤一:构建可行标称构型
[0043] 首先介绍一些用于描述线性编队控制的概念:
[0044] 标称构型(Nominal configuration):r=[r1…rn]T表示一个位于f维欧式空间的构型,其中 表示坐标,ri表示智能体i的标称构型。
[0045] 增广标称构型(Augmented nominal configuration): 表示增广标称构型,其中 表示智能体i的增广标称构型。
[0046] 目标构型(Target formation):目标构型 是一个位于d维欧式空间的向量,描述了智能体的期望位置,该目标构型由如下线性变换决定:
[0047]
[0048] 其中, 是一个线性变换矩阵, 是一个平移向量,Ari和b分别表示了形状和平移。
[0049] 本申请将使用一个领航者‑跟随者的框架完成控制目标,假设有nl个领航者,其余个体为跟随者,领航者知道期望的时变线性变换矩阵 所以可以抵达期望位置,但是跟随者不知道该时变矩阵,那么,需要跟随者根据邻居的运动去估计队形参数,进而实现编队控制。因此,该时变线性编队控制的任务目标是通过设计估计器,使得每个跟随者都能获取期望的时变队形形状参数A和时变平移参数b。
[0050] 为此,首先需要找出一个可行标称构型,要求:领航者的增广标称构型 线性张成f维欧式空间,其中
[0051] 步骤二:构建可测拓扑
[0052] 首先给出位移可测的概念:
[0053] 位移可测:如果领航者j和k之间的边可以被跟随者i测量,那么对应的拓扑图中,i与j、i与k一定是连通的,即子图 一定存在,其中vi,vj和vk分别表示智能体i,j和k,子图 包含三个节点和两个条边,即 其中表示节点集,εs={(vj,vi),(vk,vi)}表示边集。
[0054] 下面给出保证编队参数是可测的拓扑条件,需要满足以下两个条件:
[0055] 条件1:跟随者之间的拓扑图 为无向连通的。
[0056] 条件2:所有位移可测的边对应的标称队形线性张成f维欧式空间,即
[0057]
[0058] 其中,rjk=rj‑rk,rj和rk表示领航者j和k的标称构型。
[0059] 步骤三:时变队形形状参数估计器设计
[0060] 由于领航者知道期望的时变线性变换矩阵 所以可以抵达期望位置,但是跟随者不知道变队形形状参数A,因此本步骤中设计的时变队形形状参数估计器是用于对队形参数A进行估计。
[0061] 假设nf个跟随者的局部队形形状参数满足如下一阶积分器动力学模型:
[0062]
[0063] 其中, 表示控制输入, 表示智能体i对x*的估计,x*=vec(A)表示向量化的队形参数。
[0064] 本申请人发现,估计器的目标是使得全部智能体都得到正确且一致的队形参数,为了实现这样的目标,需要满足2个条件,1)全部智能体都有一致的估计结果,2)局部估计结果与局部观测不矛盾,即智能体i的全部边与局部估计结果对应的局部队形是相同的。因此,在估计器中,分别设计了gi和fi以分别满足这样的两个目标,设计了如下形状参数估计器:
[0065]
[0066]
[0067] 其中,α为一个正的控制增益,增益γi满足γi>2miδ2,增益k满足k>δ1,其中δ2表*示领航者速度的上界,δ1表示期望时变队形的变化上界,即有δ1=||x||2,mi表示跟随者i可测的领航者位移数量,集合 由所有可以测量领航者位移的跟随者构成,集合 由所有不能测量领航者位移的跟随者构成, 表示智能体i的所有跟随者邻居构成的集合,包含所有智能体i可测的领航者的边,pjk=pj‑pk,pj和pk分别表示智能体j
和k的位置, 包含所有智能体i可测的领航者的边所对应的标称构型,
rjk=rj‑rk,rj和rk分别表示智能体j和k的标称构型,|| ||∞表示无穷范数,Id表示d维单位矩阵。
[0068] 步骤四:时变编队平移参数估计器设计
[0069] 由于领航者知道期望的时变线性变换矩阵 所以可以抵达期望位置,但是跟随者不知道时变平移参数b,因此本步骤中设计的时变编队平移参数估计器是用于对平移参数b进行估计。
[0070] 假设nf个跟随者的局部队形形状参数满足如下一阶积分器动力学模型:
[0071]
[0072] 其中, 表示更新率, 表示智能体i对编队平移参数y*=b的估计。
[0073] 在基于局部队形参数的估计结果之下,通过对比变换后队形位置与实际位置差异,设计了如下误差驱动的平移参数估计器:
[0074]
[0075] 其中,σ1,σ2和σ3为三个增益,满足σ1>0,σ2>nfδ3,σ3>0。其中,nf表示跟随者智能体的数量, 表示平移参数的变化上界, 表示智能体i的所有跟随者邻居构成的集合, 表示智能体i的所有领航者邻居构成的集合,pj表示智能体j的位置。
[0076] 下面假设n个智能体的动力学满足一阶积分器动力学模型:
[0077]
[0078] 其中, 表示控制输入, 表示智能体的位置。
[0079] 基于估计器的估计结果,可以使用如下控制器使多智能体系统抵达期望队形:
[0080]
[0081] 其中,ρ为一个正的控制增益,xi和 分别表示智能体i对向量化队形形状参数x*的*估计和估计的导数;yi和 分别表示智能体i对向量化编队平移参数y 的估计和估计的导数,ri和 分别表示智能体i的标称队形和标称队形导数。
[0082] 基于所提出的时变编队参数估计器,再利用给出的控制器,进行了如下仿真实验,结果如图1,16个智能体进行编队避障机动仿真,图1展示了多智能体系统可以实现灵活的队形变换以适应障碍物环境。
[0083] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。