技术领域
[0001] 本发明涉及多智能体集群系统编队控制技术领域,具体涉及一种多智能体集群系统自适应固定时间仿射编队控制方法。
相关背景技术
[0002] 多智能体集群系统是由多个智能体组成的一种复杂网络系统,这些智能体可以相互交互和协作,以完成某项任务或达成某个目标。在集群系统中,各个智能体之间可以通过通信进行信息传递和共享资源,从而实现分布式处理和决策。这些智能体可以是无人机、机器人、传感器等不同类型的设备,它们通过互相协作,在特定的环境中实现了高效的数据收集、处理和控制等任务。由于其具有高度的可扩展性、自适应性和鲁棒性,多智能体集群系统在日常生活中的应用越来越广泛,比如在无人驾驶汽车、航空飞行控制、医疗诊断和环境监测等方面都有着重要的应用。
[0003] 在多智能体集群系统的控制任务中,编队控制一直是该领域研究中的热门,其中仿射编队控制问题又是近些年来较为新颖的问题,编队控制可以通过选择适当的通信网络拓扑实现系统的信息交互使得智能体的未知状态不断发生变化,从而形成实际需要的编队构型。除此之外,收敛速度也是编队控制算法中的一个重要评价指标。相较于不可预计稳定时间的控制算法,固定时间编队控制算法会更受欢迎,因为这种算法更符合实际应用的需求。固定时间编队控制算法也存在不足,如会面临拓扑结构下的全局信息不能够轻易获取的问题,如何克服这个不足,使得该类问题的控制器的设计变得值得推敲。
具体实施方式
[0014] 下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
[0015] 如图1所示,本发明实施例提供了一种多智能体集群系统自适应固定时间仿射编队控制方法,包括以下步骤S1至S3:S1、设定仿射编队形成时间和一类时间函数,并构造一类时间函数增益;
在本发明的一个可选实施例中,本实施例针对的多智能体集群系统是由多个以一阶积分器为动力学模型的智能体组成的系统。
[0016] 在本实施例中,步骤S1中设定的一类时间函数具体为:其中,t为时间,tf为根据不同的编队任务要求设定的仿射编队形成时间,根据的值设计合适的TBG函数 , 为一类时间函数 的初值, 和 分别为一类时间函数在t时刻和tf时刻的右导数。
[0017] 本实施例在对智能体进行编队时,需要编队形成的判断标准,首先对编队误差和跟踪误差进行定义:编队误差定义为:
其中, 为编队误差, 为多智能体集群系统所对应的应力矩阵, 为智能体的状态。
[0018] 针对Leader‑follower系统,跟随者的跟踪误差定义为:其中, 为跟随者的跟踪误差, 为多智能体集群系统所对应的应力矩阵,和 分别为智能体中跟随者和领导者的状态, 和 分别为对应力矩阵划分后的子矩阵。
[0019] 编队任务成功时满足如下条件:或者
在本实施例中,步骤S1中构造的一类时间函数增益具体为:
其中, 为一类时间函数增益, 为常数, , 为一个很小的常值,含有
的目的为了保证在预定的固定时间 以后TBG增益分母不为零。
[0020] 具体而言,根据一个具体的编队任务需求,设定TBG函数为:其中, 为根据编队任务需求设计的TBG函数,为时间, 为5s。
[0021] 对应的TBG增益的设计如下:。
[0022] S2、根据一类时间函数增益、多智能体集群系统中智能体之间的通信关系以及目标编队构型确定分布式自适应固定时间仿射编队控制率;在本发明的一个可选实施例中,本实施例的目标编队构型是通过对不同的实际编队任务需求进行分析后,有针对性地设计的。对于leaderless系统,多智能体集群系统的通信关系具体为每个智能体只与特定智能体发生通信交互。对于leader‑follower系统,多智能体集群系统的通信关系具体为:领导者只发送信息不接受信息,跟随者不仅发送自己的消息还接收特定智能体发出的信息。
[0023] 在本实施例中,根据一类时间函数增益、多智能体集群系统中智能体之间的通信关系以及目标编队构型确定leaderless系统的分布式自适应固定时间仿射编队控制率具体为:其中, 为第i个智能体的控制输入, 为一类时间函数增益, 为自适应
控制增益,为多智能体集群系统中智能体的个数, 为多智能体集群系统中第i个智能体和第j个智能体之间的通信权重, 和 分别为第i个智能体和第j个智能体的状态, 为设定参数,满足 , 为自适应控制增益 的变化率, 为二范数的平方。
[0024] 在本实施例中,根据一类时间函数增益、多智能体集群系统中智能体之间的通信关系以及目标编队构型确定Leader‑follower系统的分布式自适应固定时间仿射编队控制率具体为:其中, 为第i个智能体的控制输入, 为一类时间函数增益, 和 均
为自适应控制增益,为多智能体集群系统中智能体的个数, 为多智能体集群系统中第i个智能体和第j个智能体之间的通信权重, 和 分别为第i个智能体和第j个智能体的状态, 为设定参数,满足 , 和 分别为自适应控制增益 和 的变化
率, 为二范数, 为二范数的平方,Ni为第i个智能体的邻居集,sgn为符号函数。
[0025] S3、利用分布式自适应固定时间仿射编队控制率对多智能体集群系统进行编队控制。
[0026] 为了验证本实施例提供的一种多智能体集群系统自适应固定时间仿射编队控制方法,在具体应用场景中,进行本实施例的可行性分析。
[0027] 首先对leaderless系统进行分析,构造李雅普诺夫函数如下式:其中, 为李雅普诺夫函数, 为所有智能体状态构成的向量的转置, 为应力矩阵, 为自适应参数 的误差项。
[0028] 利用针对leaderless系统的控制率可以得到 的解集:其中, 为李雅普诺夫函数 的初值。
[0029] 随后可以得到其编队误差有如下表达式:其中, 为第i个智能体的编队误差, 为第i个智能体的编队误差的绝对值,n为智能体个数, 为取最大值, 为应力矩阵的非零最小特征值。
[0030] 当将参数 设计的足够小时,可以得到编队误差的最终结果:接下来,对leader‑follower系统进行分析,构造李雅普诺夫函数如下式:
其中, 为李雅普诺夫函数, 为跟踪误差的转置, 为应力矩阵中表示
跟随者与跟随者的子矩阵, 为跟踪误差,Nf为跟随者集, 为自适应参数。
[0031] 利用发明的针对leader‑follower系统的控制器可以得到 的解集:其中, 为李雅普诺夫函数 的初值。
[0032] 随后可以得到其跟踪误差有如下表达式:其中, 为跟踪误差的二范数, 为可以设置的常数, 为应力矩阵分
解后跟随者与跟随者交互子矩阵的最小非零特征值。
[0033] 当将参数 设计的足够小时,可以得到跟踪误差的最终结果:下面针对本实施例设计的控制器进行实例仿真,以验证本发明中的控制器的有效性。
[0034] (1)群智系统及编队构型设置:利用以6个智能体组成的多智能体集群系统为例,模拟仿真其在二维空间下执行固定时间编队任务,期望的标称构型如图2所示。
[0035] Leaderless系统中各个智能体的初始位置如下表1:表1
Leader‑follower系统中各个智能体的初始位置如下表2:
表2
假定任务需求的固定时间 ,同时设置 使其足够小。
[0036] 如图3和图4,其中x(m)表示x方向上的位置信息,y(m)代表y方向上的位置信息,Time(s)表示时间;从图3和图4可以看出,不论是对leaderless系统还是leader‑follower系统,利用本实施例的控制器可以使以6个智能体组成的多智能体集群系统在固定时间内实现编队任务。由图4进一步可以看出,该控制方法不仅可以在固定时间内实现编队,同时还可以在固定时间后保持目标编队。
[0037] 图5、图6和图7描述了自适应控制增益 和 在编队形成过程中的变化情况,其中实线代表的是智能体1的自适应控制增益随时间变化趋势。点划线代表的是智能体2的自适应控制增益随时间变化趋势。虚线代表的是智能体3的自适应控制增益随时间变化趋势。双划线代表的是智能体4的自适应控制增益随时间变化趋势。双划线并用五角星做标记的线代表的是智能体5的自适应控制增益随时间变化趋势。双划线并用圆圈做标记的线代表的是智能体6的自适应控制增益随时间变化趋势。由于智能体1、2、3为领导者不进行控制,因此图6和图7中自适应控制增益随时间变化趋势曲线重合。从图5、图6和图7可以看出,本发明实现了有效的自适应控制。对于leaderless系统和leader‑follower系统的仿真验证了本发明提出的分布式自适应固定时间仿射编队控制方法的实用性与有效性。
[0038] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0039] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0040] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0041] 本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
[0042] 本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。