本发明涉及多智能体系统一致性控制技术领域,特别涉及一种基于有向通信拓扑的高阶多智能体系统固定时一致性跟踪控制方法。
背景技术:
作为一种多智能体系统群体行为,一致性跟踪又称领导-跟随一致性,意味着跟随者可以跟踪上由领导指定的轨迹。近些年来,一致性跟踪获得了广泛的应用,诸如,微网的二次频率和电压控制、智能电网经济调度、机器人协调、自主水下航行器编队、航天器姿态协调。
在一致性跟踪协议设计中,快速收敛是一直追求的。相关研究表明可以通过选择更好的通信拓扑或设计最优权值来加速收敛。然而,这些协议只能实现渐进一致。相对而言,由于有限时一致性可以提供更好的性能,诸如,更高的控制精度,更短的稳定时间和更强的鲁棒性,有限时一致性对于实际系统而言更为可取。然而,有限时一致性控制协议的收敛时间取决于智能体初始状态偏差,这一信息难以在实际系统中获得。没有这一信息,无法估计一致性时间,这阻碍了有限时一致性协议在实际多智能体系统一致性控制上的应用。为了进一步提升有限时一致性协议的性能,固定时稳定性被引入到一致性协议设计中。和有限时一致性不同,固定时一致性协议的一致性时间与智能体初始状态偏差无关,这一特性促进了固定时一致性协议的发展。
然而,既有的固定时一致性控制协议存在一些不足。一方面,既有的固定时一致性控制协议依赖于对称的通信拓扑,这意味着所提出的控制方案无法扩展到有向图。将有向图考虑进一致性协议设计中可以降低资源花费和对信道的需要,降低通信设施的花费,增强所提出控制协议的可扩展性,提升所提出控制协议对故障、延时和干扰的容忍度。然而,将既有的固定时一致性协议扩展到有向通信拓扑需要解决许多挑战性的问题,诸如,如何构造合适的分布式观测器,如何构造合适的李雅普诺夫函数。因此,如何设计基于有向通信拓扑的固定时一致性跟踪控制协议是一个富有挑战性的并且值得研究的问题。另一方面,既有的固定时一致性控制协议只适用于一阶、二阶多智能体系统,并且难以将既有的固定时一致性控制协议扩展到高阶多智能体系统。然而,许多工程系统具有高阶动态,诸如,柔性关节机械臂、垂直起降飞行器、轮式移动机器人、无人机等。然而,将既有的固定时一致性控制协议扩展到高阶多智能体系统是困难的,需要解决许多富有挑战性的问题,诸如,如何设计控制器使得所有状态收敛到领导的轨迹,如何克服奇异性问题,如何从所设计的控制器中估计出收敛时间上界。因此,如何为高阶多智能体系统设计固定时一致性跟踪控制协议是一个富有挑战性的并且值得研究的问题。本发明将解决这些重要且富有挑战性的问题,实现在有向通信下高阶多智能体系统固定时间领导-跟随一致性。
技术实现要素:
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于有向通信拓扑的高阶多智能体系统固定时一致性跟踪控制方法,以实现有向通信拓扑下高阶跟随者在固定时间内跟踪上领导的轨迹,并降低一致性跟踪时间上界估计的保守性。
技术方案
一种有向通信下高阶多智能体系统固定时间领导-跟随一致性控制方法,其特征在于所述的多智能体系统由一个编号为0的领导者和n个编号为1~n的跟随者组成,智能体之间通信网络为有向生成树gs,第i个跟随者的动态为:
式中,xji和ui表示系统状态和控制输入,j=1,...,l;
领导的动态为:
式中,xj0和u0表示系统状态和控制输入,j=1,...,l;假设控制输入u0有界,即存在已知的正常数λ,使得|u0|≤λ,领导的控制输入无法被所有跟随者所获得,但是常数λ可以被所有跟随者获知;步骤如下:
步骤1:分布式观测器设计:
式中,ξji为观测器状态,j=1,...,l;ξ10=x10,ξ20=x20,…,ξl0=xl0,观测器增益α,β,λ为正实数,m,n为正奇数且满足m>n,sig(·)α=|·|αsign(·),aij表示智能体间相互作用关系,当智能体i可以接收到来自智能体j的信息,则aij=1,否则,aij=0;
步骤2:观测时间上界估计:
式中:
q=wh htw(7)
式中,q和w=diag{w1,...,wn}为正定矩阵,wm=max{wi},h=ls b,ls为图gs的laplacian矩阵,b=diag{a10,...,an0},ai0=1表示跟随者i与领导有直接通信连接,否则ai0=0,n表示跟随者的个数;
步骤3:当观测器获得领导状态时,第i个多智能体系统误差动态为:
式中,eji=xji-xj0,j=1,...,l;
设计一系列滑模面:
式中,p和q为满足
设计控制协议为:
式中,0<h<1/2,ta>0为预先指定的时间;
步骤4:控制时间上界估计:
t2≤ta (l-1)tb(11)
步骤5:为每个跟随者多智能体配置控制器(10)和分布式观测器(3),使得所有的跟随者能够在有限时间
有益效果
本发明公开一种基于有向通信拓扑的高阶多智能体系统固定时领导-跟随一致性控制方法,包括:(1)设计固定时分布式高阶观测器,使每个跟随者能够在固定时间内观测得到领导的状态信息;(2)给出观测时间上界的估计;(3)设计一系列固定时终端滑模面,导出终端滑模控制律,使得跟随者每一个状态能够在固定时间内跟踪上领导的轨迹;(4)给出一致性时间上界的估计。
首先,本发明将既有的固定时间一致性跟踪协议扩展到有向图,可以降低资源花费和对信道的需要,降低通信设施的花费,增强所提出控制协议的可扩展性,提升所提出控制协议对故障、延时和干扰的容忍度。其次,将既有的固定时间一致性跟踪协议扩展到高阶系统,高阶系统具有比一阶、二阶多智能体系统更为普遍的动态,适用于更多工程系统。最后,控制器增益可以直接由预先指定的时间获得,这有助于根据收敛时间要求确定和调节控制增益;并且所提出的领导-跟随一致性控制协议降低了收敛时间上界估计的保守性,这同时也降低了在根据收敛时间要求设计控制增益时控制增益设计的保守性。因此,本发明在多智能体系统快速精确的协调控制方面显示出广阔的应用前景。
与现有技术相比,本发明的创新性体现在以下三个方面:
(a)提出了一种可以实现固定时间领导状态观测的高阶分布式观测器,解决了有向通信拓扑下高阶多智能体系统固定时观测问题;
(b)提出了新颖的固定时间终端滑模一致性跟踪控制协议,该协议完全分布,解决了奇异性问题,在固定时间内实现所有状态收敛到领导轨迹,并且给出收敛时间上界的表达式;
(c)控制器增益可以直接由预先指定的时间获得,这有助于根据收敛时间要求确定和调节控制增益。
附图说明
图1固定时领导-跟随一致性控制方案设计步骤
图2柔性关节机械臂多智能体系统相互作用关系拓扑
图3观测器状态ξ1i和领导状态x10的时间演化
图4观测器状态ξ2i和跟踪误差状态x20的时间演化
图5观测器状态ξ3i和跟踪误差状态x30的时间演化
图6观测器状态ξ4i和跟踪误差状态x40的时间演化
图7智能体状态q1i的时间演化
图8智能体状态
图9智能体状态q2i的时间演化
图10智能体状态
具体实施方式
现结合实施例、附图对本发明作进一步描述:
请参阅图1至图6,多智能体系统由一个编号为0的领导者和n个编号为1~n的跟随者组成,智能体之间通信网络为有向生成树gs,第i个跟随者的动态为:
式中,xji(j=1,...,l)和ui表示系统状态和控制输入。
领导的动态为:
式中,xj0(j=1,...,l)和u0表示系统状态和控制输入。假设控制输入u0有界,即存在已知的正常数λ,使得|u0|≤λ,领导的控制输入无法被所有跟随者所获得,但是常数λ可以被所有跟随者获知。
本发明的目的是提供一种基于有向通信拓扑的高阶多智能体系统固定时领导-跟随一致性控制方法,以使得跟随者每一个状态在固定时间内跟踪上领导相应状态的轨迹,同时降低收敛时间上界估计的保守性。
结合图1,所述的领导-跟随一致性控制方案包括如下步骤:
步骤一:分布式观测器设计:
式中,ξji(j=1,...,l)为观测器状态,ξ10=x10,ξ20=x20,…,ξl0=xl0,观测器增益α,β,λ为正实数,m,n为正奇数且满足m>n,sig(·)α=|·|αsign(·),aij表示智能体间相互作用关系,当智能体i可以接收到来自智能体j的信息,则aij=1,否则,aij=0。
步骤二:观测时间上界估计:
式中:
q=wh htw(7)
式中,q和w=diag{w1,...,wn}为正定矩阵,wm=max{wi},h=ls b,ls为图gs的laplacian矩阵,b=diag{a10,...,an0},ai0=1表示跟随者i与领导有直接通信连接,否则ai0=0,n表示跟随者的个数。
步骤三:当观测器获得领导状态时,第i个多智能体系统误差动态为:
式中,eji=xji-xj0(j=1,...,l)。
设计一系列滑模面:
式中,p和q为满足
设计控制协议为:
式中,0<h<1/2,ta>0为预先指定的时间。
这里通过设置
步骤四:控制时间上界估计:
t2≤ta (l-1)tb(11)
步骤五:为每个跟随者多智能体配置控制器(10)和分布式观测器(3),使得所有的跟随者能够在有限时间
实施例:柔性关节机械臂多智能体系统固定时领导-跟随一致性控制
柔性关节机械臂已经在机械加工、空间技术、焊接等领域得到了广泛应用。为了使其更快速更精确的完成指令动作,需要发展快速精确的柔性关节机械臂系统协调控制方法。以柔性关节机械臂多智能体系统为例,展示所提出领导-跟随一致性方案的有效性。一组单连接柔性关节机械臂通信连接拓扑如图2所示,该多智能体系统由1个领导和4个跟随者组成,由图2可知,信息是单向传递的。单连接柔性关节机械臂的动态如下所示:
mi为该连接的质量,li为该连接关节轴到重心的距离,q1i和q2i表示角位置,
式中,
领导的动态表示为:
将领导的控制输入指定为u0=sin(t),初值选择为(x10(0),x20(0),x30(0),x40(0))=(0,1,0,-1)。四个跟随者的初值选择为(x11(0),x21(0),x31(0),x41(0),x12(0),x22(0),x32(0)x42(0),x13(0),x23(0),x33(0),x43(0),x14(0),x24(0),x34(0),x44(0))=(0.5,0.8,0.7,0.6,0.4,0.3,0.6,0.8,0.6,0.5,0.3,0.5,0.7,0.6,0.4,0.7).控制器和分布式观测器参数指定为α=β=10,m=11,n=9,p=31,q=3,tb=ta=1,h=0.25,λ=1.图3~6显示出观测器状态的时间演化。由图3~6中可以看出,观测器状态在0.3s内收敛到领导的状态。随后,控制器开始动作,仿真结果示于图7~10。由图7~10可以看出,跟随者状态在1.3s内跟踪上领导的轨迹。仿真结果表明,所提出领导-跟随一致性控制方案能够在固定时间内实现多智能体系统的一致性跟踪。
1.一种有向通信下高阶多智能体系统固定时间领导-跟随一致性控制方法,其特征在于所述的多智能体系统由一个编号为0的领导者和n个编号为1~n的跟随者组成,智能体之间通信网络为有向生成树gs,第i个跟随者的动态为:
式中,xji和ui表示系统状态和控制输入,j=1,...,l;
领导的动态为:
式中,xj0和u0表示系统状态和控制输入,j=1,...,l;假设控制输入u0有界,即存在已知的正常数λ,使得|u0|≤λ,领导的控制输入无法被所有跟随者所获得,但是常数λ可以被所有跟随者获知;步骤如下:
步骤1:分布式观测器设计:
式中,ξji为观测器状态,j=1,...,l;ξ10=x10,ξ20=x20,…,ξl0=xl0,观测器增益α,β,λ为正实数,m,n为正奇数且满足m>n,sig(·)α=|·|αsign(·),aij表示智能体间相互作用关系,当智能体i可以接收到来自智能体j的信息,则aij=1,否则,aij=0;
步骤2:观测时间上界估计:
式中:
q=wh htw(7)
式中,q和w=diag{w1,...,wn}为正定矩阵,wm=max{wi},h=ls b,ls为图gs的laplacian矩阵,b=diag{a10,...,an0},ai0=1表示跟随者i与领导有直接通信连接,否则ai0=0,n表示跟随者的个数;
步骤3:当观测器获得领导状态时,第i个多智能体系统误差动态为:
式中,eji=xji-xj0,j=1,...,l;
设计一系列滑模面:
式中,p和q为满足
设计控制协议为:
式中,0<h<1/2,ta>0为预先指定的时间;
步骤4:控制时间上界估计:
t2≤ta (l-1)tb(11)
步骤5:为每个跟随者多智能体配置控制器(10)和分布式观测器(3),使得所有的跟随者能够在有限时间