基于事件触发的非线性多智能体系统一致性研究文献综述

 2022-11-27 16:34:15

文 献 综 述

近年来,随着应用的需要和技术的发展,多智能体系统(multi-agent system)的协调控制问题得到了广泛的关注。多智能体系统是指由多个具备一定的感知和通信能力的智能体组成,而且各智能体之间通过无线通信网络,相互协作完成给定的任务的系统[1]。与一般的网络控制系统相比较,多智能体系统具有很多优点:(1)任务领域广泛;(2)工作效率高;(3)系统抗干扰能力好,鲁棒性强;(4)易于开发,经济成本低;(5)具有分布式的感知与作用。正因为它的这些优势,多智能体网络的分布式协同控制已经广泛地应用到许多领域。针对多智能体系统的分析主要集中于研究智能体动力学和智能体间的通信拓扑两方面因素如何相互作用, 以及二者对整个系统完成指定任务/性能指标等会产生何种影响。主要包括系统一致性[2-8]、鲁棒性分析[9]、能控性、能观性和正定性分析[10-15]、收敛性分析[16]等。利用控制行为主要是研究多智能体系统最终具有何种特定的行为, 完成某些指定任务或者达到预定的性能指标。主要包括编队控制[17-18]、蜂拥控制[19]、跟踪控制[20]、包围控制[21]等。由于许多协调控制问题都可以用多智能体系统的一致性(Consensus)理论来建模,因此研究多智能体系统一致性问题显得尤为重要。所谓的一致性,就是设计恰当的控制律使得所有的智能体关于某些状态量达到相同状态。为了实现一致,智能体之间需要进行局部的信息交换[22]

根据多智能体系统研究内容和研究重点的区别,它的研究发展阶段可以分为:第一阶段(1987-1995)是生物群体机制模拟阶段,在这一阶段研究者们主要通过Boid模型和Vicsek模型为代表的各种模型来模拟自然界群体的一致性现象[23];第二阶段(1995-2004)是一致性理论的探索研究阶段,在这一阶段Jadbabaie等人通过对Vicsek模型的一致性行为给出了理论证明[24];第三阶段(2004-)是一致性理论的逐步完善阶段,研究者们在这一阶段,发现并不断研究一致性理论在时滞系统、有向/无向网络、异步通信以及信息不确定系统中的相关问题,已经形成了相对完善的系统理论[25]。如何使得控制系统更加高效、更加具有现实性的一致性问题成为研究者们目前研究的重点。

随着网络通信技术的飞速发展,由共享通信网络构成的数字控制系统在工程应用中越来越普及。在通常情况下,这类系统中的控制任务是周期性执行的,这便于在系统的分析和设计过程中采用相对成熟的采样系统理论。基于时间触发的控制方法按照采样过程的不同可以分化为周期、随机以及不均匀采样。周期采样控制是最传统的一种采样控制方法,即按照单一的采样速度对数据进行采样。然而,在一些达到预期效果的时间采样节点是没有必要对系统进行采样的,而基于时间触发控制很可能会发生这样的情况。在实际应用中,系统的通讯带宽和计算资源都是有限的。对于网络需求日益增长的今天,对带宽的限制也越来越多,如果系统的控制器和执行器都采用基于时间触发的方式进行控制,可能加重网络负荷,甚至影响系统的控制性能和稳定性,于是基于事件触发的控制理论应运而生。由于它相比于基于时间触发控制的优势,它在很多资源受限的环境中具备良好的应用前景。

基于事件触发的控制是指基于事件的发生来触发控制任务的控制策略[26-28]。不同于时间触发,事件触发中的触发行为取决于“事件”的发生与否。基于事件触发的控制,即只有当一定的事件触发条件被满足,系统的控制器才会得到更新。由于其触发条件不是根据时间而发生改变,所以基于事件触发的控制方式往往是一种非周期或者异步的调度机制。虽然基于事件触发的控制可以带来一定的优势,但这种控制方法也牺牲了控制系统中的一定预设性能来保证资源的分配利用,所以基于事件触发的控制的关键问题是事件的设计问题。所谓事件,一般归纳为与系统状态、测量输出相关的数学表达式(函数)。由此,基于事件触发的控制便可基于系统的实际状况,实时调节采样频率,在满足系统性能的要求下,减少控制任务的执行次数,提高计算资源和通信资源利用率。近年来, 基于事件触发的控制方法在线性系统和非线性系统中都得到了广泛应用。

基于事件触发的控制方法可以分为集中式事件触发和分布式事件触发[29]

集中式事件触发一致性控制[30-31]指的是对一个多智能体系统中所有智能体设置一个统一的状态误差阈值,当系统的总状态误差的范数达到该阈值时,引起系统中所有智能体统一触发更新操作,控制目标是在集中控制下所有智能体的状态最终收敛一致;分布式事件触发一致性控制[32-33]指的是对系统中的每个智能体设定一个基于其邻居智能体的状态误差阈值,当该智能体的状态误差达到对其设定的阈值时,该智能体单独触发更新操作,并确保系统中所有的智能体在各自单独的触发条件下其状态能收敛一致。相比于集中式事件触发控制来说,在分布式事件触发控制方式中,系统的每个智能体仅受到其邻居智能体的影响,也就是每个智能体仅能够与它的邻居智能体进行信息交流,触发时刻的判定也决定于该智能体能获取的局部信息。分布式事件触发控制在降低采样频率和信息的流通量,减少触发次数,节约能源方面有更好的表现,因而得到了研究者们越来越深入细致的研究。与事件触发控制相对应的还有一种控制方式,即自触发控制。自触发控制不需要对触发条件进行实时的检测。根据当前采样时刻和采样值,自触发控制不仅能完成对采样时刻控制输入的再计算,而且能提前计算出下一个采样的时刻,这就降低个体之间的信息通信量。文献[34]就是为了避免在每个时间间隔内每个智能体都要采样自身及其邻居智能体的状态,提出了确定触发时间序列的一个自触发控制协议。

当设计的控制协议满足一致性的结果时,可能会出现当系统状态接近它的平衡点时,相邻的触发时刻将会变得非常接近的这个现象,这就是芝诺行为(Zeno behavior)。为了事件触发控制协议能得以应用,必须保证触发时刻之间的间隔下界的存在。

本次的毕业设计便是基于事件触发的非线性多智能体系统一致性研究,目的在于针对一类非线性多智能体系统,设计事件触发控制协议使系统实现一致性,并排除Zeno现象。

参考文献

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。