NL2027701B1 - Point-to-point tracking control method for multi-agent trajectory-updating iterative learning - Google Patents

Point-to-point tracking control method for multi-agent trajectory-updating iterative learning Download PDF

Info

Publication number
NL2027701B1
NL2027701B1 NL2027701A NL2027701A NL2027701B1 NL 2027701 B1 NL2027701 B1 NL 2027701B1 NL 2027701 A NL2027701 A NL 2027701A NL 2027701 A NL2027701 A NL 2027701A NL 2027701 B1 NL2027701 B1 NL 2027701B1
Authority
NL
Netherlands
Prior art keywords
point
trajectory
agent
updating
agents
Prior art date
Application number
NL2027701A
Other languages
English (en)
Other versions
NL2027701A (en
Inventor
Liu Chenglin
Luo Yujuan
Original Assignee
Univ Jiangnan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Jiangnan filed Critical Univ Jiangnan
Publication of NL2027701A publication Critical patent/NL2027701A/en
Application granted granted Critical
Publication of NL2027701B1 publication Critical patent/NL2027701B1/en

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • G05D1/0291Fleet control
    • G05D1/0295Fleet control by at least one leading vehicle of the fleet
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33051BBC behavior based control, stand alone module, cognitive, independent agent
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39219Trajectory tracking
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/42Servomotor, servo controller kind till VSS
    • G05B2219/42342Path, trajectory tracking control

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Feedback Control In General (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Claims (6)

Conclusies
1. Werkwijze voor een punt-naar-punt traceer-regelmethode voor iteratief leren bij het bijwerken van het traject van meerdere agenten, omvattende de stappen van het: stap 1 het construeren van een model van meerdere discreet heterogeen multi-agentsysteem; stap 2 het analyseren van een informatie-uitwisselingsrelatie tussen agenten in het discrete heterogene multi-agentsysteem, en het construeren van een communicatietopologiestructuur van het multi-agentsysteem met behulp van een gerichte graaf, waarbij slechts één of meerdere volg-agenten in staat zijn leidersinformatie te verwerven, en een communicatietopologiediagram gevormd door door een leider en een volger omvat één opspannende boom met de leider als een hoofdknooppunt; stap 3 het geven van een initiële toestand van alle volg-agenten; stap 4 het ontwerpen van een doeltraject-updatemethode volgens een verwacht positiepunt, het oplossen van parameters van de doeltraject- updatemethode, en het updaten van een doeltraject om het mogelijk te maken dat een nieuw doeltraject asymptotisch convergeert naar een systeemuitvoer; en stap 5 het ontwerpen van een P-type iteratief leerproces gebaseerd op het bijwerken van het doeltraject voor de volg-agenten, en het oplossen van parameters van het P-type iteratieve leerproces, om volledige tracering van de verwachte puntpositie binnen een beperkte tijd in het multi-agentsysteem te implementeren.
2. De werkwijze voor een punt-naar-punt traceer-regelmethode voor iteratief leren bij het bijwerken van het traject van meerdere agenten volgens conclusie 1, waarbij in stap 1 een model van een discreet heterogeen mutli-agentsysteem gevormd is door n verschillende agenten: 20 fax +1) = Axe (t) + Brug (1) (1 Vilt) = Cil) ’
waarbij k staat voor het aantal iteraties, / staat voor de i% agent, i = 1,2, -,n, en t €[0,N] is een bemonsteringstijdstip binnen één periode; x;,(t) € RP, u(t) ER , en y(t) ER™ duiden respectievelijk een staat, een besturingsinput en een systeemoutput van de agent i; en A; € RPPPt, B; € RPT, en C; € R™Pi zijn matrices met een overeenkomstig aantal dimensies, het is gedefinieerd dat 20 = [Pi Oi, al (D]T en w(t) = OE OT, n= Die, vi, vl (OTT, zodanig dat het systeem (1) in een compacte matrixvorm wordt geschreven als: [rale +1) = Ax (t) + Buy (t) (2). ye) = Cxy(t) waarbij A =diag{d, Az, Ax} , B=diag{ByB,-,B,} , en C= diag{C,, Co, Co}; het systeem (2) wordt omgezet in een input-output matrixmodel gebaseerd op een tijdsequentie: Vi = Pug + Qx, (0) (3), waarbij yi = DO, y (1), =, 3 (M]" en wy = [1,(0), up (1), tee (NJ, 0 0 0 0 «0 CB 0 0 0 0 : CAB CB 0 0 | en CA’B CAB CB 0 «0 CAN-1B CAN-2B CAN-3B u CB 0 Q=I[c cA CA? CA3 - CAV en tijdpunten T = Í{t,t,, tu} die moeten worden gevolgd, worden gegeven, waarbij bij voorkeur een controlemethode wordt gebruikt om het volgen van het verwachte positiepunt in het multi-agentsysteem te implementeren, dat is, Virlts) > Valts), s=12-,M, en OSt <t; < + <ty SN, waarbij yalts) het verwachte positiepunt is; het verwachte positiepunt yg(ts) wordt beschouwd als gegenereerd door een virtuele leider, s =1,2--,M; en n agenten in het systeem worden beschouwd als volgers, en slechts enkele volg-agenten kunnen direct de leider-informatie verkrijgen
3. De werkwijze voor een punt-naar-punt traceer-regelmethode voor iteratief leren bij het bijwerken van het traject van meerdere agenten volgens conclusie 1 of 2 , waarbij in stap 2, de gerichte graaf G = (V,E, A) wordt gebruikt om de topologiestructuur van het multi-agentsysteem aan te duiden, waarbij een knooppuntset van V ={1,2,,n} van de graaf G overeenkomt met de 7 agenten, en een randset ESVxV van de graaf G overeenkomt met informatieuitwisseling en overdracht onder de agenten, het gewicht van een rand isa; 20 en a; =0 (i,j EV), en een matrix A = [a;;] € R™™ js een gewogen aangrenzende matrix; als knooppunt j in staat is om informatie van knooppunt 7 te verkrijgen in de gerichte graaf, wordt een knooppuntverbindingsrand aangegeven door e; = (Lj) EE; als e; EE, een element in de gewogen aangrenzende matrix a;; = 0 is, of anders is het element 0, en a; =0, en Vi € V: een naburige verzameling van de agent i is N; ={j € V:(i,j) EE}; en een Laplaciaanse matrix van de graaf G is L=D A= [&;] € R™™ en een matrix D is een gradenmatrix van de graaf G, waarbij in de formule: Ly = (2204 py en j D= diag{¥7., a, i =1, em}, en in de gerichte graaf CG, een gericht pad van knooppunt i; naar knooppunt i is een geordende reeks (iz), ,lis1,is) van een serie van randen; als één knooppunt i één gericht pad heeft naar alle andere knooppunten in de gerichte graaf G, is het knooppunt i een wortelknooppunt, en als de graaf G een wortelknooppunt heeft, heeft de gerichte graaf één opspannende boom. na het toevoegen van een leider, vormen de 7 volg-agenten en de leider een graaf G = {0 UG}, informatieoverdracht tussen de agent i en de leider wordt aangeduid als s;, s; > 0 geeft aan dat de agent een relatie heeft met de leider, en s; = 0 geeft aan dat de agent geen relatie heeft met de leider; en in de gerichte graaf G, als er één gerichte opgespannen boom is met de leider als hoofdknooppunt, geeft dit aan dat de leider een gericht pad heeft naar alle volt-agenten.
4. De werkwijze voor een punt-naar-punt traceer-regelmethode voor iteratief leren bij het bijwerken van het traject van meerdere agenten volgens een van de conclusies 1-3 , waarbij in stap 3 een initiële toestandherstelvoorwaarde van alle volg-agenten is: xi (0) =0 (4).
5. De werkwijze voor een punt-naar-punt traceer-regelmethode voor iteratief leren bij het bijwerken van het traject van meerdere agenten volgens een van de conclusies 1-4 | waarbij in stap 4 de doeltraject-updatemethode als volgt is: Bia (=v (+R (0) f(t), (5), waarbij T;x+1(t) een doeltraject is van de i agent verkregen na het leren en bijwerken van een ks iteratie, y,(t) een traject is dat door de verwachte puntpositie yalts) gaat , A (1)=(t=1)(t=1,)-(t=1,). en f(t) zijn discrete functies; laat (0 = DD OT FO = [AQ LO, (OI, H (1) =diag{h (1).h (1). 1, (1)}, en Yo(®) = ya(©,ya(®), ~, ya(OI", Formule (4) wordt omgezet in: Tear (8) = Ya (©) + H(O)f (0) (6); Formule (6) wordt herschreven naar een op een tijdsequentie gebaseerde vorm: Teer = Va + Hf (7), waarbij Tt = [eer Ta (DTe 1 (NDT, Ya = [Y,(0), Y, (1), tty Ya (NT, H = diag{H(0),H(1),---,H(N)}, en f=1f(0), FQ, FN]; omdat punt-naar-punt tracering vereist dat de waarde van een doeltraject op een tijdstip T = {t;,t,, +, ty} waarvoor tracering in elke update vereist is consistent wordt gehouden met die van een bepaald punt verwacht wordt, dat wil zeggen, 1y;(ts) = Valts), wordt Formule (7) verder omgezet naar een doeltraject op elk bemonsteringspunt: Teer = Te +Hf (8); laat f = F(x — ye), waarbij F een reële diagonal matrix is, Formule (8) wordt genoteerd als: Thor = FHF re) (9); laat A, = HF, omdat een matrix H en een matrix F beide diagonal matrices zijn, is A; ook een reële diagonale matrix, en A (0) 0 “ee 0 A = | 0 Ae (1) u 0 waarbij 0 0 a) Aart) 0 oe 0 in de formule, A,(t)= | 0 Aak) . 0 | ‚ de doeltraject- 0 0 Ank) updatemethode (9) wordt omgekeerd naar: Terr = Tk + Akke) (10); het traceren van een vast traject door gebruik te maken van een iteratief leeralgoritme vereist dat als het aantal iteraties toeneemt, de systeemoutput Vix(t) asymptotisch convergeert naar een vast traject y,(t), dat wil zeggen IVa Verl lye zel (11); een huidig doeltraject-update algoritme is om een nieuw doeltraject 7;g(t) asymptotisch te laten convergeren naar de systeemoutput y(t), dat wil zeggen, Iris Vell Slk yell (12); en voor een punt-naar-punt tracering regelprobleem, wordt het doeltraject- update algoritme gebruikt Txs = Tr + A(x — yi), en als aan |! +24 =1 wordt voldaan en Agvoldoet aan = < Aix) < 0,t € [ONNT kan [ri — AO =O0teT ’
Vill < Ir — vill worden verkregen, en T geeft tijdstippen T = {t;,t5, ++, ty} aan die moeten worden gevolgd.
6. De werkwijze voor een punt-naar-punt traceer-regelmethode voor iteratief leren bij het bijwerken van het traject van meerdere agenten volgens een van de conclusies 1-5, waarbij in stap 5 het P-type iteratief leerproces gebaseerd op het bijwerken van het doeltraject als volgt is: eerst, het wordt gegeven da teen traceerafwijking van elke agent is: eik = Tilt) — Vilt) (13), jn) = y(t) VO, JEN, (14), waarbij e;,(t) een afwijking representeert tussen de output van de agent i tijdens de &“° iteratie en een doeltraject verkregen na iteratief bijwerken, en e(t) staat voor een afwijking tussen de agent en de naastgelegen agenten daarvan tijdens de 4“ iteratie; laat &;,(t) informatie aanduiden die ontvangen of gemeten is door de agent i tijdens de &““ iteratie, wordt verkregen dat: diel) = jen aijeijn(t) + sie (8) (15), waarbij a;; de weging is van een rand, en s; is een koppelweging tussen de agent; en de leider; omdat ex (t) = e;,(t) — e‚x(t), wordt Formule (15) omgezet naar: diel) = Xen, ij (e(t) — ej (t)) + se, (8) (16); het is gedefinieerd dat e(t) = [erx(6, esp (t), +, nk ()]T en &()= Ee), E20), En «OTT, en door gebruik te maken van grafentheorie, is het mogelijk om Formule (16) te schrijven als: GM =(L+®Iy)e(® (17), waarbij S = diag{s,,S2, Sn}, L een Laplaciaanse matrix is van G, en Im noteert een m X m-dimensionale eenheidsmatrix;
Formule (17) wordt ook geschreven in een op tijdsequentie gebaseerde vorm, dat wil zeggen:
$e = Mex (18),
waarbij ex = [er(0), ec (1), ‚er (NI, & = [§,(0), & (1), +, Eel], en
SM = diag{(L +S) ® Imn}nxen:
waarbij bij voorkeur gebruik wordt gemaakt van het P-type iteractieve leerproces voor elke volg-agent om een traceercontroleprobleem van een verwacht punt in het multi-agentsysteem op te lossen, en een iteratieve leermethode wordt als volgt weergegeven:
Upger1 = wp) + liëix+i() (19),
waarbij I; € RTP? een leertoename is;
laat u(t) = [01 (0), uz 1 (2), ne (0) en E(t) = [£16 (6), E20 (D), EO], Formule (19) wordt omgezet naar:
Up (8) = up (8) + P&k41(t) (20),
waarbij P = diag{l'y, 5, Li},
vervolgens, laat Ze = [64(0),& (1), +, & (NT en Uk = [u (0), u, (1), ++, wu, (NT, Formule (20) wordt omgezet naar:
Uppy = U +E (20),
waarbij P = diag{T'}yxn;
Formule (18) wordt ingevuld in Formule (21) om een iteratief-lerende regelmethode te verkrijgen:
Ug+1 = U +I Mey; (22);
een iteratieve leermethode op basis van het bijwerken van het doeltraject die vanuit Formule (10) en Formule (22) verkregen kan worden is:
Ur = Up + PMegy1 (23): en
Ther = Tx + Acre — Vp)
Voor het discrete heterogene multi-agentsysteem (1), onder invloed van de iteratieve leermethode (23) gebaseerd op het bijwerken van het doeltraject, als een ongelijkheid ||(I + GPM)! <1 waar is, terwijl de iteraties doorgaan, convergeert een outputtraject van een volger naar een verwacht punt, dat wil zeggen, als k >, Yx+1(ts) = Valts).
NL2027701A 2020-06-19 2021-03-03 Point-to-point tracking control method for multi-agent trajectory-updating iterative learning NL2027701B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010565612.0A CN111722628B (zh) 2020-06-19 2020-06-19 一种多智能体轨迹更新迭代学习的点到点跟踪控制方法

Publications (2)

Publication Number Publication Date
NL2027701A NL2027701A (en) 2022-01-28
NL2027701B1 true NL2027701B1 (en) 2022-03-15

Family

ID=72567744

Family Applications (1)

Application Number Title Priority Date Filing Date
NL2027701A NL2027701B1 (en) 2020-06-19 2021-03-03 Point-to-point tracking control method for multi-agent trajectory-updating iterative learning

Country Status (2)

Country Link
CN (1) CN111722628B (nl)
NL (1) NL2027701B1 (nl)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112526886A (zh) * 2020-12-08 2021-03-19 北京航空航天大学 随机试验长度下离散多智能体系统迭代学习编队控制方法
CN113342002B (zh) * 2021-07-05 2022-05-20 湖南大学 基于拓扑地图的多移动机器人调度方法及系统
CN113791611B (zh) * 2021-08-16 2024-03-05 北京航空航天大学 一种车辆在干扰下的实时跟踪迭代学习控制系统及方法
CN113786556B (zh) * 2021-09-17 2024-05-10 江南大学 足下垂功能性电刺激康复系统变长度迭代学习控制方法
CN115268275B (zh) * 2022-08-24 2024-05-28 广东工业大学 基于状态观测器的多智能体系统一致性跟踪方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108803349B (zh) * 2018-08-13 2020-06-26 中国地质大学(武汉) 非线性多智能体系统的最优一致性控制方法及系统
CN110815225B (zh) * 2019-11-15 2020-12-25 江南大学 电机驱动单机械臂系统的点对点迭代学习优化控制方法
CN110948504B (zh) * 2020-02-20 2020-06-19 中科新松有限公司 机器人加工作业法向恒力跟踪方法和装置

Also Published As

Publication number Publication date
CN111722628A (zh) 2020-09-29
CN111722628B (zh) 2021-07-09
NL2027701A (en) 2022-01-28

Similar Documents

Publication Publication Date Title
NL2027701B1 (en) Point-to-point tracking control method for multi-agent trajectory-updating iterative learning
Wang et al. Containment control for general second-order multiagent systems with switched dynamics
CN109409524B (zh) 一种量子程序运行方法及装置、存储介质及电子装置
Fang et al. Flocking of second-order multiagent systems with connectivity preservation based on algebraic connectivity estimation
Chu et al. Observer-based consensus tracking of multi-agent systems with one-sided Lipschitz nonlinearity
Xia et al. Dynamic leader-following consensus for asynchronous sampled-data multi-agent systems under switching topology
Saravanakumar et al. Reliable memory sampled-data consensus of multi-agent systems with nonlinear actuator faults
Ai et al. A zero-gradient-sum algorithm for distributed cooperative learning using a feedforward neural network with random weights
Partovi et al. Structural controllability of high order dynamic multi-agent systems
Ai et al. Distributed stochastic configuration networks with cooperative learning paradigm
Liu et al. Reduced-order observer-based leader-following formation control for discrete-time linear multi-agent systems
Chen et al. Distributed fault-tolerant consensus protocol for fuzzy multi-agent systems
Ruano et al. An overview of nonlinear identification and control with neural networks
Liu et al. Fault-tolerant consensus control with control allocation in a leader-following multi-agent system
Zhao et al. Distributed adaptive fuzzy fault-tolerant control for multi-agent systems with node faults and denial-of-service attacks
Muthusamy et al. Decentralized approaches for cooperative grasp planning
Elimelech et al. Fast action elimination for efficient decision making and belief space planning using bounded approximations
Ge et al. A novel method for distributed optimization with globally coupled constraints based on multi-agent systems
Selvam et al. Domination in join of fuzzy graphs using strong arcs
CN114637278A (zh) 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法
Qian et al. Leader-follower consensus of nonlinear agricultural multiagents using distributed adaptive protocols
Zhang et al. Consensus of Second‐Order Heterogeneous Hybrid Multiagent Systems via Event‐Triggered Protocols
Alaya et al. A CPS-Agent self-adaptive quality control platform for industry 4.0
Xiong et al. Data-driven Formation Control for a Class of Unknown Heterogeneous Discrete-time MIMO Multi-agent System with Switching Topology
Lu et al. Converting general nonlinear programming problems into separable programming problems with feedforward neural networks