KR101935006B1 - 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법 - Google Patents
멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법 Download PDFInfo
- Publication number
- KR101935006B1 KR101935006B1 KR1020170079924A KR20170079924A KR101935006B1 KR 101935006 B1 KR101935006 B1 KR 101935006B1 KR 1020170079924 A KR1020170079924 A KR 1020170079924A KR 20170079924 A KR20170079924 A KR 20170079924A KR 101935006 B1 KR101935006 B1 KR 101935006B1
- Authority
- KR
- South Korea
- Prior art keywords
- agent
- tracking
- output signal
- follower
- leader
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 263
- 238000004891 communication Methods 0.000 claims abstract description 15
- 240000007049 Juglans regia Species 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 86
- 230000003044 adaptive effect Effects 0.000 description 29
- 238000013461 design Methods 0.000 description 26
- 238000013459 approach Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B6/00—Internal feedback arrangements for obtaining particular characteristics, e.g. proportional, integral or differential
- G05B6/02—Internal feedback arrangements for obtaining particular characteristics, e.g. proportional, integral or differential electric
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Feedback Control In General (AREA)
Abstract
멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법이 제공된다. 멀티 에이전트 시스템에 포함되는 추종 에이전트는, 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 통신부; 및 상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 가중치 벡터를 도출하며, 상기 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보 및 상기 가중치 벡터를 단일 함수 근사기에 반영하여 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적(consensus tracking)하도록 상기 추종 에이전트의 제어 입력을 계산하는 제어기를 포함한다.
Description
본 발명은 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법에 관한 것이다.
제어 사회에서 다개체 시스템의 협력적 행동을 통합하는 분산된 협동 프로토콜은 센서 네트워크, 무인 차량의 편대 비행, 마이크로-그리드에서의 전력 밸런싱 등 광범위한 응용 프로그램으로 인해 많은 주목을 끌었다. 분산된 협동 문제는 세 가지 부류로 나뉘어지는데, 이는 리더 없는 의견 일치 문제, 리더에 따른 일치 추종 문제 및 다수의 리더들에 의해 유도되는 컨벡스 홀 스펜(Convex hull spanned)으로 추종 에이전트들을 수렴시키는 문제로 이어진다. 상기 문제들은 비선형 다개체 시스템에 대해 활발하게 연구되어왔다. 제어 입력과 일치하는 비선형 시스템에 대해서는 분산 제어 방식의 접근 방식이 제안되었다. 미지의 동일한 제어 방향 문제는 선형적으로 파라미터화된 비선형 함수가 제어 입력과 매칭된 일차 및 이차 다개체 시스템의 적응형 일치에서 새로운 누스바움(Nussbaum) 타입 함수가 제시됨으로서 해결되었다. 제어 입력에 일치되지 않는 비선형성을 지닌 네트워크를 통한 다개체 시스템을 제어하기 위해, 체계적이고 반복적인 설계 기법을 기반으로 하는 분산된 알고리즘은 현재 개발되었다. 특히 신경망 및 퍼지 논리 시스템과 같은 함수 근사자를 사용한 분산된 적응형 제어 방법은 하삼각 행렬 형식(Lower-triangular form)으로 완전한 미지의 다수 비선형 시스템에 대해 제시되었다. 하지만 전술한 근사 기반 분산 제어 결과는 각 추종자의 순서와 동일한 함수 근사자를 요구한다. 즉 각 추종자의 순서가 증가할수록 각 로컬 컨트롤러에서의 사용된 함수 근사자의 수는 증가한다. 따라서 분산 제어 체계의 복잡성은 여분의 적응형 파라미터(즉, 가중치)가 업데이트되어야한다는 점에서 증가하며, 이는 수치적으로 계산되는 비선형 미분 방정식(즉, 적응형 법칙)의 수를 증가시킨다. 따라서 분산 제어 시스템 구현에 따른 계산 부담은 각 추종자의 차수가 증가할수록 증가한다고 보고되었다.
한편, 불확실한 비선형 스트릭-피드백 시스템(Strict-feedback systems)을 위해 하나의 함수 예측을 사용하는 적응형 백스텝핑 제어 방법을 개발했다. 이러한 접근법의 핵심은 가상 컨트롤러를 실제 제어기를 설계하기 위해 구현할 수 없는 중간신호로 간주하고, 반복적인 제어기 설계 절차로부터 도출된 미지의 비선형 묶음을 추정하기 위해 단 하나의 함수만을 사용하는 것이다. 이 설계 방법론은 최근 비선형 이산-시간(Discrete-time) 시스템, 비선형 시간-지연(Time-delay) 시스템, 상호 연결된 비선형성 시스템으로 확장되었다. 그러나 이러한 접근법은 다음과 같은 두 가지 주요 난제로 인해 네트워크 비선형 다개체 시스템의 분산 일치 추종 문제에 아직 적용되지 않았다. :
(ⅰ) 각 추종자에 대한 집중된 비선형은 분산된 방식으로 반복적으로 유도되어야하며, 내재적 비선형 함수뿐만 아니라 개체간의 제한된 통신을 고려하여 귀납적으로 도출되어야한다.
(ⅱ) 구현할 수 없는 가상 제어법으로 구성된 오류 표면으로 인해 미지의 제어 계수 신호를 처리하기 위해 잘 알려진 해결책인 누스바움(Nussbaum) 함수 기술을 활용하는 데에 어려움이 있기 때문에 미지의 제어 방향 문제가 다뤄지지 않았다.
이러한 두 가지 어려움은 미지의 제어 방향과 함께 각각의 추종 제어 장치에 대해 하나의 함수를 사용하여 분산된 적응형 일치 추적 체계를 개발하도록 동기를 부여한다.
이에 본 발명은 상기와 같은 제반 사항을 고려하여 제안된 것으로, 멀티 에이전트 시스템에서 리더 에이전트를 컨센서스 추적하는 것을 목적으로 한다.
본 발명의 일 측면에 따르면, 멀티 에이전트 시스템에 포함되는 추종 에이전트의 제어 방법이 제공된다.
본 발명의 일 실시예에 따르면, 멀티 에이전트 시스템에 포함되는 추종 에이전트의 제어 방법에 있어서, (a) 상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 가중치 벡터를 도출하는 단계; 및 (b) 상기 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보 및 상기 가중치 벡터를 단일 함수 근사기(single function approximator)에 반영하여 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적(consensus tracking)하도록 상기 추종 에이전트의 제어 입력을 도출하는 단계를 포함하는 추종 에이전트의 제어 방법이 제공될 수 있다.
상기 단일 함수는, 상기 멀티 에이전트 시스템의 각 추종 에이전트에 분산적으로 정의되며 상호간 미지(unknown)이되, 신경망(radial basis function neural network)을 이용하여 근사화될 수 있다.
상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 상기 멀티 에이전트 시스템에 포함된 복수의 추종 에이전트들에 분산된 컨센서스 오차값을 도출하는 단계; 및 상기 컨센서스 오차값을 이용하여 상기 가중치 벡터값을 도출하는 단계를 포함할 수 있다.
Nussbaum 함수를 이용하여 상기 멀티 에이전트 시스템에 포함되는 복수의 이웃 추종 에이전트 및 상기 리더 에이전트 중 적어도 하나에 대한 미지의 제어 방향성이 고려되어 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트의 제어 입력을 도출할 수 있다.
상기 (b) 단계 이전에, 상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 Nussbaum 함수 매개변수를 도출하는 단계; 및 상기 매개변수를 Nussbaum 함수에 반영하는 단계를 더 포함할 수 있다.
상기 (b) 단계에서, 상기 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보를 이용하여 오차값을 도출하며, 상기 도출된 오차값을 더 반영하여 상기 추종 에이전트의 제어 입력을 도출할 수 있다.
상기 이웃 추종 에이전트는 복수이되, 상기 추종 에이전트는 상기 이웃 추종 에이전트의 일부 및 상기 리더 에이전트 중 적어도 하나와 비선형 상호 연결성을 가지며 통신이 가능하다.
본 발명의 다른 측면에 따르면, 멀티 에이전트 시스템에서 리더를 컨센서스 추적하는 추종 에이전트가 제공된다.
본 발명의 일 실시예에 따르면, 멀티 에이전트 시스템에 포함되는 추종 에이전트에 있어서, 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 통신부; 및 상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 가중치 벡터를 도출하며, 상기 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보 및 상기 가중치 벡터를 기반으로 단일 함수 근사기를 설계하여 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적(consensus tracking)하도록 상기 추종 에이전트의 제어 입력을 계산하는 제어기를 포함하는 추종 에이전트가 제공될 수 있다.
본 발명의 일 실시예에 따른 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법을 제공함으로써, 멀티 에이전트 시스템에서 리더 에이전트를 컨센서스 추적하는 것을 목적으로 한다.
도 1은 본 발명의 일 실시예에 따른 멀티 에이전트 시스템에서 리더 에이전트를 컨센서스 추적하도록 추종 에이전트를 제어하는 방법을 나타낸 순서도.
도 2는 본 발명의 일 실시예에 따른 멀티 에이전트 시스템에서 리더 에이전트를 컨센서스 추적하는 추종 에이전트의 내부 구성을 개략적으로 도시한 블록도.
도 3은 본 발명의 일 실시예에 따른 컨세스 추적을 위한 제어기의 상세 구조도.
도 4는 본 발명의 일 실시예에 따른 리더 에이전트와 추종 에이전트의 통신 그래프를 개략적으로 도시한 도면.
도 5는 본 발명의 일 실시예에 따른 컨센서스 추적 결과를 나타낸 그래프.
도 6은 종래의 컨센서스 추적 결과를 나타낸 그래프.
도 7은 본 발명의 일 실시예에 따른 Nussbaum function의 출력 결과를 나타낸 그래프.
도 8은 본 발명의 일 실시예에 따른 신경망의 출력 결과를 나타낸 그래프.
도 9는 본 발명의 다른 실시예에 따른 에이전트들 사이의 방향성을 가지는 통신 그래프.
도 10은 본 발명의 다른 실시예에 따른 컨센서스 추적 결과를 나타낸 그래프.
도 11은 다른 실시예에 따른 종래의 컨센서스 추적 결과를 나타낸 그래프.
도 12는 본 발명의 다른 실시예에 따른 Nussbaum function의 출력 결과를 나타낸 그래프.
도 13은 본 발명의 다른 실시예에 따른 신경망의 출력 결과를 나타낸 그래프.
도 2는 본 발명의 일 실시예에 따른 멀티 에이전트 시스템에서 리더 에이전트를 컨센서스 추적하는 추종 에이전트의 내부 구성을 개략적으로 도시한 블록도.
도 3은 본 발명의 일 실시예에 따른 컨세스 추적을 위한 제어기의 상세 구조도.
도 4는 본 발명의 일 실시예에 따른 리더 에이전트와 추종 에이전트의 통신 그래프를 개략적으로 도시한 도면.
도 5는 본 발명의 일 실시예에 따른 컨센서스 추적 결과를 나타낸 그래프.
도 6은 종래의 컨센서스 추적 결과를 나타낸 그래프.
도 7은 본 발명의 일 실시예에 따른 Nussbaum function의 출력 결과를 나타낸 그래프.
도 8은 본 발명의 일 실시예에 따른 신경망의 출력 결과를 나타낸 그래프.
도 9는 본 발명의 다른 실시예에 따른 에이전트들 사이의 방향성을 가지는 통신 그래프.
도 10은 본 발명의 다른 실시예에 따른 컨센서스 추적 결과를 나타낸 그래프.
도 11은 다른 실시예에 따른 종래의 컨센서스 추적 결과를 나타낸 그래프.
도 12는 본 발명의 다른 실시예에 따른 Nussbaum function의 출력 결과를 나타낸 그래프.
도 13은 본 발명의 다른 실시예에 따른 신경망의 출력 결과를 나타낸 그래프.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. 본 발명의 특징 및 이점들은 첨부 도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 발명자가 그 자신의 발명의 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다. 또한 본 발명과 관련된 공지 기능 및 그 구성에 대한 구체적인 설명은 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그 구체적인 설명을 생략하였음에 유의해야할 것이다.
도 1은 본 발명의 일 실시예에 따른 멀티 에이전트 시스템에서 리더 에이전트를 컨센서스 추적하도록 추종 에이전트를 제어하는 방법을 나타낸 순서도이다.
본 발명의 일 실시예에 따른 멀티 에이전트 시스템은 하나의 리더 에이전트와 적어도 하나의 추종 에이전트를 포함한다. 각 추종 에이전트는 리더 에이전트 및 이웃하는 다른 추종 에이전트(이하에서는 이웃 추종 에이전트라 칭하기로 함) 중 일부와 통신이 가능한 것을 가정하기로 한다.
또한, 하기에서 보다 상세히 설명되겠지만, 본 발명의 일 실시예에 따른 추종 에이전트는 리더 에이전트의 출력 신호(예를 들어, 위치)를 컨센서스 추적하도록 추종 에이전트의 제어 입력을 계산할 수 있다.
단계 110에서 추종 에이전트는 리더 에이전트와 적어도 하나의 이웃 추종 에이전트 중 적어도 하나와 통신을 통해 출력 신호(예를 들어, 위치)를 획득한다.
단계 115에서 추종 에이전트는 리더 에이전트와 적어도 하나의 이웃 추종 에이전트 중 적어도 하나의 출력 신호와 해당 추종 에이전트의 출력 신호를 이용하여 분산된 컨센서스 오차값을 도출한다.
분산된 컨센서스 오차값을 도출하는 상세한 방법에 대해서는 하기에서 보다 상세히 설명하기로 한다.
단계 120에서 추종 에이전트는 도출된 컨센서스 오차값을 이용하여 누스바움 함수(Nussbaum-type function)에 대한 매개변수값을 도출한 후 도출된 매개변수값을 누스바움 함수(Nussbaum-type function)에 적용함으로써, 멀티 에이전트 시스템에 포함되는 복수의 에이전트에 대한 미지의(unknown) 제어 방향성을 보상한다.
이어, 단계 125에서 추종 에이전트는 도출된 컨센서스 오차값을 이용하여 가중치를 도출하고, 도출된 가중치를 이용한 단일 함수 근사기를 통해 미지의 비선형 단일 함수를 근사화한다.
이때, 단일 함수는 하기에서 보다 상세히 설명되겠지만, 멀티 에이전트 시스템의 추종 에이전트들에 분산적으로 정의된 하나의 함수일 수 있다. 따라서, 본 발명의 일 실시예에 따른 추종 에이전트는 각 추종 에이전트들에 분산적으로 정의된 하나로 묶인 미지의 단일 함수를 근사화하기 위해 신경망(Neural basis function network)를 이용한다. 이에 대해서는 하기의 설명에 의해 보다 명확하게 이해될 것이다.
단계 130에서 추종 에이전트는 적응적으로 튜닝된 누스바움 함수(Nussbaum-type function)의 결과값(제어 방향성)을 고려하여 적응적으로 튜닝된 단일 함수 근사기의 결과값을 반영하여 추종 에이전트의 제어 입력을 도출한다. 추종 에이전트는 최종적으로 도출된 제어 입력을 기반으로 추종 에이전트를 제어함으로써 리더 에이전트를 컨센서스 추적하도록 할 수 있다.
물론, 추종 에이전트는 최종적으로 제어 입력을 도출함에 있어, 단계 115에 의해 도출된 오차값을 더 반영하여 추종 에이전트의 제어 입력을 도출할 수 있다.
추종 에이전트의 제어 입력은 하기에서 설명되는 수학식 31을 이용하여 도출될 수 있다.
도 2는 본 발명의 일 실시예에 따른 멀티 에이전트 시스템에서 리더 에이전트를 컨센서스 추적하는 추종 에이전트의 내부 구성을 개략적으로 도시한 블록도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 추종 에이전트는 통신부(210), 메모리(220) 및 제어기(230)를 포함하여 구성된다.
통신부(210)은 다른 에이전트와 데이터를 송수신하기 위한 수단이다.
예를 들어, 통신부(210)은 이웃 추종 에이전트 및 리더 에이전트 중 적어도 하나와 데이터(예를 들어, 출력 신호 등)를 송수신할 수 있다.
메모리(220)은 본 발명의 일 실시예에 따른 멀티 에이전트 시스템에서 추종 에이전트가 리더 에이전트를 컨센서스 추적하기 위해 필요한 다양한 알고리즘, 이 과정에서 파생되는 다양한 데이터 등을 저장하는 기능을 한다.
제어기(230)는 멀티 에이전트 시스템에서 추종 에이전트가 리더 에이전트를 컨센서스 추적하도록 추종 에이전트의 제어 입력을 도출한 후, 해당 제어 입력에 따라 추종 에이전트의 이동을 제어하는 기능을 수행한다.
보다 상세하게, 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 가중치 벡터를 도출하며, 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보 및 상기 가중치 벡터로 구성된 단일 함수 근사기를 통해 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적(consensus tracking)하도록 추종 에이전트의 제어 입력을 도출할 수 있다. 이어, 추종 에이전트는 도출된 제어 입력에 따라 추종 에이전트가 리더 에이전트를 컨센서스 추적하도록 추종 에이전트의 이동을 제어할 수 있다.
이에 대해서는 이하의 설명을 통해 보다 명확하고 상세하게 이해될 것이다.
본 발명의 일 실시예에 따른 멀티 에이전트 시스템에서의 컨센서스 추적은 이기종 비선형 스트릭 피드백에 대해 분산된 컨센서스 추적을 위해 최소-함수-근사(MFA, 이하 MFA라 칭하기로 함)에 기반하여 제어기를 설계할 수 있다. 본 발명의 일 실시예에 따른 MFA는 각 추종 에이전트의 순서에 상관없이 각 로컬 제어기에서 단 하나의 함수 근사기(이하에서는 단일 함수 근사기라 칭하기로 함)만을 사용한다.
또한, 본 발명의 일 실시예에 따른 멀티 에이전트 시스템의 경우 이미 전술한 바와 같이, 복수의 에이전트들이 그룹을 형성하고 있으며, 해당 그룹내에 하나의 리더 에이전트를 포함한다. 이때, 그룹에 포함되는 추종 에이전트들 중 일부만 리더 에이전트와 통신을 수행할 수 있는 것을 가정하기로 한다.
본 발명의 일 실시예에 따른 MFA 기반의 제어기 설계는 리더 에이전트의 글로벌 정보를 사용한 새로운 오차 좌표 변환(error coordinate transformation)과 미지의 비선형 함수(unknown nonlinear function)가 종래와는 다르다.
각 설계 단계에서 실행할 수 없는 중간 신호로 간주되는 가상 제어기가 새로운 오차 좌표 변환을 사용하여 설계된다. 이들 중간 신호에 기초하여, 각 추종 에이전트에 대해 분산되고 집중된 비선형 함수는 최종 설계 단계에서 귀납적으로 유도되며, 단일 함수 근사기로부터 추정된다.
또한, 각 추종 에이전트를 위한 분산된 로컬 제어는 누스바움 함수(Nussbaum function)과 하나의 함수 근사기를 이용하여 각 추종 에이전트에 대한 분산된 로컬 제어가 설명된다. 또한, 누스바움 함수(Nussbaum function)의 매개 변수와 단일 함수 근사기의 가중치를 위한 분산된 튜닝 법칙은 각 추종 에이전트에서 이용 가능한 로컬 오차에 의해 유도될 수 있다.
라푸노프(Lyapunov) 안정성 정리에서, 총 폐쇄 루프 시스템의 안정성은 누스바움(Nussbaum) 함수의 파라미터와 함수 근사기의 가중치와 관련된 두 가지 기술적 보조 정리를 유도하여 분석된다.
본 발명의 주요 특징은 다음과 같다. :
(ⅰ) 하삼각 행렬식(Lower-triangular form)의 불확실한 비선형 멀티 에이전트 시스템에 대한 종래의 근사-기반 분산된 적응적 협동 제어(approximation-based distributed adaptive cooperative control) 결과는 각 추종 에이전트에 대한 로컬 제어 법칙에서 다중 함수 근사기를 필요로 했다. 이에 전체 제어 스킴의 복잡성은 추종 에이전트의 차수와 개수가 증가함에 따라 증가한다.
그러나, 본 발명의 일 실시예에 따른 MFA 기반 분산 제어 접근은 각 추종 에이전트의 차수와 관계없이 각 로컬 컨트롤러에서 단일의 함수 근사기를 사용한다. 이에 이전 방식과 비교하였을 때 단순화된 제어 구조를 더 확고히 할 수 있다.
(ⅱ) 다양한 비선형 시스템을 위한 단일의 함수 근사기를 사용하는 적응형 제어 방식과 비교하면, 네트워크화된 다수 비선형 시스템의 MFA 기반 분산 컨센서스 추적 문제가 우선 고려된다. 추가로 MFA 기반 분산 일치 추종 프레임워크에서 미지의 제어 방향성 문제가 연구되었다. 즉 리더 에이전트의 글로벌한 정보와 미지의 비선형 조건을 사용하여 새로운 오차 좌표 변환이 제시되고, 각 추종 에이전트에 대한 분산 집중된 비선형 함수를 귀납적으로 유도하고, 본 발명의 일 실시예에 따른 로컬 제어 스킴에서 누스바움 함수의 파라미터와 단일 함수 근사기를 위해 이용 가능한 오차에 기반한 적응적 튜닝 매커니즘이 구축된다. 그리고 몇 가지 기술적 보조 정리를 사용하여 폐쇄-루프 안정성의 제공이 근사 기반 분산 협동 제어 분야에서의 첫 시도이다.
이하에서는 멀티 에이전트 시스템에서 추종 에이전트들이 리더 에이전트를 컨센서스 추적하는 방법을 설명하기 위해 각 에이전트들의 제어를 그래프 기반으로 설명하기로 한다. 따라서, 이하에서 설명되는 그래프 설명에서 각 노드는 멀티 에이전트 시스템에 포함되는 각 에이전트(추종 에이전트 또는 리더 에이전트)로 이해되어야 할 것이다.
따라서, 이해와 설명의 편의를 도모하기 위해 그래프 기반 이론의 일반적인 개념에 대해 우선 설명한다.
은 N개의 노드를 가지는 노드 집합()과 에지 집합()을 포함하는 제N 순서를 가지는 방향성이 있는 그래프이다. 에서 에지 는 에이전트 i가 에이전트 j로부터 정보를 수신할 수 있지만, 그 반대는 수신하지 않는다는 것을 나타낸다. 노드 i의 이웃 세트는 로서 정의된다. 의 인접행렬는 이다.; 인 경우 , 그렇지 않으면, 그리고 이다. 노드 i의 가중 진입 차수로서 , 진입 차수 행렬로서 을 정의한다. 그리고 의 라플라시안 행렬(Laplacian matrix)은 로 표시된다. 노드 에서 노드 로의 직접 경로는 방향성 그래프에서 형태의 에지 서열이다. 방향성 그래프 는 모든 다른 노드들로 방향성 경로를 가지는 루트라 불리는 적어도 하나의 노드가 존재한다면 스패닝 트리(Spanning tree)를 가진다.
이하에서는 개의 추종 에이전트로 구성된 그룹을 가정하며, 에이전트 1부터 에이전트 N으로 표기하기로 하며, 리더 에이전트는 에이전트 0이라 통칭하여 설명하기로 한다. 개의 추종 에이전트들은 수학식 1과 같은 스트릭 피드백(Strict-feedback) 비선형 시스템으로 설명된다.
<수학식 1>
여기서 는 상태 벡터이고, 및 는 i번째 추종 에이전트의 출력 신호와 I번째 추종 에이전트의 제어 입력이고, 는 미지의 0이 아닌 상수이며 이의 신호는 미지 신호이고, 및 는 미지의 스무스 비선형 함수를 나타낸다. 또한, 또한, 미지의 비선형 및 , 제어 계수 , 추종 에이전트의 차수(order) 는 이질적이며, 리더의 움직임은 추종 에이전트의 움직임과는 독립적인 것을 가정하기로 한다. 개의 추종 에이전트와 하나의 리더 에이전트를 위한 통신 토폴로지는 및 을 가지는 방향성 그래프 로서 정의될 수 있다. 개의 추종 에이전트 중 통신을 대표하기 위해, 및 을 포함하는 서브 그래프를 정의하기로 한다. 에서 i번째 추종자 에이전트의 이웃 에이전트 집합은 과 같이 나타낼 수 있다. 또한, 와 상응하는 라플라시안 행렬(Laplacian matrix) 은 로서 정의된다. 여기서 , 는 개의 추종 에이전트들 중 통신을 나타내는 서브그래프 의 라플라시안 행렬이고, 그래프 와 관련있는 리더 에이전트 인접 행렬 는 로 정의된다. 여기서 , 이면 이며, 그렇지 않고 이면 이다.
가정 2 : 리더 에이전트의 신호 와 이의 시간 미분(time derivative) 는 및 로 유계되고, 및 는 를 만족하는 추종 에이전트들만 이용 가능한 것으로 가정하기로 한다. 여기서 , 및 는 양의 상수이다.
<수학식 2>
문제 1 : 본 발명은 폐루프 시스템의 모든 신호가 유계됨과 동시에 각 추종 에이전트의 출력 신호가 동적 리더 에이전트의 출력에 동기화되도록 각 로컬 제어기()에서 단일 함수 근사기를 사용하는 MFA 기반 분산 적응적 컨센서스 추적 스킴을 설계하기 위한 것이다.
비고 1 : 하삼각 행렬 형식(Lower-triangular form)의 비선형 멀티 에이전트시스템을 위한 종래의 근사 기반 분산 제어 결과는 각 추종 에이전트의 차수와 동일한 차수대로 함수 근사기를 사용했다. 그러나 문제 1에서의 나타난 바와 같이, 본 발명의 일 실시예에 따른 컨센서스 추적 스킴은 i번째 추종 에이전트의 로컬 제어기 에 대해 단 하나의 함수 근사기 사용한다. 또한, 본 발명의 일 실시예에 따른 MFA 기반 컨센서스 프레임워크에서 미지의 제어 방향성 문제가 다루어진다.
MFA 기반 분산 적응적 컨센서스 추적은 재귀적 설계 기법을 이용하여 설명된다. 설명을 명확하기 하기 위해, 수학식 3과 같은 표기법을 사용한다.
<수학식 3>
로컬 제어기 설계 절차는 수학식 4와 같은 새로운 좌표 변환(coordinate transformation)에 기초한다.
<수학식 4>
여기서 , , 및 는 i번째 추종 에이전트의 가상 제어기를 나타낸다. 이는 본 발명의 일 실시예에 따른 MFA 기반 컨센서스 추적 시스템에서 실행되는 것이 아니라 각각의 추종 에이전트의 실제 로컬 제어기 를 설계하기 위한 중간 신호로 간주된다.
비고 2 : 오류 표면(error surface)이 i번째 추종 에이전트에 대해 이용 가능한 신호인 멀티 에이전트 시스템에 대한 종래의 재귀적 제어 스킴과는 대조적으로, 수학식 4에서 오류 표면(, )은 미지의 비선형 함수 항과 실행 불가능한 가상 제어기()로 피드백을 위해 이용이 불가능한 신호이다. 또한, 종래의 제어 스킴에서는 제1 오류 표면은 제1 설계 단계에서 함수 근사기의 분산된 가중치 튜닝 법칙을 파생하기 위해 분산된 양(quantity)로 정의된다. 그러나, 수학식 4에서 컨센서스 추적 오차()는 방향성이 있는 네트워크하에서 리더 에이전트의 신호()의 공유된 정보가 부족하기 때문에 몇몇 추종 에이전트에 의해 계산되지 않는 글로벌한 양(quantity)로 나타낸다. 이러한 차이에도 불구하고, 본 발명의 일 실시예에 따른 MFA 기반 컨센서스 추적 제어 스킴은 완전히 분산된 방식에서 개발되고, 폐쇄-루프 안정성은 완전하게 분포되어있는 리아프노프(Lyapunov sense)에서 엄격하게 분석된다. 이는 각 추종 에이전트의 로컬 제어기가 추종 에이전트 자신과 이웃의 정보를 사용하여 설계된다는 것을 의미한다.
<수학식 5>
<수학식 6>
<수학식 7>
상기 <수학식 7>을 <수학식 6>에 대입하면 수학식 8과 같이 나타낼 수 있다.
<수학식 8>
본 발명의 일 실시예에 따른 설계 절차에서, 모든 가상 제어기는 마지막 설계 과정에서 각 추종 에이전트의 분산된 로컬 실제 제어기의 설계를 위해 중간 신호로 사용된다.
<수학식 9>
이의 시간 미분(time derivative)은 수학식 10과 같이 나타낼 수 있다.
<수학식 10>
<수학식 11>
<수학식 12>
수학식 12를 수학식 11에 대입하면, 수학식 13과 같이 나타낼 수 있다.
<수학식 13>
<수학식 14>
<수학식 15>
<수학식 16>
<수학식 17>
<수학식 18>
<수학식 19>
<수학식 20>
<수학식 21>
<수학식 22>
<수학식 23>
상기 <수학식 23>을 <수학식 22>에 대입하면, 수학식 24와 같다.
<수학식 24>
<수학식 25>
<수학식 26>
여기서,
<수학식 27>
가상 제어기 를 설계했던 이전 단계와 달리, 구현할 수 있는 실제 제어기 는 미지의 제어 계수 와 비분산된 이용 불가능한 조건 를 사용하여 설계될 수 없다. 이 문제를 해결하기 위해, 분산된 오차 는 수학식 28과 같이 정의하기로 한다.
<수학식 28>
<수학식 29>
미지의 함수는 수학식 30과 같이 충분한 정도(degree)의 정확도로 근사화될 수 있다.
<수학식 30>
여기서 는 노드 개수 를 포함하는 최적의 가중치 벡터이며, 를 만족한다.; ; 는 가우시안 기초 함수(gaussian basis function)이고, 는 을 만족하는 재설계 오차를 나타낸다. 의 상한값이 다음과 같은 보조 정리에서 제공된다.
<수학식 31>
<수학식 32>
<수학식 33>
본 발명의 일 실시예에 따른 컨세스 추적을 위한 제어기의 상세 구조는 도 3과 같다.
수학식 31을 수학식 29에 대입하고, 수학식 30을 적용하면 수학식 34와 같다. <수학식 34>
상술한 부등식은, 일 때, 의 부정적 성향(nagativity)이 보장됨을 보여준다. 따라서 이면 는 감소하고, 는 컴팩트 집합 내에 남아있다. 그러므로 이면, 모든 에 대하여 이다.
비고 4 : 누스바움 함수 파라미터의 유계에 관련된 기술적 보조 정리(즉 보조 정리 2)는 제안된 MFA 기반 분산 일치 추종 기법과 이의 안정성 분석에서 제어 계수의 미지의 신호 문제를 다루기 위해 주어진다.
비고 5 : 하삼각 행렬 형식(Lower-triangular form)에서 비선형 멀티 에이전트 시스템에 대한 종래의 근사 기반 분산 협력적 제어 접근법에서, 각 에이전트의 차수와 동일한 함수 근사기들은 각 로컬 제어기를 설계하기 위해 설계되었다. 이 때 상기 각 로컬 제어기는 비선형 기반 함수의 계산과 멀티 근사기들의 가중치에 대한 적응형 기법의 계산은 협력적 컨트롤러의 복잡성으로 이어진다. 따라서 각 추종 에이전트의 차수와 개수가 증가함에 따라, 분산된 제어 시스템의 복잡성은 증가한다.
그러나, 본 발명의 일 실시예에 따른 수학식 32 및 수학식 33과 같은 튜닝 기법을 이용하는 로컬 제어기(수학식 31)로 구성된 MFA 기반 분산된 제어 기법은 각 추종 에이전트의 차수와 상관없이 각 로컬 제어기에서 단일의 함수 근사기만을 사용한다. 따라서 본 발명의 일 실시예에 따른 MFA 기반 분산된 적응형 제어 시스템은 이전 제어 시스템보다 더 단순한 구조를 가진다.
비고 6 : 비고 2에서 나타난 바와 같이, 오류 표면 , 은 제안된 제어 시스템을 설계하기 위해 피드백 될 수 없다. 따라서 컨센서스 추적 목적을 성취하기 위해서 로컬 적응 매커니즘 수학식 32와 수학식 33에 대한 분산된 로컬 오류 를 사용한다.
비고 7 : 하삼각 행렬 형식(Lower-triangular form)에서 비선형 멀티 에이전트 시스템의 컨센서스 추적 프레임워크에서 미지의 제어 방향 문제는 연구되었다. 이러한 문제를 처리하기 위해서, 누스바움 함수는 각 로컬 제어기에 통합되어있고, 사용된 누스바움 함수의 파라미터에 대한 튜닝 기법은 번째 오류 표면(즉 )을 사용하여 설계된다. 그런 다음, 폐쇄 루프 시스템의 안정성은 누스바움 함수와 관련된 일부 알려진 보조 정리들을 통해 분석된다. 하지만 가 본 발명의 일 실시예에 따른 MFA 기반 컨센서스 추적 설계에서 이용 불가능한 신호들이기 때문에, 에 대한 튜닝 기법은 동일한 방법에서 설계될 수 없기에 폐쇄 루프 시스템의 안정성은 알려진 보조 정리를 사용하여 분석될 수 없다. 따라서 본 발명의 일 실시예에 따라 MFA 기반 컨센서스 추적 기법을 설계하고 안정도 분석을 하기 위해, 대신 을 이용한 적응형 기법(수학식 32)가 제시된다. 그것은 미지의 제어 방향의 존재에서 다수의 함수 근사기들을 사용하는 종래의 일치 추종 기법과 본 발명의 MFA 기반 일치 추종 기법 사이의 중요한 차이이다.
본 발명의 주요 결과는 다음 이론에서 주어진다.
이론 1 : MFA 기반의 분산 적응형 컨센서스 추적 기법 <수학식 31>, <수학식 32> 및 <수학식 33>에 의해 제어되는 미지의 이기종 비선형 및 제어 방향을 갖는 멀티 에이전트 시스템을 방향성 네트워크 하에서 고려한다. 그런 다음, 폐-루프 시스템에서 모든 신호들은 균일하게 궁극적으로 유계되고, 컨센서스 오차 는 가능한 한 작게 조절될 수 있다.
<수학식 35>
<수학식 36>
<수학식 37>
<수학식 38>
<수학식 39>
<수학식 40>
여기서
<수학식 41>
시간에 대한 상기 <수학식 41>의 통합은 이다. 이에 따라, 는 , 에 의해 제한되고, 는 제한된다. 의 유계는 의 유계를 나타낸다. , 의 유계 및 가정 3으로부터, 는 유계되고 따라서 는 유계된다. 반복적인 방식으로부터, 의 유계가 보장됨에 따라 가 또한 유계된다. , 및 이 유계됨에 따라 가 유계된다. 추가로 컨센서스 오차는 기하급수적으로 가능한한 작게 조절될 수 있다.
비고 8 : 제어기와 적응적 법칙에 대한 설계 파라미터는 충분 조건이다. 보조 정리 2, 보조 정리 3 및 이론 1의 증명으로부터, 다음과 같은 제안은 일부 중요한 설계 파라미터의 선택을 위해 제공된다.:
비고 9 : 분산형 적응형 퍼지 컨트롤러는 역학적 불확실성 또는 액추에이터 고장과 함께 큰 규모 시스템을 위해 설계되었다. 추가로, 적응형 퍼지 제어 접근법은 비모델링된 역학식을 갖는 비선형 확률 시스템과 미지의 데드존을 갖는 멀티 입출력 확률 시스템에 대해 제시되었다. 앞선 다수의 함수 근사기를 사용한 근사 기반 백스텝핑 제어 기술은 비 멀티 에이전트(non multi-agent) 시스템을 위해 사용되었다. 이는 제안된 MFA 기반 적응형 제어 프레임워크를 앞선 연구들에서 다른 시스템에 사용함으로써 미래 기술에서 가치있는 투자가 될 것이다.
비고 10 : 점근적 컨세스 제어 결과는 제어 입력내에서 미매칭된 미지의 비선형을 고려하지 않는다. 하지만 본 발명의 일 실시예에서는 비선형성이 고려된다. 본 발명의 일 실시예에 따른 MFA 기반 분산 적응적 컨센서스 추적기는 각 추종 에이전트를 위해 하나의 함수 근사기를 사용하더라도, 각 추종 에이전트에 대한 멀티 함수 근사기를 사용하는 기존의 컨센서스 스킴과 유사하게 모든 폐루프 신호들이 균일하고 궁극적으로 유계될 수 있다.
본 발명의 일 실시예에 따른 MFA 기반 분산 적응형 일치 추종 접근법의 효율성을 입증하기 위해서, 다중 윙 록 모델(Multiple wing rock models)을 포함하는 두 개의 예시가 고려된다.
예시 1 : 하나의 리더 에이전트와 이기종 비선형성을 지닌 4개의 추종 에이전트로 구성된 그룹의 컨센서스 추적 문제를 고려한다. 각각의 추종 에이전트는 다음과 같이 모델링된다.
<수학식 42>
여기서
및 는 미지의 이기종 비선형 함수이고, 제어 계수는 및 이고, 이의 신호들은 알려지지 않는 것으로 가정한다. 리더 에이전트와 추종 에이전트들의 통신 그래프는 도 4에 도시된 바와 같이 방향성을 가지는 통신 네트워크에 의해 나타낼 수 있다. 리더 에이전트의 신호는 로 선택된다. 추종 에이전트들의 초기 조건들은 , 및 .
상기 <수학식 42>에 대한 본 발명의 일 실시예에 따른 MFA 기반 분산 컨센서스 추적을 위한 추종 에이전트의 제어기는 수학식 43과 같다.
<수학식 43>
본 발명의 일 실시예에 따른 MFA 기반 제어기와 다수의 함수 근사기 기반 컨트롤러의 컨센서스 추적 결과는 도 5와 도 6에서 비교된다. 도 7과 도 8은 각각 누스바움 함수의 출력과 본 발명의 일 실시예에 따른 신경망의 출력 결과를 보여준다. 도 6은 누스바움 함수의 각 출력이 에서 이기종 제어 계수 의 부호로서, 같은 부호를 가지는 것이 나타난다. 도 7을 참조하면 컨센서스 추적 오차들은 단 몇 초 이내로 빠르게 떨어지며, 본 발명의 일 실시예에 따른 방법은 각 추종 에이전트의 단일 함수 근사기가 추종 에이전트의 차수와 상관없이 제안된 로컬 제어기를 구현하기 위해서 사용되었을지라도 미지의 제어 방향성 및 비매칭된 비선형을 극복할 수 있다.
예시 2 : 예시 2에서는 1차 액츄에이터 역학에 의해 모델링된 에일리론(aileron) 과 함께 다섯 개의 윙 록 모델의 일치 안정화 문제(즉 )를 고려한다. 윙 록 모델의 역학은 다음과 같이 주어진다.
<수학식 44>
여기서 는 롤 각(roll angle)이고, 는 롤 각(roll rate)이고, 는 에일리론 편각 및 는 i번째 윙 록 모델의 제어 입력이다. 모의 실험을 위해 공격 각도 에 대한 델타 윙(delta wing)의 공기 역학 파라미터는
및 과 같은 이기종으로 설정되어있다. 다섯 개의 윙 록 모델의 방향성네트워크와 하나의 리더는 도 9에서 주어진다. 리더 신호는 0으로 설정되어있다. 와 함께 제어되지 않는 윙 록 모델 <수학식 44>은 작은 초기 조건의 경우에 상태 변수의 한계 주기 진동이 나타나고 큰 초기 조건의 경우에는 롤 각 이 발산하는 속성을 갖는다. 따라서 작고 큰 초기 조건들을
상기 <수학식 44>에 대한 MFA 기반 분산 컨센서스 추적 제어기는 다음과 같다.
<수학식 45>
도 10 및 도 11에서 본 발명의 다른 실시예 따른 컨센서스 추적 결과와 종래의 추적 결과가 비교된다. 도 10 및 도 11를 참조하면, 두 개의 제어 결과는 각 추종 에이전트에 대한 단일의 함수 근사기가 추종 에이전트의 차수에 상관없이 본 발명의 일 실시예에 따른 로컬 제어기를 구현하도록 사용되었을지라도 유사한 일치 안정성 성능을 가진다. 도 10(d) 및 도 11(d)에서, 는 다섯 개의 에이전트의 초기 위치를 나타낸다. 도 12 및 도 13은 본 발명의 다른 실시예에 따른 누스바움 함수의 출력과 제안된 접근법의 신경망의 출력 결과를 나타낸다. 본 발명의 일 실시예에 따른 MFA 기반 적응형 컨센서스 추적 접근법의 효율성은 미지의 제어 방향성과 비매칭된 비선형의 존재에서 검증된다.
이상에서 본 발명의 기술적 사상을 예시하기 위한 바람직한 실시예와 관련하여 설명하고 도시하였지만, 본 발명은 이와 같이 도시되고 설명된 그대로의 구성 및 작용에만 국한되는 것이 아니며, 기술적 사상의 범주를 일탈함이 없이 본 발명에 대해 다수의 변경 및 수정이 가능함을 당업자들은 잘 이해할 수 있을 것이다. 따라서 그러한 모든 적절한 변경 및 수정들도 본 발명의 범위에 속하는 것으로 간주되어야할 것이다.
210: 통신부
220: 메모리
230: 제어기
220: 메모리
230: 제어기
Claims (9)
- 멀티 에이전트 시스템에 포함되는 추종 에이전트의 제어 방법에 있어서,
(a) 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 가중치 벡터를 도출하는 단계; 및
(b) 상기 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보 및 상기 가중치 벡터를 단일 함수 근사기에 반영하여 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적(consensus tracking)하도록 상기 추종 에이전트의 제어 입력을 도출하는 단계를 포함하고,
상기 이웃 추종 에이전트는 복수이되,
상기 추종 에이전트는 상기 이웃 추종 에이전트의 일부 및 상기 리더 에이전트 중 적어도 하나와 통신이 가능한 것을 특징으로 하는 추종 에이전트의 제어 방법.
- 제1 항에 있어서,
상기 단일 함수는,
상기 멀티 에이전트 시스템의 각 추종 에이전트에 분산적으로 정의되며 상호간 미지(unknown)이되,
신경망(radial basis function neural network)을 이용하여 근사화되는 것을 특징으로 하는 추종 에이전트의 제어 방법.
- 제1 항에 있어서,
상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 상기 멀티 에이전트 시스템에 포함된 복수의 추종 에이전트들에 분산된 컨센서스 오차값을 도출하는 단계; 및
상기 컨센서스 오차값을 이용하여 상기 가중치 벡터값을 도출하는 단계를 포함하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
- 제1 항에 있어서,
상기 (b) 단계에서,
Nussbaum 함수를 이용하여 상기 멀티 에이전트 시스템에 포함되는 복수의 이웃 추종 에이전트 및 상기 리더 에이전트 중 적어도 하나에 대한 미지의 제어 방향성이 고려되어 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트의 제어 입력을 도출하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
- 제4 항에 있어서,
상기 (b) 단계 이전에,
상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 Nussbaum 함수 매개변수를 도출하는 단계; 및
상기 매개변수를 Nussbaum 함수에 반영하는 단계를 더 포함하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
- 제1 항에 있어서,
상기 (b) 단계에서,
상기 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보를 이용하여 오차값을 도출하며, 상기 도출된 오차값을 더 반영하여 상기 추종 에이전트의 제어 입력을 도출하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
- 삭제
- 제1 항 내지 제6 항 중 어느 하나의 항에 따른 방법을 수행하기 위한 프로그램 코드를 기록한 컴퓨터로 판독 가능한 기록매체.
- 멀티 에이전트 시스템에 포함되는 추종 에이전트에 있어서,
리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 통신부; 및
상기 리더 에이전트의 출력 신호와 이웃 추종 에이전트의 출력 신호 중 적어도 하나와 상기 추종 에이전트의 출력 신호를 이용하여 가중치 벡터를 도출하며, 상기 리더 에이전트의 출력 신호와 상기 이웃 추종 에이전트의 상태 정보 중 적어도 하나, 상기 추종 에이전트의 상태 정보 및 상기 가중치 벡터를 단일 함수 근사기에 반영하여 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적(consensus tracking)하도록 상기 추종 에이전트의 제어 입력을 계산하는 제어기를 포함하는 추종 에이전트.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170079924A KR101935006B1 (ko) | 2017-06-23 | 2017-06-23 | 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170079924A KR101935006B1 (ko) | 2017-06-23 | 2017-06-23 | 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101935006B1 true KR101935006B1 (ko) | 2019-01-03 |
Family
ID=65022044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170079924A KR101935006B1 (ko) | 2017-06-23 | 2017-06-23 | 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101935006B1 (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221542A (zh) * | 2019-06-04 | 2019-09-10 | 西北工业大学 | 一种二阶非线性多智能体系统固定时间协同跟踪控制方法 |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
CN112099525A (zh) * | 2020-08-31 | 2020-12-18 | 北京航空航天大学 | 一种航天器编队飞行低通讯连通保持协同控制方法 |
CN112379596A (zh) * | 2020-11-17 | 2021-02-19 | 南京航空航天大学 | 基于rbf神经网络的异构多智能体系统协同容错控制方法 |
CN113708367A (zh) * | 2021-08-20 | 2021-11-26 | 华东交通大学 | 一种基于一致性算法的电力系统分布式协同控制方法 |
JP2022106261A (ja) * | 2021-01-06 | 2022-07-19 | 北京科技大学 | 二次元平面でのインテリジェント車両隊列制御方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101566665B1 (ko) | 2015-08-13 | 2015-11-06 | 중앙대학교 산학협력단 | 고차 다개체 시스템을 위한 분산 포함 제어 방법 및 그 장치 |
-
2017
- 2017-06-23 KR KR1020170079924A patent/KR101935006B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101566665B1 (ko) | 2015-08-13 | 2015-11-06 | 중앙대학교 산학협력단 | 고차 다개체 시스템을 위한 분산 포함 제어 방법 및 그 장치 |
Non-Patent Citations (3)
Title |
---|
Qikun Shen 외 1, Distributed command filtered backstepping consensus tracking control of nonlinear multiple-agent systems in strict-feedback form. Automatica. 2015. pp. 120-124.* |
Wei Wang 외 3. Prescribed Performance Consensus of Uncertain Nonlinear Strict-Feedback Systems With Unknown Control Directions. IEEE TRANS. ON SYS., MAN, AND CYBERNETICS. 2016.06., pp. 1279-1286.* |
Yun Ho Choi. 외 1, Minimal-Approximation-Based Decentralized Backstepping Control of Interconnected Time-Delay Systems. IEEE Trans. on Cybernetics. 2016. 12., pp. 3401-3413.* |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221542A (zh) * | 2019-06-04 | 2019-09-10 | 西北工业大学 | 一种二阶非线性多智能体系统固定时间协同跟踪控制方法 |
CN110221542B (zh) * | 2019-06-04 | 2021-09-17 | 西北工业大学 | 一种二阶非线性多智能体系统固定时间协同跟踪控制方法 |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
CN112099525A (zh) * | 2020-08-31 | 2020-12-18 | 北京航空航天大学 | 一种航天器编队飞行低通讯连通保持协同控制方法 |
CN112379596A (zh) * | 2020-11-17 | 2021-02-19 | 南京航空航天大学 | 基于rbf神经网络的异构多智能体系统协同容错控制方法 |
CN112379596B (zh) * | 2020-11-17 | 2021-11-23 | 南京航空航天大学 | 基于rbf神经网络的异构多智能体系统协同容错控制方法 |
JP2022106261A (ja) * | 2021-01-06 | 2022-07-19 | 北京科技大学 | 二次元平面でのインテリジェント車両隊列制御方法 |
JP7226721B2 (ja) | 2021-01-06 | 2023-02-21 | 北京科技大学 | 二次元平面でのインテリジェント車両隊列制御方法 |
CN113708367A (zh) * | 2021-08-20 | 2021-11-26 | 华东交通大学 | 一种基于一致性算法的电力系统分布式协同控制方法 |
CN113708367B (zh) * | 2021-08-20 | 2023-12-19 | 华东交通大学 | 一种基于一致性算法的电力系统分布式协同控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101935006B1 (ko) | 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법 | |
Jin et al. | Distributed adaptive security consensus control for a class of multi-agent systems under network decay and intermittent attacks | |
Li et al. | Fuzzy adaptive optimized leader-following formation control for second-order stochastic multiagent systems | |
Hua et al. | Distributed time-varying output formation tracking for heterogeneous linear multiagent systems with a nonautonomous leader of unknown input | |
El-Ferik et al. | Neuro-adaptive cooperative tracking control of unknown higher-order affine nonlinear systems | |
Liu et al. | Reinforcement learning design-based adaptive tracking control with less learning parameters for nonlinear discrete-time MIMO systems | |
Shahvali et al. | Distributed control of networked uncertain Euler–Lagrange systems in the presence of stochastic disturbances: a prescribed performance approach | |
JP2000501531A (ja) | マルチプルエージェント・ハイブリッド制御アーキテクチャ | |
JP2001514403A (ja) | 分配された非線形プロセスのインテリジェントな実時間制御のためのマルチプルエージェントのハイブリッド制御アーキテクチャ | |
Qin et al. | Robust adaptive consensus of nonstrict-feedback multi-agent systems with quantized input and unmodeled dynamics | |
Rey et al. | Fully decentralized ADMM for coordination and collision avoidance | |
Lu et al. | On robust control of uncertain chaotic systems: a sliding-mode synthesis via chaotic optimization | |
Choi et al. | Minimal-approximation-based distributed consensus tracking of a class of uncertain nonlinear multiagent systems with unknown control directions | |
Zhou et al. | Distributed model predictive control for consensus of sampled‐data multi‐agent systems with double‐integrator dynamics | |
Ding et al. | Distributed MPC for tracking and formation of homogeneous multi‐agent system with time‐varying communication topology | |
Tang et al. | Distributed coordination for a class of non‐linear multi‐agent systems with regulation constraints | |
De Campos et al. | On the consensus of heterogeneous multi-agent systems: a decoupling approach | |
Weihua et al. | Robust decentralized formation flight control | |
Djamari | Distributed position estimation approach for multiagent formation with size scaling | |
Li et al. | Formation control of multiagent systems with communication noise: A convex analysis approach | |
Tafti et al. | Recurrent interval type-2 fuzzy wavelet neural network with stable learning algorithm: application to model-based predictive control | |
Mousavi et al. | Cyber-attack detection in discrete-time nonlinear multi-agent systems using neural networks | |
Liu et al. | A novel control law design for prescribed-time/fixed-time stochastic synchronization control of neural networks | |
Ma et al. | Mixed H _ ∞ H∞ and Passive Depth Control for Autonomous Underwater Vehicles with Fuzzy Memorized Sampled-Data Controller | |
Liu et al. | Velocity‐free coordinated attitude synchronisation and tracking control of multiple spacecraft |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |