KR101912341B1 - 스위치드 추종 에이전트 및 이의 제어 방법 - Google Patents

스위치드 추종 에이전트 및 이의 제어 방법 Download PDF

Info

Publication number
KR101912341B1
KR101912341B1 KR1020170079935A KR20170079935A KR101912341B1 KR 101912341 B1 KR101912341 B1 KR 101912341B1 KR 1020170079935 A KR1020170079935 A KR 1020170079935A KR 20170079935 A KR20170079935 A KR 20170079935A KR 101912341 B1 KR101912341 B1 KR 101912341B1
Authority
KR
South Korea
Prior art keywords
agent
tracking
leader
switched
consensus
Prior art date
Application number
KR1020170079935A
Other languages
English (en)
Inventor
유성진
Original Assignee
중앙대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 중앙대학교 산학협력단 filed Critical 중앙대학교 산학협력단
Priority to KR1020170079935A priority Critical patent/KR101912341B1/ko
Application granted granted Critical
Publication of KR101912341B1 publication Critical patent/KR101912341B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B11/00Automatic controllers
    • G05B11/01Automatic controllers electric
    • G05B11/36Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

스위치드 추종 에이전트 및 이의 제어 방법이 개시된다. 추종 에이전트의 제어 방법은 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 단계; 및 상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 단계를 포함한다.

Description

스위치드 추종 에이전트 및 이의 제어 방법{Switched follower agent and control method thereof}
본 발명은 추종 에이전트 및 이의 제어 방법에 관한 것이다.
분산 일치 문제는 다개체 시스템들 간 통신 흐름 제한이 존재함에 따라 협조 제어에 대해 광범위하게 조사되었다. 이 문제들은 현재 비선형 다개체 시스템으로 확장되었다.그 중 비매칭된 비선형 다개체 시스템들은 특히 많은 실제적인 시스템에 적용될 수 있어 그에 대한 협조 제어에 대한 연구가 활발히 진행되었다. 유닛 제어 매개상수를 갖는 비선형 엄격-궤환(strict-feedback) 다개체 시스템의 일치 추종 접근법이 제안되었다. 상태 변수에 의존한 제어 매개함수을 갖는 비선형 다개체 시스템의 일치 문제 또한 연구되었다. 엄격-궤환 방식에서 시간에 따라 변하는 비선형 다개체 시스템에 대한 일치 추종 접근법이 제안되었다. 이 결과들은 최근에 비아핀(non-affine) 비선형 다개체 시스템의 분산 일치 문제로 적용되었다. 즉 스위치된 비선형 다개체 시스템에 대한 일치 문제는 아직 비스위치된 다개체 시스템과 달리 충분히 다루어지지 않았다. 추가로, 실제적인 시스템의 적용을 위해 이 문제에 대해 임의적이고 비동기적인 스위칭 신호들을 고려하는 것이 필수적이다.
한편, 최근 몇 년 동안은 단일 스위치된 시스템의 제어기 설계 및 분석에 집중적인 연구가 활발히 진행되었다. 그 중 공통 리아프노프(Common Lyapunov) 함수는 평균적인 동일 체류 시간(dwell time) 조건에 독립적인 스위칭 신호를 고려할 수 있다는 장점 때문에 특히 인기가 있다. 최근 백스텝핑 기술을 사용함으로써, 알려진 비매칭된 비선형을 가진 스위치된 시스템 제어 문제들은 다루어졌다. 이러한 결과들은 미지의 변환된 비선형 존재한다는 점에서 함수 예측 기반 적응형 제어 체계의 개발을 촉진시켰다. 하지만 스위치된 비선형 다개체 시스템의 분산 일치 제어 문제는 여전히 열려있으며, 이는 이론과 실생활 응용 프로그램에서 모두 중요하고 도전적인 것이다.
이에 본 발명은 상기와 같은 제반 사항을 고려하여 제안된 것으로, 비동기적으로 스위치된 비선형성을 가지는 멀티 에이전트 시스템에서의 리더 에이전트를 컨센서스 추적할 수 있는 추종 에이전트 및 이의 제어 방법을 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, 비동기적으로 스위치된 비선형성을 가지는 멀티 에이전트 시스템으로 구성된 추종 에이전트가 리더 에이전트를 컨센서스 추적할 수 있는 추종 에이전트의 제어 방법이 제공된다.
본 발명의 일 실시예에 따르면, 추종 에이전트의 제어 방법에 있어서, 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 단계; 및 상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 단계를 포함하는 추종 에이전트의 제어 방법이 제공될 수 있다.
상기 비동기적인 스위치된 비선형성은 상기 컨센서스 추적에 따른 컨센서스 제어 영역 내에서 고려될 수 있다.
상기 제어 입력을 계산하는 단계에서, 상기 리더 에이전트로부터 상기 리더 에이전트의 속도에 대한 정보 요구 없이 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산할 수 있다.
상기 제어 입력을 계산하는 단계는, 비동기적 스위치된 비선형성에 대한 미지의 스위치된 비아핀 비선형 함수를 예측하기 위해 신경망에 기반한 함수 근사자(function approximator)를 이용하여 상기 제어 입력을 계산하되,
상기 함수 근사자는 하기 수학식으로 표현되며,
Figure 112017060602040-pat00001
여기서,
Figure 112017060602040-pat00002
이고,
Figure 112017060602040-pat00003
이며,
Figure 112017060602040-pat00004
는 f번째 추종 에이전트의 k번째 가상 제어 입력을 나타내며,
Figure 112017060602040-pat00005
는 f번째 추종 에이전트의 k번째 신경망의 예측된 가중치 벡터를 나타낸다.
본 발명의 다른 측면에 따르면, 비동기적으로 스위치된 비선형성을 가지는 멀티 에이전트 시스템으로 구성된 추종 에이전트들이 리더 에이전트를 컨센서스 추적할 수 있는 추종 에이전트의 제어 시스템이가 제공된다.
본 발명의 일 실시예에 따르면, 순-궤환 스위치된 비선형성을 포함하는 복수의 추종 에이전트에 있어서, 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 통신부; 및 상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 제어기를 포함하는 추종 에이전트가 제공될 수 있다.
본 발명의 일 실시예에 따른 추종 에이전트 및 이의 제어 방법을 제공함으로써 추종 에이전트의 비동기적으로 스위치된 비선형성을 고려하여 리더 에이전트를 컨센서스 추적할 수 있다.
도 1은 본 발명의 일 실시예에 따른 리더 에이전트를 컨센서스 추적하기 위한 추종 에이전트의 제어 방법을 나타낸 순서도.
도 2는 본 발명의 일 실시예에 따른 추종 에이전트의 내부 구성을 개략적으로 도시한 블록도.
도 3은 본 발명의 일 실시예에 따른 비동기적으로 스위치된 미지의 비선형성을 가진 추종 에이전트들에 따른 스위칭 신호를 나타낸 도면.
도 4는 도 3에 따른 스위칭 신호를 고려한 추종 에이전트에 대한 분산된 컨센서스 추적 에러를 나타낸 도면.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. 본 발명의 특징 및 이점들은 첨부 도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 발명자가 그 자신의 발명의 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다. 또한 본 발명과 관련된 공지 기능 및 그 구성에 대한 구체적인 설명은 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그 구체적인 설명을 생략하였음에 유의해야할 것이다.
도 1은 본 발명의 일 실시예에 따른 리더 에이전트를 컨센서스 추적하기 위한 추종 에이전트의 제어 방법을 나타낸 순서도이다.
본 발명의 일 실시예에 따른 시스템은 하나의 리더와 복수의 추종 에이전트로 구성되는 것을 가정하기로 한다. 또한, 이하에서 설명되는 시스템은 추종 에이전트들이 리더 에이전트를 컨센서스 추적하는 것을 가정하기로 한다.
단계 110에서 추종 에이전트는 리더 에이전트 및 이웃 에이전트 중 적어도 하나의 출력 신호를 획득한다.
하기에서 보다 상세히 설명되겠지만, 본 발명의 일 실시예에 따른 시스템에 포함되는 모든 추종 에이전트가 리더 에이전트와 통신이 가능한 것은 아니며 일부의 추종 에이전트만이 리더 에이전트와 통신이 가능한 것을 가정하기로 한다.
또한, 추종 에이전트는 인접한 다른 추종 에이전트(이하에서는 이웃 에이전트라 칭하기로함)와 통신이 가능한 것을 가정하기로 한다.
단계 115에서 추종 에이전트는 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 리더 에이전트를 컨센서스 추적시, 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 추종 에이전트를 이동시키기 위한 제어 입력을 계산한다.
본 발명의 일 실시예에 따른 시스템에 포함되는 에이전트들은 상호간 서로 다른 비동기적으로 스위치된 비선형성을 가지는 것을 가정하기로 한다. 즉, 추종 에이전트 또한 비동기 스위치된 비선형성을 가지는 것을 가정하기로 한다.
이러한 추종 에이전트의 비동기 스위치된 비선형성에 대한 미지의 스위치된 비선형 함수는 신경망에 기반한 함수 근사자(function approximator)에 의해 예측된다. 이에 대해서는 하기에서 보다 상세히 설명될 것이다.
또한, 본 발명의 일 실시예에 따른 추종 에이전트의 비동기 스위치된 비선형성은 컨센서스 추적 영역 내에서 고려될 수 있다.
단계 120에서 추종 에이전트는 계산된 제어 입력에 따라 추종 에이전트를 이동시킴으로써 리더 에이전트를 컨센서스 추적한다.
이에 대해서는 하기의 설명에 의해 보다 명확하게 이해될 것이다.
도 2는 본 발명의 일 실시예에 따른 추종 에이전트의 내부 구성을 개략적으로 도시한 블록도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 추종 에이전트는 통신부(210), 메모리(230) 및 제어기(220)를 포함하여 구성된다.
통신부(210)는 그룹에 포함되는 다른 에이전트들 중 일부와 데이터를 통신하기 위한 수단이다. 예를 들어, 그룹은 하나의 리더 에이전트와 복수의 추종 에이전트로 구성될 수 있다. 이때, 복수의 추종 에이전트는 리더 에이전트를 컨센서스 추적하는 것을 가정하기로 한다.
즉, 추종 에이전트는 리더 에이전트와 통신을 수행할 수도 있으며, 수행하지 못할 수도 있다. 또한, 추종 에이전트는 이웃 에이전트들 중 일부와 통신이 가능할 수 있다.
메모리(230)는 본 발명의 일 실시예에 따른 비동기적 스위치된 비선형성을 고려하여 리더 에이전트를 컨센서스 추적하도록 추종 에이전트를 이동시키기 위한 제어 입력을 도출하기 위해 필요한 알고리즘, 이 과정에서 파생되는 다양한 데이터 등을 저장하기 위한 수단이다.
제어기(220)는 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 추종 에이전트를 이동시키기 위한 제어 입력을 계산하기 위한 수단이다.
또한, 제어기(220)는 계산된 제어 입력에 따라 추종 에이전트를 이동시킴으로써 리더 에이전트를 컨센서스 추적할 수 있다.
이외의 상세한 설명은 하기의 설명에 의해 보다 명확하게 이해될 것이다.
본 발명의 일 실시예에 따른 멀티 에이전트 시스템은 인공적이며, 비동기적인 스위치된 비-아핀 비선형성을 포함하는 것을 가정하기로 한다. 또한, 본 발명의 일 실시예에 따른 멀티 에이전트 시스템은 분산된 적응적 컨센서스 추적을 위한 것이다.
각 추종 에이전트에 대한 스위치된 비선형성은 미지(unknown)이며, 제어 입력 내에서 매치되지 않는 것을 가정하기로 한다.
(i) 미지의 비동기적인 스위치된 비선형성을 가지는 멀티 에이전트 시스템은 우선 컨센서스 제어 영역 내에서 고려되며, 추가적으로 스위치된 비선형성은 완전하게 비-아핀 형태(non-affine form)인 것을 고려하기로 한다.
(ii) 분산된 컨센서스 추적 스킴과 비동기 스위치된 비선형 멀티-에이전트 시스템을 위한 안정성 분석은 제어 이득 함수의 부호와 리더 에이전트의 속도에 대한 정보 요구 없이 개발되는 것을 가정하기로 한다.
이를 위해, 단지 이웃 에이전트의 정보만을 사용하는 근사-기반 로컬 공통 제어기(local common controller)의 일반적인 설계 공식(universal design formula)을 구성하기 위해 공통 리아프노프 함수 방법을 컨센서스 추적 문제로 확장된다. 이는 컨센서스 추적 에러(consensus tracking error)가 점근적으로 유계되며, Lyapunov 안정성 측면에서 원점 주변으로 수렴된다. 마지막으로, 시뮬레이션 예는 본 발명의 일 실시예에 다른 이론적 결과의 유효성을 테스트하기 위해 제시된다.
임의의 연속 함수(
Figure 112017060602040-pat00006
)가 다음과 같은 조건을 만족하는 경우 누스바움 타입(Nussubaum-Type) 함수로 불린다.
Figure 112017060602040-pat00007
Figure 112017060602040-pat00008
,
Figure 112017060602040-pat00009
.
본 발명의 일 실시예에서는 상술한 조건을 만족하는 우함수(
Figure 112017060602040-pat00010
)는 추종 에이전트의 제어 이득 함수의 미지의 부호를 처리하기 위해 사용된다.
Lemma 1:
Figure 112017060602040-pat00011
Figure 112017060602040-pat00012
Figure 112017060602040-pat00013
Figure 112017060602040-pat00014
을 가지는
Figure 112017060602040-pat00015
상에서 정의된 스무스 함수(smooth function)이라고 가정하기로 한다. 또한,
Figure 112017060602040-pat00016
는 우 스무스 누스바움형 함수(even smooth nussbaum-type function)이다.
부동식
Figure 112017060602040-pat00017
Figure 112017060602040-pat00018
이 성립하면,
Figure 112017060602040-pat00019
,
Figure 112017060602040-pat00020
Figure 112017060602040-pat00021
Figure 112017060602040-pat00022
상에서 유계된다. 여기서,
Figure 112017060602040-pat00023
Figure 112017060602040-pat00024
은 양의 상수이며,
Figure 112017060602040-pat00025
은 미지의 폐쇄 구간(
Figure 112017060602040-pat00026
여기서,
Figure 112017060602040-pat00027
임)에서 값이 정해지는 시변량 파라미터(time-varying parameter)이다.
본 발명의 일 실시예에 따른 멀티 에이전트 시스템은 N개의 추종 에이전트와 하나의 리더 에이전트가 존재한다고 가정하기로 한다. 여기서, N개의 추종 에이전트는 에이전트 1에서 에이전트 N으로 통칭하기로 하며, 리더 에이전트는 에이전트 0으로 통칭하기로 한다. 또한, 멀티 에이전트 시스템에 포함된 각 에이전트는 외방향성을 가지는 네트워크를 구성하고 있는 것을 가정하기로 한다.
N개의 추종 에이전트의 동역학은 수학식 1과 같은 비동기 스위치된 불특정 순궤환 시스템에 의해 나타낼 수 있다.
<수학식 1>
Figure 112017060602040-pat00028
여기서
Figure 112017060602040-pat00029
Figure 112017060602040-pat00030
Figure 112017060602040-pat00031
Figure 112017060602040-pat00032
번째 추종 에이전트의 상태 변수이고,
Figure 112017060602040-pat00033
는 외란(external disturbance)을 나타내며,
Figure 112017060602040-pat00034
Figure 112017060602040-pat00035
Figure 112017060602040-pat00036
번째 추종 에이전트의 스위칭 모드 집합(switching mode set)을 나타내며,
Figure 112017060602040-pat00037
는 스위치될 모드의 개수를 나타낸다. 따라서
Figure 112017060602040-pat00038
Figure 112017060602040-pat00039
번째 추종 에이전트의 스위칭 모드를 나타내고, 각 추종 에이전트는 추종 에이전트들 사이에서 비동적으로 스위치되는 서로 다른 스위칭 신호(
Figure 112017060602040-pat00040
)을 가질 수 있다. 또한, 임의의
Figure 112017060602040-pat00041
이고,
Figure 112017060602040-pat00042
는 f번째 추종 에이전트상의 j번째 스위치된 부시스템의 입력을 나타낸다. 또한,
Figure 112017060602040-pat00043
는 미지의
Figure 112017060602040-pat00044
비선형 함수이다.
수학식 1의 시스템은 각 추종 에이전트들 사이의 비동기적 스위칭(
Figure 112017060602040-pat00045
)하의 이기종 스위치된 비선형성(
Figure 112017060602040-pat00046
)을 포함한다.
N개의 추종 에이전트들과 하나의 리더 에이전트에 의한 통신 토폴로지는 외방향 그래프(
Figure 112017060602040-pat00047
)로 정의될 수 있다. 여기서,
Figure 112017060602040-pat00048
는 N개의 노드 또는 정점 집합(
Figure 112017060602040-pat00049
)과 노드와 노드 사이의 연결에 대한 에지 집합(
Figure 112017060602040-pat00050
)을 포함한다.
Figure 112017060602040-pat00051
에서, 에지(
Figure 112017060602040-pat00052
)는 에이전트 f가 에이전트 l로부터 정보를 수신할 수 있으나 반대의 경우는 불가능함을 나타낸다. 노드 f의 이웃 집합은
Figure 112017060602040-pat00053
로 정의되며, 이는 노드 f로 인입되는 에지를 가지는 노드의 집합을 의미한다. 각 추종 에이전트들 사이의 통신을 설명하기 위해
Figure 112017060602040-pat00054
를 포함하는 서브 그래프가
Figure 112017060602040-pat00055
로서 정의될 수 있다.
Figure 112017060602040-pat00056
의 인접 행렬(
Figure 112017060602040-pat00057
)는
Figure 112017060602040-pat00058
이며,
Figure 112017060602040-pat00059
,
Figure 112017060602040-pat00060
이다. 만일
Figure 112017060602040-pat00061
이면,
Figure 112017060602040-pat00062
이고, 그렇지 않으면,
Figure 112017060602040-pat00063
이다.
Figure 112017060602040-pat00064
와 관련된 라플라시안 행렬(
Figure 112017060602040-pat00065
)은
Figure 112017060602040-pat00066
로 정의된다. 여기서,
Figure 112017060602040-pat00067
이면,
Figure 112017060602040-pat00068
이다. 반대로, 리더 에이전트가
Figure 112017060602040-pat00069
이고,
Figure 112017060602040-pat00070
이면, 리더 에이전트로부터 추종 에이전트로의 통신 가증치를
Figure 112017060602040-pat00071
와 같이 정의할 수 있다.
Figure 112017060602040-pat00072
Figure 112017060602040-pat00073
를 포함하는
Figure 112017060602040-pat00074
의 라플라시안 행렬을 나타낸다. 또한,
Figure 112017060602040-pat00075
는 차수 행렬(Degree matrix)
Figure 112017060602040-pat00076
의 대각선 요소를 나타낸다.
이외의 그래프 이론의 일반적인 내용은 당업자에게는 자명한 사항이며, 그래프 이론에 대한 상세 설명은 본 발명의 주요 논지와 무관하며 주요 논지의 설명을 흐릴 수 있으므로 일반적인 그래프 이론에 대한 설명은 생략하기로 한다.
Remark 1 : 스패닝 트리(spanning tree)를 포함하는 방향성을 가지는 그래프
Figure 112017060602040-pat00077
Figure 112017060602040-pat00078
조건을 만족한다.
Figure 112017060602040-pat00079
Figure 112017060602040-pat00080
을 사용하면,
Figure 112017060602040-pat00081
이 유지될 수 있다. 여기서,
Figure 112017060602040-pat00082
은 N-벡터일 수 있다.
가정 1 : 리더 에이전트의 출력 신호
Figure 112017060602040-pat00083
는 연속적이고, 유계되며,
Figure 112017060602040-pat00084
이고,
Figure 112017060602040-pat00085
이 유계되는 조건을 만족하는 f번째 추종 에이전트에서 이용 가능한 것을 가정하기로 한다. 물론, 모든 추종 에이전트들이 리더 에이전트의 출력 신호를 이용할 수 있는 것은 아니다. 즉, 추종 에이전트들 중 일부만 리더 에이전트의 출력 신호를 이용할 수 있는 것을 가정하기로 한다.
가정 2 : 비동기적으로 스위치된 비선형 함수(
Figure 112017060602040-pat00086
)는 외방향성을 가진 그래프(
Figure 112017060602040-pat00087
)에서 미지인 것을 가정하기로 한다. 여기서,
Figure 112017060602040-pat00088
이며,
Figure 112017060602040-pat00089
이다.
가정 3 :
Figure 112017060602040-pat00090
인 것을 가정하기로 한다.
Figure 112017060602040-pat00091
인 경우 이들 부호는 변경가능하며 미지인 것을 가정하기로 한다. 또한,
Figure 112017060602040-pat00092
와 같이 미지의 실상수
Figure 112017060602040-pat00093
Figure 112017060602040-pat00094
이 존재하는 것을 가정하기로 한다. 여기서,
Figure 112017060602040-pat00095
이며,
Figure 112017060602040-pat00096
이다.
가정 4 : 외란(external disturbances)
Figure 112017060602040-pat00097
Figure 112017060602040-pat00098
로 유계되는 것을 가정하기로 한다. 여기서,
Figure 112017060602040-pat00099
이고,
Figure 112017060602040-pat00100
이며,
Figure 112017060602040-pat00101
는 미지의 상수를 나타낸다.
정의 1 : 수학식 1의 추종 에이전트를 위한 분산된 컨센서스 추적 에러는 협동적, 반-전역적(semi-globally), 점근적으로 유계될 수 있다.
만일
Figure 112017060602040-pat00102
Figure 112017060602040-pat00103
에 대해 조정 가능한 상수
Figure 112017060602040-pat00104
,
Figure 112017060602040-pat00105
Figure 112017060602040-pat00106
이 존재한다면,
Figure 112017060602040-pat00107
로써,
Figure 112017060602040-pat00108
Figure 112017060602040-pat00109
이고,
Figure 112017060602040-pat00110
Figure 112017060602040-pat00111
이다. 여기서,
Figure 112017060602040-pat00112
는 초기 시간이고,
Figure 112017060602040-pat00113
이며,
Figure 112017060602040-pat00114
이다.
본 발명의 목적은 전체 폐루프 시스템내의 모든 신호가 유계되는 동안 추종 에이전트의 출력(
Figure 112017060602040-pat00115
)이 동적인 리더 에이전트의 출력(
Figure 112017060602040-pat00116
)에 동기화되도록 미지의 스위치된 비-아핀 비선형성을 가지는 수학식 1의 N개의 추종 에이전트를 위한 분산된 공통 적응적 컨센서스 추적 법칙(
Figure 112017060602040-pat00117
)을 설계하기 위한 것이다.
Remark 2: 가정 1은 리더 에이전트의 신호(
Figure 112017060602040-pat00118
)가 그룹내의 추종 에이전트의 일부에 의해 접근될 수 있으며, 컨센서스 스킴의 설계에 속도는 사용되지 않는 것을 의미한다.
(ii) 가정 2는 추종 에이전트에 대한 모든 비-아핀 비선형성은 본 발명의 일 실시예에 따른 컨센서스 추적을 구성하기 위해 요구되지 않는다는 것을 의미한다.
(iii) 가정 3은 순궤환 형태에서 수학식 1의 시스템에 대한 제어 가능성의 충분 조건에 대한 일반적인 가정이다.
특히,
Figure 112017060602040-pat00119
의 신호들은
Figure 112017060602040-pat00120
Figure 112017060602040-pat00121
으로의 유계는 미지(unknown)의 함수이다.
(iv) 가정 4는 외란은 인위적으로 커지지 않을 수 있음을 의미한다. 이는 종래의 제어 결과에서 일반적인 것이다.
Remark 3: 순-궤환 비선형 시스템은 예를 들어, 생화학 공정(biochemical processes), 선박 기동 시스템(ship maneuvering system), 연속 교반 탱크 리액터(continuous stirred tank reactor) 등의 특정 실제 시스템 등과 같은 시스템의 상태 공간 모델을 나타낸다. 예를 들어, 간단한 키(방향타)(rudder) 모델을 포함하는 선박 기동 시스템을 가정하기로 한다. 배의 속도가 변경될 때 키(방향타)의 이득과 시간 상수는 변경되고 그 결과 선박 기동 시스템은 스위치된 순-궤환 모델로 정의될 수 있다.
만일 이들 시스템이 외방향을 가진 통신망에 연결되는 경우 수학식 1의 시스템은 운용 환경에 따라 스위치된 모델 파라미터와 함수를 가지는 순-궤환 비선형 시스템을 구성하는 멀티 에이전트 시스템으로 설명할 수 있다.
Remark 4: 스위칭이 발생하지 않은 경우, 수학식 1의 시스템은 모든 비선형 멀티 에이전트 시스템의 일반적인 형태로 나타낼 수 있다. 따라서, 수학식 1에 의한 시스템은
이전 비선형 멀티 에이전트 시스템이 임의로, 비동기적으로 스위치되는 경우를 포함할 수 있으며, 이론적인 결과는 실제 응용의 다양한 분야에서 적용될 수 있다.
수학식 1의 시스템에 대한 분산된 적응적 컨센서스 추적 스킴의 설계에 관해 상세히 설명하기로 한다.
Figure 112017060602040-pat00122
의 모든 값에 대해 암시적 함수 정리와 가정 3을 적용함으로써,
Figure 112017060602040-pat00123
인 스무스 함수(
Figure 112017060602040-pat00124
)가 존재한다. 여기서,
Figure 112017060602040-pat00125
이고,
Figure 112017060602040-pat00126
이며,
Figure 112017060602040-pat00127
이다.
평균값 정리를 사용하면,
Figure 112017060602040-pat00128
Figure 112017060602040-pat00129
과 같다. 여기서,
Figure 112017060602040-pat00130
이고,
Figure 112017060602040-pat00131
이며,
Figure 112017060602040-pat00132
을 포함하는
Figure 112017060602040-pat00133
이다.
따라서, 수학식 1의 시스템은 수학식 2와 같이 다시 나타낼 수 있다.
<수학식 2>
Figure 112017060602040-pat00134
여기서
Figure 112017060602040-pat00135
이고,
Figure 112017060602040-pat00136
이다.
수학식 1에 대한 분산된 컨센서스 추적 스텝을 위한 적응적 근사화 설계는, 동역학 표면 설계를 통해 제안되었다. 이와 관련하여 비선형 파라미터화된 함수 근사기들은 설계 절차에서 유도된 미지의 비선형 함수를 근사화기 위해 사용된다. 함수 근사화기(
Figure 112017060602040-pat00137
)는 컴팩트 집합(
Figure 112017060602040-pat00138
)에 대해 충분한 정확도를 가지는 수학식 3과 같은 미지의 스무스 함수(
Figure 112017060602040-pat00139
)로 근사화될 수 있다.
<수학식 3>
Figure 112017060602040-pat00140
여기서,
Figure 112017060602040-pat00141
이고,
Figure 112017060602040-pat00142
는 근사화기의 입력 벡터를 나타내며,
Figure 112017060602040-pat00143
Figure 112017060602040-pat00144
Figure 112017060602040-pat00145
로서 정의되는 근사화기의 모든 가중치를 포함하는 최적 가중치 벡터를 나타낸다.
Figure 112017060602040-pat00146
Figure 112017060602040-pat00147
의 추정치이고,
Figure 112017060602040-pat00148
는 미지의 상수
Figure 112017060602040-pat00149
을 가진
Figure 112017060602040-pat00150
을 만족하는 재구성 오류를 나타낸다.
근사화기의 모든 가중치들을 튜닝(tuning)하기 위해
Figure 112017060602040-pat00151
중심으로 테
Figure 112017060602040-pat00152
에 대해 테일러 급수 전개를 취하면 수학식 4와 같다.
<수학식 4>
Figure 112017060602040-pat00153
여기서
Figure 112017060602040-pat00154
Figure 112017060602040-pat00155
의 예측치를 나타내며,
Figure 112017060602040-pat00156
이고,
Figure 112017060602040-pat00157
은 고차항(high order term)을 나타낸다. <수학식 4>를 <수학식 3>에 대입하면, 다음과 같다.
<수학식 5>
Figure 112017060602040-pat00158
<수학식 6>
Figure 112017060602040-pat00159
여기서.
Figure 112017060602040-pat00160
Figure 112017060602040-pat00161
는 미지의 상수이다. Radial basis function 신경망, 퍼지 신경망, 웨이블릿 신경망과 같은 다양한 신경망은 아무런 어려움 없이 함수 근사기로서 사용될 수 있다.
컨트롤러 설계를 위해, f번째 추종 에이전트에 대한 에러 표면(error surface)를
Figure 112017060602040-pat00162
라 가정하고, 바운더리 레이어 에러(boundary layer error)를
Figure 112017060602040-pat00163
가 가정하면 수하식 7 및 8과 같이 나타낼 수 있다.
<수학식 7>
Figure 112017060602040-pat00164
<수학식 8>
Figure 112017060602040-pat00165
여기서
Figure 112017060602040-pat00166
Figure 112017060602040-pat00167
번째 추종 에이전트에 대한 공통 가상 제어기를 나타내고,
Figure 112017060602040-pat00168
는 시간 상수
Figure 112017060602040-pat00169
을 가진 다음 1차 필터에 의해 얻어지는 신호이다.
<수학식 9>
Figure 112017060602040-pat00170
수학식 9는 반복되는 설계 과정에서 가상 제어 기법
Figure 112017060602040-pat00171
의 반복되는 도함수의 계산 문제를 극복하도록 구성되어있다.
로컬 정보에 기초하여,
Figure 112017060602040-pat00172
번째 추종 에이전트에 대한 분산된 공통 적응적 컨센서스 추적 스킴은 다음과 같다.
<수학식 10>
Figure 112017060602040-pat00173
<수학식 11>
Figure 112017060602040-pat00174
<수학식 12>
Figure 112017060602040-pat00175
<수학식 13>
Figure 112017060602040-pat00176
여기서
Figure 112017060602040-pat00177
Figure 112017060602040-pat00178
Figure 112017060602040-pat00179
이다.
Figure 112017060602040-pat00180
및 상수
Figure 112017060602040-pat00181
을 가진
Figure 112017060602040-pat00182
Figure 112017060602040-pat00183
및 상수
Figure 112017060602040-pat00184
을 가진
Figure 112017060602040-pat00185
Figure 112017060602040-pat00186
Figure 112017060602040-pat00187
Figure 112017060602040-pat00188
는 설계 상수이다. 여기서 함수 근사기
Figure 112017060602040-pat00189
는 각 제어기 설계 스텝에서 설명되어지는 미지의 비선형 함수
Figure 112017060602040-pat00190
를 추정하고,
Figure 112017060602040-pat00191
Figure 112017060602040-pat00192
의 추정치이다.
Figure 112017060602040-pat00193
Figure 112017060602040-pat00194
에 대한 적응 기법은 다음과 같은 미분 방정식으로 정의된다.
<수학식 14>
Figure 112017060602040-pat00195
<수학식 15>
Figure 112017060602040-pat00196
여기서
Figure 112017060602040-pat00197
Figure 112017060602040-pat00198
의 범위에서 랜덤하게 선택되고,
Figure 112017060602040-pat00199
은 튜닝 비율(tuning rate)로 나타내고,
Figure 112017060602040-pat00200
Figure 112017060602040-pat00201
Figure 112017060602040-pat00202
-수정에 대한 설계 파라미터이다.
이제 수학식 1에 대한 제안된 분산 추적 스킴을 단계적으로 제시한다.
단계
Figure 112017060602040-pat00203
: 이 단계에서, 리더 에이전트의 신호(
Figure 112017060602040-pat00204
)로 추종 에이전트의 출력(
Figure 112017060602040-pat00205
)을 유도하기 위한 분산된 제1 가상 제어기(
Figure 112017060602040-pat00206
)를 설계한다. 이 때문에 분산된 컨센서스 추적 에러
Figure 112017060602040-pat00207
를 고려한다. 수학식 2, 수학식 7 및 수학식 8에 따른
Figure 112017060602040-pat00208
의 시간 미분(time derivative)
은 수학식 16과 같이 나타낼 수 있다.
<수학식 16>
Figure 112017060602040-pat00209
제1 가상 제어기 을 설계하도록 일반적인 리아프노프 함수 후보
Figure 112017060602040-pat00211
를 고려하기로 한다. 수학식 16으로부터의 시간 도함수는 수학식 17과 같다.
<수학식 17>
Figure 112017060602040-pat00212
여기서,
Figure 112017060602040-pat00213
Figure 112017060602040-pat00214
이다,
가정 1, 가정 3 및 가정 4에 의해 수학식 18과 같은 연속 함수(continuous function)(
Figure 112017060602040-pat00215
)이 존재한다.
<수학식 18>
Figure 112017060602040-pat00216
여기서
Figure 112017060602040-pat00217
는 상수이다. 수학식 5, 수학식 6 및 수학식 18을 사용하면, 수학식 17은
Figure 112017060602040-pat00218
Figure 112017060602040-pat00219
Figure 112017060602040-pat00220
이 된다. 그런 다음, 수학식 10과 같이
Figure 112017060602040-pat00221
번째 추종 에이전트에 대한 분산된 제1 공통 가상 제어기를 설계하면, 수학식 19와 같이 나타낼 수 있다.<수학식 19>
Figure 112017060602040-pat00222
여기서
Figure 112017060602040-pat00223
및 속성
Figure 112017060602040-pat00224
Figure 112017060602040-pat00225
이 적용된다.
Remark 5: 수학식 10의 제1 공통 가상 제어기는 (i)
Figure 112017060602040-pat00226
Figure 112017060602040-pat00227
은 적응적이며, 적응 함수 근사화 기술에 의해 보상되며(수학식 10에서
Figure 112017060602040-pat00228
Figure 112017060602040-pat00229
) , (ii)
Figure 112017060602040-pat00230
의 안정성 분석을 위해 Lemma 1은 수학식 19에서 용어
Figure 112017060602040-pat00231
을 유도함으로써 사용되어 설계될 수 있다. 이 설계 개념에 따라, 누스바움형 함수
Figure 112017060602040-pat00232
을 포함하는 본 발명의 일 실시예에 따른 컨센서스 추적 스킴(수학식 10 내지 수학식 13) 아래 설계 단계에서 생성된다.
단계
Figure 112017060602040-pat00233
: 가상 제어 기법
Figure 112017060602040-pat00234
의 설계를 위해, 공통 리아프노프 함수 후보
Figure 112017060602040-pat00235
를 고려한다. 수학식 2, 수학식 7, 수학식 8 및 수학식 9에 따라
Figure 112017060602040-pat00236
을 미분하여
Figure 112017060602040-pat00237
Figure 112017060602040-pat00238
을 획득할 수 있다. 여기서,
Figure 112017060602040-pat00239
Figure 112017060602040-pat00240
이고,
Figure 112017060602040-pat00241
Figure 112017060602040-pat00242
이고,
Figure 112017060602040-pat00243
이다.
단계
Figure 112017060602040-pat00244
,1과 유사하게,
Figure 112017060602040-pat00245
Figure 112017060602040-pat00246
인 미지의 연속 함수(
Figure 112017060602040-pat00247
)가 존재한다. 여기서,
Figure 112017060602040-pat00248
인 상수이다. 수학식 5와 수학식 6을 사용함으로써 수학식 11의 가상 제어기는 수학식 20과 같이 나타낼 수 있다.
<수학식 20>
Figure 112017060602040-pat00249
여기서
Figure 112017060602040-pat00250
및 부등식
Figure 112017060602040-pat00251
Figure 112017060602040-pat00252
은 사용된다.
단계
Figure 112017060602040-pat00253
: 이 단계에서
Figure 112017060602040-pat00254
번째 추종 에이전트에 대한 실제 제어기
Figure 112017060602040-pat00255
은 일반적인 리아프노프 함수 후보
Figure 112017060602040-pat00256
을 정의함으로써 설계된다. 수학식 2, 수학식 7 및 수학식 9에 따른
Figure 112017060602040-pat00257
의 시간 도함수는
Figure 112017060602040-pat00258
Figure 112017060602040-pat00259
과 같다. 여기서,
Figure 112017060602040-pat00260
Figure 112017060602040-pat00261
이다.
Figure 112017060602040-pat00262
인 미지의 연속 함수(
Figure 112017060602040-pat00263
)가 존재한다. 여기서,
Figure 112017060602040-pat00264
은 상수이다. 수학식 5와 수학식 6을 사용하여 수학식 12와 같은 f번째 추종 에이전트에 대한 가상 제어기
Figure 112017060602040-pat00265
를 선택하면 수학식 21과 같이 나타낼 수 있다.
<수학식 21>
Figure 112017060602040-pat00266
여기서
Figure 112017060602040-pat00267
및 부등식
Figure 112017060602040-pat00268
Figure 112017060602040-pat00269
이 사용된다.
전체 폐쇄 루프 시스템의 안정성을 분석하기 위해서,
Figure 112017060602040-pat00270
Figure 112017060602040-pat00271
로 전체 일반적인 리아프노프 함수
Figure 112017060602040-pat00272
를 선택한다.
정리 1 : 비동기적으로 스위치된 비선형 멀티 에이전트 시스템(수학식 1)과 수학식 14와 수학식 15와 같은 적응 법칙을 포함하는 분산된 적응적 컨센서스 추적 스킴(수학식 10 내지 수학식 13)으로 구성되는 전체 폐쇄 루프 시스템을 고려한다. 또한, 리더 에이전트는 모든 추종 에이전트(1 내지 N)에 대한 외방향 패스(directed path)를 가지는 것을 가정하기로 한다.
Figure 112017060602040-pat00273
을 만족하는 초기 조건에 대해 전체 폐루프 시스템상의 모든 신호들은 협동적, 반전역적, 그리고 점근적으로 유계되며, 리더 에이전트와 추종 에이전트 간의 컨센서스 추정 에러는 원점 주변으로 수렴될 수 있다. 여기서,
Figure 112017060602040-pat00274
는 임의의 상수이다.
증명 : 'A. 정리 1의 증명' 참조
Remark 6 : Theorem 1의 증명에서, 컨센서스 추적 에러의 유계는 설계 파라미터
Figure 112017060602040-pat00275
,
Figure 112017060602040-pat00276
, 초기 에러(V(0)) 및
Figure 112017060602040-pat00277
의 최소 고유값(
Figure 112017060602040-pat00278
)과 관련된 파라미터(
Figure 112017060602040-pat00279
)에 종속적이다. 따라서, 컨센서스 추적 에러(
Figure 112017060602040-pat00280
)의 유계 집합(
Figure 112017060602040-pat00281
)은 이들 파라미터들을 조정함으로써 작게 줄일 수 있다.
이러한 관찰 결과에 근거하여, 다음과 같이 설계 파라미터의 선택할 수 있는 몇 가지 제안이 제시된다.:
(i)
Figure 112017060602040-pat00282
Figure 112017060602040-pat00283
를 작은 상수로 고정하며,
Figure 112017060602040-pat00284
Figure 112017060602040-pat00285
증가는 파라미터
Figure 112017060602040-pat00286
Figure 112017060602040-pat00287
의 튜닝 속도를 증가시키는데 도움이 된다. 이는
Figure 112017060602040-pat00288
를 감소시키고,
Figure 112017060602040-pat00289
을 증가시키며, 그 후 유계
Figure 112017060602040-pat00290
를 줄일 수 있다.
(ii)
Figure 112017060602040-pat00291
증가는
Figure 112017060602040-pat00292
을 증가시키는데 도움이 되며, 그러므로 유계
Figure 112017060602040-pat00293
를 줄일 수 있다.
(iii)
Figure 112017060602040-pat00294
증가(즉 통신 링크
Figure 112017060602040-pat00295
의 연결성을 증가시킨다.)는 유계
Figure 112017060602040-pat00296
를 줄이는 데 도움이 된다.
이러한 설계 파라미터의 선택은 Theorem 1을 위한 충분한 조건이나 미지의 인자
Figure 112017060602040-pat00297
Figure 112017060602040-pat00298
을 포함하므로 유계
Figure 112017060602040-pat00299
는 정확하게 계산될 수 없다. 이러한 분석 방법은 함수 근사기를 사용하는 많은 제어 결과들로부터 도출된다.
수학식 1의 비동기적으로 스위치되는 임의의 순궤환 시스템을 구성하는 하나의 리더 에이전트와 세 개의 추종 에이전트로 구성되는 하나의 그룹인 것을 가정하기로 한다. 즉,
Figure 112017060602040-pat00300
Figure 112017060602040-pat00301
Figure 112017060602040-pat00302
Figure 112017060602040-pat00303
인 것을 가정하기로 한다. 이기종의 스위치된 비선형
Figure 112017060602040-pat00304
Figure 112017060602040-pat00305
는 다음과 같이 정의된다.:
Figure 112017060602040-pat00306
Figure 112017060602040-pat00307
Figure 112017060602040-pat00308
Figure 112017060602040-pat00309
Figure 112017060602040-pat00310
Figure 112017060602040-pat00311
Figure 112017060602040-pat00312
Figure 112017060602040-pat00313
. 리더 에이전트의 출력은
Figure 112017060602040-pat00314
이다. 세 개의 추종 에이전트에 대한 초기 값은
Figure 112017060602040-pat00315
에서
Figure 112017060602040-pat00316
Figure 112017060602040-pat00317
Figure 112017060602040-pat00318
로 설정되어있다. 에이전트 간 통신 관계를 위해
Figure 112017060602040-pat00319
,
Figure 112017060602040-pat00320
,
Figure 112017060602040-pat00321
Figure 112017060602040-pat00322
을 선택한다. 웨이브렛 신경망는 함수 근사화기로 사용되며, 구조의 단순성을 위한 단일의 곱 노드로 구성된다. 제안된 분산 일치 추종 체계 <수학식 10> 내지 <수학식 15>는
Figure 112017060602040-pat00323
Figure 112017060602040-pat00324
Figure 112017060602040-pat00325
로 정의되고,
Figure 112017060602040-pat00326
Figure 112017060602040-pat00327
Figure 112017060602040-pat00328
Figure 112017060602040-pat00329
Figure 112017060602040-pat00330
Figure 112017060602040-pat00331
위로 선택된다. 도 3은 임의적 및 비동기적으로 스위치된 미지의 비선형을 가진 추종 에이전트들에 따른 스위칭 신호
Figure 112017060602040-pat00332
을 보여준다. 이러한 비동기적인 스위칭 신호 아래, 추종 에이전트들에 대한 분산 일치 추적 에러
Figure 112017060602040-pat00333
는 도 4에 도시된 바와 같다. 이러한 수치는 각 추종 에이전트들에 대한 미지의 비아핀 비선형이 임의적 및 비동기적으로 스위치되며 제어 이득 함수의 신호들이 알려지지 않았다할지라도, 폐쇄 루프 시스템의 모든 신호들은 유계되며 제안된 컨트롤러 수학식 12는 분산 일치 추적 목적을 충분히 달성한다는 것을 나타낸다.
상술한 바와 같이, 본 발명의 일 실시예에서는 외방향성이 있는 네트워크 하에 미지의 비아핀 비선형을 가진 비동기 스위치된 다개체 시스템의 분산 일치 추종을 위한 반복되는 설계 방법론을 제안했다. 본 발명의 첫 번째 기여는 일치 제어 분야에서 스위치된 비선형 추종 에이전트들의 고려하는 것이다. 각 스위치된 추종 에이전트에 대한 일반적인 로컬 컨트롤러(제어기)는 함수 근사화 기술과 일반적인 리아프노프 함수 방법을 사용함으로써 구성되었다.
정리 1의 증명
수학식 8의 바운더리 경계 에러의 동역학은 다음과 같이 나타낼 수 있다.
Figure 112017060602040-pat00334
여기서
Figure 112017060602040-pat00335
Figure 112017060602040-pat00336
Figure 112017060602040-pat00337
Figure 112017060602040-pat00338
Figure 112017060602040-pat00339
Figure 112017060602040-pat00340
Figure 112017060602040-pat00341
Figure 112017060602040-pat00342
의 시간 도함수를 각각 나타내는 연속 함수이다. 그런 다음, 적응형 기법 수학식 14 및 수학식 15를 수학식 19, 수학식 20 및 수학식 21에 대입함으로써,
Figure 112017060602040-pat00343
의 시간 도함수는
Figure 112017060602040-pat00344
Figure 112017060602040-pat00345
Figure 112017060602040-pat00346
Figure 112017060602040-pat00347
에서
Figure 112017060602040-pat00348
Figure 112017060602040-pat00349
Figure 112017060602040-pat00350
이 된다.
Figure 112017060602040-pat00351
Figure 112017060602040-pat00352
에서 집합
Figure 112017060602040-pat00353
Figure 112017060602040-pat00354
Figure 112017060602040-pat00355
및 집합
Figure 112017060602040-pat00356
Figure 112017060602040-pat00357
을 고려한다.
Figure 112017060602040-pat00358
Figure 112017060602040-pat00359
Figure 112017060602040-pat00360
Figure 112017060602040-pat00361
에서 각각 근접하다.
Figure 112017060602040-pat00362
Figure 112017060602040-pat00363
에 근접하기 때문에,
Figure 112017060602040-pat00364
는 집합
Figure 112017060602040-pat00365
의 크기를 나타내는
Figure 112017060602040-pat00366
에서
Figure 112017060602040-pat00367
Figure 112017060602040-pat00368
와 같은 상수
Figure 112017060602040-pat00369
가 존재한다.
Figure 112017060602040-pat00370
에서
Figure 112017060602040-pat00371
,
Figure 112017060602040-pat00372
Figure 112017060602040-pat00373
Figure 112017060602040-pat00374
Figure 112017060602040-pat00375
을 사용하고,
Figure 112017060602040-pat00376
Figure 112017060602040-pat00377
Figure 112017060602040-pat00378
Figure 112017060602040-pat00379
에서
Figure 112017060602040-pat00380
을 선택하면
Figure 112017060602040-pat00381
Figure 112017060602040-pat00382
가 표시된다. 이의 양쪽을 통합하는 것은
Figure 112017060602040-pat00383
Figure 112017060602040-pat00384
에서
Figure 112017060602040-pat00385
Figure 112017060602040-pat00386
을 제공한다. 보조 정리 1 및 가정 3으로부터
Figure 112017060602040-pat00387
,
Figure 112017060602040-pat00388
Figure 112017060602040-pat00389
Figure 112017060602040-pat00390
로 제한된다. 폐쇄 루프 시스템의 해결책 경계선이
Figure 112017060602040-pat00391
을 보장한다. 따라서 폐루프 시스템의 모든 신호들은 유계된다. 그런 다음,
Figure 112017060602040-pat00392
와 같은 상수
Figure 112017060602040-pat00393
가 존재한다.
Figure 112017060602040-pat00394
에서
Figure 112017060602040-pat00395
이 되는
Figure 112017060602040-pat00396
은 상수이다.
Figure 112017060602040-pat00397
Figure 112017060602040-pat00398
및 크로네커 곱(Kronecker product)
Figure 112017060602040-pat00399
Figure 112017060602040-pat00400
에서
Figure 112017060602040-pat00401
에 의해 표현될 수 있기 때문에,
Figure 112017060602040-pat00402
의 최소 고유값인
Figure 112017060602040-pat00403
에서
Figure 112017060602040-pat00404
을 얻는다. 따라서 리더와 추종 에이전트들 사이의 컨센서스 추적 에러
Figure 112017060602040-pat00405
Figure 112017060602040-pat00406
에 의해 표현되는 원점 주변으로 수렴한다.
이상에서 본 발명의 기술적 사상을 예시하기 위한 바람직한 실시예와 관련하여 설명하고 도시하였지만, 본 발명은 이와 같이 도시되고 설명된 그대로의 구 및 작용에만 국한되는 것이 아니며, 기술적 사상의 범주를 일탈함이 없이 본 발명에 대해 다수의 변경 및 수정이 가능함을 당업자들은 잘 이해할 수 있을 것이다. 따라서 그러한 모든 적절한 변경 및 수정들도 본 발명의 범위에 속하는 것으로 간주되어야할 것이다.
210: 통신부
220: 메모리
230: 제어기

Claims (11)

  1. 추종 에이전트의 제어 방법에 있어서,
    리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 단계; 및
    상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 단계를 포함하며,
    상기 제어 입력을 계산하는 단계에서,
    상기 리더 에이전트로부터 상기 리더 에이전트의 속도에 대한 정보 요구 없이 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
  2. 제1 항에 있어서,
    상기 비동기적인 스위치된 비선형성은 상기 컨센서스 추적에 따른 컨센서스 제어 영역 내에서 고려되는 것을 특징으로 하는 추종 에이전트의 제어 방법.
  3. 삭제
  4. 제1 항에 있어서,
    상기 제어 입력을 계산하는 단계는,
    비동기적 스위치된 비선형성에 대한 미지의 스위치된 비아핀 비선형 함수를 예측하기 위해 신경망에 기반한 함수 근사자(function approximator)를 이용하여 상기 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
  5. 삭제
  6. 제1 항, 제2 항 및 제4 항 중 어느 하나의 항에 따른 방법을 수행하기 위한 프로그램 코드를 기록한 컴퓨터로 판독 가능한 기록매체.
  7. 순-궤환 스위치된 비선형성을 포함하는 복수의 추종 에이전트에 있어서,
    리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 통신부; 및
    상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 제어기를 포함하며,
    상기 제어기는,
    상기 리더 에이전트의 속도에 대한 정보를 상기 리더 에이전트로부터 요구하지 않은 상태에서 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트.
  8. 삭제
  9. 제7 항에 있어서,
    상기 비동기적인 스위치된 비선형성은 상기 컨센서스 추적에 따른 컨센서스 제어 영역 내에서 고려되는 것을 특징으로 하는 추종 에이전트.
  10. 제7 항에 있어서,
    상기 복수의 에이전트는 각각 이기종의 비동기적 스위치된 비선형성을 가지는 것을 특징으로 하는 추종 에이전트.
  11. 제7 항에 있어서,
    상기 제어기는,
    비동기적 스위치된 비선형성에 대한 미지의 스위치된 비아핀 비선형 함수를 예측하기 위해 신경망에 기반한 함수 근사자(function approximator)를 이용하여 상기 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트.
KR1020170079935A 2017-06-23 2017-06-23 스위치드 추종 에이전트 및 이의 제어 방법 KR101912341B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170079935A KR101912341B1 (ko) 2017-06-23 2017-06-23 스위치드 추종 에이전트 및 이의 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170079935A KR101912341B1 (ko) 2017-06-23 2017-06-23 스위치드 추종 에이전트 및 이의 제어 방법

Publications (1)

Publication Number Publication Date
KR101912341B1 true KR101912341B1 (ko) 2018-10-26

Family

ID=64098899

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170079935A KR101912341B1 (ko) 2017-06-23 2017-06-23 스위치드 추종 에이전트 및 이의 제어 방법

Country Status (1)

Country Link
KR (1) KR101912341B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083066A (zh) * 2019-05-22 2019-08-02 杭州电子科技大学 多智能体系统的分数阶迭代控制方法
CN110196554A (zh) * 2019-05-27 2019-09-03 重庆邮电大学 一种多智能体系统的安全一致性控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101566665B1 (ko) * 2015-08-13 2015-11-06 중앙대학교 산학협력단 고차 다개체 시스템을 위한 분산 포함 제어 방법 및 그 장치
KR20170062118A (ko) * 2015-11-27 2017-06-07 광운대학교 산학협력단 n차 선형 시스템 군집의 협조 추종을 위한 분산형 제어기 및 그 제어 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101566665B1 (ko) * 2015-08-13 2015-11-06 중앙대학교 산학협력단 고차 다개체 시스템을 위한 분산 포함 제어 방법 및 그 장치
KR20170062118A (ko) * 2015-11-27 2017-06-07 광운대학교 산학협력단 n차 선형 시스템 군집의 협조 추종을 위한 분산형 제어기 및 그 제어 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hao Yang 외 1, Stabilization of Switched Nonlinear Systems With All Unstable Modes: Application to Multi-Agent Systems. IEEE Trans. on Automatic Control. 2011. 09, pp. 2230-2235.* *
Qikun Shen 외 1, Distributed command filtered backstepping consensus tracking control of nonlinear multiple-agent systems in strict-feedback form. Automatica. 2015. pp. 120-124.* *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083066A (zh) * 2019-05-22 2019-08-02 杭州电子科技大学 多智能体系统的分数阶迭代控制方法
CN110196554A (zh) * 2019-05-27 2019-09-03 重庆邮电大学 一种多智能体系统的安全一致性控制方法
CN110196554B (zh) * 2019-05-27 2022-02-18 重庆邮电大学 一种多智能体系统的安全一致性控制方法

Similar Documents

Publication Publication Date Title
Huang et al. Finite-time distributed formation control for multiple unmanned surface vehicles with input saturation
Qin et al. Distributed finite-time fault-tolerant containment control for multiple ocean bottom flying node systems with error constraints
Wu et al. Adaptive fuzzy control for full states constrained systems with nonstrict-feedback form and unknown nonlinear dead zone
Gu et al. Adaptive bounded neural network control for coordinated path-following of networked underactuated autonomous surface vehicles under time-varying state-dependent cyber-attack
Wang et al. Neural network based adaptive dynamic surface control for cooperative path following of marine surface vehicles via state and output feedback
Qin et al. The distributed adaptive finite-time chattering reduction containment control for multiple ocean bottom flying nodes
He et al. Uncertainty and disturbance estimator-based distributed synchronization control for multiple marine surface vehicles with prescribed performance
Liu et al. Robust trajectory tracking control of marine surface vessels with uncertain disturbances and input saturations
Yang et al. Time-varying formation tracking control for high-order nonlinear multi-agent systems in fixed-time framework
Dong et al. Neural-network-based adaptive output-feedback formation tracking control of USVs under collision avoidance and connectivity maintenance constraints
Babu et al. Online adaptive radial basis function networks for robust object tracking
Zou et al. Neural network-based adaptive output feedback formation control for multi-agent systems
KR101935006B1 (ko) 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법
Yang et al. Adaptive backstepping terminal sliding mode control method based on recurrent neural networks for autonomous underwater vehicle
Lin et al. Neural network-based prescribed performance adaptive finite-time formation control of multiple underactuated surface vessels with collision avoidance
KR101912341B1 (ko) 스위치드 추종 에이전트 및 이의 제어 방법
Yu et al. An observer-based adaptive neural network tracking control of robotic systems
Jiang et al. Prescribed-time distributed formation control for a class of nonlinear multi-agent systems subject to internal uncertainties and external disturbances
CN111694272B (zh) 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置
Wang et al. Iterative learning approach for consensus tracking of partial difference multi-agent systems with control delay under switching topology
Zhang et al. Fast finite-time fuzzy control for a class of nonstrict feedback systems with input quantization
Luo et al. Finite-time dynamic event-triggered consensus of multi-agent systems with mismatched disturbances based on disturbance observer
Liu et al. Event-triggered fixed-time adaptive neural formation control for underactuated ASVs with connectivity constraints and prescribed performance
Liu et al. Robust Adaptive Self‐Structuring Neural Network Bounded Target Tracking Control of Underactuated Surface Vessels
Yu et al. Bipartite containment control of nonlinear multi-agent systems with input saturation

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant