KR101912341B1

KR101912341B1 - 스위치드 추종 에이전트 및 이의 제어 방법

Info

Publication number: KR101912341B1
Application number: KR1020170079935A
Authority: KR
Inventors: 유성진
Original assignee: 중앙대학교 산학협력단
Priority date: 2017-06-23
Filing date: 2017-06-23
Publication date: 2018-10-26

Abstract

스위치드 추종 에이전트 및 이의 제어 방법이 개시된다. 추종 에이전트의 제어 방법은 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 단계; 및 상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 단계를 포함한다.

Description

스위치드 추종 에이전트 및 이의 제어 방법{Switched follower agent and control method thereof}

본 발명은 추종 에이전트 및 이의 제어 방법에 관한 것이다.

분산 일치 문제는 다개체 시스템들 간 통신 흐름 제한이 존재함에 따라 협조 제어에 대해 광범위하게 조사되었다. 이 문제들은 현재 비선형 다개체 시스템으로 확장되었다.그 중 비매칭된 비선형 다개체 시스템들은 특히 많은 실제적인 시스템에 적용될 수 있어 그에 대한 협조 제어에 대한 연구가 활발히 진행되었다. 유닛 제어 매개상수를 갖는 비선형 엄격-궤환(strict-feedback) 다개체 시스템의 일치 추종 접근법이 제안되었다. 상태 변수에 의존한 제어 매개함수을 갖는 비선형 다개체 시스템의 일치 문제 또한 연구되었다. 엄격-궤환 방식에서 시간에 따라 변하는 비선형 다개체 시스템에 대한 일치 추종 접근법이 제안되었다. 이 결과들은 최근에 비아핀(non-affine) 비선형 다개체 시스템의 분산 일치 문제로 적용되었다. 즉 스위치된 비선형 다개체 시스템에 대한 일치 문제는 아직 비스위치된 다개체 시스템과 달리 충분히 다루어지지 않았다. 추가로, 실제적인 시스템의 적용을 위해 이 문제에 대해 임의적이고 비동기적인 스위칭 신호들을 고려하는 것이 필수적이다.

한편, 최근 몇 년 동안은 단일 스위치된 시스템의 제어기 설계 및 분석에 집중적인 연구가 활발히 진행되었다. 그 중 공통 리아프노프(Common Lyapunov) 함수는 평균적인 동일 체류 시간(dwell time) 조건에 독립적인 스위칭 신호를 고려할 수 있다는 장점 때문에 특히 인기가 있다. 최근 백스텝핑 기술을 사용함으로써, 알려진 비매칭된 비선형을 가진 스위치된 시스템 제어 문제들은 다루어졌다. 이러한 결과들은 미지의 변환된 비선형 존재한다는 점에서 함수 예측 기반 적응형 제어 체계의 개발을 촉진시켰다. 하지만 스위치된 비선형 다개체 시스템의 분산 일치 제어 문제는 여전히 열려있으며, 이는 이론과 실생활 응용 프로그램에서 모두 중요하고 도전적인 것이다.

이에 본 발명은 상기와 같은 제반 사항을 고려하여 제안된 것으로, 비동기적으로 스위치된 비선형성을 가지는 멀티 에이전트 시스템에서의 리더 에이전트를 컨센서스 추적할 수 있는 추종 에이전트 및 이의 제어 방법을 제공하기 위한 것이다.

본 발명의 일 측면에 따르면, 비동기적으로 스위치된 비선형성을 가지는 멀티 에이전트 시스템으로 구성된 추종 에이전트가 리더 에이전트를 컨센서스 추적할 수 있는 추종 에이전트의 제어 방법이 제공된다.

본 발명의 일 실시예에 따르면, 추종 에이전트의 제어 방법에 있어서, 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 단계; 및 상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 단계를 포함하는 추종 에이전트의 제어 방법이 제공될 수 있다.

상기 비동기적인 스위치된 비선형성은 상기 컨센서스 추적에 따른 컨센서스 제어 영역 내에서 고려될 수 있다.

상기 제어 입력을 계산하는 단계에서, 상기 리더 에이전트로부터 상기 리더 에이전트의 속도에 대한 정보 요구 없이 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산할 수 있다.

상기 제어 입력을 계산하는 단계는, 비동기적 스위치된 비선형성에 대한 미지의 스위치된 비아핀 비선형 함수를 예측하기 위해 신경망에 기반한 함수 근사자(function approximator)를 이용하여 상기 제어 입력을 계산하되,

상기 함수 근사자는 하기 수학식으로 표현되며,

여기서,

이고,

이며,

는 f번째 추종 에이전트의 k번째 가상 제어 입력을 나타내며,

는 f번째 추종 에이전트의 k번째 신경망의 예측된 가중치 벡터를 나타낸다.

본 발명의 다른 측면에 따르면, 비동기적으로 스위치된 비선형성을 가지는 멀티 에이전트 시스템으로 구성된 추종 에이전트들이 리더 에이전트를 컨센서스 추적할 수 있는 추종 에이전트의 제어 시스템이가 제공된다.

본 발명의 일 실시예에 따르면, 순-궤환 스위치된 비선형성을 포함하는 복수의 추종 에이전트에 있어서, 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 통신부; 및 상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 제어기를 포함하는 추종 에이전트가 제공될 수 있다.

본 발명의 일 실시예에 따른 추종 에이전트 및 이의 제어 방법을 제공함으로써 추종 에이전트의 비동기적으로 스위치된 비선형성을 고려하여 리더 에이전트를 컨센서스 추적할 수 있다.

도 1은 본 발명의 일 실시예에 따른 리더 에이전트를 컨센서스 추적하기 위한 추종 에이전트의 제어 방법을 나타낸 순서도.
도 2는 본 발명의 일 실시예에 따른 추종 에이전트의 내부 구성을 개략적으로 도시한 블록도.
도 3은 본 발명의 일 실시예에 따른 비동기적으로 스위치된 미지의 비선형성을 가진 추종 에이전트들에 따른 스위칭 신호를 나타낸 도면.
도 4는 도 3에 따른 스위칭 신호를 고려한 추종 에이전트에 대한 분산된 컨센서스 추적 에러를 나타낸 도면.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. 본 발명의 특징 및 이점들은 첨부 도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 발명자가 그 자신의 발명의 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다. 또한 본 발명과 관련된 공지 기능 및 그 구성에 대한 구체적인 설명은 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그 구체적인 설명을 생략하였음에 유의해야할 것이다.

도 1은 본 발명의 일 실시예에 따른 리더 에이전트를 컨센서스 추적하기 위한 추종 에이전트의 제어 방법을 나타낸 순서도이다.

본 발명의 일 실시예에 따른 시스템은 하나의 리더와 복수의 추종 에이전트로 구성되는 것을 가정하기로 한다. 또한, 이하에서 설명되는 시스템은 추종 에이전트들이 리더 에이전트를 컨센서스 추적하는 것을 가정하기로 한다.

단계 110에서 추종 에이전트는 리더 에이전트 및 이웃 에이전트 중 적어도 하나의 출력 신호를 획득한다.

하기에서 보다 상세히 설명되겠지만, 본 발명의 일 실시예에 따른 시스템에 포함되는 모든 추종 에이전트가 리더 에이전트와 통신이 가능한 것은 아니며 일부의 추종 에이전트만이 리더 에이전트와 통신이 가능한 것을 가정하기로 한다.

또한, 추종 에이전트는 인접한 다른 추종 에이전트(이하에서는 이웃 에이전트라 칭하기로함)와 통신이 가능한 것을 가정하기로 한다.

단계 115에서 추종 에이전트는 리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 리더 에이전트를 컨센서스 추적시, 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 추종 에이전트를 이동시키기 위한 제어 입력을 계산한다.

본 발명의 일 실시예에 따른 시스템에 포함되는 에이전트들은 상호간 서로 다른 비동기적으로 스위치된 비선형성을 가지는 것을 가정하기로 한다. 즉, 추종 에이전트 또한 비동기 스위치된 비선형성을 가지는 것을 가정하기로 한다.

이러한 추종 에이전트의 비동기 스위치된 비선형성에 대한 미지의 스위치된 비선형 함수는 신경망에 기반한 함수 근사자(function approximator)에 의해 예측된다. 이에 대해서는 하기에서 보다 상세히 설명될 것이다.

또한, 본 발명의 일 실시예에 따른 추종 에이전트의 비동기 스위치된 비선형성은 컨센서스 추적 영역 내에서 고려될 수 있다.

단계 120에서 추종 에이전트는 계산된 제어 입력에 따라 추종 에이전트를 이동시킴으로써 리더 에이전트를 컨센서스 추적한다.

이에 대해서는 하기의 설명에 의해 보다 명확하게 이해될 것이다.

도 2는 본 발명의 일 실시예에 따른 추종 에이전트의 내부 구성을 개략적으로 도시한 블록도이다.

도 2를 참조하면, 본 발명의 일 실시예에 따른 추종 에이전트는 통신부(210), 메모리(230) 및 제어기(220)를 포함하여 구성된다.

통신부(210)는 그룹에 포함되는 다른 에이전트들 중 일부와 데이터를 통신하기 위한 수단이다. 예를 들어, 그룹은 하나의 리더 에이전트와 복수의 추종 에이전트로 구성될 수 있다. 이때, 복수의 추종 에이전트는 리더 에이전트를 컨센서스 추적하는 것을 가정하기로 한다.

즉, 추종 에이전트는 리더 에이전트와 통신을 수행할 수도 있으며, 수행하지 못할 수도 있다. 또한, 추종 에이전트는 이웃 에이전트들 중 일부와 통신이 가능할 수 있다.

메모리(230)는 본 발명의 일 실시예에 따른 비동기적 스위치된 비선형성을 고려하여 리더 에이전트를 컨센서스 추적하도록 추종 에이전트를 이동시키기 위한 제어 입력을 도출하기 위해 필요한 알고리즘, 이 과정에서 파생되는 다양한 데이터 등을 저장하기 위한 수단이다.

제어기(220)는 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 추종 에이전트를 이동시키기 위한 제어 입력을 계산하기 위한 수단이다.

또한, 제어기(220)는 계산된 제어 입력에 따라 추종 에이전트를 이동시킴으로써 리더 에이전트를 컨센서스 추적할 수 있다.

이외의 상세한 설명은 하기의 설명에 의해 보다 명확하게 이해될 것이다.

본 발명의 일 실시예에 따른 멀티 에이전트 시스템은 인공적이며, 비동기적인 스위치된 비-아핀 비선형성을 포함하는 것을 가정하기로 한다. 또한, 본 발명의 일 실시예에 따른 멀티 에이전트 시스템은 분산된 적응적 컨센서스 추적을 위한 것이다.

각 추종 에이전트에 대한 스위치된 비선형성은 미지(unknown)이며, 제어 입력 내에서 매치되지 않는 것을 가정하기로 한다.

(i) 미지의 비동기적인 스위치된 비선형성을 가지는 멀티 에이전트 시스템은 우선 컨센서스 제어 영역 내에서 고려되며, 추가적으로 스위치된 비선형성은 완전하게 비-아핀 형태(non-affine form)인 것을 고려하기로 한다.

(ii) 분산된 컨센서스 추적 스킴과 비동기 스위치된 비선형 멀티-에이전트 시스템을 위한 안정성 분석은 제어 이득 함수의 부호와 리더 에이전트의 속도에 대한 정보 요구 없이 개발되는 것을 가정하기로 한다.

이를 위해, 단지 이웃 에이전트의 정보만을 사용하는 근사-기반 로컬 공통 제어기(local common controller)의 일반적인 설계 공식(universal design formula)을 구성하기 위해 공통 리아프노프 함수 방법을 컨센서스 추적 문제로 확장된다. 이는 컨센서스 추적 에러(consensus tracking error)가 점근적으로 유계되며, Lyapunov 안정성 측면에서 원점 주변으로 수렴된다. 마지막으로, 시뮬레이션 예는 본 발명의 일 실시예에 다른 이론적 결과의 유효성을 테스트하기 위해 제시된다.

임의의 연속 함수(

)가 다음과 같은 조건을 만족하는 경우 누스바움 타입(Nussubaum-Type) 함수로 불린다.

,

.

본 발명의 일 실시예에서는 상술한 조건을 만족하는 우함수(

)는 추종 에이전트의 제어 이득 함수의 미지의 부호를 처리하기 위해 사용된다.

Lemma 1:

와

는

을 가지는

상에서 정의된 스무스 함수(smooth function)이라고 가정하기로 한다. 또한,

는 우 스무스 누스바움형 함수(even smooth nussbaum-type function)이다.

부동식

이 성립하면,

,

및

은

상에서 유계된다. 여기서,

과

은 양의 상수이며,

은 미지의 폐쇄 구간(

여기서,

임)에서 값이 정해지는 시변량 파라미터(time-varying parameter)이다.

본 발명의 일 실시예에 따른 멀티 에이전트 시스템은 N개의 추종 에이전트와 하나의 리더 에이전트가 존재한다고 가정하기로 한다. 여기서, N개의 추종 에이전트는 에이전트 1에서 에이전트 N으로 통칭하기로 하며, 리더 에이전트는 에이전트 0으로 통칭하기로 한다. 또한, 멀티 에이전트 시스템에 포함된 각 에이전트는 외방향성을 가지는 네트워크를 구성하고 있는 것을 가정하기로 한다.

N개의 추종 에이전트의 동역학은 수학식 1과 같은 비동기 스위치된 불특정 순궤환 시스템에 의해 나타낼 수 있다.

<수학식 1>

여기서

및

는

번째 추종 에이전트의 상태 변수이고,

는 외란(external disturbance)을 나타내며,

는

번째 추종 에이전트의 스위칭 모드 집합(switching mode set)을 나타내며,

는 스위치될 모드의 개수를 나타낸다. 따라서

는

번째 추종 에이전트의 스위칭 모드를 나타내고, 각 추종 에이전트는 추종 에이전트들 사이에서 비동적으로 스위치되는 서로 다른 스위칭 신호(

)을 가질 수 있다. 또한, 임의의

이고,

는 f번째 추종 에이전트상의 j번째 스위치된 부시스템의 입력을 나타낸다. 또한,

는 미지의

비선형 함수이다.

수학식 1의 시스템은 각 추종 에이전트들 사이의 비동기적 스위칭(

)하의 이기종 스위치된 비선형성(

)을 포함한다.

N개의 추종 에이전트들과 하나의 리더 에이전트에 의한 통신 토폴로지는 외방향 그래프(

)로 정의될 수 있다. 여기서,

는 N개의 노드 또는 정점 집합(

)과 노드와 노드 사이의 연결에 대한 에지 집합(

)을 포함한다.

에서, 에지(

)는 에이전트 f가 에이전트 l로부터 정보를 수신할 수 있으나 반대의 경우는 불가능함을 나타낸다. 노드 f의 이웃 집합은

로 정의되며, 이는 노드 f로 인입되는 에지를 가지는 노드의 집합을 의미한다. 각 추종 에이전트들 사이의 통신을 설명하기 위해

를 포함하는 서브 그래프가

로서 정의될 수 있다.

의 인접 행렬(

)는

이며,

,

이다. 만일

이면,

이고, 그렇지 않으면,

이다.

와 관련된 라플라시안 행렬(

)은

로 정의된다. 여기서,

이면,

이다. 반대로, 리더 에이전트가

이고,

이면, 리더 에이전트로부터 추종 에이전트로의 통신 가증치를

와 같이 정의할 수 있다.

는

를 포함하는

의 라플라시안 행렬을 나타낸다. 또한,

는 차수 행렬(Degree matrix)

의 대각선 요소를 나타낸다.

이외의 그래프 이론의 일반적인 내용은 당업자에게는 자명한 사항이며, 그래프 이론에 대한 상세 설명은 본 발명의 주요 논지와 무관하며 주요 논지의 설명을 흐릴 수 있으므로 일반적인 그래프 이론에 대한 설명은 생략하기로 한다.

Remark 1 : 스패닝 트리(spanning tree)를 포함하는 방향성을 가지는 그래프

는

조건을 만족한다.

을 사용하면,

이 유지될 수 있다. 여기서,

은 N-벡터일 수 있다.

가정 1 : 리더 에이전트의 출력 신호

는 연속적이고, 유계되며,

이고,

이 유계되는 조건을 만족하는 f번째 추종 에이전트에서 이용 가능한 것을 가정하기로 한다. 물론, 모든 추종 에이전트들이 리더 에이전트의 출력 신호를 이용할 수 있는 것은 아니다. 즉, 추종 에이전트들 중 일부만 리더 에이전트의 출력 신호를 이용할 수 있는 것을 가정하기로 한다.

가정 2 : 비동기적으로 스위치된 비선형 함수(

)는 외방향성을 가진 그래프(

)에서 미지인 것을 가정하기로 한다. 여기서,

이며,

이다.

가정 3 :

인 것을 가정하기로 한다.

인 경우 이들 부호는 변경가능하며 미지인 것을 가정하기로 한다. 또한,

와 같이 미지의 실상수

와

이 존재하는 것을 가정하기로 한다. 여기서,

이며,

이다.

가정 4 : 외란(external disturbances)

는

로 유계되는 것을 가정하기로 한다. 여기서,

이고,

이며,

는 미지의 상수를 나타낸다.

정의 1 : 수학식 1의 추종 에이전트를 위한 분산된 컨센서스 추적 에러는 협동적, 반-전역적(semi-globally), 점근적으로 유계될 수 있다.

만일

와

에 대해 조정 가능한 상수

,

와

이 존재한다면,

로써,

이고,

이다. 여기서,

는 초기 시간이고,

이며,

이다.

본 발명의 목적은 전체 폐루프 시스템내의 모든 신호가 유계되는 동안 추종 에이전트의 출력(

)이 동적인 리더 에이전트의 출력(

)에 동기화되도록 미지의 스위치된 비-아핀 비선형성을 가지는 수학식 1의 N개의 추종 에이전트를 위한 분산된 공통 적응적 컨센서스 추적 법칙(

)을 설계하기 위한 것이다.

Remark 2: 가정 1은 리더 에이전트의 신호(

)가 그룹내의 추종 에이전트의 일부에 의해 접근될 수 있으며, 컨센서스 스킴의 설계에 속도는 사용되지 않는 것을 의미한다.

(ii) 가정 2는 추종 에이전트에 대한 모든 비-아핀 비선형성은 본 발명의 일 실시예에 따른 컨센서스 추적을 구성하기 위해 요구되지 않는다는 것을 의미한다.

(iii) 가정 3은 순궤환 형태에서 수학식 1의 시스템에 대한 제어 가능성의 충분 조건에 대한 일반적인 가정이다.

특히,

의 신호들은

과

으로의 유계는 미지(unknown)의 함수이다.

(iv) 가정 4는 외란은 인위적으로 커지지 않을 수 있음을 의미한다. 이는 종래의 제어 결과에서 일반적인 것이다.

Remark 3: 순-궤환 비선형 시스템은 예를 들어, 생화학 공정(biochemical processes), 선박 기동 시스템(ship maneuvering system), 연속 교반 탱크 리액터(continuous stirred tank reactor) 등의 특정 실제 시스템 등과 같은 시스템의 상태 공간 모델을 나타낸다. 예를 들어, 간단한 키(방향타)(rudder) 모델을 포함하는 선박 기동 시스템을 가정하기로 한다. 배의 속도가 변경될 때 키(방향타)의 이득과 시간 상수는 변경되고 그 결과 선박 기동 시스템은 스위치된 순-궤환 모델로 정의될 수 있다.

만일 이들 시스템이 외방향을 가진 통신망에 연결되는 경우 수학식 1의 시스템은 운용 환경에 따라 스위치된 모델 파라미터와 함수를 가지는 순-궤환 비선형 시스템을 구성하는 멀티 에이전트 시스템으로 설명할 수 있다.

Remark 4: 스위칭이 발생하지 않은 경우, 수학식 1의 시스템은 모든 비선형 멀티 에이전트 시스템의 일반적인 형태로 나타낼 수 있다. 따라서, 수학식 1에 의한 시스템은

이전 비선형 멀티 에이전트 시스템이 임의로, 비동기적으로 스위치되는 경우를 포함할 수 있으며, 이론적인 결과는 실제 응용의 다양한 분야에서 적용될 수 있다.

수학식 1의 시스템에 대한 분산된 적응적 컨센서스 추적 스킴의 설계에 관해 상세히 설명하기로 한다.

의 모든 값에 대해 암시적 함수 정리와 가정 3을 적용함으로써,

인 스무스 함수(

)가 존재한다. 여기서,

이고,

이며,

이다.

평균값 정리를 사용하면,

과 같다. 여기서,

이고,

이며,

을 포함하는

이다.

따라서, 수학식 1의 시스템은 수학식 2와 같이 다시 나타낼 수 있다.

<수학식 2>

여기서

이고,

이다.

수학식 1에 대한 분산된 컨센서스 추적 스텝을 위한 적응적 근사화 설계는, 동역학 표면 설계를 통해 제안되었다. 이와 관련하여 비선형 파라미터화된 함수 근사기들은 설계 절차에서 유도된 미지의 비선형 함수를 근사화기 위해 사용된다. 함수 근사화기(

)는 컴팩트 집합(

)에 대해 충분한 정확도를 가지는 수학식 3과 같은 미지의 스무스 함수(

)로 근사화될 수 있다.

<수학식 3>

여기서,

이고,

는 근사화기의 입력 벡터를 나타내며,

는

로서 정의되는 근사화기의 모든 가중치를 포함하는 최적 가중치 벡터를 나타낸다.

는

의 추정치이고,

는 미지의 상수

을 가진

을 만족하는 재구성 오류를 나타낸다.

근사화기의 모든 가중치들을 튜닝(tuning)하기 위해

중심으로 테

에 대해 테일러 급수 전개를 취하면 수학식 4와 같다.

<수학식 4>

여기서

는

의 예측치를 나타내며,

이고,

은 고차항(high order term)을 나타낸다. <수학식 4>를 <수학식 3>에 대입하면, 다음과 같다.

<수학식 5>

<수학식 6>

여기서.

와

는 미지의 상수이다. Radial basis function 신경망, 퍼지 신경망, 웨이블릿 신경망과 같은 다양한 신경망은 아무런 어려움 없이 함수 근사기로서 사용될 수 있다.

컨트롤러 설계를 위해, f번째 추종 에이전트에 대한 에러 표면(error surface)를

라 가정하고, 바운더리 레이어 에러(boundary layer error)를

가 가정하면 수하식 7 및 8과 같이 나타낼 수 있다.

<수학식 7>

<수학식 8>

여기서

는

번째 추종 에이전트에 대한 공통 가상 제어기를 나타내고,

는 시간 상수

을 가진 다음 1차 필터에 의해 얻어지는 신호이다.

<수학식 9>

수학식 9는 반복되는 설계 과정에서 가상 제어 기법

의 반복되는 도함수의 계산 문제를 극복하도록 구성되어있다.

로컬 정보에 기초하여,

번째 추종 에이전트에 대한 분산된 공통 적응적 컨센서스 추적 스킴은 다음과 같다.

<수학식 10>

<수학식 11>

<수학식 12>

<수학식 13>

여기서

및

이다.

및 상수

을 가진

및

및 상수

을 가진

및

는 설계 상수이다. 여기서 함수 근사기

는 각 제어기 설계 스텝에서 설명되어지는 미지의 비선형 함수

를 추정하고,

는

의 추정치이다.

및

에 대한 적응 기법은 다음과 같은 미분 방정식으로 정의된다.

<수학식 14>

<수학식 15>

여기서

는

의 범위에서 랜덤하게 선택되고,

은 튜닝 비율(tuning rate)로 나타내고,

및

는

-수정에 대한 설계 파라미터이다.

이제 수학식 1에 대한 제안된 분산 추적 스킴을 단계적으로 제시한다.

단계

: 이 단계에서, 리더 에이전트의 신호(

)로 추종 에이전트의 출력(

)을 유도하기 위한 분산된 제1 가상 제어기(

)를 설계한다. 이 때문에 분산된 컨센서스 추적 에러

를 고려한다. 수학식 2, 수학식 7 및 수학식 8에 따른

의 시간 미분(time derivative)

은 수학식 16과 같이 나타낼 수 있다.

<수학식 16>

제1 가상 제어기 을 설계하도록 일반적인 리아프노프 함수 후보

를 고려하기로 한다. 수학식 16으로부터의 시간 도함수는 수학식 17과 같다.

<수학식 17>

여기서,

이다,

가정 1, 가정 3 및 가정 4에 의해 수학식 18과 같은 연속 함수(continuous function)(

)이 존재한다.

<수학식 18>

여기서

는 상수이다. 수학식 5, 수학식 6 및 수학식 18을 사용하면, 수학식 17은

이 된다. 그런 다음, 수학식 10과 같이

번째 추종 에이전트에 대한 분산된 제1 공통 가상 제어기를 설계하면, 수학식 19와 같이 나타낼 수 있다.<수학식 19>

여기서

및 속성

이 적용된다.

Remark 5: 수학식 10의 제1 공통 가상 제어기는 (i)

과

은 적응적이며, 적응 함수 근사화 기술에 의해 보상되며(수학식 10에서

과

) , (ii)

의 안정성 분석을 위해 Lemma 1은 수학식 19에서 용어

을 유도함으로써 사용되어 설계될 수 있다. 이 설계 개념에 따라, 누스바움형 함수

을 포함하는 본 발명의 일 실시예에 따른 컨센서스 추적 스킴(수학식 10 내지 수학식 13) 아래 설계 단계에서 생성된다.

단계

: 가상 제어 기법

의 설계를 위해, 공통 리아프노프 함수 후보

를 고려한다. 수학식 2, 수학식 7, 수학식 8 및 수학식 9에 따라

을 미분하여

을 획득할 수 있다. 여기서,

이고,

이다.

단계

,1과 유사하게,

인 미지의 연속 함수(

)가 존재한다. 여기서,

인 상수이다. 수학식 5와 수학식 6을 사용함으로써 수학식 11의 가상 제어기는 수학식 20과 같이 나타낼 수 있다.

<수학식 20>

여기서

및 부등식

은 사용된다.

단계

: 이 단계에서

번째 추종 에이전트에 대한 실제 제어기

은 일반적인 리아프노프 함수 후보

을 정의함으로써 설계된다. 수학식 2, 수학식 7 및 수학식 9에 따른

의 시간 도함수는

과 같다. 여기서,

이다.

인 미지의 연속 함수(

)가 존재한다. 여기서,

은 상수이다. 수학식 5와 수학식 6을 사용하여 수학식 12와 같은 f번째 추종 에이전트에 대한 가상 제어기

를 선택하면 수학식 21과 같이 나타낼 수 있다.

<수학식 21>

여기서

및 부등식

이 사용된다.

전체 폐쇄 루프 시스템의 안정성을 분석하기 위해서,

로 전체 일반적인 리아프노프 함수

를 선택한다.

정리 1 : 비동기적으로 스위치된 비선형 멀티 에이전트 시스템(수학식 1)과 수학식 14와 수학식 15와 같은 적응 법칙을 포함하는 분산된 적응적 컨센서스 추적 스킴(수학식 10 내지 수학식 13)으로 구성되는 전체 폐쇄 루프 시스템을 고려한다. 또한, 리더 에이전트는 모든 추종 에이전트(1 내지 N)에 대한 외방향 패스(directed path)를 가지는 것을 가정하기로 한다.

을 만족하는 초기 조건에 대해 전체 폐루프 시스템상의 모든 신호들은 협동적, 반전역적, 그리고 점근적으로 유계되며, 리더 에이전트와 추종 에이전트 간의 컨센서스 추정 에러는 원점 주변으로 수렴될 수 있다. 여기서,

는 임의의 상수이다.

증명 : 'A. 정리 1의 증명' 참조

Remark 6 : Theorem 1의 증명에서, 컨센서스 추적 에러의 유계는 설계 파라미터

,

, 초기 에러(V(0)) 및

의 최소 고유값(

)과 관련된 파라미터(

)에 종속적이다. 따라서, 컨센서스 추적 에러(

)의 유계 집합(

)은 이들 파라미터들을 조정함으로써 작게 줄일 수 있다.

이러한 관찰 결과에 근거하여, 다음과 같이 설계 파라미터의 선택할 수 있는 몇 가지 제안이 제시된다.:

(i)

및

를 작은 상수로 고정하며,

및

증가는 파라미터

및

의 튜닝 속도를 증가시키는데 도움이 된다. 이는

를 감소시키고,

을 증가시키며, 그 후 유계

를 줄일 수 있다.

(ii)

증가는

을 증가시키는데 도움이 되며, 그러므로 유계

를 줄일 수 있다.

(iii)

증가(즉 통신 링크

의 연결성을 증가시킨다.)는 유계

를 줄이는 데 도움이 된다.

이러한 설계 파라미터의 선택은 Theorem 1을 위한 충분한 조건이나 미지의 인자

과

을 포함하므로 유계

는 정확하게 계산될 수 없다. 이러한 분석 방법은 함수 근사기를 사용하는 많은 제어 결과들로부터 도출된다.

수학식 1의 비동기적으로 스위치되는 임의의 순궤환 시스템을 구성하는 하나의 리더 에이전트와 세 개의 추종 에이전트로 구성되는 하나의 그룹인 것을 가정하기로 한다. 즉,

및

인 것을 가정하기로 한다. 이기종의 스위치된 비선형

및

는 다음과 같이 정의된다.:

및

. 리더 에이전트의 출력은

이다. 세 개의 추종 에이전트에 대한 초기 값은

에서

및

로 설정되어있다. 에이전트 간 통신 관계를 위해

,

및

을 선택한다. 웨이브렛 신경망는 함수 근사화기로 사용되며, 구조의 단순성을 위한 단일의 곱 노드로 구성된다. 제안된 분산 일치 추종 체계 <수학식 10> 내지 <수학식 15>는

로 정의되고,

는

및

위로 선택된다. 도 3은 임의적 및 비동기적으로 스위치된 미지의 비선형을 가진 추종 에이전트들에 따른 스위칭 신호

을 보여준다. 이러한 비동기적인 스위칭 신호 아래, 추종 에이전트들에 대한 분산 일치 추적 에러

는 도 4에 도시된 바와 같다. 이러한 수치는 각 추종 에이전트들에 대한 미지의 비아핀 비선형이 임의적 및 비동기적으로 스위치되며 제어 이득 함수의 신호들이 알려지지 않았다할지라도, 폐쇄 루프 시스템의 모든 신호들은 유계되며 제안된 컨트롤러 수학식 12는 분산 일치 추적 목적을 충분히 달성한다는 것을 나타낸다.

상술한 바와 같이, 본 발명의 일 실시예에서는 외방향성이 있는 네트워크 하에 미지의 비아핀 비선형을 가진 비동기 스위치된 다개체 시스템의 분산 일치 추종을 위한 반복되는 설계 방법론을 제안했다. 본 발명의 첫 번째 기여는 일치 제어 분야에서 스위치된 비선형 추종 에이전트들의 고려하는 것이다. 각 스위치된 추종 에이전트에 대한 일반적인 로컬 컨트롤러(제어기)는 함수 근사화 기술과 일반적인 리아프노프 함수 방법을 사용함으로써 구성되었다.

정리 1의 증명

수학식 8의 바운더리 경계 에러의 동역학은 다음과 같이 나타낼 수 있다.

여기서

및

은

및

의 시간 도함수를 각각 나타내는 연속 함수이다. 그런 다음, 적응형 기법 수학식 14 및 수학식 15를 수학식 19, 수학식 20 및 수학식 21에 대입함으로써,

의 시간 도함수는

및

에서

이 된다.

및

에서 집합

및 집합

을 고려한다.

및

는

및

에서 각각 근접하다.

가

에 근접하기 때문에,

는 집합

의 크기를 나타내는

에서

의

와 같은 상수

가 존재한다.

에서

,

및

을 사용하고,

및

에서

을 선택하면

가 표시된다. 이의 양쪽을 통합하는 것은

에서

을 제공한다. 보조 정리 1 및 가정 3으로부터

,

및

는

로 제한된다. 폐쇄 루프 시스템의 해결책 경계선이

을 보장한다. 따라서 폐루프 시스템의 모든 신호들은 유계된다. 그런 다음,

와 같은 상수

가 존재한다.

에서

이 되는

은 상수이다.

가

및 크로네커 곱(Kronecker product)

및

에서

에 의해 표현될 수 있기 때문에,

의 최소 고유값인

에서

을 얻는다. 따라서 리더와 추종 에이전트들 사이의 컨센서스 추적 에러

은

에 의해 표현되는 원점 주변으로 수렴한다.

이상에서 본 발명의 기술적 사상을 예시하기 위한 바람직한 실시예와 관련하여 설명하고 도시하였지만, 본 발명은 이와 같이 도시되고 설명된 그대로의 구 및 작용에만 국한되는 것이 아니며, 기술적 사상의 범주를 일탈함이 없이 본 발명에 대해 다수의 변경 및 수정이 가능함을 당업자들은 잘 이해할 수 있을 것이다. 따라서 그러한 모든 적절한 변경 및 수정들도 본 발명의 범위에 속하는 것으로 간주되어야할 것이다.

210: 통신부
220: 메모리
230: 제어기

Claims

추종 에이전트의 제어 방법에 있어서,
리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 단계; 및
상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 단계를 포함하며,
상기 제어 입력을 계산하는 단계에서,
상기 리더 에이전트로부터 상기 리더 에이전트의 속도에 대한 정보 요구 없이 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
제1 항에 있어서,
상기 비동기적인 스위치된 비선형성은 상기 컨센서스 추적에 따른 컨센서스 제어 영역 내에서 고려되는 것을 특징으로 하는 추종 에이전트의 제어 방법.
삭제
제1 항에 있어서,
상기 제어 입력을 계산하는 단계는,
비동기적 스위치된 비선형성에 대한 미지의 스위치된 비아핀 비선형 함수를 예측하기 위해 신경망에 기반한 함수 근사자(function approximator)를 이용하여 상기 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트의 제어 방법.
삭제
제1 항, 제2 항 및 제4 항 중 어느 하나의 항에 따른 방법을 수행하기 위한 프로그램 코드를 기록한 컴퓨터로 판독 가능한 기록매체.
순-궤환 스위치된 비선형성을 포함하는 복수의 추종 에이전트에 있어서,
리더 에이전트 및 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 획득하는 통신부; 및
상기 리더 에이전트 및 상기 이웃 에이전트 중 적어도 하나에 대한 출력 신호를 이용하여 상기 리더 에이전트를 컨센서스 추적함에 있어, 상기 추종 에이전트의 비동기적인 스위치된 비선형성을 고려하여 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 제어기를 포함하며,
상기 제어기는,
상기 리더 에이전트의 속도에 대한 정보를 상기 리더 에이전트로부터 요구하지 않은 상태에서 상기 추종 에이전트가 상기 리더 에이전트를 컨센서스 추적하도록 상기 추종 에이전트를 이동시키기 위한 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트.
삭제
제7 항에 있어서,
상기 비동기적인 스위치된 비선형성은 상기 컨센서스 추적에 따른 컨센서스 제어 영역 내에서 고려되는 것을 특징으로 하는 추종 에이전트.
제7 항에 있어서,
상기 복수의 에이전트는 각각 이기종의 비동기적 스위치된 비선형성을 가지는 것을 특징으로 하는 추종 에이전트.
제7 항에 있어서,
상기 제어기는,
비동기적 스위치된 비선형성에 대한 미지의 스위치된 비아핀 비선형 함수를 예측하기 위해 신경망에 기반한 함수 근사자(function approximator)를 이용하여 상기 제어 입력을 계산하는 것을 특징으로 하는 추종 에이전트.