KR102166387B1 - 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법 - Google Patents

미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법 Download PDF

Info

Publication number
KR102166387B1
KR102166387B1 KR1020190053847A KR20190053847A KR102166387B1 KR 102166387 B1 KR102166387 B1 KR 102166387B1 KR 1020190053847 A KR1020190053847 A KR 1020190053847A KR 20190053847 A KR20190053847 A KR 20190053847A KR 102166387 B1 KR102166387 B1 KR 102166387B1
Authority
KR
South Korea
Prior art keywords
missile
control
flight
compensation function
target
Prior art date
Application number
KR1020190053847A
Other languages
English (en)
Inventor
김기응
강민구
Original Assignee
국방과학연구소
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국방과학연구소, 한국과학기술원 filed Critical 국방과학연구소
Priority to KR1020190053847A priority Critical patent/KR102166387B1/ko
Application granted granted Critical
Publication of KR102166387B1 publication Critical patent/KR102166387B1/ko

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F42AMMUNITION; BLASTING
    • F42BEXPLOSIVE CHARGES, e.g. FOR BLASTING, FIREWORKS, AMMUNITION
    • F42B15/00Self-propelled projectiles or missiles, e.g. rockets; Guided missiles
    • F42B15/01Arrangements thereon for guidance or control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41GWEAPON SIGHTS; AIMING
    • F41G7/00Direction control systems for self-propelled missiles
    • F41G7/001Devices or systems for testing or checking
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41GWEAPON SIGHTS; AIMING
    • F41G7/00Direction control systems for self-propelled missiles
    • F41G7/20Direction control systems for self-propelled missiles based on continuous observation of target position

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Aiming, Guidance, Guns With A Light Source, Armor, Camouflage, And Targets (AREA)

Abstract

본 명세서는 미사일의 비행 제어 결과에 따른 보상 함수를 연산하고, 이전 비행 제어에 대한 제어 데이터를 근거로 상기 보상 함수에 따른 최적의 보상 조건을 판단하여, 판단 결과에 따라 미사일이 비행하도록 제어함으로써, 데이터를 기반으로 한 강화 학습 방식으로 미사일의 비행을 제어하는 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법에 관한 것이다.

Description

미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법{APPARATUS FOR CONTROLLING MISSILE, SYSTEM FOR CONTROLLING MISSILE AND METHOD FOR CONTROLLING MISSILE}
본 발명은 타겟을 추종하는 미사일을 데이터 기반의 강화 학습 방식으로 제어하는 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법에 관한 것이다.
본 발명의 배경이 되는 기술은, 미사일이 타겟을 추종하여 비행하도록 제어하는 기술에 관한 것이다.
기존의 미사일의 타겟 추종 제어는, 미사일이 타겟을 추종하는 시스템을 모델링하여, 모델링한 모델을 기반으로 미사일의 비행을 제어하는 방식으로 이루어졌다. 이러한 기존의 모델 기반 제어 기법에서는 Proportional Navigation (PN) Guidance 를 위한 미사일의 측 방향 가속도 명령 (lateral acceleration command) 신호가 외부 제어 루프에서 생성되고, 이 측 방향 가속도 명령을 추종하기 위한 제어 신호는 내부 제어 루프에서 생성된다. 이러한 제어기는, 비선형 미사일 모델을 관심있는 평형점(equilibrium points)들 주변에서 선형화하는 과정을 거친 후, 선형 제어기 이론(Linear System Control Theory)에 기반하여 생성된다.
높은 추종 성능을 가지는 제어기 설계를 위해서는 높은 정확도를 가진 미사일 시스템의 수학적 모델을 필요로 하게 된다. 그러나, 높은 정확도의 시스템 모델을 얻기 위해서는 해당 분야의 전문 지식이 요구되며, 모델의 복잡성으로 인해 설계의 복잡성 또한 증가하게 된다. 또한, 비선형 시스템을 선형 시스템으로 근사화하는 과정에서 모델링 에러가 발생하게 될 우려가 있는데, 이 경우 에러에 따른 오차로 인해 제어의 정확성이 떨어지게 될 수 있다.
즉, 종래의 모델 기반 제어 기법은, 모델의 높은 정확도가 요구되어 모델의 복잡성이 증가할 수 밖에 없었으며, 이로 인해 제어 설계 자체가 어렵게 이루어질 수 밖에 없었다. 또한, 시스템을 모델화하여 제어하는 방식의 특성상, 모델을 기반으로 설계된 제어기가 다양한 환경/상황 각각에 정확하고 적절하게 적용되기 어려운 점이 있었으며, 이로 인해 다양한 상황에서의 추종 제어의 정확성이 확실하게 보장되지 못하는 한계가 있었다.
따라서, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 상술한 바와 같은 종래기술의 한계를 개선하는 것을 과제로 한다.
구체적으로는, 종래의 모델 기반 제어 기법의 한계인 제어 설계의 어려움을 개선할 수 있는 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법을 제공하고자 한다.
또한, 미사일의 타겟 추종을 위한 제어의 정확성 및 제어 성능을 향상시킬 수 있는 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법을 제공하고자 한다.
아울러, 제어 대상 및 제어 상황에 따른 적절하고 효과적인 타겟 추종 제어가 이루어질 수 있는 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법을 제공하고자 한다.
상술한 바와 같은 과제를 해결하기 위한 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 데이터 기반의 강화 학습 방식을 기반으로 미사일의 타겟 추종을 제어하는 것을 해결 수단으로 한다.
구체적으로는, 미사일의 제어에 적절한 보상 함수를 적용하여, 상기 보상 함수에 따라 미사일이 최적의 보상 조건으로 비행하도록 제어하게 되는 것을 기술적 특징으로 한다.
보다 상세하게는, 이전 비행 제어의 결과에 대한 제어 데이터를 기반으로 상기 보상 함수에 따른 보상값이 최대가 되는 결과를 학습하여, 학습 결과에 따라 미사일의 비행을 제어하게 됨으로써, 최적의 보상 조건에 따른 비행 제어가 이루어지게 된다.
즉, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 미사일의 비행 제어 결과에 따른 보상 함수를 연산하여, 기저장된 제어 데이터 및 상기 보상 함수를 근거로 미사일이 최적의 보상 조건으로 비행하도록 제어하게 됨으로써, 데이터를 기반으로 한 강화 학습 기반의 미사일 제어가 이루어지게 되어, 상술한 바와 같은 과제를 해결하게 된다.
상술한 바와 같은 기술적 특징을 과제 해결 수단으로 하는 본 발명에 따른 미사일 제어 장치는, 타겟을 추종하는 미사일을 제어하는 미사일 제어 장치로, 상기 미사일과 통신하며 상기 미사일의 비행 제어에 대한 정보를 송수신하는 통신부, 상기 미사일의 이전 비행 제어에 대한 제어 데이터를 저장하는 저장부 및 상기 미사일의 상태에 대한 포텐셜 함수를 근거로 상기 비행 제어의 결과에 대한 보상 함수를 연산하여, 상기 보상 함수를 근거로 상기 미사일이 상기 타겟을 추종하여 비행하도록 상기 미사일의 비행을 제어하는 제어부를 포함하고, 상기 제어부는, 상기 미사일이 상기 타겟을 추종하도록 제어하는 동안, 상기 제어 데이터를 근거로 상기 보상 함수에 따른 보상값이 최대가 되는 결과를 판단하여, 판단 결과에 따라 상기 미사일의 비행을 제어한다.
일 실시 예에서, 상기 제어부는, 상기 미사일의 비행 중 실시간으로 상기 보상값이 최대가 되는 결과를 판단하여, 판단 결과에 따라 상기 미사일의 비행을 제어할 수 있다.
일 실시 예에서, 상기 제어부는, 상기 미사일이 상기 타겟에 충돌할 때까지 상기 판단 결과에 따라 상기 미사일의 비행을 제어할 수 있다.
일 실시 예에서, 상기 보상 함수는, 상기 비행 제어의 결과에 따른 상기 미사일과 상기 타겟 간의 거리에 대한 함수일 수 있다.
일 실시 예에서, 상기 제어부는, 기설정된 연산 기준에 따라 상기 포텐셜 함수로부터 상기 보상 함수를 연산할 수 있다.
일 실시 예에서, 상기 연산 기준은, 상기 포텐셜 함수를 근사화하는 제1 과정, 상기 제1 과정의 결과를 에너지 함수 형태로 변환하는 제2 과정, 상기 제2 과정의 결과를 유한 차분법에 따라 근사화하는 제3 과정, 상기 제3 과정의 결과를 체인룰에 따라 전개하는 제4 과정 및 상기 제4 과정의 결과를 상기 미사일과 상기 타겟 간의 거리 함수 형태로 변환하는 제5 과정 순으로 상기 보상 함수를 연산하는 기준일 수 있다.
일 실시 예에서, 상기 보상 함수는,
Figure 112019047063059-pat00001
이고, 상기
Figure 112019047063059-pat00002
는, 상기 미사일의 상태를 나타내는 변수이고, 상기 at는, 상기 미사일의 시각 t에서의 동작을 나타내는 변수일 수 있다.
일 실시 예에서, 상기 제어부는, 상기 미사일의 비행을 제어하는 회차에 따라 상기 보상 함수의 절대값이 증가하도록 상기 미사일의 비행을 제어할 수 있다.
일 실시 예에서, 상기 제어부는, 상기 보상 함수의 절대값이 이전 제어 시의 절대값 이상이 되도록 상기 보상값이 최대가 되는 결과를 판단할 수 있다.
또한, 상술한 바와 같은 기술적 특징을 과제 해결 수단으로 하는 본 발명에 따른 미사일 제어 시스템은, 타겟을 추종하는 미사일 및 상기 미사일의 비행 제어에 대한 제어 신호를 생성하여 상기 미사일에 송신하는 미사일 제어 장치를 포함하는 미사일 제어 시스템으로, 상기 제어 장치는, 상기 미사일의 상태에 대한 포텐셜 함수를 근거로 상기 비행 제어의 결과에 대한 보상 함수를 연산하고, 상기 미사일의 이전 비행 제어에 대한 기저장된 제어 데이터를 근거로 상기 보상 함수의 절대값이 최대가 되는 제어값을 학습하여, 학습 결과에 따른 상기 제어값에 따라 상기 제어 신호를 생성한다.
일 실시 예에서, 상기 제어 장치는, 상기 미사일의 비행을 제어하는 제어 장치로, 상기 미사일의 비행 제어에 대한 제어 신호를 상기 미사일에 송신하는 통신부, 상기 미사일의 이전 비행 제어에 대한 제어 데이터를 저장하는 저장부 및 상기 미사일이 상기 타겟을 추종하여 비행하도록 상기 제어 신호를 생성하여 상기 미사일의 비행을 제어하는 제어부를 포함할 수 있다.
일 실시 예에서, 상기 제어 장치는, 상기 미사일의 비행 중 실시간으로 상기 제어 신호를 생성할 수 있다.
일 실시 예에서, 상기 제어 장치는, 상기 미사일이 상기 타겟에 충돌할 때까지 상기 제어 신호를 복수 회 생성하여 상기 미사일의 비행을 제어할 수 있다.
일 실시 예에서, 상기 보상 함수는, 상기 비행 제어의 결과에 따른 상기 미사일과 상기 타겟 간의 거리에 대한 함수일 수 있다.
일 실시 예에서, 상기 제어 장치는, 기설정된 연산 기준에 따라 상기 포텐셜 함수로부터 상기 보상 함수를 연산할 수 있다.
일 실시 예에서, 상기 연산 기준은, 상기 포텐셜 함수를 근사화하는 제1 과정, 상기 제1 과정의 결과를 에너지 함수 형태로 변환하는 제2 과정, 상기 제2 과정의 결과를 유한 차분법에 따라 근사화하는 제3 과정, 상기 제3 과정의 결과를 체인룰에 따라 전개하는 제4 과정 및 상기 제4 과정의 결과를 상기 미사일과 상기 타겟 간의 거리 함수 형태로 변환하는 제5 과정 순으로 상기 보상 함수를 연산할 수 있다.
일 실시 예에서, 상기 보상 함수는,
Figure 112019047063059-pat00003
이고, 상기
Figure 112019047063059-pat00004
는, 상기 미사일의 상태를 나타내는 변수이고, 상기 at는, 상기 미사일의 시각 t에서의 동작을 나타내는 변수일 수 있다.
일 실시 예에서, 상기 제어 장치는, 상기 제어 신호의 생성 회차에 따라 상기 보상 함수의 절대값이 증가하도록 상기 제어값을 학습할 수 있다.
일 실시 예에서, 상기 제어 장치는, 상기 보상 함수의 절대값이 이전 제어 신호 생성 시의 절대값 이상이 되도록 상기 제어값을 학습할 수 있다.
또한, 상술한 바와 같은 기술적 특징을 과제 해결 수단으로 하는 본 발명에 따른 미사일 제어 방법은, 타겟을 추종하는 미사일을 제어하는 미사일 제어 방법으로, 상기 미사일을 제어하기 위한 제어 기준을 설정하는 단계, 상기 미사일의 포텐셜 함수를 근거로 상기 미사일과 상기 타겟 간의 거리에 대한 보상 함수를 연산하는 단계 및 상기 제어 기준에 상기 보상 함수를 반영한 결과를 근거로 상기 미사일을 제어하는 단계를 포함한다.
일 실시 예에서, 상기 제어 방법은, 상기 미사일이 상기 타겟에 충돌할 때까지, 상기 미사일의 비행 중 실시간으로 상기 미사일을 제어할 수 있다.
일 실시 예에서, 상기 보상 함수를 연산하는 단계는, 상기 포텐셜 함수를 근사화하는 제1 단계, 상기 제1 단계의 결과를 에너지 함수 형태로 변환하는 제2 단계, 상기 제2 단계의 결과를 유한 차분법에 따라 근사화하는 제3 단계, 상기 제3 단계의 결과를 체인룰에 따라 전개하는 제4 단계 및 상기 제4 단계의 결과를 상기 미사일과 상기 타겟 간의 거리 함수 형태로 변환하여 상기 보상 함수를 연산하는 제5 단계를 포함할 수 있다.
일 실시 예에서, 상기 미사일을 제어하는 단계는, 기저장된 제어 데이터를 근거로 상기 보상 함수가 최대가 되는 제어값을 연산하는 단계 및 상기 제어값을 상기 제어 기준에 적용한 결과에 따라 상기 미사일의 제어를 수행하는 단계를 포함할 수 있다.
일 실시 예에서, 상기 미사일을 제어하는 단계는, 상기 미사일이 상기 타겟에 충돌할 때까지 상기 제어값을 연산하는 단계 및 상기 미사일의 제어를 수행하는 단계를 반복할 수 있다.
일 실시 예에서, 상기 제어값을 연산하는 단계는, 상기 제어값의 연산 회차에 따라 상기 보상 함수의 절대값이 증가하도록 상기 제어값을 연산할 수 있다.
상술한 바와 같은 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법의 실시 예들은, 각 실시 예들이 하나 이상 조합되어 실시될 수 있고, 또한 각 실시 예들이 독립적으로 실시될 수도 있다.
또한, 상술한 바와 같은 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법의 실시 예들은, 각 실시 예들이 포함하고 있는 구성 또는 단계의 일부가 독립적으로 구현되거나 조합되어 구현될 수도 있다.
본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 미사일의 제어에 적절한 보상 함수를 적용하여, 미사일이 최적의 보상 조건으로 비행하도록 제어함으로써, 미사일의 타겟을 추종하기 위한 제어의 구조가 간소화될 수 있는 효과가 있다.
이에 따라, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 미사일의 타겟을 추종하기 위한 제어 설계가 용이하게 이루어질 수 있게 되는 효과가 있다.
또한, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 보상 함수를 통해 미사일이 최적의 보상 조건으로 비행하도록 제어함으로써, 미사일의 타겟을 추종하기 위한 제어 설계가 용이하게 이루어질 수 있게 됨은 물론, 미사일의 타겟 추종 및 타겟 추종의 제어가 정확하고 효과적으로 이루어질 수 있게 되는 효과가 있다.
이로 인해, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 설계의 구조가 간소화됨과 동시에, 추종 제어의 정확성이 향상되어 미사일 제어의 성능을 향상시키게 될 수 있는 효과가 있다.
아울러, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 모델의 특정 없이 보상 함수를 통한 강화 학습 기반의 제어가 이루어지게 됨으로써, 다양한 환경/상황에 제어 방식을 적용할 수 있게 되는 효과가 있다.
즉, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 별도의 모델링 과정 및 모델링 결과를 근거로 제어 구조를 설계하는 과정 없이 미사일 제어가 이루어질 수 있으며, 또한 다양한 환경/상황에서 미사일 제어가 정확하게 이루어질 수 있게 되어, 미사일의 타겟 추종을 위한 제어 기술의 적용성, 활용성, 효용성 및 호환성이 증대될 수 있게 되는 효과가 있다.
결과적으로, 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법은, 상술한 바와 같은 효과들을 통해, 미사일 제어 기술 분야의 전통적 제어 방식에 따른 한계를 개선함은 물론, 데이터 기반의 강화 학습 방식을 기반으로 한 미사일 제어 기술의 발전을 촉진시킬 수 있게 되는 효과가 있다.
도 1a는 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법이 실시되는 미사일 제어 개념을 나타낸 개념도.
도 1b는 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법의 타겟 예시를 나타낸 예시도.
도 2는 본 발명에 따른 미사일 제어 장치의 구성을 나타낸 구성도.
도 3은 본 발명에 따른 미사일 제어 장치의 보상 함수를 연산하는 과정을 나타낸 블록도.
도 4는 본 발명에 따른 미사일 제어 장치의 보상 함수 및 제어 데이터를 근거로 한 미사일 제어 과정을 나타낸 블록도.
도 5는 본 발명에 따른 미사일 제어 장치의 보상 함수에 따른 미사일 제어 결과를 나타낸 예시도.
도 6은 본 발명에 따른 미사일 제어 시스템의 구성을 나타낸 구성도.
도 7은 본 발명에 따른 미사일 제어 시스템의 타겟 추종 제어 개념을 나타낸 개념도.
도 8은 본 발명에 따른 미사일 제어 방법의 순서를 나타낸 순서도.
도 9는 본 발명에 따른 미사일 제어 방법의 구체적인 순서를 나타낸 순서도.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예들을 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
또한, 본 명세서에 개시된 기술을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 기술의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 기술의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 그 기술의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.
먼저, 본 발명에 따른 미사일 제어 장치(이하, 제어 장치라 칭한다)를 설명한다.
상기 제어 장치(100)는, 도 1a에 도시된 바와 같이 타겟(T)을 추종하여 비행하는 미사일(10)을 제어하는 장치를 의미한다.
상기 타겟(T)은, 상기 미사일(10)의 타격 대상을 의미한다.
상기 타격 대상은, 차량, 선박, 미사일, 비행체, 이동체, 지형, 지물, 구조물, 또는 시설물 등 상기 미사일(10)이 타격할 수 있는 모든 대상물 중 하나 이상일 수 있다.
예를 들면, 도 1b에 도시된 바와 같이, 미사일(a), 전투기(b), 헬기(c), 선박(d), 차량(e) 및 탱크(f) 등을 비롯한 이동체일 수 있다.
이에 따라, 상기 타겟(T)은, 도 1b에 도시된 바와 같은 이동체 중 어느 하나일 수 있으며, 또는 하나 이상을 포함할 수도 있다.
상기 타겟(T)은, 바람직하게는 비행체일 수 있다.
이러한 이동체를 타격 대상으로 하는 상기 미사일(10)은, 이동이 이루어지는 상기 타격 대상을 공격하기 위한 무기일 수 있다.
상기 미사일(10)은, 비행을 통해 상기 타겟(T)을 타격하는 무기일 수 있다.
이를테면, 상기 타격 대상이 특정 목표 지점을 공격하기 위한 미사일인 경우, 상기 타격 대상을 요격하는 무기일 수 있다.
상기 미사일(10)은, 상기 타겟(T)을 타격하도록 상기 타겟(T)을 추종하여 비행할 수 있다.
상기 미사일(10)은, 상기 제어 장치(100)에 의해 제어될 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)을 제어하는 제어 수단일 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)에 포함되거나, 또는 상기 미사일(10)과 분리된 모듈 형태로 이루어져, 상기 미사일(10)을 제어할 수 있다.
상기 제어 장치(100)가 상기 미사일(10)에 포함되는 경우, 상기 제어 장치(100)는 상기 미사일(10)에 포함된 비행 제어 장치이거나, 또는 상기 비행 제어 장치에 포함된 제어 모듈일 수 있다.
상기 제어 장치(100)가 상기 미사일(10)의 외부에 형성된 모듈인 경우, 상기 제어 장치(100)는, 상기 미사일(10)을 원격에서 제어하는 원격 제어 장치이거나, 또는 상기 원격 제어 장치에 포함된 미사일 제어 전용 모듈일 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 미사일(10)을 제어할 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 상기 미사일(10)의 비행을 제어할 수 있다.
이를테면, 상기 미사일(10)의 비행 중 상기 미사일(10)의 비행 경로를 제어하거나, 상기 미사일(10)이 지령 경로로 비행하도록 상기 미사일(10)의 비행을 제어하여, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하게 될 수 있다.
이처럼 상기 타겟(T)을 추종하도록 상기 미사일(10)을 제어하는 상기 제어 장치(100)는, 도 2에 도시된 바와 같이, 통신부(110), 상기 저장부(120) 및 상기 제어부(130)를 포함한다.
상기 통신부(110)는, 외부의 통신 대상 장치와의 통신을 수행하는 통신 모듈일 수 있다.
상기 통신부(110)는, 유무선 통신 방식으로 하나 이상의 상기 통신 대상 장치와 통신할 수 있다.
여기서, 상기 통신 대상 장치는, 상기 미사일(10), 또는 상기 미사일(10)에 포함된 통신 모듈을 포함할 수 있다.
즉, 상기 통신부(110)는, 상기 미사일(10)과의 통신을 수행할 수 있다.
상기 통신부(110)는, 상기 미사일(10)을 포함하는 하나 이상의 통신 대상 장치와 통신할 수 있다.
상기 통신부(110)는, 상기 미사일(10)과 통신하며 상기 미사일(10)의 비행 제어에 대한 정보를 송수신한다.
이를테면, 상기 미사일(10)에 상기 비행 제어에 대한 제어 명령을 송신하거나, 상기 미사일(10)로부터 비행 상태에 대한 비행 정보를 수신할 수 있다.
여기서, 상기 비행 제어에 대한 제어 명령은, 상기 제어부(130)가 상기 미사일(10)의 비행을 제어하기 위한 제어 신호로, 상기 미사일(10)의 비행 궤도, 속도, 자세 및 방향 중 하나 이상에 대한 지령이 포함될 수 있다.
상기 통신부(110)는, 상기 제어부(130)의 제어에 의해 상기 미사일(10)과 통신하여, 상기 제어 명령을 상기 미사일(10)에 송신할 수 있다.
상기 통신부(110)는 또한, 상기 미사일(10)로부터 상기 비행 정보를 수신할 수 있다.
상기 비행 정보는, 상기 미사일(10)의 비행 상태에 대한 정보로, 상기 미사일(10)의 비행 궤도, 속도, 자세 및 방향 중 하나 이상의 정보가 포함될 수 있다.
상기 통신부(110)는, 상기 비행 정보를 수신하여 상기 제어부(130)에 전달하고, 상기 제어부(130)는, 상기 비행 정보를 근거로 상기 미사일(10)의 비행을 제어하기 위한 제어 명령을 판단하여 상기 통신부(110)에 전달할 수 있고, 상기 통신부(110)는, 상기 제어 명령을 상기 미사일(10)에 송신할 수 있다.
상기 저장부(120)는, 상기 제어 장치(100)의 데이터를 저장하는 메모리 모듈일 수 있다.
상기 저장부(120)는, 상기 제어 장치(100)에서 처리되는 데이터를 저장하는 메모리 모듈로, 이를테면 상기 통신부(110) 및 상기 제어부(130) 중 하나 이상에서 처리되는 데이터를 저장하게 될 수 있다.
상기 저장부(120)는 또한, 상기 제어 장치(100)의 제어 프로그램, 이를테면 상기 제어부(130)에서 실행되는 소프트웨어, 운영체제, 어플리케이션, 펌웨어, 또는 상기 미사일(10)을 제어하기 위한 제어 전용 프로그램 등을 비롯한 제어 프로그램을 저장할 수 있다.
즉, 상기 저장부(120)는, 상기 제어 장치(100)의 구동을 위한 데이터를 저장하고, 상기 제어부(130)는, 상기 저장부(120)에 저장된 데이터를 근거로 상기 미사일(10)의 제어를 수행하게 될 수 있다.
상기 저장부(120)는, 상기 미사일(10)의 이전 비행 제어에 대한 제어 데이터를 저장한다.
여기서, 상기 제어 데이터는, 상기 제어부(130)가 상기 미사일(10)의 비행을 제어한 이력에 대한 데이터로, 상기 비행 정보 및 상기 제어 신호의 데이터 중 하나 이상을 포함하여 상기 제어부(130)에서 생성될 수 있다.
즉, 상기 저장부(120)는, 상기 제어 장치(100)의 제어 이력에 관한 데이터를 저장할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 제어를 수행하는 상기 제어 장치(100)의 제어 모듈일 수 있다.
상기 제어부(130)는, 상기 제어 장치(100)의 중앙 처리 장치로, 상기 미사일(10)의 비행 제어를 수행할 수 있다.
상기 제어부(130)는, 상기 비행 제어에 대한 데이터를 연산 및 처리하여 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)의 통신을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)를 통해 상기 미사일(10)에 상기 제어 명령을 전달하여, 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)를 통해 상기 미사일(10)의 비행 정보를 전달받아, 상기 비행 정보를 근거로 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)를 통해 상기 미사일(10)의 비행 정보를 전달받아, 상기 비행 정보를 근거로 상기 미사일(10)의 비행을 제어하기 위한 상기 제어 명령을 판단하고, 상기 통신부(110)를 통해 상기 제어 명령을 상기 미사일(10)에 전달하여, 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는 또한, 상기 저장부(120)에 저장된 데이터를 근거로 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 저장부(120)에 저장된 데이터를 근거로 상기 제어 명령을 판단하여 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)의 통신을 제어한 결과 및 상기 미사일(10)의 비행을 제어한 결과를 데이터화하여 상기 저장부(120)에 저장할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 이전 비행 제어에 대한 상기 제어 데이터를 생성하여 상기 저장부(120)에 저장할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 비행 중 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 발사된 후, 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 미사일(10)의 비행을 제어한다.
즉, 상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 제어 명령을 판단하여, 판단한 상기 제어 명령에 따라 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하게 될 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 상태에 따라 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 상태에 따라 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 미사일(10)의 제어 지령을 연산하고, 상기 제어 지령에 따른 상기 제어 명령을 상기 미사일(10)에 전달하여 상기 미사일(10)의 비행을 제어할 수 있다.
이와 같이 상기 미사일(10)의 상태에 따라 상기 미사일(10)의 비행을 제어하는, 상기 제어부(130)는, 상기 미사일(10)의 상태에 대한 포텐셜 함수를 근거로 상기 비행 제어의 결과에 대한 보상 함수를 연산하여, 상기 보상 함수를 근거로 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 미사일(10)의 비행을 제어한다.
이처럼 상기 보상 함수를 근거로 상기 미사일(10)의 비행을 제어하는 상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하는 동안, 상기 제어 데이터를 근거로 상기 보상 함수에 따른 보상값이 최대가 되는 결과를 판단하여, 판단 결과에 따라 상기 미사일(10)의 비행을 제어한다.
즉, 상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하는 동안, 상기 보상 함수를 근거로 한 제어를 통해 상기 미사일(10)의 비행을 학습 기반으로 제어하게 될 수 있다.
구체적으로는, 상기 제어부(130)가 상기 보상 함수에 따른 보상값이 최대가 되도록 상기 미사일(10)의 제어 결과를 판단하고, 판단 결과에 따라 상기 미사일(10)의 비행을 제어하게 됨으로써, 상기 보상값이 증가될 수 있는 조건이 강화되는 방향을 학습하며 상기 미사일(10)의 비행을 제어하게 될 수 있다.
이에 따라, 상기 제어 장치(100)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하는 동안 상기 보상 함수에 따른 강화 학습 기반의 비행 제어가 이루어지게 될 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 비행 중 실시간으로 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 비행하는 중, 실시간으로 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 비행 중 실시간으로 상기 보상값이 최대가 되는 결과를 판단하여, 판단 결과에 따라 상기 미사일(10)의 비행을 제어할 수 있다.
즉, 상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하는 동안 실시간으로 상기 보상값이 최대가 되는 결과를 학습하여, 학습 결과에 따라 상기 미사일(10)의 비행을 제어하게 될 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 판단 결과에 따라 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하는 동안 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 판단 결과에 따라 상기 미사일(10)의 비행을 복수 회 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 판단 결과에 따라 상기 미사일(10)의 비행을 복수 회 제어하여 상기 미사일(10)의 비행을 연속적으로 제어할 수 있다.
이처럼 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 미사일(10)의 비행을 실시간으로 복수 회 제어하는 상기 제어부(130)는, 상기 포텐셜 함수를 근거로 상기 보상 함수를 연산하고, 상기 제어 데이터를 근거로 상기 보상값이 최대가 되는 결과를 판단하여, 판단 결과에 따라 상기 미사일(10)의 비행을 제어함으로써, 상기 보상 함수에 따른 강화 학습 기반으로 상기 미사일(10)의 비행을 제어하게 될 수 있다.
상기 포텐셜 함수는, 상기 미사일(10)의 상태를 수학적으로 나타낸 함수일 수 있다.
상기 포텐셜 함수는, 하나 이상의 변수 및 상수를 포함하여 상기 미사일(10)의 상태를 나타내는 함수일 수 있다.
상기 포텐셜 함수는, 상기 제어부(130)에 기설정될 수 있다.
상기 포텐셜 함수는,
Figure 112019047063059-pat00005
로 나타내어질 수 있다.
여기서, 상기
Figure 112019047063059-pat00006
는, 상기 미사일(10)의 시각 t에서의 상태를 나타내는 변수일 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 상태를 수학적으로 나타낸 상기 포텐셜 함수로부터 상기 보상 함수를 연산할 수 있다.
상기 보상 함수는, 상기 비행 제어의 결과에 따른 상기 미사일(10)과 상기 타겟(T) 간의 거리에 대한 함수일 수 있다.
즉, 상기 제어부(130)는, 상기 미사일(10)의 상태를 수학적으로 나타낸 상기 포텐셜 함수로부터 상기 비행 제어의 결과에 따른 상기 미사일(10)과 상기 타겟(T) 간의 거리에 대한 상기 보상 함수를 연산하게 될 수 있다.
상기 보상 함수는, 상기 미사일(10)의 비행 제어를 위한 연산의 기준이 되는 함수일 수 있다.
이를테면, 상기 보상 함수가 특정 값이 되도록 상기 비행 제어의 연산을 처리하게 될 수 있다.
상기 제어부(130)는, 기설정된 연산 기준에 따라 상기 포텐셜 함수로부터 상기 보상 함수를 연산할 수 있다.
상기 연산 기준(CP)은, 도 3에 도시된 바와 같이, 상기 포텐셜 함수로부터 상기 보상 함수를 연산하는 연산 방법 및 연산 순서에 대한 기준일 수 있다.
상기 연산 기준(CP)은, 상기 포텐셜 함수를 근사화하는 제1 과정(P1), 상기 제1 과정(P1)의 결과를 에너지 함수 형태로 변환하는 제2 과정(P2), 상기 제2 과정(P2)의 결과를 유한 차분법에 따라 근사화하는 제3 과정(P3), 상기 제3 과정(P3)의 결과를 체인룰에 따라 전개하는 제4 과정(P4) 및 상기 제4 과정(P4)의 결과를 상기 미사일(10)과 상기 타겟(T) 간의 거리 함수 형태로 변환하는 제5 과정(P5) 순으로 상기 보상 함수를 연산하는 기준일 수 있다.
이에 따라, 상기 제어부(130)는, 상기 연산 기준에 따라, 상기 포텐셜 함수를 근사화(P1)하여 에너지 함수 형태로 변환(P2)하고, 변환한 결과를 유한 차분법에 따라 근사화(P3)하여 체인룰에 따라 전개(P4)하고, 전개한 결과를 상기 미사일(10)과 상기 타겟(T) 간의 거리 함수 형태로 변환(P5)하여 상기 보상 함수를 연산하게 될 수 있다.
상기 보상 함수는,
Figure 112019047063059-pat00007
로 나타내어질 수 있다.
여기서, 상기 at는, 상기 미사일(10)의 시각 t에서의 동작을 나타내는 변수일 수 있다.
상기 제어부(130)가 상기 연산 기준에 따라 상기 포텐셜 함수로부터 상기 보상 함수를 연산하는 구체적인 연산 과정을 설명하면 다음과 같다.
<제1 과정(P1): 근사화>
상기 제어부(130)는, 상기 포텐셜 함수
Figure 112019047063059-pat00008
를 근거로 하기 [수학식 1]과 같은 기준 근사 함수
Figure 112019047063059-pat00009
를 연산할 수 있다.
[수학식 1]
Figure 112019047063059-pat00010
<제2 과정(P2): 에너지 함수 형태 변환>
이후, 에너지 함수 H를 하기 [수학식 2]와 같이 정의하고, 상기 [수학식 1]을 상기 [수학식 2]에 따라, 하기 [수학식 3]과 같은 에너지 함수 형태로 변환할 수 있다.
[수학식 2]
Figure 112019047063059-pat00011
[수학식 3]
Figure 112019047063059-pat00012
<제3 과정(P3): 유한 차분법에 따라 근사화>
이후, 상기 [수학식 3]과 같은 기준 근사 함수
Figure 112019047063059-pat00013
를 상기 유한 차분법에 따라 하기 [수학식 4]와 같이 근사화할 수 있다.
[수학식 4]
Figure 112019047063059-pat00014
<제4 과정(P4): 체인룰에 따라 전개>
이후, 상기 [수학식 4]와 같은 기준 근사 함수
Figure 112019047063059-pat00015
를 하기 [수학식 5]와 같은 상기 보상 함수 G로 변환하고, 상기 체인룰(Chain Rule)에 따라 하기 [수학식 6]과 같이 전개할 수 있다.
[수학식 5]
Figure 112019047063059-pat00016
[수학식 6]
Figure 112019047063059-pat00017
Figure 112019047063059-pat00018
Figure 112019047063059-pat00019
상기 [수학식 6]과 같은 상기 보상 함수 G에 따르면, 상기 에너지 함수 H의 최대 강하 방향(steepest descent direction)과 상기 미사일(10)의 상태 벡터의 시간 변화 벡터
Figure 112019047063059-pat00020
를 잘 일치(align)시키는 상황에서 상기 보상 함수 값이 증가하게 되어, 상기 미사일(10) 제어의 보상이 높아지게 될 수 있다.
<제5 과정(P5): 거리 함수 형태로 변환>
이후, 상기 [수학식 6]에 포함된 상기 에너지 함수 H를 하기 [수학식 7]과 같은 상기 미사일(10)과 상기 타겟(T) 간의 유클리디안 거리 함수 형태로 정의할 수 있다.
[수학식 7]
Figure 112019047063059-pat00021
여기서, 상기
Figure 112019047063059-pat00022
는 상기 미사일(10)의 3차원 위치 벡터이고, 상기
Figure 112019047063059-pat00023
는 상기 타겟(T)의 3차원 위치 벡터이고, 상기
Figure 112019047063059-pat00024
는 상기 미사일(10)과 상기 타겟(T) 간의 상대 위치 벡터 또는 Line of Sight(LOS)일 수 있다.
이후, 상기 보상 함수 G에 상기 거리 함수를 적용하여 하기 [수학식 8]과 같이 상기 보상 함수 G를 연산할 수 있다.
[수학식 8]
Figure 112019047063059-pat00025
Figure 112019047063059-pat00026
Figure 112019047063059-pat00027
여기서, 상기
Figure 112019047063059-pat00028
는 상기 미사일(10)과 상기 타겟(T) 간의 상대 속도 벡터일 수 있다.
이와 같은 연산 과정을 통해, 하기 [수학식 9]와 같은 상기 보상 함수 G를 연산하게 될 수 있다.
[수학식 9]
Figure 112019047063059-pat00029
상기 [수학식 9]와 같은 상기 보상 함수에 따르면, 상기 타겟(T)과의 상대 위치 벡터
Figure 112019047063059-pat00030
가 상대 속도 벡터
Figure 112019047063059-pat00031
와 정렬도가 높을수록 상기 보상 함수 값이 커지게 되고, 이에 따라 상기 미사일(10) 제어의 보상이 높아지게 될 수 있다.
이와 같이 상기 포텐셜 함수로부터 상기 보상 함수를 연산하는 상기 제어부(130)는, 도 4에 도시된 바와 같은 과정으로 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 도 4에 도시된 바와 같이, 상기 포텐셜 함수를 근거로 상기 보상 함수를 연산(B1)하여, 상기 제어 데이터를 근거로 상기 보상 함수의 절대값이 최대가 되는 결과를 판단(B2)하고, 판단 결과에 따라 상기 미사일(10)의 비행을 제어(B3)함으로써, 상기 미사일(10) 제어의 보상이 최대가 되도록 상기 미사일(10)의 비행을 제어하게 될 수 있다.
이를테면, 상기 보상 함수의 절대값이 최대가 되는 조건들을 판단하기 위한 데이터에 해당하는 상기 제어 데이터를 근거로, 상기 보상 함수의 절대값이 최대가 되는 제어값을 학습(B2)하여, 학습한 제어값에 따라 상기 미사일(10)의 비행을 제어하기 위한 제어 명령을 판단하여, 판단한 제어 명령에 따라 상기 미사일(10)의 비행을 제어(B3)하게 될 수 있다.
구체적으로는, 상기 제어 데이터를 근거로 상기 보상 함수의 시간 축 합이 최대가 되는 최적의 제어값을 판단(B2)하고, 판단한 제어값을 상기 미사일(10)의 비행을 제어하기 위한 제어 명령에 적용하여 상기 미사일(10)의 제어를 수행(B3)하게 됨으로써, 상기 보상 함수에 따른 보상의 시간 축 합이 최대가 되도록 상기 미사일(10)의 비행을 제어하게 될 수 있다.
즉, 최적의 제어값을 연산하여 상기 미사일(10)을 제어하게 됨으로써, 상기 미사일(10)의 제어가 최적으로 수행될 수 있게 된다.
이에 따라, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 제어하는 동안, 상기 제어 데이터를 기반으로 상기 미사일(10) 제어의 보상이 최대가 되는 결과를 학습(B2)하여, 학습 결과에 따라 상기 미사일(10)의 비행을 제어(B3)하는 데이터 기반의 강화 학습 제어가 이루어지게 될 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 비행을 제어하는 회차에 따라 상기 보상 함수의 절대값이 증가하도록 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 비행을 제어하는 회차가 증가함에 따라 상기 보상 함수의 절대값이 증가하도록 상기 보상값이 최대가 되는 결과를 판단하여, 판단 결과에 따라 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 보상 함수의 절대값이 이전 제어 신호 생성 시의 절대값 이상이 되도록 상기 보상값이 최대가 되는 결과를 판단할 수 있다.
이처럼 상기 보상값이 최대가 되는 결과를 판단하게 됨으로써, 상기 미사일(10) 제어의 보상이 강화되는 방향으로 상기 미사일(10)의 비행을 제어하게 될 수 있다.
이에 따라, 상기 미사일(10) 제어의 보상이 증가하도록 상기 미사일(10)의 비행을 제어하게 됨으로써, 상기 미사일(10)의 제어가 도 5에 도시된 바와 같이 충돌 삼각형(Collision triangle)을 형성하며 상기 타겟(T)을 추종하게 될 수 있다.
결과적으로, 상기 보상 함수에 따라 상기 미사일(10)의 비행을 제어하게 됨으로써, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하게 되어, 도 5에 도시된 바와 같은 충돌 삼각형을 형성하며 상기 타겟(T)에 충돌하게 될 수 있다.
이하, 본 발명에 따른 미사일 제어 시스템(이하, 시스템이라 칭한다)을 설명하되, 앞서 상기 제어 장치(100)에서 설명한 내용과 중복되는 부분은 가급적 생략한다.
상기 시스템은, 도 1a에 도시된 바와 같이 타겟(T)을 추종하는 미사일(10)을 제어하는 미사일(10)을 제어하는 시스템을 의미한다.
상기 시스템은, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 상기 미사일(10)의 비행을 제어하는 시스템일 수 있다.
상기 시스템은, 상기 미사일(10)을 제어하는 제어 장치의 상기 미사일(10)을 제어하는 시스템일 수 있다.
상기 시스템은 또한, 상기 미사일(10)의 비행 제어를 시뮬레이션하는 시뮬레이션 장치의 제어 시스템, 또는 시뮬레이션 시스템일 수 있다.
상기 시스템은, 앞서 설명한 상기 제어 장치(100)가 상기 미사일(10)의 비행을 제어하기 위한 시스템일 수 있다.
상기 시스템은 또한, 앞서 설명한 상기 제어 장치(100)의 상기 제어부(130)가 상기 미사일(10)의 비행을 제어하기 위한 제어 시스템일 수 있다.
상기 시스템(1)은, 도 6에 도시된 바와 같이, 타겟(T)을 추종하는 미사일(10) 및 상기 미사일(10)의 비행 제어에 대한 제어 신호를 생성하여 상기 미사일(10)에 송신하는 미사일 제어 장치(100)를 포함하여, 상기 미사일(10)의 비행을 제어한다.
여기서, 상기 제어 장치(100)는, 앞서 설명한 상기 제어 장치(100)일 수 있다.
상기 시스템(1)에서 상기 제어 장치(100)는, 상기 미사일(10)의 상태에 대한 포텐셜 함수를 근거로 상기 비행 제어의 결과에 대한 보상 함수를 연산하고, 상기 미사일(10)의 이전 비행 제어에 대한 기저장된 제어 데이터를 근거로 상기 보상 함수의 절대값이 최대가 되는 제어값을 학습하여, 학습 결과에 따른 상기 제어값에 따라 상기 제어 신호를 생성한다.
즉, 상기 제어 장치(100)는, 상기 제어 데이터를 근거로 상기 보상 함수의 절대값이 최대가 되는 제어값을 학습하여, 학습 결과에 따른 상기 제어값에 따라 상기 제어 신호를 생성하여 상기 미사일(10)에 송신함으로써, 상기 보상 함수의 절대값이 최대가 되는 학습 결과에 따라 상기 미사일(10)의 비행을 제어하게 될 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)과 통신하여 상기 미사일(10)을 제어할 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)의 비행 중 상기 미사일(10)과 통신하여, 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)과 통신하며 상기 미사일(10)로부터 상기 비행 정보를 수신하고, 상기 제어 신호를 상기 미사일(10)에 송신할 수 있다.
이에 따라 상기 제어 장치(100)는, 상기 미사일(10)과의 통신을 통해 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 미사일(10)을 제어할 수 있다.
이를테면, 도 7에 도시된 바와 같이, 상기 미사일(10)의 비행 중 상기 타겟(T)을 추종하도록 상기 미사일(10)의 비행 경로를 제어하거나, 상기 미사일(10)이 지령 경로로 비행하도록 제어하는 상기 제어 신호를 생성하여 상기 미사일(10)에 송신함으로써, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하게 될 수 있다.
이처럼 상기 타겟(T)을 추종하도록 상기 미사일(10)을 제어하는 상기 제어 장치(100)는, 도 2에 도시된 바와 같이, 상기 통신부(110), 상기 저장부(120) 및 상기 제어부(130)를 포함할 수 있다.
상기 통신부(110)는, 상기 미사일(10)의 비행 제어에 대한 상기 제어 신호를 상기 미사일(10)에 송신한다.
여기서, 상기 제어 신호는, 상기 제어부(130)가 상기 미사일(10)의 비행을 제어하기 위한 제어 명령 신호로, 상기 미사일(10)의 비행 궤도, 속도, 자세 및 방향 중 하나 이상에 대한 제어 명령이 포함될 수 있다.
상기 통신부(110)는, 상기 제어부(130)의 제어에 의해 상기 미사일(10)과 통신하여, 상기 제어 신호를 상기 미사일(10)에 송신할 수 있다.
상기 통신부(110)는 또한, 상기 미사일(10)로부터 상기 미사일(10)의 비행에 대한 상기 비행 정보를 수신할 수 있다.
여기서, 상기 비행 정보는, 상기 미사일(10)의 비행 상태에 대한 정보로, 상기 미사일(10)의 비행 궤도, 속도, 자세 및 방향 중 하나 이상의 정보가 포함될 수 있다.
상기 통신부(110)는, 상기 비행 정보를 수신하여 상기 제어부(130)에 전달하고, 상기 제어부(130)는, 상기 비행 정보를 근거로 상기 제어 신호를 생성하여 상기 통신부(110)에 전달할 수 있다.
상기 저장부(120)는, 상기 미사일(10)의 이전 비행 제어에 대한 상기 제어 데이터를 저장할 수 있다.
여기서, 상기 제어 데이터는, 상기 제어부(130)가 상기 미사일(10)의 비행을 제어한 이력에 대한 데이터로, 상기 비행 정보 및 상기 제어 신호의 데이터 중 하나 이상을 포함하여 상기 제어부(130)에서 생성될 수 있다.
즉, 상기 저장부(120)는, 상기 제어 장치(100)의 제어 이력에 관한 데이터를 저장할 수 있다.
상기 제어부(130)는, 상기 비행 제어에 대한 데이터를 연산 및 처리하여 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)의 통신을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)를 통해 상기 미사일(10)에 상기 제어 신호를 전달하여, 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 통신부(110)를 통해 상기 미사일(10)의 비행 정보를 전달받아, 상기 비행 정보를 근거로 상기 제어 신호를 생성하고, 상기 통신부(110)를 통해 상기 제어 신호를 상기 미사일(10)에 전달하여, 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는 또한, 상기 저장부(120)에 저장된 데이터를 근거로 상기 제어 신호를 생성할 수 있다.
상기 제어부(130)는, 상기 통신부(110)의 통신을 제어한 결과 및 상기 미사일(10)의 비행을 제어한 결과를 데이터화하여 상기 저장부(120)에 저장할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 이전 비행 제어에 대한 상기 제어 데이터를 생성하여 상기 저장부(120)에 저장할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 비행 중 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 발사된 후, 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 제어 신호를 생성하여 상기 미사일(10)의 비행을 제어한다.
즉, 상기 제어부(130)는, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 제어하는 제어 신호를 생성하여 상기 미사일(10)에 전달함으로써, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 제어하게 될 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 상태에 따라 상기 제어 신호를 생성하여, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 제어할 수 있다.
상기 제어부(130)는, 상기 미사일(10)의 상태에 따라 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 상기 미사일(10)의 제어 지령을 연산하여, 상기 제어 지령에 따라 상기 제어 신호를 생성하여 상기 미사일(10)의 비행을 제어할 수 있다.
이와 같이 상기 미사일(10)의 비행을 제어하는 상기 제어 장치(100)는, 상기 미사일(10)의 비행 중 실시간으로 상기 제어 신호를 생성할 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 비행하는 중, 실시간으로 상기 제어 신호를 생성하여 상기 미사일(10)의 비행을 제어할 수 있다.
즉, 상기 제어 장치(100)는, 상기 미사일(10)의 비행을 실시간으로 제어하게 될 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 제어 신호를 복수 회 생성하여 상기 미사일(10)의 비행을 제어할 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 타겟(T)을 추종하여 비행하도록 상기 제어 신호를 복수 회 생성하여 상기 미사일(10)의 비행을 복수 회 제어할 수 있다.
상기 제어 장치(100)는, 상기 미사일(10)의 비행 중, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 제어 신호를 복수 회 생성하여 상기 미사일(10)의 비행을 연속적으로 제어할 수 있다.
이처럼 상기 미사일(10)의 비행을 제어하는 상기 제어 장치(100)는, 상기 포텐셜 함수로부터 상기 보상 함수를 연산하여, 상기 제어 데이터를 근거로 상기 보상 함수의 절대값이 최대가 되는 제어값에 따라 상기 제어 신호를 생성하여 상기 미사일(10)의 비행을 제어함으로써, 상기 제어 데이터 기반의 강화 학습 제어 방식으로 상기 미사일(10)의 비행을 제어하게 될 수 있다.
상기 보상 함수의 구체적인 연산 과정은, 앞서 상기 제어 장치(100)에서 설명한 도 3에 도시된 바와 같은 과정과 상기 [수학식 1] 내지 [수학식 9] 순서대로 이루어질 수 있다.
상기 제어 장치(100)는, 도 4에 도시된 바와 같이, 상기 포텐셜 함수로부터 상기 보상 함수를 연산(B1)하여, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하는 동안, 상기 제어 데이터를 근거로 상기 보상 함수의 절대값이 최대가 되는 제어값을 학습(B2)하고, 학습 결과에 따른 상기 제어값에 따라 상기 제어 신호를 생성하여 상기 미사일(10)의 비행을 제어(B3)할 수 있다.
즉, 상기 제어 장치(100)는, 상기 보상 함수의 절대값이 최대가 되는 제어값에 따라 상기 제어 신호를 생성하게 되어, 상기 미사일(10) 제어의 보상이 최대가 되도록 하게 될 수 있다.
구체적으로는, 상기 제어 데이터를 근거로 상기 보상 함수의 시간 축 합이 최대가 되는 최적의 제어값을 판단(B2)하고, 판단한 제어값에 따라 상기 제어 신호를 생성하여 상기 미사일(10)의 제어를 수행(B3)하게 됨으로써, 상기 보상 함수에 따른 보상의 시간 축 합이 최대가 되도록 상기 미사일(10)의 비행을 제어하게 될 수 있다.
즉, 최적의 제어값을 연산하여 상기 미사일(10)을 제어하게 됨으로써, 상기 미사일(10) 제어의 보상이 최대가 되도록 상기 미사일(10)의 비행을 제어하게 되어, 상기 미사일(10)의 제어가 최적으로 수행될 수 있게 된다.
이에 따라, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 제어하는 동안, 상기 제어 데이터를 기반으로 상기 미사일(10) 제어의 보상이 최대가 되는 결과를 학습(B2)하여, 학습 결과에 따라 상기 미사일(10)의 비행을 제어(B3)하는 데이터 기반의 강화 학습 제어가 이루어지게 될 수 있다.
상기 제어 장치(100)는, 상기 제어 신호의 생성 회차에 따라 상기 보상 함수의 절대값이 증가하도록 상기 제어 신호를 생성할 수 있다.
상기 제어 장치(100)는, 상기 제어 신호의 생성 회차가 증가함에 따라 상기 보상 함수의 절대값이 증가하도록 상기 제어 신호를 생성할 수 있다.
상기 제어 장치(100)는, 상기 보상 함수의 절대값이 이전 제어 신호 생성 시의 절대값 이상이 되도록 상기 제어 신호를 생성할 수 있다.
이처럼 상기 제어 신호를 생성하게 됨으로써, 상기 미사일(10) 제어의 보상이 증가하도록 상기 제어 신호를 생성하게 될 수 있다.
이에 따라, 상기 미사일(10) 제어의 보상이 증가하도록 상기 미사일(10)의 비행을 제어하게 됨으로써, 상기 미사일(10)의 제어가 도 5에 도시된 바와 같이 충돌 삼각형(Collision triangle)을 형성하며 상기 타겟(T)을 추종하게 될 수 있다.
결과적으로, 상기 보상 함수에 따라 상기 미사일(10)의 비행을 제어하게 됨으로써, 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하게 되어, 도 5에 도시된 바와 같은 충돌 삼각형을 형성하며 상기 타겟(T)에 충돌하게 될 수 있다.
이하, 본 발명에 따른 미사일 제어 방법(이하, 제어 방법이라 칭한다)을 설명하되, 앞서 상기 제어 장치(100) 및 상기 시스템(1)에서 설명한 내용과 중복되는 부분은 가급적 생략한다.
상기 제어 방법은, 도 1a에 도시된 바와 같이 타겟(T)을 추종하는 미사일(10)을 제어하는 방법을 의미한다.
상기 제어 방법은, 상기 미사일(10)이 상기 타겟(T)을 추종하도록 상기 미사일(10)의 비행을 제어하는 방법일 수 있다.
상기 제어 방법은, 상기 미사일(10)을 제어하는 제어 장치의 상기 미사일(10)을 제어하는 방법일 수 있다.
상기 제어 방법은 또한, 상기 미사일(10)의 비행 제어를 시뮬레이션하는 시뮬레이션 장치의 시뮬레이션 방법일 수도 있다.
상기 제어 방법은, 앞서 설명한 상기 제어 장치(100)의 제어 방법, 또는 앞서 설명한 상기 시스템(1)의 제어 방법일 수 있다.
상기 제어 방법은, 도 8에 도시된 바와 같이, 상기 미사일(10)을 제어하기 위한 제어 기준을 설정하는 단계(S10), 상기 미사일(10)의 포텐셜 함수를 근거로 상기 미사일(10)과 상기 타겟(T) 간의 거리에 대한 보상 함수를 연산하는 단계(S20) 및 상기 제어 기준에 상기 보상 함수를 반영한 결과를 근거로 상기 미사일(10)을 제어하는 단계(S30)를 포함한다.
즉, 상기 제어 방법은, 상기 미사일(10)을 제어하기 위한 제어 기준을 설정(S10)하고, 상기 미사일(10)의 포텐셜 함수를 근거로 상기 미사일(10)과 상기 타겟(T) 간의 거리에 대한 보상 함수를 연산(S20)하고, 상기 제어 기준에 상기 보상 함수를 반영한 결과를 근거로 상기 미사일(10)을 제어(S30)하는 순서로 상기 미사일(10)을 제어하게 된다.
이처럼 상기 제어 기준을 설정하는 단계(S10), 상기 보상 함수를 연산하는 단계(S20) 및 상기 미사일(10)을 제어하는 단계(S30)를 포함하는 상기 제어 방법은, 상기 제어 기준에 상기 보상 함수를 반영한 결과를 근거로 상기 미사일(10)의 비행을 제어하게 됨으로써, 상기 타겟(T)을 추종하도록 상기 미사일(10)을 제어하게 될 수 있다.
상기 제어 방법은, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지, 상기 미사일(10)의 비행 중 실시간으로 상기 미사일(10)을 제어할 수 있다.
즉, 상기 제어 방법은, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지, 상기 미사일(10)의 비행 중 실시간으로 상기 제어 기준을 설정하는 단계(S10), 상기 보상 함수를 연산하는 단계(S20) 및 상기 미사일(10)을 제어하는 단계(S30) 순으로 상기 미사일(10)의 비행을 제어하게 될 수 있다.
상기 제어 기준을 설정하는 단계(S10)는, 상기 미사일(10) 및 상기 타겟(T)에 따라 상기 제어 기준을 설정할 수 있다.
상기 제어 기준은, 상기 미사일(10)의 비행을 제어하기 위한 기준으로, 상기 미사일(10)의 종류, 상태, 타겟 대상, 상기 타겟(T)의 종류, 상태 및 상기 미사일(10)의 목표 중 하나 이상에 따라 설정될 수 있다.
상기 보상 함수를 연산하는 단계(S20)는, 상기 포텐셜 함수를 근거로 상기 미사일(10)과 상기 타겟(T) 간의 거리에 대한 상기 보상 함수를 연산(S20)하는 단계일 수 있다.
상기 보상 함수를 연산하는 단계(S20)는, 기설정된 연산 단계에 따라 상기 포텐셜 함수로부터 상기 보상 함수를 연산할 수 있다.
상기 연산 단계는, 상기 포텐셜 함수로부터 상기 보상 함수를 연산하는 연산 방법에 대한 단계로, 복수의 연산 과정을 포함할 수 있다.
상기 보상 함수를 연산하는 단계(S20)는, 도 9에 도시된 바와 같이, 상기 포텐셜 함수를 근사화하는 제1 단계(S21), 상기 제1 단계(S21)의 결과를 에너지 함수 형태로 변환하는 제2 단계(S22), 상기 제2 단계(S22)의 결과를 유한 차분법에 따라 근사화하는 제3 단계(S23), 상기 제3 단계(S23)의 결과를 체인룰에 따라 전개하는 제4 단계(S24) 및 상기 제4 단계(S24)의 결과를 상기 미사일(10)과 상기 타겟(T) 간의 거리 함수 형태로 변환하여 상기 보상 함수를 연산하는 제5 단계(S25)를 포함할 수 있다.
이에 따라, 상기 보상 함수를 연산하는 단계(S20)는, 상기 포텐셜 함수를 근사화(S21)하여 에너지 함수 형태로 변환(S22)하고, 변환한 결과를 유한 차분법에 따라 근사화(S23)하여 체인룰에 따라 전개(S24)하고, 전개한 결과를 상기 거리 함수 형태로 변환하여 상기 보상 함수를 연산(S25)하게 될 수 있다.
상기 보상 함수를 연산하는 단계(S20)에 따른 상기 보상 함수의 구체적인 연산 과정은, 앞서 상기 제어 장치(100)에서 설명한 상기 [수학식 1] 내지 [수학식 9] 순서대로 이루어질 수 있다.
상기 미사일을 제어하는 단계(S30)는, 상기 제어 기준에 상기 보상 함수를 반영한 결과를 근거로 상기 미사일(10)이 상기 타겟(T)을 추종하여 비행하도록 제어하는 단계일 수 있다.
상기 미사일을 제어하는 단계(S30)는, 기저장된 제어 데이터를 근거로 상기 보상 함수가 최대가 되는 제어값을 연산하는 단계(S31) 및 상기 제어값을 상기 제어 기준에 적용한 결과에 따라 상기 미사일(10)의 제어를 수행하는 단계(S32)를 포함할 수 있다.
이에 따라, 상기 미사일을 제어하는 단계(S30)는, 상기 보상 함수가 최대가 되는 상기 제어값을 연산(S31)하여, 상기 제어값을 상기 제어 기준에 적용한 결과에 따라 상기 미사일(10)의 제어를 수행하게 됨으로써, 상기 보상 함수에 따른 보상이 최대가 되도록 상기 미사일(10)의 비행을 제어하게 될 수 있다.
구체적으로는, 상기 보상 함수의 시간 축 합이 최대가 되는 최적의 상기 제어값을 연산(S31)하여, 상기 제어값을 상기 제어 기준에 적용한 결과에 따라 상기 미사일(10)의 제어를 수행하게 됨으로써, 상기 보상 함수에 따른 보상의 시간 축 합이 최대가 되도록 상기 미사일(10)의 비행을 제어하게 될 수 있다.
즉, 상기 미사일을 제어하는 단계(S30)는, 최적의 제어값을 연산하여 상기 미사일(10)을 제어하게 됨으로써, 상기 미사일(10)의 제어가 최적으로 수행될 수 있게 된다.
상기 미사일을 제어하는 단계(S30)는, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 제어값을 연산하는 단계(S31) 및 상기 미사일(10)의 제어를 수행하는 단계(S32)를 반복할 수 있다.
즉, 상기 미사일을 제어하는 단계(S30)는, 상기 미사일(10)이 상기 타겟(T)에 충돌할 때까지 상기 제어값의 연산(S31) 및 상기 제어값에 따른 상기 미사일(10)의 제어(S32)를 복수 회 반복하여 수행하게 될 수 있다.
상기 제어값을 연산하는 단계(S31)는, 상기 제어값의 연산 회차에 따라 상기 보상 함수의 절대값이 증가하도록 상기 제어값을 연산할 수 있다.
즉, 상기 제어값을 연산하는 단계(S31)는, 상기 제어값의 연산 회차가 증가함에 따라 상기 보상 함수에 따른 보상이 증가하도록 상기 제어값을 연산하게 될 수 있다.
이와 같은 과정을 통해 상기 제어 방법은, 상기 미사일(10)이 도 4에 도시된 바와 같이 상기 미사일(T)이 충돌 삼각형을 형성하며 상기 타겟(T)을 추종하여 비행하도록 제어하게 됨으로써, 상기 미사일(T)이 상기 타겟(T)에 충돌하게 될 수 있다.
상기 제어 기준을 설정하는 단계(S10), 상기 보상 함수를 연산하는 단계(S20) 및 상기 미사일(10)을 제어하는 단계(S30)를 포함하는 상기 제어 방법은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 컴퓨터는 상기 제어부(130)를 포함할 수도 있다.
상술한 바와 같은 본 발명에 따른 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법의 실시 예들은, 본 발명의 기술적 사상이 적용될 수 있는 기존의 모든 미사일 제어 장치, 미사일 제어 시스템, 미사일 제어 방법, 미사일 시뮬레이션 장치, 미사일 시뮬레이션 시스템, 미사일 시뮬레이션 방법, 비행 제어 장치, 비행 제어 시스템 및 비행 제어 방법 등에 적용될 수 있으며, 특히 강화 학습 기반의 제어를 통해 비행체의 비행을 제어하는 제어 장치, 제어 시스템 및 제어 방법에 유용하게 적용될 수 있다.
지금까지 본 발명에 따른 구체적인 실시 예에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서는 여러 가지 변형이 가능함은 물론이다. 그러므로, 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안 되며, 후술하는 특허 청구의 범위뿐 아니라 이 특허 청구의 범위와 균등한 것들에 의해 정해져야 한다.
이상과 같이 본 발명은 비록 한정된 실시 예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시 예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
10: 미사일 100: 미사일 제어 장치
110: 통신부 120: 저장부
130: 제어부 T: 타겟

Claims (20)

  1. 타겟을 추종하는 미사일을 제어하는 미사일 제어 장치에 있어서,
    상기 미사일과 통신하며 상기 미사일에 상기 미사일의 비행 제어에 대한 제어명령을 송신하거나, 상기 미사일로부터 상기 미사일의 비행 상태에 대한 비행 정보를 수신하는 통신부;
    상기 미사일의 상태에 대한 포텐셜 함수를 근거로 상기 비행 제어의 결과에 대한 보상 함수를 연산하여, 상기 보상 함수를 근거로 상기 미사일이 상기 타겟을 추종하여 비행하도록 상기 미사일의 비행을 제어하는 제어부; 및
    상기 제어명령 또는 상기 비행 정보를 포함하는 제어 데이터를 저장하는 저장부를 포함하고,
    상기 제어부는,
    상기 미사일이 상기 타겟을 추종하도록 제어하는 동안,
    상기 제어명령 또는 상기 비행 정보를 포함하는 상기 제어 데이터를 근거로 상기 보상 함수의 값이 최대가 되도록 상기 미사일의 비행을 제어하는 것을 특징으로 하는 미사일 제어 장치.
  2. 제1 항에 있어서,
    상기 제어부는,
    상기 미사일의 비행 중 실시간으로 상기 보상 함수의 값이 최대가 되도록 상기 미사일의 비행을 제어하는 것을 특징으로 하는 미사일 제어 장치.
  3. 제1 항에 있어서,
    상기 제어부는,
    상기 미사일이 상기 타겟에 충돌할 때까지 상기 보상 함수의 값이 최대가 되도록 상기 미사일의 비행을 제어하는 것을 특징으로 하는 미사일 제어 장치.
  4. 제1 항에 있어서,
    상기 보상 함수는,
    상기 비행 제어의 결과에 따른 상기 미사일과 상기 타겟 간의 거리에 대한 함수인 것을 특징으로 하는 미사일 제어 장치.
  5. 제4 항에 있어서,
    상기 제어부는,
    기설정된 연산 기준에 따라 상기 포텐셜 함수로부터 상기 보상 함수를 연산하는 것을 특징으로 하는 미사일 제어 장치.
  6. 제5 항에 있어서,
    상기 연산 기준은,
    상기 포텐셜 함수를 근사화하는 제1 과정;
    상기 제1 과정의 결과를 에너지 함수 형태로 변환하는 제2 과정;
    상기 제2 과정의 결과를 유한 차분법에 따라 근사화하는 제3 과정;
    상기 제3 과정의 결과를 체인룰에 따라 전개하는 제4 과정; 및
    상기 제4 과정의 결과를 상기 미사일과 상기 타겟 간의 거리 함수 형태로 변환하는 제5 과정; 순으로 상기 보상 함수를 연산하는 기준인 것을 특징으로 하는 미사일 제어 장치.
  7. 제6 항에 있어서,
    상기 보상 함수는,
    Figure 112019047063059-pat00032
    이고,
    상기
    Figure 112019047063059-pat00033
    는,
    상기 미사일의 상태를 나타내는 변수이고,
    상기 at는,
    상기 미사일의 시각 t에서의 동작을 나타내는 변수인 것을 특징으로 하는 미사일 제어 장치.
  8. 제1 항에 있어서,
    상기 제어부는,
    상기 미사일의 비행을 제어하는 회차에 따라 상기 보상 함수의 값이 최대가 되도록 상기 미사일의 비행을 제어하는 것을 특징으로 하는 미사일 제어 장치.
  9. 제8 항에 있어서,
    상기 제어부는,
    상기 보상 함수의 값이 이전 제어 시의 보상 함수의 값 이상이 되도록 상기 미사일의 비행을 제어하는 것을 특징으로 하는 미사일 제어 장치.
  10. 타겟을 추종하는 미사일; 및
    상기 미사일의 비행 제어에 대한 제어 신호를 생성하여 상기 미사일에 송신하는 미사일 제어 장치;를 포함하는 미사일 제어 시스템에 있어서,
    상기 제어 장치는,
    상기 미사일의 상태에 대한 포텐셜 함수를 근거로 상기 비행 제어의 결과에 대한 보상 함수를 연산하고, 상기 미사일의 이전 비행 제어에 대한 기저장된 제어 데이터를 근거로 상기 보상 함수의 값이 최대가 되는 제어값을 학습하여, 학습 결과에 따른 상기 제어값에 따라 상기 제어 신호를 생성하는 것을 특징으로 하는 미사일 제어 시스템.
  11. 제10 항에 있어서,
    상기 제어 장치는,
    상기 미사일의 비행 중 실시간으로 상기 제어 신호를 생성하는 것을 특징으로 하는 미사일 제어 시스템.
  12. 제10 항에 있어서,
    상기 제어 장치는,
    상기 미사일이 상기 타겟에 충돌할 때까지 상기 제어 신호를 복수 회 생성하여 상기 미사일의 비행을 제어하는 것을 특징으로 하는 미사일 제어 시스템.
  13. 제10 항에 있어서,
    상기 제어 장치는,
    상기 제어 신호의 생성 회차에 따라 상기 보상 함수의 값이 최대가 되도록 상기 제어값을 학습하는 것을 특징으로 하는 미사일 제어 시스템.
  14. 제13 항에 있어서,
    상기 제어 장치는,
    상기 보상 함수의 값이 이전 제어 신호 생성 시의 보상 함수의 값 이상이 되도록 상기 제어값을 학습하는 것을 특징으로 하는 미사일 제어 시스템.
  15. 타겟을 추종하는 미사일을 제어하는 미사일 제어 방법에 있어서,
    상기 미사일을 제어하기 위한 제어 기준을 설정하는 단계;
    상기 미사일의 포텐셜 함수를 근거로 상기 미사일과 상기 타겟 간의 거리에 대한 보상 함수를 연산하는 단계; 및
    상기 제어 기준에 상기 보상 함수를 반영한 결과를 근거로 상기 미사일을 제어하는 단계;를 포함하는 것을 특징으로 하는 미사일 제어 방법.
  16. 제15 항에 있어서,
    상기 미사일이 상기 타겟에 충돌할 때까지, 상기 미사일의 비행 중 실시간으로 상기 미사일을 제어하는 것을 특징으로 하는 미사일 제어 방법.
  17. 제15 항에 있어서,
    상기 보상 함수를 연산하는 단계는,
    상기 포텐셜 함수를 근사화하는 제1 단계;
    상기 제1 단계의 결과를 에너지 함수 형태로 변환하는 제2 단계;
    상기 제2 단계의 결과를 유한 차분법에 따라 근사화하는 제3 단계;
    상기 제3 단계의 결과를 체인룰에 따라 전개하는 제4 단계; 및
    상기 제4 단계의 결과를 상기 미사일과 상기 타겟 간의 거리 함수 형태로 변환하여 상기 보상 함수를 연산하는 제5 단계;를 포함하는 것을 특징으로 하는 미사일 제어 방법.
  18. 제15 항에 있어서,
    상기 미사일을 제어하는 단계는,
    기저장된 제어 데이터를 근거로 상기 보상 함수가 최대가 되는 제어값을 연산하는 단계; 및
    상기 제어값을 상기 제어 기준에 적용한 결과에 따라 상기 미사일의 제어를 수행하는 단계;를 포함하는 것을 특징으로 하는 미사일 제어 방법.
  19. 제18 항에 있어서,
    상기 미사일을 제어하는 단계는,
    상기 미사일이 상기 타겟에 충돌할 때까지 상기 제어값을 연산하는 단계 및 상기 미사일의 제어를 수행하는 단계를 반복하는 것을 특징으로 하는 미사일 제어 방법.
  20. 제19 항에 있어서,
    상기 제어값을 연산하는 단계는,
    상기 제어값의 연산 회차에 따라 상기 보상 함수의 값이 증가하도록 상기 제어값을 연산하는 것을 특징으로 하는 미사일 제어 방법.
KR1020190053847A 2019-05-08 2019-05-08 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법 KR102166387B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190053847A KR102166387B1 (ko) 2019-05-08 2019-05-08 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190053847A KR102166387B1 (ko) 2019-05-08 2019-05-08 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법

Publications (1)

Publication Number Publication Date
KR102166387B1 true KR102166387B1 (ko) 2020-10-15

Family

ID=72882926

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190053847A KR102166387B1 (ko) 2019-05-08 2019-05-08 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법

Country Status (1)

Country Link
KR (1) KR102166387B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101601136B1 (ko) * 2015-06-12 2016-03-08 엘아이지넥스원 주식회사 소형 비행체 자세 제어 방법
KR101686929B1 (ko) * 2016-05-03 2016-12-15 엘아이지넥스원 주식회사 비행체의 구동 날개 얼라인먼트 장치 및 방법
KR20190053847A (ko) * 2016-09-28 2019-05-20 미츠비시 가스 가가쿠 가부시키가이샤 광학용 폴리에스터 필름 및 투명 도전성 필름

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101601136B1 (ko) * 2015-06-12 2016-03-08 엘아이지넥스원 주식회사 소형 비행체 자세 제어 방법
KR101686929B1 (ko) * 2016-05-03 2016-12-15 엘아이지넥스원 주식회사 비행체의 구동 날개 얼라인먼트 장치 및 방법
KR20190053847A (ko) * 2016-09-28 2019-05-20 미츠비시 가스 가가쿠 가부시키가이샤 광학용 폴리에스터 필름 및 투명 도전성 필름

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
1020190053847_0001

Similar Documents

Publication Publication Date Title
US11150655B2 (en) Method and system for training unmanned aerial vehicle control model based on artificial intelligence
Sun et al. Mapless motion planning system for an autonomous underwater vehicle using policy gradient-based deep reinforcement learning
Lin et al. Missile guidance law design using adaptive cerebellar model articulation controller
CN112947592B (zh) 一种基于强化学习的再入飞行器轨迹规划方法
CN111538241B (zh) 一种平流层飞艇水平轨迹智能控制方法
KR102244988B1 (ko) 군집 비행을 위한 복수 개의 무인항공기의 군집 비행 제어 시스템 및 방법
CN112286218B (zh) 基于深度确定性策略梯度的飞行器大迎角摇滚抑制方法
CN114115262B (zh) 基于方位角信息的多auv执行器饱和协同编队控制系统和方法
CN111898201B (zh) 一种空战模拟环境中的战斗机高精度自主攻击引导方法
Gaudet et al. Missile homing-phase guidance law design using reinforcement learning
Xiao et al. Flying through a narrow gap using end-to-end deep reinforcement learning augmented with curriculum learning and sim2real
KR102339273B1 (ko) 레이트 기반 자동조종을 위한 gbias
Peng et al. Research on hover control of AUV uncertain stochastic nonlinear system based on constructive backstepping control strategy
KR102166387B1 (ko) 미사일 제어 장치, 미사일 제어 시스템 및 미사일 제어 방법
Khamis et al. Nonlinear optimal tracking for missile gimbaled seeker using finite-horizon state dependent Riccati equation
KR100382526B1 (ko) 뉴럴 네트워크 궤도 명령 제어기
CN116627157B (zh) 一种运载火箭的运行控制方法、装置及设备
CN117419716A (zh) 无人机三维路径规划方法、系统、存储介质和电子设备
KR101846019B1 (ko) 비행체 위치 산출 장치 및 방법
KR102019876B1 (ko) 고속 수중유도무기를 위한 관성항법시스템의 항법 성능 검증 장치 및 방법
KR102455003B1 (ko) 무인 체계의 강화 학습을 위한 시뮬레이션 방법 및 장치
Thangeda et al. Synthesis of optimal trajectories in aerial engagements using differential evolution
CN115047769A (zh) 一种基于约束跟随的无人作战平台避障-到达控制方法
KR101833242B1 (ko) 비행체 항법 제어 시스템 및 방법
CN113777926A (zh) 小天体附着三维凸轨迹燃耗最优控制方法

Legal Events

Date Code Title Description
GRNT Written decision to grant