KR102662286B1 - 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법 - Google Patents
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법 Download PDFInfo
- Publication number
- KR102662286B1 KR102662286B1 KR1020230158926A KR20230158926A KR102662286B1 KR 102662286 B1 KR102662286 B1 KR 102662286B1 KR 1020230158926 A KR1020230158926 A KR 1020230158926A KR 20230158926 A KR20230158926 A KR 20230158926A KR 102662286 B1 KR102662286 B1 KR 102662286B1
- Authority
- KR
- South Korea
- Prior art keywords
- engagement
- artificial intelligence
- information
- command
- learning model
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 21
- 238000012549 training Methods 0.000 claims abstract description 111
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 79
- 238000004364 calculation method Methods 0.000 claims abstract description 40
- 230000008685 targeting Effects 0.000 claims abstract description 27
- 230000007613 environmental effect Effects 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 15
- 230000000007 visual effect Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 4
- 238000007726 management method Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 102100040653 Tryptophan 2,3-dioxygenase Human genes 0.000 description 1
- 101710136122 Tryptophan 2,3-dioxygenase Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F41—WEAPONS
- F41G—WEAPON SIGHTS; AIMING
- F41G3/00—Aiming or laying means
- F41G3/26—Teaching or practice apparatus for gun-aiming or gun-laying
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F41—WEAPONS
- F41A—FUNCTIONAL FEATURES OR DETAILS COMMON TO BOTH SMALLARMS AND ORDNANCE, e.g. CANNONS; MOUNTINGS FOR SMALLARMS OR ORDNANCE
- F41A33/00—Adaptations for training; Gun simulators
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F41—WEAPONS
- F41J—TARGETS; TARGET RANGES; BULLET CATCHERS
- F41J9/00—Moving targets, i.e. moving when fired at
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B9/00—Simulators for teaching or training purposes
- G09B9/003—Simulators for teaching or training purposes for military purposes and tactics
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Radar, Positioning & Navigation (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
Abstract
본 발명에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템은 상기 표적 개체의 인공지능 적용 여부에 기초하여 훈련 진행을 수행하는 훈련 제어부, 훈련 특성별로 설정된 표적 개체의 인공지능 설정 레벨 및 훈련 목적에 따른 학습모델을 로딩하는 학습모델 관리부, 상기 표적 개체의 다음 기동 명령 정보를 계산하는 기동 명령 계산부 및 상기 표적 개체의 다음 교전 명령 정보를 계산하는 교전 명령 계산부를 포함한다.
Description
본 발명은 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법에 관한 것이다.
종래의 군사 훈련 기술은 특정한 임무 및 상황에 대비하기 위해 아군 훈련생들에게 다양한 상황을 경험시키는 목적으로 사용되었다. 일반적으로 훈련을 위해 구축된 훈련장은 특정한 상황을 훈련하기 위하여 아군과 적군의 역할을 정의하고, 훈련 환경에서 발생할 특정 상황과 임무를 시뮬레이션하기 위한 시나리오를 생성하고, 시나리오를 재생하여 훈련을 실시한다. 여기에서, 시나리오는 전투상황, 작전상황, 비상상황 등을 포함할 수 있으며, 훈련 목적과 목표에 따라 다양한 상황이 고려될 수 있다. 또는, 훈련 환경에서 또 다른 훈련생들에게 적군 역할을 할당하여 훈련을 할 수도 있다.
특정한 상황의 시나리오는 훈련의 목적에 맞게 조금씩 수정하여 반복적으로 장비운용과 특정한 상황에 대한 훈련을 숙달한다. 훈련장은 훈련생들이 실제 장비를 직접 운용하고, 실제 환경을 모사하여 훈련할 수 있는 HW/SW로 구성되어 실제 환경과 동일한 상황에서 훈련할 수 있다.
한편, 훈련장에서는 실제 환경을 모의하고, 훈련 목적에 맞게 아군과 적군을 표적화하여 상황에 맞는 시나리오를 생성하고, 훈련생들은 실제 장비와 임무 환경을 사용하여 훈련을 수행한다. 아군 표적의 경우 훈련생들이 직접 운용하고, 적군 표적 개체는 시나리오 입력된 절차에 따라서 소프트웨어가 순차적으로 명령을 수행하거나 훈련 교관 또는 전문가에 의해직접 표적 개체가 제어되어 훈련이 진행되었다.
하지만, 이러한 종래기술의 경우 동일한 시나리오를 반복적으로 훈련하는 과정에서 훈련생들은 시나리오에 익숙해지고, 특정 상황에서 어떤 행동을 취해야 하는지 예측할 수 있게 된다. 이로 인해 훈련의 다양성이 부족하고, 실제 전투 상황에서 예상치 못한 상황에 대비하기 어려워질 수 있다.
또한, 적군 표적에 대한 대응 상황을 훈련 교관이 직접 판단하고 수동으로 제어해야 하는 경우, 훈련 교관의 주관과 경험에 따라 훈련 결과가 다를 수 있으며, 훈련에 대한 평가 집중력이 감소할 수 있다. 이로 인해 훈련의 일관성과 효율성이 부족할 수 있다.
본 발명이 해결하고자 하는 과제는 기존의 시나리오 기반 훈련도 제공할 뿐만 아니라, 정형화된 훈련에 익숙한 훈련생들의 예측된 행동을 예방하고, 훈련 교관의 훈련 통제 편의성을 제공하고, 평가에 대한 집중력 향상을 위한 인공지능을 이용하여 자율 기동 및 교전이 가능한 표적 솔루션을 제공할 수 있는, 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법에 관한 것이다.
다만, 본 발명이 해결하고자 하는 과제는 상기된 바와 같은 과제로 한정되지 않으며, 또다른 과제들이 존재할 수 있다.
상술한 과제를 해결하기 위한 본 발명의 제1 측면에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템은 표적 개체의 인공지능 적용 여부에 기초하여 훈련 진행을 수행하는 훈련 제어부, 훈련 특성별로 설정된 표적 개체의 인공지능 레벨 및 훈련 목적에 따른 학습모델을 로딩하는 학습모델 관리부, 상기 표적 개체의 다음 기동 명령 정보를 계산하는 기동 명령 계산부 및 상기 표적 개체의 다음 교전 명령 정보를 계산하는 교전 명령 계산부를 포함한다.
본 발명의 일부 실시예는, 훈련 목적에 대응하여 상기 학습모델을 생성하는 모델 생성부를 더 포함할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 모델 생성부는 발사한 무장이 목표한 표적 개체의 명중 여부 및 적군 표적 개체가 발사한 무장의 회피 또는 피격 여부 중 적어도 하나에 기초하여 상기 학습모델의 보상값을 적용할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 모델 생성부는 상기 표적 개체를 에이전트 요소로 설정하고, 시나리오, 환경 및 탐지 정보를 환경 요소로 설정하여 상기 학습모델에 대한 학습을 수행할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 훈련 제어부는 상기 인공지능 적용시, 상기 인공지능 레벨, 상기 훈련 목적, 시나리오 정보, 환경 및 탐지 정보를 포함하는 입력 데이터를 수집하여 상기 학습모델 관리부로 제공하고, 상기 학습모델 관리부는 상기 입력 데이터를 로딩한 학습모델에 입력하여 기동 명령 및 교전 명령을 출력할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 기동 명령 계산부는 상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 기동 명령을 계산하고, 계산 결과를 상기 훈련 제어부로 반환할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 교전 명령 계산부는 상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 교전 명령을 계산하고, 계산 결과를 상기 훈련 제어부로 반환할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 학습모델 관리부는 상기 인공지능 적용시 상기 인공지능 레벨을 확인하고, 상기 인공지능 레벨에 따라 룰 기반으로 학습된 학습모델 또는 완전 자율 학습모델을 선택적으로 적용할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 훈련 제어부는 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 상기 기동 명령 계산부 및 교전 명령 계산부로 제공할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 기동 명령 계산부는 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 기동 명령을 계산할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 교전 명령 계산부는 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 교전 명령을 계산할 수 있다.
또한, 본 발명의 제2 측면에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템에 의해 수행되는 방법은 시나리오, 훈련 목적, 환경 정보 및 표적 개체의 탐지 정보를 획득하는 단계; 상기 표적 개체에 대한 인공지능 적용 여부를 판단하는 단계; 상기 판단 결과 인공지능 적용시, 훈련 특성별로 설정된 표적 개체의 인공지능 레벨 및 훈련 목적에 따른 학습모델을 로딩하는 단계; 상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 기동 명령 정보를 계산하는 단계; 및 상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 교전 명령 정보를 계산하는 단계를 포함한다.
본 발명의 일부 실시예에 있어서, 상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 기동 명령 정보를 계산하는 단계; 및 상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 교전 명령 정보를 계산하는 단계는, 상기 인공지능 레벨, 상기 훈련 목적, 시나리오 정보, 환경 및 탐지 정보를 포함하는 입력 데이터를 인공지능 모델에 입력하여 출력되는 출력값을 기반으로 상기 기동 명령 정보 및 교전 명령 정보를 출력할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 기동 명령 정보를 계산하는 단계는, 상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 기동 명령을 계산하고, 계산 결과를 훈련 제어부로 반환할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 교전 명령 정보를 계산하는 단계는, 상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 교전 명령을 계산하고, 계산 결과를 훈련 제어부로 반환할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 판단 결과 인공지능 적용시, 훈련 특성별로 설정된 표적 개체의 인공지능 레벨 및 훈련 목적에 따른 학습모델을 로딩하는 단계는, 상기 인공지능 적용시 상기 인공지능 레벨을 확인하고, 상기 인공지능 레벨에 따라 룰 기반으로 학습된 학습모델 또는 완전 자율 학습모델을 선택적으로 적용할 수 있다.
본 발명의 일부 실시예는, 상기 판단 결과 인공지능 미적용시, 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 상기 기동 명령 및 교전 명령을 계산하는 단계를 더 포함할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 기동 명령 및 교전 명령을 계산하는 단계는, 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 기동 명령을 계산할 수 있다.
본 발명의 일부 실시예에 있어서, 상기 기동 명령 및 교전 명령을 계산하는 단계는, 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 교전 명령을 계산할 수 있다.
본 발명의 일부 실시예는, 모델 생성부는 상기 표적 개체를 에이전트 요소로 설정하고, 시나리오, 환경 및 탐지 정보를 환경 요소로 설정하여 상기 학습모델에 대한 학습을 수행하는 단계를 더 포함할 수 있다.
상술한 과제를 해결하기 위한 본 발명의 다른 면에 따른 컴퓨터 프로그램은, 하드웨어인 컴퓨터와 결합되어 상기 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법을 실행하며, 컴퓨터 판독가능 기록매체에 저장된다.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
전술한 본 발명의 일 실시예에 의하면, 가변적인 표적 개체의 행동을 제공함으로써, 동일한 시나리오를 반복 훈련하더라도 항상 새로운 상황과 도전을 제공할 수 있으며, 이로 인해 훈련생들은 예측 가능한 행동을 할 수 없으며, 더욱 현실적이고 다양한 훈련 제공이 가능하다.
또한, 본 발명은 표적 개체의 인공지능 적용 레벨을 조절하여 룰 기반 또는 완전 자율 동작을 조절할 수 있는바, 훈련 목적 및 요구에 따라 표적 개체가 자율적으로 행동하거나, 훈련 교관의 룰에 따라 동작하게 할 수 있다.
또한, 본 발명은 인공지능을 활용하여 적군 표적의 기동 및 교전 판단 명령을 자동으로 계산하고, 훈련 교관의 직접적인 개입을 최소화할 수 있도록 함으로써 훈련 교관들은 훈련의 진행, 평가, 및 훈련생 지도에 집중할 수 있으며, 인력 및 시간 절약이 가능하게 한다.
또한, 본 발명은 계속해서 발전하는 인공지능 학습 모델을 활용하면서, 훈련 교관이 원하는 방향으로 인공지능의 학습을 조절할 수 있으며, 또한, 언제든지 원래 시나리오로 돌아갈 수 있는 옵션을 제공하므로, 훈련 방법을 유연하게 조절할 수 있다는 장점이 있다.
결과적으로, 다양한 상황과 예측 불가능한 훈련을 통해 훈련생들은 현실적이고 다양한 상황에 대비하며, 훈련 목표를 더 효과적으로 달성할 수 있도록 하며 또한, 자동화된 훈련 교관 기능은 훈련 시간과 비용을 절약하고, 훈련 품질을 향상시킬 수 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
이하에 첨부되는 도면들은 본 실시 예에 관한 이해를 돕기 위한 것으로, 상세한 설명과 함께 실시 예들을 제공한다. 다만, 본 실시 예의 기술적 특징이 특정 도면에 한정되는 것은 아니며, 각 도면에서 개시하는 특징들은 서로 조합되어 새로운 실시 예로 구성될 수 있다.
도 1은 본 발명의 일 실시예에 따른 표적 솔루션 제공 시스템의 블록도이다.
도 2는 본 발명의 일 실시예에서의 모델 생성부를 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에서 생성된 학습모델의 일 예시를 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 방법의 순서도이다.
도 1은 본 발명의 일 실시예에 따른 표적 솔루션 제공 시스템의 블록도이다.
도 2는 본 발명의 일 실시예에서의 모델 생성부를 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에서 생성된 학습모델의 일 예시를 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 방법의 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하에서는 도 1 내지 도 3을 참조하여 본 발명의 일 실시예에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템(100, 이하 표적 솔루션 제공 시스템)에 대해 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른 표적 솔루션 제공 시스템(100)의 블록도이다.
본 발명의 일 실시예에 따른 표적 솔루션 제공 시스템(100)은 모델 생성부(110), 훈련 제어부(120), 학습모델 관리부(130), 기동 명령 계산부(140) 및 교전 명령 계산부(150)를 포함한다.
먼저, 모델 생성부(110)는 훈련 목적에 대응하여 학습 모델을 생성한다. 이때, 모델 생성부(110)는 정책 최적화를 중심으로 하는 알고리즘인 TRPO, PPO, 강화학습에서 Q-값 기반의 방법을 사용하여 성능 향상을 유도하는 DQN, DDQN, 시간적 차이 네트워크를 기반으로 하는 강화학습 알고리즘인 SQN 등 훈련 목적 및 방법에 따라서 다양한 강화학습 알고리즘 중 어느 하나를 적용할 수 있다.
도 2는 본 발명의 일 실시예에서의 모델 생성부(110)를 설명하기 위한 도면이다. 도 3은 본 발명의 일 실시예에서 생성된 학습모델의 일 예시를 도시한 도면이다.
일 실시예로, 모델 생성부(110)는 훈련 목적, 시나리오 및 표적 개체 정보를 이용하여 상황에 적합한 행동을 하게 되면 높은 보상값을 부여하고, 상황에 적합하지 않은 행동을 하면 낮은 보상값을 부여하는 강화학습 기반 학습을 수행할 수 있다. 이때, 적합 및 비적합 행동을 분류하는 것은 훈련별, 훈련 방법 및 훈련 목적에 따라 달라질 수 있다
하지만, 공통적으로 모델 생성부(110)는 발사한 무장이 목표한 표적 개체의 명중 여부 및 적군 표적 개체가 발사한 무장의 회피 또는 피격 여부 중 적어도 하나에 기초하여 상기 학습모델의 보상값을 적용할 수 있다.
예를 들어, 발사한 무장이 목표한 표적 개체를 명중한 경우나 적군 표적 개체가 발사한 무장을 회피한 경우에는 높은 보상값을 부여할 수 있도록 한다. 반대로, 발사한 무장이 목표한 표적 개체를 명중하지 못한 경우나 적군 표적 개체가 발사한 무장에 피격된 경우에는 낮은 보상값을 부여할 수 있도록 한다. 높은 보상값에 따라 학습이 될 경우에는 생존능력을 향상시킬 수 있도록 하는데 기여할 수 있으며, 반대로 낮은 보상값에 따라 학습될 경우에는 적군의 공격을 피하는 능력을 향상시기키 위한 피드백으로 작용하여 학습될 수 있다.
한편, 도 2를 참조하면, 모델 생성부(110)는 표적 개체를 에이전트(Agent) 요소로 설정하고, 시나리오, 환경 및 탐지 정보를 환경(Environment) 요소로 설정하여 학습모델에 대한 학습을 수행할 수 있다. 에이전트 요소는 훈련 목적에 따라 표적 개체의 행동을 결정하고, 이후의 행동에 관여한다. 또한, 환경 요소는 에이전트가 상호작용하고 행동을 시험하는 공간 또는 시나리오로, 표적 개체들의 환경을 모의하며, 표적 개체들의 상호작용 및 행동 결과를 제공한다.
이러한 학습 모델의 학습은 처음에는 인공신경망은 학습되지 않은 상태에서 무작위로 행동을 선택하고, 이로 인해 낮은 보상을 얻을 수 있다. 그러나 반복 수행하면서 우연히 높은 보상을 얻게 되고, 이러한 경험을 토대로 인공신경망은 높은 보상을 얻을 확률이 높은 행동을 선택하도록 학습된다. 이처럼 모델 학습부는 보상을 최대화하기 위한 최적의 정책을 학습할 수 있도록 한다.
도 3을 참조하면, 이와 같이 학습된 학습 모델은 표적 개체의 기동 또는 교전 명령 정보를 제공한다. 표적 개체의 상태, 표적 개체의 무장 및 센서, 탐지 결과, 표적 개체의 환경 등의 정보를 입력으로 받아, 표적 개체의 다음 번 기동 및 교전 명령을 계산하기 위한 출력값을 선택하여 제공한다.
다음으로, 훈련 제어부(120)는 표적 개체의 인공지능 적용 여부에 기초하여 훈련 진행을 수행한다. 그리고 학습모델 관리부(130)는 훈련 특성별로 설정된 표적 개체의 인공지능 레벨 및 훈련 목적에 따른 학습모델을 로딩한다.
일 실시예로, 훈련 제어부(120)는 인공지능 적용시에는 인공지능 레벨, 훈련 목적, 시나리오 정보, 환경 및 탐지 정보를 포함하는 입력 데이터를 수집하여 학습모델 관리부(130)로 제공할 수 있다.
이에 따라 학습모델 관리부(130)는 입력 데이터를 로딩한 학습모델에 입력하여 현재 상황에 적합한 기동 명령 및 교전 명령을 출력할 수 있다.
이와 달리, 훈련 제어부(120)는 인공지능 미적용시 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기동 명령 계산부(140) 및 교전 명령 계산부(150)로 제공할 수 있다.
기동 명령 계산부(140)는 표적 개체의 다음 기동 명령 정보를 계산한다. 이때, 기동 명령 계산부(140)는 인공지능 미적용시 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 기동 명령을 계산할 수 있다. 이와 달리, 기동 명령 계산부(140)는 인공지능 적용시 학습모델의 출력값을 기반으로 기동 명령을 계산하고, 계산 결과를 상기 훈련 제어부(120)로 반환할 수 있다.
교전 명령 계산부(150)는 표적 개체의 다음 교전 명령 정보를 계산한다. 이때, 교전 명령 계산부(150)는 인공지능 미적용시 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 교전 명령을 계산할 수 있다. 이와 달리, 교전 명령 계산부(150)는 인공지능 적용시 학습모델의 출력값을 기반으로 교전 명령을 계산하고, 계산 결과를 상기 훈련 제어부(120)로 반환할 수 있다.
이하에서는 도 4를 참조하여, 본 발명의 일 실시예에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템(100)에 의해 수행되는 방법을 설명하도록 한다.
도 4는 본 발명의 일 실시예에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 방법의 순서도이다.
먼저, 시나리오, 훈련 목적, 환경 정보를 획득하고(S101), 또한 표적 개체의 탐지 정보를 획득한다(S102).
다음으로, 표적 개체에 대한 인공지능 적용 여부를 판단한다(S103).
판단 결과 인공지능 적용시에는(S103-Y) 훈련 특성별로 설정된 표적 개체의 인공지능 설정 레벨 및 훈련 목적에 따른 학습모델을 로딩한다(S104). 이때, 본 발명의 일 실시예는 표적 개체의 인공지능 설정 레벨을 확인하여 인공지능 설정 레벨이 낮은 경우 룰 기반으로 학습된 모델을 적용하여(S105) 기동 및 교전 명령을 계산하거나(S107), 또는 표적 개체의 인공지능 설정 레벨이 높은 완전 자율 학습모델 적용이 가능한 경우 완전 자율 학습모델을 적용하여(S106) 기동 및 교전 명령을 계산할 수 있다(S107).
이 경우, 본 발명의 일 실시예는 인공지능 레벨, 훈련 목적, 시나리오 정보, 환경 및 탐지 정보를 포함하는 입력 데이터를 인공지능 모델에 입력하여 출력되는 출력값을 기반으로 기동 명령 정보 및 교전 명령 정보를 출력할 수 있다.
이와 달리, 판단 결과 인공지능 미적용시에는(S103-N), 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 기동 명령 및 교전 명령을 계산할 수 있다(S108).
이 경우, 본 발명의 일 실시예는 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 기동 명령 및 교전 명령을 계산할 수 있다.
이와 같이 기동 명령 및 교전 명령이 계산되면, 기동 명령에 따른 기동(속도, 침로, 심도/고도)을 수행하고(S109), 교전 명령에 따른 교전(무장할당/무장발사)을 수행할 수 있다(S110).
한편, 상술한 설명에서, 단계 S101 내지 S110는 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다. 아울러, 기타 생략된 내용이라 하더라도 도 1 내지 도 3에 기술된 내용과 도 4에 기술된 내용은 상호 적용될 수 있다.
이상에서 전술한 본 발명의 일 실시예에 따른 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템(100) 및 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다.
상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, Ruby, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 표적 솔루션 제공 시스템
110: 모델 생성부
120: 훈련 제어부
130: 학습모델 관리부
140: 기동 명령 계산부
150: 교전 명령 계산부
110: 모델 생성부
120: 훈련 제어부
130: 학습모델 관리부
140: 기동 명령 계산부
150: 교전 명령 계산부
Claims (20)
- 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템에 있어서,
표적 개체의 인공지능 적용 여부에 기초하여 훈련 진행을 수행하는 훈련 제어부,
훈련 특성별로 설정된 표적 개체의 인공지능 설정 레벨 및 훈련 목적에 따른 학습모델을 로딩하는 학습모델 관리부,
상기 표적 개체의 다음 기동 명령 정보를 계산하는 기동 명령 계산부 및
상기 표적 개체의 다음 교전 명령 정보를 계산하는 교전 명령 계산부를 포함하는,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제1항에 있어서,
훈련 목적에 대응하여 상기 학습모델을 생성하는 모델 생성부를 더 포함하는,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제2항에 있어서,
상기 모델 생성부는 발사한 무장이 목표한 표적 개체의 명중 여부 및 적군 표적 개체가 발사한 무장의 회피 또는 피격 여부 중 적어도 하나에 기초하여 상기 학습모델의 보상값을 적용하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제2항에 있어서,
상기 모델 생성부는 상기 표적 개체를 에이전트 요소로 설정하고, 시나리오, 환경 및 탐지 정보를 환경 요소로 설정하여 상기 학습모델에 대한 학습을 수행하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제1항에 있어서,
상기 훈련 제어부는 상기 인공지능 적용시, 상기 인공지능 설정 레벨, 상기 훈련 목적, 시나리오 정보, 환경 및 탐지 정보를 포함하는 입력 데이터를 수집하여 상기 학습모델 관리부로 제공하고,
상기 학습모델 관리부는 상기 입력 데이터를 로딩한 학습모델에 입력하여 기동 명령 및 교전 명령을 출력하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제5항에 있어서,
상기 기동 명령 계산부는 상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 기동 명령을 계산하고, 계산 결과를 상기 훈련 제어부로 반환하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제5항에 있어서,
상기 교전 명령 계산부는 상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 교전 명령을 계산하고, 계산 결과를 상기 훈련 제어부로 반환하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제1항에 있어서,
상기 학습모델 관리부는 상기 인공지능 적용시 상기 인공지능 레벨을 확인하고, 상기 인공지능 레벨에 따라 룰 기반으로 학습된 학습모델 또는 완전 자율 학습모델을 선택적으로 적용하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제1항에 있어서,
상기 훈련 제어부는 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 상기 기동 명령 계산부 및 교전 명령 계산부로 제공하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제9항에 있어서,
상기 기동 명령 계산부는 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 기동 명령을 계산하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 제9항에 있어서,
상기 교전 명령 계산부는 상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 교전 명령을 계산하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템.
- 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템에 의해 수행되는 방법에 있어서,
시나리오, 훈련 목적, 환경 정보 및 표적 개체의 탐지 정보를 획득하는 단계;
상기 표적 개체에 대한 인공지능 적용 여부를 판단하는 단계;
상기 판단 결과 인공지능 적용시, 훈련 특성별로 설정된 표적 개체의 인공지능 레벨 및 훈련 목적에 따른 학습모델을 로딩하는 단계;
상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 기동 명령 정보를 계산하는 단계; 및
상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 교전 명령 정보를 계산하는 단계를 포함하는,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제12항에 있어서,
상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 기동 명령 정보를 계산하는 단계; 및 상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 교전 명령 정보를 계산하는 단계는,
상기 인공지능 레벨, 상기 훈련 목적, 시나리오 정보, 환경 및 탐지 정보를 포함하는 입력 데이터를 인공지능 모델에 입력하여 출력되는 출력값을 기반으로 상기 기동 명령 정보 및 교전 명령 정보를 출력하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제13항에 있어서,
상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 기동 명령 정보를 계산하는 단계는,
상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 기동 명령을 계산하고, 계산 결과를 훈련 제어부로 반환하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제13항에 있어서,
상기 학습모델을 통해 출력되는 상기 표적 개체의 다음 교전 명령 정보를 계산하는 단계는,
상기 인공지능 적용시 상기 학습모델의 출력값을 기반으로 상기 교전 명령을 계산하고, 계산 결과를 훈련 제어부로 반환하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제12항에 있어서,
상기 판단 결과 인공지능 적용시, 훈련 특성별로 설정된 표적 개체의 인공지능 레벨 및 훈련 목적에 따른 학습모델을 로딩하는 단계는,
상기 인공지능 적용시 상기 인공지능 레벨을 확인하고, 상기 인공지능 레벨에 따라 룰 기반으로 학습된 학습모델 또는 완전 자율 학습모델을 선택적으로 적용하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제12항에 있어서,
상기 판단 결과 인공지능 미적용시, 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 상기 기동 명령 및 교전 명령을 계산하는 단계를 더 포함하는,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제17항에 있어서,
상기 기동 명령 및 교전 명령을 계산하는 단계는,
상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 기동 명령을 계산하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제17항에 있어서,
상기 기동 명령 및 교전 명령을 계산하는 단계는,
상기 인공지능 미적용시 상기 표적 개체의 정보, 환경 정보 및 시나리오 정보를 기반으로 정해진 훈련 시나리오에 따른 다음 시각 표적의 교전 명령을 계산하는 것인,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
- 제12항에 있어서,
모델 생성부는 상기 표적 개체를 에이전트 요소로 설정하고, 시나리오, 환경 및 탐지 정보를 환경 요소로 설정하여 상기 학습모델에 대한 학습을 수행하는 단계를 더 포함하는,
자율 기동 및 교전이 가능한 표적 솔루션 제공 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230158926A KR102662286B1 (ko) | 2023-11-16 | 2023-11-16 | 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230158926A KR102662286B1 (ko) | 2023-11-16 | 2023-11-16 | 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102662286B1 true KR102662286B1 (ko) | 2024-05-03 |
Family
ID=91077148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230158926A KR102662286B1 (ko) | 2023-11-16 | 2023-11-16 | 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102662286B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008180784A (ja) * | 2007-01-23 | 2008-08-07 | Mitsubishi Electric Corp | シミュレーション装置 |
KR101345645B1 (ko) * | 2011-10-26 | 2013-12-27 | 국방과학연구소 | 목표지향 행위계획 결정이 가능한 모의훈련 시스템 및 목표지향 행위계획 결정방법 |
KR20140145446A (ko) * | 2013-06-13 | 2014-12-23 | 국방과학연구소 | 무기체계 전투효과분석을 위한 모의 전투 시뮬레이션 시스템 및 그 방법 |
KR102561498B1 (ko) * | 2021-05-27 | 2023-08-01 | 한국과학기술원 | 군사 시뮬레이션 시스템 및 그의 동작 방법 |
-
2023
- 2023-11-16 KR KR1020230158926A patent/KR102662286B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008180784A (ja) * | 2007-01-23 | 2008-08-07 | Mitsubishi Electric Corp | シミュレーション装置 |
KR101345645B1 (ko) * | 2011-10-26 | 2013-12-27 | 국방과학연구소 | 목표지향 행위계획 결정이 가능한 모의훈련 시스템 및 목표지향 행위계획 결정방법 |
KR20140145446A (ko) * | 2013-06-13 | 2014-12-23 | 국방과학연구소 | 무기체계 전투효과분석을 위한 모의 전투 시뮬레이션 시스템 및 그 방법 |
KR102561498B1 (ko) * | 2021-05-27 | 2023-08-01 | 한국과학기술원 | 군사 시뮬레이션 시스템 및 그의 동작 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11491400B2 (en) | Method, apparatus, and device for scheduling virtual objects in virtual environment | |
CN101964019A (zh) | 基于Agent技术的对抗行为建模仿真平台及仿真方法 | |
US20210078735A1 (en) | Satellite threat mitigation by application of reinforcement machine learning in physics based space simulation | |
CN111783944A (zh) | 基于组合训练的规则嵌入多智能体强化学习方法及装置 | |
CN115300910B (zh) | 基于多智能体强化学习的去混淆游戏策略模型生成方法 | |
Zhou et al. | An air combat decision learning system based on a brain-like cognitive mechanism | |
KR20220086873A (ko) | 숙련도 조절이 가능한 npc 생성 장치 및 방법 | |
Johnson | Artificial intelligence systems: unique challenges for defense applications | |
Rowe et al. | Toward automated scenario generation with deep reinforcement learning in gift | |
Källström et al. | Design of simulation-based pilot training systems using machine learning agents | |
KR102662286B1 (ko) | 자율 기동 및 교전이 가능한 표적 솔루션 제공 시스템 및 방법 | |
Ludwig et al. | Developing an adaptive opponent for tactical training | |
US20240320551A1 (en) | Autonomous virtual entities continuously learning from experience | |
Dimitriu et al. | A Reinforcement Learning Approach to Military Simulations in Command: Modern Operations | |
CN114935893A (zh) | 基于双层模型的作战场景中飞机的动作控制方法及装置 | |
Möbius et al. | AI-based Military Decision Support Using Natural Language | |
Allen | Enlisting AI in Course of Action Analysis as Applied to Naval Freedom of Navigation Operations | |
van Oijen et al. | Teaching reinforcement learning agents with adaptive instructional systems | |
Mendi et al. | Applications of Reinforcement Learning and its Extension to Tactical Simulation Technologies | |
Wu et al. | A training model of wargaming based on imitation learning and deep reinforcement learning | |
CN110515297A (zh) | 基于冗余肌肉骨骼系统的阶段式运动控制方法 | |
Cosma et al. | IMPLEMENTING A SOFTWARE MODELING--SIMULATION IN MILITARY TRAINING. | |
Li et al. | A study on the behavior modeling method of helicopter force | |
Ioerger et al. | On the use of intelligent agents as partners in training systems for complex tasks1 | |
Song et al. | Research on Behavior Modeling Method of Agent-Based CGF. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |