KR20210039640A - 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법 - Google Patents

비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법 Download PDF

Info

Publication number
KR20210039640A
KR20210039640A KR1020190122103A KR20190122103A KR20210039640A KR 20210039640 A KR20210039640 A KR 20210039640A KR 1020190122103 A KR1020190122103 A KR 1020190122103A KR 20190122103 A KR20190122103 A KR 20190122103A KR 20210039640 A KR20210039640 A KR 20210039640A
Authority
KR
South Korea
Prior art keywords
data
military equipment
maintenance history
unstructured
monitoring system
Prior art date
Application number
KR1020190122103A
Other languages
English (en)
Other versions
KR102303442B1 (ko
Inventor
이우성
이용희
오성준
안덕호
Original Assignee
(주)디지탈쉽
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)디지탈쉽 filed Critical (주)디지탈쉽
Priority to KR1020190122103A priority Critical patent/KR102303442B1/ko
Publication of KR20210039640A publication Critical patent/KR20210039640A/ko
Application granted granted Critical
Publication of KR102303442B1 publication Critical patent/KR102303442B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 일실시예에 따른, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 군 장비의 정비 이력에 관한 비정형 텍스트 데이터를 수집하는 데이터 수집부, 상기 수집된 데이터를 그리드 형식으로 출력하는 데이터 출력부, 상기 출력된 데이터 중 목표 칼럼의 단어를 추출하여 분석하는 데이터 분석부, 상기 분석된 데이터를 벡터화하여 모델을 생성하는 모델 생성부 및 상기 생성된 모델을 네트워크 형태로 시각화하는 데이터 시각화부를 포함한다.

Description

비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법{A SYSTEM AND METHOD FOR MORNITORING MAINTENANCE HISTORY OF MILITARY EQUIPMENT USING UNSTRUCTURED DATA}
본 발명은 비정형 데이터인 군 장비 정비 이력을 정형화하여 모니터링하는 시스템 및 방법에 관한 것이다.
이하에 기술되는 내용은 단순히 본 발명에 따른 일 실시예와 관련되는 배경 정보만을 제공할 뿐 종래기술을 구성하는 것은 아니다.
군에서 운용하는 전투기, 전차, 군용 트럭, 전투함 등의 군 장비들은 매우 고가이면서, 극한의 하중 하에서 높은 신뢰도가 요구되는 것들이다. 그러나 이들은 운용 중 마모, 균열 결함(fault)이나 성능저하(degradation)로 인한 손상(damage)이 어쩔 수 없이 발생하게 되며, 이를 예방하기 위해, 설계단계에서 수명기간 중 고장이 발생하지 않도록 원천 예방 설계를 하거나 운용 중 검사와 정비를 정기적으로 수행해야 한다.
과거 군 장비 정비기술은 고장이 발생하면 수리하는 사후정비(Corrective Maintenance)에 의존하였으나, 현재의 군 장비 고장 예측 기술은 예방정비(Preventice Maintenance), 즉 정기 유지보수에 의존하고 있다. 그러나 이는 실제 결함수준과 관계없이 무조건 정비를 실시하므로 잦은 중단(Down Time)과 부품 교체로 높은 비용이 발생한다.
따라서, 이러한 문제를 해결하기 위해 예측 정비(Predictive Maintenance) 기술이 연구되고 있다. 예측 정비는 결함 발생 패턴을 분석하여 고장이 발생하기 전 조기에 고장을 예방하는 기술이다. 따라서, 기존 무조건 정비를 실시하던 계획 정비가 아닌 예측 정비를 실시함으로써 정비에 대한 시간과 비용적 절감을 이룰 수 있다.
군에서는 다양한 군 장비들에 대해 장기적으로 운용에 필요한 예산을 확보해야 하는데, 정확성이 낮은 수요 예측 결과는 예산을 낭비하고, 장비 가동률을 저하시키는 문제가 있었다.
일반적으로 군에서 군 장비(항공기, 전차 등)를 운용할 경우, 정비사가 정비 진행 후, 결함 내용, 작업 내용, 조치 내용 등의 정비 이력을 시스템에 저장한다. 그러나, 군 장비의 정비 이력은 텍스트나 이미지 등의 비정형 데이터로 구성되며, 정형화된 데이터가 아니기 때문에, 현재 정비 상태의 확인과 수리 부속 예측 등의 데이터로 활용하기가 어려운 점이 있었다. 또한, 각 부대별, 정비사별로 고장 내용을 기록하는 방식에 대한 차이로 인해 예측 정비 모델의 변수로서 활용하기가 어려운 실정이다.
이러한 비정형 데이터에는 결함내용, 조치내용 등 고장 예측을 위한 주요 항목이 포함되기 때문에 성공적인 고장 예측을 위해서는 반드시 비정형 데이터에 대한 활용이 필요하다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 군 장비의 정비내용 및 고장 내용 등의 기존에 활용하기 어려웠던 비정형 데이터를 정형화하여 사용자에게 시각화 화면을 제공하여 비정형 데이터를 활용하는데 어려움을 줄이는, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 제공하고자 한다.
본 발명의 일실시예에 따르면, 군 장비의 정비 이력 데이터를 기반으로 사용자가 원하는 칼럼에 대한 비정형 데이터를 분석하고, 단어 간의 연관 관계를 시각화하여 나타낼 수 있도록 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 제공하고자 한다.
본 발명의 일실시예에 따르면, 비정형 데이터를 정형화하여 사용자에게 시각화 화면을 제공하여 군 장비 가동률을 향상시키고, 운영 유지비를 최적화할 수 있도록 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 제공하고자 한다.
다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또다른 기술적 과제들이 존재할 수 있다.
본 발명의 일실시예에 따른, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 군 장비의 정비 이력에 관한 비정형 텍스트 데이터를 수집하는 데이터 수집부, 상기 수집된 데이터를 그리드 형식으로 출력하는 데이터 출력부, 상기 출력된 데이터 중 목표 칼럼의 단어를 추출하여 분석하는 데이터 분석부, 상기 분석된 데이터를 벡터화하여 모델을 생성하는 모델 생성부 및 상기 생성된 모델을 네트워크 형태로 시각화하는 데이터 시각화부를 포함할 수 있다.
일실시예에 따르면, 상기 데이터 분석부는 상기 목표 칼럼의 비정형 데이터를 형태소 단위로 나누고, 각각의 형태소에 품사 정보를 부착할 수 있다.
일실시예에 따르면, 상기 데이터 분석부는 상기 품사 정보를 조사 그룹, 명사 그룹 및 기타 그룹으로 그룹화할 수 있다.
일실시예에 따르면, 상기 조사그룹은 접속조사, 부사격조사, 인용격조사 및 보조사를 포함하고, 상기 명사 그룹은 의존명사, 일반명사, 고유명사 및 대명사를 포함하고, 상기 기타 그룹은 형용사와 동사를 포함할 수 있다.
일실시예에 따르면, 상기 모델 생성부는 Word2vec을 이용해서 단어를 벡터화할 수 있다.
일실시예에 따르면, 상기 데이터 시각화부는 시각화에 사용될 단어와 단어의 빈도수를 출력하고, 상기 모델 생성부에서 생성된 모델들을 상기 빈도수를 기초로 시각화할 수 있다.
본 발명의 일실시예에 따르면, 군 장비의 정비내용 및 고장 내용 등의 기존에 활용하기 어려웠던 비정형 데이터를 정형화하여 사용자에게 시각화 화면을 제공하여 비정형 데이터를 활용하는데 어려움을 줄이는, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 제공할 수 있다.
본 발명의 일실시예에 따르면, 군 장비의 정비 이력 데이터를 기반으로 사용자가 원하는 칼럼에 대한 비정형 데이터를 분석하고, 단어 간의 연관 관계를 시각화하여 나타낼 수 있도록 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 제공할 수 있다.
본 발명의 일실시예에 따르면, 비정형 데이터를 정형화하여 사용자에게 시각화 화면을 제공하여 군 장비 가동률을 향상시키고, 운영 유지비를 최적화할 수 있도록 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 제공할 수 있다.
따라서, 비정형 데이터를 정형화시키는 기술을 이용하여 고장 예측 모델에 주요 변수로 활용함으로써 고장 예측 모델의 성능을 향상시킬 수 있다.
도 1은 본 발명의 실시예에 따른 군 장비의 수리 부속 수요와 정비 수요를 예측하는 시스템을 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 설명하기 위한 도면이다.
도 3은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 비정형 데이터를 저장하기 위해 파일을 업로드하는 방식으ㄹ 설명하기 위한 도면이다.
도 4는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 데이터의 출력 방식을 설명하기 위한 도면이다.
도 5는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 추출될 단어 타입을 선택하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 형태소 분석이 완료된 출력 데이터를 설명하기 위한 도면이다.
도 7은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 추출된 단어의 빈도수를 출력한 데이터를 설명하기 위한 도면이다.
도 8은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 모델을 생성하는 방식을 설명하기 위한 도면이다.
도 9는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 시각화한 데이터를 설명하기 위한 도면이다.
도10은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 수행하는 동작을 설명하기 위한 흐름도이다.
본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템의 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 군 장비의 수리 부속 수요와 정비 수요를 예측하는 시스템을 설명하기 위한 도면이다.
도 1을 참조하면, 군 장비의 수리 부속 수요와 정비 수요를 예측하는 시스템은 예측에 필요한 각종 비정형/정형 데이터를 저장하고 있는 데이터 저장부(110), 수리부속/정비 이력에 대한 빅데이터 통합 관리부(120) 및 지능형 수리부속 수요 및 정비 수요 예측부(130)를 포함할 수 있다.
일실시예에 따르면, 군 장비의 가동률을 향상시키고, 운영 유지비를 최적화하기 위해, 정비 이력 데이터를 분석하여 수리 부속 수요와 정비 수요를 예측하는 시스템이 개시된다. 이를 통해서 수리 부속의 수요와 정비 수요의 예측 정확도를 높이고, 군 장비의 고장을 미리 예측할 수 있다.
이때, 군 장비의 수리 부속과 정비 이력에 대한 데이터는 비정형 데이터 형식으로 구성되기 때문에 빅데이터로 활용하기 위해서는 빅데이터 정제 및 정형화 기술이 필요하다.
여기서 정비 이력에 대한 비정형 데이터는 예를 들면, "전/후방석 ECS MODE LAMP 1EA 씩 안 들어옴"과 같은 데이터를 말한다. 현재 군 장비의 정비 이력은 상기 예와 같이 텍스트로 구성된 데이터를 포함하고 있어, 빅데이터로 활용하기가 어려운 문제가 있었다.
일실시예에 따르면, 데이터 저장부(110)는 전차 데이터(111), 항공 데이터(112) 등의 군 장비의 정비 이력에 대한 데이터를 저장할 수 있다. 여기서, 전차 데이터(111)는 전차의 정비 이력에 대한 데이터를 포함하며, 항공 데이터(112)는 항공기의 정비 이력에 대한 데이터를 포함할 수 있다.
본 명세서에서는 전차 데이터와 항공 데이터에 대해서 설명하고 있지만, 다른 군 장비 데이터(예를 들면, 군용 트럭 데이터, 군함대 데이터 등)에 대한 내용을 포함할 수도 있다.
일실시예에 따르면, 수리부속/정비 이력에 대한 빅데이터 통합 관리부(120)는 데이터를 수집/통합하는 데이터 수집부(121), 수집된 데이터를 정제하는 데이터 정제부(122) 및 정제된 데이터를 정형화하는 데이터 정형화부(123)를 포함할 수 있다.
일실시예에 따른 데이터 수집부(121)는 데이터 저장부(110)로부터 군 장비의 정비 이력에 대한 정형화된 데이터 및 비정형화된 데이터를 수집할 수 있다.
일실시예에 따른 데이터 정제부(122)는 데이터 수집부(121)에서 수집된 데이터에 대한 이상치나 결측값을 처리하여 정제할 수 있다.
일실시예에 따른 데이터 정형화부(123)는 데이터 정제부(122)에서 정제된 데이터를 미리 정해진 방식에 따라 정형화할 수 있다. 데이터의 정형화에 대한 보다 구체적인 설명은 도 3 내지 도 9를 통해서 하도록 한다.
일실시예에 따르면, 지능형 수리부속 수요 및 정비 수요 예측부(130)는 수리부속 수요 예측부(131) 및 정비 수요 예측부(132)를 포함할 수 있다. 빅데이터 통합 관리부(120)를 통해서 정형화된 데이터를 활용하면, 종래의 비정형화된 정비 이력에 대한 데이터를 이용해서 수리부속의 수요와 정비 수요를 미리 예측하여 군 장비의 가동률을 향상시키고 운영 유지비를 최적화할 수 있다.
도 2는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템을 설명하기 위한 도면이다.
도 2를 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템(200)은 데이터 수집부(210), 데이터 출력부(220), 데이터 분석부(230), 모델 생성부(240) 및 데이터 시각화부(250)를 포함할 수 있다.
일실시예에 따르면, 데이터 수집부(210)는 군 장비의 정비 이력에 관한 비정형 텍스트 데이터를 수집할 수 있다. 과거부터 쌓여온 군 장비의 정비 이력에 관한 데이터는 비정형화된 텍스트 데이터로 구성되어 있다. 예를 들면, 전차의 정비병은 전차의 정비 작업 수행시 정비 이력을 기록하도록 되어 있는데, 이는 정형화된 데이터로 보관하지 않고, "엔진 오일 관리 지침에 의거하여 보충" 등의 정비 이력을 텍스트로 기록하고 있다. 또한, 전차나 항공기는 각자의 고유 코드를 보유하고 있는데, 이러한 데이터들은 정형화된 데이터로 분류할 수 있다. 따라서, 데이터 수집부(210)는 비정형화된 텍스트 데이터들과 정형화된 코드 데이터들을 수집할 수 있다.
일실시예에 따르면, 데이터 출력부(220)는 데이터 수집부(210)에서 수집된 비정형 데이터와 정형 데이터에 대해서 그리드 형식으로 출력할 수 있다. 여기서 그리드 형식이란, 바둑판 형식으로 분할된 표 안에 정리되는 방식을 말한다. 예를 들면, 엑셀이나 스프레드시트를 포함하며, 자바 스크립트 기반으로 제작될 수 있다. 데이터들을 자바 스크립트 기반의 그리드 형식으로 출력할 경우, 50만 건 이하의 데이터를 속도 저하 없이 처리할 수 있는 효과가 있다.
일실시예에 따르면, 데이터 분석부(230)는 데이터 출력부(220)에서 출력된 데이터 중 목표 칼럼의 단어를 추출하여 분석할 수 있다. 이때, 목표 칼럼은 비정형화된 정비 이력의 텍스트 데이터가 입력된 칼럼이 될 수 있다.
일실시예에 따르면, 데이터 분석부(230)는 목표 칼럼의 비정형 데이터를 형태소 단위로 나누고, 각각의 형태소에 품사 정보를 부착할 수 있다. 이러한 형태소를 분석하기 위해서는 코모란, 트위터, 꼬꼬마 중 하나의 분석기 모듈을 사용할 수 있다. 바람직하게는 코모란(KOMORAN) 분석기를 사용하여 정확도와 속도를 향상시킬 수 있다.
일실시예에 따르면, 텍스트 데이터에 부착된 품사 정보 중에서 접속조사, 부사격조사, 인용격조사, 보조사, 의존명사, 일반명사, 대명사, 형용사, 동사를 분석 대상으로 할 수 있다.
일실시예에 따르면, 데이터 분석부(230)는 각각의 형태소에 부착된 품사 정보를 조사 그룹, 명사 그룹 및 기타 그룹으로 그룹화할 수 있다. 여기서, 상기 조사그룹은 접속조사, 부사격조사, 인용격조사 및 보조사를 포함하고, 상기 명사 그룹은 의존명사, 일반명사, 고유명사 및 대명사를 포함하고, 상기 기타 그룹은 형용사와 동사를 포함할 수 있다.
일실시예에 따르면, 데이터 분석부(230)는 분석 대상이 되는 단어들에 대해서 빈도수를 추출할 수 있다.
일실시예에 따르면, 모델 생성부(240)는 데이터 분석부(230)에서 분석된 데이터를 벡터화하여 모델을 생성할 수 있다. 이때, 모델 생성부(240)는 워드투벡터(Word2vec)를 이용하여 추출된 단어를 벡터화한 후 DL4J(deeplearning4j) 라이브러리를 사용하여 모델을 생성할 수 있다. DL4J는 자바와 자바 가상머신 용으로 작성된 딥 러닝 라이브러리이며 딥 러닝 알고리즘을 광범위하게 지원하는 컴퓨팅 프레임워크이다. 이렇게 생성된 모델은 웹소켓(Web Socket)을 이용하여 모델 생성 상태를 확인할 수 있다. 웹소켓(Web Socket)은 웹 브라우저와 웹 서버 사이에서 전이중(full-duplex) 통신을 가능하게 하는 통신 프로토콜을 말한다.
일실시예에 따르면, 데이터 시각화부(250)는 생성된 모델을 네트워크 형태로 시각화할 수 있다. 데이터 시각화부(250)는 시각화에 사용될 단어와 단어 빈도수를 출력하고, 벡터화한 단어들을 네트워크 형태로 시각화를 구현할 수 있다.
도 3은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 비정형 데이터를 저장하기 위해 파일을 업로드하는 방식으ㄹ 설명하기 위한 도면이다.
도 3을 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템의 데이터 수집부에 데이터를 업로드하는 방식을 확인할 수 있다.
일실시예에 따르면, 군 장비의 정비 이력에 대한 비정형화된 데이터와 정형화된 데이터들은 클라이언트 응용 프로그램에 임베디드되어 동작하는 SQLite를 이용해서 저장할 수 있다. 이는 비정형 데이터들의 파일을 관리하고, 분석을 용이하게 할 수 있다.
군 장비의 정비 이력에 대한 비정형화된 데이터와 정형화된 데이터들은 엑셀이나 CSV 형식(쉼표를 기준으로 항목을 구분하여 저장한 데이터)으로 업로드 될 수 있다. 이때, 파일의 0번째 열을 칼럼으로 인식하고, 키(Key) 값을 제외한 모든 필드를 텍스트 칼럼으로 지정하여 동적 데이블을 생성할 수 있다.
여기서 엑셀 파일은 POI 라이브러리를 사용하고, CSV 형식의 파일은 OPEN CSV 라이브러리를 사용하여 업로드될 수 있다.
도 4는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 데이터의 출력 방식을 설명하기 위한 도면이다.
도 4를 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에 수집된 데이터들은 그리드 형식으로 출력될 수 있다. 예를 들면, 수집된 데이터들은 자바 스크립트 기반의 매우 심플한 Grid/SpreadSheet 컴포넌트로 출력될 수 있다. 이를 통해서 50만건 이하의 데이터를 속도 저하 없이 처리할 수 있는 효과가 있다.
도 5는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 추출될 단어 타입을 선택하는 방법을 설명하기 위한 도면이다.
도 5를 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 출력된 데이터들 중에서 분석 대상 데이터가 선정될 수 있다. 이때, 분석 대상 데이터는 비정형 데이터가 저장되어 있는 칼럼이 될 수 있다. 일실시예에 따르면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서, 비정형 데이터의 추출될 단어의 품사가 선택될 수 있도록 제공될 수 있다.
일실시예에 따르면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 출력된 데이터 중 목표 칼럼의 단어를 추출하여 분석할 수 있다. 이때, 목표 칼럼은 비정형화된 정비 이력의 텍스트 데이터가 입력된 칼럼이 될 수 있다.
도 6은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 형태소 분석이 완료된 출력 데이터를 설명하기 위한 도면이다.
도 6을 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 목표 칼럼의 비정형 데이터를 형태소 단위로 나누고, 각각의 형태소에 품사 정보를 부착할 수 있다. 이러한 형태소를 분석하기 위해서는 코모란, 트위터, 꼬꼬마 중 하나의 분석기 모듈을 사용할 수 있다. 바람직하게는 코모란(KOMORAN) 분석기를 사용하여 정확도와 속도를 향상시킬 수 있다.
일실시예에 따르면, 텍스트 데이터에 부착된 품사 정보 중에서 접속조사, 부사격조사, 인용격조사, 보조사, 의존명사, 일반명사, 대명사, 형용사, 동사를 분석 대상으로 할 수 있다.
일실시예에 따르면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 각각의 형태소에 부착된 품사 정보를 조사 그룹, 명사 그룹 및 기타 그룹으로 그룹화할 수 있다. 여기서, 상기 조사그룹은 접속조사, 부사격조사, 인용격조사 및 보조사를 포함하고, 상기 명사 그룹은 의존명사, 일반명사, 고유명사 및 대명사를 포함하고, 상기 기타 그룹은 형용사와 동사를 포함할 수 있다.
일실시예에 따르면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서, 형태소 분석이 완료되면, 단어의 종류에 대한 칼럼이 파일 목록에 추가될 수 있으며, 분석된 데이터가 저장될 수 있다.
예를들면, 비정형 데이터 파일의 칼럼은 계획 정비 여부(PNP_YN), 품목번호(ITEMNO), 조치 내용(ACT_CTNT), 결함 내용(DEFI_CTNT), 단어 분석 타입(WORD_TYPE), 수리부속 사용 년도(ATTRI_DT_YY), 수리부속 사용 분기(ATTRI_DT_QT) 및 추출 단어(ACT_CTNT_WORD)를 포함할 수 있다.
계획 정비 여부(PNP_YN)는 계획 정비인지, 비계획 정비인지 여부를 구분하는 것으로, 예를들면, 항공기의 정비 작업 진행 시 해당 작업이 계획적으로 이루어진 정비(P)인지 비계획적으로 이루어진 정비(NP)인지 구분하는 정보를 의미한다.
품목번호(ITEMNO)는 정비 작업할 때 사용되는 수리부속의 고유번호로, 마스킹 처리 해두었다.
조치 내용(ACT_CTNT)은 조치내용으로 작업자가 정비 작업 시 어떤 조치를 취했는지 메모한 비정형 데이터를 말한다.
결함 내용(DEFI_CTNT)은 항공기의 어떠한 결함으로 정비를 했는지 메모한 비정형 데이터를 말한다.
단어 분석 타입(WORD_TYPE) 비정형 데이터를 분석했을 때 명사인지 동사인지 구분하는 코드성 데이터로, 조사(JC, JKB, JKQ, JX), 명사(NNB, NNG, NNP, NP), 형용사(VA), 동사(VV), 외국어(SL), 숫자(SN) 등을 포함할 수 있다.
수리부속 사용 년도(ATTRI_DT_YY)는 수리부속을 사용하기 시작한 년도이고, 수리부속 사용 분기(ATTRI_DT_QT)는 수리부속의 기준 연한을 말한다.
추출 단어(ACT_CTNT_WORD)는 실제 추출된 단어이며 콤마(,)를 기준으로 분리되어서 일렬로 저장될 수 있다.
도 7은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 추출된 단어의 빈도수를 출력한 데이터를 설명하기 위한 도면이다.
도 7을 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 아파치스파크(Apache Spark)를 사용하여 단어의 빈도수를 추출할 수 있다. 이때, 아파치스파크는 아파치사(社)에서 제공하는 빅데이터 분석을 위한 프레임워크이다. 이렇게 비정형화된 데이터들 안에서 가장 많이 사용되는 단어들 순서로 출력할 수 있다.
도 8은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 모델을 생성하는 방식을 설명하기 위한 도면이다.
도 8을 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 분석된 데이터를 벡터화하여 모델을 생성할 수 있다. 이때, 모델 생성은 워드투벡터(Word2vec)를 이용하여 추출된 단어를 벡터화한 후 DL4J(deeplearning4j) 라이브러리를 사용하여 생성할 수 있다. DL4J는 자바와 자바 가상머신 용으로 작성된 딥러닝 라이브러리이며 딥러닝 알고리즘을 광범위하게 지원하는 컴퓨팅 프레임워크이다.
생성된 모델은 웹소켓(Web Socket)을 이용하여 모델 생성 상태를 확인할 수 있다. 웹소켓(Web Socket)은 웹 브라우저와 웹 서버 사이에서 전이중(full-duplex) 통신을 가능하게 하는 통신 프로토콜을 말한다.
도 9는 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 시각화한 데이터를 설명하기 위한 도면이다.
도 9를 참조하면, 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 시각화에 사용될 단어와 단어 빈도수를 출력하고, 벡터화한 단어들을 네트워크 형태로 시각화를 구현할 수 있다. 이때, 벡터화된 단어들은 위키피디아 네트워크(Wikipedia Network)를 이용하여 시각화가 구현될 수 있다.
도10은 본 발명의 실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템에서 수행하는 동작을 설명하기 위한 흐름도이다.
도 10을 참조하면, 단계(S1010)에서, 일실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 장비의 정비 이력 데이터를 저장할 수 있다. 여기서 장비의 정비 이력 데이터는 비정형 텍스트 데이터와 정형화된 코드 데이터를 포함할 수 있다.
단계(S1020)에서, 일실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 수집된 비정형 데이터와 정형 데이터에 대해서 그리드 형식으로 출력할 수 있다.
단계(S1030)에서, 일실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 출력된 데이터 중 목표 칼럼의 단어를 추출하여 분석할 수 있다.
단계(S1040)에서, 일실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 분석된 데이터를 벡터화하여 모델을 생성할 수 있다.
단계(S1050)에서, 일실시예에 따른 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템은 생성된 모델을 네트워크 형태로 시각화할 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
200: 군 장비 정비 이력 모니터링 시스템
210: 데이터 수집부
220: 데이터 출력부
230: 데이터 분석부
240: 모델 생성부
250: 데이터 시각화부

Claims (6)

  1. 군 장비의 정비 이력에 관한 비정형 텍스트 데이터를 수집하는 데이터 수집부;
    상기 수집된 데이터를 그리드 형식으로 출력하는 데이터 출력부;
    상기 출력된 데이터 중 목표 칼럼의 단어를 추출하여 분석하는 데이터 분석부
    상기 분석된 데이터를 벡터화하여 모델을 생성하는 모델 생성부; 및
    상기 생성된 모델을 네트워크 형태로 시각화하는 데이터 시각화부를 포함하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템.
  2. 제1항에 있어서,
    상기 데이터 분석부는 상기 목표 칼럼의 비정형 데이터를 형태소 단위로 나누고, 각각의 형태소에 품사 정보를 부착하는 것을 특징으로 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템.
  3. 제2항에 있어서,
    상기 데이터 분석부는 상기 품사 정보를 조사 그룹, 명사 그룹 및 기타 그룹으로 그룹화하는 것을 특징으로 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템.
  4. 제3항에 있어서,
    상기 조사그룹은 접속조사, 부사격조사, 인용격조사 및 보조사를 포함하고, 상기 명사 그룹은 의존명사, 일반명사, 고유명사 및 대명사를 포함하고, 상기 기타 그룹은 형용사와 동사를 포함하는 것을 특징으로 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템.
  5. 제1항에 있어서,
    상기 모델 생성부는 Word2vec을 이용해서 단어를 벡터화하는 것을 특징으로 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템.
  6. 제1항에 있어서,
    상기 데이터 시각화부는 시각화에 사용될 단어와 단어의 빈도수를 출력하고, 상기 모델 생성부에서 생성된 모델들을 상기 빈도수를 기초로 시각화하는 것을 특징으로 하는 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템.
KR1020190122103A 2019-10-02 2019-10-02 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법 KR102303442B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190122103A KR102303442B1 (ko) 2019-10-02 2019-10-02 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190122103A KR102303442B1 (ko) 2019-10-02 2019-10-02 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20210039640A true KR20210039640A (ko) 2021-04-12
KR102303442B1 KR102303442B1 (ko) 2021-09-23

Family

ID=75439710

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190122103A KR102303442B1 (ko) 2019-10-02 2019-10-02 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102303442B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110046860A (ko) * 2009-10-29 2011-05-06 강준규 품사별 결합 정보를 이용한 형태소 분석 시스템 및 방법
KR20160086777A (ko) * 2015-06-12 2016-07-20 박기동 감성 및 성향분석 솔루션
KR20190069696A (ko) * 2017-12-12 2019-06-20 (주)위세아이텍 장비 고장 예측 장치 및 방법
KR20190070430A (ko) * 2017-12-13 2019-06-21 (주)엔텔스 빅데이터 분석 기반 질병 진단명 추정 방법 및 추정 장치
KR20190080234A (ko) * 2017-12-28 2019-07-08 포항공과대학교 산학협력단 컨벌루션 신경망 기반 영문 텍스트 정형화 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110046860A (ko) * 2009-10-29 2011-05-06 강준규 품사별 결합 정보를 이용한 형태소 분석 시스템 및 방법
KR20160086777A (ko) * 2015-06-12 2016-07-20 박기동 감성 및 성향분석 솔루션
KR20190069696A (ko) * 2017-12-12 2019-06-20 (주)위세아이텍 장비 고장 예측 장치 및 방법
KR20190070430A (ko) * 2017-12-13 2019-06-21 (주)엔텔스 빅데이터 분석 기반 질병 진단명 추정 방법 및 추정 장치
KR20190080234A (ko) * 2017-12-28 2019-07-08 포항공과대학교 산학협력단 컨벌루션 신경망 기반 영문 텍스트 정형화 방법

Also Published As

Publication number Publication date
KR102303442B1 (ko) 2021-09-23

Similar Documents

Publication Publication Date Title
Horrocks et al. Using semantic technology to tame the data variety challenge
AU2014208308B2 (en) Safety analysis of a complex system using component-oriented fault trees
US8489601B2 (en) Knowledge extraction methodology for unstructured data using ontology-based text mining
US11741384B2 (en) Adaptable systems and methods for discovering intent from enterprise data
US20130073271A1 (en) Static fault tree analysis system and method from system models
Jin Reliability engineering and services
CN107103363A (zh) 一种基于lda的软件故障专家系统的构建方法
CN106776326B (zh) 一种数据分析模型的建模方法及系统
KR101282244B1 (ko) 원자력발전소 설비의 예방/고장 정비정보 관리 시스템 및 그 방법
Souza et al. A systematic literature review about integrating dependability attributes, performability and sustainability in the implantation of cooling subsystems in data center
Fahmy et al. Dynamic fault tree analysis of auxiliary feedwater system in a pressurized water reactor
Lipaczewski et al. Using tool-supported model based safety analysis--Progress and experiences in SAML development
KR102303442B1 (ko) 비정형 데이터를 이용한 군 장비 정비 이력 모니터링 시스템 및 방법
Ulrich et al. Operator timing of task level primitives for use in computation-based human reliability analysis
Reuss et al. Knowledge engineering for decision support on diagnosis and maintenance in the aircraft domain
Ghani et al. Improved Test Case Selection Algorithm to Reduce Time in Regression Testing.
Johnson et al. Extending the application of formal methods to analyse human error and system failure during accident investigations
CN102298549A (zh) 可执行模型的离线形式验证
KR102504535B1 (ko) 군 장비의 예측정비 데이터 셋 생성을 위한 데이터 분석 시스템 및 방법
Prosvirnova et al. Strategies for Modelling Failure Propagation in Dynamic Systems with AltaRica
Bao et al. An Integrated Framework for Risk Assessment of Safety-related Digital Instrumentation and Control Systems in Nuclear Power Plants: Methodology Refinement and Exploration
CN117350705B (zh) 用于装备健康管理的方法、系统、存储介质及电子设备
Hamza OpenPHI–A Human Reliability Analysis Methodology to Risk-Inform the Importance of Operator Actions for Advanced Reactors during Early Design Stages
KR102287014B1 (ko) 크라우드소싱 기반 소프트웨어 위험 분석 방법
Hiromichi et al. STUDY ON EXTENDING INITIATING EVENT CLASSIFICATION TREE METHOD TO EVALUATE SEISMIC-INDUCED MULTI-UNIT INITIATING EVENT FREQUENCIES

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant