KR101768202B1 - 패턴화를 이용한 데이터 분석 장치 및 방법 - Google Patents

패턴화를 이용한 데이터 분석 장치 및 방법 Download PDF

Info

Publication number
KR101768202B1
KR101768202B1 KR1020160139338A KR20160139338A KR101768202B1 KR 101768202 B1 KR101768202 B1 KR 101768202B1 KR 1020160139338 A KR1020160139338 A KR 1020160139338A KR 20160139338 A KR20160139338 A KR 20160139338A KR 101768202 B1 KR101768202 B1 KR 101768202B1
Authority
KR
South Korea
Prior art keywords
variables
data
unit
pattern
weapons
Prior art date
Application number
KR1020160139338A
Other languages
English (en)
Inventor
김근형
김용국
이강택
박승환
Original Assignee
엘아이지넥스원 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘아이지넥스원 주식회사 filed Critical 엘아이지넥스원 주식회사
Priority to KR1020160139338A priority Critical patent/KR101768202B1/ko
Application granted granted Critical
Publication of KR101768202B1 publication Critical patent/KR101768202B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • G06F17/30318

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명의 일 실시예에 따르면, 패턴화를 이용한 데이터 분석 장치에 있어서, 분석하고자 하는 적어도 하나의 대상에 관련된 데이터들을 특징에 따라 구분하기 위한 복수개의 변수들로 분류하여 상기 변수 각각에 해당하는 상기 데이터 입력값이 많은 순서에 따라 내림차순으로 정렬하는 데이터 정렬부, 상기 정렬된 변수들 중 일부를 선택하여 기준변수들로 설정하고, 상기 설정된 기준변수들간 상관관계를 시각적으로 나타내는 패턴을 형성하여 그룹화하는 패턴 형성부 및 상기 형성된 패턴을 고려하여, 상기 그룹화한 결과를 테이블로 출력하는 결과 출력부를 포함한다.

Description

패턴화를 이용한 데이터 분석 장치 및 방법 {Apparatus and method for analyzing data using patterning}
본 발명은 패턴화를 이용한 데이터 분석 장치 및 그 방법에 관한 것으로, 특히, 분석하고자 하는 대상에 관련되어 영향을 미치는 변수들을 선택하고, 선택한 변수들을 이용하여 패턴화하여 분석하는 데이터 분석 장치 및 그 방법에 관한 것이다.
급변하는 안보환경은 최첨단 무기 개발의 필요성을 증가시키고 있다. 이로 인한 무기체계의 발전은 첨단 무기의 가격 상승을 초래했다. 따라서, 정부는 국방 연구개발 투자예산을 꾸준히 증가시키고 있는 상황이다.
많은 제조업체들은 산업화 시대에 치열한 경쟁에서 살아남기 위해 보다 빠르게 신제품을 출시하고 있다. 하지만 제품들은 고성능, 다기능을 갖추게 될수록 품질 결함으로 인한 피해가 증가하고 있다.
이러한 결함을 최소화하기 위해 적용되는 연굴 활동 중 최근 가장 이슈가 되는 분야가 빅데이터(Big data) 분석이다. 빅데이터는 기업 활동 과정에서 축적된 대량의 데이터를 분석해 경영 활동에 필요한 다양한 의사결정에 활용하기 위해 사용된다.
하지만, 아직까지 무기체계 개발에서는 빅데이터 분석연구가 활발하게 진행되지 못하고 있다. 무기체계는 연구개발 단계에서 시제품을 시험하지만, 양산품 중 일부를 표본 추출하여 시험하는 타 제조업과는 다른 특성을 보인다.
현재 대부분의 무기체계는 개발 단계에서만 불량의 이력 관리가 이루어지고 있다. 개발 이후 실질적 전력화 이후의 불량에 대한 이력 관리는 추후 연구개발의 신뢰도 향상, 불량도 감소, 적절한 부품 사용 및 개발 간의 효율성 향상을 위해 필수적이다.
따라서, 후술하는 본 발명에서는 후속 군수지원의 결함 데이터의 분석 가능성을 확인하기 위해 데이터 분석의 기초 절차를 통한 데이터 분석 장치 및 방법을 제안한다.
선행문헌 1: 한국 공개 특허 제10-2014-0072964호 (공개)
본 발명의 목적은 전술한 종래기술의 문제점을 해결하기 위한 것으로, 변수별 패턴화를 이용하여, 분석하고자 하는 대상에 관련한 데이터들에 대한 분석을 할 수 있도록 하는 것이다.
본 발명의 또 다른 목적은, 상기 데이터 분석 장치 및 방법을 통해 짧은 기간에 분석을 가능하게 하고, 정확한 파악이 가능하도록 하는 것이다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따르면, 패턴화를 이용한 데이터 분석 장치에 있어서, 분석하고자 하는 적어도 하나의 대상에 관련된 데이터들을 특징에 따라 구분하기 위한 복수개의 변수들로 분류하여 상기 변수 각각에 해당하는 상기 데이터 입력값이 많은 순서에 따라 내림차순으로 정렬하는 데이터 정렬부, 상기 정렬된 변수들 중 일부를 선택하여 기준변수들로 설정하고, 상기 설정된 기준변수들간 상관관계를 시각적으로 나타내는 패턴을 형성하여 그룹화하는 패턴 형성부, 및 상기 형성된 패턴을 고려하여, 상기 그룹화한 결과를 테이블로 출력하는 결과 출력부를 포함할 수 있다.
본 발명에서, 상기 패턴 형성부는 상기 복수개의 변수들간의 상관관계에 따른 분산의 정도를 고려하여, 상기 형성된 패턴 중 적어도 일부를 그룹화할 수 있다.
본 발명에서, 상기 패턴 형성부는, 미리 설정되는 분산값의 범위에 따라 상기 패턴 중 그룹화하고자 하는 적어도 일부를 선택할 수 있다.
본 발명에서, 상기 데이터 정렬부는, 상기 정렬된 복수개의 변수들 중 기 설정된 기준에 따라 데이터 입력값이 적은 변수들은 제거할 수 있다.
본 발명에서, 상기 패턴 형성부는, 상기 복수개의 변수들간의 상관관계를 나타내는 패턴을 다중 히스토그램 또는 분할표로 나타낼 수 있다.
또한, 상기 데이터들을 수집하여 입력하는 입력부, 상기 데이터들을 저장하는 저장부 및 상기 결과출력부로부터 출력한 테이블을 화면으로 표시하는 디스플레이부를 더 포함할 수 있다.
상기 목적을 달성하기 위한 본 발명의 다른 실시예에 따르면, 데이터 분석 장치가 데이터를 분석하는 방법에 있어서, 분석하고자 하는 적어도 하나의 대상에 관련된 데이터들을 특징에 따라 구분하기 위한 복수개의 변수들로 분류하여 상기 변수 각각에 해당하는 상기 데이터 입력값이 많은 순서에 따라 내림차순으로 정렬하는 단계, 상기 정렬된 변수들 중 일부를 선택하여 기준변수들로 설정하고, 상기 설정된 기준변수들간 상관관계를 시각적으로 나타내는 패턴을 형성하여 그룹화하는 단계 및 상기 형성된 패턴을 고려하여, 상기 그룹화한 결과를 테이블로 출력하는 단계를 포함할 수 있다.
본 발명에서, 상기 그룹화하는 단계는, 상기 복수개의 변수들간의 상관관계에 따른 분산 정도를 고려하여, 상기 형성된 패턴 중 적어도 일부를 그룹화할 수 있다.
본 발명에서, 상기 그룹화하는 단계는, 미리 설정되는 분산값의 범위에 따라 상기 패턴 중 그룹화하고자 하는 적어도 일부를 선택할 수 있다.
본 발명에서, 상기 그룹화하는 단계는, 상기 정렬된 복수개의 변수들 중 기 설정된 기준에 따라 입력값이 적은 변수들을 제거하는 단계를 더 포함할 수 있다.
또한, 상기 복수개의 변수들간의 상관관계를 나타내는 패턴을 다중 히스토그램 또는 분할표로 표현할 수 있다.
따라서, 본 발명의 실시예에 따르면, 개발 단계에서 획득하기 어려운 하나의 변수와 관련된 다양한 정보 획득이 가능하다.
본 발명의 실시예에 따르면, 짧은 기간에 많은 양의 데이터의 분석이 가능하다.
도 1은 본 발명의 바람직한 실시예에 따른 패턴화를 이용한 데이터 분석 장치를 개략적으로 도시한 구성도이다.
도 2는 본 발명의 일 실시예에 따라 데이터 정렬 과정을 설명하기 위한 그래프를 도시한 도면이다.
도 3은 본 발명의 일 예에 따른 패턴 형성부가 표를 생성하기 위한 과정을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 데이터 분석 장치의 패턴화를 이용한 변수들간 상관관계를 표로 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 패턴화를 이용한 데이터 분석 방법을 시간의 흐름에 따라 도시한 도면이다.
첨부된 도면들을 참조하여 본 발명을 일 실시예에 따라 상세히 설명한다.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예를 상세하게 설명하지만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다.
본 발명의 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 해당 분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라 질 수 있다. 또한 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명부분에서 그 의미를 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는, 단순한 용어의 명칭이 아닌 그 용어가 가지는 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 함을 밝혀두고자 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다.
나아가, 도면들 중 참조번호 및 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 참조번호들 및 부호들로 나타내고 있음에 유의해야 한다. 하기에서 본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
따라서 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하에서는, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 대하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 바람직한 실시예에 따른 패턴화를 이용한 데이터 분석 장치(100)를 개략적으로 도시한 구성도이다.
도 1을 참조하면, 본 발명의 실시예에 따른 데이터 분석 장치(100)는 입력부(110), 데이터 정렬부(120), 패턴 형성부(130), 결과 출력부(140), 저장부(150) 및 디스플레이부(160)를 포함하여 구성될 수 있다.
먼저, 입력부(110)는 분석하고자 하는 적어도 하나의 대상에 관련된 데이터들을 입력한다.
본 발명의 일 실시예에 따른 입력부(110)는 사용자 인터페이스로 구현되어, 상기 대상에 관련된 데이터들을 사용자가 인터페이스로 직접 입력하여, 상기 데이터들을 수집할 수 있다.
또 다른 일 예에 따른 입력부(110)는 네트워크를 통해 복수의 계층들로부터 수집되는 데이터들을 수신하기 위해 통신하는 통신모듈(미도시)을 더 포함할 수 있고, 입력부(110)는 상기 통신모듈을 이용하여, 데이터들을 입력할 수 있다.
예컨대, 네트워크를 이용하여 데이터 분석 장치(100)는 상기 분석하고자 하는 대상을 보유하고 있는 복수개의 구역(부대)에 위치하는 통신 단말들에 입력되어 있는 데이터들을 수집할 수 있다.
본 발명의 실시예에 따른 데이터 정렬부(120)는 데이터 수집부(121), 변수 선정부(122) 및 정렬부(123)를 더 포함하도록 구성될 수 있다. 또 다른 일 실시예에 따른 입력부(110)는 데이터 정렬부(120)에 포함되어 구성될 수 있고, 별도로, 상기 사용자 인터페이스 장치를 통해 마련되어 구성될 수 있다.
데이터 정렬부(120)는 분석하고자 하는 적어도 하나의 대상에 관련된 데이터들을 수집하여 입력하고, 상기 입력된 데이터들을 특징에 따라 구분하기 위한 복수개의 변수들로 분류하여, 입력값이 많은 순서에 따라 내림차순으로 정렬한다.
보다 상세하게는, 데이터 수집부(121)는 상기 입력부(110)로부터 입력되는 데이터들을 수집한다. 이 때, 본 발명에서 저장부(150)는 데이터 수집부(121)로부터 수집된 데이터들을 저장하도록 마련될 수 있다.
또한, 변수 선정부(122)는 데이터 수집부(121)로부터 수집되는 데이터들의 특징에 따라 분류하기 위한 복수개의 변수들을 선정한다.
예컨대, 본 발명에 따른 데이터는 미리 설정된 상기 대상에 대한 정보를 구분하는 다수개의 식별자를 포함할 수 있다. 여기서, 식별자는 분석하고자 하는 대상에 있어서, 상기 대상의 모델명, 모듈, 유닛, 결함원인 등 대상에 관련되어 미리 설정되는 식별자일 수 있다.
일 예로, 변수 선정부(122)는 데이터에 포함되어 있는 식별자들에 따라 복수개의 변수들을 선정할 수 있고, 상기 선정된 복수개의 변수들을 기반으로 상기 데이터들을 추출하여 재분류할 수 있다.
다음으로, 정렬부(123)는 변수 별 입력 데이터가 많은 순서대로 정렬할 수 있다. 즉, 정렬부(123)는 변수 선정부(122)로부터 선정된 복수개의 변수들에 따라 정렬하되, 각각의 변수에 해당하는 데이터들의 입력값이 많은 순서에 따라 내림차순으로 정렬한다.
이하, 도 2를 참조하여, 데이터 분석 장치(100)의 데이터 정렬에 대하여 보다 구체적으로 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따라 데이터 정렬 과정을 설명하기 위한 그래프를 도시한 도면이다.
일 실시예에 의한, 도 2는 복수개의 변수들에 따른 데이터 입력값의 관계를 나타내는 그래프이다. 보다 상세하게는, 도 2의 X축은 복수개의 변수들을 나타내며, Y축은 데이터 입력값을 나타낸다.
본 발명의 일 실시예에 따른 데이터 정렬부(120)는 변수들을 변수들에 관련된 데이터 입력이 많은 순서대로 정렬하는 도 2에 도시된 바와 같은 그래프로 나타낼 수 있다.
또한, 데이터 정렬부(120)는 도 2의 그래프와 같이, 정렬된 변수들 중 기 설정된 기준에 의해, 상기 기준보다 입력값이 적은 변수들은 제거할 수 있다. 예를 들어, 데이터 정렬부(120)는 데이터 입력값이 많은 순서대로 그래프에 정렬된 변수들 중 상위 50%안에 해당하는 변수들을 제외한 나머지 하위 50%에 해당하는 변수들을 자동으로 제거하도록 미리 설정할 수 있다.
또 다른 일 실시예에 따르면, 본 발명의 데이터 분석 장치(100)의 데이터 정렬부(120)는 복수개의 변수들 중 데이터 입력값이 작은 변수들을 제거한 뒤, 상위 50%에 해당하는 변수들 중 적어도 하나의 변수들을 선택한다. 여기서, 일 실시예인 도 2를 참조하면, a 내지 f와 같이, 6개의 변수를 선택할 수 있다. 이 때, 일부 변수를 선택하는 기준은 데이터 입력값이 많은 변수 순서에 따라 선택할 수 있고, 상기 대상에 관련된 전문가들을 대상으로 설문조사를 실시하여, 선정되는 변수들에 의해 선택될 수 있다.
예를 들어, 상기 대상이 무기(weapon)이고, 데이터 분석 장치(100)가 상기 무기의 결함원인을 분석하는 장치로 구현될 때, 도 2의 그래프와 같이 정렬된 복수개의 변수들 중 일부를 선택하는 변수들은 부대명(Military), 무기체계(Weapon System), 탑(Top Name), 모듈(Module Name), 유닛(Unit Name) 및 결함원인(Defect Type)이 선택될 수 있다.
다시, 도 1을 참조하면, 본 발명에 따른 패턴 형성부(130)는 정렬된 변수들 중 일부를 선택하여 기준변수들로 설정하고, 상기 설정된 기준변수들간 상관관계를 시각적으로 나타내는 패턴을 형성하여 그룹화한다.
보다 상세하게는, 본 발명의 일 실시예에 따른 패턴 형성부(130)는 상기 데이터 정렬부(120)로부터 선택된 변수들 중 하나를 기 설정된 기준에 따라 하나의 목적변수를 선택한다.
또한, 패턴 형성부(130)는 데이터 전처리 및 기록 방식의 표준화를 통해 상기 선택된 변수들 중 일부를 분석 대상 변수들로 선택할 수 있다.
이에 보다 구체적인 설명을 위하여, 후술하는 설명에서는 목적변수를 제 1변수로, 분석 대상 변수들을 제 2변수와 제 3변수로 예시하여 설명한다.
예컨대, 복수개의 변수들 중 선택된 부대명(Military), 무기체계(Weapon System), 탑(Top Name), 모듈(Module Name), 유닛(Unit Name)과 결함원인(Defect Type) 중 부대명, 모듈 그리고 유닛은 표현방식이 상이하여, 명목 수준이 상대적으로 높기 때문에 별도의 데이터 전처리 및 기록 방식의 표준화가 필요하다. 따라서, 최종 분석 대상 변수를 결함원인(제 1변수), 무기체계(제 2변수), 부대명(제 3변수)로 선택할 수 있다.
패턴 형성부(130)는 전술한 바와 같이, 선택된 목적변수 및 분석 대상 변수들을 결정함에 따라, 상기 변수들(제 1변수, 제 2변수, 제 3변수)간 상관관계를 표로 나타낼 수 있다.
또 다른 일 예에 따른 패턴 형성부(130)는 상기 결정된 변수인 부대명(제 3변수) 중 분석하고자 하는 일부 부대만을 선택할 수 있다. 이에 대한 보다 상세한 설명을 위하여, 도 3을 참고한다.
도 3은 본 발명의 일 예에 따른 패턴 형성부가 표를 생성하기 위한 과정을 설명하기 위한 도면이다.
도 3에 도시된 바와 같이, 본 발명의 패턴 형성부(130)는 상기 변수들(제 1변수, 제 2변수, 제 3변수)간 상관관계를 나타내는 표 또는 그래프를 생성함으로써, 분석하고자 하는 하나의 변수에 대하여 일 부분만을 선정하여 분석할 수 있도록 추출할 수 있다.
도 3의 X축은 부대명(Military)를 나타내고, 각 Y축은 불량형태에 대한 빈도수를 나타낸다. 예컨대, 일 실시예인 도 3을 참고하면, 전처리 과정을 거친 최종 분석 데이터는 전체 부대에서 결함 빈도가 높은 일부 부대(M7, M8, M9, M11, M12, M19, M20, M22)의 부대에 대한 무기체계(제 2변수)와 결함원인(제 1변수) 중 일부(기타, 설계불량, 운용미숙, 자재불량)을 주요 변수로 추출할 수 있다.
본 발명의 실시예에 따른 패턴 형성부(130)는 상술한 바와 같이, 주요 변수를 추출한 각 변수들을 이용하여, 상기 각 변수들간 상관관계를 시각적으로 나타내는 패턴을 형성하는 표를 생성할 수 있다.
이하, 도 4를 참고하여 분석하고자 하는 변수들의 상관관계를 패턴화하여, 분석하는 방법에 대해 상세히 설명하도록 한다.
도 4는 본 발명의 일 실시예에 따른 데이터 분석 장치의 패턴화를 이용한 변수들간 상관관계를 표로 도시한 도면이다.
일 예로, 도 4에 도시된 바와 같이, 패턴 형성부(130)는 다중 히스토그램 또는 다중 분할표를 이용하여, 변수들에 대한 패턴화를 나타낼 수 있다.
도 4의 X축은 분석 대상 변수들(무기체계, 부대명)이고, Y축은 목적변수(결함원인)을 나타낸다. 일 실시예에 따른 패턴 형성부(130)는 복수개의 변수들 중 선택된 변수들에 대한 축을 갖는 다중 분할표로서, 도 4와 같이 다중 히스토그램에 의해 나타낼 수 있다.
도 4를 참고하면, 상기 추출한 주요 변수들인 8개의 주요 부대(제 3변수)에 대한 무기체계(제 2변수)별 결함원인(제 1변수)의 분포를 나타낸 것으로, X축은 각 부대(제 3변수)에 배치된 무기체계(제 2변수)를 나타내고, Y축은 각 결함원인(제 1변수)에 대한 빈도수를 나타낸다.
이에 따라, 다중 히스토그램을 통해 결함원인들이 무기체계별로 패턴을 보이는 것을 확인할 수 있다. 예를 들면, 도 4와 같이, 제 3변수인 결함원인의 요소 중 기타, 설계불량 그리고 운용미숙에 대한 결함은 특정 무지체계(제 2변수)에 집중 되는 반면, 자재불량은 대부분의 무기체계에 균일하게 발생되는 것을 확인할 수 있다. 여기서, 일 예에 따른 무기체계는 패트리어트 미사일, 사드(THAAD), 천궁 등으로 각 부대마다 보유하고 있는 무기체계가 같을 수 있고, 다를 수도 있다.
상술한 바와 같이, 패턴 형성부(130)는 다중 표에 형성된 변수들에 대한 패턴들을 이용하여, 상기 패턴들 중 적어도 일부를 그룹화할 수 있다.
보다 상세하게는, 일 실시예에 따른 패턴 형성부(130)는 분석하기 위해 선택한 변수들간의 상관관계에 따른 분산 정도를 고려하여 그룹화하고자 하는 패턴을 선정할 수 있다.
또한, 패턴 형성부(130)는 미리 설정되는 분산값의 범위에 따라 형성된 패턴들 중 그룹화하고자 하는 적어도 일부를 선택할 수 있다. 예컨대, 히스토그램에 형성된 패턴들 중 X축과 Y축의 분산값의 차이가 큰 변수에 따른 패턴 또는 X축과 Y축의 분산값의 차이가 작은 변수에 따른 패턴들을 선별하여, 그룹화할 수 있다. 여기서, 미리 설정되는 분산값의 범위는 사용자가 원하는 수준에 한하여, 미리 설정되도록 마련할 수 있다. 또 다른 실시예로, 사용자가 원하는 그룹의 수에 맞춰서 분산을 조정하여 미리 설정하고, 데이터 분석 장치(100)는 상기 설정된 분산 범위에 따라 자동적으로 계산하여 그룹화하고자 하는 타입을 결정할 수 있다.
예를 들어, 도 4를 참고하면, 무기체계(제 2변수)와 결함의 패턴을 분석하기 위해 4개의 결함원인들(제 1변수)이 규칙적으로 나타나는 패턴을 무기체계별로 정리하여, 네 가지 형태(Type A, B, C, D)로 그룹화할 수 있다.
여기서, Type A는 모든 결하이 균일하게 다수 발생한 경우이고, Type B는 설계불량과 운용미숙의 두 가지 불량이 다수 발생한 경우를 나타낸다. 또한, Type C는 자재불량과 설계불량의 경우를 나타내고, Type D는 기타와 자재불량의 경우를 보여준다.
패턴 형성부(130)는 분석 관점에 따라 다른 형태의 패턴도 존재할 수 있지만, 상대적으로 불량 빈도가 높은 무기체계들에 한해서 그 중 일부를 그룹화하도록 구현될 수 있다.
다시 도 1을 참고하면, 본 발명의 실시예에 따른 결과 출력부(140)는 패턴 형성부(130)로부터 형성된 패턴을 고려하여, 그룹화한 결과를 테이블로 출력한다.
본 발명의 일 실시예에 따른 테이블은 <표1>과 같다.
Types Defects M11 M12 M19 M20 M22 M7 M8 M9
Type A Design
Operation
Material
ETC
Type B Design
Operation
Type C Design
Material
Type D Design
ETC
결과 출력부(140)는 패턴 형성부(130)로부터 그룹화한 타입에 따라 분석하고자 하는 대상에 대한 변수들을 정리하여 <표1>과 같이 테이블로 출력할 수 있다.
일 실시예에 따라 결과 출력부(140)로부터 출력된 분석결과 <표1>을 통해, 설정된 타입에 따른 부대별 분포를 파악할 수 있다. 예컨대, 네 가지 결함이 균일하게 다수 발생하는 Type A는 M8 과 M12 부대에서 나타나고, 자재불량과 기타결함이 다수 발생하는 Type D는 M22에서만 나타나는 것을 확인할 수 있다. 또한, 두가지 Type과 달리 Type B와 C는 최소 3개 이상의 부대에서 나타난다.
이렇게 파악된 결과를 통해, Type B와 C는 설계불량을 공통적으로 포함하므로 해당되는 부대들은 설계불량에 대한 집중적인 관리가 요구된다는 것을 파악하는데 용이하다.
본 발명의 일 실시예에 따른 디스플레이부(160)은 상기 결과 출력부(140)로부터 출력한 테이블을 화면으로 표시할 수 있다.
상술한 바와 같이, 구성된 패턴화를 이용한 데이터 분석 장치(100)에 의해 분석하고자 하는 대상에 대하여 분석하는 분석 절차를 통해 유용한 정보를 추출하여 무기체계의 중요한 결함원인들을 분석하고, 반복적인 결함을 보이는 무기체계들을 보유한 부대 정보를 얻을 수 있다. 따라서, 새로운 무기체계 개발 시 결함요소를 사전에 차단함으로써 무기체계의 품질향상에 도움이 된다.
도 5는 본 발명의 일 실시예에 따른 패턴화를 이용한 데이터 분석 방법을 시간의 흐름에 따라 도시한 도면이다.
먼저, 데이터 분석 장치(100)는 분석하고자 하는 대상을 선정하고(S310), 상기 대상에 관련된 데이터들을 수집하여 입력부(110)는 상기 수집된 데이터들을 입력한다(S320). 이 때, 입력부(110)는 사용자가 직접 인터페이스로 구현되는 장치를 통해 상기 데이터들을 입력할 수 있고, 또 다른 예로, 네트워크를 통해 복수의 계층들로부터 수집되는 데이터들을 입력할 수 있도록 구현할 수 있다.
입력부(110)로부터 상기 대상에 관련된 데이터들을 입력하면, 본 발명에 따른 데이터 정렬부(120)는 입력된 데이터들을 특징에 다라 구분하기 위한 복수개의 변수들을 결정하여 분류한다(S330).
데이터 정렬부(120)는 분류한 변수들을 각 변수들에 해당하는 데이터의 입력값이 많은 순서에 따라 내림차순으로 정렬한다(S340).
일 실시예에 따른 데이터 정렬부(120)로부터 내림차순으로 정렬된 변수들 중 미리 설정된 기준에 의해 일부 변수들을 자동으로 제거할 수 있다(S350).
다음으로, 패턴 형성부(130)는 데이터 정렬부(120)로부터 정렬하여 일부 변수들을 제거하고 남은 변수들 중 일부를 기준변수로 선택하여 설정할 수 있다(S360).
이렇게, 설정된 기준변수들간 상관관계를 패턴 형성부(130)는 시각적으로 나타내는 패턴을 형성하는 다중 분할표를 생성한다(S370). 여기서, 패턴 형성부(130)는 상기 기준 변수들간 상관관계를 시각적으로 분석할 수 있도록 다중 분할표 또는 다중 히스토그램을 이용하여 패턴화할 수 있다.
다음으로, 패턴 형성부(130)는 패턴화한 기준변수들 중 분산값의 차이의 크기에 따라 그룹화하고자 하는 변수들을 자동으로 타입별로 구분하여 그룹화한다(S380). 여기서, 분산값의 차이를 고려하여 그룹화하고자 하는 변수들의 패턴을 선정하는 것은 사용자가 미리 원하는 그룹의 수에 맞춰 분산값의 차이에 따른 범위를 설정하여, 상기 설정된 분산값의 차이의 범위를 고려하여 결정될 수 있도록 한다.
이렇게, 상기 대상의 데이터들을 사용자가 한눈에 분석 및 파악하기 용이하도록 결과 출력부(140)는 최종적으로 그룹화 된 변수들을 테이블(표)을 생성하여, 정리한다(S390).
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 데이터 분석 장치
110: 입력부
120: 데이터 정렬부
121: 데이터 수집부
122: 변수 선정부
123: 정렬부
130: 패턴 형성부
140: 결과 출력부
150: 저장부
160: 디스플레이부

Claims (11)

  1. 부대 각각에 위치하는 적어도 하나의 무기들에 관련된 데이터들을 특징에 따라 구분하기 위한 복수개의 변수들로 분류하여 상기 변수 각각에 해당하는 데이터 입력값이 많은 순서에 따라 내림차순으로 정렬하는 데이터 정렬부;
    상기 정렬된 변수들 중 상기 입력값의 개수를 고려하여 상기 변수들 중 일부의 변수를 기준변수들로 설정하고, 상기 설정된 기준변수들간 상관관계에 따른 분산의 정도를 고려하여 시각적으로 나타내는 패턴을 형성하고, 상기 형성된 패턴들 중 상기 무기의 결함이 균일하게 다수 발생한 경우, 상기 무기의 설계불량과 운용미숙에 따른 원인이 다수 발생한 경우, 상기 무기의 자재불량과 설계불량의 경우 및 상기 무기의 자재불량과 기타 원인으로 인한 경우를 포함하는 적어도 네 가지 타입으로 그룹화하는 패턴 형성부; 및
    상기 그룹화한 결과를 기초로 반복적인 결함을 보이는 상기 무기들을 보유한 부대 정보를 테이블로 출력하는 결과 출력부;를 포함하되,
    상기 설정된 기준변수들은, 부대명(Military), 무기체계(Weapon System), 탑(Top name), 모듈(Module name) 및 결함원인(Defect Type)인 것을 특징으로 하는 패턴화를 이용한 데이터 분석 장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 패턴 형성부는,
    미리 설정되는 분산값의 범위에 따라 상기 패턴 중 그룹화하고자 하는 적어도 일부를 선택하는 것을 특징으로 하는 패턴화를 이용한 데이터 분석 장치.
  4. 제1항에 있어서,
    상기 데이터 정렬부는,
    상기 정렬된 복수개의 변수들 중 기 설정된 기준에 따라 데이터 입력값이 적은 변수들은 제거하는 것을 특징으로 하는 패턴화를 이용한 데이터 분석 장치.
  5. 제1항에 있어서,
    상기 패턴 형성부는,
    상기 복수개의 변수들간의 상관관계를 나타내는 패턴을 다중 히스토그램 또는 분할표로 나타내는 것을 특징으로 하는 패턴화를 이용한 데이터 분석 장치.
  6. 제1항에 있어서,
    상기 데이터들을 수집하여 입력하는 입력부;
    상기 데이터들을 저장하는 저장부; 및
    상기 결과출력부로부터 출력한 테이블을 화면으로 표시하는 디스플레이부
    를 더 포함하는 패턴화를 이용한 데이터 분석 장치.
  7. 데이터를 분석하는 데이터 분석 장치가 부대 각각에 위치하는 적어도 하나의 무기들에 관련된 데이터들을 특징에 따라 구분하기 위한 복수개의 변수들로 분류하여 상기 변수 각각에 해당하는 데이터 입력값이 많은 순서에 따라 내림차순으로 정렬하는 단계;
    상기 정렬된 변수들 중 상기 입력값의 개수를 고려하여 상기 변수들 중 일부의 변수를 기준변수들로 설정하고, 상기 설정된 기준변수들간 상관관계에 따른 분산의 정도를 고려하여 시각적으로 나타내는 패턴을 형성하고, 상기 형성된 패턴들 중 상기 무기의 결함이 균일하게 다수 발생한 경우, 상기 무기의 설계불량과 운용미숙에 따른 원인이 다수 발생한 경우, 상기 무기의 자재불량과 설계불량의 경우 및 상기 무기의 자재불량과 기타 원인으로 인한 경우를 포함하는 적어도 네 가지 타입으로 그룹화하는 단계; 및
    상기 형성된 패턴을 고려하여, 상기 그룹화한 결과를 테이블로 출력하는 단계를 포함하되,
    상기 설정된 기준변수들은, 부대명(Military), 무기체계(Weapon System), 탑(Top name), 모듈(Module name) 및 결함원인(Defect Type)인 것을 특징으로 하는 패턴화를 이용한 데이터 분석 방법.
  8. 삭제
  9. 제7항에 있어서,
    상기 그룹화하는 단계는,
    미리 설정되는 분산값의 범위에 따라 상기 패턴 중 그룹화하고자 하는 적어도 일부를 선택하는 것을 특징으로 하는 패턴화를 이용한 데이터 분석 방법.
  10. 제7항에 있어서,
    상기 그룹화하는 단계는,
    상기 정렬된 복수개의 변수들 중 기 설정된 기준에 따라 입력값이 적은 변수들을 제거하는 단계를 더 포함하는 것을 특징으로 하는 패턴화를 이용한 데이터 분석 방법.
  11. 제7항에 있어서,
    상기 복수개의 변수들간의 상관관계를 나타내는 패턴을 다중 히스토그램 또는 분할표로 표현하는 것을 특징으로 하는 패턴화를 이용한 데이터 분석 방법.
KR1020160139338A 2016-10-25 2016-10-25 패턴화를 이용한 데이터 분석 장치 및 방법 KR101768202B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160139338A KR101768202B1 (ko) 2016-10-25 2016-10-25 패턴화를 이용한 데이터 분석 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160139338A KR101768202B1 (ko) 2016-10-25 2016-10-25 패턴화를 이용한 데이터 분석 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101768202B1 true KR101768202B1 (ko) 2017-08-16

Family

ID=59752396

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160139338A KR101768202B1 (ko) 2016-10-25 2016-10-25 패턴화를 이용한 데이터 분석 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101768202B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101884908B1 (ko) * 2018-01-18 2018-08-02 엘아이지넥스원 주식회사 빅데이터 분석 기반 신뢰도 예측 장치
KR101884907B1 (ko) * 2018-01-18 2018-08-29 엘아이지넥스원 주식회사 빅데이터 분석 기반 신뢰도 예측 방법
KR20200021844A (ko) * 2018-08-21 2020-03-02 아주대학교산학협력단 연속형 변수의 계층화 그룹핑 방법 및 이를 이용한 상관관계 분석 방법 및 그 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010153588A (ja) 2008-12-25 2010-07-08 Fujitsu Semiconductor Ltd データ解析プログラム、データ解析装置およびデータ解析方法
JP2011141866A (ja) * 2009-12-09 2011-07-21 Nikon Corp データ分類装置、データ分類システムおよびプログラム
US20140046983A1 (en) 2011-05-05 2014-02-13 Centrifuge Pty Ltd Data Analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010153588A (ja) 2008-12-25 2010-07-08 Fujitsu Semiconductor Ltd データ解析プログラム、データ解析装置およびデータ解析方法
JP2011141866A (ja) * 2009-12-09 2011-07-21 Nikon Corp データ分類装置、データ分類システムおよびプログラム
US20140046983A1 (en) 2011-05-05 2014-02-13 Centrifuge Pty Ltd Data Analysis

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101884908B1 (ko) * 2018-01-18 2018-08-02 엘아이지넥스원 주식회사 빅데이터 분석 기반 신뢰도 예측 장치
KR101884907B1 (ko) * 2018-01-18 2018-08-29 엘아이지넥스원 주식회사 빅데이터 분석 기반 신뢰도 예측 방법
KR20200021844A (ko) * 2018-08-21 2020-03-02 아주대학교산학협력단 연속형 변수의 계층화 그룹핑 방법 및 이를 이용한 상관관계 분석 방법 및 그 장치
KR102203705B1 (ko) * 2018-08-21 2021-01-15 아주대학교산학협력단 연속형 변수의 계층화 그룹핑 방법 및 이를 이용한 상관관계 분석 방법 및 그 장치

Similar Documents

Publication Publication Date Title
KR101768202B1 (ko) 패턴화를 이용한 데이터 분석 장치 및 방법
CN101432864B (zh) 缺陷分布分类方法及系统、故障源设备确定方法及系统
CN109146279B (zh) 基于工艺规则与大数据的全流程产品质量溯源分析方法
KR102226225B1 (ko) 다양화 및 결함 발견을 위한 동적 비닝
CN115268350B (zh) 一种稳压变压器的故障预警方法及系统
US9142014B2 (en) System and method for identifying systematic defects in wafer inspection using hierarchical grouping and filtering
JP2019061598A (ja) 生産管理装置および生産管理方法
JP2019101644A (ja) データ分析システムおよびデータ分析装置
CN115423603A (zh) 一种基于机器学习的风控模型建立方法、系统及存储介质
Kaur et al. A machine learning approach to determine maturity stages of tomatoes
CN115578585A (zh) 工业图像异常检测方法、系统、计算机设备和存储介质
CN107967401A (zh) 一种版图重复单元匹配性检查方法及系统
CN112527573A (zh) 一种接口测试方法、装置及存储介质
US20140355866A1 (en) Method and apparatus for identifying root cause of defect using composite defect map
CN117335998A (zh) 基于行为模式异常检测中样本平衡方法以及装置
CN112732773B (zh) 一种继电保护缺陷数据的唯一性校核方法及系统
CN114741300A (zh) 基于测试用例的测试方法及装置
CN110866150B (zh) 一种快速生成台账数据图谱及预控设备家族缺陷的检修方法
CN113157666A (zh) 一种建立晶圆良率问题数据库的方法和装置
CN110969263A (zh) 一种用于机器学习的高级分析基础构架
Tsai et al. Enhancing the data analysis in IC testing by machine learning techniques
JP2019144870A (ja) 対象検査のためのシステム及び方法
CN108984734A (zh) 一种大样本容量图像质量主观评价方法及系统
CN118071336B (zh) 一种电缆生产设备的设备运行管理方法及系统
CN115239936B (zh) 一种高精度织物组织结构识别方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant