KR20220094827A - 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램 - Google Patents

데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20220094827A
KR20220094827A KR1020200186453A KR20200186453A KR20220094827A KR 20220094827 A KR20220094827 A KR 20220094827A KR 1020200186453 A KR1020200186453 A KR 1020200186453A KR 20200186453 A KR20200186453 A KR 20200186453A KR 20220094827 A KR20220094827 A KR 20220094827A
Authority
KR
South Korea
Prior art keywords
data
correlation
thermodynamic
dynamics
analysis
Prior art date
Application number
KR1020200186453A
Other languages
English (en)
Other versions
KR102480394B1 (ko
Inventor
김진평
장규진
배현재
김영민
Original Assignee
재단법인차세대융합기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인차세대융합기술연구원 filed Critical 재단법인차세대융합기술연구원
Priority to KR1020200186453A priority Critical patent/KR102480394B1/ko
Publication of KR20220094827A publication Critical patent/KR20220094827A/ko
Application granted granted Critical
Publication of KR102480394B1 publication Critical patent/KR102480394B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M17/00Testing of vehicles
    • G01M17/08Railway vehicles
    • G01M17/10Suspensions, axles or wheels
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L15/00Indicators provided on the vehicle or train for signalling purposes
    • B61L15/0081On-board diagnosis or maintenance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L27/00Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
    • B61L27/60Testing or simulation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/72Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating magnetic variables
    • G01N27/82Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating magnetic variables for investigating the presence of flaws
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/005Testing of electric installations on transport means
    • G01R31/008Testing of electric installations on transport means on air- or spacecraft, railway rolling stock or sea-going vessels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mechanical Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

본 발명은 따른 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램에 관한 것으로서, 정의된 트랙을 따라 이동하는 차량의 차륜 부재의 이상을 야기하는 영향 인자를 결정하기 위한 데이터 분석 장치로서, 차량이 이동하는 과정에서, 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)를 수집하는 데이터 수집부, 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA(Exploratory Data Analysis) 알고리즘을 적용하여 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출하는 EDA 분석부, 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 열역학 데이터셋 및 동역학 데이터셋의 유효성을 검증하는 상관 관계 분석부, 및 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 학습된 상관 예측 모델을 이용하여 상관 관계 분석부의 분석 결과를 검증하는 상관 관계 검증부를 포함하고, 상관 관계 검증부에 의해 검증된 열역학 데이터셋 및 동역학 데이터셋이 영향 인자로 결정되는 것을 특징으로 한다.

Description

데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램{APPARATUS AND METHOD FOR ANALYZING DATA, APPARATUS AND METHOD FOR PREDICTING ABNORMALITY, COMPUTER PROGRAM}
본 발명은 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램에 관한 것으로서, 더욱 상세하게는 철도 차량의 차륜 부재의 이상을 예측하는 과정에 활용될 수 있는, 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램에 관한 것이다.
철도 차량의 차륜은 철도 운행에 있어 안전에 가장 중요한 부품으로, 레일과의 지속적인 마찰에 의해 차륜이 일정 수준 이상으로 마모되어 차륜이 레일로부터 탈선하는 것을 방지하고, 동시에 안정적인 승차감을 확보하기 위해 특정 형상을 갖는 차륜 프로파일 구조로 설계되어 있다.
그러나, 일반적으로 철도 차량의 차륜은 철도 차량의 운행 시 레일과의 연속적인 접촉하중을 받게 되며, 이에 따라 연속적이고 지속적인 접촉하중에 의한 차륜 답면의 손상은 운행 중의 충격 하중을 발생시켜, 차륜이 설치되는 대차 부품에 영향을 미치게 되며, 이는 차륜의 파손 및 탈선을 유발시켜 커다란 인명 피해를 야기시킨다.
현재, 철도 차량의 차륜 관리는 철도 차량의 운행 시 야기되는 이상적인 진동 및 소음 등 물리적인 현상이 관측될 때마다 차륜을 점검하는 사후적 점검에 국한되어 이루어지고 있으며, 이에 따라 차륜 소손으로 인한 철도 차량의 파손 및 인명 피해의 가능성에 상시 노출되어 있는 실정이다. 나아가, 차륜의 사후적 점검 이후 그 유지보수가 이루어짐에 따라 유지보수 비용도 증가하는 경제적인 소모도 수반되고 있다.
본 발명의 배경기술은 대한민국 공개특허공보 제10-2009-0042621호(2009.04.30. 공개)에 개시되어 있다.
본 발명은 전술한 문제점을 해결하기 위해 창안된 것으로서, 본 발명의 일 측면에 따른 목적은 철도 차량의 이상 현상 발생 시 수행되는 차륜의 사후적 점검에 의존하였던 종래의 관리 방법에서 벗어나, 철도 차량 차륜의 이상을 사전에 예측할 수 있는 이상 예측 장치 및 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 철도 차량 차륜의 이상을 예측하기 위해 적용되는 신경망 모델을 학습시키기 위한 학습 데이터를 정량적인 데이터 분석 기법에 의해 선별 및 특정함으로써 신경망 모델의 학습 성능 및 예측 성능을 향상시키기 위한 데이터 분석 장치 및 방법을 제공하는 것이다.
본 발명의 일 측면에 따른 데이터 분석 장치는 정의된 트랙을 따라 이동하는 차량의 차륜 부재의 이상을 야기하는 영향 인자를 결정하기 위한 데이터 분석 장치로서, 상기 차량이 이동하는 과정에서, 상기 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)를 수집하는 데이터 수집부, 상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA(Exploratory Data Analysis) 알고리즘을 적용하여 상기 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출하는 EDA 분석부, 상기 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 상기 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 상기 열역학 데이터셋 및 상기 동역학 데이터셋의 유효성을 검증하는 상관 관계 분석부, 및 상기 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 상기 학습된 상관 예측 모델을 이용하여 상기 상관 관계 분석부의 분석 결과를 검증하는 상관 관계 검증부를 포함하고, 상기 상관 관계 검증부에 의해 검증된 열역학 데이터셋 및 동역학 데이터셋이 상기 영향 인자로 결정되는 것을 특징으로 한다.
본 발명에 있어 상기 EDA 분석부는, 상기 열역학 로우 데이터에 포함되는 복수의 하위 데이터 중 상기 EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 열역학 데이터를 특정하여 상기 열역학 데이터셋으로서 도출하고, 상기 동역학 로우 데이터에 포함되는 복수의 하위 데이터 중 상기 EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 동역학 데이터를 특정하여 상기 동역학 데이터셋으로서 도출하는 것을 특징으로 한다.
본 발명에 있어 상기 EDA 분석부는, 상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터에 대하여 IQR(Inter-Quartile Range) 방식으로 이상치(Outlier)를 제거한 후, 이상치가 제거된 열역학 로우 데이터 및 동역학 로우 데이터로부터 상기 EDA 알고리즘을 통해 상기 열역학 데이터셋 및 상기 동역학 데이터셋을 도출하는 것을 특징으로 한다.
본 발명에 있어 상기 상관 관계 분석부는, 상기 제1 및 제2 열역학 데이터 간의 선형 상관 관계, 및 상기 제1 및 제2 동역학 데이터 간의 선형 상관 관계를 분석하는 방식으로 상기 제1 및 제2 열역학 데이터와 상기 제1 및 제2 동역학 데이터의 유효성을 검증하되, 상기 제1 및 제2 열역학 데이터 간의 제1 피어슨 상관 계수(Pearson Correlation Coefficient)와 상기 제1 및 제2 동역학 데이터 간의 제2 피어슨 상관 계수가 각각 미리 정의된 기준치 이상인 경우 유효성이 검증된 것으로 판단하는 것을 특징으로 한다.
본 발명에 있어 상기 상관 관계 분석부는, 상기 제1 피어슨 상관 계수 또는 상기 제2 피어슨 상관 계수가 상기 기준치 미만인 경우, 상기 제1 및 제2 열역학 데이터 간의 시계열 상관 관계, 또는 상기 제1 및 제2 동역학 데이터 간의 시계열 상관 관계를 후속 분석하는 방식으로 제1 및 제2 열역학 데이터, 또는 상기 제1 및 제2 동역학 데이터의 유효성을 검증하는 것을 특징으로 한다.
본 발명에 있어 상기 상관 예측 모델은 머신 러닝(Machine Learning)에 의해 학습되는 앙상블 모델(Ensemble Model)이고, 상기 상관 관계 검증부는, 상기 제1 열역학 데이터 및 상기 제1 동역학 데이터를 상기 상관 예측 모델의 입력 데이터로 하고, 상기 제2 열역학 데이터 및 상기 제2 동역학 데이터를 상기 상관 예측 모델의 출력 클래스로 하여 상기 상관 예측 모델을 학습시키는 것을 특징으로 한다.
본 발명에 있어 상기 상관 관계 검증부는, 차기 시점에서 실측되는, 제1 및 제2 테스트 열역학 데이터와 제1 및 제2 테스트 동역학 데이터를 획득하고, 상기 제1 테스트 열역학 데이터 및 상기 제1 테스트 동역학 데이터를 상기 학습된 상관 예측 모델에 입력하며, 그에 따라 출력되는 출력 열역학 데이터 및 출력 동역학 데이터를 각각 상기 제2 테스트 열역학 데이터 및 상기 제2 테스트 동역학 데이터와 비교하는 방식으로 상기 상관 관계 분석부의 분석 결과를 검증하는 것을 특징으로 한다.
본 발명에 있어 상기 차량은 철도 차량인 것을 특징으로 한다.
본 발명의 일 측면에 따른 이상 예측 장치는 신경망(Neural Network)을 통해 입력 데이터의 클래스를 식별하도록 구성된 신경망 모델을 학습시키는 학습부로서, 데이터 분석 장치에 의해 결정된 영향 인자를 상기 신경망 모델을 학습시키기 위한 학습 데이터로서 이용하는, 학습부, 및 상기 학습부를 통해 상기 신경망 모델이 학습된 이후, 상기 차량이 이동하는 과정에서 수집되는, 상기 영향 인자에 해당하는 실측 열역학 데이터 및 실측 동역학 데이터를 상기 학습된 신경망 모델에 적용하여 상기 차륜 부재의 이상을 예측하는 예측부를 포함하는 것을 특징으로 한다.
본 발명의 일 측면에 따른 데이터 분석 방법은, 정의된 트랙을 따라 이동하는 차량의 차륜 부재의 이상을 야기하는 영향 인자를 결정하기 위한 데이터 분석 방법으로서, 데이터 수집부가, 상기 차량이 이동하는 과정에서, 상기 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)를 수집하는 단계, EDA 분석부가, 상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA(Exploratory Data Analysis) 알고리즘을 적용하여 상기 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출하는 단계, 상관 관계 분석부가, 상기 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 상기 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 상기 열역학 데이터셋 및 상기 동역학 데이터셋의 유효성을 검증하는 단계, 및 상관 관계 검증부가, 상기 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 상기 학습된 상관 예측 모델을 이용하여 상기 상관 관계 분석부의 분석 결과를 검증하는 단계를 포함하고, 상기 상관 관계 검증부에 의해 검증된 열역학 데이터셋 및 동역학 데이터셋이 상기 영향 인자로 결정되는 것을 특징으로 한다.
본 발명의 일 측면에 따른 이상 예측 방법은, 학습부가, 신경망(Neural Network)을 통해 입력 데이터의 클래스를 식별하도록 구성된 신경망 모델을 학습시키는 단계로서, 제9항에 따른 데이터 분석 방법에 의해 결정된 영향 인자를 상기 신경망 모델을 학습시키기 위한 학습 데이터로서 이용하는, 단계, 및 예측부가, 상기 학습부를 통해 상기 신경망 모델이 학습된 이후, 상기 차량이 이동하는 과정에서 수집되는, 상기 영향 인자에 해당하는 실측 열역학 데이터 및 실측 동역학 데이터를 상기 학습된 신경망 모델에 적용하여 상기 차륜 부재의 이상을 예측하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일 측면에 따른 컴퓨터 프로그램은 하드웨어와 결합되어, 정의된 트랙을 따라 이동하는 차량의 차륜 부재의 이상을 야기하는 영향 인자를 결정하기 단계들을 실행시키기 위해 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램으로서, 상기 단계들은, 상기 차량이 이동하는 과정에서, 상기 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)를 수집하는 단계, 상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA(Exploratory Data Analysis) 알고리즘을 적용하여 상기 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출하는 단계, 상기 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 상기 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 상기 열역학 데이터셋 및 상기 동역학 데이터셋의 유효성을 검증하는 단계, 및 상기 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 상기 학습된 상관 예측 모델을 이용하여 상기 상관 관계의 분석 결과를 검증함으로써 상기 영향 인자를 결정하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일 측면에 따르면, 머신 러닝에 따라 학습된 신경망 모델을 통해 철도 차량의 차륜을 모니터링하고 그 이상을 사전에 예측함으로써, 차륜의 사후적 점검에 의존하였던 종래의 관리 방법 대비 그 모니터링 편의성 및 유지보수 비용을 절감시킬 수 있다.
또한, EDA 알고리즘, 상관 관계 분석, 및 머신 러닝에 따라 학습된 상관 예측 모델을 통해 차륜 이상 예측을 위한 신경망 모델의 학습 데이터를 선별 및 특정함으로써, 신경망 모델의 학습 성능 및 예측 성능을 향상시킬 수 있다.
도 1은 본 발명의 일 실시예에 따른 데이터 분석 장치 및 이상 예측 장치를 설명하기 위한 블록구성도이다.
도 2 내지 도 5는 본 발명의 일 실시예에 따른 데이터 분석 장치에서 EDA 분석부의 동작을 시각적으로 보인 예시도이다.
도 6 내지 도 8은 본 발명의 일 실시예에 따른 데이터 분석 장치에서 상관 관계 분석부의 동작을 시각적으로 보인 예시도이다.
도 9는 본 발명의 일 실시예에 따른 데이터 분석 방법 및 이상 예측 방법을 설명하기 위한 흐름도이다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램의 실시예를 설명한다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 실시예는 정의된 트랙(레일)을 따라 이동하는 철도 차량의 차륜 부재의 이상(파손)을 야기하는 영향 인자를 결정하고, 결정된 영향 인자를 이용하여 차륜 부재의 이상을 예측하기 위한 신경망 모델(Neural Network Model)을 학습시키며, 영향 인자에 해당하는 차륜 부재의 실측 데이터를 상기 학습된 신경망 모델에 적용하여 차륜 부재의 이상을 예측하도록 동작한다. 본 실시예에서 머신 러닝(Machine Learning)에 따른 예측 모델은, 데이터 분석 장치(10)에 적용되는 상관 예측 모델과 이상 예측 장치(20)에 적용되는 신경망 모델로 구분되며, 상관 예측 모델은 열역학 데이터셋과 동역학 데이터셋(후술)의 상관 관계를 예측하기 위한 모델로, 그리고 신경망 모델은 차륜 부재의 이상을 예측하기 위한 모델로 그 용어를 명확히 구분하여 정의하기로 한다.
차륜 부재는 철제 차륜의 경우 차륜 자체를 의미할 수도 있고, 경전철에 적용되는 고무 차륜의 경우 타이어를 의미할 수도 있다. 본 실시예에서는 차륜 부재가 경전철 고무 차륜 타이어를 의미하는 것으로 설명한다. 또한, 차륜 부재의 이상은 차륜 부재의 파손 부위(위치), 파손 정도, 및 파손이 예측되는 시점을 포괄하는 개념으로 정의될 수 있다.
위에서 언급한 본 실시예의 동작 중, 영향 인자를 결정하는 동작은 데이터 분석 장치(10)에 의해 수행되며, 신경망 모델을 학습시키고 차륜 부재의 이상을 예측하는 동작은 이상 예측 장치(20)에 의해 수행된다. 차륜 부재의 이상을 예측하기 위한 신경망 모델은, 신경망을 통해 입력 데이터의 클래스를 식별하도록 구성된 통상의 머신 러닝 모델에 해당하며, 본 실시예에서는 데이터 분석 장치(10)에 의해 결정된 영향 인자에 해당하는 차륜의 실측 데이터를 입력받고, 그 클래스로서 차륜 부재의 이상을 출력하도록 학습된다.
한편, 신경망 모델의 학습 정확도, 그리고 그에 따른 예측 정확도는 전적으로 신경망 모델의 학습 과정에서 이용되는 학습 데이터의 품질 및 양에 의존한다. 차륜 부재의 이상을 야기하는 것과 무관한 인자가 학습 데이터로 이용될 경우 High Bias를 야기하여 신경망 모델이 언더 피팅(Under Fitting)될 수 있고, 학습 데이터의 양이 과도하게 증가하면 High Variance를 야기하여 신경망 모델이 오버 피팅(Over Fitting)될 수 있으며, 이는 신경망 모델의 학습 성능 및 예측 성능의 저하를 나타낸다.
이에, 본 실시예에서는 신경망 모델을 학습시키는데 이용되는 학습 데이터를 최적화시키는 구성을 채용한다. 즉, 차륜 부재의 이상을 야기할 것으로 예상되는 데이터를 선별적으로 수집하여 학습 데이터의 품질(Feature)이 높아지도록 유도하며, 이후 정량적인 데이터 분석 기법을 통해 신경망 모델을 학습시키는데 이용될 학습 데이터(즉, 차륜 부재의 이상을 야기하는 유효 영향 인자)를 선별 및 특정함으로써, 신경망 모델의 학습에 소요되는 로드가 저감되고 예측 성능이 향상되도록 하는 방안을 제시하며, 이하에서 구체적으로 설명한다.
도 1은 본 발명의 일 실시예에 따른 데이터 분석 장치 및 이상 예측 장치를 설명하기 위한 블록구성도이고, 도 2 내지 도 5는 본 발명의 일 실시예에 따른 데이터 분석 장치에서 EDA 분석부의 동작을 시각적으로 보인 예시도이며, 도 6 내지 도 8은 본 발명의 일 실시예에 따른 데이터 분석 장치에서 상관 관계 분석부의 동작을 시각적으로 보인 예시도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 데이터 분석 장치(10)는 데이터 수집부(100), EDA 분석부(200), 상관 관계 분석부(300) 및 상관 관계 검증부(400)를 포함하며, 상기와 같은 데이터 분석 장치(10)는 학습부(500) 및 예측부(600)와 함께 이상 예측 장치(20)를 구성한다. 본 실시예의 각 구성(100, 200, 300, 400, 500, 600)은 프로세서(Processor), 중앙 처리 장치(CPU: Central Processing Unit) 또는 SoC(System on Chip)로 구현될 수 있으며, 운영 체제 또는 어플리케이션을 구동하여 프로세서에 연결된 복수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있으며, 메모리에 저장된 적어도 하나의 명령을 실행시키고, 그 실행 결과 데이터를 메모리에 저장하도록 구성될 수 있다.
데이터 분석 장치(10)의 동작을 그 하위 구성별로 구체적으로 설명하면, 먼저 데이터 수집부(100)는 차량이 이동하는 과정에서, 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 데이터 및 동역학 데이터를 수집한다.
구체적으로, 철도 차량의 경우 열차종합제어장치(Train Control & Monitoring System, 이하 TCMS)가 마련되어, 철도 차량 내의 각 부속장치(예: 주변압기, 브레이크장치, 출입문 제어장치, 고압회로 및 저압회로기기, 공압장치, ATC 차상장치 또는 ATS 차상장치 등)에 대한 상태 데이터를 수집하고 자체 제어 로직 또는 외부로부터 입력되는 제어 신호에 의해 각 부속장치의 동작을 제어함과 동시에 그 이력을 기록하며, 또한 철도 차량에 장착된 각 센서로부터의 데이터를 수집하여 철도 차량의 운행 및 고장에 대한 종합 관리를 수행하도록 동작한다.
데이터 수집부(100)는 TCMS에 의해 관리되는 방대한 데이터 중, 차륜 부재의 열역학적 상태를 지표하는 열역학 데이터, 그리고 차륜 부재의 동역학적 상태를 지표하는 동역학 데이터만을 선별적으로 수집한다(본 실시예에서 데이터 수집부(100)에 의해 수집되는 열역학 데이터 및 동역학 데이터를 각각 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)로 정의한다). 즉, 앞서 설명한 것과 같이 본 실시예에서 차륜 부재는 경전철 고무 차륜 타이어에 해당할 수 있으며, 이에 따라 차륜 부재의 이상은 열역학적 상태 및 동역학적 상태에 의존하므로, 데이터 수집부(100)는 TCMS에 의해 관리되는 방대한 데이터 중, 차륜 부재의 이상을 야기할 수 있는 열역학 로우 데이터 및 동역학 로우 데이터만을 선별적으로 수집하여, 신경망 모델의 학습 데이터로 기능하게 되는 영향 인자의 Feature가 높아지도록 할 수 있다. 열역학 로우 데이터에는 차륜 부재, 즉 타이어의 온도, 압력, 체적 등이 해당될 수 있으며, 동역학 로우 데이터는 타이어의 3축 가속도 및 속도(철도 차량의 3축 가속도 및 속도에 대응된다) 등이 해당될 수 있다(3축은 차량의 횡방향을 지시하는 x축, 차량의 종방향을 지시하는 y축, 차량의 상하 방향을 지시하는 z축을 의미한다). 한편, 데이터 수집부(100)는 상기와 같은 열역학 로우 데이터 및 동역학 로우 데이터와 함께, 차륜 부재의 상태 데이터(차륜 부재의 파손 위치, 파손 정도, 및 파손이 발생한 시점)를 TCMS로부터 수집할 수 있으며, 수집된 차륜 부재의 상태 데이터는 후술하는 것과 같이 신경망 모델의 학습을 위한 출력 클래스로 활용된다.
데이터 수집부(100)에 의해 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 후술하는 EDA 분석부(200), 상관 관계 분석부(300) 및 상관 관계 검증부(400)에 의해 최종적인 영향 인자로 기능하게 되는 열역학 데이터셋(제1 및 제2 열역학 데이터)과 동역학 데이터셋(제1 및 제2 동역학 데이터)이 도출된다. 즉, 데이터 수집부(100)에 의해 수집된 열역학 로우 데이터 및 동역학 로우 데이터 전부를, 차륜 부재 이상 예측을 위한 신경망 모델의 학습 데이터로 이용함에 따라 야기될 수 있는 신경망 모델의 오버 피팅이 방지될 수 있도록, 본 실시예는 신경망 모델의 학습 데이터로 기능하게 되는 영향 인자의 수를 최적화시키도록 동작하며, 영향 인자의 수를 최적화시키기 위한 정량적 기준 내지 방법으로서 EDA(Exploratory Data Analysis) 및 상관 분석(Correlation Analysis)를 채용한다.
먼저 EDA 분석부(200)의 동작에 대하여 설명하면, EDA 분석부(200)는 데이터 수집부(100)에 의해 수집된 열역학 로우 데이터 및 동역학 로우 데이터에 대하여 IQR(Inter-Quartile Range) 방식으로 이상치(Outlier)를 제거한다. 즉, 영향 인자의 Feature를 높이기 위한 데이터 전처리로서 EDA 분석부(200)는 사전적으로 IQR 방식으로 이상치를 제거하도록 동작하며, 예를 들어 Q3+IQR*3보다 크거나, Q1-IQR*3보다 작은 값을 갖는 데이터를 이상치로 판단하여 제거할 수 있다.
이후, EDA 분석부(200)는 이상치가 제거된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA 알고리즘을 적용하여 차륜 부재의 이상을 야기하는 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출한다.
구체적으로, EDA 분석부(200)는 열역학 로우 데이터에 포함되는 복수의 하위 데이터 중, EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 열역학 데이터를 특정하여 열역학 데이터셋으로서 도출한다. 여기서, 시계열적 변화 패턴이 정합된다 함은 시계열적으로 변환하는 추세가 두 데이터 간에 유사하거나, 시계열적인 변화가 발생하는 시점이 유사함을 의미하며, 상기 '유사'의 정량적 기준은 설계자의 의도 및 실험적 결과에 기초하여 상기한 EDA 알고리즘에 미리 정의되어 있을 수 있다.
마찬가지로, EDA 분석부(200)는 동역학 로우 데이터에 포함되는 복수의 하위 데이터 중, EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 동역학 데이터를 특정하여 동역학 데이터셋으로서 도출한다.
도 2 및 도 3은 열역학 데이터셋으로서 제1 및 제2 열역학 데이터가 특정되는 예시를 보이고 있으며, 구체적으로 도 3은 EDA 알고리즘을 기반으로, 시계열적 변화 패턴이 정합되는(즉, 시계열적으로 변화하는 추세가 유사한) 온도 데이터와 압력 데이터가 각각 제1 및 제2 열역학 데이터로 특정되는 예시를 보이고 있다. 도 2에 도시된 급격히 하락되는 패턴에 해당하는 온도 데이터는 이상치로 제거된다.
도 4 및 도 5는 동역학 데이터셋으로서 제1 및 제2 동역학 데이터가 특정되는 예시를 보이고 있으며(도 4 및 도 5는 각각 철도 차량이 상호 반대 방향으로 주행할 때의 데이터 예시에 해당한다), 구체적으로 x축 가속도 데이터, y축 가속도 데이터, z축 가속도 데이터, 속도 데이터 중 시계열적 변화 패턴이 정합되는(즉, 시계열적인 변화가 발생하는 시점이 유사한) y축 가속도 데이터 및 속도 데이터가 각각 제1 및 제2 동역학 데이터로 특정되는 예시를 보이고 있다.
다음으로, 상관 관계 분석부(300)는 EDA 분석부(200)에 의해 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 열역학 데이터셋 및 동역학 데이터셋의 유효성을 검증한다. 이때, 상관 관계 분석 기법으로서 선형 상관 분석에 해당하는 피어슨 상관 분석(Pearson Correlation Analysis)과 시계열 상관 분석에 해당하는 교차 상관 분석(Cross Correlation Analysis)이 상호 보완적으로 적용된다.
구체적으로, 상관 관계 분석부(300)는 제1 및 제2 열역학 데이터 간의 선형 상관 관계를 분석하는 방식으로 제1 및 제2 열역학 데이터의 유효성(즉, 제1 및 제2 열역 데이터 간의 상관성)을 검증한다. 이때, 상관 관계 분석부(300)는 제1 및 제2 열역학 데이터 간의 제1 피어슨 상관 계수(Pearson Correlation Coefficient, ρp)가 미리 정의된 기준치 이상인 경우 그 유효성이 검증된 것으로 판단한다. 기준치는 설계자의 의도 및 실험적 결과에 기초하여 특정 값으로 미리 정의되어 있을 수 있다(예: 0.8).
도 6은 제1 및 제2 열역학 데이터가 각각 온도 데이터 및 압력 데이터로 특정된 예시에서 선형 상관 관계 분석 결과의 예시를 보이고 있다. 도 6의 예시에서, 온도 데이터 및 압력 데이터 간의 제1 피어슨 상관 계수는 1에 가까우며, 이에 따라 온도 데이터 및 압력 데이터는 양의 선형 상관 관계를 가진 것으로 그 유효성이 검증된다.
마찬가지로, 상관 관계 분석부(300)는 제1 및 제2 동역학 데이터 간의 선형 상관 관계를 분석하는 방식으로 제1 및 제2 동역학 데이터의 유효성을 검증한다. 이때, 상관 관계 분석부(300)는 제1 및 제2 동역학 데이터 간의 제2 피어슨 상관 계수가 상기한 기준치 이상인 경우 유효성이 검증된 것으로 판단한다.
도 7은 제1 및 제2 동역학 데이터가 각각 y축 가속도 데이터 및 속도 데이터로 특정된 예시에서 선형 상관 관계 분석 결과를 매트릭스 형태로 보이고 있으며, y축 가속도 데이터 및 속도 데이터는 선형 상관 관계가 부재한 예시를 보이고 있다.
도 7의 예시와 같이, 제1 및 제2 열역학 데이터 간, 또는 제1 및 제2 동역학 데이터 간의 선형 상관 관계의 유효성이 검증되지 않은 경우, 상관 관계 분석부(300)는 제1 및 제2 열역학 데이터 간, 또는 제1 및 제2 동역학 데이터 간의 시계열 상관 관계를 후속 분석하는 방식으로 제1 및 제2 열역학 데이터, 또는 제1 및 제2 동역학 데이터의 유효성을 재차 검증할 수 있다. 이 경우, 상관 관계 분석부(300)는 제1 및 제2 열역학 데이터 간의 제1 교차 상관 계수와, 제1 및 제2 동역학 데이터 간의 제2 교차 상관 계수를 분석하는 방식으로 그 유효성을 검증할 수 있다. 상관 관계 분석부(300)는 교차 상관 계수의 시계열적 변화 패턴이 주기성을 갖는 경우 유효성이 검증된 것으로 판단할 수 있으며, 이를 위해 교차 상관 계수의 시계열적 변화 패턴이 주기성을 갖는지를 판단하기 위한 정량적 알고리즘이 상관 관계 분석부(300)에 미리 정의되어 있을 수 있다.
도 8은 제1 및 제2 동역학 데이터가 각각 y축 가속도 데이터 및 속도 데이터로 특정된 예시에서 교차 상관 분석 결과의 예시를 보이고 있다. y축 가속도 데이터 및 속도 데이터 간의 제2 교차 상관 계수는 그 시계열적 변화 패턴이 양의 값과 음의 값을 갖는 형태로 주기성을 가지며, 이에 따라 상관 관계 분석부(300)는 제1 및 제2 동역학 데이터로서 y축 가속도 데이터 및 속도 데이터의 유효성이 검증된 것으로 판단할 수 있다.
다음으로, 상관 관계 검증부(400)는 상관 관계 분석부(300)에 의해 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 학습된 상관 예측 모델을 이용하여 상관 관계 분석부(300)의 분석 결과를 검증한다. 여기서, 상관 예측 모델은 머신 러닝에 의해 학습되는 앙상블 모델(Ensemble Model, 예: XGBoost)로서, 제1 열역학 데이터에 해당하는 파라미터를 입력 데이터로 하고 제2 열역학 데이터에 해당하는 파라미터를 출력 클래스로 하는 제1 상관 예측 모델과, 제1 동역학 데이터에 해당하는 파라미터를 입력데이터를 하고 제2 동역학 데이터에 해당하는 파라미터를 출력 클래스로 하는 제2 상관 예측 모델을 포함하도록 구성될 수 있다.
구체적으로, 상관 관계 검증부(400)는 상관 관계 분석부(300)에 의해 유효성 검증된 제1 열역학 데이터를 제1 상관 예측 모델의 입력 데이터로 하고, 제2 열역학 데이터를 제1 상관 예측 모델의 출력 클래스로 하여 제1 상관 예측 모델을 학습시킬 수 있다. 예를 들어, 상관 관계 검증부(400)는 온도 데이터를 입력 데이터로 하고 압력 데이터를 출력 클래스로 하여 제1 상관 예측 모델을 학습시킬 수 있으며, 이에 따라 온도 및 압력 간의 예측 모델이 학습될 수 있다.
마찬가지로, 상관 관계 검증부(400)는 상관 관계 분석부(300)에 의해 유효성 검증된 제1 동역학 데이터를 제2 상관 예측 모델의 입력 데이터로 하고, 제2 동역학 데이터를 제2 상관 예측 모델의 출력 클래스로 하여 제2 상관 예측 모델을 학습시킬 수 있다. 예를 들어, 상관 관계 검증부(400)는 y축 가속도 데이터를 입력 데이터로 하고 속도 데이터를 출력 클래스로 하여 제2 상관 예측 모델을 학습시킬 수 있으며, 이에 따라 y축 가속도 및 속도 간의 예측 모델이 학습될 수 있다.
이후, 상관 관계 검증부(400)는, 차기 시점에서 실측된 제1 및 제2 테스트 열역학 데이터를 획득하고, 제1 테스트 열역학 데이터를 상기와 같이 학습된 제1 상관 예측 모델에 입력하며, 그에 따라 출력되는 출력 열역학 데이터를 제2 테스트 열역학 데이터와 비교하는 방식으로 상관 관계 분석부(300)의 분석 결과를 검증할 수 있다. 여기서, 제1 및 제2 테스트 열역학 데이터는 차기 시점에서 실측되는 온도 데이터 및 압력 데이터일 수 있다. 즉, 상관 관계 검증부(400)는 제1 상관 예측 모델을 통해 제1 테스트 열역학 데이터(실측 온도 데이터)로부터 예측되는 출력 열역학 데이터(예측 압력 데이터)를 제2 테스트 열역학 데이터(실측 압력 데이터)와 비교하도록 동작할 수 있으며, 비교 결과 그 차이가 임계치 미만인 경우 제1 상관 예측 모델의 예측 성능, 그리고 그에 따른 상관 관계 분석부(300)의 분석 결과가 검증된 것으로 판단할 수 있다.
마찬가지의 방법으로서, 상관 관계 검증부(400)는, 차기 시점에서 실측된 제1 및 제2 테스트 동역학 데이터(실측 y축 가속도 데이터 및 실측 속도 데이터)를 획득하고, 제1 테스트 동역학 데이터(실측 y축 가속도 데이터)를 상기와 같이 학습된 제2 상관 예측 모델에 입력하며, 그에 따라 출력되는 출력 열역학 데이터(예측 속도 데이터)를 제2 테스트 열역학 데이터(실측 속도 데이터)와 비교하는 방식으로 상관 관계 분석부(300)의 분석 결과를 검증할 수 있다.
상관 관계 검증부(400)에 의해 최종적으로 검증이 완료되면, 검증된 열역학 데이터셋(즉, 제1 및 제2 열역학 데이터) 및 동역학 데이터셋(제1 및 제2 동역학 데이터)이 영향 인자로 결정된다. 앞선 예시에서, 온도, 압력, y축 가속도 및 속도가 차륜 부재의 이상을 야기하는 유효한 영향 인자로 결정된다.
전술한 과정을 통해 영향 인자가 결정되면, 이상 예측 장치(20)는 결정된 영향 인자를 통해 신경망 모델을 학습시켜 차륜 부재의 이상을 예측하도록 동작하며, 앞서 언급한 것과 같이 이상 예측 장치(20)는 위에서 설명한 데이터 분석 장치(10), 학습부(500) 및 예측부(600)를 포함한다.
학습부(500)는 데이터 분석 장치(10)에 의해 결정된 영향 인자를 학습 데이터로 이용하여 신경망 모델을 학습시킨다. 구체적으로, 학습부(500)는 데이터 분석 장치(10)에 의해 결정된 영향 인자로서 제1 및 제2 열역학 데이터와 제1 및 제2 동역학 데이터를 입력 데이터로 하고, 데이터 분석 장치(10)의 데이터 수집부(100)에 의해 수집된 차륜 부재의 상태 데이터(차륜 부재의 파손 위치, 파손 정도, 및 파손이 발생한 시점)를 출력 클래스로 하여 신경망 모델을 학습시킨다. 앞선 예시에 따를 때, 학습부(500)는 온도 데이터, 압력 데이터, y축 가속도 데이터 및 속도 데이터를 입력 데이터로 하고 차륜 부재의 상태 데이터를 출력 클래스로 하여 신경망 모델을 학습시킬 수 있다.
예측부(600)는 학습부(500)를 통해 신경망 모델이 학습된 이후, 차량이 이동하는 과정에서 수집되는, 영향 인자에 해당하는 실측 열역학 데이터 및 실측 동역학 데이터를 학습된 신경망 모델에 적용하여 차륜 부재의 이상을 예측한다. 즉, 신경망 모델의 학습이 완료되면, 예측부(600)는 차기 시점에서 차량이 이동하는 동안 수집되는 실측 열역학 데이터(실측 온도 데이터와 실측 압력 데이터) 및 실측 동역학 데이터(실측 y축 가속도 데이터와 실측 속도 데이터)를 신경망 모델에 입력하고, 신경망 모델로부터 출력되는 클래스인 차륜 부재의 상태 데이터를 확인하는 방식으로 차륜 부재의 이상을 예측한다. 예측부(600)의 예측 결과는 TCMS로 피드백되어 철도 차량의 종합 제어 및 관리 과정에서 활용될 수 있다.
도 9는 본 발명의 일 실시예에 따른 데이터 분석 방법 및 이상 예측 방법을 설명하기 위한 흐름도로서, 전술한 내용과 중복적인 구성에 대한 구체적인 설명은 생략하고 그 시계열적인 구성을 중심으로 설명한다. 도 9의 S100 단계 내지 S400 단계는 데이터 분석 방법을 구성하며, S100 단계 내지 S600 단계는 이상 예측 방법을 구성한다.
먼저, 데이터 수집부(100)는 차량이 이동하는 과정에서, 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터 및 동역학 로우 데이터를 수집한다(S100).
이어서, EDA 분석부(200)는 S100 단계에서 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA 알고리즘을 적용하여 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출한다(S200).
S200 단계에서, EDA 분석부(200)는 열역학 로우 데이터에 포함되는 복수의 하위 데이터 중 EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 열역학 데이터를 특정하여 열역학 데이터셋으로서 도출하고, 마찬가지로 동역학 로우 데이터에 포함되는 복수의 하위 데이터 중 EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 동역학 데이터를 특정하여 동역학 데이터셋으로서 도출한다. 이때, EDA 분석부(200)는 열역학 로우 데이터 및 동역학 로우 데이터에 대하여 IQR 방식으로 이상치를 제거한 후, 이상치가 제거된 열역학 로우 데이터 및 동역학 로우 데이터로부터 EDA 알고리즘을 통해 열역학 데이터셋 및 동역학 데이터셋을 도출한다.
이어서, 상관 관계 분석부(300)는 S200 단계에서 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, S200 단계에서 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 열역학 데이터셋 및 동역학 데이터셋의 유효성을 검증한다(S300).
S300 단계에서, 상관 관계 분석부(300)는 제1 및 제2 열역학 데이터 간의 선형 상관 관계, 및 제1 및 제2 동역학 데이터 간의 선형 상관 관계를 분석하는 방식으로 제1 및 제2 열역학 데이터와 제1 및 제2 동역학 데이터의 유효성을 검증하되, 제1 및 제2 열역학 데이터 간의 제1 피어슨 상관 계수와 제1 및 제2 동역학 데이터 간의 제2 피어슨 상관 계수가 각각 미리 정의된 기준치 이상인 경우 유효성이 검증된 것으로 판단한다. 만약, 제1 피어슨 상관 계수 또는 제2 피어슨 상관 계수가 기준치 미만인 경우, 상관 관계 분석부(300)는 제1 및 제2 열역학 데이터 간의 시계열 상관 관계, 또는 제1 및 제2 동역학 데이터 간의 시계열 상관 관계를 후속 분석하는 방식으로 제1 및 제2 열역학 데이터, 또는 제1 및 제2 동역학 데이터의 유효성을 재차 검증한다.
이어서, 상관 관계 검증부(400)는 S300 단계에서 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 학습된 상관 예측 모델을 이용하여 상관 관계 분석부(300)의 분석 결과를 검증한다(S400).
S400 단계에서 상관 관계 검증부(400)는 제1 열역학 데이터 및 제1 동역학 데이터를 상관 예측 모델의 입력 데이터로 하고, 제2 열역학 데이터 및 제2 동역학 데이터를 상관 예측 모델의 출력 클래스로 하여 상관 예측 모델을 학습시킨다.
S100 단계 내지 S400 단계를 통해 최종적으로 도출된 열역학 데이터셋(제1 및 제2 열역학 데이터) 및 동역학 데이터셋(제1 및 제2 동역학 데이터)이 영향 인자로 결정된다.
이후, 학습부(500)는 S100 단계 내지 S400 단계를 통해 결정된 영향 인자를 학습 데이터로 이용하여 신경망 모델을 학습시킨다(S500).
S500 단계를 통해 신경망 모델이 학습된 이후, 예측부(600)는 차량이 이동하는 과정에서 수집되는, 영향 인자에 해당하는 실측 열역학 데이터 및 실측 동역학 데이터를 학습된 신경망 모델에 적용하여 차륜 부재의 이상을 예측한다(S600).
한편, 본 실시예에 따른 데이터 분석 방법 및 이상 예측 방법은 하드웨어와 결합되어 전술한 S100 단계 내지 S600 단계를 실행시키기 위한 컴퓨터 프로그램으로 작성될 수 있으며, 컴퓨터로 판독 가능한 기록매체에 저장되어 상기 컴퓨터 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 컴퓨터로 판독 가능한 기록매체는 ROM, RAM, 하드 디스크, 플로피 디스크, 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 플래시 메모리(flash memory)와 같은 프로그램 명령어들을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 해당될 수 있다.
이와 같이 본 실시예는 머신 러닝에 따라 학습된 신경망 모델을 통해 철도 차량의 차륜을 모니터링하고 그 이상을 사전에 예측함으로써, 차륜의 사후적 점검에 의존하였던 종래의 관리 방법 대비 그 모니터링 편의성 및 유지보수 비용을 절감시킬 수 있다. 또한, EDA 알고리즘, 상관 관계 분석, 및 머신 러닝에 따라 학습된 상관 예측 모델을 통해 차륜 이상 예측을 위한 신경망 모델의 학습 데이터를 선별 및 특정함으로써, 신경망 모델의 학습 성능 및 예측 성능을 향상시킬 수 있다.
본 명세서에서 설명된 구현은, 예컨대, 방법 또는 프로세스, 장치, 소프트웨어 프로그램, 데이터 스트림 또는 신호로 구현될 수 있다. 단일 형태의 구현의 맥락에서만 논의(예컨대, 방법으로서만 논의)되었더라도, 논의된 특징의 구현은 또한 다른 형태(예컨대, 장치 또는 프로그램)로도 구현될 수 있다. 장치는 적절한 하드웨어, 소프트웨어 및 펌웨어 등으로 구현될 수 있다. 방법은, 예컨대, 컴퓨터, 마이크로프로세서, 집적 회로 또는 프로그래밍가능한 로직 디바이스 등을 포함하는 프로세싱 디바이스를 일반적으로 지칭하는 프로세서 등과 같은 장치에서 구현될 수 있다. 프로세서는 또한 최종-사용자 사이에 정보의 통신을 용이하게 하는 컴퓨터, 셀 폰, 휴대용/개인용 정보 단말기(personal digital assistant: "PDA") 및 다른 디바이스 등과 같은 통신 디바이스를 포함한다.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며 당해 기술이 속하는 기술분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호범위는 아래의 특허청구범위에 의하여 정해져야 할 것이다.
10: 데이터 분석 장치
20: 이상 예측 장치
100: 데이터 수집부
200: EDA 분석부
300: 상관 관계 분석부
400: 상관 관계 검증부
500: 학습부
600: 예측부

Claims (12)

  1. 정의된 트랙을 따라 이동하는 차량의 차륜 부재의 이상을 야기하는 영향 인자를 결정하기 위한 데이터 분석 장치로서,
    상기 차량이 이동하는 과정에서, 상기 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)를 수집하는 데이터 수집부;
    상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA(Exploratory Data Analysis) 알고리즘을 적용하여 상기 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출하는 EDA 분석부;
    상기 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 상기 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 상기 열역학 데이터셋 및 상기 동역학 데이터셋의 유효성을 검증하는 상관 관계 분석부; 및
    상기 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 상기 학습된 상관 예측 모델을 이용하여 상기 상관 관계 분석부의 분석 결과를 검증하는 상관 관계 검증부;
    를 포함하고,
    상기 상관 관계 검증부에 의해 검증된 열역학 데이터셋 및 동역학 데이터셋이 상기 영향 인자로 결정되는 것을 특징으로 하는 데이터 분석 장치.
  2. 제1항에 있어서,
    상기 EDA 분석부는,
    상기 열역학 로우 데이터에 포함되는 복수의 하위 데이터 중 상기 EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 열역학 데이터를 특정하여 상기 열역학 데이터셋으로서 도출하고,
    상기 동역학 로우 데이터에 포함되는 복수의 하위 데이터 중 상기 EDA 알고리즘을 통해 시계열적 변화 패턴이 정합되는 제1 및 제2 동역학 데이터를 특정하여 상기 동역학 데이터셋으로서 도출하는 것을 특징으로 하는 데이터 분석 장치.
  3. 제2항에 있어서,
    상기 EDA 분석부는,
    상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터에 대하여 IQR(Inter-Quartile Range) 방식으로 이상치(Outlier)를 제거한 후, 이상치가 제거된 열역학 로우 데이터 및 동역학 로우 데이터로부터 상기 EDA 알고리즘을 통해 상기 열역학 데이터셋 및 상기 동역학 데이터셋을 도출하는 것을 특징으로 하는 데이터 분석 장치.
  4. 제2항에 있어서,
    상기 상관 관계 분석부는,
    상기 제1 및 제2 열역학 데이터 간의 선형 상관 관계, 및 상기 제1 및 제2 동역학 데이터 간의 선형 상관 관계를 분석하는 방식으로 상기 제1 및 제2 열역학 데이터와 상기 제1 및 제2 동역학 데이터의 유효성을 검증하되, 상기 제1 및 제2 열역학 데이터 간의 제1 피어슨 상관 계수(Pearson Correlation Coefficient)와 상기 제1 및 제2 동역학 데이터 간의 제2 피어슨 상관 계수가 각각 미리 정의된 기준치 이상인 경우 유효성이 검증된 것으로 판단하는 것을 특징으로 하는 데이터 분석 장치.
  5. 제4항에 있어서,
    상기 상관 관계 분석부는,
    상기 제1 피어슨 상관 계수 또는 상기 제2 피어슨 상관 계수가 상기 기준치 미만인 경우, 상기 제1 및 제2 열역학 데이터 간의 시계열 상관 관계, 또는 상기 제1 및 제2 동역학 데이터 간의 시계열 상관 관계를 후속 분석하는 방식으로 제1 및 제2 열역학 데이터, 또는 상기 제1 및 제2 동역학 데이터의 유효성을 검증하는 것을 특징으로 하는 데이터 분석 장치.
  6. 제5항에 있어서,
    상기 상관 예측 모델은 머신 러닝(Machine Learning)에 의해 학습되는 앙상블 모델(Ensemble Model)이고,
    상기 상관 관계 검증부는,
    상기 제1 열역학 데이터 및 상기 제1 동역학 데이터를 상기 상관 예측 모델의 입력 데이터로 하고, 상기 제2 열역학 데이터 및 상기 제2 동역학 데이터를 상기 상관 예측 모델의 출력 클래스로 하여 상기 상관 예측 모델을 학습시키는 것을 특징으로 하는 데이터 분석 장치.
  7. 제6항에 있어서,
    상기 상관 관계 검증부는,
    차기 시점에서 실측되는, 제1 및 제2 테스트 열역학 데이터와 제1 및 제2 테스트 동역학 데이터를 획득하고, 상기 제1 테스트 열역학 데이터 및 상기 제1 테스트 동역학 데이터를 상기 학습된 상관 예측 모델에 입력하며, 그에 따라 출력되는 출력 열역학 데이터 및 출력 동역학 데이터를 각각 상기 제2 테스트 열역학 데이터 및 상기 제2 테스트 동역학 데이터와 비교하는 방식으로 상기 상관 관계 분석부의 분석 결과를 검증하는 것을 특징으로 하는 데이터 분석 장치.
  8. 제1항에 있어서,
    상기 차량은 철도 차량인 것을 특징으로 하는 데이터 분석 장치.
  9. 신경망(Neural Network)을 통해 입력 데이터의 클래스를 식별하도록 구성된 신경망 모델을 학습시키는 학습부로서, 제1항에 따른 데이터 분석 장치에 의해 결정된 영향 인자를 상기 신경망 모델을 학습시키기 위한 학습 데이터로서 이용하는, 학습부; 및
    상기 학습부를 통해 상기 신경망 모델이 학습된 이후, 상기 차량이 이동하는 과정에서 수집되는, 상기 영향 인자에 해당하는 실측 열역학 데이터 및 실측 동역학 데이터를 상기 학습된 신경망 모델에 적용하여 상기 차륜 부재의 이상을 예측하는 예측부;
    를 포함하는 것을 특징으로 하는 이상 예측 장치.
  10. 정의된 트랙을 따라 이동하는 차량의 차륜 부재의 이상을 야기하는 영향 인자를 결정하기 위한 데이터 분석 방법으로서,
    데이터 수집부가, 상기 차량이 이동하는 과정에서, 상기 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)를 수집하는 단계;
    EDA 분석부가, 상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA(Exploratory Data Analysis) 알고리즘을 적용하여 상기 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출하는 단계;
    상관 관계 분석부가, 상기 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 상기 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 상기 열역학 데이터셋 및 상기 동역학 데이터셋의 유효성을 검증하는 단계; 및
    상관 관계 검증부가, 상기 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 상기 학습된 상관 예측 모델을 이용하여 상기 상관 관계 분석부의 분석 결과를 검증하는 단계;
    를 포함하고,
    상기 상관 관계 검증부에 의해 검증된 열역학 데이터셋 및 동역학 데이터셋이 상기 영향 인자로 결정되는 것을 특징으로 하는 데이터 분석 방법.
  11. 제10항에 따른 데이터 분석 방법을 통해 결정된 영향 인자를 이용하여 차륜 부재의 이상을 예측하는 방법으로서,
    학습부가, 신경망(Neural Network)을 통해 입력 데이터의 클래스를 식별하도록 구성된 신경망 모델을 학습시키는 단계로서, 제9항에 따른 데이터 분석 방법에 의해 결정된 영향 인자를 상기 신경망 모델을 학습시키기 위한 학습 데이터로서 이용하는, 단계; 및
    예측부가, 상기 학습부를 통해 상기 신경망 모델이 학습된 이후, 상기 차량이 이동하는 과정에서 수집되는, 상기 영향 인자에 해당하는 실측 열역학 데이터 및 실측 동역학 데이터를 상기 학습된 신경망 모델에 적용하여 상기 차륜 부재의 이상을 예측하는 단계;
    를 포함하는 것을 특징으로 하는 이상 예측 방법.
  12. 하드웨어와 결합되어, 정의된 트랙을 따라 이동하는 차량의 차륜 부재의 이상을 야기하는 영향 인자를 결정하기 단계들을 실행시키기 위해 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램으로서, 상기 단계들은,
    상기 차량이 이동하는 과정에서, 상기 차륜 부재의 열역학적 상태 및 동역학적 상태를 각각 지표하는 열역학 로우 데이터(Thermodynamics Raw Data) 및 동역학 로우 데이터(Dynamics Raw Data)를 수집하는 단계;
    상기 수집된 열역학 로우 데이터 및 동역학 로우 데이터로부터, 미리 정의된 EDA(Exploratory Data Analysis) 알고리즘을 적용하여 상기 영향 인자의 후보 데이터로 기능하는 열역학 데이터셋 및 동역학 데이터셋을 도출하는 단계;
    상기 도출된 열역학 데이터셋에 포함되는 데이터 간의 상관 관계와, 상기 도출된 동역학 데이터셋에 포함되는 데이터 간의 상관 관계를 분석하여 상기 열역학 데이터셋 및 상기 동역학 데이터셋의 유효성을 검증하는 단계; 및
    상기 유효성이 검증된 열역학 데이터셋 및 동역학 데이터셋을 이용하여 상관 예측 모델을 학습시키고, 상기 학습된 상관 예측 모델을 이용하여 상기 상관 관계의 분석 결과를 검증함으로써 상기 영향 인자를 결정하는 단계;
    를 포함하는, 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램.
KR1020200186453A 2020-12-29 2020-12-29 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램 KR102480394B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200186453A KR102480394B1 (ko) 2020-12-29 2020-12-29 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200186453A KR102480394B1 (ko) 2020-12-29 2020-12-29 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램

Publications (2)

Publication Number Publication Date
KR20220094827A true KR20220094827A (ko) 2022-07-06
KR102480394B1 KR102480394B1 (ko) 2022-12-22

Family

ID=82400448

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200186453A KR102480394B1 (ko) 2020-12-29 2020-12-29 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR102480394B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102651797B1 (ko) * 2023-09-18 2024-03-28 (주) 웨다 Ai 비전문가를 위한 소프트웨어 정의 제조 기반의 머신러닝 플랫폼 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006300613A (ja) * 2005-04-18 2006-11-02 Yokohama Rubber Co Ltd:The タイヤ試験装置およびタイヤ試験方法
KR101252123B1 (ko) * 2011-01-14 2013-04-12 한국표준과학연구원 열화상을 이용한 복합재료 휠의 평가 장치 및 방법
KR20180065628A (ko) * 2016-12-08 2018-06-18 재단법인대구경북과학기술원 철도차량이상판별장치 및 철도차량 이상 판별 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006300613A (ja) * 2005-04-18 2006-11-02 Yokohama Rubber Co Ltd:The タイヤ試験装置およびタイヤ試験方法
KR101252123B1 (ko) * 2011-01-14 2013-04-12 한국표준과학연구원 열화상을 이용한 복합재료 휠의 평가 장치 및 방법
KR20180065628A (ko) * 2016-12-08 2018-06-18 재단법인대구경북과학기술원 철도차량이상판별장치 및 철도차량 이상 판별 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102651797B1 (ko) * 2023-09-18 2024-03-28 (주) 웨다 Ai 비전문가를 위한 소프트웨어 정의 제조 기반의 머신러닝 플랫폼 시스템

Also Published As

Publication number Publication date
KR102480394B1 (ko) 2022-12-22

Similar Documents

Publication Publication Date Title
CN110764493B (zh) 一种适用于高速铁路的phm应用系统、方法及存储介质
Gonzalez et al. BWIM aided damage detection in bridges using machine learning
CN111351664B (zh) 一种基于lstm模型的轴承温度预测和报警诊断方法
Mosleh et al. Early wheel flat detection: An automatic data-driven wavelet-based approach for railways
CN112326280B (zh) 列车转向架的故障检测方法、装置和计算机可读介质
JP6796545B2 (ja) 鉄道車両機器診断装置および鉄道車両機器診断方法
Mosleh et al. Automatic clustering-based approach for train wheels condition monitoring
Braga et al. Multivariate statistical aggregation and dimensionality reduction techniques to improve monitoring and maintenance in railways: The wheelset component
KR20220094827A (ko) 데이터 분석 장치 및 방법, 이상 예측 장치 및 방법, 컴퓨터 프로그램
JP2018155517A (ja) 車両の監視装置、監視方法、プログラム
Krishna et al. Rail RCF damage quantification and comparison for different damage models
KR20180027114A (ko) 서포트 벡터 머신을 이용한 회전체 수명 진단방법
Lourenço et al. Adaptive time series representation for out-of-round railway wheels fault diagnosis in wayside monitoring
Wan et al. Anomaly detection of train wheels utilizing short-time Fourier transform and unsupervised learning algorithms
Men et al. Health assessment of high-speed train wheels based on group-profile data
Huang et al. Quantification of dynamic track stiffness using machine learning
Xu et al. Parameters studies for rail wear in high-speed railway turnouts by unreplicated saturated factorial design
KR20130066858A (ko) 타이어 플랫스팟 성능 예측 방법
CN110243598B (zh) 列车轴承温度的处理方法、装置及存储介质
KR20240052154A (ko) 차륜 부재의 상태 인식을 위한 장치 및 방법
CN114881076B (zh) 基于支持向量机的钢轨波磨识别方法、装置、设备及介质
CN116579125A (zh) 一种轴承剩余寿命预测方法、装置、设备及可读存储介质
Xu et al. Condition monitoring of wheel wear for high-speed trains: A data-driven approach
CN115600086A (zh) 一种基于卷积回归的钢轨波磨粗糙度车载式定量检测方法
Lourenço et al. Online adaptive learning for out-of-round railway wheels detection

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant