KR102660993B1 - 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템 - Google Patents

제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템 Download PDF

Info

Publication number
KR102660993B1
KR102660993B1 KR1020230110908A KR20230110908A KR102660993B1 KR 102660993 B1 KR102660993 B1 KR 102660993B1 KR 1020230110908 A KR1020230110908 A KR 1020230110908A KR 20230110908 A KR20230110908 A KR 20230110908A KR 102660993 B1 KR102660993 B1 KR 102660993B1
Authority
KR
South Korea
Prior art keywords
data
time series
series data
augmented
artificial intelligence
Prior art date
Application number
KR1020230110908A
Other languages
English (en)
Inventor
기대욱
이혁수
김재걸
Original Assignee
주식회사 티라유텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 티라유텍 filed Critical 주식회사 티라유텍
Priority to KR1020230110908A priority Critical patent/KR102660993B1/ko
Application granted granted Critical
Publication of KR102660993B1 publication Critical patent/KR102660993B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에 관한 것으로서, 보다 구체적으로는 제조 실행 시스템(Manufacturing Execution System, MES)에서 각 단계가 수행되는 데이터 증강 방법으로서, (1) 상기 제조 실행 시스템에서 수집되는 시계열 데이터를 MES DB에 저장하는 단계; (2) 상기 MES DB에 저장된 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 단계; (3) 상기 증강 시계열 데이터가 인공지능 학습에 적합한지를 대응 표본 T-검정(Paired T-test)으로 검증하는 단계; 및 (4) 상기 단계 (3)에서 인공지능 학습에 적합한 것으로 검증된 증강 시계열 데이터를 상기 MES DB에 저장하는 단계를 포함하며, 상기 단계 (2)에서는, 시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제1 증강 모듈; 및 시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 주파수 영역으로 변환해 고주파를 제거한 다음, 고주파가 제거된 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제2 증강 모듈 중 적어도 하나를 통해 상기 증강 시계열 데이터를 생성하는 것을 그 구성상의 특징으로 한다.
본 발명에서 제안하고 있는 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템에 따르면, 시계열 데이터에 적합한 데이터 증강 기법을 적용해 학습 데이터의 다양성을 증대하고, 증강된 시계열 데이터는 성능 검증 후 데이터베이스에 저장하여 인공지능 학습에 사용함으로써, 시계열 데이터의 분석 및 예측을 하는 인공지능 모델의 성능을 개선할 수 있으며, 적은 양의 데이터로 학습할 때 발생할 수 있는 과적합을 방지할 수 있다.
또한, 본 발명에서 제안하고 있는 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템에 따르면, 산업 자동화 및 제조 분야에서 수집되는 시계열 데이터에 적합한 데이터 증강 기법에 의해 증강된 데이터를 이용해 인공지능 알고리즘을 학습함으로써, 생산 공정의 최적화, 품질관리, 장비 예측 정비 등의 분야에서 효과적인 결정을 내릴 수 있다.

Description

제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템{DATA AUGMENTATION METHOD AND SYSTEM FOR AI LEARNING IN MANUFACTURING EXECUTION SYSTEM}
본 발명은 데이터 증강 방법 및 시스템에 관한 것으로서, 보다 구체적으로는 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 발명의 일실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
제조 실행 시스템(Manufacturing Execution Systems, MES)은, 생산 현장 상황에 중점을 두어 실시간 현황 파악, 작업의 계획 및 수행, 품질관리 등을 측정할 수 있는 통합관리 시스템이다. 생산 계획과 실행의 차이를 줄이기 위한 시스템으로, 주문받은 제품이 최종 제품이 될 때까지 현장의 정보를 실시간으로 제공하여 관리자가 정확한 데이터로 공장 활동을 지시하고 현장 상황에 대응할 수 있게 한다. 이러한 제조 실행 시스템은, 다품종 소량 생산, 주문생산 등 잦은 공정 변경에 대한 대응을 할 수 있게 한다.
한편, 설비에서 수집되는 데이터를 인공지능에 적용하기 위해서는 많은 수의 설비 데이터가 필요하다. 그러나 현실적으로는 설비 데이터가 부족한 경우가 많아 이를 보완하기 위한 방법이 필요하다. 예를 들어, 시험 목적으로 설비를 가동하는 상황이나, 가동한 지 시간이 많이 지나지 않은 가동 초기 설비의 경우 인공지능을 적용하기에는 데이터가 부족하다. 또한, 다품종 소량 생산이나 주문생산을 하는 경우에는, 생산 시 데이터를 수집하더라도 데이터양이 충분치 못하여 인공지능 적용을 못 하고, 충분한 데이터를 수집했을 때는 다른 생산품으로 교체가 되어 기존에 확보한 데이터를 사용하지 못하는 상황이 발생하기도 한다. 따라서 전술한 바와 같이 생산 현장에서 인공지능 적용을 위한 데이터 부족 시 이를 해결하기 위한 기술의 개발이 필요하다.
시계열 데이터는 일정한 시간 간격으로 수집된 데이터로, 기상 데이터, 생산 설비 및 센서 데이터 등 다양한 분야에서 사용된다. 시계열 데이터의 특성상, 시간적인 패턴이나 계절성을 고려하여 분석하고 예측을 수행하는 것이 중요하다. 이러한 과제를 수행하기 위해 다양한 인공지능 알고리즘이 개발되고 있으며, 이를 효과적으로 활용하기 위해서는 적절한 데이터 전처리 및 증강 기법이 필요하다.
여기서, 데이터 증강 기법은 데이터의 양이 부족한 경우 이를 해결하기 위한 기법으로, 원본 데이터를 변형하여 새로운 데이터를 생성하는 방법이다. 이미지 분야에서는 회전, 반전, 확대/축소, 크롭(crop) 등의 방법이 널리 사용되고 있다. 그러나 시계열 데이터에는 이미지 분야와는 다른 데이터 증강 기법이 적용되어야 한다.
한편, 본 발명과 관련된 선행기술로, 공개특허 제10-2023-0017556호(발명의 명칭: 빅데이터 및 인공지능 기반의 제조 실행 시스템 및 이의 운영방법, 공개일자: 2023년 02월 06일) 등이 개시된 바 있다.
전술한 배경 기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지 기술이라 할 수는 없다.
본 발명은 기존에 제안된 방법들의 상기와 같은 문제점들을 해결하기 위해 제안된 것으로서, 시계열 데이터에 적합한 데이터 증강 기법을 적용해 학습 데이터의 다양성을 증대하고, 증강된 시계열 데이터는 성능 검증 후 데이터베이스에 저장하여 인공지능 학습에 사용함으로써, 시계열 데이터의 분석 및 예측을 하는 인공지능 모델의 성능을 개선할 수 있으며, 적은 양의 데이터로 학습할 때 발생할 수 있는 과적합을 방지할 수 있는, 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템을 제공하는 것을 그 목적으로 한다.
또한, 본 발명은, 산업 자동화 및 제조 분야에서 수집되는 시계열 데이터에 적합한 데이터 증강 기법에 의해 증강된 데이터를 이용해 인공지능 알고리즘을 학습함으로써, 생산 공정의 최적화, 품질관리, 장비 예측 정비 등의 분야에서 효과적인 결정을 내릴 수 있는, 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템을 제공하는 것을 또 다른 목적으로 한다.
다만, 본 발명이 이루고자 하는 기술적 과제는 상기한 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있고, 명시적으로 언급하지 않더라도 과제의 해결수단이나 실시 형태로부터 파악될 수 있는 목적이나 효과도 이에 포함됨은 물론이다.
상기한 목적을 달성하기 위한 본 발명의 특징에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법은,
제조 실행 시스템(Manufacturing Execution System, MES)에서 각 단계가 수행되는 데이터 증강 방법으로서,
(1) 상기 제조 실행 시스템에서 수집되는 시계열 데이터를 MES DB에 저장하는 단계;
(2) 상기 MES DB에 저장된 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 단계;
(3) 상기 증강 시계열 데이터가 인공지능 학습에 적합한지를 대응 표본 T-검정(Paired T-test)으로 검증하는 단계; 및
(4) 상기 단계 (3)에서 인공지능 학습에 적합한 것으로 검증된 증강 시계열 데이터를 상기 MES DB에 저장하는 단계를 포함하며,
상기 단계 (2)에서는,
시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제1 증강 모듈; 및
시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 주파수 영역으로 변환해 고주파를 제거한 다음, 고주파가 제거된 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제2 증강 모듈 중 적어도 하나를 통해 상기 증강 시계열 데이터를 생성하는 것을 그 구성상의 특징으로 한다.
바람직하게는, 상기 단계 (4) 이후에는,
(5) 상기 MES DB에 저장된 시계열 데이터 및 증강 시계열 데이터를 사용해 인공지능 학습을 수행하며, 학습된 인공지능 모델을 통해 생산 공정에서 설비 이상 또는 품질 이상을 모니터링하는 단계를 더 포함할 수 있다.
바람직하게는, 상기 제1 증강 모듈의 증강 시계열 데이터 생성 과정은,
(2-1-1) 상기 MES DB에 저장된 복수의 원본 시계열 데이터를 시간 영역에서 각각 동일한 개수의 구간으로 중복 없이 분할하는 단계; 및
(2-1-2) 상기 단계 (2-1-1)에서 분할된 데이터를 랜덤으로 선택하고 조합하여 상기 증강 시계열 데이터를 생성하는 단계를 포함할 수 있다.
더욱 바람직하게는, 상기 단계 (2-1-2)에서는,
상기 단계 (2-1-1)에서 분할된 데이터를 구간별로 그룹화하고, 각 그룹 내에서 랜덤으로 선택된 분할된 데이터를 시간 순서대로 조합하여 상기 증강 시계열 데이터를 생성할 수 있다.
바람직하게는, 상기 제2 증강 모듈의 증강 시계열 데이터 생성 과정은,
(2-2-1) 상기 MES DB에 저장된 복수의 원본 시계열 데이터를 시간 영역에서 각각 동일한 개수의 구간으로 분할하되, 미리 설정된 비율만큼 오버랩되도록 분할하는 단계;
(2-2-2) 상기 단계 (2-2-1)에서 분할된 데이터 각각을 푸리에 변환하여 주파수 영역으로 변환하는 단계;
(2-2-3) 상기 푸리에 변환된 데이터를 고주파 필터 처리하여 고주파를 제거하는 단계;
(2-2-4) 상기 고주파가 제거된 분할된 데이터를 랜덤으로 선택하고 조합하는 단계; 및
(2-2-5) 상기 조합된 데이터를 역 푸리에 변환한 후 중첩된 부분을 제거하고 시간 순서대로 결합해 상기 증강 시계열 데이터를 생성하는 단계를 포함할 수 있다.
더욱 바람직하게는, 상기 단계 (2-2-4)에서는,
상기 고주파가 제거된 분할된 데이터를 구간별로 그룹화하고, 각 그룹 내에서 랜덤으로 선택된 분할된 데이터를 시간 순서대로 조합할 수 있다.
더더욱 바람직하게는, 상기 단계 (2-2-3)에서는,
해밍 윈도우(Hamming window)를 적용해 고주파를 제거할 수 있다.
상기한 목적을 달성하기 위한 본 발명의 특징에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 시스템은,
제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 시스템으로서,
상기 제조 실행 시스템에서 수집되는 시계열 데이터를 수집하여 MES DB에 저장하는 데이터 수집 모듈;
상기 MES DB에 저장된 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 데이터 증강 모듈;
상기 증강 시계열 데이터가 인공지능 학습에 적합한지를 대응 표본 T-검정(Paired T-test)으로 검증하는 검정 모듈; 및
상기 검정 모듈에서 인공지능 학습에 적합한 것으로 검증된 증강 시계열 데이터를 저장하는 상기 MES DB를 포함하며,
상기 데이터 증강 모듈은,
시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제1 증강 모듈; 및
시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 주파수 영역으로 변환해 고주파를 제거한 다음, 고주파가 제거된 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제2 증강 모듈 중 적어도 하나를 통해 상기 증강 시계열 데이터를 생성하는 것을 그 구성상의 특징으로 한다.
본 발명에서 제안하고 있는 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템에 따르면, 시계열 데이터에 적합한 데이터 증강 기법을 적용해 학습 데이터의 다양성을 증대하고, 증강된 시계열 데이터는 성능 검증 후 데이터베이스에 저장하여 인공지능 학습에 사용함으로써, 시계열 데이터의 분석 및 예측을 하는 인공지능 모델의 성능을 개선할 수 있으며, 적은 양의 데이터로 학습할 때 발생할 수 있는 과적합을 방지할 수 있다.
또한, 본 발명에서 제안하고 있는 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템에 따르면, 산업 자동화 및 제조 분야에서 수집되는 시계열 데이터에 적합한 데이터 증강 기법에 의해 증강된 데이터를 이용해 인공지능 알고리즘을 학습함으로써, 생산 공정의 최적화, 품질관리, 장비 예측 정비 등의 분야에서 효과적인 결정을 내릴 수 있다.
더불어, 본 발명의 다양하면서도 유익한 장점과 효과는 상술한 내용에 한정되지 않으며, 본 발명의 구체적인 실시 형태를 설명하는 과정에서 보다 쉽게 이해될 수 있을 것이다.
도 1은 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 시스템의 구성을 도시한 도면.
도 2는 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법의 흐름을 도시한 도면.
도 3은 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제1 증강 모듈의 증강 시계열 데이터 생성 과정의 세부적인 흐름을 도시한 도면.
도 4는 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제1 증강 모듈의 증강 시계열 데이터 생성 과정을 설명하기 위해 도시한 도면.
도 5는 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제2 증강 모듈의 증강 시계열 데이터 생성 과정의 세부적인 흐름을 도시한 도면.
도 6은 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제2 증강 모듈의 증강 시계열 데이터 생성 과정을 설명하기 위해 도시한 도면.
도 7은 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법의 단계 S221에서 원본 시계열 데이터의 분할을 설명하기 위해 도시한 도면.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하의 실시예는 본 발명의 이해를 돕기 위한 상세한 설명이며, 본 발명의 권리 범위를 제한하는 것이 아니다. 따라서 본 발명과 동일한 기능을 수행하는 동일 범위의 발명 역시 본 발명의 권리 범위에 속할 것이다.
또한, 본 발명의 각 실시예에 포함된 각 구성, 과정, 공정 또는 방법 등은 기술적으로 상호간 모순되지 않는 범위 내에서 공유될 수 있다.
또한, 본 발명에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수 있다. 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다.
특히, 본 발명의 각 실시예에 따른 시스템을 실행시키기 위한 수단으로는 애플리케이션(Application), 또는 웹 서버일 수 있으며, 이 애플리케이션, 또는 웹 서버를 기록한 기록매체를 읽을 수 있는 수단인 단말로는, 일반적인 데스크톱이나 노트북 등의 일반 PC뿐만 아니라, 스마트 폰, 태블릿 PC, 등의 모바일 단말기를 포함할 수 있다.
이하, 첨부된 도면을 참고하여 본 발명의 실시예들을 상세히 설명하도록 한다.
도 1은 본 발명의 일실시예에 따른 제조 실행 시스템(Manufacturing Execution System, MES)에서 인공지능 학습을 위한 데이터 증강 시스템(10)의 구성을 도시한 도면이다. 도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 시스템(10)은, 제조 실행 시스템에서 수집되는 시계열 데이터를 수집하여 MES DB(400)에 저장하는 데이터 수집 모듈(100); MES DB(400)에 저장된 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 데이터 증강 모듈(200); 증강 시계열 데이터가 인공지능 학습에 적합한지를 대응 표본 T-검정(Paired T-test)으로 검증하는 검정 모듈(300); 및 검정 모듈(300)에서 인공지능 학습에 적합한 것으로 검증된 증강 시계열 데이터를 저장하는 MES DB(400)를 포함하여 구성될 수 있다. 여기서, 데이터 증강 모듈(200)은, 시간 영역에서 복수의 시계열 데이터를 분할하고 분할된 데이터를 랜덤 선택 및 조합하여 증강 시계열 데이터를 생성하는 제1 증강 모듈(210); 및 시간 영역에서 복수의 시계열 데이터를 분할하고 분할된 데이터를 주파수 영역으로 변환해 고주파를 제거한 다음, 고주파가 제거된 분할된 데이터를 랜덤 선택 및 조합하여 증강 시계열 데이터를 생성하는 제2 증강 모듈(220) 중 적어도 하나를 통해 증강 시계열 데이터를 생성할 수 있다. 또한, MES DB(400)에 저장된 시계열 데이터 및 증강 시계열 데이터를 사용해 인공지능 학습을 수행하는 머신러닝/딥러닝 학습 모듈(500); 및 머신러닝/딥러닝 학습 모듈(500)에서 학습 완료된 인공지능 모델을 통해 생산 공정에서 설비 이상 또는 품질 이상을 모니터링하는 생산 공정/품질 모니터링 모듈(600)을 더 포함하여 구성될 수 있다.
즉, 도 1에 도시된 바와 같이, 설비에서 생산 공정 파라미터나 품질 계측 데이터 등의 시계열 데이터가 수집되고, 수집된 시계열 데이터는 데이터 수집 모듈(100)을 통해 MES DB(400)에 저장될 수 있다. 공정 설비의 모니터링을 위해 수집된 데이터를 학습하려고 할 때 데이터 부족 등으로 학습 및 모델링이 정상적으로 진행되지 않을 경우 데이터 증강을 위해 데이터 증강 모듈(200)로 수집된 데이터를 전달하고 데이터 증강 모듈(200)은 제1 증강 모듈(210)과 제2 증강 모듈(220) 중 적어도 하나를 통해 증강 시계열 데이터를 생성해 데이터의 개수를 증가시킬 수 있다. 이때, 새로 생성된 증강 시계열 데이터 중에서 기존의 수집된 설비 데이터와 성격이 다른 데이터를 확인하기 위해 검정 모듈(300)에서 대응 표본 T-검정을 수행할 수 있다. 검정 결과에 따라 검증을 통과하지 못한 데이터는 제거하고, 검증된 데이터를 MES DB(400)에 저장할 수 있다. 저장된 데이터는 머신러닝/딥러닝 학습 모듈(500)에서 인공지능 학습 또는 모델링 후, 그 결과를 생산 공정/품질 모니터링 모듈(600)이 모니터링에 사용할 수 있다.
여기서, MES DB(400)는 MES에서 생산관리를 위해 사용하는 데이터베이스(Database, DB)이며, 일반적으로 산업 현장에서 많이 사용하는 일반 RDB (Relational Database), 또는 시계열 데이터나 비정형 데이터에 적합하여 인공지능(머신러닝/딥러링)에 사용하는 Realtime DB일 수 있다.
도 2는 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법의 흐름을 도시한 도면이다. 도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법은, 제조 실행 시스템에서 각 단계가 수행되는 데이터 증강 방법으로서, 시계열 데이터를 MES DB(400)에 저장하는 단계(S100), 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 단계(S200), 증강 시계열 데이터가 인공지능 학습에 적합한지를 검증하는 단계(S300) 및 검증된 증강 시계열 데이터를 MES DB(400)에 저장하는 단계(S400)를 포함하여 구현될 수 있으며, 단계 S400 이후에는, MES DB(400)에 저장된 시계열 데이터 및 증강 시계열 데이터를 사용해 인공지능 학습을 수행하여, 학습된 인공지능 모델을 통해 생산 공정에서 설비 이상 또는 품질 이상을 모니터링하는 단계(S500)를 더 포함하여 구현될 수 있다.
이하에서는, 도 1 및 도 2를 참조하여, 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법의 각 단계에 대해 상세히 설명하도록 한다.
단계 S100에서는, 제조 실행 시스템에서 수집되는 시계열 데이터를 MES DB(400)에 저장할 수 있다. 단계 S100에서 수집되는 시계열 데이터는 산업 자동화 또는 제조 공정에서 사용되는 설비, 센서들에서 수집되는 설비 데이터이다. 이러한 시계열 데이터는 온도, 압력, 속도, 생산 설비의 운용 파라미터, 검계측 장비에서 측정된 품질 데이터 등 다양한 측정치를 포함할 수 있으며, 데이터 수집 모듈(100)은 이러한 원본 설비 데이터를 시간 순서대로 정렬하여 데이터셋을 만들고 생산 공정 관리를 위한 MES DB(400)에 저장할 수 있다.
단계 S200에서는, MES DB(400)에 저장된 시계열 데이터를 증강하여 증강 시계열 데이터를 생성할 수 있다. 즉, 단계 S100에서 저장한 시계열 데이터(설비 데이터)로 머신러닝/딥러닝 등의 인공지능 알고리즘이나 확률 기법 등을 이용하여 학습, 모델링하기 위해서는, 충분한 데이터가 있어야 한다. 그러나 충분한 데이터를 수집하기 어려운 환경에서는, 단계 S200의 데이터 증강을 통해 충분한 데이터를 확보할 수 있다.
보다 구체적으로, 단계 S200에서는, 시간 영역에서 복수의 시계열 데이터를 분할하고 분할된 데이터를 랜덤 선택 및 조합하여 증강 시계열 데이터를 생성하는 제1 증강 모듈(210); 및 시간 영역에서 복수의 시계열 데이터를 분할하고 분할된 데이터를 주파수 영역으로 변환해 고주파를 제거한 다음, 고주파가 제거된 분할된 데이터를 랜덤 선택 및 조합하여 증강 시계열 데이터를 생성하는 제2 증강 모듈(220) 중 적어도 하나를 통해 증강 시계열 데이터를 생성할 수 있다. 제1 증강 모듈(210) 및 제2 증강 모듈(220)의 데이터 증강 과정에 대해서는 추후 도 3 내지 도 6을 참고하여 상세히 설명하도록 한다. 여기서, 단계 S200에서는, 제1 증강 모듈(210)과 제2 증강 모듈(220) 중 관리자에 의해 선택된 적어도 하나를 통해 데이터 증강을 처리할 수 있다. 즉, 제1 증강 모듈(210)과 제2 증강 모듈(220)은 관리자에 의해 둘 중 하나가 선택되어 데이터 증강을 진행하거나, 둘 모두를 통해 데이터 증강을 진행할 수 있다.
단계 S300에서는, 증강 시계열 데이터가 인공지능 학습에 적합한지를 대응 표본 T-검정(Paired T-test)으로 검증할 수 있다. 단계 S200에서 생성된 증강 시계열 데이터는 학습과 모델링에 바로 사용할 수가 없고, 원본 시계열 데이터와 특성이 유사한지를 검정하고, 원본 시계열 데이터와 차이가 크게 나는 증강 시계열 데이터는 삭제하여 데이터의 질을 유지할 수 있다. 단계 S300은 검정 모듈(300)이 처리하며, 대응 표본 T-검정(Paired t-test) 방식을 사용해 검정을 진행할 수 있다.
단계 S400에서는, 단계 S300에서 인공지능 학습에 적합한 것으로 검증된 증강 시계열 데이터를 MES DB(400)에 저장할 수 있다. 즉, 단계 S200에서 충분한 증강 데이터를 생성하고, 단계 S300에서 데이터 검증을 처리해, 원본 시계열 데이터와 그 특성이 유사한 증강 시계열 데이터를 MES DB(400)에 저장해 데이터셋을 구성함으로써, 데이터 부족을 해결할 수 있다.
단계 S500에서는, MES DB(400)에 저장된 시계열 데이터 및 증강 시계열 데이터를 사용해 인공지능 학습을 수행하며, 학습된 인공지능 모델을 통해 생산 공정에서 설비 이상 또는 품질 이상을 모니터링할 수 있다.
도 3은 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제1 증강 모듈(210)의 증강 시계열 데이터 생성 과정(S210)의 세부적인 흐름을 도시한 도면이고, 도 4는 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제1 증강 모듈(210)의 증강 시계열 데이터 생성 과정(S210)을 설명하기 위해 도시한 도면이다. 도 3 및 도 4에 도시된 바와 같이, 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제1 증강 모듈(210)의 증강 시계열 데이터 생성 과정(S210)은, 복수의 원본 시계열 데이터를 각각 동일한 개수의 구간으로 중복 없이 시간 영역에서 분할하는 단계(S211), 분할된 데이터를 랜덤으로 선택하고 조합하여 증강 시계열 데이터를 생성하는 단계(S212)를 포함하여 구현될 수 있다. 즉, 제1 증강 모듈(210)은, 시간 영역에서 시계열 데이터를 재조합하는 기법을 이용해 증강 시계열 데이터를 생성할 수 있다.
단계 S211에서는, MES DB(400)에 저장된 복수의 원본 시계열 데이터를 시간 영역에서 각각 동일한 개수의 구간으로 중복 없이 분할할 수 있다. 예를 들어 데이터를 8개로 분할하는 경우, 원본 시계열 데이터 a를 8개의 구간으로 분할하고, 원본 시계열 데이터 b도 8개의 구간으로 분할할 수 있다. 도 4에는 원본 시계열 데이터 a, b의 2개만 도시되었으나, 2개를 초과하는 다수의 데이터를 사용할 수 있다.
단계 S212에서는, 단계 S211에서 분할된 데이터를 랜덤으로 선택하고 조합하여 증강 시계열 데이터를 생성할 수 있다. 보다 구체적으로, 단계 S212에서는, 단계 S211에서 분할된 데이터를 구간별로 그룹화하고, 각 그룹 내에서 랜덤으로 선택된 분할된 데이터를 시간 순서대로 조합하여 증강 시계열 데이터를 생성할 수 있다.
예를 들어, 원본 시계열 데이터가 a, b, c, d의 4개가 있고, 원본 시계열 데이터를 각각 8개의 구간으로 분할하였다면, 증강 시계열 데이터의 8구간 중 첫 번째 구간을 원본 시계열 데이터의 첫 번째 구간의 분할 데이터(a1, b1, c1, d1)들 중 랜덤으로 선택할 수 있다. 그리고 두 번째 구간은 원본 시계열 데이터의 두 번째 구간의 분할 데이터(a2, b2, c2, d2)들 중 랜덤으로 선택할 수 있다. 같은 방법으로 8번째 구간까지, 각 구간별 원본 시계열 데이터의 분할 데이터 중 랜덤으로 선택하여, 8개의 선택된 분할 데이터들을 조합하면 새로운 증강 시계열 데이터를 생성할 수 있다. 두 번째 증강 시계열 데이터를 생성할 때도 첫 번째 증강 시계열 데이터 생성을 할 때와 같은 방법으로 생성하고, 필요한 개수만큼 이 과정을 반복해 필요한 개수의 증강 시계열 데이터를 생성할 수 있다
이와 같이, 도 3 및 도 4에 도시된 바와 같은 방법으로 생성된 증강 시계열 데이터는, 각 구간을 랜덤으로 선택하여 구성하였으므로 증강의 재료로 사용한 원본 시계열 데이터 a, b, c, d와 데이터의 성격이나 특성이 다를 수 있다. 증강 데이터가 기존의 원본 데이터와 성격이나 특성이 다를 경우 인공지능 학습에 포함해서 사용하면 성능 저하의 요인이 될 수 있다. 따라서 증강 시계열 데이터는 단계 S300의 대응 표본 T-검정을 통해 검증 후 사용할 수 있다.
도 5는 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제2 증강 모듈(220)의 증강 시계열 데이터 생성 과정(S220)의 세부적인 흐름을 도시한 도면이고, 도 6은 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제2 증강 모듈(220)의 증강 시계열 데이터 생성 과정(S220)을 설명하기 위해 도시한 도면이다. 도 5 및 도 6에 도시된 바와 같이, 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법에서, 제2 증강 모듈(220)의 증강 시계열 데이터 생성 과정(S220)은, 복수의 원본 시계열 데이터를 각각 동일한 개수의 구간으로 시간 영역에서 분할하되, 미리 설정된 비율만큼 오버랩되도록 분할하는 단계(S221), 분할된 데이터 각각을 푸리에 변환하여 주파수 영역으로 변환하는 단계(S222), 푸리에 변환된 데이터를 고주파 필터 처리하여 고주파를 제거하는 단계(S223), 고주파가 제거된 분할된 데이터를 랜덤으로 선택하고 조합하는 단계(S224) 및 조합된 데이터를 역 푸리에 변환한 후 중첩된 부분을 제거하고 시간 순서대로 데이터를 결합해 증강 시계열 데이터를 생성하는 단계(S225)를 포함하여 구현될 수 있다. 즉, 제2 증강 모듈(220)은, 푸리에 변환 수행 후 주파수 영역에서 시계열 데이터를 재조합하고 고주파를 제거한 다음, 역 푸리에 변환하여 시간 영역에서 데이터를 결합하는 기법을 이용해 증강 시계열 데이터를 생성할 수 있다.
제2 증강 모듈(220)이 수행하는 증강 시계열 데이터 생성 기법은, 데이터를 시간 영역에서 분할하면 자연적으로 발생하는 고주파를 제거할 수 있는 기법으로, 인공지능 학습이나 데이터의 신호 처리 시에 고주파에 민감한 적용처가 있을 수 있는데, 이같이 적용하는 현장이 데이터의 고주파에 민감할 때는 제1 증강 모듈(210)보다는 제2 증강 모듈(220)을 적용해 주파수 영역으로 변환하고 고주파를 제거 후 재조합하여 증강 시계열 데이터를 만드는 방법이 더 정확하고 유용할 수 있다.
이하에서는, 도 5 및 도 6을 참조하여 제2 증강 모듈(220)의 증강 시계열 데이터 생성 과정(S220)의 각 단계를 상세히 설명하도록 한다.
단계 S221에서는, MES DB(400)에 저장된 복수의 원본 시계열 데이터를 시간 영역에서 각각 동일한 개수의 구간으로 분할하되, 미리 설정된 비율만큼 오버랩되도록 분할할 수 있다. 여기서, 미리 설정된 비율은 20% 이상 70% 이하일 수 있다.
도 7은 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법의 단계 S221에서 원본 시계열 데이터의 분할을 설명하기 위해 도시한 도면이다. 도 7에 도시된 바와 같이, 본 발명의 일실시예에 따른 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법의 단계 S221에서는, 단계 S211에서처럼 재조합을 위한 원본 시계열 데이터를 시간 영역에서 분할을 진행하나, 원본 시계열 데이터에서 일정한 퍼센테이지(Percentage)로 오버랩되도록 구간을 분할할 수 있다. 오버랩하는 퍼센테이지(미리 설정된 비율)는 20~70% 범위일 수 있으며, 바람직하게는 도 7에 도시된 바와 같이 50%일 수 있다. 이때, 미리 설정된 비율은 20~70% 범위 내에서 사용처에 맞게 관리자 등이 선택할 수 있다.
단계 S222에서는, 단계 S221에서 분할된 데이터 각각을 푸리에 변환하여 주파수 영역으로 변환할 수 있다. 즉, 분할된 데이터는 분할된 구간별로 푸리에 변환을 진행하여 주파수 영역으로 변환하는데, 여기서는 구간으로 분할 후 푸리에 변환을 진행하므로 단시간 푸리에 변환(Short Time Fourier Transform, STFT)을 사용할 수 있다.
단계 S223에서는, 푸리에 변환된 데이터를 고주파 필터 처리하여 고주파를 제거할 수 있다. 보다 구체적으로, 단계 S223에서는, 해밍 윈도우(Hamming window)를 적용해 고주파를 제거할 수 있다.
단계 S224에서는, 고주파가 제거된 분할된 데이터를 랜덤으로 선택하고 조합할 수 있다. 보다 구체적으로, 단계 S224에서는, 고주파가 제거된 분할된 데이터를 구간별로 그룹화하고, 각 그룹 내에서 랜덤으로 선택된 분할된 데이터를 시간 순서대로 조합할 수 있다.
고주파가 제거된 주파수 영역의 데이터는 증강 데이터를 생성하기 위하여, 단계 S212와 같은 방법으로 분할된 구간을 선택하여 구성할 수 있다. 예를 들어, 원본 시계열 데이터가 a, b, c, d의 4개가 있고, 원본 시계열 데이터를 각각 8개의 구간으로 분할하였다면, STFT를 적용하고 해밍 윈도우 필터를 처리한 첫 번째 구간의 분할 데이터들(STFT a1, STFT b1, STFT c1, STFT d1) 중에서 랜덤으로 증강 시계열 데이터의 8구간 중 첫 번째 구간을 선택할 수 있다. 그리고 증강 시계열 데이터의 두 번째 구간은 STFT 적용 및 해밍 윈도우 필터 처리한 원본 시계열 데이터의 두 번째 구간의 분할 데이터들(STFT a2, STFT b2, STFT c2, STFT d2) 중 랜덤으로 선택할 수 있다. 같은 방법으로 8번째 구간까지 랜덤 선택된 총 8개의 STFT 적용 및 해밍 윈도우 필터 처리된 분할 데이터들을 조합할 수 있다. 앞의 방법을 반복하여 원하는 증강 시계열 데이터의 개수만큼 조합을 반복할 수 있다.
단계 S225에서는, 조합된 데이터를 역 푸리에 변환한 후 중첩된 부분을 제거하고 시간 순서대로 결합해 증강 시계열 데이터를 생성할 수 있다. 즉, 단계 S224에서 조합된 분할 데이터들은 아직 주파수 영역의 데이터이므로, 각 구간을 시간 영역의 데이터로 변환하기 위해 역 단시간 푸리에 변환(Inverse - Short Time Fourier Transform, I-STFT)을 진행하고, 단계 S221에서 데이터 분할을 수행할 때 오버랩된 만큼의 데이터를 제거 후 시간 순차적으로 결합해서 증강 시계열 데이터를 생성할 수 있다.
이러한 방법으로 제2 증강 모듈(220)에서 생성한 증강 시계열 데이터도 수집된 원본 시계열 데이터와 성격과 특성이 다르게 생성될 수 있고, 이러한 데이터는 학습 후의 모델 정확도를 낮추는 원인이 될 수 있다. 따라서 검정 모듈(300)에서 대응 표본 T 검정 방식을 사용하여 성격과 특성이 다른 증강 시계열 데이터를 제거 후 학습에 사용할 수 있다.
사용자는 제1 증강 모듈(210)과 제2 증강 모듈(220)의 기법을 상황에 맞게 선택해서 사용하거나 아니면 둘 다 사용하여 증강 시계열 데이터를 생성 후 검증 모듈에서 대응 표본 T 검정을 진행하고, 수집된 원본 데이터와 함께 인공지능 학습에 사용하여 생산 설비의 상태나 품질 상태 분석 및 예측의 정확도를 높일 수 있다.
전술한 바와 같이, 본 발명에서 제안하고 있는 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템에 따르면, 시계열 데이터에 적합한 데이터 증강 기법을 적용해 학습 데이터의 다양성을 증대하고, 증강된 시계열 데이터는 성능 검증 후 데이터베이스에 저장하여 인공지능 학습에 사용함으로써, 시계열 데이터의 분석 및 예측을 하는 인공지능 모델의 성능을 개선할 수 있으며, 적은 양의 데이터로 학습할 때 발생할 수 있는 과적합을 방지할 수 있다. 또한, 본 발명에 따르면, 산업 자동화 및 제조 분야에서 수집되는 시계열 데이터에 적합한 데이터 증강 기법에 의해 증강된 데이터를 이용해 인공지능 알고리즘을 학습함으로써, 생산 공정의 최적화, 품질관리, 장비 예측 정비 등의 분야에서 효과적인 결정을 내릴 수 있다.
한편, 본 발명은 다양한 통신 단말기로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터에서 판독 가능한 매체를 포함할 수 있다. 예를 들어, 컴퓨터에서 판독 가능한 매체는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD_ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.
이와 같은 컴퓨터에서 판독 가능한 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 이때, 컴퓨터에서 판독 가능한 매체에 기록되는 프로그램 명령은 본 발명을 구현하기 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예를 들어, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명된 각 구성요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명된 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10: 데이터 증강 시스템
100: 데이터 수집 모듈
200: 데이터 증강 모듈
210: 제1 증강 모듈
220: 제2 증강 모듈
300: 검정 모듈
400: MES DB
500: 머신러닝/딥러닝 학습 모듈
600: 생산 공정/품질 모니터링 모듈
S100: 시계열 데이터를 MES DB에 저장하는 단계
S200: 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 단계
S210: 제1 증강 모듈의 증강 시계열 데이터 생성 과정
S211: 복수의 원본 시계열 데이터를 각각 동일한 개수의 구간으로 중복 없이 시간 영역에서 분할하는 단계
S212: 분할된 데이터를 랜덤으로 선택하고 조합하여 증강 시계열 데이터를 생성하는 단계
S220: 제2 증강 모듈의 증강 시계열 데이터 생성 과정
S221: 복수의 원본 시계열 데이터를 각각 동일한 개수의 구간으로 시간 영역에서 분할하되, 미리 설정된 비율만큼 오버랩되도록 분할하는 단계
S222: 분할된 데이터 각각을 푸리에 변환하여 주파수 영역으로 변환하는 단계
S223: 푸리에 변환된 데이터를 고주파 필터 처리하여 고주파를 제거하는 단계
S224: 고주파가 제거된 분할된 데이터를 랜덤으로 선택하고 조합하는 단계
S225: 조합된 데이터를 역 푸리에 변환한 후 중첩된 부분을 제거하고 시간 순서대로 데이터를 결합해 증강 시계열 데이터를 생성하는 단계
S300: 증강 시계열 데이터가 인공지능 학습에 적합한지를 검증하는 단계
S400: 검증된 증강 시계열 데이터를 MES DB에 저장하는 단계
S500: MES DB에 저장된 시계열 데이터 및 증강 시계열 데이터를 사용해 인공지능 학습을 수행하여, 학습된 인공지능 모델을 통해 생산 공정에서 설비 이상 또는 품질 이상을 모니터링하는 단계

Claims (8)

  1. 제조 실행 시스템(Manufacturing Execution System, MES)에서 각 단계가 수행되는 데이터 증강 방법으로서,
    (1) 상기 제조 실행 시스템에서 수집되는 시계열 데이터를 MES DB(400)에 저장하는 단계;
    (2) 상기 MES DB(400)에 저장된 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 단계;
    (3) 상기 증강 시계열 데이터가 인공지능 학습에 적합한지를 대응 표본 T-검정(Paired T-test)으로 검증하는 단계; 및
    (4) 상기 단계 (3)에서 인공지능 학습에 적합한 것으로 검증된 증강 시계열 데이터를 상기 MES DB(400)에 저장하는 단계를 포함하며,
    상기 단계 (2)에서는,
    시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제1 증강 모듈(210); 및
    시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 주파수 영역으로 변환해 고주파를 제거한 다음, 고주파가 제거된 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제2 증강 모듈(220) 중 적어도 하나를 통해 상기 증강 시계열 데이터를 생성하며,
    상기 제2 증강 모듈(220)의 증강 시계열 데이터 생성 과정은,
    (2-2-1) 상기 MES DB(400)에 저장된 복수의 원본 시계열 데이터를 시간 영역에서 각각 동일한 개수의 구간으로 분할하되, 미리 설정된 비율만큼 오버랩되도록 분할하는 단계;
    (2-2-2) 상기 단계 (2-2-1)에서 분할된 데이터 각각을 푸리에 변환하여 주파수 영역으로 변환하는 단계;
    (2-2-3) 상기 푸리에 변환된 데이터를 고주파 필터 처리하여 고주파를 제거하는 단계;
    (2-2-4) 상기 고주파가 제거된 분할된 데이터를 랜덤으로 선택하고 조합하는 단계; 및
    (2-2-5) 상기 조합된 데이터를 역 푸리에 변환한 후 중첩된 부분을 제거하고 시간 순서대로 결합해 상기 증강 시계열 데이터를 생성하는 단계를 포함하며,
    상기 단계 (2-2-3)에서는,
    해밍 윈도우(Hamming window)를 적용해 고주파를 제거하며,
    상기 단계 (2-2-4)에서는,
    상기 고주파가 제거된 분할된 데이터를 구간별로 그룹화하고, 각 그룹 내에서 랜덤으로 선택된 분할된 데이터를 시간 순서대로 조합하는 것을 특징으로 하는, 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법.
  2. 제1항에 있어서, 상기 단계 (4) 이후에는,
    (5) 상기 MES DB(400)에 저장된 시계열 데이터 및 증강 시계열 데이터를 사용해 인공지능 학습을 수행하며, 학습된 인공지능 모델을 통해 생산 공정에서 설비 이상 또는 품질 이상을 모니터링하는 단계를 더 포함하는 것을 특징으로 하는, 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법.
  3. 제1항에 있어서, 상기 제1 증강 모듈(210)의 증강 시계열 데이터 생성 과정은,
    (2-1-1) 상기 MES DB(400)에 저장된 복수의 원본 시계열 데이터를 시간 영역에서 각각 동일한 개수의 구간으로 중복 없이 분할하는 단계; 및
    (2-1-2) 상기 단계 (2-1-1)에서 분할된 데이터를 랜덤으로 선택하고 조합하여 상기 증강 시계열 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는, 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법.
  4. 제3항에 있어서, 상기 단계 (2-1-2)에서는,
    상기 단계 (2-1-1)에서 분할된 데이터를 구간별로 그룹화하고, 각 그룹 내에서 랜덤으로 선택된 분할된 데이터를 시간 순서대로 조합하여 상기 증강 시계열 데이터를 생성하는 것을 특징으로 하는, 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 시스템(10)으로서,
    상기 제조 실행 시스템에서 수집되는 시계열 데이터를 수집하여 MES DB(400)에 저장하는 데이터 수집 모듈(100);
    상기 MES DB(400)에 저장된 시계열 데이터를 증강하여 증강 시계열 데이터를 생성하는 데이터 증강 모듈(200);
    상기 증강 시계열 데이터가 인공지능 학습에 적합한지를 대응 표본 T-검정(Paired T-test)으로 검증하는 검정 모듈(300); 및
    상기 검정 모듈(300)에서 인공지능 학습에 적합한 것으로 검증된 증강 시계열 데이터를 저장하는 상기 MES DB(400)를 포함하며,
    상기 데이터 증강 모듈(200)은,
    시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제1 증강 모듈(210); 및
    시간 영역에서 복수의 상기 시계열 데이터를 분할하고 분할된 데이터를 주파수 영역으로 변환해 고주파를 제거한 다음, 고주파가 제거된 분할된 데이터를 랜덤 선택 및 조합하여 상기 증강 시계열 데이터를 생성하는 제2 증강 모듈(220) 중 적어도 하나를 통해 상기 증강 시계열 데이터를 생성하며,
    상기 제2 증강 모듈(220)의 증강 시계열 데이터 생성 과정은,
    (2-2-1) 상기 MES DB(400)에 저장된 복수의 원본 시계열 데이터를 시간 영역에서 각각 동일한 개수의 구간으로 분할하되, 미리 설정된 비율만큼 오버랩되도록 분할하는 단계;
    (2-2-2) 상기 단계 (2-2-1)에서 분할된 데이터 각각을 푸리에 변환하여 주파수 영역으로 변환하는 단계;
    (2-2-3) 상기 푸리에 변환된 데이터를 고주파 필터 처리하여 고주파를 제거하는 단계;
    (2-2-4) 상기 고주파가 제거된 분할된 데이터를 랜덤으로 선택하고 조합하는 단계; 및
    (2-2-5) 상기 조합된 데이터를 역 푸리에 변환한 후 중첩된 부분을 제거하고 시간 순서대로 결합해 상기 증강 시계열 데이터를 생성하는 단계를 포함하며,
    상기 단계 (2-2-3)에서는,
    해밍 윈도우(Hamming window)를 적용해 고주파를 제거하며,
    상기 단계 (2-2-4)에서는,
    상기 고주파가 제거된 분할된 데이터를 구간별로 그룹화하고, 각 그룹 내에서 랜덤으로 선택된 분할된 데이터를 시간 순서대로 조합하는 것을 특징으로 하는, 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 시스템(10).
KR1020230110908A 2023-08-23 2023-08-23 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템 KR102660993B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230110908A KR102660993B1 (ko) 2023-08-23 2023-08-23 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230110908A KR102660993B1 (ko) 2023-08-23 2023-08-23 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR102660993B1 true KR102660993B1 (ko) 2024-04-26

Family

ID=90882980

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230110908A KR102660993B1 (ko) 2023-08-23 2023-08-23 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102660993B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102393095B1 (ko) * 2021-10-06 2022-05-02 가온플랫폼 주식회사 진동, 음향, 이미지 데이터를 활용한 인공지능 기반의 회전설비 고장예지진단시스템
KR20220085589A (ko) * 2020-12-15 2022-06-22 현대모비스 주식회사 딥러닝 기반 제품 불량 검출방법 및 시스템
KR20230109935A (ko) * 2022-01-14 2023-07-21 광운대학교 산학협력단 전염병 분석을 위한 데이터의 증강을 지원하는 서비스 제공 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220085589A (ko) * 2020-12-15 2022-06-22 현대모비스 주식회사 딥러닝 기반 제품 불량 검출방법 및 시스템
KR102393095B1 (ko) * 2021-10-06 2022-05-02 가온플랫폼 주식회사 진동, 음향, 이미지 데이터를 활용한 인공지능 기반의 회전설비 고장예지진단시스템
KR20230109935A (ko) * 2022-01-14 2023-07-21 광운대학교 산학협력단 전염병 분석을 위한 데이터의 증강을 지원하는 서비스 제공 장치 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
F. Lotte. "Signal Processing Approaches to Minimize or Suppress Calibration Time in Oscillatory Activity-Based Brain-Computer Interfaces". Proceedings of the IEEE* *
주재현 등. "제조 공정의 위험 감지를 위한 채널화 시계열 데이터 증강 및 예측 방법론". 한국지능시스템학회 논문지* *

Similar Documents

Publication Publication Date Title
Li et al. Monitoring and identifying wind turbine generator bearing faults using deep belief network and EWMA control charts
JP2021064370A (ja) デジタル・ツイン・シミュレーション・データを利用した時系列データに基づく、大規模な産業用監視システム向けの半教師あり深層異常検出のための方法およびシステム
Martínez-Martínez et al. An Artificial Neural Network based expert system fitted with Genetic Algorithms for detecting the status of several rotary components in agro-industrial machines using a single vibration signal
Baraldi et al. Reconstruction of missing data in multidimensional time series by fuzzy similarity
Gai et al. A Parameter‐Optimized DBN Using GOA and Its Application in Fault Diagnosis of Gearbox
CN116451150A (zh) 一种基于半监督小样本的设备故障诊断方法
CN110263944A (zh) 一种多变量故障预测方法和装置
de Calle et al. Dynamic condition monitoring method based on dimensionality reduction techniques for data-limited industrial environments
Patel et al. Doctor for machines: a failure pattern analysis solution for industry 4.0
Chamangard et al. Transfer learning for CNN-based damage detection in civil structures with insufficient data
CN115438897A (zh) 一种基于blstm神经网络的工业过程产品质量预测方法
WO2022218632A1 (en) System and method of monitoring an industrial environment
Du et al. RUL prediction based on GAM–CNN for rotating machinery
KR102660993B1 (ko) 제조 실행 시스템에서 인공지능 학습을 위한 데이터 증강 방법 및 시스템
Segovia Ramirez et al. Supervisory control and data acquisition analysis for wind turbine maintenance management
KR102622569B1 (ko) 지능형 제조 설비 제어 장치 및 그의 제어 방법
Lakhno et al. Models for forming knowledge databases for decision support systems for recognizing cyberattacks
KR20210126378A (ko) 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템
Aldosari et al. Image-Based Partial Discharge Identification in High Voltage Cables Using Hybrid Deep Network
Hinz et al. Detection of distinctions in car fleets based on measured and simulated data
CN113139332A (zh) 一种自动化模型构建方法、装置及设备
Jia et al. IIoT-based Predictive Maintenance for Oil and Gas Industry
Golmoradi et al. Compressor fault diagnosis based on SVM and GA
Ramirez et al. Motif analysis in internet of the things platform for wind turbine maintenance management
AU2021280953B2 (en) An industrial process model generation system

Legal Events

Date Code Title Description
GRNT Written decision to grant