KR20220028724A - Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data - Google Patents

Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data Download PDF

Info

Publication number
KR20220028724A
KR20220028724A KR1020200110112A KR20200110112A KR20220028724A KR 20220028724 A KR20220028724 A KR 20220028724A KR 1020200110112 A KR1020200110112 A KR 1020200110112A KR 20200110112 A KR20200110112 A KR 20200110112A KR 20220028724 A KR20220028724 A KR 20220028724A
Authority
KR
South Korea
Prior art keywords
virtual measurement
value
time series
calculating
series data
Prior art date
Application number
KR1020200110112A
Other languages
Korean (ko)
Other versions
KR102486460B1 (en
Inventor
김도훈
이원석
정수근
한금찬
이승현
Original Assignee
(주)브릭
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)브릭 filed Critical (주)브릭
Priority to KR1020200110112A priority Critical patent/KR102486460B1/en
Publication of KR20220028724A publication Critical patent/KR20220028724A/en
Application granted granted Critical
Publication of KR102486460B1 publication Critical patent/KR102486460B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L22/00Testing or measuring during manufacture or treatment; Reliability measurements, i.e. testing of parts without further processing to modify the parts as such; Structural arrangements therefor
    • H01L22/20Sequence of activities consisting of a plurality of measurements, corrections, marking or sorting steps
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L21/00Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
    • H01L21/67Apparatus specially adapted for handling semiconductor or electric solid state devices during manufacture or treatment thereof; Apparatus specially adapted for handling wafers during manufacture or treatment of semiconductor or electric solid state devices or components ; Apparatus not specifically provided for elsewhere
    • H01L21/67005Apparatus not specifically provided for elsewhere
    • H01L21/67242Apparatus for monitoring, sorting or marking
    • H01L21/67276Production flow monitoring, e.g. for increasing throughput

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Manufacturing & Machinery (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Power Engineering (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Disclosed are a virtual measurement method for calculating a prediction value and feature importance based on feature values of time series data, and an apparatus therefor. A virtual measurement method according to an embodiment of the present invention may include: a time series data obtaining step of obtaining time series data including a time series type variable; a model learning processing step of extracting a feature value for the time series data, calculating a prediction value for learning based on the feature value, and generating a learning model; a virtual measurement processing step of calculating a virtual measurement result by applying new time series data to the learning model; and a virtual measurement result outputting step of providing the virtual measurement result to an external device.

Description

시계열 데이터의 특징값을 기반으로 예측값 및 특징 중요도 산출을 수행하는 가상 계측 방법 및 그를 위한 장치{Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data}A virtual measurement method for calculating predicted values and feature importance based on feature values of time series data, and an apparatus therefor

본 발명은 시계열 데이터의 특징값을 기반으로 예측값 및 특징 중요도 산출을 수행하는 가상 계측 방법 및 그를 위한 장치에 관한 것이다. The present invention relates to a virtual measurement method for calculating predicted values and feature importance based on feature values of time series data, and an apparatus therefor.

이 부분에 기술된 내용은 단순히 본 발명의 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.The content described in this section merely provides background information on the embodiments of the present invention and does not constitute the prior art.

반도체 또는 평판디스플레이(FPD: Flat panel display)등의 제품 생산은 수 많은 제조 공정으로 이루어져 있으며 생산 시간 단축을 위해 대부분 샘플링 계측을 진행하고 있다. 이로 인해 계측 데이터가 많이 부족하여 결함원인 분석 및 제품 품질 향상에 어려움이 있다.The production of products such as semiconductors or flat panel displays (FPDs) consists of numerous manufacturing processes, and sampling and measurement are mostly carried out to shorten production time. Due to this, there is a lack of measurement data, which makes it difficult to analyze the cause of defects and improve product quality.

이러한 계측 기반 공정 관리의 문제점을 해결하기 위하여 최근 가상 계측(VM: Virtual metrology)에 대한 관심이 집중되고 있다. 가상 계측은 제조 공정에서 발생하는 장비의 센서 데이터를 활용하여 실제로 계측 공정을 수행하지 않고서도 모든 웨이퍼에 대한 계측 값을 예측하는 것이다. 가상 계측을 통해 예측된 계측값을 공정제어 시스템과 연동하는 경우 제품의 품질 향상과 제조비용을 절감할 수 있다.In order to solve the problem of such metrology-based process management, interest in virtual metrology (VM) has recently been focused. Virtual metrology utilizes sensor data of equipment generated in the manufacturing process to predict measurement values for all wafers without actually performing the measurement process. If the measured value predicted through virtual measurement is linked with the process control system, product quality improvement and manufacturing cost can be reduced.

하지만, 가상 계측 처리의 예측 알고리즘을 학습하기 위해서는 사용자가 적절한 특징을 원 데이터(Raw Data)에서 가공하여 입력해야 한다. 일반적으로 신경망(Neural Network)는 원 데이터에서 스스로 특징을 추출하여 학습할 수 있는 장점이 있지만, 학계의 많은 노력해도 불구하고 높은 비선형성으로 인해 예측 결과에 대한 정확한 해석이 불가능하여 입력 데이터의 어떠한 특징을 얼만큼 반영하여 예측 결과로 도출했는지 알 수 없다. 이로 인해, 신경망 기술의 발전에도 불구하고 결과에 대한 원인 분석이 중요한 공정 및 제조 현장에서 사용을 기피하게 되었다. 이에, 전술한 문제점을 해결하기 위하여 원 데이터의 특징을 스스로 추출하며 해석이 가능한 신경망 기반의 가상 계측 기술이 필요하다. However, in order to learn the prediction algorithm of virtual measurement processing, the user must process and input appropriate features from raw data. In general, neural networks have the advantage of extracting features from raw data and learning by themselves, but despite many efforts in academia, accurate interpretation of prediction results is impossible due to high nonlinearity, It is not known how much was reflected in the prediction results. Due to this, despite advances in neural network technology, it has been avoided to use in processes and manufacturing sites where cause analysis of results is important. Accordingly, in order to solve the above-mentioned problems, a neural network-based virtual measurement technology capable of extracting and interpreting the features of raw data by itself is required.

본 발명은 시계열 데이터에서 특징값을 추출하여 예측하고, 각 특징값에 대한 중요도를 계산하는 시계열 데이터의 특징값을 기반으로 예측값 및 특징 중요도 산출을 수행하는 가상 계측 방법 및 그를 위한 장치를 제공하는 데 주된 목적이 있다.The present invention provides a virtual measurement method for extracting and predicting a feature value from time series data, and calculating a predicted value and feature importance based on a feature value of the time series data for calculating the importance for each feature value, and an apparatus therefor. It has a main purpose.

본 발명의 일 측면에 의하면, 상기 목적을 달성하기 위한 가상 계측 방법은, 시계열 형태의 변수를 포함하는 시계열 데이터를 획득하는 시계열 데이터 획득 단계; 상기 시계열 데이터에 대한 특징값을 추출하고, 상기 특징값을 기반으로 학습용 예측값을 산출하여 학습 모델을 생성하는 모델 학습 처리 단계; 신규 시계열 데이터를 상기 학습 모델에 적용하여 가상 계측 결과를 산출하는 가상 계측 처리 단계; 및 상기 가상 계측 결과를 외부 장치로 제공하는 가상 계측 결과 출력 단계를 포함할 수 있다. According to an aspect of the present invention, a virtual measurement method for achieving the above object includes: a time series data obtaining step of obtaining time series data including a variable in a time series form; a model learning processing step of extracting a feature value for the time series data, calculating a prediction value for learning based on the feature value, and generating a learning model; a virtual measurement processing step of calculating a virtual measurement result by applying new time series data to the learning model; and outputting a virtual measurement result of providing the virtual measurement result to an external device.

또한, 본 발명의 다른 측면에 의하면, 상기 목적을 달성하기 위한 가상 계측 장치는, 적어도 하나 이상의 프로세서; 및 상기 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 메모리를 포함하며, 상기 프로그램들은 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서들에서, 시계열 형태의 변수를 포함하는 시계열 데이터를 획득하는 시계열 데이터 획득 단계; 상기 시계열 데이터에 대한 특징값을 추출하고, 상기 특징값을 기반으로 학습용 예측값을 산출하여 학습 모델을 생성하는 모델 학습 처리 단계; 신규 시계열 데이터를 상기 학습 모델에 적용하여 가상 계측 결과를 산출하는 가상 계측 처리 단계; 및 상기 가상 계측 결과를 외부 장치로 제공하는 가상 계측 결과 출력 단계를 포함하는 동작들을 수행하게 할 수 있다. In addition, according to another aspect of the present invention, a virtual measurement device for achieving the above object, at least one or more processors; and a memory for storing one or more programs executed by the processor, wherein when the programs are executed by one or more processors, the one or more processors obtains time series data including a time series variable. acquisition stage; a model learning processing step of extracting a feature value for the time series data, calculating a prediction value for learning based on the feature value, and generating a learning model; a virtual measurement processing step of calculating a virtual measurement result by applying new time series data to the learning model; and outputting a virtual measurement result of providing the virtual measurement result to an external device.

이상에서 설명한 바와 같이, 본 발명은 학습 모델을 통해 설명변수의 시계열 데이터에서 반응변수에 대한 설명력이 높은 특징값을 자동으로 추출하는 효과가 있다. As described above, the present invention has an effect of automatically extracting feature values with high explanatory power for response variables from time series data of explanatory variables through a learning model.

또한, 본 발명은 자동으로 추출된 특징값에 대한 중요도(기여도)를 계산하여 공정 및 실계측에 대한 예측과 원인 분석이 가능한 방법론을 제공하는 효과가 있다. In addition, the present invention has the effect of providing a methodology capable of predicting and analyzing the cause of the process and actual measurement by calculating the importance (contribution) of the automatically extracted feature value.

또한, 본 발명은 시계열 데이터에서 자동으로 특징값을 추출하고, 이에 따른 중요도를 산출하여 가상 계측 결과를 제공함으로써, 공정 제어에 따른 제품의 품질 향상과 제조비용을 절감하는 효과가 있다. In addition, the present invention has the effect of improving product quality and reducing manufacturing costs according to process control by automatically extracting feature values from time-series data, calculating their importance, and providing virtual measurement results.

도 1은 본 발명의 실시예에 따른 가상 계측 기반의 공정 시스템을 개략적으로 나타낸 블록 구성도이다.
도 2는 본 발명의 실시예에 따른 가상 계측 장치를 개략적으로 나타낸 블록 구성도이다.
도 3 및 도 4는 본 발명의 실시예에 따른 가상 계측 장치의 프로세서 동작을 설명하기 위한 블록 구성도이다.
도 5는 본 발명의 실시예에 따른 모델 학습 처리부를 개략적으로 나타낸 블록 구성도이다.
도 6은 본 발명의 실시예에 따른 모델 학습 처리를 위한 가상 계측 방법을 설명하기 위한 순서도이다.
도 7은 본 발명의 실시예에 따른 가상 계측 처리부를 개략적으로 나타낸 블록 구성도이다.
도 8은 본 발명의 실시예에 따른 학습 모델을 이용한 가상 계측 방법을 설명하기 위한 순서도이다.
도 9a 및 도 9b는 본 발명의 실시예에 따른 가상 계측 장치의 모델 학습 동작을 설명하기 위한 예시도이다.
도 10a 및 도 10b는 본 발명의 실시예에 따른 가상 계측 장치의 예측값 및 특징 중요도 산출 동작을 설명하기 위한 예시도이다.
1 is a block diagram schematically illustrating a virtual metrology-based process system according to an embodiment of the present invention.
2 is a block diagram schematically illustrating a virtual measurement apparatus according to an embodiment of the present invention.
3 and 4 are block diagrams for explaining a processor operation of a virtual measurement apparatus according to an embodiment of the present invention.
5 is a block diagram schematically showing a model learning processing unit according to an embodiment of the present invention.
6 is a flowchart illustrating a virtual measurement method for model learning processing according to an embodiment of the present invention.
7 is a block diagram schematically illustrating a virtual measurement processing unit according to an embodiment of the present invention.
8 is a flowchart illustrating a virtual measurement method using a learning model according to an embodiment of the present invention.
9A and 9B are exemplary diagrams for explaining a model learning operation of a virtual measurement device according to an embodiment of the present invention.
10A and 10B are exemplary diagrams for explaining an operation of calculating a predicted value and a feature importance of a virtual measurement device according to an embodiment of the present invention.

이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다. 이하에서는 도면들을 참조하여 본 발명에서 제안하는 시계열 데이터의 특징값을 기반으로 예측값 및 특징 중요도 산출을 수행하는 가상 계측 방법 및 그를 위한 장치에 대해 자세하게 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In describing the present invention, if it is determined that a detailed description of a related known configuration or function may obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, preferred embodiments of the present invention will be described below, but the technical spirit of the present invention is not limited thereto or may be variously implemented by those skilled in the art without being limited thereto. Hereinafter, a virtual measurement method for calculating predicted values and feature importance based on feature values of time series data proposed by the present invention and an apparatus therefor will be described in detail with reference to the drawings.

도 1은 본 발명의 실시예에 따른 가상 계측 기반의 공정 제어 시스템을 개략적으로 나타낸 블록 구성도이다.1 is a block diagram schematically illustrating a virtual metrology-based process control system according to an embodiment of the present invention.

본 실시예에 따른 가상 계측 기반의 공정 제어 시스템(10)은 가상 계측 장치(100) 및 공정 및 계측 장치(200)를 포함한다. 도 1의 공정 제어 시스템(10)은 일 실시예에 따른 것으로서, 도 1에 도시된 모든 블록이 필수 구성요소는 아니며, 다른 실시예에서 공정 제어 시스템(10)에 포함된 일부 블록이 추가, 변경 또는 삭제될 수 있다. 예를 들어, 공정 제어 시스템(10)은 입력 변수를 제공하는 입력 변수 제공장치(미도시)를 추가로 포함할 수 있으며, 공정 및 계측 장치(200)는 공정 장치 및 계측 장치와 같이 별도의 장치로 구현될 수 있다. The virtual metrology-based process control system 10 according to the present embodiment includes a virtual metrology device 100 and a process and measurement device 200 . The process control system 10 of FIG. 1 is according to one embodiment, and not all blocks shown in FIG. 1 are essential components, and in another embodiment, some blocks included in the process control system 10 are added or changed. Or it can be deleted. For example, the process control system 10 may further include an input variable providing device (not shown) that provides input variables, and the process and measuring device 200 is a separate device such as a process device and a measuring device. can be implemented as

본 실시예에 따른 공정 제어 시스템(10)은 반도체 또는 평판디스플레이(FPD: Flat panel display)등의 제품을 생산하기 위한 적어도 하나의 공정을 수행하는 시스템인 것이 바람직하나 반드시 이에 한정되는 것은 아니며, 예측을 위한 학습 모델이 적용 가능한 다양한 분야의 공정 시스템 중 하나일 수 있다. The process control system 10 according to the present embodiment is preferably a system that performs at least one process for producing products such as semiconductors or flat panel displays (FPDs), but is not necessarily limited thereto. It may be one of the process systems in various fields to which the learning model for

공정 제어 시스템(10)의 가상 계측 장치(100) 및 공정 및 계측 장치(200)는 입력 변수에 의해 동작할 수 있으며, 입력 변수는 시계열 데이터, 센서 데이터, 이전 시점의 공정 조건 데이터, 이전 시점의 실 계측 데이터 등일 수 있다. The virtual measurement device 100 and the process and measurement device 200 of the process control system 10 may operate according to input variables, and the input variables include time series data, sensor data, process condition data at a previous time, and a previous time point. It may be actual measurement data or the like.

가상 계측 장치(100)는 가상 계측을 위한 학습을 통해 학습 모델을 생성하고, 생성된 학습 모델을 이용하여 예측값 및 특징 중요도를 포함하는 가상 계측 결과를 생성한다. 구체적으로, 가상 계측 장치(100)는 시계열 데이터에서 특징값을 추출하고, 특징값에 대한 예측값을 산출하는 동작을 통해 학습된 학습 모델을 이용하여 최종 예측값 및 각 특징값에 대한 중요도를 산출하여 가상 계측 결과를 생성하는 동작을 수행한다. The virtual measurement apparatus 100 generates a learning model through learning for virtual measurement, and generates a virtual measurement result including a predicted value and feature importance by using the generated learning model. Specifically, the virtual measurement device 100 extracts a feature value from time series data and calculates the final predicted value and the importance of each feature value by using a learning model learned through the operation of calculating the predicted value for the feature value Performs an operation that generates a measurement result.

가상 계측 장치(100)는 생성된 가상 계측 결과를 공정 및 계측 장치(200)로 제공한다. The virtual measurement apparatus 100 provides the generated virtual measurement result to the process and measurement apparatus 200 .

공정 및 계측 장치(200)는 공정이 진행될 때 주기적으로 실제 계측을 실시하며, 실 계측값이 기 설정된 기준값 이내이면 현재 공정 조건으로 공정이 진행되도록 하고, 실 계측값이 기 설정된 기준값을 벗어나거나 소정의 기준에 따라 공정 조건의 변화가 필요한 것으로 판단되면 공정 조건을 조정한다. The process and measurement device 200 periodically performs actual measurement when the process is in progress, and if the actual measurement value is within a preset reference value, the process proceeds under the current process conditions, and the actual measurement value deviates from the preset reference value or a predetermined value If it is determined that a change in process conditions is necessary according to the standards of

공정 및 계측 장치(200)는 가상 계측 장치(100)로부터 가상 계측 결과를 제공 받고, 가상 계측 결과를 기반으로 기준값 또는 공정 조건을 조정하여 공정을 진행한다. The process and measurement apparatus 200 receives a virtual measurement result from the virtual measurement apparatus 100 , and performs the process by adjusting a reference value or process condition based on the virtual measurement result.

공정 및 계측 장치(200)는 가상 계측 결과를 제공 받음에 따라 실 계측을 통한 샘플링 계측을 최소화할 수 있고, 공정 제어에 따른 제품의 품질 향상과 제조비용을 절감할 수 있다. As the process and measurement device 200 receives the virtual measurement result, sampling measurement through actual measurement may be minimized, and product quality may be improved and manufacturing cost may be reduced according to process control.

도 2는 본 발명의 실시예에 따른 가상 계측 장치를 개략적으로 나타낸 블록 구성도이다.2 is a block diagram schematically illustrating a virtual measurement apparatus according to an embodiment of the present invention.

본 실시예에 따른 가상 계측 장치(100)는 입력부(110), 출력부(120), 프로세서(130), 메모리(140) 및 데이터 베이스(150)를 포함한다. 도 2의 가상 계측 장치(100)는 일 실시예에 따른 것으로서, 도 2에 도시된 모든 블록이 필수 구성요소는 아니며, 다른 실시예에서 가상 계측 장치(100)에 포함된 일부 블록이 추가, 변경 또는 삭제될 수 있다. 한편, 가상 계측 장치(100)는 컴퓨팅 디바이스로 구현될 수 있고, 가상 계측 장치(100)에 포함된 각 구성요소들은 각각 별도의 소프트웨어 프로그램으로 구현되거나, 소프트웨어가 결합된 별도의 하드웨어 장치로 구현될 수 있다.The virtual measurement apparatus 100 according to the present embodiment includes an input unit 110 , an output unit 120 , a processor 130 , a memory 140 , and a database 150 . The virtual measurement apparatus 100 of FIG. 2 is according to an embodiment, and not all blocks shown in FIG. 2 are essential components, and in another embodiment, some blocks included in the virtual measurement apparatus 100 are added or changed. Or it can be deleted. Meanwhile, the virtual measurement apparatus 100 may be implemented as a computing device, and each component included in the virtual measurement apparatus 100 may be implemented as a separate software program or as a separate hardware device combined with software. can

가상 계측 장치(100)는 시계열 데이터에서 특징값을 추출하고, 특징값에 대한 예측값을 산출하는 동작을 통해 학습된 학습 모델을 이용하여 최종 예측값 및 각 특징값에 대한 중요도를 산출하여 가상 계측 결과를 생성하는 동작을 수행한다.The virtual measurement device 100 extracts a feature value from time series data and calculates the final predicted value and the importance for each feature value using the learning model learned through the operation of calculating the predicted value for the feature value, thereby obtaining the virtual measurement result Execute the creation action.

입력부(110)는 가상 계측 장치(100)에서 가상 계측 동작을 수행하기 위한 신호 또는 데이터를 입력하거나 획득하는 수단을 의미한다. 입력부(110)는 프로세서(130)와 연동하여 다양한 형태의 신호 또는 데이터를 입력하거나, 외부 장치와의 연동을 통해 신호 또는 데이터를 획득하여 프로세서(130)로 전달할 수도 있다. 여기서, 입력부(110)는 입력 변수, 시계열 데이터, 학습 조건, 가상 계측 수행 조건 등을 입력하기 위한 모듈로 구현될 수 있으나 반드시 이에 한정되는 것은 아니다. The input unit 110 refers to a means for inputting or acquiring a signal or data for performing a virtual measurement operation in the virtual measurement device 100 . The input unit 110 may interwork with the processor 130 to input various types of signals or data, or may obtain signals or data through interworking with an external device and transmit the signals or data to the processor 130 . Here, the input unit 110 may be implemented as a module for inputting input variables, time series data, learning conditions, virtual measurement performance conditions, etc., but is not necessarily limited thereto.

출력부(120)는 프로세서(130)와 연동하여 학습 결과, 가상 계측 결과 등의 다양한 정보를 출력할 수 있다. 출력부(120)는 가상 계측 장치(100)에 구비된 디스플레이(미도시)를 통해 다양한 정보를 출력할 수 있으나 반드시 이에 한정되는 것은 아니며, 공정 및 계측 장치(200) 또는 사용자 단말기와 연동하는 방식과 같이 다양한 형태의 방식으로 출력을 수행할 수 있다. The output unit 120 may output various information such as a learning result and a virtual measurement result in conjunction with the processor 130 . The output unit 120 may output various information through a display (not shown) provided in the virtual measurement device 100 , but is not limited thereto, and a method of interworking with the process and measurement device 200 or a user terminal Output can be performed in various types of methods, such as

프로세서(130)는 메모리(140)에 포함된 적어도 하나의 명령어 또는 프로그램을 실행시키는 기능을 수행한다.The processor 130 performs a function of executing at least one instruction or program included in the memory 140 .

본 실시예에 따른 프로세서(130)는 입력부(110) 또는 데이터 베이스(150)로부터 획득한 시계열 데이터에 대한 특징값을 추출하고, 특징값을 기반으로 학습용 예측값을 산출하여 학습 모델을 생성하는 동작을 수행한다. The processor 130 according to this embodiment extracts a feature value for the time series data obtained from the input unit 110 or the database 150, and calculates a prediction value for learning based on the feature value to generate a learning model. carry out

또한, 프로세서(130)는 기 학습된 학습 모델을 이용하여 신규 시계열 데이터에 대한 특징값을 산출하고, 특징값을 기반으로 최종 예측값, 각 특징값에 대한 특징 중요도 등을 포함하는 가상 계측 결과를 산출하는 동작을 수행한다. 본 실시예에 따른 프로세서(130)의 자세한 동작은 도 3 내지 8을 통해 설명하도록 한다. In addition, the processor 130 calculates a feature value for the new time series data using the pre-learned learning model, and calculates a virtual measurement result including a final predicted value and a feature importance for each feature value based on the feature value perform the action A detailed operation of the processor 130 according to the present embodiment will be described with reference to FIGS. 3 to 8 .

메모리(140)는 프로세서(130)에 의해 실행 가능한 적어도 하나의 명령어 또는 프로그램을 포함한다. 메모리(140)는 학습 모델을 생성하는 동작, 가상 계측 결과를 생성하는 동작 등을 위한 명령어 또는 프로그램을 포함할 수 있다. The memory 140 includes at least one instruction or program executable by the processor 130 . The memory 140 may include instructions or programs for generating a learning model, generating a virtual measurement result, and the like.

데이터베이스(150)는 데이터베이스 관리 프로그램(DBMS)을 이용하여 컴퓨터 시스템의 저장공간(하드디스크 또는 메모리)에 구현된 일반적인 데이터구조를 의미하는 것으로, 데이터의 검색(추출), 삭제, 편집, 추가 등을 자유롭게 행할 수 있는 데이터 저장형태를 뜻하는 것으로, 오라클(Oracle), 인포믹스(Infomix), 사이베이스(Sybase), DB2와 같은 관계형 데이타베이스 관리 시스템(RDBMS)이나, 겜스톤(Gemston), 오리온(Orion), O2 등과 같은 객체 지향 데이타베이스 관리 시스템(OODBMS) 및 엑셀론(Excelon), 타미노(Tamino), 세카이주(Sekaiju) 등의 XML 전용 데이터베이스(XML Native Database)를 이용하여 본 발명의 일 실시예의 목적에 맞게 구현될 수 있고, 자신의 기능을 달성하기 위하여 적당한 필드(Field) 또는 엘리먼트들을 가지고 있다.The database 150 means a general data structure implemented in the storage space (hard disk or memory) of a computer system using a database management program (DBMS), and performs data search (extraction), deletion, editing, addition, etc. Relational database management system (RDBMS) such as Oracle, Infomix, Sybase, DB2, Gemston, Orion ), an object-oriented database management system (OODBMS) such as O2, and an XML Native Database such as Excelon, Tamino, Sekaiju, etc. The purpose of an embodiment of the present invention It can be implemented according to the requirements, and has appropriate fields or elements to achieve its function.

본 실시예에 따른 데이터베이스(150)는 입력 변수, 학습 모델 생성, 가상 계측 결과 산출 등과 관련된 데이터를 저장하고, 기 저장된 입력 변수, 학습 모델 생성, 가상 계측 결과 산출 등과 관련된 데이터를 제공할 수 있다. The database 150 according to the present embodiment may store data related to input variables, learning model generation, virtual measurement result calculation, and the like, and may provide data related to pre-stored input variables, learning model generation, virtual measurement result calculation, and the like.

데이터베이스(150)에 저장된 입력 변수는 시계열 데이터, 센서 데이터, 이전 시점의 공정 조건 데이터, 이전 시점의 실 계측 데이터 등일 수 있다. 데이터베이스(150)는 가상 계측 장치(100) 내에 구현되는 것으로 기재하고 있으나 반드시 이에 한정되는 것은 아니며, 별도의 데이터 저장장치로 구현될 수도 있다.The input variable stored in the database 150 may be time series data, sensor data, process condition data of a previous time, actual measurement data of a previous time, and the like. Although the database 150 is described as being implemented in the virtual measurement device 100, it is not necessarily limited thereto, and may be implemented as a separate data storage device.

도 3 및 도 4는 본 발명의 실시예에 따른 가상 계측 장치의 프로세서 동작을 설명하기 위한 블록 구성도이다. 3 and 4 are block diagrams for explaining a processor operation of a virtual measurement apparatus according to an embodiment of the present invention.

가상 계측 장치(100)의 프로세서(130)는 가상 계측을 위한 학습 모델 생성 및 기 학습된 학습 모델을 기반으로 가상 계측을 수행한다. 도 3을 참고하면, 가상 계측 장치(100)의 프로세서(130)는 심층 신경망 구성(310), 화이트 박스 알고리즘 구성(320) 및 화이트 박스 해석 구성(330) 등을 이용하여 학습, 예측, 가상 계측 결과 산출 등의 동작을 수행한다. The processor 130 of the virtual measurement apparatus 100 generates a learning model for virtual measurement and performs virtual measurement based on a pre-learned learning model. Referring to FIG. 3 , the processor 130 of the virtual measurement device 100 learns, predicts, and performs virtual measurement using a deep neural network configuration 310 , a white box algorithm configuration 320 , and a white box analysis configuration 330 , etc. Executes an operation such as calculating a result.

심층 신경망 구성(310)은 컨볼루션 신경망(CNN: Convolution Neural Network)을 기반으로 동작한다. 예를 들어, 심층 신경망 구성(310)은 컨볼루션 신경망에 시계열 데이터를 입력하여 특징값, 신경망 기반의 제1 예측값을 산출할 수 있다. The deep neural network configuration 310 operates based on a convolutional neural network (CNN). For example, the deep neural network configuration 310 may input time series data to the convolutional neural network to calculate a feature value and a neural network-based first predicted value.

화이트 박스 알고리즘 구성(320) 및 화이트 박스 해석 구성(330)은 화이트 박스 알고리즘을 기반으로 분류 예측 모델, 회기 예측 모델을 기반으로 동작한다. 예를 들어, 화이트 박스 알고리즘 구성(320) 및 화이트 박스 해석 구성(330)은 회기 결정 트리(Regression decision tree) 방식을 기반으로 예측값, 특징 중요도 등을 산출할 수 있다. The white box algorithm configuration 320 and the white box interpretation configuration 330 operate based on the classification prediction model and the regression prediction model based on the white box algorithm. For example, the white box algorithm configuration 320 and the white box analysis configuration 330 may calculate predicted values, feature importance, etc. based on a regression decision tree method.

도 4를 참고하면, 본 실시예에 따른 가상 계측 장치(100)의 프로세서(130)는 시계열 데이터 획득부(410), 모델 학습 처리부(420), 가상 계측 처리부(430), 가상 계측 결과 출력부(440)를 포함할 수 있다. 도 4에서 가상 계측 장치(100)의 프로세서(130)는 일 실시예에 따른 것으로서, 도 4에 도시된 모든 블록이 필수 구성요소는 아니며, 다른 실시예에서 프로세서(130)에 포함된 일부 블록이 추가, 변경 또는 삭제될 수 있다. 한편, 가상 계측 장치(100)는 컴퓨팅 디바이스로 구현될 수 있고, 가상 계측 장치(100)의 프로세서(130)에 포함된 각 구성요소들은 각각 별도의 소프트웨어 장치로 구현되거나, 소프트웨어가 결합된 별도의 하드웨어 장치로 구현될 수 있다.Referring to FIG. 4 , the processor 130 of the virtual measurement apparatus 100 according to the present embodiment includes a time series data acquisition unit 410 , a model learning processing unit 420 , a virtual measurement processing unit 430 , and a virtual measurement result output unit. 440 may be included. In FIG. 4 , the processor 130 of the virtual measurement device 100 is according to an embodiment, and not all blocks shown in FIG. 4 are essential components, and in another embodiment, some blocks included in the processor 130 are It may be added, changed or deleted. On the other hand, the virtual measurement apparatus 100 may be implemented as a computing device, and each component included in the processor 130 of the virtual measurement apparatus 100 may be implemented as a separate software device, or a separate software device combined with software. It may be implemented as a hardware device.

시계열 데이터 획득부(410)는 시계열 형태의 변수를 포함하는 시계열 데이터를 획득한다. The time series data obtaining unit 410 obtains time series data including time series type variables.

시계열 데이터 획득부(410)는 시계열 형태의 설명 변수 및 반응 변수를 포함하는 시계열 데이터를 획득할 수 있다. The time series data obtaining unit 410 may obtain time series data including explanatory variables and response variables in the form of time series.

시계열 데이터는 외부 장치(미도시), 별도의 저장부(미도시)로부터 획득하거나 사용자의 조작에 의해 획득할 수 있다. 시계열 데이터에 포함된 설명 변수는 단변량 또는 다변량에 대한 변수이며, 반응 변수는 연속형 또는 범주형에 대한 변수일 수 있다. The time series data may be acquired from an external device (not shown), a separate storage unit (not shown), or acquired by a user's manipulation. The explanatory variables included in the time series data may be univariate or multivariate, and the response variable may be continuous or categorical.

또한, 시계열 데이터는 학습 데이터 개수, 시계열 데이터 길이, 시계열 변수의 개수 등에 대한 정보를 포함할 수 있다. In addition, the time series data may include information on the number of training data, the length of time series data, the number of time series variables, and the like.

모델 학습 처리부(420)는 가상 계측을 위한 학습 모델을 생성하는 동작을 수행한다. 구체적으로, 모델 학습 처리부(420)는 시계열 데이터에 대한 특징값을 추출하고, 특징값을 기반으로 학습용 예측값을 산출하여 학습 모델을 생성한다. The model learning processing unit 420 performs an operation of generating a learning model for virtual measurement. Specifically, the model learning processing unit 420 generates a learning model by extracting a feature value for the time series data, and calculating a prediction value for learning based on the feature value.

모델 학습 처리부(420)에서 학습 모델을 생성하기 위한 일부 동작은 심층 신경망을 통해 처리되고, 다른 일부 동작은 화이트 박스 알고리즘을 통해 처리될 수 있다. Some operations for generating the learning model in the model learning processing unit 420 may be processed through a deep neural network, and other operations may be processed through a white box algorithm.

모델 학습 처리부(420)에 대한 구체적인 설명은 도 5에서 자세히 기재하도록 한다. A detailed description of the model learning processing unit 420 will be described in detail with reference to FIG. 5 .

가상 계측 처리부(430)는 모델 학습 처리부(420)에서 학습된 학습 모델을 이용하여 가상 계측을 수행한다. 구체적으로, 가상 계측 처리부(430)는 신규 시계열 데이터를 학습 모델에 적용하여 가상 계측 결과를 산출한다. The virtual measurement processing unit 430 performs virtual measurement using the learning model learned by the model learning processing unit 420 . Specifically, the virtual measurement processing unit 430 calculates a virtual measurement result by applying the new time series data to the learning model.

가상 계측 처리부(430)에서 가상 계측을 위한 일부 동작은 심층 신경망을 통해 처리되고, 다른 일부 동작은 화이트 박스 알고리즘을 통해 처리될 수 있다. In the virtual metrology processing unit 430 , some operations for virtual measurement may be processed through a deep neural network, and other operations may be processed through a white box algorithm.

가상 계측 처리부(430)에 대한 구체적인 설명은 도 7에서 자세히 기재하도록 한다.A detailed description of the virtual measurement processing unit 430 will be described in detail with reference to FIG. 7 .

가상 계측 결과 출력부(440)는 산출된 가상 계측 결과를 외부 장치로 제공하는 동작을 수행한다. The virtual measurement result output unit 440 performs an operation of providing the calculated virtual measurement result to an external device.

가상 계측 결과 출력부(440)는 가상 계측 결과를 공정 및 계측 장치(200)로 제공할 수 있으나 반드시 이에 한정되는 것은 아니며, 공정 및 계측 장치(200)와 연동하는 별도의 제어장치 또는 사용자 단말기로 가상 계측 결과를 제공할 수 있다. The virtual measurement result output unit 440 may provide the virtual measurement result to the process and measurement device 200 , but is not limited thereto, and may be a separate control device or user terminal interworking with the process and measurement device 200 . Virtual measurement results can be provided.

도 5는 본 발명의 실시예에 따른 모델 학습 처리부를 개략적으로 나타낸 블록 구성도이다. 5 is a block diagram schematically showing a model learning processing unit according to an embodiment of the present invention.

본 실시예에 따른 모델 학습 처리부(420)는 특징값 추출부(510), 제1 예측값 산출부(520), 제2 예측값 산출부(530), 학습용 예측값 산출부(540), 에러값 산출부(550) 및 학습 모델 생성부(560)을 포함한다. 도 5의 모델 학습 처리부(420)는 일 실시예에 따른 것으로서, 도 5에 도시된 모든 블록이 필수 구성요소는 아니며, 다른 실시예에서 모델 학습 처리부(420)에 포함된 일부 블록이 추가, 변경 또는 삭제될 수 있다. 한편, 모델 학습 처리부(420)에 포함된 각 구성요소들은 각각 별도의 소프트웨어 프로그램으로 구현되거나, 소프트웨어가 결합된 별도의 하드웨어 장치로 구현될 수 있다.The model learning processing unit 420 according to the present embodiment includes a feature value extraction unit 510 , a first prediction value calculation unit 520 , a second prediction value calculation unit 530 , a prediction value calculation unit for learning 540 , and an error value calculation unit 550 and a learning model generator 560 . The model learning processing unit 420 of FIG. 5 is according to an embodiment, and not all blocks shown in FIG. 5 are essential components, and in another embodiment, some blocks included in the model learning processing unit 420 are added or changed. Or it can be deleted. Meanwhile, each component included in the model learning processing unit 420 may be implemented as a separate software program, or may be implemented as a separate hardware device combined with software.

모델 학습 처리부(420)는 시계열 데이터에 대한 특징값을 추출하고, 특징값을 기반으로 학습용 예측값을 산출하여 학습 모델을 생성한다. 이하, 모델 학습 처리부(420)에 포함된 구성요소 각각에 대해 설명하도록 한다. The model learning processing unit 420 generates a learning model by extracting feature values for time series data, and calculating prediction values for learning based on the feature values. Hereinafter, each of the components included in the model learning processing unit 420 will be described.

특징값 추출부(510)는 신경망을 통해 시계열 데이터에 대한 특징값을 추출한다. The feature value extraction unit 510 extracts a feature value for time series data through a neural network.

특징값 추출부(510)는 시계열 데이터를 신경망에 포함된 컨볼루션 레이어를 통과시켜 특징값을 추출한다. 여기서, 특징값은 벡터 형태인 것이 바람직하다. The feature value extraction unit 510 extracts feature values by passing the time series data through a convolution layer included in the neural network. Here, the feature value is preferably in the form of a vector.

예측값 산출부(520, 530, 540)는 특징값을 기반으로 학습용 예측값을 산출한다. The prediction value calculators 520 , 530 , and 540 calculate prediction values for learning based on the feature values.

제1 예측값 산출부(520)는 신경망을 기반으로 특징값을 기반으로 제1 예측값을 산출하는 동작을 수행한다. The first predicted value calculating unit 520 performs an operation of calculating a first predicted value based on the feature value based on the neural network.

제2 예측값 산출부(530)는 특징값을 화이트 박스 알고리즘에 대입하여 제2 예측값을 산출한다. The second predicted value calculator 530 calculates a second predicted value by substituting the feature value into the white box algorithm.

학습용 예측값 산출부(540)는 제1 예측값과 제2 예측값을 비교하여 유사도를 산출하고, 유사도에 따른 가중치를 부여하여 학습용 예측값을 산출한다. The prediction value calculation unit 540 for learning calculates a similarity by comparing the first predicted value with the second predicted value, and calculates a predicted value for learning by assigning a weight according to the similarity.

에러값 산출부(550)는 학습용 예측값에 대한 에러값을 산출하는 동작을 수행한다. The error value calculator 550 calculates an error value for the prediction value for learning.

학습 모델 생성부(560)는 학습용 예측값을 기반으로 가상 계측을 위한 학습 모델을 생성한다. The learning model generator 560 generates a learning model for virtual measurement based on the predicted value for learning.

학습 모델 생성부(560)는 학습용 예측값에 대한 에러값을 산출하는 과정이 생략되거나 미수행되는 경우 학습용 예측값을 기반으로 학습 모델을 생성할 수 있다. The learning model generator 560 may generate a learning model based on the prediction value for learning when the process of calculating an error value for the prediction value for learning is omitted or not performed.

한편, 학습 모델 생성부(560)는 학습용 예측값에 대한 에러값을 산출하는 과정이 수행된 경우, 에러값과 기 설정된 임계치를 비교하여 학습 모델을 생성한다. On the other hand, when the process of calculating the error value for the prediction value for learning is performed, the learning model generator 560 compares the error value with a preset threshold to generate the learning model.

학습 모델 생성부(560)는 에러값과 기 설정된 임계치를 비교하여, 에러값이 상기 임계치 이상인 경우 특징값 추출을 위한 신경망을 업데이트하는 동작을 반복하여 수행한다. The learning model generator 560 compares the error value with a preset threshold, and repeats the operation of updating the neural network for extracting the feature value when the error value is greater than or equal to the threshold.

학습 모델 생성부(560)는 에러값과 기 설정된 임계치를 비교하여, 에러값이 임계치 미만인 경우 해당 학습용 예측값을 기반으로 학습 모델을 생성한다. The learning model generator 560 compares the error value with a preset threshold, and when the error value is less than the threshold, generates a learning model based on the corresponding learning prediction value.

도 6은 본 발명의 실시예에 따른 모델 학습 처리를 위한 가상 계측 방법을 설명하기 위한 순서도이다. 6 is a flowchart illustrating a virtual measurement method for model learning processing according to an embodiment of the present invention.

가상 계측 장치(100)는 시계열 데이터를 획득한다(S610).The virtual measurement device 100 acquires time series data (S610).

가상 계측 장치(100)는 신경망을 통해 시계열 데이터에 대한 특징값을 추출한다(S620).The virtual measurement apparatus 100 extracts a feature value of the time series data through a neural network (S620).

가상 계측 장치(100)는 신경망을 기반으로 특징값을 기반으로 제1 예측값을 산출한다(S630).The virtual measurement apparatus 100 calculates a first predicted value based on the feature value based on the neural network (S630).

가상 계측 장치(100)는 특징값을 화이트 박스 알고리즘에 적용하여 제2 예측값 산출한다(S640).The virtual measurement apparatus 100 calculates a second predicted value by applying the feature value to the white box algorithm (S640).

가상 계측 장치(100)는 제1 예측값 및 제2 예측값을 비교하여 학습용 예측값을 산출한다(S650). 가상 계측 장치(100)는 제1 예측값과 제2 예측값을 비교하여 유사도를 산출하고, 유사도에 따른 가중치를 부여하여 학습용 예측값을 산출한다.The virtual measurement device 100 compares the first predicted value and the second predicted value to calculate a learning predicted value ( S650 ). The virtual measurement apparatus 100 calculates a similarity by comparing the first predicted value with the second predicted value, and calculates a predicted value for learning by assigning a weight according to the similarity.

가상 계측 장치(100)는 학습용 예측값에 대한 에러값을 산출한다(S660).The virtual measurement device 100 calculates an error value for the prediction value for learning ( S660 ).

가상 계측 장치(100)는 산출된 에러값과 기 설정된 임계치를 비교한다(S670). The virtual measurement apparatus 100 compares the calculated error value with a preset threshold (S670).

단계 S670에서, 가상 계측 장치(100)는 에러값과 기 설정된 임계치를 비교하여, 에러값이 상기 임계치 이상인 경우 특징값 추출을 위한 신경망을 업데이트하는 동작을 반복하여 수행한다(S672). 즉, 에러값이 임계값 이상인 경우, 가상 계측 장치(100)는 백프로파게이션을 수행하여 단계 S620로 돌아가 학습 동작을 반복한다. In step S670, the virtual measurement apparatus 100 compares the error value with a preset threshold, and repeats the operation of updating the neural network for extracting the feature value when the error value is greater than or equal to the threshold (S672). That is, when the error value is equal to or greater than the threshold value, the virtual measurement apparatus 100 performs backpropagation and returns to step S620 to repeat the learning operation.

단계 S670에서, 가상 계측 장치(100)는 에러값과 기 설정된 임계치를 비교하여, 에러값이 임계치 미만인 경우 학습을 종료하고, 해당 학습용 예측값을 기반으로 학습 모델을 생성한다(S680). In step S670, the virtual measurement device 100 compares the error value with a preset threshold, ends the learning when the error value is less than the threshold, and generates a learning model based on the predicted value for learning (S680).

도 6에서는 각 단계를 순차적으로 실행하는 것으로 기재하고 있으나, 반드시 이에 한정되는 것은 아니다. 다시 말해, 도 6에 기재된 단계를 변경하여 실행하거나 하나 이상의 단계를 병렬적으로 실행하는 것으로 적용 가능할 것이므로, 도 6은 시계열적인 순서로 한정되는 것은 아니다.Although it is described that each step is sequentially executed in FIG. 6 , the present invention is not limited thereto. In other words, since it may be applicable to changing and executing the steps described in FIG. 6 or executing one or more steps in parallel, FIG. 6 is not limited to a chronological order.

도 6에 기재된 본 실시예에 따른 모델 학습 처리를 위한 가상 계측 방법은 애플리케이션(또는 프로그램)으로 구현되고 단말장치(또는 컴퓨터)로 읽을 수 있는 기록매체에 기록될 수 있다. 본 실시예에 따른 모델 학습 처리를 위한 가상 계측 방법을 구현하기 위한 애플리케이션(또는 프로그램)이 기록되고 단말장치(또는 컴퓨터)가 읽을 수 있는 기록매체는 컴퓨팅 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치 또는 매체를 포함한다.The virtual measurement method for model learning processing according to the present embodiment described in FIG. 6 may be implemented as an application (or program) and recorded in a recording medium readable by a terminal device (or computer). An application (or program) for implementing a virtual measurement method for model learning processing according to this embodiment is recorded and a terminal device (or computer) readable recording medium is all of the data that can be read by the computing system are stored Recording devices or media of any kind.

도 7은 본 발명의 실시예에 따른 가상 계측 처리부를 개략적으로 나타낸 블록 구성도이다. 7 is a block diagram schematically illustrating a virtual measurement processing unit according to an embodiment of the present invention.

본 실시예에 따른 가상 계측 처리부(430)는 특징값 추출부(710), 학습 모델 처리부(720), 최종 예측값 산출부(730) 및 중요도 산출부(740)를 포함한다. The virtual measurement processing unit 430 according to the present embodiment includes a feature value extraction unit 710 , a learning model processing unit 720 , a final predicted value calculation unit 730 , and an importance calculation unit 740 .

도 7의 가상 계측 처리부(430)는 일 실시예에 따른 것으로서, 도 7에 도시된 모든 블록이 필수 구성요소는 아니며, 다른 실시예에서 가상 계측 처리부(430)에 포함된 일부 블록이 추가, 변경 또는 삭제될 수 있다. 한편, 가상 계측 처리부(430)에 포함된 각 구성요소들은 각각 별도의 소프트웨어 프로그램으로 구현되거나, 소프트웨어가 결합된 별도의 하드웨어 장치로 구현될 수 있다.The virtual metrology processing unit 430 of FIG. 7 is according to an embodiment, and not all blocks shown in FIG. 7 are essential components, and in another embodiment, some blocks included in the virtual metrology processing unit 430 are added or changed. Or it can be deleted. Meanwhile, each component included in the virtual measurement processing unit 430 may be implemented as a separate software program or as a separate hardware device combined with software.

가상 계측 처리부(430)는 신규 시계열 데이터를 학습 모델에 적용하여 가상 계측 결과를 산출한다. 이하, 가상 계측 처리부(430)에 포함된 구성요소 각각에 대해 설명하도록 한다. The virtual measurement processing unit 430 calculates a virtual measurement result by applying the new time series data to the learning model. Hereinafter, each of the components included in the virtual measurement processing unit 430 will be described.

특징값 추출부(710)는 신규 시계열 데이터를 획득하면, 신규 시계열 데이터에 대한 특징값을 추출한다. When new time series data is obtained, the feature value extraction unit 710 extracts a feature value for the new time series data.

가상 계측 결과 산출부(720, 730, 740)는 기 학습된 학습 모델을 이용하여 가상 계측 결과를 산출하는 동작을 수행한다. The virtual measurement result calculation units 720 , 730 , and 740 calculate a virtual measurement result by using a pre-learned learning model.

학습 모델 처리부(720)는 신규 시계열 데이터에 대한 특징값을 화이트 박스 알고리즘 기반의 상기 학습 모델에 적용하여 가상 계측 결과가 생성되도록 한다. The learning model processing unit 720 applies the feature value of the new time series data to the learning model based on the white box algorithm to generate a virtual measurement result.

학습 모델 처리부(720)는 모델 학습 처리부(420)에서 학습된 학습 모델(422)를 저장하며, 신규 시계열 데이터에 대한 특징값을 입력값으로 적용하여 출력값을 생성한다. 여기서, 출력값은 최종 예측값 산출부(730) 및 중요도 산출부(740) 중 적어도 하나로 전송될 수 있다. The learning model processing unit 720 stores the learning model 422 learned by the model learning processing unit 420 , and generates an output value by applying a feature value of the new time series data as an input value. Here, the output value may be transmitted to at least one of the final predicted value calculator 730 and the importance calculator 740 .

최종 예측값 산출부(730)는 신규 시계열 데이터에 대한 특징값을 화이트 박스 알고리즘 기반의 학습 모델에 적용하여 최종 예측값을 산출하고, 산출된 최종 예측값을 포함하는 가상 계측 결과를 생성한다. The final predicted value calculating unit 730 applies the feature value of the new time series data to the white box algorithm-based learning model to calculate the final predicted value, and generates a virtual measurement result including the calculated final predicted value.

중요도 산출부(740)는 신규 시계열 데이터에 대한 특징값을 화이트 박스 알고리즘 기반의 학습 모델에 적용하여 상기 특징값에 대한 오차 감소율에 따른 특징 중요도를 산출하고, 산출된 상기 특징 중요도를 포함하는 가상 계측 결과를 생성한다. The importance calculator 740 applies the feature value for the new time series data to a white box algorithm-based learning model to calculate the feature importance according to the error reduction rate for the feature value, and virtual measurement including the calculated feature importance produce results.

도 8은 본 발명의 실시예에 따른 학습 모델을 이용한 가상 계측 방법을 설명하기 위한 순서도이다. 8 is a flowchart illustrating a virtual measurement method using a learning model according to an embodiment of the present invention.

가상 계측 장치(100)는 시계열 데이터를 획득한다(S810). 여기서, 시계열 데이터는 학습 과정의 시계열 데이터와 상이한 신규 시계열 데이터일 수 있다. The virtual measurement device 100 acquires time series data (S810). Here, the time series data may be new time series data different from the time series data of the learning process.

가상 계측 장치(100)는 시계열 데이터에 대한 특징값을 추출한다(S820). 여기서, 가상 계측 장치(100)는 기 학습된 학습 모델에 포함된 신경망을 통해 신규 시계열 데이터에 대한 특징값을 산출할 수 있다. The virtual measurement apparatus 100 extracts a feature value for the time series data (S820). Here, the virtual measurement apparatus 100 may calculate a feature value for the new time series data through the neural network included in the pre-trained learning model.

가상 계측 장치(100)는 기 학습된 학습 모델을 통해 최종 예측값을 산출한다(S830). 가상 계측 장치(100)는 산출된 최종 예측값을 포함하는 가상 계측 결과를 외부 장치로 전달할 수 있다. The virtual measurement apparatus 100 calculates a final predicted value through the pre-trained learning model (S830). The virtual measurement device 100 may transmit a virtual measurement result including the calculated final predicted value to an external device.

가상 계측 장치(100)는 기 학습된 학습 모델을 통해 특징값의 특징 중요도를 산출한다(S840). 가상 계측 장치(100)는 산출된 특징 중요도를 포함하는 가상 계측 결과를 외부 장치로 전달할 수 있다. The virtual measurement apparatus 100 calculates the feature importance of the feature value through the pre-learned learning model (S840). The virtual measurement device 100 may transmit a virtual measurement result including the calculated feature importance to an external device.

단계 S830 및 단계 S840은 순차적으로 수행되는 것으로 기재하고 있으나 반드시 이에 한정되는 것은 아니며, 단계 S830 및 단계 S840 중 하나의 단계만 수행하여 가상 계측 결과를 생성할 수도 있다. Steps S830 and S840 are described as being sequentially performed, but are not necessarily limited thereto, and only one of steps S830 and S840 may be performed to generate a virtual measurement result.

도 8에서는 각 단계를 순차적으로 실행하는 것으로 기재하고 있으나, 반드시 이에 한정되는 것은 아니다. 다시 말해, 도 8에 기재된 단계를 변경하여 실행하거나 하나 이상의 단계를 병렬적으로 실행하는 것으로 적용 가능할 것이므로, 도 8은 시계열적인 순서로 한정되는 것은 아니다.Although it is described that each step is sequentially executed in FIG. 8 , the present invention is not limited thereto. In other words, since it may be applicable to changing and executing the steps described in FIG. 8 or executing one or more steps in parallel, FIG. 8 is not limited to a chronological order.

도 8에 기재된 본 실시예에 따른 학습 모델을 이용한 가상 계측 방법은 애플리케이션(또는 프로그램)으로 구현되고 단말장치(또는 컴퓨터)로 읽을 수 있는 기록매체에 기록될 수 있다. 본 실시예에 따른 학습 모델을 이용한 가상 계측 방법을 구현하기 위한 애플리케이션(또는 프로그램)이 기록되고 단말장치(또는 컴퓨터)가 읽을 수 있는 기록매체는 컴퓨팅 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치 또는 매체를 포함한다.The virtual measurement method using the learning model according to the present embodiment described in FIG. 8 may be implemented as an application (or program) and recorded in a recording medium readable by a terminal device (or computer). The recording medium in which the application (or program) for implementing the virtual measurement method using the learning model according to this embodiment is recorded and the terminal device (or computer) can read is any type of data that can be read by the computing system is stored of recording devices or media.

도 9a 및 도 9b는 본 발명의 실시예에 따른 가상 계측 장치의 모델 학습 동작을 설명하기 위한 예시도이다. 9A and 9B are exemplary diagrams for explaining a model learning operation of a virtual measurement device according to an embodiment of the present invention.

도 9a는 가상 계측 장치(100)에서 학습용 예측값을 산출하여 학습 모델을 생성하는 동작을 설명하기 위한 도면이다. 9A is a diagram for explaining an operation of generating a learning model by calculating a prediction value for learning in the virtual measurement device 100 .

단계 S910에서, 가상 계측 장치(100)는 시계열 데이터를 획득한다. 단계 S910은 시계열 데이터 획득부(410)의 동작과 매칭될 수 있다. In step S910 , the virtual measurement device 100 acquires time series data. Step S910 may match the operation of the time series data acquisition unit 410 .

단계 S910에서, 시계열 데이터는 (n × t × m) 형태의 설명 변수에 대한 로우 데이터(Raw data, 911), (n × 1) 형태의 반응변수에 대한 레이블 데이터(Lable data)를 포함할 수 있다. 여기서, n은 학습 데이터 개수, t는 시계열 데이터 길이, m은 시계열 변수의 개수를 의미한다. 예를 들어, 시계열 데이터는 (100 × 64 × 1) 형태의 로우 데이터, (100 × 1) 형태의 레이블 데이터를 포함할 수 있다. In step S910, the time series data may include raw data (911) for explanatory variables in the form of (n × t × m), and label data for response variables in the form of (n × 1). there is. Here, n is the number of training data, t is the length of time series data, and m is the number of time series variables. For example, the time series data may include (100×64×1) raw data and (100×1) label data.

단계 S920에서, 가상 계측 장치(100)는 신경망을 통해 시계열 데이터에 대한 특징값을 추출한다. 단계 S920는 특징값 추출부(510)의 동작과 매칭될 수 있다. In step S920 , the virtual measurement apparatus 100 extracts a feature value for time series data through a neural network. Step S920 may match the operation of the feature value extraction unit 510 .

단계 S920에서, 신경망은 제1 컨볼루션 레이어(Convolution Layer), 제1 액티베이션 레이어(Activation Layer), 제1 풀링 레이어(Pooling Layer), 제2 컨볼루션 레이어, 제2 액티베이션 레이어, 제2 풀링 레이어 및 플래튼 레이어(Flatten layer)를 포함한다. In step S920, the neural network includes a first convolution layer, a first activation layer, a first pooling layer, a second convolution layer, a second activation layer, a second pooling layer, and Including a flatten layer (Flatten layer).

제1 액티베이션 레이어(블록 921)의 출력은 [수학식 1]과 같이 정의될 수 있다. The output of the first activation layer (block 921) may be defined as [Equation 1].

Figure pat00001
Figure pat00001

(n: 학습 데이터 개수, in: 입력(input) 데이터 사이즈, k: 커널 사이즈, s: 스트라이드 사이즈, f: 필터 개수)(n: number of training data, in: input data size, k: kernel size, s: stride size, f: number of filters)

제1 풀링 레이어(블록 922)의 출력은 [수학식 2]과 같이 정의될 수 있다. The output of the first pooling layer (block 922) may be defined as [Equation 2].

Figure pat00002
Figure pat00002

(n: 학습 데이터 개수, in: 입력(input) 데이터 사이즈, p: 풀(pool) 사이즈, f: 필터 개수)(n: number of training data, in: input data size, p: pool size, f: number of filters)

플래튼 레이어의 출력은 [수학식 3]과 같이 정의될 수 있다. The output of the platen layer may be defined as [Equation 3].

Figure pat00003
Figure pat00003

(n: 학습 데이터 개수, o: 이전 노드의

Figure pat00004
값, f: 필터 개수)(n: the number of training data, o: the number of previous nodes
Figure pat00004
value, f: number of filters)

예를 들어, 신경망의 사용자 설정값은 stride=2, kernel size=2, filter size=8, pool size=2인 것으로 가정하면, 제1 액티베이션 레이어의 출력은 (100 × 32 × 8) 형태의 값이고, 제1 풀링 레이어의 출력은 (100 × 16 × 8) 형태의 값이고, 제2 액티베이션 레이어(블록 923)의 출력은 (100 × 4 × 8) 형태의 값이고, 제2 풀링 레이어(블록 924)의 출력은 (100 × 8 × 8) 형태의 값일 수 있다. 또한, 플래튼 레이어(블록 925)의 출력은 (100 × 64) 형태의 값(특징값)일 수 있다. For example, assuming that the user setting values of the neural network are stride=2, kernel size=2, filter size=8, pool size=2, the output of the first activation layer is a value of the form (100 × 32 × 8) , the output of the first pooling layer is a value of the form (100 × 16 × 8), the output of the second activation layer (block 923) is a value of the form (100 × 4 × 8), and the second pooling layer (block 923) has a value of the form 924) may be a value of the form (100 × 8 × 8). Also, the output of the platen layer (block 925) may be a value (feature value) of the form (100×64).

단계 S930에서, 가상 계측 장치(100)는 신경망을 기반으로 특징값을 기반으로 제1 예측값을 산출한다. 단계 S930은 제1 예측값 산출부(520)의 동작과 매칭될 수 있다.In operation S930, the virtual measurement apparatus 100 calculates a first predicted value based on the feature value based on the neural network. Step S930 may match the operation of the first prediction value calculator 520 .

단계 S930에서, 신경망은 풀리 커넥티드 레이어(Fully connected Layer), 출력 레이어를 추가로 포함한다. 출력 레이어는 제1 예측값을 출력하고, 제1 예측값은 (100 × 1) 형태의 값일 수 있다.In step S930, the neural network further includes a fully connected layer and an output layer. The output layer outputs a first prediction value, and the first prediction value may be a value in the form of (100 × 1).

단계 S940에서, 가상 계측 장치(100)는 특징값을 화이트 박스 알고리즘에 적용하여 제2 예측값 산출한다. 단계 S940은 제2 예측값 산출부(530)의 동작과 매칭될 수 있다. In operation S940, the virtual measurement apparatus 100 calculates a second predicted value by applying the feature value to the white box algorithm. Step S940 may match the operation of the second prediction value calculator 530 .

단계 S940에서, 가상 계측 장치(100)는 플래튼 레이어의 출력인 (100 × 64) 형태의 특징값을 입력 받고, 부트스트랩을 통해 샘플 데이터 셋을 생성하여 화이트 박스 알고리즘에 적용한다(블록 942, 블록 944). 여기서, 부트스트랩은 중복을 허용한 랜덤 샘플링을 통해 데이터 셋을 만드는 방식을 의미한다. 여기서, 데이터 셋은 (100 × 64) 형태의 값일 수 있다.In step S940, the virtual metrology device 100 receives a feature value in the form of (100 × 64) that is the output of the platen layer, generates a sample data set through bootstrap, and applies it to the white box algorithm (block 942, block 944). Here, bootstrap refers to a method of creating a data set through random sampling that allows duplication. Here, the data set may be a value in the form of (100 × 64).

단계 S940에서, 화이트 박스 알고리즘을 통과한 출력은 화이트 박스 알고리즘의 종류에 따라 상이할 수 있다. 예를 들어, 화이트 박스 알고리즘을 통과한 출력은 대상 타입 데이터, 예측에 필요한 모델 정보 등을 포함할 수 있다.In step S940, an output that has passed through the white box algorithm may be different depending on the type of the white box algorithm. For example, an output that has passed through the white box algorithm may include target type data, model information required for prediction, and the like.

단계 S940에서, 플래튼 레이어의 출력인 (100 × 64) 형태의 특징값을 학습된 화이트 박스 알고리즘에 대입하여 제2 예측값을 산출할 수 있다. 여기서, 제2 예측값은 (100 × 1) 형태의 값일 수 있다(블록 946).In operation S940, a second predicted value may be calculated by substituting a feature value in the form of (100×64), which is the output of the platen layer, into the learned white box algorithm. Here, the second prediction value may be a value of the form (100×1) (block 946).

단계 S950 및 단계 S960에서, 가상 계측 장치(100)는 제1 예측값 및 제2 예측값을 비교하여 학습용 예측값을 산출한다. 구체적으로, 가상 계측 장치(100)는 제1 예측값과 제2 예측값을 비교하여 유사도를 산출하고, 유사도에 따른 가중치를 부여하여 학습용 예측값을 산출한다. 단계 S950 및 단계 S960는 학습용 예측값 산출부(540)의 동작과 매칭될 수 있다.In steps S950 and S960 , the virtual measurement device 100 calculates a prediction value for learning by comparing the first predicted value and the second predicted value. Specifically, the virtual measurement apparatus 100 calculates a similarity by comparing the first predicted value with the second predicted value, and calculates the predicted value for learning by assigning a weight according to the similarity. Steps S950 and S960 may match the operation of the prediction value calculation unit 540 for learning.

단계 S950에서, 가상 계측 장치(100)는 피어슨 상관 계수(Pearson Correlation Coefficient)를 기반으로 제1 예측값과 제2 예측값을 비교하여 유사도를 산출할 수 있다(블록 952). 여기서, 단계 S950의 출력값은 (100 × 1) 형태의 값일 수 있다.In operation S950 , the virtual measurement apparatus 100 may calculate a similarity by comparing the first predicted value and the second predicted value based on a Pearson correlation coefficient (block 952 ). Here, the output value of step S950 may be a value in the form of (100 × 1).

단계 S960에서, 가상 계측 장치(100)는 유사도에 따라 기 설정된 가중치(w)를 부여하고(블록 962), 학습용 예측값을 산출한다(블록 964). 여기서, 가중치(w)는 가중치(w)의 합이 1이 되도록 스케일을 조정한 값을 의미하며, 출력값은 (100 × 1) 형태의 값일 수 있다.In step S960, the virtual measurement device 100 assigns a preset weight w according to the degree of similarity (block 962), and calculates a prediction value for learning (block 964). Here, the weight w refers to a scaled value such that the sum of the weights w becomes 1, and the output value may be a value in the form of (100 × 1).

단계 S960에서, 가상 계측 장치(100)는 제1 예측값에 가중치를 부여하는 것이 바람직하나 반드시 이에 한정되는 것은 아니며, 제2 예측값에 가중치를 부여하거나, 제1 예측값 및 제2 예측값의 평균값에 가중치를 부여하여 학습용 예측값을 산출할 수도 있다. In step S960, the virtual measurement device 100 preferably assigns a weight to the first predicted value, but is not limited thereto, and assigns a weight to the second predicted value, or applies a weight to the average value of the first predicted value and the second predicted value. It is also possible to calculate a prediction value for learning by giving it.

도 9b는 가상 계측 장치(100)에서 학습용 예측값을 산출한 후 에러값을 산출하여 학습 모델을 생성하는 동작을 설명하기 위한 도면이다. 9B is a diagram for explaining an operation of generating a learning model by calculating an error value after calculating a prediction value for learning in the virtual measurement device 100 .

도 9b의 S910 내지 S960의 동작은 도 9a의 동작과 동일함에 따라 중복되는 설명의 기재는 생략하도록 한다. Since operations S910 to S960 of FIG. 9B are the same as those of FIG. 9A , descriptions of overlapping descriptions will be omitted.

단계 S970에서, 가상 계측 장치(100)는 학습용 예측값에 대한 에러값을 산출한다. 단계 S970은 에러값 산출부(550)의 동작과 매칭될 수 있다. In step S970 , the virtual measurement device 100 calculates an error value for the prediction value for learning. Step S970 may match the operation of the error value calculator 550 .

단계 S970에서, 가상 계측 장치(100)는 학습용 예측값과 시계열 데이터에 포함된 레이블 데이터의 값(실제값)을 이용하여 손실 함수(Loss function)를 계산하여 에러값을 산출한다. 단계 S970에서는 에러값 산출을 위하여 손실 함수(Loss function)를 사용하는 것으로 기재하고 있으나, 반드시 이에 한정되는 것은 아니며 회귀 방식에서는 평균 제곱근 오차(RMSE: Root mean square error) 등을 사용할 수도 있다. In step S970 , the virtual measurement device 100 calculates an error value by calculating a loss function using the predicted value for learning and the value (actual value) of the label data included in the time series data. In step S970, it is described that a loss function is used for calculating an error value, but the present invention is not limited thereto, and a root mean square error (RMSE) may be used in the regression method.

단계 S980에서, 가상 계측 장치(100)는 산출된 에러값과 기 설정된 임계치(ε)를 비교하고, 비교 결과를 기반으로 학습 모델을 생성한다. 단계 S980은 학습 모델 생성부(560)의 동작과 매칭될 수 있다. In step S980 , the virtual measurement apparatus 100 compares the calculated error value with a preset threshold ε, and generates a learning model based on the comparison result. Step S980 may match the operation of the learning model generator 560 .

단계 S980에서, 가상 계측 장치(100)는 에러값과 기 설정된 임계치를 비교하여, 에러값이 상기 임계치 이상인 경우 특징값 추출을 위한 신경망을 업데이트하는 동작을 반복하여 수행한다. 즉, 에러값이 임계값 이상인 경우, 가상 계측 장치(100)는 백프로파게이션(Backpropagation)을 수행하여 단계 S930 및 단계 S920 순으로 신경망 업데이트를 수행한다. 여기서, 신경망을 업데이트하는 동작은 에러값이 임계치(ε)보다 작은 것으로 판단될 때까지 반복한다. In step S980 , the virtual measurement apparatus 100 compares the error value with a preset threshold and repeats the operation of updating the neural network for extracting the feature value when the error value is greater than or equal to the threshold. That is, when the error value is equal to or greater than the threshold value, the virtual measurement apparatus 100 performs backpropagation to update the neural network in the order of steps S930 and S920. Here, the operation of updating the neural network is repeated until it is determined that the error value is smaller than the threshold ε.

단계 S980에서, 가상 계측 장치(100)는 에러값과 기 설정된 임계치를 비교하여, 에러값이 임계치 미만인 경우 학습을 종료하고, 해당 학습용 예측값을 기반으로 학습 모델을 생성한다. In step S980 , the virtual measurement apparatus 100 compares the error value with a preset threshold, ends learning when the error value is less than the threshold, and generates a learning model based on the corresponding learning prediction value.

도 10a 및 도 10b는 본 발명의 실시예에 따른 가상 계측 장치의 예측값 및 특징 중요도 산출 동작을 설명하기 위한 예시도이다.10A and 10B are exemplary diagrams for explaining an operation of calculating a predicted value and a feature importance of a virtual measurement device according to an embodiment of the present invention.

도 10a는 가상 계측 장치(100)에서 기 학습된 학습 모델을 이용하여 최종 예측값을 산출하는 동작을 설명하기 위한 도면이다. FIG. 10A is a diagram for explaining an operation of calculating a final predicted value using a pre-trained learning model in the virtual measurement device 100 .

단계 S1010에서, 가상 계측 장치(100)는 신규 시계열 데이터를 획득한다. 단계 S1010은 시계열 데이터 획득부(410)의 동작과 매칭될 수 있다. In step S1010 , the virtual measurement device 100 acquires new time series data. Step S1010 may match the operation of the time series data acquisition unit 410 .

단계 S1010에서, 시계열 데이터는 (n × t × m) 형태의 설명 변수에 대한 로우 데이터(Raw data), (n × 1) 형태의 반응변수에 대한 레이블 데이터(Lable data)를 포함할 수 있다. 여기서, n은 학습 데이터 개수, t는 시계열 데이터 길이, m은 시계열 변수의 개수를 의미한다. 예를 들어, 시계열 데이터는 (100 × 64 × 1) 형태의 로우 데이터, (100 × 1) 형태의 레이블 데이터를 포함할 수 있다. In step S1010 , the time series data may include raw data for an explanatory variable in the form of (n × t × m) and label data for a response variable in the form of (n × 1). Here, n is the number of training data, t is the length of time series data, and m is the number of time series variables. For example, the time series data may include raw data in the form of (100 × 64 × 1) and label data in the form of (100 × 1).

단계 S1020에서, 가상 계측 장치(100)는 신경망을 통해 신규 시계열 데이터에 대한 특징값을 추출한다. 여기서, 가상 계측 장치(100)는 기 학습된 학습 모델에 포함된 신경망을 통해 신규 시계열 데이터에 대한 특징값을 산출할 수 있다. 단계 S1020는 특징값 추출부(710)의 동작과 매칭될 수 있다. In step S1020 , the virtual measurement apparatus 100 extracts a feature value for new time series data through a neural network. Here, the virtual measurement apparatus 100 may calculate a feature value for the new time series data through the neural network included in the pre-trained learning model. Step S1020 may match the operation of the feature value extraction unit 710 .

단계 S1030 및 단계 S1040에서, 가상 계측 장치(100)는 산출된 특징값을 기 학습된 학습 모델에 입력시키고, 기 학습된 학습 모델을 통해 최종 예측값을 산출한다. 단계 S1030 및 단계 S1040은 학습 모델 처리부(720), 최종 예측값 산출부(730)의 동작과 매칭될 수 있다. In steps S1030 and S1040, the virtual measurement device 100 inputs the calculated feature values to the pre-learned learning model, and calculates a final predicted value through the pre-learned learning model. Steps S1030 and S1040 may match operations of the learning model processing unit 720 and the final prediction value calculating unit 730 .

단계 S1040에서, 가상 계측 장치(100)는 시계열 데이터의 레이블 데이터와 동일한 타입과 길이인 최종 예측값을 산출하여 출력한다 예를 들어, 단계 S1040에서, 가상 계측 장치(100)는 (100 × 1) 형태의 최종 예측값을 출력한다. In step S1040, the virtual measurement device 100 calculates and outputs a final predicted value having the same type and length as the label data of the time series data. For example, in step S1040, the virtual measurement device 100 has a (100 × 1) form output the final predicted value of .

도 10b는 가상 계측 장치(100)에서 기 학습된 학습 모델을 이용하여 특징 중요도를 산출하는 동작을 설명하기 위한 도면이다. FIG. 10B is a diagram for explaining an operation of calculating feature importance by using a pre-learned learning model in the virtual measurement apparatus 100 .

도 10b의 S1010 내지 S1030의 동작은 도 10a의 동작과 동일함에 따라 중복되는 설명의 기재는 생략하도록 한다. of Figure 10b Operations of S1010 to S1030 are the same as those of FIG. 10A , so description of overlapping descriptions will be omitted.

단계 S1030 및 단계 S1050에서, 가상 계측 장치(100)는 산출된 특징값을 기 학습된 학습 모델에 입력시키고, 기 학습된 학습 모델을 통해 특징값의 특징 중요도를 산출한다. 단계 S1030 및 단계 S1050은 학습 모델 처리부(720), 중요도 산출부(740)의 동작과 매칭될 수 있다. In steps S1030 and S1050, the virtual measurement device 100 inputs the calculated feature values to the pre-trained learning model, and calculates the feature importance of the feature values through the pre-learned learning model. Steps S1030 and S1050 may match operations of the learning model processing unit 720 and the importance calculating unit 740 .

단계 S1050에서, 가상 계측 장치(100)는 예측 시 해당 변수가 감소시킨 오차의 크기를 해당 변수 즉 특징값의 설명력으로 판단하고, 설명력에 따라 특징 중요도를 산출할 수 있다. In operation S1050 , the virtual measurement apparatus 100 may determine the magnitude of the error reduced by the corresponding variable during prediction as the explanatory power of the corresponding variable, that is, the feature value, and calculate the feature importance according to the explanatory power.

예를 들어, 단계 S1050에서, 가상 계측 장치(100)는 [표 1]과 같이, 특징값 및 특징 중요도를 산출할 수 있다. For example, in operation S1050 , the virtual measurement apparatus 100 may calculate a feature value and feature importance as shown in [Table 1].

Figure pat00005
Figure pat00005

도 10b에서, 단계 S1050은 단계 S1030 이후에 처리되는 것으로 기재하고 있으나 반드시 이에 한정되는 것은 아니며, 도 10a의 단계 S1040을 수행한 이후 추가로 수행될 수도 있다. In FIG. 10B , step S1050 is described as being processed after step S1030, but is not limited thereto, and may be additionally performed after step S1040 of FIG. 10A is performed.

이상의 설명은 본 발명의 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명의 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명의 실시예들은 본 발명의 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the embodiment of the present invention, and those of ordinary skill in the art to which the embodiment of the present invention pertains may modify various modifications and transformation will be possible. Accordingly, the embodiments of the present invention are not intended to limit the technical spirit of the embodiment of the present invention, but to explain, and the scope of the technical spirit of the embodiment of the present invention is not limited by these embodiments. The protection scope of the embodiment of the present invention should be construed by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the embodiment of the present invention.

10: 공정 제어 시스템
100: 가상 계측 장치 200: 공정 및 계측 장치
110: 입력부 120: 출력부
130: 프로세서 140: 메모리
150: 데이터 베이스
410: 시계열 데이터 획득부 420: 모델 학습 처리부
430: 가상 계측 처리부 440: 가상 계측 결과 출력부
10: Process control system
100: virtual metrology device 200: process and metrology device
110: input unit 120: output unit
130: processor 140: memory
150: database
410: time series data acquisition unit 420: model learning processing unit
430: virtual measurement processing unit 440: virtual measurement result output unit

Claims (13)

가상 계측 장치에서 가상 계측을 수행하는 방법에 있어서,
시계열 형태의 변수를 포함하는 시계열 데이터를 획득하는 시계열 데이터 획득 단계;
상기 시계열 데이터에 대한 특징값을 추출하고, 상기 특징값을 기반으로 학습용 예측값을 산출하여 학습 모델을 생성하는 모델 학습 처리 단계;
신규 시계열 데이터를 상기 학습 모델에 적용하여 가상 계측 결과를 산출하는 가상 계측 처리 단계; 및
상기 가상 계측 결과를 외부 장치로 제공하는 가상 계측 결과 출력 단계
를 포함하는 것을 특징으로 하는 가상 계측 방법.
A method for performing virtual measurement in a virtual measurement device, the method comprising:
a time series data obtaining step of obtaining time series data including time series type variables;
a model learning processing step of extracting a feature value for the time series data, calculating a prediction value for learning based on the feature value, and generating a learning model;
a virtual measurement processing step of calculating a virtual measurement result by applying new time series data to the learning model; and
Virtual measurement result output step of providing the virtual measurement result to an external device
Virtual measurement method comprising a.
제1항에 있어서,
상기 시계열 데이터 획득 단계는,
시계열 형태의 설명 변수 및 반응 변수를 포함하는 시계열 데이터를 획득하되, 상기 설명 변수는 단변량 또는 다변량에 대한 변수이며, 상기 반응 변수는 연속형 또는 범주형에 대한 변수이며,
상기 시계열 데이터는 학습 데이터 개수, 시계열 데이터 길이 및 시계열 변수의 개수 중 적어도 하나의 정보를 포함하는 것을 특징으로 하는 가상 계측 방법.
The method of claim 1,
The time series data acquisition step includes:
Acquire time series data including explanatory variables and response variables in a time series form, wherein the explanatory variable is a variable for univariate or multivariate, and the response variable is a variable for continuous or categorical type,
The time series data is a virtual measurement method, characterized in that it comprises at least one information of the number of training data, time series data length, and the number of time series variables.
제1항에 있어서,
상기 모델 학습 처리 단계는,
신경망을 통해 상기 시계열 데이터에 대한 특징값을 추출하는 특징값 추출 단계;
상기 특징값을 기반으로 학습용 예측값을 산출하는 예측값 산출 단계; 및
상기 학습용 예측값을 기반으로 가상 계측 처리를 위한 학습 모델을 생성하는 학습 모델 생성 단계
를 포함하는 것을 특징으로 하는 가상 계측 방법.
The method of claim 1,
The model learning processing step is,
a feature value extraction step of extracting feature values for the time series data through a neural network;
a prediction value calculation step of calculating a prediction value for learning based on the feature value; and
A learning model generation step of generating a learning model for virtual measurement processing based on the prediction value for learning
Virtual measurement method comprising a.
제3항에 있어서,
상기 예측값 산출 단계는,
상기 신경망을 기반으로 상기 특징값을 기반으로 제1 예측값을 산출하는 제1 예측값 산출 단계;
상기 특징값을 화이트 박스 알고리즘에 대입하여 제2 예측값을 산출하는 제2 예측값 산출 단계; 및
상기 제1 예측값과 상기 제2 예측값을 비교하여 유사도를 산출하고, 상기 유사도에 따른 가중치를 부여하여 학습용 예측값을 산출하는 학습용 예측값 산출 단계
를 포함하는 것을 특징으로 하는 가상 계측 방법.
4. The method of claim 3,
The prediction value calculation step is,
a first predicted value calculating step of calculating a first predicted value based on the feature value based on the neural network;
a second predicted value calculating step of calculating a second predicted value by substituting the feature value into a white box algorithm; and
A learning prediction value calculation step of calculating a similarity by comparing the first predicted value with the second predicted value, and calculating a learning predicted value by assigning a weight according to the similarity
Virtual measurement method comprising a.
제3항에 있어서,
상기 모델 학습 처리 단계는,
상기 학습용 예측값에 대한 에러값을 산출하는 에러값 산출 단계를 추가로 포함하며,
상기 학습 모델 생성 단계는,
상기 에러값과 기 설정된 임계치를 비교하여, 상기 에러값이 상기 임계치 이상인 경우 상기 특징값 추출을 위한 상기 신경망을 업데이트하는 동작을 반복하고, 상기 에러값이 상기 임계치 미만인 경우 상기 학습 모델을 생성하는 것을 특징으로 하는 가상 계측 방법.
4. The method of claim 3,
The model learning processing step is,
Further comprising an error value calculation step of calculating an error value for the prediction value for learning,
The learning model creation step is,
Comparing the error value with a preset threshold, repeating the operation of updating the neural network for extracting the feature value when the error value is greater than or equal to the threshold, and generating the learning model when the error value is less than the threshold Virtual measurement method characterized.
제1항에 있어서,
상기 가상 계측 처리 단계는,
신규 시계열 데이터를 획득하면, 상기 신규 시계열 데이터에 대한 특징값을 추출하는 특징값 추출 단계;
상기 학습 모델을 이용하여 가상 계측 결과를 산출하는 가상 계측 결과 산출 단계
를 포함하는 것을 특징으로 하는 가상 계측 방법.
The method of claim 1,
The virtual measurement processing step includes:
a feature value extraction step of extracting a feature value for the new time series data when new time series data is obtained;
A virtual measurement result calculation step of calculating a virtual measurement result using the learning model
Virtual measurement method comprising a.
제6항에 있어서,
상기 가상 계측 결과 산출 단계는,
상기 신규 시계열 데이터에 대한 특징값을 화이트 박스 알고리즘 기반의 상기 학습 모델에 적용하여 최종 예측값을 산출하고, 산출된 상기 최종 예측값을 포함하는 상기 가상 계측 결과를 생성하는 것을 특징으로 하는 가상 계측 방법.
7. The method of claim 6,
The virtual measurement result calculation step includes:
A virtual measurement method, characterized in that by applying the feature value of the new time series data to the learning model based on a white box algorithm, calculating a final predicted value, and generating the virtual measurement result including the calculated final predicted value.
제6항에 있어서,
상기 가상 계측 결과 산출 단계는,
상기 신규 시계열 데이터에 대한 특징값을 화이트 박스 알고리즘 기반의 상기 학습 모델에 적용하여 상기 특징값에 대한 오차 감소율에 따른 특징 중요도를 산출하고, 산출된 상기 특징 중요도를 포함하는 상기 가상 계측 결과를 생성하는 것을 특징으로 하는 가상 계측 방법.
7. The method of claim 6,
The step of calculating the virtual measurement result,
By applying the feature value for the new time series data to the learning model based on the white box algorithm, calculating the feature importance according to the error reduction rate for the feature value, and generating the virtual measurement result including the calculated feature importance Virtual measurement method, characterized in that.
가상 계측을 수행하는 장치로서,
적어도 하나 이상의 프로세서; 및 상기 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 메모리를 포함하며, 상기 프로그램들은 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서들에서,
시계열 형태의 변수를 포함하는 시계열 데이터를 획득하는 시계열 데이터 획득 단계;
상기 시계열 데이터에 대한 특징값을 추출하고, 상기 특징값을 기반으로 학습용 예측값을 산출하여 학습 모델을 생성하는 모델 학습 처리 단계;
신규 시계열 데이터를 상기 학습 모델에 적용하여 가상 계측 결과를 산출하는 가상 계측 처리 단계; 및
상기 가상 계측 결과를 외부 장치로 제공하는 가상 계측 결과 출력 단계
를 포함하는 동작들을 수행하게 하는 것을 특징으로 하는 가상 계측 장치.
A device for performing virtual metrology, comprising:
at least one processor; and a memory storing one or more programs executed by the processor, wherein the programs, when executed by the one or more processors, in the one or more processors;
a time series data obtaining step of obtaining time series data including time series type variables;
a model learning processing step of extracting a feature value for the time series data, calculating a prediction value for learning based on the feature value, and generating a learning model;
a virtual measurement processing step of calculating a virtual measurement result by applying new time series data to the learning model; and
Virtual measurement result output step of providing the virtual measurement result to an external device
A virtual metrology device, characterized in that it performs operations comprising:
제9항에 있어서,
상기 모델 학습 처리 단계는,
신경망을 통해 상기 시계열 데이터에 대한 특징값을 추출하는 특징값 추출 단계;
상기 특징값을 기반으로 학습용 예측값을 산출하는 예측값 산출 단계;
상기 학습용 예측값에 대한 에러값을 산출하는 에러값 산출 단계; 및
상기 에러값과 기 설정된 임계치를 비교하여, 상기 에러값이 상기 임계치 이상인 경우 상기 특징값 추출을 위한 상기 신경망을 업데이트하는 동작을 반복하고, 상기 에러값이 상기 임계치 미만인 경우 가상 계측 처리를 위한 학습 모델을 생성하는 학습 모델 생성 단계
를 포함하는 것을 특징으로 하는 가상 계측 장치.
10. The method of claim 9,
The model learning processing step is,
a feature value extraction step of extracting feature values for the time series data through a neural network;
a prediction value calculation step of calculating a prediction value for learning based on the feature value;
an error value calculation step of calculating an error value for the learning prediction value; and
Comparing the error value with a preset threshold, and repeating the operation of updating the neural network for extracting the feature value when the error value is greater than or equal to the threshold, and when the error value is less than the threshold, a learning model for virtual measurement processing Steps to create a learning model that creates
Virtual measurement device comprising a.
제10항에 있어서,
상기 예측값 산출 단계는,
상기 신경망을 기반으로 상기 특징값을 기반으로 제1 예측값을 산출하는 제1 예측값 산출 단계;
상기 특징값을 화이트 박스 알고리즘에 대입하여 제2 예측값을 산출하는 제2 예측값 산출 단계; 및
상기 제1 예측값과 상기 제2 예측값을 비교하여 유사도를 산출하고, 상기 유사도에 따른 가중치를 부여하여 학습용 예측값을 산출하는 학습용 예측값 산출 단계
를 포함하는 것을 특징으로 하는 가상 계측 장치.
11. The method of claim 10,
The predicted value calculation step is,
a first predicted value calculating step of calculating a first predicted value based on the feature value based on the neural network;
a second predicted value calculating step of calculating a second predicted value by substituting the feature value into a white box algorithm; and
A learning prediction value calculation step of calculating a similarity by comparing the first predicted value with the second predicted value, and calculating a learning predicted value by assigning a weight according to the similarity
Virtual measurement device comprising a.
제9항에 있어서,
상기 가상 계측 처리 단계는,
신규 시계열 데이터를 획득하면, 상기 신규 시계열 데이터에 대한 특징값을 추출하는 특징값 추출 단계;
상기 학습 모델을 이용하여 가상 계측 결과를 산출하는 가상 계측 결과 산출 단계
를 포함하는 것을 특징으로 하는 가상 계측 장치.
10. The method of claim 9,
The virtual measurement processing step includes:
a feature value extraction step of extracting a feature value for the new time series data when new time series data is obtained;
A virtual measurement result calculation step of calculating a virtual measurement result using the learning model
Virtual measurement device comprising a.
제12항에 있어서,
상기 가상 계측 결과 산출 단계는,
상기 신규 시계열 데이터에 대한 특징값을 화이트 박스 알고리즘 기반의 상기 학습 모델에 적용하여 최종 예측값을 산출하는 동작 및 상기 신규 시계열 데이터에 대한 특징값을 화이트 박스 알고리즘 기반의 상기 학습 모델에 적용하여 상기 특징값에 대한 오차 감소율에 따른 특징 중요도를 산출하는 동작 중 적어도 하나의 동작을 수행하여 상기 최종 예측값 및 상기 특징 중요도 중 적어도 하나를 포함하는 상기 가상 계측 결과를 생성하는 것을 특징으로 하는 가상 계측 장치.
13. The method of claim 12,
The step of calculating the virtual measurement result,
An operation of calculating a final predicted value by applying the feature value of the new time series data to the learning model based on the white box algorithm, and applying the feature value of the new time series data to the learning model based on the white box algorithm, the feature value and generating the virtual measurement result including at least one of the final predicted value and the feature importance by performing at least one of the operations of calculating the feature importance according to the error reduction rate.
KR1020200110112A 2020-08-31 2020-08-31 Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data KR102486460B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200110112A KR102486460B1 (en) 2020-08-31 2020-08-31 Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200110112A KR102486460B1 (en) 2020-08-31 2020-08-31 Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data

Publications (2)

Publication Number Publication Date
KR20220028724A true KR20220028724A (en) 2022-03-08
KR102486460B1 KR102486460B1 (en) 2023-01-09

Family

ID=80812891

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200110112A KR102486460B1 (en) 2020-08-31 2020-08-31 Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data

Country Status (1)

Country Link
KR (1) KR102486460B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240039729A (en) 2022-09-20 2024-03-27 고려대학교 산학협력단 Device and method for multivariate to multivariate time series forecasting using self-attention based convolutional autoencoder and temporal convolutional network

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090001148A (en) * 2007-06-29 2009-01-08 삼성전자주식회사 Virtual metrology system and virtual metrology method
KR20140011064A (en) * 2012-07-17 2014-01-28 서울과학기술대학교 산학협력단 Method for estimating reliability of virtual metrology prediction using novelty detection
WO2020111258A1 (en) * 2018-11-30 2020-06-04 東京エレクトロン株式会社 Virtual measurement device, virtual measurement method, and virtual measurement program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090001148A (en) * 2007-06-29 2009-01-08 삼성전자주식회사 Virtual metrology system and virtual metrology method
KR20140011064A (en) * 2012-07-17 2014-01-28 서울과학기술대학교 산학협력단 Method for estimating reliability of virtual metrology prediction using novelty detection
WO2020111258A1 (en) * 2018-11-30 2020-06-04 東京エレクトロン株式会社 Virtual measurement device, virtual measurement method, and virtual measurement program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240039729A (en) 2022-09-20 2024-03-27 고려대학교 산학협력단 Device and method for multivariate to multivariate time series forecasting using self-attention based convolutional autoencoder and temporal convolutional network

Also Published As

Publication number Publication date
KR102486460B1 (en) 2023-01-09

Similar Documents

Publication Publication Date Title
CN109697207A (en) The abnormality monitoring method and system of time series data
JP7304384B2 (en) Methods, apparatus, electronics, storage media, and computer program products for generating models
CN113411216B (en) Network flow prediction method based on discrete wavelet transform and FA-ELM
Hüttner et al. First response fire combat: Deep leaning based visible fire detection
US20210019456A1 (en) Accelerated simulation setup process using prior knowledge extraction for problem matching
CN111060652A (en) Method for predicting concentration of dissolved gas in transformer oil based on long-term and short-term memory network
Raymond et al. Genetic programming with rademacher complexity for symbolic regression
CN112420125A (en) Molecular attribute prediction method and device, intelligent equipment and terminal
KR102486460B1 (en) Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance Based on Feature Values of Time Series Data
CN112580288B (en) Semiconductor device characteristic modeling method and system based on multi-gradient neural network
CN113254729A (en) Multi-modal evolution characteristic automatic conformal representation method based on dynamic hypergraph network
US20200279148A1 (en) Material structure analysis method and material structure analyzer
KR102486461B1 (en) Method and Apparatus for Virtual Measurement for Calculating Predicted Value and Feature Importance by Time Series Section Based on Feature Values of Time Series Data
CN116703466A (en) System access quantity prediction method based on improved wolf algorithm and related equipment thereof
CN111695989A (en) Modeling method and platform of wind-control credit model
KR20220028727A (en) Method and Apparatus for Real Time Fault Detection Using Time series data According to Degradation
KR20220153365A (en) Method and apparatus for energy-aware deep neural network compression
Gelvez-Almeida et al. Parallel model of online sequential extreme learning machines for classification problems with large-scale databases
JP7462206B2 (en) Learning device, learning method, and learning program
Lazukhin et al. Investigation and Development of Recursive Neural Networks for the Analysis of Industrial Processes
US20230082140A1 (en) Relationship extraction apparatus, relationship extraction method, and program
US20230195842A1 (en) Automated feature engineering for predictive modeling using deep reinforcement learning
Zhou Research and Implementation of Specific Action Generation Model in Dance Video Based on Deep Learning Technology
Huang et al. Deep Time Series Sketching and Its Application on Industrial Time Series Clustering
Liang et al. Sub-trajectory clustering with deep reinforcement learning

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant