KR102532757B1 - Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor - Google Patents

Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor Download PDF

Info

Publication number
KR102532757B1
KR102532757B1 KR1020200123589A KR20200123589A KR102532757B1 KR 102532757 B1 KR102532757 B1 KR 102532757B1 KR 1020200123589 A KR1020200123589 A KR 1020200123589A KR 20200123589 A KR20200123589 A KR 20200123589A KR 102532757 B1 KR102532757 B1 KR 102532757B1
Authority
KR
South Korea
Prior art keywords
learning
model
data
boundary
output
Prior art date
Application number
KR1020200123589A
Other languages
Korean (ko)
Other versions
KR20220040651A (en
Inventor
김동철
강태욱
곽태진
Original Assignee
서강대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서강대학교산학협력단 filed Critical 서강대학교산학협력단
Priority to KR1020200123589A priority Critical patent/KR102532757B1/en
Publication of KR20220040651A publication Critical patent/KR20220040651A/en
Application granted granted Critical
Publication of KR102532757B1 publication Critical patent/KR102532757B1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/59Transmissivity
    • G01N21/5907Densitometers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

용존 가스 농도를 예측하기 위한 장치가 제공된다. 상기 장치는 수용액에 대한 라만 스펙트럼 데이터가 입력되면, 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 피크추출부와, 상기 피크 데이터를 기초로 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하고, 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 농도예측부를 포함한다. An apparatus for predicting dissolved gas concentration is provided. The apparatus includes a peak extraction unit for extracting peak data of a wavelength corresponding to a type of gas from the Raman spectrum data when Raman spectrum data for an aqueous solution is input, and a prediction model based on the peak data included in the aqueous solution. and a concentration predicting unit that calculates a predicted value of the gas concentration and derives and outputs the gas concentration from the calculated predicted value.

Description

라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치 및 이를 위한 방법{Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor}Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor}

본 발명은 용존 가스 농도를 예측 기술에 관한 것으로, 보다 상세하게는, 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치 및 이를 위한 방법에 관한 것이다. The present invention relates to a technique for predicting dissolved gas concentration, and more particularly, to an apparatus and method for predicting dissolved gas concentration in an aqueous solution based on a Raman spectroscopic signal.

라만 산란법은 고감도 검출 기술이라는 장점으로 인해 기존에 측정할 수 없었던 수용액 상의 소량의 가스(gas) 검출을 가능하게 한다. 하지만 가스의 농도와 라만 산란법의 라만 스펙트럼의 관계는 선형적이지 않고, 또한 그 관계를 쉽게 도출할 수 없다. 그러므로 기존에는 실험을 통해 도출한 라만 스펙트럼 데이터와 용존 가스의 농도 데이터를 1:1로 비교하여 그 관계를 도출하였다. 하지만 이러한 방법의 경우 수많은 실험 데이터베이스가 필요하다. The Raman scattering method enables the detection of a small amount of gas in an aqueous solution that could not be previously measured due to the advantage of a highly sensitive detection technology. However, the relationship between the gas concentration and the Raman spectrum of the Raman scattering method is not linear, and the relationship cannot be easily derived. Therefore, in the past, the Raman spectrum data derived through experiments and the concentration data of dissolved gas were compared 1:1 to derive the relationship. However, these methods require numerous experimental databases.

한국공개특허 제2001-0022918호 2001년 03월 26일 공개 (명칭: 실시간 개스 분석 방법 및 장치)Korean Patent Publication No. 2001-0022918 published on March 26, 2001 (Name: Real-time gas analysis method and device)

본 발명의 목적은 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치 및 이를 위한 방법을 제공함에 있다. An object of the present invention is to provide an apparatus and method for predicting the concentration of dissolved gas in an aqueous solution based on a Raman spectroscopic signal.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치는 수용액에 대한 라만 스펙트럼 데이터가 입력되면, 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 피크추출부와, 상기 피크 데이터를 기초로 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하고, 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 농도예측부를 포함한다. An apparatus for predicting the dissolved gas concentration of an aqueous solution based on a Raman spectroscopy signal according to a preferred embodiment of the present invention for achieving the above object is input when the Raman spectrum data for the aqueous solution is input, the concentration of the gas from the Raman spectrum data A peak extractor for extracting peak data of a wavelength corresponding to the type, calculating a predicted value of the gas concentration contained in the aqueous solution through a predictive model based on the peak data, and deriving and outputting the gas concentration from the calculated predicted value It includes a concentration prediction unit.

상기 장치는 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하고, 상기 학습 데이터 중 일부를 검사 데이터로 설정하고, 상기 학습 데이터를 이용하여 수용액에 포함된 가스 농도의 예측값을 산출하도록 예측모델을 학습시키고, 상기 검사 데이터를 이용하여 상기 학습 결과를 검사하는 모델생성부를 더 포함한다. The apparatus extracts learning peak data of a wavelength corresponding to the type of gas and gas concentration corresponding to the learning peak data from Raman spectrum data, which is experimental data, to prepare learning data, and sets some of the learning data as inspection data. and a model generator for learning a predictive model to calculate a predicted value of the gas concentration contained in the aqueous solution using the learning data, and examining the learning result using the test data.

상기 모델생성부는 상기 학습 데이터 및 상기 검사 데이터 각각의 정확도 양자 모두가 기 설정된 조건을 만족할 때까지 상기 예측모델의 은닉계층 및 은닉노드의 수를 조절하면서, 상기 학습 데이터를 이용한 상기 예측모델에 대한 학습과, 상기 검사 데이터를 이용한 상기 예측모델에 대한 학습 성과의 검사를 반복하는 것을 특징으로 한다. The model generator controls the number of hidden layers and hidden nodes of the predictive model until both the accuracy of each of the learning data and the test data satisfies a preset condition, while learning the predictive model using the learning data And, it is characterized in that the inspection of the learning performance for the predictive model using the inspection data is repeated.

상기 모델생성부는 상기 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 경계 레이블로 설정하고, 상기 학습용 피크 데이터를 예측모델에 입력하고, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면, 경계손실함수

Figure 112020101656791-pat00001
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계 최적화를 수행하고, 상기 Lboaderselected는 경계 손실함수이고, 상기 Oi는 상기 예측모델의 예측값이고, 상기 vi는 상기 출력값에 대응하는 경계 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 한다. The model generating unit converts the gas concentration corresponding to the learning peak data into a one-hot encoding vector based on a predetermined boundary value, sets it as a boundary label, inputs the learning peak data into a prediction model, and the prediction model converts the learning peak data into a prediction model. If a prediction value is calculated by performing a plurality of operations in which a plurality of inter-layer weights are applied to the peak data, the boundary loss function
Figure 112020101656791-pat00001
According to , boundary optimization is performed to modify the weight of the prediction model so that the boundary loss, which is the difference between the predicted value, which is the output of the prediction model, and the boundary label, is minimized, the Lboaderselected is a boundary loss function, and the Oi is the prediction model A prediction value, vi is a boundary label corresponding to the output value, and i is an index corresponding to an output node of an output layer of the prediction model.

상기 모델생성부는 기 설정된 경계값을 기준으로 학습용 피크 데이터에 대응하는 가스 농도를 원핫인코딩 벡터로 변환하여 상기 경계레이블로 설정하고, 상기 학습용 피크 데이터의 은닉벡터에 대응하는 기준벡터를 증강 레이블로 설정하고, 상기 학습용 피크 데이터를 예측모델에 입력하고, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 마지막 은닉계층의 복수의 은닉노드의 출력값과, 출력층의 출력인 예측값을 산출하면, 경계증강손실함수

Figure 112020101656791-pat00002
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계 손실 및 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계증강 최적화를 수행하고, 상기 Lboaderenhanced는 경계증강 손실함수이고, 상기 Oi는 상기 예측모델의 출력층의 출력인 예측값이고, 상기 vi는 상기 예측값에 대응하는 경계 레이블이고, 상기 hij는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값이고, 상기 rij는 상기 복수의 은닉노드의 출력값에 대응하는 증강 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이고, 상기 j는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드에 대응하는 인덱스인 것을 특징으로 한다. The model generator converts the gas concentration corresponding to the peak data for learning into a one-hot encoding vector based on the preset boundary value, sets it as the boundary label, and sets the reference vector corresponding to the hidden vector of the peak data for learning as an augmented label and inputs the peak data for learning to a prediction model, and the prediction model performs a plurality of operations in which a weight between a plurality of layers is applied to the peak data for learning, and output values of a plurality of hidden nodes of the last hidden layer and an output layer If the predicted value, which is the output of , is calculated, the boundary augmentation loss function
Figure 112020101656791-pat00002
According to the boundary enhancement loss, including the boundary loss that is the difference between the predicted value and the boundary label, which is the output of the prediction model, and the enhancement loss representing the difference between the output value of a plurality of hidden nodes of the last hidden layer of the prediction model and the augmented label, Minimum Boundary enhancement optimization is performed to modify the weight of the predictive model so that Lboaderenhanced is a boundary enhancement loss function, Oi is a predicted value that is an output of the output layer of the predictive model, and vi is a boundary label corresponding to the predicted value. , wherein hij is an output value of a plurality of hidden nodes of the last hidden layer of the prediction model, rij is an augmentation label corresponding to an output value of the plurality of hidden nodes, and i is an output node of an output layer of the prediction model a corresponding index, and j is an index corresponding to a plurality of hidden nodes of the last hidden layer of the prediction model.

상기 모델생성부는 상기 학습용 피크 데이터에 대응하는 가스 농도를 수치 레이블로 설정하고, 상기 학습용 피크 데이터를 예측모델에 입력하고, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면, 상기 예측모델의 상기 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하는 것을 특징으로 한다. The model generator sets the gas concentration corresponding to the learning peak data as a numerical label, inputs the learning peak data to a prediction model, and the prediction model applies a plurality of inter-layer weights to the learning peak data. When a predictive value is calculated by performing the operation of the predictive model, numerical optimization is performed to modify the weight of the predictive model so that the numerical loss, which is the difference between the predicted value and the numerical label of the predictive model, is minimized.

상기 모델생성부는 수치손실함수

Figure 112020101656791-pat00003
에 따라 상기 예측모델의 출력값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하며, 상기 Lvaule는 수치손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 Ci는 상기 예측값에 대응하는 수치 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 한다. The model generator is a numerical loss function
Figure 112020101656791-pat00003
Numerical optimization is performed to modify the weight of the predictive model so that the numerical loss, which is the difference between the output value of the predictive model and the numerical label, is minimized according to A prediction value, Ci is a numerical label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model.

상기 가스가 CO이면, 상기 파장은 1948

Figure 112020101656791-pat00004
및 2063
Figure 112020101656791-pat00005
이고, 상기 가스가 아세트산염(Acetate)이면 상기 파장은 928
Figure 112020101656791-pat00006
이고, 상기 가스가 낙산염(Butyrate)이면, 상기 파장은 877
Figure 112020101656791-pat00007
인 것을 특징으로 한다. If the gas is CO, the wavelength is 1948
Figure 112020101656791-pat00004
and 2063
Figure 112020101656791-pat00005
, and if the gas is acetate, the wavelength is 928
Figure 112020101656791-pat00006
, and if the gas is butyrate, the wavelength is 877
Figure 112020101656791-pat00007
It is characterized by being

상기 장치는 수용액에 내에 프로브를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 취득하고, 취득한 라만 스펙트럼 데이터를 제공하는 스펙트럼측정부를 더 포함한다. The apparatus further includes a spectrum measuring unit configured to emit light through a probe in the aqueous solution, measure scattering of the emitted light, acquire Raman spectrum data, and provide the acquired Raman spectrum data.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치는 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하고, 상기 학습 데이터를 이용하여 수용액에 포함된 가스 농도의 예측값을 산출하도록 인공신경망 알고리즘인 예측모델을 학습시키는 모델생성부를 포함한다. An apparatus for predicting the concentration of dissolved gas in an aqueous solution based on a Raman spectroscopic signal according to a preferred embodiment of the present invention for achieving the above object is for learning the wavelength corresponding to the type of gas from Raman spectral data, which is experimental data. A model generator for learning a predictive model, which is an artificial neural network algorithm, to prepare learning data by extracting peak data and a gas concentration corresponding to the peak data for learning, and using the learning data to calculate a predicted value of the gas concentration contained in the aqueous solution include

상기 모델생성부는 상기 학습용 피크 데이터에 대응하는 가스 농도를 수치 레이블로 설정하고, 상기 학습용 피크 데이터를 예측모델에 입력하고, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면, 상기 예측모델의 상기 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하는 것을 특징으로 한다. The model generator sets the gas concentration corresponding to the learning peak data as a numerical label, inputs the learning peak data to a prediction model, and the prediction model applies a plurality of inter-layer weights to the learning peak data. When a predictive value is calculated by performing the operation of the predictive model, numerical optimization is performed to modify the weight of the predictive model so that the numerical loss, which is the difference between the predicted value and the numerical label of the predictive model, is minimized.

상기 모델생성부는 수치손실함수

Figure 112020101656791-pat00008
에 따라 상기 예측모델의 출력값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하며, 상기 Lvaule는 수치 손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 Ci는 상기 예측값에 대응하는 수치 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 한다. The model generator is a numerical loss function
Figure 112020101656791-pat00008
Numerical optimization is performed to modify the weight of the predictive model so that the numerical loss, which is the difference between the output value of the predictive model and the numerical label, is minimized according to A prediction value, Ci is a numerical label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model.

상기 모델생성부는 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 경계 레이블로 설정하고, 상기 학습용 피크 데이터를 예측모델에 입력하고, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면, 경계손실함수

Figure 112020101656791-pat00009
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계 최적화를 수행하고, 상기 Lboaderselected는 경계 손실함수이고, 상기 Oi는 상기 예측모델의 예측값이고, 상기 vi는 상기 출력값에 대응하는 경계 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 한다. The model generating unit converts the gas concentration corresponding to the learning peak data into a one-hot encoding vector based on a preset boundary value, sets it as a boundary label, inputs the learning peak data into a prediction model, and the prediction model converts the learning peak data into a prediction model. If a predicted value is calculated by performing a plurality of operations in which a plurality of inter-layer weights are applied to the data, the boundary loss function
Figure 112020101656791-pat00009
According to , boundary optimization is performed to modify the weight of the prediction model so that the boundary loss, which is the difference between the predicted value, which is the output of the prediction model, and the boundary label, is minimized, the Lboaderselected is a boundary loss function, and the Oi is the prediction model A prediction value, vi is a boundary label corresponding to the output value, and i is an index corresponding to an output node of an output layer of the prediction model.

상기 모델생성부는 기 설정된 경계값을 기준으로 학습용 피크 데이터에 대응하는 가스 농도를 원핫인코딩 벡터로 변환하여 상기 경계레이블로 설정하고, 상기 학습용 피크 데이터의 은닉벡터에 대응하는 기준벡터를 증강 레이블로 설정하고, 상기 학습용 피크 데이터를 예측모델에 입력하고, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 마지막 은닉계층의 복수의 은닉노드의 출력값과, 출력층의 출력인 예측값을 산출하면, 경계증강손실함수

Figure 112020101656791-pat00010
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계 손실 및 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계증강 최적화를 수행하고, 상기 Lboaderenhanced는 경계증강 손실함수이고, 상기 Oi는 상기 예측모델의 출력층의 출력인 예측값이고, 상기 vi는 상기 예측값에 대응하는 경계 레이블이고, 상기 hij는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값이고, 상기 rij는 상기 복수의 은닉노드의 출력값에 대응하는 증강 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이고, 상기 j는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드에 대응하는 인덱스인 것을 특징으로 한다. The model generator converts the gas concentration corresponding to the peak data for learning into a one-hot encoding vector based on the preset boundary value, sets it as the boundary label, and sets the reference vector corresponding to the hidden vector of the peak data for learning as an augmented label and inputs the peak data for learning to a prediction model, and the prediction model performs a plurality of operations in which a weight between a plurality of layers is applied to the peak data for learning, and output values of a plurality of hidden nodes of the last hidden layer and an output layer If the predicted value, which is the output of , is calculated, the boundary augmentation loss function
Figure 112020101656791-pat00010
According to the boundary enhancement loss, including the boundary loss that is the difference between the predicted value and the boundary label, which is the output of the prediction model, and the enhancement loss representing the difference between the output value of a plurality of hidden nodes of the last hidden layer of the prediction model and the augmented label, Minimum Boundary enhancement optimization is performed to modify the weight of the predictive model so that Lboaderenhanced is a boundary enhancement loss function, Oi is a predicted value that is an output of the output layer of the predictive model, and vi is a boundary label corresponding to the predicted value. , wherein hij is an output value of a plurality of hidden nodes of the last hidden layer of the prediction model, rij is an augmentation label corresponding to an output value of the plurality of hidden nodes, and i is an output node of an output layer of the prediction model a corresponding index, and j is an index corresponding to a plurality of hidden nodes of the last hidden layer of the prediction model.

상기 모델생성부는 상기 학습 데이터 및 상기 검사 데이터 각각의 정확도 양자 모두가 기 설정된 조건을 만족할 때까지 상기 예측모델의 은닉계층 및 은닉노드의 수를 조절하면서, 상기 학습 데이터를 이용한 상기 예측모델에 대한 학습과, 상기 검사 데이터를 이용한 상기 예측모델에 대한 학습 성과의 검사를 반복하는 것을 특징으로 한다. The model generator controls the number of hidden layers and hidden nodes of the predictive model until both the accuracy of each of the learning data and the test data satisfies a preset condition, while learning the predictive model using the learning data And, it is characterized in that the inspection of the learning performance for the predictive model using the inspection data is repeated.

상기 장치는 수용액에 내에 프로브를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 취득하고, 취득한 라만 스펙트럼 데이터를 제공하는 스펙트럼측정부와, 상기 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 피크추출부와, 상기 피크 데이터를 기초로 상기 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하고, 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 농도예측부를 더 포함한다. The device emits light through a probe in an aqueous solution, measures the scattering of the emitted light, acquires Raman spectrum data, and provides a spectrum measurement unit for providing the acquired Raman spectrum data, and a gas measurement unit from the Raman spectrum data. A peak extractor for extracting peak data of a wavelength corresponding to the type; and based on the peak data, a predicted value of the gas concentration contained in the aqueous solution is calculated through the prediction model, and the gas concentration is derived and output from the calculated predicted value. It further includes a concentration prediction unit to.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 방법은 스펙트럼측정부가 수용액에 내에 프로브를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 취득하는 단계와, 피크추출부가 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 단계와, 농도예측부가 상기 피크 데이터를 기초로 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하는 단계와, 상기 농도예측부가 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 단계를 포함한다. A method for predicting the dissolved gas concentration of an aqueous solution based on a Raman spectroscopy signal according to a preferred embodiment of the present invention for achieving the above object is to emit light through a probe in the aqueous solution by the spectrum measuring unit, Acquiring Raman spectrum data by measuring the scattering of light, extracting peak data of a wavelength corresponding to the type of gas from the Raman spectrum data by a peak extraction unit, and predicting by a concentration prediction unit based on the peak data Calculating a predicted value of the gas concentration included in the aqueous solution through a model, and deriving and outputting a gas concentration from the predicted value calculated by the concentration predicting unit.

상기 방법은 상기 라만 스펙트럼 데이터를 취득하는 단계 전, 상기 모델생성부가 실험 데이터로부터 학습 데이터 및 검사 데이터를 추출하는 단계와, 상기 모델생성부가 상기 예측모델의 은닉계층 및 은닉노드의 수를 설정하는 단계와, 상기 모델생성부가 상기 학습 데이터를 이용하여 설정된 수의 은닉계층 및 은닉노드를 가지는 예측모델에 대한 학습을 수행하고, 상기 검사 데이터를 이용하여 예측모델(PM)의 학습 성과를 검사하고, 상기 모델생성부가 상기 학습 데이터의 정확도 및 상기 검사 데이터의 정확도를 산출하는 단계와, 상기 모델생성부가 상기 학습 데이터 정확도가 상기 검사 데이터의 정확도 보다 높으면서 상기 학습 데이터 정확도 및 상기 검사 데이터의 정확도 양자 모두가 임계치 이상인 조건을 만족하는지 여부를 판별하는 단계와, 상기 판별 결과, 상기 조건을 만족하면, 상기 모델생성부가 현재 설정에 따라 은닉계층 및 은닉노드의 수를 결정하는 단계를 포함한다. The method includes extracting learning data and inspection data from experimental data by the model generator before acquiring the Raman spectrum data, and setting the number of hidden layers and hidden nodes of the predictive model by the model generator. And, the model generator performs learning on a predictive model having a set number of hidden layers and hidden nodes using the training data, and checks the learning performance of the predictive model (PM) using the test data, Calculating, by a model generator, the accuracy of the training data and the accuracy of the test data, wherein the accuracy of the training data and the accuracy of the test data are both higher than the accuracy of the test data by the model generator and reach a threshold value Determining whether a condition equal to or above is satisfied, and if the condition is satisfied as a result of the determination, determining, by the model generating unit, the number of hidden layers and hidden nodes according to a current setting.

또한, 상기 방법은 상기 조건을 만족하는지 여부를 판별하는 단계후, 상기 판별 결과, 상기 조건을 만족하지 않으면, 상기 모델생성부가 은닉계층 및 은닉노드의 수를 재설정한 후, 상기 정확도를 산출하는 단계 및 상기 조건을 만족하는지 여부를 판별하는 단계를 반복하는 단계를 더 포함한다. In addition, after the step of determining whether the condition is satisfied, if the condition is not satisfied as a result of the determination, the model generating unit resets the number of hidden layers and hidden nodes, and then calculating the accuracy and repeating the step of determining whether the condition is satisfied.

상기 방법은 상기 라만 스펙트럼 데이터를 취득하는 단계 전, 상기 모델생성부가 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터에 대응하는 가스 농도를 수치 레이블로 설정하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계와, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하는 단계와, 상기 모델생성부가 상기 예측모델의 상기 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하는 단계를 더 포함한다. In the method, before the step of acquiring the Raman spectrum data, the model generator extracts learning peak data of a wavelength corresponding to the type of gas and gas concentration corresponding to the learning peak data from Raman spectrum data, which is experimental data, and extracts learning data. preparing a gas concentration corresponding to the learning peak data as a numerical label, the model generating unit inputting the learning peak data into a predictive model, and the predictive model Calculating a predicted value by performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning, and the model generating unit making the prediction such that the numerical loss, which is the difference between the predicted value and the numerical label of the predictive model, is minimized. and performing numerical optimization to modify the weights of the model.

상기 수치 최적화를 수행하는 단계는 상기 모델생성부가 수치손실함수

Figure 112020101656791-pat00011
에 따라 상기 예측모델의 출력값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하며, 상기 Lvalue는 수치손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 Ci는 상기 예측값에 대응하는 수치 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 한다. The step of performing the numerical optimization is a numerical loss function by the model generator
Figure 112020101656791-pat00011
Numerical optimization is performed to modify the weight of the predictive model so that the numerical loss, which is the difference between the output value of the predictive model and the numerical label, is minimized according to A prediction value, Ci is a numerical label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model.

상기 라만 스펙트럼 데이터를 취득하는 단계 전, 상기 모델생성부가 상기 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 경계 레이블로 설정하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계와, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하는 단계와, 상기 모델생성부가 경계손실함수

Figure 112020101656791-pat00012
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계 최적화를 수행하는 단계를 더 포함한다. 여기서, 상기 Lboaderselected는 경계 손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 vi는 상기 예측값에 대응하는 경계 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이다. Before acquiring the Raman spectrum data, the model generating unit converts the gas concentration corresponding to the learning peak data into a one-hot encoding vector based on a predetermined boundary value and sets it as a boundary label; The step of inputting peak data for learning into a predictive model, the step of calculating a predicted value by the predictive model performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning, and the boundary loss function performed by the model generator
Figure 112020101656791-pat00012
The method further includes performing boundary optimization of modifying weights of the prediction model so that boundary loss, which is a difference between a predicted value output from the prediction model and a boundary label, is minimized according to the prediction model. Here, Lboaderselected is a boundary loss function, Oi is a prediction value that is an output of the prediction model, vi is a boundary label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model. .

상기 방법은 상기 경계 최적화를 수행하는 단계 후, 상기 모델생성부가 기 설정된 경계값을 기준으로 학습용 피크 데이터에 대응하는 가스 농도를 원핫인코딩 벡터로 변환하여 상기 경계레이블로 설정하고, 상기 학습용 피크 데이터의 은닉벡터에 대응하는 기준벡터를 증강 레이블로 설정하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계와, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 마지막 은닉계층의 복수의 은닉노드의 출력값과, 출력층의 출력인 예측값을 산출하는 단계와, 상기 모델생성부가 경계증강손실함수

Figure 112020101656791-pat00013
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계 손실 및 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계증강 최적화를 수행하는 단계를 더 포함한다. 여기서, 상기 Lboaderenhanced는 경계증강 손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 vi는 상기 예측값에 대응하는 경계 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이고, 상기 hij는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값이고, 상기 rij는 상기 복수의 은닉노드의 출력값에 대응하는 증강 레이블이고, 상기 j는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드에 대응하는 인덱스인 것을 특징으로 한다. In the method, after the step of performing the boundary optimization, the model generating unit converts the gas concentration corresponding to the peak data for learning into a one-hot encoding vector based on the preset boundary value, sets it as the boundary label, and sets the peak data for learning. Setting a reference vector corresponding to a hidden vector as an augmented label, inputting the peak data for learning by the model generator to a prediction model, and applying a weight between a plurality of layers to the peak data for learning by the prediction model Calculating the output values of the plurality of hidden nodes of the last hidden layer and the predicted value that is the output of the output layer by performing a plurality of operations, and the model generator performs a boundary enhancement loss function
Figure 112020101656791-pat00013
According to the boundary enhancement loss, including the boundary loss that is the difference between the predicted value and the boundary label, which is the output of the prediction model, and the enhancement loss representing the difference between the output value of a plurality of hidden nodes of the last hidden layer of the prediction model and the augmented label, Minimum and performing boundary enhancement optimization of modifying the weights of the predictive model so that Here, Lboaderenhanced is a boundary enhancement loss function, Oi is a prediction value that is an output of the prediction model, vi is a boundary label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model. , wherein hij is an output value of a plurality of hidden nodes of the last hidden layer of the prediction model, rij is an augmentation label corresponding to the output value of the plurality of hidden nodes, and j is a plurality of the last hidden layer of the prediction model It is characterized in that the index corresponding to the hidden node of.

여기서, 상기 가스가 CO이면, 상기 파장은 1948

Figure 112020101656791-pat00014
및 2063
Figure 112020101656791-pat00015
이고, 상기 가스가 아세트산염(Acetate)이면 상기 파장은 928
Figure 112020101656791-pat00016
이고, 상기 가스가 낙산염(Butyrate)이면, 상기 파장은 877
Figure 112020101656791-pat00017
인 것을 특징으로 한다. Here, if the gas is CO, the wavelength is 1948
Figure 112020101656791-pat00014
and 2063
Figure 112020101656791-pat00015
, and if the gas is acetate, the wavelength is 928
Figure 112020101656791-pat00016
, and if the gas is butyrate, the wavelength is 877
Figure 112020101656791-pat00017
It is characterized by being

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 방법은 상기 모델생성부가 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터에 대응하는 가스 농도를 수치 레이블로 설정하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계와, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하는 단계와, 상기 모델생성부가 상기 예측모델의 상기 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하는 단계를 더 포함한다. A method for predicting the concentration of dissolved gas in an aqueous solution based on a Raman spectroscopy signal according to a preferred embodiment of the present invention for achieving the above object is the model generating unit corresponding to the type of gas from Raman spectral data, which is experimental data. preparing learning data by extracting peak data for learning of a wavelength of a wavelength and a gas concentration corresponding to the peak data for learning, and setting the gas concentration corresponding to the peak data for learning as a numerical label by the model generator; The step of inputting the peak data for learning into a predictive model by a model generator, the step of calculating a predictive value by performing a plurality of calculations in which a weight between a plurality of layers is applied to the peak data for the predictive model, and generating the model The method may further include performing numerical optimization of modifying a weight of the predictive model so that a numerical loss, which is a difference between the predicted value and the numerical label of the predictive model, is minimized.

상기 수치 최적화를 수행하는 단계는 상기 모델생성부가 수치손실함수

Figure 112020101656791-pat00018
에 따라 상기 예측모델의 출력값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하며, 상기 Lvalue는 수치손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 Ci는 상기 예측값에 대응하는 수치 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 한다. The step of performing the numerical optimization is a numerical loss function by the model generator
Figure 112020101656791-pat00018
Numerical optimization is performed to modify the weight of the predictive model so that the numerical loss, which is the difference between the output value of the predictive model and the numerical label, is minimized according to A prediction value, Ci is a numerical label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model.

상기 방법은 학습 데이터를 마련하는 단계 후, 상기 가스 농도를 수치 레이블로 설정하는 단계 전, 상기 모델생성부가 상기 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 경계 레이블로 설정하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계와, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하는 단계와, 상기 모델생성부가 경계손실함수

Figure 112020101656791-pat00019
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계 최적화를 수행하는 단계를 더 포함한다. 여기서, 상기 Lboaderselected는 경계 손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 vi는 상기 예측값에 대응하는 경계 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이다. In the method, after the step of preparing learning data and before the step of setting the gas concentration as a numerical label, the model generator converts the gas concentration corresponding to the peak data for learning into a one-hot encoding vector based on a preset boundary value, The step of setting a boundary label, the step of inputting the peak data for learning by the model generation unit to a prediction model, and the step of the prediction model performing a plurality of calculations in which weights between a plurality of layers are applied to the peak data for learning, thereby predicting a predicted value. Calculating, and the model generator boundary loss function
Figure 112020101656791-pat00019
The method further includes performing boundary optimization of modifying weights of the prediction model so that boundary loss, which is a difference between a predicted value output from the prediction model and a boundary label, is minimized according to the prediction model. Here, Lboaderselected is a boundary loss function, Oi is a prediction value that is an output of the prediction model, vi is a boundary label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model. .

상기 방법은 상기 경계 최적화를 수행하는 단계 후, 상기 모델생성부가 기 설정된 경계값을 기준으로 학습용 피크 데이터에 대응하는 가스 농도를 원핫인코딩 벡터로 변환하여 상기 경계레이블로 설정하고, 상기 학습용 피크 데이터의 은닉벡터에 대응하는 기준벡터를 증강 레이블로 설정하는 단계와, 상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계와, 상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 마지막 은닉계층의 복수의 은닉노드의 출력값과, 출력층의 출력인 예측값을 산출하는 단계와, 상기 모델생성부가 경계증강손실함수

Figure 112020101656791-pat00020
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계 손실 및 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계증강 최적화를 수행하는 단계를 더 포함한다. 여기서, 상기 Lboaderenhanced는 경계증강 손실함수이고, 상기 Oi는 상기 예측모델의 출력인 예측값이고, 상기 vi는 상기 예측값에 대응하는 경계 레이블이고, 상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이고, 상기 hij는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값이고, 상기 rij는 상기 복수의 은닉노드의 출력값에 대응하는 증강 레이블이고, 상기 j는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드에 대응하는 인덱스이다. In the method, after the step of performing the boundary optimization, the model generating unit converts the gas concentration corresponding to the peak data for learning into a one-hot encoding vector based on the preset boundary value, sets it as the boundary label, and sets the peak data for learning. Setting a reference vector corresponding to a hidden vector as an augmented label, inputting the peak data for learning by the model generator to a prediction model, and applying a weight between a plurality of layers to the peak data for learning by the prediction model Calculating the output values of the plurality of hidden nodes of the last hidden layer and the predicted value that is the output of the output layer by performing a plurality of operations, and the model generator performs a boundary enhancement loss function
Figure 112020101656791-pat00020
According to the boundary enhancement loss, including the boundary loss that is the difference between the predicted value and the boundary label, which is the output of the prediction model, and the enhancement loss representing the difference between the output value of a plurality of hidden nodes of the last hidden layer of the prediction model and the augmented label, Minimum and performing boundary enhancement optimization of modifying the weights of the predictive model so that Here, Lboaderenhanced is a boundary enhancement loss function, Oi is a prediction value that is an output of the prediction model, vi is a boundary label corresponding to the prediction value, and i is an index corresponding to an output node of an output layer of the prediction model. , wherein hij is an output value of a plurality of hidden nodes of the last hidden layer of the prediction model, rij is an augmentation label corresponding to the output value of the plurality of hidden nodes, and j is a plurality of the last hidden layer of the prediction model It is an index corresponding to the hidden node of .

상기 방법은 상기 수치 최적화를 수행하는 단계 후, 스펙트럼측정부가 수용액에 내에 프로브를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 취득하는 단계와, 피크추출부가 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 단계와, 농도예측부가 상기 피크 데이터를 기초로 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하는 단계와, 상기 농도예측부가 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 단계를 더 포함한다. The method includes: after the step of performing the numerical optimization, the spectrum measuring unit emits light through a probe in the aqueous solution, and the emitted light is scattered to obtain Raman spectrum data, and the peak extraction unit acquires Raman spectrum data. Extracting peak data of a wavelength corresponding to the type of gas from data; calculating, by a concentration predicting unit, a predicted value of the gas concentration included in the aqueous solution through a prediction model based on the peak data; The method further includes deriving and outputting the gas concentration from the calculated predicted value.

본 발명에 따르면, 라만 분광 신호의 특정 파장의 증폭량을 기초로 머신러닝을 통해 수용액의 용존 가스 농도를 정확하게 예측할 수 있다. 이에 따라, 용존 가스 농도를 실시간으로 획득할 수 있다. According to the present invention, the dissolved gas concentration of the aqueous solution can be accurately predicted through machine learning based on the amplification amount of a specific wavelength of the Raman spectroscopy signal. Accordingly, the dissolved gas concentration can be obtained in real time.

도 1은 본 발명의 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치의 구성을 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 라만 스펙트럼 데이터로부터 수용액의 농도를 예측하는 예측부의 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 실시예에 따른 가스 농도를 예측하는 예측모델의 구성을 설명하기 위한 도면이다.
도 4는 본 발명의 실시예에 따른 가스 농도를 예측하는 예측모델의 노드를 설명하기 위한 도면이다.
도 5는 본 발명의 실시예에 따른 예측모델의 원형을 생성하는 방법을 설명하기 위한 흐름도이다.
도 6은 본 발명의 실시예에 따른 예측모델의 원형을 생성하는 방법을 설명하기 위한 그래프이다.
도 7은 본 발명의 실시예에 따른 예측모델에 대한 학습 방법에 대해서 설명하기 위한 흐름도이다.
도 8은 본 발명의 실시예에 따른 실험 데이터에서 아세트산염 및 낙산염이 포함된 수용액에 대한 라만 스펙트럼 데이터를 나타내는 그래프이다.
도 9는 본 발명의 실시예에 따른 실험 데이터에서 아세트산염 및 낙산염의 혼합물 및 일산화탄소가 포함된 수용액에 대한 라만 스펙트럼 데이터를 나타내는 그래프이다.
도 10은 본 발명의 실시예에 따른 실험 데이터에서 수용액에 포함된 가스의 농도가 알려진 라만 스펙트럼 데이터를 나타내는 그래프이다.
도 11은 본 발명의 실시예에 따른 예측모델에 대한 경계학습을 설명하기 위한 흐름도이다.
도 12는 본 발명의 실시예에 따른 예측모델에 대한 경계학습을 설명하기 위한 도면이다.
도 13은 본 발명의 실시예에 따른 예측모델에 대한 수치학습을 설명하기 위한 흐름도이다.
도 14는 본 발명의 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 방법을 설명하기 위한 흐름도이다.
도 15는 본 발명의 실시예에 따른 컴퓨팅 장치를 나타내는 도면이다.
1 is a diagram for explaining the configuration of an apparatus for predicting the dissolved gas concentration of an aqueous solution based on a Raman spectroscopy signal according to an embodiment of the present invention.
2 is a block diagram for explaining the configuration of a prediction unit for predicting the concentration of an aqueous solution from Raman spectrum data according to an embodiment of the present invention.
3 is a diagram for explaining the configuration of a prediction model for predicting gas concentration according to an embodiment of the present invention.
4 is a diagram for explaining nodes of a prediction model for predicting gas concentration according to an embodiment of the present invention.
5 is a flowchart for explaining a method of generating a prototype of a predictive model according to an embodiment of the present invention.
6 is a graph for explaining a method of generating a prototype of a predictive model according to an embodiment of the present invention.
7 is a flowchart for explaining a method for learning a predictive model according to an embodiment of the present invention.
8 is a graph showing Raman spectrum data for an aqueous solution containing acetate and butyrate in experimental data according to an embodiment of the present invention.
9 is a graph showing Raman spectrum data for an aqueous solution containing a mixture of acetate and butyrate and carbon monoxide in experimental data according to an embodiment of the present invention.
10 is a graph showing Raman spectrum data in which the concentration of gas contained in an aqueous solution is known in experimental data according to an embodiment of the present invention.
11 is a flowchart illustrating boundary learning for a predictive model according to an embodiment of the present invention.
12 is a diagram for explaining boundary learning for a predictive model according to an embodiment of the present invention.
13 is a flowchart for explaining numerical learning for a predictive model according to an embodiment of the present invention.
14 is a flowchart for explaining a method for predicting a dissolved gas concentration in an aqueous solution based on a Raman spectroscopy signal according to an embodiment of the present invention.
15 is a diagram illustrating a computing device according to an embodiment of the present invention.

본 발명의 상세한 설명에 앞서, 이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 실시예에 불과할 뿐, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다. Prior to the detailed description of the present invention, the terms or words used in this specification and claims described below should not be construed as being limited to a common or dictionary meaning, and the inventors should use their own invention in the best way. It should be interpreted as a meaning and concept corresponding to the technical idea of the present invention based on the principle that it can be properly defined as a concept of a term for explanation. Therefore, the embodiments described in this specification and the configurations shown in the drawings are only the most preferred embodiments of the present invention, and do not represent all of the technical ideas of the present invention, so various equivalents that can replace them at the time of the present application. It should be understood that there may be water and variations.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 이때, 첨부된 도면에서 동일한 구성 요소는 가능한 동일한 부호로 나타내고 있음을 유의해야 한다. 또한, 본 발명의 요지를 흐리게 할 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략할 것이다. 마찬가지의 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 또는 개략적으로 도시되었으며, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. At this time, it should be noted that the same components in the accompanying drawings are indicated by the same reference numerals as much as possible. In addition, detailed descriptions of well-known functions and configurations that may obscure the gist of the present invention will be omitted. For the same reason, some components in the accompanying drawings are exaggerated, omitted, or schematically illustrated, and the size of each component does not entirely reflect the actual size.

먼저, 본 발명의 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치에 대해서 설명하기로 한다. 도 1은 본 발명의 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치의 구성을 설명하기 위한 도면이다. 도 1을 참조하면, 본 발명의 실시예에 따른 라라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치(PA: Prediction Apparatus, 이하, '예측장치'로 축약함)는 프로브(11)를 포함하는 스펙트럼측정부(10)와, 예측부(20)를 포함한다. First, an apparatus for predicting the dissolved gas concentration of an aqueous solution based on a Raman spectroscopy signal according to an embodiment of the present invention will be described. 1 is a diagram for explaining the configuration of an apparatus for predicting the dissolved gas concentration of an aqueous solution based on a Raman spectroscopy signal according to an embodiment of the present invention. Referring to FIG. 1 , an apparatus for predicting the dissolved gas concentration of an aqueous solution based on a Raraman spectroscopic signal according to an embodiment of the present invention (PA: Prediction Apparatus, hereinafter abbreviated as 'prediction apparatus') is a probe 11 It includes a spectrum measuring unit 10 including a ) and a predicting unit 20.

스펙트럼측정부(10)는 도 1에 도시된 바와 같이, 수용액(Q)에 내에 프로브(11)를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 생성한다. 이러한 라만 스펙트럼 데이터는 예측부(20)에 제공된다. As shown in FIG. 1 , the spectrum measurement unit 10 emits light through the probe 11 in the aqueous solution Q and measures the scattering of the emitted light to generate Raman spectrum data. These Raman spectrum data are provided to the prediction unit 20 .

예측부(20)는 인공신경망 알고리즘인 예측모델(PM: Prediction Model)을 통해 라만 스펙트럼 데이터로부터 수용액의 농도를 예측한다. The prediction unit 20 predicts the concentration of the aqueous solution from the Raman spectrum data through a prediction model (PM), which is an artificial neural network algorithm.

그러면, 예측부(20)의 구성에 대해서 보다 상세하게 설명하기로 한다. 도 2는 본 발명의 실시예에 따른 라만 스펙트럼 데이터로부터 수용액의 농도를 예측하는 예측부의 구성을 설명하기 위한 블록도이다. 도 2를 참조하면, 예측부(20)는 모델생성부(100), 피크추출부(200) 및 농도예측부(300)를 포함한다. Then, the configuration of the prediction unit 20 will be described in more detail. 2 is a block diagram for explaining the configuration of a predictor for predicting the concentration of an aqueous solution from Raman spectrum data according to an embodiment of the present invention. Referring to FIG. 2 , the predictor 20 includes a model generator 100 , a peak extractor 200 and a concentration predictor 300 .

모델생성부(100)는 실험 데이터로부터 학습 데이터를 마련한다. 즉, 모델생성부(100)는 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련할 수 있다. 모델생성부(100)는 마련된 학습 데이터를 이용하여 학습(machine learning/deep learning)을 수행하여 수용액에 포함된 가스 농도의 예측값을 산출하도록 예측모델(PM)을 생성한다. 또한, 모델생성부(100)는 마련된 학습 데이터 중 일부를 검사 데이터로 설정하고, 검사 데이터를 이용하여 학습 결과를 검사할 수 있다. 모델생성부(100)의 학습 방법에 대해서는 아래에서 보다 상세하게 설명하기로 한다. The model generator 100 prepares learning data from experimental data. That is, the model generating unit 100 may prepare learning data by extracting learning peak data of a wavelength corresponding to the type of gas and gas concentration corresponding to the learning peak data from Raman spectrum data, which is experimental data. The model generating unit 100 performs machine learning/deep learning using the prepared learning data to generate a predictive model (PM) to calculate a predicted value of the gas concentration contained in the aqueous solution. In addition, the model generating unit 100 may set some of the prepared learning data as test data and inspect a learning result using the test data. The learning method of the model generator 100 will be described in more detail below.

피크추출부(200)는 스펙트럼측정부(10)로부터 수용액에 대한 라만 스펙트럼 데이터가 입력되면, 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장(Raman Shift)의 피크 데이터를 추출한다. 여기서, 가스가 CO인 경우, 파장은 1948

Figure 112020101656791-pat00021
및 2063
Figure 112020101656791-pat00022
이다. 또한, 가스가 아세트산염(Acetate)이면 파장은 928
Figure 112020101656791-pat00023
이고, 가스가 낙산염(Butyrate)이면, 파장은 877
Figure 112020101656791-pat00024
이다. When Raman spectrum data for an aqueous solution is input from the spectrum measuring unit 10, the peak extraction unit 200 extracts peak data of a wavelength (Raman shift) corresponding to the type of gas from the Raman spectrum data. Here, when the gas is CO, the wavelength is 1948
Figure 112020101656791-pat00021
and 2063
Figure 112020101656791-pat00022
am. Also, if the gas is acetate, the wavelength is 928
Figure 112020101656791-pat00023
, and the gas is butyrate, the wavelength is 877
Figure 112020101656791-pat00024
am.

농도예측부(300)는 피크추출부(200)가 추출한 피크 데이터를 기초로 예측모델을 통해 수용액에 포함된 가스 농도의 예측값을 산출하고, 산출된 예측값으로부터 가스 농도를 도출하여 출력한다. 이와 같이, 본 발명은 종래의 복잡한 실험을 통해 시료를 채취하여 도출되는 수용액의 용존 가스 농도를 스펙트럼측정부(10)의 한 번의 측정을 통해 도출된 라만 스펙트럼 데이터로부터 예측모델(PM)을 이용하여 예측할 수 있다. 이에 따라, 용존 가스 농도를 실시간으로 획득할 수 있다. The concentration prediction unit 300 calculates a predicted value of the gas concentration included in the aqueous solution through a predictive model based on the peak data extracted by the peak extractor 200, and derives and outputs the gas concentration from the calculated predicted value. As such, the present invention uses a predictive model (PM) from Raman spectrum data derived through a single measurement of the spectrum measurement unit 10 to measure the dissolved gas concentration of an aqueous solution derived by taking a sample through a conventional complex experiment. Predictable. Accordingly, the dissolved gas concentration can be obtained in real time.

그러면, 본 발명의 실시예에 따른 가스 농도를 예측하는 예측모델(PM)의 구성에 대해서 보다 상세하게 설명하기로 한다. 도 3은 본 발명의 실시예에 따른 가스 농도를 예측하는 예측모델(PM)의 구성을 설명하기 위한 도면이다. 도 4는 본 발명의 실시예에 따른 가스 농도를 예측하는 예측모델(PM)의 노드를 설명하기 위한 도면이다. Then, the configuration of the prediction model (PM) for predicting the gas concentration according to an embodiment of the present invention will be described in detail. 3 is a diagram for explaining the configuration of a prediction model (PM) for predicting gas concentration according to an embodiment of the present invention. 4 is a diagram for explaining a node of a prediction model (PM) for predicting gas concentration according to an embodiment of the present invention.

본 발명의 실시예에서 예측모델(PM)은 복수의 계층으로 이루어지며, 이러한 복수의 계층은 입력계층(IL: Input Layer), 적어도 하나의 은닉계층(HL: Hidden Layer, HL1~HLk) 및 출력계층(OL: Output Layer)을 포함한다. In an embodiment of the present invention, the predictive model (PM) is composed of a plurality of layers, and these multiple layers include an input layer (IL: Input Layer), at least one hidden layer (HL: Hidden Layer, HL1 to HLk) and an output It includes the layer (OL: Output Layer).

또한, 복수의 계층(IL, HL, OL) 각각은 복수의 노드를 포함한다. 예컨대, 도시된 바와 같이, 입력계층(IL)은 a개의 입력노드(i1 내지 ia)를 포함하며, 출력층(OL)은 1개의 출력노드(O)를 포함한다. 또한, 은닉계층(HL) 중 제1 은닉계층(HL1)은 b개의 노드(g1 내지 gb)를 포함하고, 마지막 은닉계층인 제k 은닉계층(HLk)은 j개의 노드(h1 내지 hj)를 포함할 수 있다. In addition, each of the plurality of layers IL, HL, and OL includes a plurality of nodes. For example, as shown, the input layer IL includes a number of input nodes i1 to ia, and the output layer OL includes one output node O. In addition, among the hidden layers (HL), the first hidden layer (HL1) includes b nodes (g1 to gb), and the last hidden layer, the k-th hidden layer (HLk) includes j nodes (h1 to hj) can do.

복수의 계층(IL, HL, OL)의 복수의 노드는 개별적으로 연산을 수행한다. 서로 다른 계층의 노드는 가중치(W: weight)를 가지는 채널(점선으로 표시)로 연결된다. 다른 말로, 어느 하나의 노드의 연산 결과는 가중치가 적용되어 다음 계층 노드의 입력이 된다. 도 4에 어느 하나의 노드(ND)의 구성이 상세하게 도시되었다. 이러한 노드(ND)의 연산에 대해 도 4를 참조하여 설명하기로 한다. 노드(ND)는 이전 계층의 복수(n개)의 노드의 출력값 각각이 X=[X1, X2, … , Xn]에 가중치 W=[W1, W2, … , Wn]를 적용한 값을 입력받고, 이를 모두 합산 후, 그 합산 값에 함수 F를 취한다. 여기서, 함수 F는 활성화 함수(activation function) 또는 전달함수(transfer function)라고 한다. 이러한 활성화함수는 계단(step)함수, 부호(sgn)함수, 시그모이드(Sigmoid), 하이퍼볼릭탄젠트(tanh: Hyperbolic tangent), ELU(Exponential Linear Unit), ReLU(Rectified Linear Unit), Leakly ReLU, Maxout, Minout, Softmax 함수 등을 예시할 수 있다. A plurality of nodes of a plurality of layers (IL, HL, OL) individually perform calculations. Nodes of different layers are connected by channels (shown as dotted lines) having a weight (W). In other words, the calculation result of one node is weighted and becomes the input of the next layer node. The configuration of any one node ND is shown in detail in FIG. 4 . An operation of the node ND will be described with reference to FIG. 4 . Each of the output values of a plurality of (n) nodes of the previous layer of the node ND is X=[X1, X2, . . . , Xn] with weights W=[W1, W2, . . . , Wn] is input, and after summing them all, the function F is taken on the sum value. Here, the function F is called an activation function or a transfer function. These activation functions include step function, sign function, sigmoid, hyperbolic tangent (tanh), exponential linear unit (ELU), rectified linear unit (ReLU), leaky ReLU, Maxout, Minout, and Softmax functions can be exemplified.

노드(ND)의 출력은 다음의 수학식 1과 같다. An output of the node ND is expressed in Equation 1 below.

Figure 112020101656791-pat00025
Figure 112020101656791-pat00025

설명되지 않은 변수 θ는 임계치 혹은 바이어스이며, 이러한 임계치는 수학식 4에서

Figure 112020101656791-pat00026
의 값이 임계치 보다 작을 때 해당 노드가 활성화되지 않도록 하는 역할을 한다. The unexplained variable θ is a threshold or bias, and this threshold is
Figure 112020101656791-pat00026
It serves to prevent the corresponding node from being activated when the value of is smaller than the threshold.

수학식 1에 따라 노드(ND)가 수행하는 연산은 다음과 같이 수행된다. 일례로, 노드(ND)의 이전 계층의 노드가 3개라고 가정한다. 이에 따라, 이전 계층의 3개의 노드 각각의 출력이 해당 노드(ND)에 대해 3개의 입력(n=3) X1, X2, X3 각각에 3개의 가중치 W1, W2, W3가 적용되어 입력된다. 이에 따라, 노드(ND)는 3개의 입력 X1, X2, X3에 대응하는 가중치 W1, W2, W3을 곱한 값을 입력받고, 모두 합산한 후, 합산된 값을 전달 함수에 대입하여 출력을 산출한다. 구체적으로, 입력 [X1, X2, X3] = 0.5, -0.3, -0.1이라고 가정하고, 가중치 [W1, W2, W3] = 4, 5, 4라고 가정한다. 또한, 설명의 편의를 위하여 활성화 함수는 부호함수, 즉, 'sgn()'이라고 가정하면, 다음의 수학식 2와 같이 출력값이 산출된다. An operation performed by the node ND according to Equation 1 is performed as follows. As an example, it is assumed that the number of nodes in the layer prior to the node ND is three. Accordingly, the output of each of the three nodes of the previous layer is input with three weights W1, W2, and W3 applied to each of the three inputs (n=3) X1, X2, and X3 for the corresponding node ND. Accordingly, the node ND receives a value obtained by multiplying the three inputs X1, X2, and X3 by weights W1, W2, and W3, sums them all, and substitutes the summed value into a transfer function to calculate an output. . Specifically, suppose inputs [X1, X2, X3] = 0.5, -0.3, -0.1, and weights [W1, W2, W3] = 4, 5, 4. Also, for convenience of description, assuming that the activation function is a sign function, that is, 'sgn()', an output value is calculated as shown in Equation 2 below.

Figure 112020101656791-pat00027
Figure 112020101656791-pat00027

도 4에서 설명된 바와 같이, 예측모델(PM)의 어느 한 계층의 어느 하나의 노드 또한 이전 계층의 복수의 노드의 출력에 가중치(W)를 적용한 값을 입력받는다. 그러면, 해당 노드는 입력을 합산하고, 합산한 값에 활성화함수에 의한 연산을 수행하여 해당 노드의 출력값을 산출한다. 출력값은 다음 계층의 입력이거나, 예측모델(PM)의 최종 출력값이 될 수 있다. 이에 따라, 예측모델(PM)은 피크 데이터가 입력되면, 입력된 피크 데이터에 대해 복수의 계층(IL, HL, OL) 간 가중치가 적용되는 복수의 연산을 수행하여 수용액의 가스 농도를 예측하는 예측값을 산출할 수 있다. As described in FIG. 4, any one node of any one layer of the predictive model (PM) also receives a value obtained by applying a weight (W) to the outputs of a plurality of nodes of the previous layer. Then, the corresponding node sums the inputs and calculates the output value of the corresponding node by performing an operation by an activation function on the summed value. The output value may be an input of the next layer or a final output value of the predictive model (PM). Accordingly, when peak data is input, the prediction model (PM) performs a plurality of operations in which weights between a plurality of layers (IL, HL, and OL) are applied to the input peak data to predict the gas concentration of the aqueous solution. can be calculated.

보다 구체적으로 설명하면, 농도예측부(300)는 피크추출부(200)로부터 피크 데이터를 수신하면, 피크 데이터를 바이너리 데이터로 변환하고, 예측모델(PM)의 입력계층(IL)의 입력노드(i1 내지 ia)의 수에 맞게 분할한 후, 입력계층(IL)의 복수의 입력노드(i1 내지 ia)에 분산하여 입력한다. More specifically, when the concentration prediction unit 300 receives peak data from the peak extraction unit 200, the peak data is converted into binary data, and the input node (IL) of the input layer (IL) of the prediction model (PM) After dividing according to the number of i1 to ia), input is distributed to a plurality of input nodes i1 to ia of the input layer IL.

그러면, 제1 은닉계층(HL1)의 복수의 제1 은닉노드(g1 내지 gb) 각각은 복수의 입력노드(i1 내지 ia)에 분산되어 입력된 바이너리 데이터(즉, 피크 데이터) 각각에 가중치가 적용된 값을 입력받고(점선으로 표시), 입력된 값을 모두 합산한 후, 합산된 값에 대해 활성화함수에 따른 연산을 수행하여 복수의 제1 은닉노드의 출력값을 산출한다. Then, each of the plurality of first hidden nodes g1 to gb of the first hidden layer HL1 is distributed to a plurality of input nodes i1 to ia, and a weight is applied to each of the input binary data (ie, peak data) A value is received (indicated by a dotted line), all input values are summed, and an operation is performed according to an activation function on the summed values to calculate an output value of a plurality of first hidden nodes.

이어서, 도시되지는 않았지만, 제2 은닉계층의 복수의 제2 은닉노드 각각은 복수의 제1 은닉노드(g1 내지 gb)의 복수의 출력값 각각에 가중치가 적용된 값을 입력받고, 입력된 값을 모두 합산하고, 합산된 값에 대해 활성화함수에 따른 연산을 수행하여 복수의 제2 은닉노드의 출력값을 산출한다. 이와 같은 방식으로, 은닉계층(HL) 내에서 이전의 노드값이 가중치가 적용되어 전달되고, 연산을 통해 현재의 노드값이 산출된다. 이러한 과정을 반복하여, 마지막 은닉계층인 제k 은닉계층(HLk)의 복수의 제k 은닉노드(h1 ~ hj)의 복수의 제k 은닉노드의 출력값을 산출할 수 있다. Subsequently, although not shown, each of the plurality of second hidden nodes of the second hidden layer receives a value to which a weight is applied to each of the plurality of output values of the plurality of first hidden nodes (g1 to gb), and all of the input values Output values of the plurality of second hidden nodes are calculated by summing and performing an operation according to an activation function on the summed values. In this way, in the hidden layer (HL), a previous node value is transmitted with a weight applied, and a current node value is calculated through an operation. By repeating this process, output values of a plurality of k-th hidden nodes of a plurality of k-th hidden nodes (h1 to hj) of the k-th hidden layer (HLk), which is the last hidden layer, may be calculated.

이에 따라, 도 3을 참조하면, 출력노드(O)는 제k 은닉계층(HLk)의 복수의 제k 은닉노드(h1 ~ hj)의 복수의 제k 은닉노드의 출력값에 가중치 w=[w1, w2, … , wj]가 적용된 값을 입력받고(점선으로 표시), 입력된 값을 모두 합산한 후, 합산된 값에 대해 활성화함수에 따른 연산을 수행하여 출력값을 산출한다. 출력층(OL)의 출력노드(O)는 수용액의 가스 농도에 대응한다. 그리고 출력노드(O)의 출력값은 수용액의 가스 농도의 예측값이다. 예컨대, 출력노드(O)의 출력값이 0.089이면, 해당 가스의 농도는 9%이고, 출력노드(O)의 출력값이 0.911이면, 해당 가스의 농도는 91%를 의미한다. 이와 같이, 예측모델(PM)이 예측값(예컨대, 0.089, 0.911)을 산출하면, 농도예측부(300)는 예측값을 농도로 변환하여 출력한다. Accordingly, referring to FIG. 3, the output node O applies a weight w = [w1, w2, ... , wj] is applied (indicated by a dotted line), and after summing up all the input values, an operation is performed on the summed values according to an activation function to calculate an output value. The output node O of the output layer OL corresponds to the gas concentration of the aqueous solution. And the output value of the output node (O) is the predicted value of the gas concentration of the aqueous solution. For example, if the output value of the output node O is 0.089, the concentration of the corresponding gas is 9%, and if the output value of the output node O is 0.911, the concentration of the corresponding gas is 91%. In this way, when the prediction model (PM) calculates the predicted value (eg, 0.089, 0.911), the concentration predicting unit 300 converts the predicted value into a concentration and outputs it.

그러면, 전술한 예측모델(PM)의 원형을 생성하는 방법에 대해서 설명하기로 한다. 도 5는 본 발명의 실시예에 따른 예측모델의 원형을 생성하는 방법을 설명하기 위한 흐름도이다. 도 6은 본 발명의 실시예에 따른 예측모델의 원형을 생성하는 방법을 설명하기 위한 그래프이다. Then, a method of generating a prototype of the aforementioned predictive model (PM) will be described. 5 is a flowchart for explaining a method of generating a prototype of a predictive model according to an embodiment of the present invention. 6 is a graph for explaining a method of generating a prototype of a predictive model according to an embodiment of the present invention.

도 5를 참조하면, 모델생성부(100)는 S100 단계에서 실험 데이터로부터 학습 데이터 및 검사 데이터를 추출한다. 즉, 모델생성부(100)는 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하고, 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 검사용 피크 데이터와 검사용 피크 데이터에 대응하는 가스 농도를 추출하여 검사 데이터를 마련한다. Referring to FIG. 5 , the model generating unit 100 extracts learning data and test data from experimental data in step S100. That is, the model generating unit 100 prepares learning data by extracting the learning peak data of the wavelength corresponding to the type of gas and the gas concentration corresponding to the learning peak data from the Raman spectrum data, which is experimental data, and prepares the experimental data, the Raman spectrum. Inspection data is prepared by extracting inspection peak data of a wavelength corresponding to the type of gas and gas concentration corresponding to the inspection peak data from the data.

다음으로, 모델생성부(100)는 S110 단계에서 초기값에 따라 예측모델(PM)의 은닉계층 및 은닉노드의 수를 설정한다. 초기값은 예측모델(PM)의 은닉계츠의 수가 1개인 것이 바람직하다. 이는 도 3의 예에서, 제1 은니계층(HL1)만 존재하며, 나머지 은닉계층은 존재하지 않는 상태를 의미한다. 하지만, 본 발명을 이에 한정하는 것은 아니며, 신뢰되는 데이터를 근거로 초기값을 달리 설정할 수도 있다. Next, the model generator 100 sets the number of hidden layers and hidden nodes of the prediction model (PM) according to the initial values in step S110. As for the initial value, it is preferable that the number of hidden gates of the prediction model (PM) is one. In the example of FIG. 3 , this means that only the first hidden layer HL1 exists and the other hidden layers do not exist. However, the present invention is not limited thereto, and an initial value may be differently set based on trusted data.

모델생성부(100)는 S120 단계에서 실험 데이터로부터 추출되는 학습 데이터를 이용하여 앞서 설정된 수의 은닉계층 및 은닉노드를 가지는 예측모델(PM)에 대한 학습을 수행한다. 그런 다음, 모델생성부(100)는 S130 단계에서 검사 데이터를 이용하여 예측모델(PM)의 학습 성과를 검사한다. 이어서, 모델생성부(100)는 S140 단계에서 학습 데이터 및 검사 데이터의 정확도를 산출한다. The model generating unit 100 performs learning on a predictive model (PM) having a previously set number of hidden layers and hidden nodes using learning data extracted from experimental data in step S120. Then, the model generating unit 100 checks the learning performance of the predictive model (PM) using the test data in step S130. Subsequently, the model generating unit 100 calculates the accuracy of the training data and the inspection data in step S140.

모델생성부(100)는 S150 단계에서 학습 데이터 및 검사 데이터의 정확도가 조건을 만족하는지 여부를 판단한다. 여기서, 조건은 학습 데이터 정확도가 검사 데이터의 정확도 보다 높으면서 학습 데이터 정확도 및 검사 데이터의 정확도 양자 모두가 임계치 이상인 경우를 의미한다. The model generating unit 100 determines whether the accuracy of the training data and the test data satisfies the condition in step S150. Here, the condition means a case where the accuracy of the training data is higher than the accuracy of the test data and both the accuracy of the learning data and the accuracy of the test data are equal to or greater than the threshold value.

S150 단계의 판단 결과, 학습 데이터 및 검사 데이터의 정확도가 설정 조건을 만족하지 않으면, 모델생성부(100)는 S160 단계로 진행하여 은닉계층 및 은닉노드의 수를 재설정한다. 이때, 모델생성부(100)는 은닉계층 및 은닉노드의 수를 증가 혹은 감소시킨다. 그런 다음, 모델생성부(100)는 전술한 S120 단계 내지 S150 단계를 반복한다. As a result of the determination in step S150, if the accuracy of the training data and the test data does not satisfy the set condition, the model generator 100 proceeds to step S160 to reset the number of hidden layers and hidden nodes. At this time, the model generator 100 increases or decreases the number of hidden layers and hidden nodes. Then, the model generator 100 repeats steps S120 to S150 described above.

반면, S150 단계의 판단 결과, 학습 데이터 및 검사 데이터의 정확도가 설정 조건을 만족하면, 모델생성부(100)는 현재 설정에 따라 은닉계층의 수 및 은닉노드의 수를 결정한다. 이로써, 예측모델(PM)의 원형이 결정된다. On the other hand, if the determination result of step S150 and the accuracy of the learning data and the test data satisfy the set condition, the model generator 100 determines the number of hidden layers and the number of hidden nodes according to the current setting. In this way, the prototype of the predictive model PM is determined.

예컨대, 도 6의 그래프에 도시된 바와 같이, 은닉계층이 1개 및 2개의 경우, 학습 데이터의 정확도 및 검사 데이터 정확도 양자 모두 임계치 미만이다. 그리고 은닉계층의 수가 4개 및 5개의 경우, 학습 데이터의 정확도는 매우 높지만, 검사 데이터의 정확도는 임계치 미만이다. 이에 따라, 은닉계층의 수가 3개일 때에만 조건을 만족하기 때문에 예측모델(PM)의 원형은 은닉계층이 3개인 모델로 결정할 수 있다. For example, as shown in the graph of FIG. 6 , when the number of hidden layers is 1 and 2, both the accuracy of the training data and the accuracy of the test data are less than the threshold value. And when the number of hidden layers is 4 or 5, the accuracy of the training data is very high, but the accuracy of the inspection data is less than the critical value. Accordingly, since the condition is satisfied only when the number of hidden layers is three, the prototype of the prediction model (PM) can be determined as a model with three hidden layers.

그러면, 본 발명의 실시예에 따른 예측모델(PM)에 대한 학습 방법에 대해서 보다 상세하게 설명하기로 한다. 도 7은 본 발명의 실시예에 따른 예측모델(PM)에 대한 학습 방법에 대해서 설명하기 위한 흐름도이다. 도 8은 본 발명의 실시예에 따른 실험 데이터에서 아세트산염 및 낙산염이 포함된 수용액에 대한 라만 스펙트럼 데이터를 나타내는 그래프이다. 도 9는 본 발명의 실시예에 따른 실험 데이터에서 아세트산염 및 낙산염의 혼합물 및 일산화탄소가 포함된 수용액에 대한 라만 스펙트럼 데이터를 나타내는 그래프이다. 도 10은 본 발명의 실시예에 따른 실험 데이터에서 수용액에 포함된 가스의 농도가 알려진 라만 스펙트럼 데이터를 나타내는 그래프이다. Then, the learning method for the predictive model (PM) according to an embodiment of the present invention will be described in more detail. 7 is a flowchart for explaining a learning method for a predictive model (PM) according to an embodiment of the present invention. 8 is a graph showing Raman spectrum data for an aqueous solution containing acetate and butyrate in experimental data according to an embodiment of the present invention. 9 is a graph showing Raman spectrum data for an aqueous solution containing a mixture of acetate and butyrate and carbon monoxide in experimental data according to an embodiment of the present invention. 10 is a graph showing Raman spectrum data in which the concentration of gas contained in an aqueous solution is known in experimental data according to an embodiment of the present invention.

도 7을 참조하면, 모델생성부(100)는 S210 단계에서 학습 데이터를 마련한다. 도 8 내지 도 10에 도시된 바와 같이, 실험 데이터는 가스가 포함된 수용액에 대한 라만 스펙트럼 데이터 및 해당 수용액의 가스 농도를 포함한다. 따라서 모델생성부(100)는 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련한다. 예컨대, 도 8의 (A)는 아세트산염(Acetate)이 포함된 물과 배양액의 혼합액에 대한 라만 스펙트럼 데이터이다. 이와 같이, 수용액에 포함된 가스의 종류가 아세트산염(Acetate)이면 928

Figure 112020101656791-pat00028
의 피크 데이터를 추출한다. 또한, 도 8의 (B)는 낙산염(Butyrate)이 포함된 물과 배양액의 혼합액에 대한 라만 스펙트럼 데이터이다. 이와 같이, 수용액에 포함된 가스의 종류가 아세트산염(Acetate)이면 877
Figure 112020101656791-pat00029
의 피크 데이터를 추출한다. 도 9의 (C)는 아세트산염(Acetate) 및 낙산염(Butyrate)의 혼합물 수용액에 대한 라만 스펙트럼 데이터이다. 수용액에 포함된 가스가 아세트산염(Acetate) 및 낙산염(Butyrate)이기 때문에 928
Figure 112020101656791-pat00030
및 877
Figure 112020101656791-pat00031
각각의 피크 데이터를 추출한다. 도 9의 (D)는 일산화탄소(CO)의 수용액에 대한 라만 스펙트럼 데이터이다. 이와 같이, 수용액에 포함된 가스의 종류가 일산화탄소(CO)이면 1948
Figure 112020101656791-pat00032
및 2063
Figure 112020101656791-pat00033
의 피크 데이터를 추출한다. 전술한 바와 같이, 실험 데이터는 해당 수용액의 가스 농도를 포함한다. 예를 들면, 도 10의 (E)는 2.5% 농도(concentration)의 일산화탄소를 포함하는 수용액의 라만 스펙트럼 데이터이고, (F)는 5% 농도의 일산화탄소를 포함하는 수용액의 라만 스펙트럼 데이터를 보인다. 이에 따라, 해당 실험 데이터로부터 수용액에 포함된 가스의 종류가 일산화탄소(CO)이기 때문에 1948
Figure 112020101656791-pat00034
및 2063
Figure 112020101656791-pat00035
의 피크 데이터를 추출하고, 그 피크 데이터에 대응하는 가스의 농도(2.5%, 5%)를 추출할 수 있다. Referring to FIG. 7 , the model generating unit 100 prepares learning data in step S210. As shown in FIGS. 8 to 10 , the experimental data includes Raman spectrum data of an aqueous solution containing gas and gas concentration of the aqueous solution. Accordingly, the model generating unit 100 prepares learning data by extracting learning peak data of a wavelength corresponding to the type of gas and gas concentration corresponding to the learning peak data from Raman spectrum data, which is experimental data. For example, (A) of FIG. 8 is Raman spectrum data of a mixture of water containing acetate and a culture medium. As such, if the type of gas contained in the aqueous solution is acetate, 928
Figure 112020101656791-pat00028
Extract the peak data of In addition, (B) of FIG. 8 is Raman spectrum data for a mixture of water and culture medium containing butyrate. As such, if the type of gas contained in the aqueous solution is acetate, 877
Figure 112020101656791-pat00029
Extract the peak data of 9(C) is Raman spectrum data for an aqueous mixture of acetate and butyrate. 928 because the gases contained in the aqueous solution are acetate and butyrate.
Figure 112020101656791-pat00030
and 877
Figure 112020101656791-pat00031
Extract each peak data. 9(D) is Raman spectrum data for an aqueous solution of carbon monoxide (CO). As such, if the type of gas contained in the aqueous solution is carbon monoxide (CO), 1948
Figure 112020101656791-pat00032
and 2063
Figure 112020101656791-pat00033
Extract the peak data of As mentioned above, the experimental data includes the gas concentration of the aqueous solution. For example, (E) of FIG. 10 shows Raman spectrum data of an aqueous solution containing carbon monoxide at a concentration of 2.5%, and (F) shows Raman spectrum data of an aqueous solution containing carbon monoxide at a concentration of 5%. Accordingly, from the experimental data, since the type of gas contained in the aqueous solution is carbon monoxide (CO), 1948
Figure 112020101656791-pat00034
and 2063
Figure 112020101656791-pat00035
Peak data of can be extracted, and the concentration (2.5%, 5%) of the gas corresponding to the peak data can be extracted.

학습 데이터를 마련한 후, 모델생성부(100)는 S220 단계에서 학습 데이터를 이용하여 경계 학습을 수행할 수 있다. 이러한 S220 단계는 선택적인 것으로, 필요에 따라 수행하거나, 생략할 수 있다. 경계 학습은 학습을 통해 명확하게 구분되지 않는 경계를 명확하게 위한 것이다. 도 10을 참조하면, 일산화탄소 농도 2.5%와 일산화탄소 농도 5%의 데이터는 학습을 통해 명확하게 구분되지 않는다고 가정한다. 이러한 경우, 2.5%와 5% 사이의 값을 경계값으로 설정하고(예컨대. 2.75%), 그 경계값을 기준으로 레이블을 설정하여 농도 2.5%와 5% 사이의 값들을 명확하게 구분되도록 경계학습을 수행한다. 경계학습의 구체적인 내용에 대해서는 아래에서 더 상세하게 설명될 것이다. After preparing the learning data, the model generating unit 100 may perform boundary learning using the learning data in step S220. This step S220 is optional and may be performed or omitted as needed. Boundary learning is for clarifying boundaries that are not clearly distinguished through learning. Referring to FIG. 10 , it is assumed that data of a carbon monoxide concentration of 2.5% and a carbon monoxide concentration of 5% are not clearly distinguished through learning. In this case, a value between 2.5% and 5% is set as a boundary value (e.g. 2.75%), and a label is set based on the boundary value for boundary learning to clearly distinguish values between concentrations of 2.5% and 5%. Do it. The specific contents of boundary learning will be explained in more detail below.

다음으로, 모델생성부(100)는 S230 단계에서 학습 데이터를 이용하여 수치 학습을 수행한다. 수치학습은 목표값, 즉, 레이블을 실험 데이터에서 얻어진 농도(수치)로 설정하여 학습을 수행함으로써, 실제로 수용액에서 가스의 농도를 예측할 수 있도록 예측모델(PM)을 학습시키는 절차이다. 수치학습의 구체적인 내용에 대해서는 아래에서 더 상세하게 설명될 것이다. Next, the model generating unit 100 performs numerical learning using the learning data in step S230. Numerical learning is a procedure for learning a predictive model (PM) to actually predict the concentration of a gas in an aqueous solution by setting a target value, that is, a label, to a concentration (numerical value) obtained from experimental data. The specific contents of numerical learning will be explained in more detail below.

다음으로, 본 발명의 실시예에 따른 예측모델(PM)에 경계학습에 대해서 보다 상세하게 설명하기로 한다. 도 11은 본 발명의 실시예에 따른 예측모델(PM)에 대한 경계학습을 설명하기 위한 흐름도이다. 도 12는 본 발명의 실시예에 따른 예측모델(PM)에 대한 경계학습을 설명하기 위한 도면이다. 다시 강조하면, 도 11은 도 7의 S220 단계의 경계학습의 일 실시예를 보다 상세하게 설명하는 것이다. Next, boundary learning in the predictive model (PM) according to an embodiment of the present invention will be described in more detail. 11 is a flowchart illustrating boundary learning for a predictive model (PM) according to an embodiment of the present invention. 12 is a diagram for explaining boundary learning for a predictive model (PM) according to an embodiment of the present invention. Emphasizing again, FIG. 11 describes an embodiment of boundary learning in step S220 of FIG. 7 in more detail.

도 11을 참조하면, 모델생성부(100)는 S310 단계에서 가스의 종류에 따른 파장의 학습용 피크 데이터 및 대응하는 가스 농도를 포함하는 복수의 학습 데이터를 마련한다. 그런 다음, 모델생성부(100)는 S320 단계에서 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩(One-hot-encoding) 벡터로 변환하여 경계 레이블을 설정한다. 일 실시예에 따르면, 일산화탄소 농도 2.5%와 5%의 구분을 명확하게 하기 위하여 경계값을 2.75%, 즉, 0.0275로 설정하였다고 가정한다. 그러면, 2.75% 이상의 가스 농도는 벡터 1로 변환되고, 2.75% 미만의 가스 농도는 벡터 0로 변환된다. 예컨대, 일산화탄소 농도 2.5%의 경우, 레이블은 벡터 0으로 설정되며, 일산화탄소 농도 5%의 경우, 레이블은 벡터 1로 설정된다. Referring to FIG. 11 , the model generating unit 100 prepares a plurality of learning data including peak data for learning wavelengths according to types of gases and corresponding gas concentrations in step S310. Then, in step S320, the model generating unit 100 converts the gas concentration corresponding to the peak data for learning into a one-hot-encoding vector based on a preset boundary value to set boundary labels. According to an embodiment, it is assumed that the boundary value is set to 2.75%, that is, 0.0275, in order to clearly distinguish between 2.5% and 5% carbon monoxide concentration. Then, gas concentrations above 2.75% are converted to vector 1, and gas concentrations below 2.75% are converted to vector 0. For example, for a carbon monoxide concentration of 2.5%, the label is set to vector 0, and for a carbon monoxide concentration of 5%, the label is set to vector 1.

경계 레이블이 설정되면, 모델생성부(100)는 S330 단계에서 경계 손실을 최적화하는 학습을 수행한다. 이때, 모델생성부(100)가 학습용 피크 데이터를 예측모델(PM)에 입력하면, 예측모델(PM)은 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 통해 예측값을 산출한다. 그러면, 모델생성부(100)는 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 예측모델(PM)의 가중치를 수정하는 경계손실 최적화를 수행한다. 이때, 경계손실은 다음의 수학식 3과 같은 경계손실함수를 통해 도출할 수 있다. When boundary labels are set, the model generator 100 performs learning to optimize boundary loss in step S330. At this time, when the model generating unit 100 inputs the peak data for learning to the prediction model (PM), the prediction model (PM) calculates a predicted value through a plurality of operations in which weights between a plurality of layers are applied to the peak data for learning. . Then, the model generating unit 100 performs boundary loss optimization for modifying the weight of the prediction model PM so that the boundary loss, which is the difference between the prediction value and the boundary label, is minimized. At this time, the boundary loss can be derived through a boundary loss function such as Equation 3 below.

Figure 112020101656791-pat00036
Figure 112020101656791-pat00036

수학식 3에서, Lboaderselected는 경계손실함수를 나타낸다. 특히, Oi는 예측모델(PM)의 출력층(OL)의 출력노드(O)의 출력인 예측값이고, vi는 예측값에 대응하는 경계 레이블이다. 여기서, i는 예측모델(PM)의 출력층(OL)의 출력노드(O)에 대응하는 인덱스이다. In Equation 3, Lboaderselected represents a boundary loss function. In particular, Oi is a predicted value that is an output of the output node O of the output layer OL of the predictive model PM, and vi is a boundary label corresponding to the predicted value. Here, i is an index corresponding to the output node O of the output layer OL of the predictive model PM.

정리하면, 모델생성부(100)는 수학식 3의 경계 손실함수를 통해 경계 손실을 도출한 후, 경계 손실이 최소가 되도록 예측모델(PM)의 가중치를 수정하는 경계 손실 최적화를 수행한다. 이러한 경계 손실 최적화는 복수의 서로 다른 학습용 데이터를 이용하여 반복하여 수행되며, 이러한 반복은 평가 지표를 통해 원하는 정확도에 도달할 때까지 이루어질 수 있다. In summary, the model generator 100 derives the edge loss through the edge loss function of Equation 3, and then performs edge loss optimization of modifying the weight of the prediction model (PM) so that the edge loss is minimized. This boundary loss optimization is repeatedly performed using a plurality of different learning data, and such repetition may be performed until a desired accuracy is reached through an evaluation index.

전술한 바와 같은 경계 손실 최적화에 따른 학습이 완료되면, 모델생성부(100)는 S140 단계에서 예측모델(PM)을 통해 경계값을 기준으로 구분되는 그룹 각각의 복수의 은닉벡터 중 기준벡터를 선택한다. 복수의 학습 데이터 중 대응하는 가스 농도가 경계값 이상인 학습용 피크 데이터를 제1 그룹으로 분류하고, 대응하는 가스 농도가 경계값 미만인 학습용 피크 데이터를 제2 그룹으로 분류할 때, 기준벡터를 선택하는 방법은 다음과 같다. 앞서(S130) 사용된 학습 데이터의 학습용 피크 데이터를 경계 손실 최적화가 이루어진 예측모델(PM)에 다시 입력하여 예측모델(PM)의 마지막, 은닉계층, 즉, 제k 은닉계층(HLk)의 복수의 은닉노드(h1 내지 hj)의 출력값인 은닉벡터를 도출한다. 즉, 은닉벡터는 H[h1, h2, h3, …, hj]이다. 모델생성부(100)는 복수의 차원으로 이루어진 복수의 은닉벡터를 소정의 벡터공간에 임베딩한다. 도 12의 (가)에 소정의 벡터공간에 복수의 은닉벡터가 임베딩된 예를 도시하였다. 기본적으로, 경계 손실 최적화에 의해 벡터공간 상에서 경계값 이상의 농도를 가지는 제1 그룹에 대한 은닉벡터(원형 표시)와 경계값 미만의 농도를 가지는 제2 그룹에 대한 은닉벡터(사각형 표시)는 경계(BORDER)에 의해 구분이 이루어진다. 하지만, 도 12의 (가)에 도시된 바와 같이, 경계(BORDER)에 걸쳐 있는 은닉벡터도 존재한다. 모델생성부(100)는 이러한 벡터 공간에 임베딩된 복수의 은닉벡터 중 각 그룹 별로 기준벡터를 선택한다. 기준벡터는 9의 (A)에 도시된 바와 같이, 동일한 그룹 내의 은닉벡터 중 중간값을 선택할 수 있다. When the learning according to the boundary loss optimization as described above is completed, the model generator 100 selects a reference vector from among a plurality of hidden vectors of each group classified based on the boundary value through the prediction model (PM) in step S140 do. A method for selecting a reference vector when classifying peak data for learning with a corresponding gas concentration equal to or greater than the threshold among a plurality of learning data into a first group and classifying peak data for learning with a corresponding gas concentration less than the threshold value as a second group. Is as follows. The learning peak data of the previously used training data (S130) is re-entered into the prediction model (PM) in which boundary loss optimization is performed, and the plurality of the last hidden layer of the prediction model (PM), that is, the k-th hidden layer (HLk) A hidden vector that is an output value of the hidden nodes (h1 to hj) is derived. That is, the hidden vector is H[h1, h2, h3, . . . , hj]. The model generator 100 embeds a plurality of hidden vectors having a plurality of dimensions into a predetermined vector space. 12(a) shows an example in which a plurality of hidden vectors are embedded in a predetermined vector space. Basically, by boundary loss optimization, the hidden vector (marked by a circle) for the first group having a concentration greater than or equal to the boundary value in the vector space and the hidden vector (marked by a square) for the second group having a concentration less than the boundary value are the boundary ( BORDER) is used for classification. However, as shown in (a) of FIG. 12, hidden vectors that cross the BORDER also exist. The model generator 100 selects a reference vector for each group from among a plurality of hidden vectors embedded in the vector space. As shown in (A) of 9, a median value among hidden vectors in the same group may be selected as the reference vector.

다음으로, 모델생성부(100)는 S350 단계에서 경계 레이블 및 증강 레이블을 설정한다. 경계 레이블은 앞서 S320 단계에서와 동일하게 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 설정된다. 증강 레이블은 앞서(S340) 그룹별로 선택된 기준벡터를 이용한다. Next, the model generating unit 100 sets boundary labels and augmentation labels in step S350. The boundary label is set by converting the gas concentration corresponding to the peak data for learning into a one-hot encoding vector based on a preset boundary value, as in the previous step S320. The augmented label uses the reference vector selected for each group in step S340.

경계 레이블 및 증강 레이블이 설정되면, 모델생성부(100)는 S360 단계에서 증강 손실을 최적화하는 학습을 수행한다. 이때, 모델생성부(100)가 학습용 피크 데이터를 예측모델(PM)에 입력하면, 예측모델(PM)은 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 통해 순차로 마지막 은닉계층(예컨대, 제k 은닉계층)의 출력값 및 출력층의 출력인 예측값을 산출한다. 그러면, 모델생성부(100)는 예측값과 경계 레이블의 차이를 나타내는 경계 손실과, 마지막 은닉계층(예컨대, 제k 은닉계층)의 출력값 H[h1, h2, h3, …, hj]과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 예측모델(PM)의 가중치를 수정하는 경계증강 손실 최적화를 수행한다. 이때, 경계증강 손실은 다음의 수학식 3과 같은 경계증강 손실함수를 통해 도출할 수 있다. When boundary labels and augmentation labels are set, the model generator 100 performs learning to optimize augmentation loss in step S360. At this time, when the model generator 100 inputs the peak data for learning to the prediction model (PM), the prediction model (PM) sequentially performs the last concealment through a plurality of operations in which weights between a plurality of layers are applied to the peak data for learning. An output value of the layer (eg, the kth hidden layer) and a predicted value that is an output of the output layer are calculated. Then, the model generator 100 calculates the boundary loss representing the difference between the predicted value and the boundary label, and the output value H[h1, h2, h3, . . . . At this time, the boundary enhancement loss can be derived through a boundary enhancement loss function such as Equation 3 below.

Figure 112020101656791-pat00037
Figure 112020101656791-pat00037

수학식 4에서, Lboaderenhanced는 경계증강 손실함수를 나타낸다. 특히, Oi는 예측모델(PM)의 출력층(OL)의 출력노드(O)의 출력인 예측값이고, vi는 예측값에 대응하는 경계 레이블이다. 여기서, i는 예측모델(PM)의 출력층(OL)의 출력노드(O)에 대응하는 인덱스이다. 또한, hij는 예측모델(PM)의 마지막 은닉계층(예컨대, HLk)의 복수의 은닉노드의 출력값인 은닉벡터 H[h1, h2, h3, …, hj]이고, rij는 마지막 은닉계층(예컨대, HLk)의 복수의 은닉노드의 출력값인 은닉벡터 H[h1, h2, h3, …, hj]에 대응하는 증강 레이블이다. 이 증강 레이블은 그룹 별로 선택된 기준벡터이다. j는 예측모델(PM)의 마지막 은닉계층(예컨대, HLk)의 복수의 은닉노드에 대응하는 인덱스이다. In Equation 4, Lboaderenhanced represents the boundary enhancement loss function. In particular, Oi is a predicted value that is an output of the output node O of the output layer OL of the predictive model PM, and vi is a boundary label corresponding to the predicted value. Here, i is an index corresponding to the output node O of the output layer OL of the predictive model PM. In addition, hij is a hidden vector H [h1, h2, h3, . , hj], and rij is the hidden vector H [h1, h2, h3, . . . , hj]. This augmented label is a reference vector selected for each group. j is an index corresponding to a plurality of hidden nodes of the last hidden layer (eg, HLk) of the prediction model (PM).

정리하면, 모델생성부(100)는 수학식 4의 경계증강 손실함수를 통해 경계증강 손실을 도출한다. 경계증강 손실은 예측값과 경계 레이블의 차이를 나타내는 경계 손실과, 마지막 은닉계층(예컨대, 제k 은닉계층)의 출력값 H[h1, h2, h3, …, hj]과 증강 레이블과의 차이를 나타내는 증강 손실을 포함한다. 이와 같이, 경계증강 손실이 도출되면, 모델생성부(100)는 경계증강 손실이 최소가 되도록 예측모델(PM)의 가중치를 수정하는 경계증강 손실 최적화를 수행한다. 이러한 경계증강 손실 최적화는 복수의 서로 다른 학습용 데이터를 이용하여 반복하여 수행되며, 이러한 반복은 평가 지표를 통해 원하는 정확도에 도달할 때까지 이루어질 수 있다. In summary, the model generator 100 derives the boundary enhancement loss through the boundary enhancement loss function of Equation 4. The boundary enhancement loss is the boundary loss representing the difference between the predicted value and the boundary label, and the output value of the last hidden layer (eg, the kth hidden layer) H[h1, h2, h3, ... , hj] and the enhancement loss representing the difference from the enhancement label. In this way, when the boundary enhancement loss is derived, the model generating unit 100 performs boundary enhancement loss optimization of modifying the weight of the prediction model (PM) so that the boundary enhancement loss is minimized. Such boundary enhancement loss optimization is repeatedly performed using a plurality of different training data, and such repetition may be performed until a desired accuracy is reached through an evaluation index.

이러한 경계증강 손실에 의한 학습이 완료되면, 벡터 공간 상의 복수의 은닉벡터는 도 12의 (B)와 같이 분류될 수 있다. 즉, 복수의 은닉벡터는 벡터 공간 상에서 기준벡터를 향하여 이동된다. 특히, 경계(BORDER)에 존재하는 은닉벡터가 기준벡터를 향하여 이동함에 따라 제1 그룹과 제2 그룹의 구분이 보다 명확해짐을 알 수 있다. 즉, 경계증강 손실 최적화를 통한 학습을 수행함에 따라 예측모델(PM)에서 수치의 차이의 구분 성능이 향상될 수 있다. When learning by the boundary enhancement loss is completed, a plurality of hidden vectors on the vector space can be classified as shown in FIG. 12(B). That is, the plurality of hidden vectors are moved toward the reference vector on the vector space. In particular, it can be seen that the distinction between the first group and the second group becomes clearer as the hidden vector existing on the BORDER moves toward the reference vector. That is, as learning is performed through boundary enhancement loss optimization, the performance of discriminating numerical differences in the prediction model (PM) can be improved.

다음으로, 본 발명의 실시예에 따른 예측모델(PM)에 수치학습에 대해서 보다 상세하게 설명하기로 한다. 도 13은 본 발명의 실시예에 따른 예측모델(PM)에 대한 수치학습을 설명하기 위한 흐름도이다. 다시 강조하면, 도 13은 도 7의 S230 단계의 수치학습을 보다 상세하게 설명하는 것이다. Next, numerical learning in the predictive model (PM) according to an embodiment of the present invention will be described in more detail. 13 is a flowchart for explaining numerical learning for a predictive model (PM) according to an embodiment of the present invention. Emphasizing again, FIG. 13 explains the numerical learning of step S230 of FIG. 7 in more detail.

도 13을 참조하면, 모델생성부(100)는 S410 단계에서 가스의 종류에 따른 파장의 학습용 피크 데이터 및 대응하는 가스 농도를 포함하는 복수의 학습 데이터를 마련한다. 그런 다음, 모델생성부(100)는 S420 단계에서 학습용 피크 데이터에 대응하는 가스 농도의 수치를 수치 레이블로 설정한다. 예컨대, 일산화탄소 농도 2.5%의 경우, 수치 레이블은 0.025로 설정되며, 일산화탄소 농도 5%의 경우, 레이블은 0.050로 설정된다. Referring to FIG. 13 , the model generating unit 100 prepares a plurality of learning data including peak data for learning wavelengths according to types of gases and corresponding gas concentrations in step S410. Then, the model generation unit 100 sets the value of the gas concentration corresponding to the peak data for learning as a numerical label in step S420. For example, for a carbon monoxide concentration of 2.5%, the numerical label is set to 0.025, and for a carbon monoxide concentration of 5%, the label is set to 0.050.

수치 레이블이 설정되면, 모델생성부(100)는 S430 단계에서 수치 손실을 최적화하는 학습을 수행한다. 이때, 모델생성부(100)가 학습용 피크 데이터를 예측모델(PM)에 입력하면, 예측모델(PM)은 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 통해 예측값을 산출한다. 그러면, 모델생성부(100)는 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 예측모델(PM)의 가중치를 수정하는 수치 손실 최적화를 수행한다. 이때, 수치 손실은 다음의 수학식 5와 같은 수치손실함수를 통해 도출할 수 있다. When the numerical labels are set, the model generating unit 100 performs learning to optimize numerical loss in step S430. At this time, when the model generating unit 100 inputs the peak data for learning to the prediction model (PM), the prediction model (PM) calculates a predicted value through a plurality of operations in which weights between a plurality of layers are applied to the peak data for learning. . Then, the model generating unit 100 performs numerical loss optimization to modify the weight of the prediction model PM so that the numerical loss, which is the difference between the predicted value and the numerical label, is minimized. At this time, the numerical loss can be derived through a numerical loss function such as Equation 5 below.

Figure 112020101656791-pat00038
Figure 112020101656791-pat00038

수학식 3에서 Lvalue는 수치손실함수를 나타낸다. Oi는 출력층(OL)의 출력인 예측값이고, Ci은 출력층(OL)의 출력인 예측값에 대응하는 수치 레이블이다. 그리고 i는 예측모델(PM)의 출력층(OL)의 출력노드에 대응하는 인덱스이다. 수치손실함수 Lvalue의 첫 번째 항(term)은 L1-norm 손실이며, 두 번째 항은 SSIM(Structural Similarity Index)을 나타낸다. 즉, L1-norm 및 SSIM을 합산한 값이 최소가 되도록 최적화를 수행할 수 있다. In Equation 3, Lvalue represents a numerical loss function. Oi is a predicted value output from the output layer OL, and Ci is a numerical label corresponding to the predicted value output from the output layer OL. And i is an index corresponding to an output node of the output layer OL of the predictive model PM. The first term of the numerical loss function Lvalue is the L1-norm loss, and the second term represents SSIM (Structural Similarity Index). That is, optimization may be performed so that the sum of L1-norm and SSIM is minimized.

정리하면, 모델생성부(100)는 수학식 5의 수치 손실함수를 통해 수치 손실을 도출한 후, 수치 손실이 최소가 되도록 예측모델(PM)의 가중치를 수정하는 수치 손실 최적화를 수행한다. 이러한 수치 손실 최적화는 복수의 서로 다른 학습용 데이터를 이용하여 반복하여 수행되며, 이러한 반복은 평가 지표를 통해 원하는 정확도에 도달할 때까지 이루어질 수 있다. In summary, the model generator 100 derives the numerical loss through the numerical loss function of Equation 5, and then performs numerical loss optimization to modify the weight of the prediction model PM so that the numerical loss is minimized. This numerical loss optimization is repeatedly performed using a plurality of different training data, and such repetition may be performed until a desired accuracy is reached through an evaluation index.

전술한 바와 같은 방법을 통해 예측모델(PM)이 생성되면, 본 발명의 실시예에 따른 예측장치(PA)는 실시간으로 수용액의 용존 가스 농도를 예측할 수 있다. 이러한 방법에 대해서 설명하기로 한다. 도 14는 본 발명의 실시예에 따른 라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 방법을 설명하기 위한 흐름도이다. When the predictive model (PM) is generated through the method described above, the predictor (PA) according to an embodiment of the present invention can predict the dissolved gas concentration of the aqueous solution in real time. These methods will be described. 14 is a flowchart for explaining a method for predicting a dissolved gas concentration in an aqueous solution based on a Raman spectroscopy signal according to an embodiment of the present invention.

도 14를 참조하면, 스펙트럼측정부(10)는 S510 단계에서 도 1에 도시된 바와 같이, 수용액에 내에 프로브(11)를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 취득한다. 이러한 라만 스펙트럼 데이터는 예측부(20)에 제공된다. Referring to FIG. 14, the spectrum measuring unit 10 emits light through the probe 11 in the aqueous solution as shown in FIG. 1 in step S510, and measures the scattering of the emitted light to obtain a Raman spectrum. Acquire data. These Raman spectrum data are provided to the prediction unit 20 .

예측부(20)의 피크추출부(200)는 S520 단계에서 스펙트럼측정부(10)로부터 수용액에 대한 라만 스펙트럼 데이터가 입력되면, 라만 스펙트럼 데이터로부터 수용액에 포함된 가스의 종류에 상응하는 파장(Raman Shift)의 피크 데이터를 추출한다. 도 8 내지 도 9를 참조하면, 가스가 CO인 경우, 파장은 1948

Figure 112020101656791-pat00039
및 2063
Figure 112020101656791-pat00040
이다. 또한, 가스가 아세트산염(Acetate)이면 파장은 928
Figure 112020101656791-pat00041
이고, 가스가 낙산염(Butyrate)이면, 파장은 877
Figure 112020101656791-pat00042
이다. When Raman spectrum data for the aqueous solution is input from the spectrum measuring unit 10 in step S520, the peak extraction unit 200 of the prediction unit 20, the wavelength (Raman spectrum) corresponding to the type of gas included in the aqueous solution from the Raman spectrum data Shift) to extract the peak data. 8 to 9, when the gas is CO, the wavelength is 1948
Figure 112020101656791-pat00039
and 2063
Figure 112020101656791-pat00040
am. Also, if the gas is acetate, the wavelength is 928
Figure 112020101656791-pat00041
, and the gas is butyrate, the wavelength is 877
Figure 112020101656791-pat00042
am.

농도예측부(300)는 S530 단계에서 예측모델(PM)을 통해 피크 데이터로부터 가스 농도의 예측값을 산출한다. 이때, 농도예측부(300)는 피크추출부(200)가 추출한 피크 데이터를 예측모델(PM)에 입력한다. 그러면, 예측모델(PM)은 피크 데이터에 대해 복수의 계층(IL, HL, OL) 간 학습된 가중치가 적용되는 복수의 연산을 통해 수용액에 포함된 가스 농도의 예측값을 산출한다. The concentration prediction unit 300 calculates a gas concentration predicted value from the peak data through the predictive model (PM) in step S530. At this time, the concentration prediction unit 300 inputs the peak data extracted by the peak extraction unit 200 to the prediction model (PM). Then, the prediction model (PM) calculates the predicted value of the gas concentration included in the aqueous solution through a plurality of calculations to which weights learned between the plurality of layers (IL, HL, and OL) are applied to the peak data.

다음으로, 농도예측부(300)는 S540 단계에서 예측값을 농도로 변환하여 변환된 농도를 수용액의 용존 가스 농도를 출력한다. 예컨대, 예측모델(PM)이 일산화탄소(CO)에 대해 0.089, 0.911과 같은 예측값을 산출하면, 농도예측부(300)는 예측값을 9%, 91% 등의 농도로 변환하여 일산화탄소(CO)의 용존 가스 농도를 9%, 91% 등으로 출력한다. Next, the concentration prediction unit 300 converts the predicted value into a concentration in step S540 and outputs the converted concentration as the dissolved gas concentration of the aqueous solution. For example, when the prediction model (PM) calculates predicted values such as 0.089 and 0.911 for carbon monoxide (CO), the concentration predicting unit 300 converts the predicted values into concentrations such as 9% and 91% to dissolve carbon monoxide (CO). Output the gas concentration as 9%, 91%, etc.

도 15는 본 발명의 실시예에 따른 컴퓨팅 장치를 나타내는 도면이다. 도 15의 컴퓨팅 장치(TN100)는 본 명세서에서 기술된 장치(예, 예측장치(PA) 등) 일 수 있다. 15 is a diagram illustrating a computing device according to an embodiment of the present invention. The computing device TN100 of FIG. 15 may be a device described in this specification (eg, a prediction device (PA), etc.).

도 15의 실시예에서, 컴퓨팅 장치(TN100)는 적어도 하나의 프로세서(TN110), 송수신 장치(TN120), 및 메모리(TN130)를 포함할 수 있다. 또한, 컴퓨팅 장치(TN100)는 저장 장치(TN140), 입력 인터페이스 장치(TN150), 출력 인터페이스 장치(TN160) 등을 더 포함할 수 있다. 컴퓨팅 장치(TN100)에 포함된 구성 요소들은 버스(bus)(TN170)에 의해 연결되어 서로 통신을 수행할 수 있다. In the embodiment of FIG. 15 , the computing device TN100 may include at least one processor TN110, a transceiver TN120, and a memory TN130. In addition, the computing device TN100 may further include a storage device TN140, an input interface device TN150, and an output interface device TN160. Elements included in the computing device TN100 may communicate with each other by being connected by a bus TN170.

프로세서(TN110)는 메모리(TN130) 및 저장 장치(TN140) 중에서 적어도 하나에 저장된 프로그램 명령(program command)을 실행할 수 있다. 프로세서(TN110)는 중앙 처리 장치(CPU: central processing unit), 그래픽 처리 장치(GPU: graphics processing unit), 또는 본 발명의 실시예에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 프로세서(TN110)는 본 발명의 실시예와 관련하여 기술된 절차, 기능, 및 방법 등을 구현하도록 구성될 수 있다. 프로세서(TN110)는 컴퓨팅 장치(TN100)의 각 구성 요소를 제어할 수 있다. The processor TN110 may execute program commands stored in at least one of the memory TN130 and the storage device TN140. The processor TN110 may mean a central processing unit (CPU), a graphics processing unit (GPU), or a dedicated processor on which methods according to embodiments of the present invention are performed. Processor TN110 may be configured to implement procedures, functions, methods, and the like described in relation to embodiments of the present invention. The processor TN110 may control each component of the computing device TN100.

메모리(TN130) 및 저장 장치(TN140) 각각은 프로세서(TN110)의 동작과 관련된 다양한 정보를 저장할 수 있다. 메모리(TN130) 및 저장 장치(TN140) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(TN130)는 읽기 전용 메모리(ROM: read only memory) 및 랜덤 액세스 메모리(RAM: random access memory) 중에서 적어도 하나로 구성될 수 있다. Each of the memory TN130 and the storage device TN140 may store various information related to the operation of the processor TN110. Each of the memory TN130 and the storage device TN140 may include at least one of a volatile storage medium and a non-volatile storage medium. For example, the memory TN130 may include at least one of read only memory (ROM) and random access memory (RAM).

송수신 장치(TN120)는 유선 신호 또는 무선 신호를 송신 또는 수신할 수 있다. 송수신 장치(TN120)는 네트워크에 연결되어 통신을 수행할 수 있다.The transmitting/receiving device TN120 may transmit or receive a wired signal or a wireless signal. The transmitting/receiving device TN120 may perform communication by being connected to a network.

한편, 앞서 설명된 본 발명의 실시예에 따른 방법은 다양한 컴퓨터수단을 통하여 판독 가능한 프로그램 형태로 구현되어 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. On the other hand, the method according to the embodiment of the present invention described above can be implemented in the form of a program readable through various computer means and recorded on a computer-readable recording medium. Here, the recording medium may include program commands, data files, data structures, etc. alone or in combination. Program instructions recorded on the recording medium may be those specially designed and configured for the present invention, or those known and usable to those skilled in computer software. For example, recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magneto-optical media such as floptical disks ( magneto-optical media), and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of the program command may include a high-level language that can be executed by a computer using an interpreter, as well as a machine language generated by a compiler. These hardware devices may be configured to act as one or more software modules to perform the operations of the present invention, and vice versa.

이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 이와 같이, 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 균등론에 따라 다양한 변화와 수정을 가할 수 있음을 이해할 것이다. The present invention has been described above using several preferred examples, but these examples are illustrative and not limiting. As such, those skilled in the art to which the present invention belongs will understand that various changes and modifications can be made according to the doctrine of equivalents without departing from the spirit of the present invention and the scope of rights set forth in the appended claims.

10: 스펙트럼측정부
20: 예측부
100: 모델생성부
200: 피크추출부
300: 농도예측부
10: spectrum measuring unit
20: prediction unit
100: model generator
200: peak extraction unit
300: concentration prediction unit

Claims (20)

라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치에 있어서,
수용액에 대한 라만 스펙트럼 데이터가 입력되면, 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 피크추출부; 및
상기 피크 데이터를 기초로 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하고, 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 농도예측부;
를 포함하며,
실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하고,
상기 학습 데이터 중 일부를 검사 데이터로 설정하고,
상기 학습 데이터를 이용하여 수용액에 포함된 가스 농도의 예측값을 산출하도록 예측모델을 학습시키고,
상기 검사 데이터를 이용하여 상기 학습 결과를 검사하는 모델생성부;
를 더 포함하며,
상기 모델생성부는
상기 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 경계 레이블로 설정하고,
상기 학습용 피크 데이터를 예측모델에 입력하고,
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면,
경계손실함수
Figure 112023010299886-pat00075
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계 최적화를 수행하고,
상기 Lboaderselected는 경계 손실함수이고,
상기 Oi는 상기 예측모델의 예측값이고,
상기 vi는 상기 출력값에 대응하는 경계 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
An apparatus for predicting the concentration of dissolved gas in an aqueous solution based on a Raman spectroscopy signal,
a peak extraction unit for extracting peak data of a wavelength corresponding to a type of gas from the Raman spectrum data when Raman spectrum data for an aqueous solution is input; and
a concentration prediction unit that calculates a predicted value of the gas concentration contained in the aqueous solution through a predictive model based on the peak data, and derives and outputs the gas concentration from the calculated predicted value;
Including,
Preparing learning data by extracting learning peak data of a wavelength corresponding to the type of gas and gas concentration corresponding to the learning peak data from Raman spectrum data, which is experimental data;
Set some of the learning data as test data;
Learning a predictive model to calculate a predicted value of the gas concentration contained in the aqueous solution using the learning data;
a model generating unit inspecting the learning result using the inspection data;
Including more,
The model generator
The gas concentration corresponding to the learning peak data is converted into a one-hot encoding vector based on a preset boundary value and set as a boundary label,
Input the peak data for learning into a predictive model,
When the predictive model calculates a predicted value by performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning,
boundary loss function
Figure 112023010299886-pat00075
Performs boundary optimization for modifying weights of the prediction model so that boundary loss, which is a difference between a predicted value output from the prediction model and a boundary label, is minimized according to
The Lboaderselected is a boundary loss function,
The Oi is a predicted value of the predictive model,
vi is a boundary label corresponding to the output value,
Characterized in that i is an index corresponding to the output node of the output layer of the predictive model
A device for predicting dissolved gas concentrations.
삭제delete 제1항에 있어서,
상기 모델생성부는
상기 학습 데이터 및 상기 검사 데이터 각각의 정확도 양자 모두가 기 설정된 조건을 만족할 때까지 상기 예측모델의 은닉계층 및 은닉노드의 수를 조절하면서, 상기 학습 데이터를 이용한 상기 예측모델에 대한 학습과, 상기 검사 데이터를 이용한 상기 예측모델에 대한 학습 성과의 검사를 반복하는 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
According to claim 1,
The model generator
Learning the predictive model using the learning data while adjusting the number of hidden layers and hidden nodes of the predictive model until both the accuracy of each of the learning data and the test data satisfies a preset condition, and the test Characterized in repeating the inspection of the learning performance for the predictive model using data
A device for predicting dissolved gas concentrations.
삭제delete 제1항에 있어서,
상기 모델생성부는
기 설정된 경계값을 기준으로 학습용 피크 데이터에 대응하는 가스 농도를 원핫인코딩 벡터로 변환하여 상기 경계레이블로 설정하고,
상기 학습용 피크 데이터의 은닉벡터에 대응하는 기준벡터를 증강 레이블로 설정하고,
상기 학습용 피크 데이터를 예측모델에 입력하고,
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 마지막 은닉계층의 복수의 은닉노드의 출력값과, 출력층의 출력인 예측값을 산출하면,
경계증강손실함수
Figure 112023010299886-pat00044
에 따라
상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계 손실 및 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계증강 최적화를 수행하고,
상기 Lboaderenhanced는 경계증강 손실함수이고,
상기 Oi는 상기 예측모델의 출력층의 출력인 예측값이고,
상기 vi는 상기 예측값에 대응하는 경계 레이블이고,
상기 hij는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값이고,
상기 rij는 상기 복수의 은닉노드의 출력값에 대응하는 증강 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이고,
상기 j는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드에 대응하는 인덱스인 것
을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
According to claim 1,
The model generator
Based on a preset boundary value, the gas concentration corresponding to the peak data for learning is converted into a one-hot encoding vector and set as the boundary label,
Set a reference vector corresponding to the hidden vector of the learning peak data as an augmentation label,
Input the peak data for learning into a predictive model,
When the predictive model performs a plurality of operations in which weights between a plurality of layers are applied to the peak data for learning, output values of a plurality of hidden nodes of the last hidden layer and predicted values that are outputs of the output layer are calculated,
Boundary Augmentation Loss Function
Figure 112023010299886-pat00044
Depending on the
Boundary enhancement loss, including boundary loss, which is the difference between the predicted value and the boundary label, which is the output of the prediction model, and enhancement loss representing the difference between the output value of a plurality of hidden nodes of the last hidden layer of the prediction model and the augmented label, is minimized performing boundary enhancement optimization to modify the weights of the prediction model;
The Lboaderenhanced is a boundary enhancement loss function,
The Oi is a prediction value that is an output of the output layer of the prediction model,
vi is a boundary label corresponding to the predicted value,
The hij is an output value of a plurality of hidden nodes of the last hidden layer of the prediction model,
rij is an augmented label corresponding to the output values of the plurality of hidden nodes;
The i is an index corresponding to the output node of the output layer of the predictive model,
The j is an index corresponding to a plurality of hidden nodes of the last hidden layer of the prediction model
characterized by
A device for predicting dissolved gas concentrations.
제5항에 있어서,
상기 모델생성부는
상기 학습용 피크 데이터에 대응하는 가스 농도를 수치 레이블로 설정하고,
상기 학습용 피크 데이터를 예측모델에 입력하고,
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면,
상기 예측모델의 상기 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하는 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
According to claim 5,
The model generator
Set the gas concentration corresponding to the peak data for learning as a numerical label,
Input the peak data for learning into a predictive model,
When the predictive model calculates a predicted value by performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning,
Characterized in that performing numerical optimization of modifying the weight of the predictive model so that the numerical loss, which is the difference between the predicted value and the numerical label of the predictive model, is minimized
A device for predicting dissolved gas concentrations.
제6항에 있어서,
상기 모델생성부는
수치손실함수
Figure 112020101656791-pat00045

에 따라 상기 예측모델의 출력값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하며,
상기 Lvaule는 수치손실함수이고,
상기 Oi는 상기 예측모델의 출력인 예측값이고,
상기 Ci는 상기 예측값에 대응하는 수치 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
According to claim 6,
The model generator
Numerical loss function
Figure 112020101656791-pat00045

Performs numerical optimization to modify the weight of the prediction model so that the numerical loss, which is the difference between the output value of the prediction model and the numerical label, is minimized according to
The Lvaule is a numerical loss function,
The Oi is a prediction value that is an output of the prediction model,
Ci is a numerical label corresponding to the predicted value,
Characterized in that i is an index corresponding to the output node of the output layer of the predictive model
A device for predicting dissolved gas concentrations.
제1항에 있어서,
상기 가스가 CO이면, 상기 파장은 1948
Figure 112020101656791-pat00046
및 2063
Figure 112020101656791-pat00047
이고,
상기 가스가 아세트산염(Acetate)이면 상기 파장은 928
Figure 112020101656791-pat00048
이고,
상기 가스가 낙산염(Butyrate)이면, 상기 파장은 877
Figure 112020101656791-pat00049
인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
According to claim 1,
If the gas is CO, the wavelength is 1948
Figure 112020101656791-pat00046
and 2063
Figure 112020101656791-pat00047
ego,
If the gas is acetate, the wavelength is 928
Figure 112020101656791-pat00048
ego,
If the gas is butyrate, the wavelength is 877
Figure 112020101656791-pat00049
characterized in that
A device for predicting dissolved gas concentrations.
라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 장치에 있어서,
실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하고,
상기 학습 데이터를 이용하여 수용액에 포함된 가스 농도의 예측값을 산출하도록 인공신경망 알고리즘인 예측모델을 학습시키는 모델생성부;
를 포함하며,
상기 모델생성부는
상기 학습용 피크 데이터에 대응하는 가스 농도를 수치 레이블로 설정하고,
상기 학습용 피크 데이터를 예측모델에 입력하고,
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면,
상기 예측모델의 상기 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하되,
수치손실함수
Figure 112023010299886-pat00076

에 따라 상기 예측모델의 출력값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하며,
상기 Lvaule는 수치 손실함수이고,
상기 Oi는 상기 예측모델의 출력인 예측값이고,
상기 Ci는 상기 예측값에 대응하는 수치 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
An apparatus for predicting the concentration of dissolved gas in an aqueous solution based on a Raman spectroscopy signal,
Preparing learning data by extracting learning peak data of a wavelength corresponding to the type of gas and gas concentration corresponding to the learning peak data from Raman spectrum data, which is experimental data;
a model generator for learning a predictive model, which is an artificial neural network algorithm, to calculate a predicted value of a gas concentration contained in an aqueous solution using the learning data;
Including,
The model generator
Set the gas concentration corresponding to the peak data for learning as a numerical label,
Input the peak data for learning into a predictive model,
When the predictive model calculates a predicted value by performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning,
Perform numerical optimization to modify the weight of the predictive model so that the numerical loss, which is the difference between the predicted value and the numerical label of the predictive model, is minimized,
Numerical loss function
Figure 112023010299886-pat00076

Performs numerical optimization to modify the weight of the predictive model so that the numerical loss, which is the difference between the output value of the predictive model and the numerical label, is minimized according to
The Lvaule is a numerical loss function,
The Oi is a prediction value that is an output of the prediction model,
Ci is a numerical label corresponding to the predicted value,
Characterized in that i is an index corresponding to the output node of the output layer of the predictive model
A device for predicting dissolved gas concentrations.
삭제delete 제9항에 있어서,
상기 모델생성부는
학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 경계 레이블로 설정하고,
상기 학습용 피크 데이터를 예측모델에 입력하고,
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하면,
경계손실함수
Figure 112020101656791-pat00051
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계 최적화를 수행한 후,
기 설정된 경계값을 기준으로 학습용 피크 데이터에 대응하는 가스 농도를 원핫인코딩 벡터로 변환하여 상기 경계레이블로 설정하고,
상기 학습용 피크 데이터의 은닉벡터에 대응하는 기준벡터를 증강 레이블로 설정하고,
상기 학습용 피크 데이터를 예측모델에 입력하고,
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 마지막 은닉계층의 복수의 은닉노드의 출력값과, 출력층의 출력인 예측값을 산출하면,
경계증강손실함수
Figure 112020101656791-pat00052
에 따라
상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계 손실 및 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계증강 최적화를 수행하고,
상기 Lboaderselected는 경계 손실함수이고,
상기 Lboaderenhanced는 경계증강 손실함수이고,
상기 Oi는 상기 예측모델의 출력층의 출력인 예측값이고,
상기 vi는 상기 예측값에 대응하는 경계 레이블이고,
상기 hij는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값이고,
상기 rij는 상기 복수의 은닉노드의 출력값에 대응하는 증강 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이고,
상기 j는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드에 대응하는 인덱스인 것
을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
According to claim 9,
The model generator
The gas concentration corresponding to the peak data for learning is converted into a one-hot encoding vector based on a preset boundary value and set as a boundary label,
Input the peak data for learning into a predictive model,
When the predictive model calculates a predicted value by performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning,
boundary loss function
Figure 112020101656791-pat00051
After performing boundary optimization for modifying the weight of the prediction model so that the boundary loss, which is the difference between the predicted value and the boundary label, is minimized according to
Based on a preset boundary value, the gas concentration corresponding to the peak data for learning is converted into a one-hot encoding vector and set as the boundary label,
Set a reference vector corresponding to the hidden vector of the learning peak data as an augmentation label,
Input the peak data for learning into a predictive model,
When the predictive model performs a plurality of operations in which weights between a plurality of layers are applied to the peak data for learning, output values of a plurality of hidden nodes of the last hidden layer and predicted values that are outputs of the output layer are calculated,
Boundary Augmentation Loss Function
Figure 112020101656791-pat00052
Depending on the
Boundary enhancement loss, including boundary loss, which is the difference between the predicted value and the boundary label, which is the output of the prediction model, and enhancement loss representing the difference between the output value of a plurality of hidden nodes of the last hidden layer of the prediction model and the augmented label, is minimized performing boundary enhancement optimization to modify the weights of the prediction model;
The Lboaderselected is a boundary loss function,
The Lboaderenhanced is a boundary enhancement loss function,
The Oi is a prediction value that is an output of the output layer of the prediction model,
vi is a boundary label corresponding to the predicted value,
The hij is an output value of a plurality of hidden nodes of the last hidden layer of the prediction model,
rij is an augmented label corresponding to the output values of the plurality of hidden nodes;
The i is an index corresponding to the output node of the output layer of the predictive model,
The j is an index corresponding to a plurality of hidden nodes of the last hidden layer of the prediction model
characterized by
A device for predicting dissolved gas concentrations.
제9항에 있어서,
수용액에 내에 프로브를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 취득하고, 취득한 라만 스펙트럼 데이터를 제공하는 스펙트럼측정부;
상기 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 피크추출부; 및
상기 피크 데이터를 기초로 상기 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하고, 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 농도예측부;
를 더 포함하는 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 장치.
According to claim 9,
a spectrum measuring unit that emits light through a probe in an aqueous solution, measures the scattering of the emitted light, acquires Raman spectrum data, and provides the obtained Raman spectrum data;
a peak extraction unit extracting peak data of a wavelength corresponding to the type of gas from the Raman spectrum data; and
a concentration prediction unit that calculates a predicted value of the gas concentration included in the aqueous solution through the predictive model based on the peak data, and derives and outputs the gas concentration from the calculated predicted value;
characterized in that it further comprises
A device for predicting dissolved gas concentrations.
라만 분광 신호를 기초로 수용액의 용존 가스 농도를 예측하기 위한 방법에 있어서,
스펙트럼측정부가 수용액에 내에 프로브를 통해 빛을 발광하고, 발광된 빛이 산란되어 나오는 것을 측정하여 라만 스펙트럼 데이터를 취득하는 단계;
피크추출부가 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 피크 데이터를 추출하는 단계;
농도예측부가 상기 피크 데이터를 기초로 예측모델을 통해 상기 수용액에 포함된 가스 농도의 예측값을 산출하는 단계; 및
상기 농도예측부가 산출된 예측값으로부터 가스 농도를 도출하여 출력하는 단계;
를 포함하며,
상기 라만 스펙트럼 데이터를 취득하는 단계 전,
상기 모델생성부가 실험 데이터인 라만 스펙트럼 데이터로부터 가스의 종류에 상응하는 파장의 학습용 피크 데이터와 상기 학습용 피크 데이터에 대응하는 가스 농도를 추출하여 학습 데이터를 마련하는 단계;
상기 모델생성부가 상기 학습용 피크 데이터에 대응하는 가스 농도를 수치 레이블로 설정하는 단계;
상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계;
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하는 단계;
상기 모델생성부가 상기 예측모델의 상기 예측값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하는 단계;
를 더 포함하는 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 방법.
A method for predicting a dissolved gas concentration in an aqueous solution based on a Raman spectroscopy signal,
Acquiring Raman spectrum data by emitting light through a probe in an aqueous solution by a spectrum measuring unit and measuring scattering of the emitted light;
Extracting peak data of a wavelength corresponding to the type of gas from the Raman spectrum data by a peak extraction unit;
Calculating a predicted value of the gas concentration contained in the aqueous solution through a predictive model based on the peak data by a concentration predictor; and
deriving and outputting a gas concentration from the predicted value calculated by the concentration prediction unit;
Including,
Before acquiring the Raman spectrum data,
preparing learning data by extracting learning peak data of a wavelength corresponding to a type of gas and a gas concentration corresponding to the learning peak data from Raman spectrum data, which is experimental data, by the model generator;
setting a gas concentration corresponding to the peak data for learning as a numerical label by the model generating unit;
inputting the peak data for learning into a predictive model by the model generating unit;
calculating, by the predictive model, a predicted value by performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning;
performing numerical optimization by the model generating unit to modify weights of the predictive model so that a numerical loss, which is a difference between the predicted value and the numerical label of the predictive model, is minimized;
characterized in that it further comprises
A method for predicting dissolved gas concentrations.
제13항에 있어서,
상기 라만 스펙트럼 데이터를 취득하는 단계 전,
상기 모델생성부가 실험 데이터로부터 학습 데이터 및 검사 데이터를 추출하는 단계;
상기 모델생성부가 상기 예측모델의 은닉계층 및 은닉노드의 수를 설정하는 단계;
상기 모델생성부가 상기 학습 데이터를 이용하여 설정된 수의 은닉계층 및 은닉노드를 가지는 예측모델에 대한 학습을 수행하고, 상기 검사 데이터를 이용하여 예측모델(PM)의 학습 성과를 검사하고, 상기 모델생성부가 상기 학습 데이터의 정확도 및 상기 검사 데이터의 정확도를 산출하는 단계;
상기 모델생성부가 상기 학습 데이터 정확도가 상기 검사 데이터의 정확도 보다 높으면서 상기 학습 데이터 정확도 및 상기 검사 데이터의 정확도 양자 모두가 임계치 이상인 조건을 만족하는지 여부를 판별하는 단계; 및
상기 판별 결과, 상기 조건을 만족하면, 상기 모델생성부가 현재 설정에 따라 은닉계층 및 은닉노드의 수를 결정하는 단계;
를 포함하는 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 방법.
According to claim 13,
Before acquiring the Raman spectrum data,
extracting learning data and test data from the experimental data by the model generator;
setting the number of hidden layers and hidden nodes of the prediction model by the model generator;
The model generator performs learning on a predictive model having a set number of hidden layers and hidden nodes using the training data, inspects the learning performance of the predictive model (PM) using the test data, and generates the model additionally calculating the accuracy of the learning data and the accuracy of the inspection data;
determining, by the model generating unit, whether the accuracy of the training data is higher than that of the test data and a condition that both the accuracy of the learning data and the accuracy of the test data are equal to or greater than a threshold value is satisfied; and
determining, by the model generator, the number of hidden layers and hidden nodes according to a current setting, if the condition is satisfied as a result of the determination;
characterized in that it includes
A method for predicting dissolved gas concentrations.
제14항에 있어서,
상기 조건을 만족하는지 여부를 판별하는 단계후,
상기 판별 결과, 상기 조건을 만족하지 않으면,
상기 모델생성부가 은닉계층 및 은닉노드의 수를 재설정한 후, 상기 정확도를 산출하는 단계 및 상기 조건을 만족하는지 여부를 판별하는 단계를 반복하는 단계;
더 포함하는 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 방법.
According to claim 14,
After determining whether the above condition is satisfied,
As a result of the determination, if the above condition is not satisfied,
repeating the step of calculating the accuracy and the step of determining whether the condition is satisfied after the model generator resets the number of hidden layers and hidden nodes;
characterized in that it further comprises
A method for predicting dissolved gas concentrations.
삭제delete 제13항에 있어서,
상기 수치 최적화를 수행하는 단계는
상기 모델생성부가
수치손실함수
Figure 112023010299886-pat00053

에 따라 상기 예측모델의 출력값과 수치 레이블의 차이인 수치 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 수치 최적화를 수행하며,
상기 Lvalue는 수치손실함수이고,
상기 Oi는 상기 예측모델의 출력인 예측값이고,
상기 Ci는 상기 예측값에 대응하는 수치 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 방법.
According to claim 13,
The step of performing the numerical optimization is
The model generation unit
Numerical loss function
Figure 112023010299886-pat00053

Performs numerical optimization to modify the weight of the prediction model so that the numerical loss, which is the difference between the output value of the prediction model and the numerical label, is minimized according to
The Lvalue is a numerical loss function,
The Oi is a prediction value that is an output of the prediction model,
Ci is a numerical label corresponding to the predicted value,
Characterized in that i is an index corresponding to the output node of the output layer of the predictive model
A method for predicting dissolved gas concentrations.
제13항에 있어서,
상기 라만 스펙트럼 데이터를 취득하는 단계 전,
상기 모델생성부가 상기 학습용 피크 데이터에 대응하는 가스 농도를 기 설정된 경계값을 기준으로 원핫인코딩 벡터로 변환하여 경계 레이블로 설정하는 단계;
상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계;
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 예측값을 산출하는 단계;
상기 모델생성부가
경계손실함수
Figure 112020101656791-pat00054
에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계 최적화를 수행하는 단계;
를 더 포함하며,
상기 Lboaderselected는 경계 손실함수이고,
상기 Oi는 상기 예측모델의 출력인 예측값이고,
상기 vi는 상기 예측값에 대응하는 경계 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 방법.
According to claim 13,
Before acquiring the Raman spectrum data,
converting, by the model generator, the gas concentration corresponding to the peak data for training into a one-hot encoding vector based on a predetermined boundary value, and setting the boundary label;
inputting the peak data for learning into a predictive model by the model generating unit;
calculating, by the predictive model, a predicted value by performing a plurality of calculations to which weights between a plurality of layers are applied to the peak data for learning;
The model generation unit
boundary loss function
Figure 112020101656791-pat00054
performing boundary optimization of modifying weights of the prediction model so that boundary loss, which is a difference between a predicted value output from the prediction model and a boundary label, is minimized according to;
Including more,
The Lboaderselected is a boundary loss function,
The Oi is a prediction value that is an output of the prediction model,
vi is a boundary label corresponding to the predicted value,
Characterized in that i is an index corresponding to the output node of the output layer of the predictive model
A method for predicting dissolved gas concentrations.
제18항에 있어서,
상기 경계 최적화를 수행하는 단계 후,
상기 모델생성부가 기 설정된 경계값을 기준으로 학습용 피크 데이터에 대응하는 가스 농도를 원핫인코딩 벡터로 변환하여 상기 경계레이블로 설정하고, 상기 학습용 피크 데이터의 은닉벡터에 대응하는 기준벡터를 증강 레이블로 설정하는 단계;
상기 모델생성부가 상기 학습용 피크 데이터를 예측모델에 입력하는 단계;
상기 예측모델이 상기 학습용 피크 데이터에 대해 복수의 계층 간 가중치가 적용되는 복수의 연산을 수행하여 마지막 은닉계층의 복수의 은닉노드의 출력값과, 출력층의 출력인 예측값을 산출하는 단계;
상기 모델생성부가 경계증강손실함수
Figure 112020101656791-pat00055

에 따라 상기 예측모델의 출력인 예측값과 경계 레이블의 차이인 경계 손실 및 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값과 증강 레이블과의 차이를 나타내는 증강 손실을 포함하는 경계증강 손실이 최소가 되도록 상기 예측모델의 가중치를 수정하는 경계증강 최적화를 수행하는 단계;
를 더 포함하며,
상기 Lboaderenhanced는 경계증강 손실함수이고,
상기 Oi는 상기 예측모델의 출력인 예측값이고,
상기 vi는 상기 예측값에 대응하는 경계 레이블이고,
상기 i는 상기 예측모델의 출력층의 출력노드에 대응하는 인덱스이고,
상기 hij는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드의 출력값이고,
상기 rij는 상기 복수의 은닉노드의 출력값에 대응하는 증강 레이블이고,
상기 j는 상기 예측모델의 마지막 은닉계층의 복수의 은닉노드에 대응하는 인덱스인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 방법.
According to claim 18,
After performing the boundary optimization,
The model generation unit converts the gas concentration corresponding to the peak data for learning into a one-hot encoding vector based on a preset boundary value, sets it as the boundary label, and sets the reference vector corresponding to the hidden vector of the learning peak data as an augmented label doing;
inputting the peak data for learning into a predictive model by the model generating unit;
calculating an output value of a plurality of hidden nodes of a last hidden layer and a predicted value that is an output of an output layer by performing a plurality of operations in which weights between a plurality of layers are applied to the peak data for learning by the prediction model;
The model generation unit boundary enhancement loss function
Figure 112020101656791-pat00055

According to the boundary enhancement loss, including the boundary loss that is the difference between the predicted value and the boundary label, which is the output of the prediction model, and the enhancement loss representing the difference between the output value of a plurality of hidden nodes of the last hidden layer of the prediction model and the augmented label, Minimum performing boundary enhancement optimization to modify the weights of the prediction model so that
Including more,
The Lboaderenhanced is a boundary enhancement loss function,
The Oi is a prediction value that is an output of the prediction model,
vi is a boundary label corresponding to the predicted value,
The i is an index corresponding to the output node of the output layer of the predictive model,
The hij is an output value of a plurality of hidden nodes of the last hidden layer of the prediction model,
rij is an augmented label corresponding to the output values of the plurality of hidden nodes;
Characterized in that j is an index corresponding to a plurality of hidden nodes of the last hidden layer of the prediction model
A method for predicting dissolved gas concentrations.
제13항에 있어서,
상기 가스가 CO이면, 상기 파장은 1948
Figure 112020101656791-pat00056
및 2063
Figure 112020101656791-pat00057
이고,
상기 가스가 아세트산염(Acetate)이면 상기 파장은 928
Figure 112020101656791-pat00058
이고,
상기 가스가 낙산염(Butyrate)이면, 상기 파장은 877
Figure 112020101656791-pat00059
인 것을 특징으로 하는
용존 가스 농도를 예측하기 위한 방법.
According to claim 13,
If the gas is CO, the wavelength is 1948
Figure 112020101656791-pat00056
and 2063
Figure 112020101656791-pat00057
ego,
If the gas is acetate, the wavelength is 928
Figure 112020101656791-pat00058
ego,
If the gas is butyrate, the wavelength is 877
Figure 112020101656791-pat00059
characterized in that
A method for predicting dissolved gas concentrations.
KR1020200123589A 2020-09-24 2020-09-24 Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor KR102532757B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200123589A KR102532757B1 (en) 2020-09-24 2020-09-24 Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200123589A KR102532757B1 (en) 2020-09-24 2020-09-24 Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor

Publications (2)

Publication Number Publication Date
KR20220040651A KR20220040651A (en) 2022-03-31
KR102532757B1 true KR102532757B1 (en) 2023-05-12

Family

ID=80934811

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200123589A KR102532757B1 (en) 2020-09-24 2020-09-24 Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor

Country Status (1)

Country Link
KR (1) KR102532757B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020106340A (en) 2018-12-26 2020-07-09 キヤノン株式会社 Information processor, control method of information processor and program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02308359A (en) * 1989-05-24 1990-12-21 Japan Radio Co Ltd Multilayered neural network
US5615673A (en) * 1995-03-27 1997-04-01 Massachusetts Institute Of Technology Apparatus and methods of raman spectroscopy for analysis of blood gases and analytes
US6076392A (en) 1997-08-18 2000-06-20 Metasensors, Inc. Method and apparatus for real time gas analysis
KR102408951B1 (en) * 2017-09-18 2022-06-13 삼성전자주식회사 Apparatus and method for estimating glucose exposure, Apparatus and method for generating glucose exposure estimation model
KR102574088B1 (en) * 2018-08-10 2023-09-04 삼성전자주식회사 Apparatus and method for estimating analyte concentration, Apparatus and method for generating analyte concentration estimation model
KR102249319B1 (en) * 2018-10-25 2021-05-07 서강대학교산학협력단 Apparatus and Method for On-line Monitoring of Dissolved C1 Gas in Non-equilibrium State via Surface-enhanced Raman Spectroscopy Using Bimetallic Nanostructure
KR102271449B1 (en) * 2018-11-17 2021-07-01 한국과학기술정보연구원 Artificial intelligence model platform and operation method thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020106340A (en) 2018-12-26 2020-07-09 キヤノン株式会社 Information processor, control method of information processor and program

Also Published As

Publication number Publication date
KR20220040651A (en) 2022-03-31

Similar Documents

Publication Publication Date Title
RU2012152447A (en) WINDOW STATISTICAL ANALYSIS FOR DETECTING ANOMALIES IN GEOPHYSICAL DATA SETS
Hanifah et al. Smotebagging algorithm for imbalanced dataset in logistic regression analysis (case: Credit of bank x)
CN111879710B (en) Method, system, server and storage medium for evaluating corrosion resistance of steel structure coating
AU2013343203B2 (en) Method for processing an image
JP6596446B2 (en) Method and apparatus for estimating quality indicators for 3D images of composite parts
KR20200075071A (en) Apparatus and Method for Generating Sampling Model for Uncertainty Prediction, Apparatus for Predicting Uncertainty
US20240053302A1 (en) Ultrasonic non-destructive test method and system using deep learning, and auto-encoder-based prediction model training method used therefor
Bandara et al. The three-stage artificial neural network method for damage assessment of building structures
EP4123287A1 (en) N-value prediction device and method using data augmentation-based artificial intelligence
KR102489473B1 (en) Method and system for predicting climate indices using artificial intelligence model capable of providing uncertainty and relevance for climate index prediction result
KR102532757B1 (en) Apparatus for predicting dissolved gas concentration in aqueous solution based on Raman spectral signal and method therefor
Zhang et al. Identification of concrete surface damage based on probabilistic deep learning of images
Mohamed et al. A hybrid intelligent approach for metal-loss defect depth prediction in oil and gas pipelines
KR20190139254A (en) Inspection method and inspection equipment
Mariscal et al. Enhanced analysis of experimental x-ray spectra through deep learning
KR102336962B1 (en) Apparatus for automatically performing labeling through Semi-weakly supervised learning and method therefor
Krüger et al. Evaluating spatial data acquisition and interpolation strategies for river bathymetries
Lowe et al. Echofilter: A Deep Learning Segmention Model Improves the Automation, Standardization, and Timeliness for Post-Processing Echosounder Data in Tidal Energy Streams
CN109145887B (en) Threshold analysis method based on spectral latent variable confusion discrimination
Cao et al. A novel pca-bp fuzzy neural network model for software defect prediction
Carpenter Machine Learning Brings Vast Core-Analysis Legacy Data to Life
Low-Choy et al. Experimenting with modelling via a virtual laboratory: Evaluating pseudo-absence strategies to refine a species distribution model
JP2021197008A (en) Information processing device, learning method, and learning program
CN117233347B (en) Carbon steel spheroidization grade measuring method, system and equipment
ALI et al. NEW SOFTWARE DEFECT PREDICTION METHOD BASED ON PCA AND OPTIMIZED LSTM

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant