KR20090071219A - Method for determining mixing ratios in a mixture via non-negative independent component analysis - Google Patents
Method for determining mixing ratios in a mixture via non-negative independent component analysis Download PDFInfo
- Publication number
- KR20090071219A KR20090071219A KR1020070139451A KR20070139451A KR20090071219A KR 20090071219 A KR20090071219 A KR 20090071219A KR 1020070139451 A KR1020070139451 A KR 1020070139451A KR 20070139451 A KR20070139451 A KR 20070139451A KR 20090071219 A KR20090071219 A KR 20090071219A
- Authority
- KR
- South Korea
- Prior art keywords
- mixture
- negative
- independent component
- independent
- component analysis
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/28—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
- G01N1/38—Diluting, dispersing or mixing samples
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/20—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
- G01N23/207—Diffractometry using detectors, e.g. using a probe in a central position and one or more displaceable detectors in circumferential positions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/22—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
- G01N23/223—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2223/00—Investigating materials by wave or particle radiation
- G01N2223/05—Investigating materials by wave or particle radiation by diffraction, scatter or reflection
- G01N2223/056—Investigating materials by wave or particle radiation by diffraction, scatter or reflection diffraction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2223/00—Investigating materials by wave or particle radiation
- G01N2223/10—Different kinds of radiation or particles
- G01N2223/101—Different kinds of radiation or particles electromagnetic radiation
- G01N2223/1016—X-ray
Landscapes
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
Description
본 발명은 미지 혼합물의 구성성분 비율을 결정하는 방법에 관한 것으로서, 보다 상세하게는 비음독립성분분석과 비음최소제곱법을 이용하여 미지 혼합물을 이루는 각 구성성분의 비율을 정확히 예측할 수 있는 혼합물 구성비 결정 방법에 관한 것이다. The present invention relates to a method for determining the composition ratio of an unknown mixture, and more particularly, to determine a mixture composition ratio that can accurately predict the ratio of each component constituting the unknown mixture using non-negative independent component analysis and non-negative square method. It is about a method.
혼합물 시료에 대한 X선 회절(X-Ray Diffraction: XRD) 분석을 통해 혼합물의 구성성분을 검출하고, 각 구성성분의 성분비를 측정할 수 있다. 종래에는 분말 X선 회절법을 이용하여 혼합물의 성분을 정량적으로 분석하기 위해, 혼합물 시료를 구성하는 순수성분에 대한 각각의 XRD 스펙트럼을 측정하고 혼합물 시료의 XRD 스펙트럼을 측정하여 이들을 비교하는 방법이 일반적으로 사용되었다. 그러나 이러한 혼합물 분석 방법은 시료를 구성하는 순수한 물질의 XRD 데이터를 구할 수 없거나 측정이 불가능한 경우에는 사용할 수 없다는 문제점을 가지고 있다. 또한 혼합물 시료뿐만 아니라 구성성분인 순수물질을 측정하고 이들을 비교하는 데에는 많은 시간이 걸리며, 필요한 데이터 중 일부 데이터가 없을 경우에는 정량적인 결과를 얻을 수 없는 경우가 많다. X-ray diffraction (XRD) analysis of the mixture sample can detect the components of the mixture and determine the component ratio of each component. Conventionally, in order to quantitatively analyze the components of a mixture by using powder X-ray diffraction, it is common to measure the XRD spectra of the pure components constituting the mixture sample and to compare them by measuring the XRD spectra of the mixture samples. Was used. However, this mixture analysis method has a problem that it cannot be used when XRD data of the pure substance constituting the sample cannot be obtained or cannot be measured. In addition, it takes a lot of time to measure and compare the pure substances as components, as well as mixture samples, and in some cases quantitative results cannot be obtained without some of the necessary data.
이러한 문제를 극복하고자 미지의 혼합물에 대한 XRD 강도 데이터를 기초로 독립성분분석(Independent Component Analysis: ICA)법을 이용하여 독립성분을 분리하고, 분리된 각 독립성분에 대한 비율을 예측하고자 하는 방안이 제안되었다. 그러나, 이러한 독립성분분석을 이용한 미지 혼합물의 정량적 분석에 따르면, 혼합물의 구성성분이 본래 비음(non-native)이고 근저성인 순수물질임에도 불구하고 독립성분분석으로 도출된 독립성분이 음수인 경우가 발생된다. In order to overcome this problem, an independent component analysis (ICA) method is used to separate independent components based on the XRD intensity data of unknown mixtures, and the ratio of each separated component is estimated. Proposed. However, according to the quantitative analysis of the unknown mixture using the independent component analysis, the independent component derived by the independent component analysis is negative even though the components of the mixture are originally non-native and basal pure substances. .
본래 독립성분들이 비음인 경우, 다음과 같은 2가지 이유로 기존의 독립성분분석에 의해 도출된 독립성분이 음수인 범위가 발생한다. 첫째, 기존의 독립성분분석의 경우 비음인 독립성분으로 이루어진 혼합물 데이터를 전처리함으로써 평균이 0인 정규직교행렬을 만들고, 이것과 가중치 벡터의 곱의 비정규성이 최대인 독립성분을 추출하는데, 이로 인해 독립성분의 노이즈 부분이 전체적으로 음수가 되는 문제가 발생한다. 둘째, 개별 독립성분 내의 성분간 분산이 크고 피크들의 폭이 좁은 혼합물 데이터의 경우 독립성분간의 간섭이 발생하여 독립성분의 일정 범위에서 순간적으로 큰 강도의 음수 피크가 발생하는 문제가 발생한다. 상술한 독립성분의 음수 발생 문제뿐만 아니라, 독립성분분석에 의해 도출된 각 독립성분의 계수도 음수 로 추정되는 문제가 발생할 수 있다. 그러나 혼합물의 독립성분 비율을 계산하는 경우, 그 비율을 나타내는 독립성분의 계수는 비음의 값이 되어야 한다. If the independent components are nonnegative in nature, a range occurs in which the independent components derived by the existing independent component analysis are negative for two reasons. First, in the existing independent component analysis, a normal orthogonal matrix having a mean of 0 is generated by preprocessing mixture data composed of nonnegative independent components, and an independent component having the maximum nonnormality of the product of the weight vector is extracted. There arises a problem that the noise part of the independent component becomes negative in its entirety. Second, in the case of mixture data having a large dispersion between components in individual independent components and narrow widths of peaks, interference between independent components occurs, and a negative intensity peak of a large intensity occurs within a range of independent components instantaneously. In addition to the negative generation problem of the independent components described above, a problem may also occur in which the coefficient of each independent component derived by the independent component analysis is also negative. However, when calculating the proportion of independent components of a mixture, the coefficient of independent components representing that proportion should be a negative value.
본 발명의 일 측면은, 상기한 종래의 문제점을 해결하기 위해 제안된 것으로서, 본래 비음인 독립성분으로 구성된 혼합물을 비음독립성분분석에 적용하여 독립이고 양수인 미지 구성성분을 분리하고, 분리된 성분 간이 비율을 비음으로서 정확하고 신속하게 예측, 결정하는 방법을 제공한다. One aspect of the present invention is proposed to solve the above-mentioned conventional problems, by applying a mixture consisting of independent non-negative independent components to non-negative independent component analysis to separate the independent and positive unknown components, and to separate the separated components It provides a method for predicting and determining accurate and fast by emptying a ratio.
본 발명의 일 측면에 따른 비음독립성분분석을 통한 혼합물 성분비 결정 방법은, m개의 혼합물 시료(m은 1이상의 정수)에 대한 X선 회절 강도 데이터를 획득하는 단계; 상기 획득된 X선 회절 강도 데이터를 기초로, 비음독립성분분석을 사용하여 상기 혼합물 시료로부터 상기 혼합물 시료의 독립성분을 도출하는 단계; 및 상기 추출된 독립성분을 기초로, 비음최소제곱법을 사용하여 상기 혼합물 시료의 구성성분 비율을 나타내는 혼합물 계수를 산정하는 단계;를 포함한다. Mixture component ratio determination method through non-negative independent component analysis according to an aspect of the present invention, the step of obtaining the X-ray diffraction intensity data for m mixture samples (m is an integer of 1 or more); Deriving independent components of the mixture sample from the mixture sample using non-negative independent component analysis based on the obtained X-ray diffraction intensity data; And calculating, based on the extracted independent components, a mixture coefficient representing the constituent ratio of the mixture sample using a nonnegative square method.
본 발명의 실시형태에 따르면, 상기 독립성분 도출 단계는, According to an embodiment of the present invention, the independent component derivation step,
상기 m개의 혼합물 시료의 X선 회절 강도 데이터(X)에 대하여 평균이 0이고 표준편차가 1인 표준정규분포에서 초기의 가중치 벡터(w)를 랜덤하게 선택하는 제1 단계; A first step of randomly selecting an initial weight vector ( w ) from a standard normal distribution having a mean of 0 and a standard deviation of 1 with respect to the X-ray diffraction intensity data ( X ) of the m mixture samples;
w ← E[xg(w T x)]-wE[g(w T x)]의 수식을 사용하여 상기 초기 가중치 벡터 w를 새로운 가중치 벡터로 수정하는 제2 단계 (여기서 x T 는 x T =(X1,..., Xm)으로서 혼합물 변수 벡터이고, 기대치 E는 데이터의 평균으로 추정하고, 함수 g는 non-quardratic 함수 G의 미분함수로서 g(u) = tanh(u)임) ; w ← E [x g (w T x)] - wE [g (w T x)] the second step formula with a modifying said initial weight vector w with a new weight vectors (where x T is x T = (X 1 , ..., X m ) is a mixture variable vector, the expected E is estimated as the mean of the data, and the function g is the derivative of the non-quardratic function G, where g (u) = tanh (u)) ;
상기 제2 단계에서 얻은 새로운 가중치 벡터 w를 이용하여 w ← w/∥w∥의 수식을 통해 현재의 가중치 벡터로 변경하는 제3 단계; A third step of changing the current weight vector using a new weight vector w obtained in the second step through a formula of w ← w / ∥ w ∥;
상기 제3 단계에서 얻은 현재의 가중치 벡터 w에 대해 w T x ≥0이 되도록 음수부분을 비음처리하는 제4 단계;A fourth step of non-negative processing the negative part such that w T x ? 0 with respect to the current weight vector w obtained in the third step;
상기 비음처리된 현재의 가중치 벡터와 이전 단계의 가중치 벡터의 차이가 기설정된 값 이하로 수렴하는지 판단하는 제5 단계; 및 A fifth step of determining whether a difference between the non-negative current weight vector and the previous weight vector converges to a predetermined value or less; And
상기 판단 결과 수렴하지 않으면 상기 제2 단계로 진행하여 그 이후의 단계들을 반복 수행하고, 상기 판단 결과 수렴하면 S=w T x를 통해 독립성분(S)를 계산하는 제6 단계;를 포함할 수 있다.And if the convergence result does not converge, proceeding to the second step and repeating subsequent steps; and if the convergence result converges, calculating the independent component S through S = w T x ; have.
상기 제1 내지 제6 단계는, 상기 혼합물 시료의 독립성분의 갯수만큼 반복 수행되어 w를 구하고 이로부터 각 독립성분을 얻을 수 있다. 상기 제5 단계에서, 상기 기설정된 값은 0.0001로 설정될 수 있다.The first to sixth steps may be repeated by the number of independent components of the mixture sample to obtain w and obtain each independent component therefrom. In the fifth step, the predetermined value may be set to 0.0001.
상기 제4 단계는, 아래의 수학식으로 표현되는 3가지 방법중 적어도 하나의 방법을 이용하여 상기 음수부분을 비음처리할 수 있다. In the fourth step, the negative portion may be non-negative using at least one of three methods represented by the following equation.
. .
본 발명의 실시형태에 따르면, 상기 혼합물 계수 산정 단계는, According to an embodiment of the invention, the step of calculating the coefficient of mixture,
x선 회절 강도의 측정 각도수 차원이 n(n은 1이상의 정수)인 상기 m개의 혼합물 시료에 대해 (m×n)의 혼합물 관측 행렬(X)과, (p×n)의 독립성분 행렬(S)을 이용하여(p는 1이상의 정수) 최소제곱법을 적용하여 수학식 B T = (SS T ) -1 SX T 을 통해 혼합물 계수 행렬 B를 산출하는 단계; The mixture observation matrix X of (m × n) and the independent component matrix of (p × n) for the m mixture samples of which the measurement angle dimension of the x-ray diffraction intensity dimension is n (n is an integer of 1 or more) Calculating a mixture coefficient matrix B through equation B T = ( SS T ) −1 SX T by applying the least square method using S ) (p is an integer of 1 or more);
상기 혼합물 계수 행렬 B의 j번째 행벡터를 b j = (bji,..., bjp)라 할 때, 상기 행벡터 bj의 원소들중 최소값 bjmin = min(bji,..., bjp)을 구하는 단계; When the j th row vector of the mixture coefficient matrix B is b j = (b ji , ..., b jp ), the minimum value of the elements of the row vector bj b jmin = min (b ji , ..., b jp Obtaining;
상기 최소값 bjmin ≥ 0 인지 판단하는 단계;Determining whether the minimum value b jmin ≥ 0;
상기 판단 결과, 상기 최소값 bjmin ≥ 0 이면 아래의 수식을 통해 상기 행벡터 b j 의 원소들의 합이 1이 되도록 재조정하여 혼합물의 계수(aij)를 구하고, 상기 최소값 bjmin < 0 이면 수식 bji ← bji-bjmin 을 통해 상기 행벡터 bj의 원소를 조정한 후, 상기 조정된 이후의 행벡터 bj의 원소들의 합이 1이 되도록 아래의 수식을 통해 다시 재조정하여 혼합물의 계수(aij)를 구하는 단계,As a result of the determination, if the minimum value b jmin ≥ 0, the coefficient (a ij ) of the mixture is obtained by adjusting the sum of the elements of the row vector b j to be 1 through the following equation, and if the minimum value b jmin <0, the expression bji ← after adjusting the elements of the row vector bj through b ji -b jmin, and re-adjusting the coefficients of the mixture (a ij ) by the following equation so that the sum of the elements of the adjusted row vector bj is 1; ,
; ;
를 포함할 수 있다.It may include.
본 발명에 따르면, 비음이고 근저성인 독립성분으로 구성된 혼합물 데이터의 독립성분을 분리해낼 수 있고, 혼합물의 구성성분 비율을 신속하고 정확하게 예측할 수 있다. 종래 혼합물 시료를 구성하는 순수물질에 대한 데이터를 구할 수 없거나 측정이 불가능한 경우에도, 혼합물의 X선 회절 강도 데이터로부터 단시간에 그 구성성분의 비율을 얻을 수 있을 뿐만 아니라, 독립성분분석을 이용할 때 발생하는 음수의 독립성분 발생을 방지하여 성분비를 정확히 결정할 수 있다. According to the present invention, it is possible to separate the independent components of the mixture data composed of the nonnegative and hypotonic independent components, and to quickly and accurately predict the component ratio of the mixture. Even when data on the pure substance constituting the mixture mixture is not available or cannot be measured, the ratio of the components can be obtained from the mixture's X-ray diffraction intensity data in a short time, and when the independent component analysis is used. The component ratio can be accurately determined by preventing the generation of negative independent components.
이하, 첨부된 도면을 참조하여 본 발명의 실시형태를 설명한다. 그러나, 본 발명의 실시형태는 여러가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 이 하 설명하는 실시형태로 한정되는 것은 아니다. 본 발명의 실시형태는 당업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. However, embodiments of the present invention may be modified in various other forms, and the scope of the present invention is not limited to the embodiments described below. Embodiments of the present invention are provided to more completely explain the present invention to those skilled in the art.
비음독립성분분석은 혼합물 데이터로부터 본래의 독립성분이 비음인 조건하에서 독립성분분석 문제 해결을 통해 도출된 독립성분들이 서로 독립이고 양수인 독립성분을 추출하는 통계적 기법이다. 만약 실수값을 갖는 P개의 미지 성분으로 구성된 독립성분 벡터 s = [S1, S2,..., Sp]가 있다고 가정하는 경우, i 번째 독립성분에 대한 2가지 조건을 다음과 같이 표현할 수 있다. Non-negative independent component analysis is a statistical technique for extracting independent and positive independent components derived from solving mixture problem analysis problem under the condition that original independent component is non-negative. If it is assumed that there is an independent component vector s = [S1, S2, ..., Sp] consisting of P unknown components with real values, two conditions for the i-th independent component may be expressed as follows.
비음: Pr(Si < 0) = 0, (i = 1,..., p)Nasal: Pr (Si <0) = 0, (i = 1, ..., p)
근저성: Pr(Si < δ) > 0, ∀δ(>0), (i = 1,..., p)Basis: Pr (Si <δ)> 0, ∀δ (> 0), (i = 1, ..., p)
(여기서, Pr은 확률을 나타냄)Where Pr represents the probability
본 발명에서는 비음독립성분분석을 이용하여 본래 비음이고 근저성인 순수물질이 섞인 혼합물에 대하여 측정된 시그널 데이터로부터 구성성분들을 도출하고, 이를 비음최소제곱법에 적용하여 원래의 혼합물 데이터 값에 회귀하는 방식으로 독립성분들의 구성비율을 예측하는 방법을 제안한다. 그 적용예로서 철의 제조 과정에서 촉매제로 사용되는 몰드 플럭스의 주요 구성성분인 SiO2, TiO2, MgO로 구성되는 혼합물 분말의 스펙트럼의 구성성분을 분리한 다음 각 구성성분의 비율을 예측할 수 있다. In the present invention, by using the non-negative independent component analysis, the components are derived from the measured signal data of the mixture containing the purely nonnegative and hypo-negative substances, and applied to the non-negative square method to return the original mixture data values. We propose a method for predicting the composition ratio of independent components. As an application example, the components of the spectrum of the mixture powder composed of
도 1은 본 발명의 실시형태에 따른 혼합물 성분비 결정 방법을 설명하기 위한 흐름도이다. 도 1을 참조하면, 먼저 n개의 혼합물 시료에 X선을 조사하여 시료로부터 회절된 X선 회절(XRD) 강도 데이터를 획득한다(S100). 획득된 XRD 강도 데이터는 특정 각도 범위에서 회절 각도축(x축) 상에서 n차원으로 측정된 XRD 강도값일 수 있다. 예를 들어, 10개의 분말 혼합물 시료에 대한 XRD 강도 데이터로서, x축 상의 20~70도 각도 범위에서 0.05도 간격으로 1000개의 회절 각도(1000차원)에서 측정한 y축 상의 XRD 강도값이 제시될 수 있다. 이 경우, m=10이고, n=1000이 된다. BRIEF DESCRIPTION OF THE DRAWINGS It is a flowchart for demonstrating the mixture component ratio determination method which concerns on embodiment of this invention. Referring to FIG. 1, first, X-rays are irradiated to n mixture samples to obtain X-ray diffraction (XRD) intensity data diffracted from the sample (S100). The obtained XRD intensity data may be an XRD intensity value measured in n dimensions on the diffraction angle axis (x axis) in a specific angular range. For example, as XRD intensity data for 10 powder mixture samples, XRD intensity values on the y axis measured at 1000 diffraction angles (1000 dimensions) at 0.05 degree intervals in the 20 to 70 degree angle range on the x axis will be presented. Can be. In this case, m = 10 and n = 1000.
m개 혼합물 시료에 대해 측정각도수 n차원으로 획득된 XRD 데이터는 아래와 같이 (m×n) 행렬 X (혼합물 관측 행렬)로 표현될 수 있다. XRD data obtained in n-dimensional angles of measurement for m mixture samples may be expressed as (m × n) matrix X (mixture observation matrix) as follows.
예를 들어, 도 4의 회절 강도 스펙트럼은 10개의 혼합물 시료에 대해 1000차원의 측정 각도수로 측정하여 얻은 스펙트럼이다. 여기서, 혼합물 관측 행렬 X의 각 원소(xij)는 XRD 강도값을 나타낸다. For example, the diffraction intensity spectrum of FIG. 4 is a spectrum obtained by measuring a measurement angle of 1000 dimensions for 10 mixture samples. Here, each element (x ij ) of the mixture observation matrix X represents an XRD intensity value.
다음으로, 상기 획득된 XRD 데이터를 기초로, 비음독립성분분석을 사용하여 혼합물 시료로부터 독립성분을 도출한다(S102). 본 실시형태에서는 미지의 혼합물 시료로부터 독립성분을 뽑아내기 위하여 FastICA(Fast Independent Component Analysis)과 같은 독립성분분석 방법 대신에, 이를 변형한 비음독립성분분석 방법을 제안하고(도 2 참조), 이를 NNFICA(Non-negative Fast Independent Component Analysis)로 칭한다. Next, based on the obtained XRD data, an independent component is derived from the mixture sample using non-negative independent component analysis (S102). In this embodiment, instead of an independent component analysis method such as FastICA (Fast Independent Component Analysis) in order to extract an independent component from an unknown mixture sample, a modified non-negative component analysis method is proposed (see FIG. 2), and this is NNFICA. (Non-negative Fast Independent Component Analysis).
혼합물 시료가 m개이고(예:j = 1,...,10), XRD 측정 각도수가 n차원이고(예: k=1,...,1000)이고, 혼합물의 독립성분 S가 p개(예: i=1, 2, 3)라고 하면, XRD 강도값(X)은 예컨대, 아래의 수학식 1과 같이 표현될 수 있다.M mixture samples (e.g. j = 1, ..., 10), XRD measurement angles in n dimensions (e.g. k = 1, ..., 1000), p independent components S of the mixture ( Example: i = 1, 2, 3), the XRD intensity value (X) can be expressed by, for example,
여기서, aji는 i번째 독립성분에 대한 j번째 혼합물의 계수를 나타낸다. Where a ji represents the coefficient of the jth mixture with respect to the ith independent component.
수학식 1을 행렬 형태로 표현하면, X = (Xjk), S = (Sik), A = (aji)일 때, X = AS로 표현될 수 있다. When
독립성분 S를 도출하기 위해 비음독립분석법이 사용되는데, 구체적인 독립성 분 도출방법은 도 2를 참조하여 아래와 같이 설명될 수 있다. A non-negative independence analysis method is used to derive the independent component S, which can be described below with reference to FIG. 2.
독립성분의 도출Derivation of Independent Ingredients
하나의 독립성분을 나타내는 확률변수 S는 S = w T x로 표현될 수 있으며, 독립성분 S를 얻기 위하여, w T x의 비정규성을 최대화시키는 가중치 벡터 w를 구한다. 여기서, w T 는 w의 전치행렬로서 w T = (w1,...,wm)로 표현될 수 있고, x의 전치행렬인 x T 는 x T = (X1,...,Xm)으로서 혼합물 변수 벡터이다(위첨자 'T'는 전치행열임을 나타냄). 따라서, S = w1X1+...+wmXm = w T x 이다. 독립성분(S)를 구하기 위해 수식 S=w T x에 대입될 가중치 벡터 w를 구하는 과정은 다음과 같다. The random variable S representing one independent component may be expressed as S = w T x , and in order to obtain the independent component S, a weight vector w maximizing the nonnormality of w T x is obtained. Here, w is T w T = (w 1, ... , w m) can be expressed as a transposed matrix of x is x T x T = (X 1, a transpose matrix of w ..., X m ) as a mixture variable vector (superscript 'T' indicates a transpose). Thus, S = w 1 X 1 + ... + w m X m = w T x . The process of obtaining the weight vector w to be substituted into the equation S = w T x to find the independent component S is as follows.
(1) 도 2에 도시된 바와 같이, 먼저 m개의 혼합물 시료의 X선 회절 강도 데이터(X)에 대하여, 초기 가중치 벡터 w 랜덤하게 선택한다(S200). 이 때, 평균이 0이고 표준편차가 1인 표준 정규분포에서 초기 가중치 벡터 w를 랜덤하게 선택하여 (m×1)의 열벡터를 추출한다. (1), the first select the initial weight vector w with respect to the random X-ray diffraction intensity data (X) of the m sample mixture as shown in Figure 2 (S200). At this time, an initial weight vector w is randomly selected from a standard normal distribution having a mean of 0 and a standard deviation of 1, and a column vector of (m × 1) is extracted.
(2) 다음으로, 수식 w ← E[xg(w T x)]-wE[g(w T x)]을 사용하여 상기 초기 가중치 벡터 w를 새로운 가중치 벡터로 수정한다(S202). 여기서, 기대치 E는 회절강도 데이터의 평균으로 추정하고, 함수 g는 non-quardratic 함수 G의 미분함수로서 g(u) = tanh(u)이다. (2) Next, the initial weight vector w is modified to a new weight vector using the formula w ← E [ x g ( w T x )]-wE [g ( w T x )] (S202). Here, the expected value E is estimated as an average of the diffraction intensity data, and the function g is a derivative of the non-quardratic function G, where g (u) = tanh (u).
(3) 다음으로, w ← w/∥w∥의 수식을 통해 상기 (2)에서 얻은 새로운 가중치 벡터 w를 현재의 가중치 벡터로 변경한다(S204). (3) Next, the new weight vector w obtained in the above (2) is changed into the current weight vector through the formula w ← w / ∥ w ∥ (S204).
(4) 다음으로, 상기 제3 단계에서 얻은 현재의 가중치 벡터 w에 대해 w T x ≥0이 되도록 음수부분을 비음처리하여 변환한다(S206). (4) Next, the negative portion is non-negative and transformed so that w T x ≥ 0 with respect to the current weight vector w obtained in the third step (S206).
여기서, 음수인 독립성분의 비음처리를 위해 3가지 방법(방법1, 방법2, 방법3)을 다음과 같이 제안한다. Here, three methods (
. .
위 3가지 비음처리 방법은 NNFICA의 반복과정마다 도출된 독립성분의 음수부분을 최소화하거나 보상하면서 일정한 가중치 벡터로 수렴하는 것을 목적으로 제안된 것이다. The above three non-negative processing methods are proposed to converge to a constant weight vector while minimizing or compensating the negative part of the independent components derived for each iteration of NNFICA.
(5) 다음으로, 상기 비음처리까지 거친 현재의 가중치 벡터와 이전 단계의 가중치 벡터의 크기의 차이가 기설정된 값 이하로 수렴하는지 판단한다(S208). 본 실시형태에는 현재 w와 이전 단계의 w의 크기가 0.0001 이하이면 수렴하는 것으로 설정한다. (5) Next, it is determined whether the difference between the magnitude of the current weight vector passed through the non-negative processing and the weight vector of the previous step converges below a predetermined value (S208). In the present embodiment, the convergence is set when the magnitude of the current w and the w in the previous step is 0.0001 or less.
(6) 상기 판단 결과 수렴하지 않으면 다시 (2)로 진행하여 그 이후의 단계들을 반복 수행하고, 상기 판단 결과 수렴하면 최종 w를 사용하여 S=w T x를 통해 독립성분(S)를 계산한다(S210). (6) If the result of the determination does not converge, the process proceeds to (2) again and repeats subsequent steps, and if the result of the determination converges, the independent component S is calculated by using S = w T x using the final w . (S210).
위 (1) 내지 (6) 과정을 혼합물 시료의 독립성분의 갯수만큼 반복 수행하여 각 독립성분에 대한 w를 구하고 이로부터 각 독립성분을 얻을 수 있다(도 5 참조). Repeating steps (1) to (6) as many as the number of independent components of the mixture sample to obtain w for each independent component can be obtained from each independent component (see Figure 5).
상술한 바와 같이, 비음독립분석, 특히 본 실시형태에서 제안하는 NNFICA에 의한 방법(상술한 (1) 내지 (6) 참조)에 의하여 독립성분(S)을 구한 다음에는, 위와 같이 추출된 독립성분(S)을 기초로 비음최소제곱법(non-negative least squares)을 사용하여 혼합물 계수를 산정함으로써, 혼합물 시료의 구성성분 비율을 얻는다(도 1의 단계 S104). 구체적인 혼합물 계수 산정 방법은 도 3을 참조하여 아래와 같이 설명될 수 있다. As described above, after obtaining the independent component (S) by the non-negative independence analysis, in particular, the method according to the NNFICA proposed in this embodiment (see (1) to (6) described above), the independent component extracted as described above By calculating the mixture coefficients using non-negative least squares based on (S), the component proportions of the mixture samples are obtained (step S104 in FIG. 1). Specific mixture coefficient calculation method can be described as follows with reference to FIG.
혼합물 계수 산정Calculation of Mixture Factor
아래의 수학식2의 모형을 통해 혼합물 계수를 나타내는 aji를 구한다. From the model of
단, 이며, εjk는 회귀모형관련 오차항을 나타낸다.only, Ε jk represents the error term related to the regression model.
위 수학식 2는 비음최소제곱법을 나타내는 식으로 아래 기술된 과정을 통해 혼합물 계수를 구할 수 있다. 우선, (m×n) 행렬로 표현되는 혼합물 관측 행렬을 X = (Xjk)라 하고, (p×n) 행렬로 표현되는 독립성분 행렬을 S = (Sik)라고 하자.
[1] 최소제곱법에 의하여 아래의 수학식 3을 통해 혼합물 계수 행렬 B를 산출한다(S300). [1] The mixture coefficient matrix B is calculated through
[2] 다음으로, 위 [1]에서 구한 혼합물 계수 행렬 B의 j번째 행벡터를 b j = (bji,..., bjp)라 할 때, 상기 행벡터 bj의 원소들중 최소값 bjmin = min(bji,..., bjp) 을 구한다(S302). [2] Next, when the j th row vector of the mixture coefficient matrix B obtained in the above [1] is b j = (b ji , ..., b jp ), the minimum value of the elements of the row vector bj b jmin = min (b ji , ..., b jp ) is obtained (S302).
[3] 다음으로, 비음처리를 위해, bjmin ≥ 0 인지 여부를 판단한다(S304). [3] Next, for non- sound processing, it is determined whether b jmin ≥ 0 (S304).
[4-1] 상기 판단 결과, bjmin ≥ 0 이면 아래의 [5]로 간다.[4-1] As a result of the determination, if b jmin ? 0, the process goes to the following [5].
[4-2] 상기 판단 결과, bjmin < 0 이면 아래 수학식 4와 같이 행벡터 bj의 원소를 조정한 후(S306) 아래의 [5]로 간다. [4-2] As a result of the determination, if b jmin < 0, the elements of the row vector bj are adjusted as shown in
[5] 아래의 수학식 5와 같이 행벡터 b j 의 원소들의 합이 1이 되도록 재조정하여 혼합물 계수를 나타내는 aji를 구한다(S308). [5] As shown in
[1] ~[5]의 과정을 통해 혼합물 계수, 즉 혼합물의 구성성분의 성분비를 얻 게 된다. Through [1] ~ [5], the mixture coefficients, ie the component ratios of the components of the mixture, are obtained.
(실시예)(Example)
본 발명자들은, 상술한 혼합물 성분비 결정 방법의 적용예로서 철 제조과정에서 촉매제로 사용되는 몰드 플럭스의 분말 혼합물 시료(SiO2, TiO2, MgO를 포함)에 대하여 상술한 비음독립성분분석과 비음최소제곱법을 사용하여 혼합물의 독립성분을 분리하고, 각 구성성분의 비율을 예측하였다. The present inventors have applied the above-described non-negative independent component analysis and non-negative minimum for powder mixture samples (including SiO 2 , TiO 2 , and MgO) of a mold flux used as a catalyst in the iron manufacturing process as an application example of the above-described mixture component ratio determination method. Square method was used to separate the independent components of the mixture and predict the proportion of each component.
도 4는 그 분말 혼합물 시료 10개에 대한 XRD 강도 스펙트럼을 나타낸 것이다. 이 스펙트럼은 20도에서 70도까지 0.05도 간격으로 1000차원(x축) 측정된 XRD 강도값(y축)을 나타낸다. 도 5는 도 4에 나타난 바와 같은 혼합물 XRD 강도 데이터를 기초로, 본 발명자들이 제안한 NNFICA 비음독립분석(상술한 (1) 내지 (6)의 과정 참조)을 통해 얻은 3가지(SiO2, TiO2, MgO)의 독립성분을 나타낸 그래프이다. 도 3을 참조하면, 3가지 독립성분으로 분리되었으며, 각 독립성분은 일정한 각도에서 고유의 피크를 보인다는 것을 확인할 수 있다(SiO2: 26.5°, TiO2: 25.5°, MgO: 43°).4 shows the XRD intensity spectrum for 10 samples of the powder mixture. This spectrum represents the XRD intensity value (y-axis) measured in 1000 dimensions (x-axis) at 0.05-degree intervals from 20 degrees to 70 degrees. Figure 5 is based on the mixture XRD intensity data as shown in Figure 4, the three obtained through the inventors proposed NNFICA non-negative independence analysis (see (1) to (6) above) (SiO 2 , TiO 2 , MgO) is a graph showing the independent components. Referring to Figure 3, it was separated into three independent components, each independent component can be seen that shows a unique peak at a certain angle (SiO 2: 26.5 °, TiO 2: 25.5 °, MgO: 43 °).
도 6는 도 4에 나타난 독립성분을 바탕으로 상술한 비음최소제곱법(상술한 [1] 내지 [5]의 과정 참조)을 이용하여 각 구성성분 비율을 예측한 결과를 나타낸 테이블이다. 본 발명자들이 제안한 방법을 통해 얻은 혼합물 성분 비율 예측값의 정확도를 확인하고, 기존의 독립성분분석법을 통한 예측값의 정확도와 비교하기 위해 평균절대오차(mean absolute deviation: MAD)를 사용하였다. 평균절대오차은 아래의 식과 같이 표현된다. FIG. 6 is a table showing the results of predicting each component ratio using the aforementioned non-negative square method (see the above-described processes of [1] to [5]) based on the independent components shown in FIG. 4. Mean absolute deviation (MAD) was used to confirm the accuracy of the mixture component ratio prediction value obtained by the method proposed by the present inventors and to compare the accuracy of the prediction value through the conventional independent component analysis method. The mean absolute error is expressed as
여기서, Aji는 NNFICA 또는 통상의 ICA 등을 사용한 분석방법을 통해 얻은 구성성분 비율의 예측값이고, 는 실제의 구성상분 비율을 나타낸다. Here, A ji is a predicted value of the component ratio obtained through an analytical method using NNFICA or conventional ICA, Represents the actual percentage of composition.
도 7은 상기 몰드 플럭스의 혼합 분말 데이터를 기존의 FastICA에 적용해서 얻은 평균절대값오차와, 본 발명자들이 제안한 NNFICA에 적용하여 얻은 평균 절대값오차를 나타낸 테이블이다. 도 7에 나타난 바와 같이, 본 명세서에서 제안된 NNFICA를 적용함으로써 평균절대오차가 감소되어 기존의 FastICA를 적용한 경우보다 더 안정적인 결과를 도출함을 알 수 있으며, 이로써 예측값의 정확도에 대한 신뢰성을 높일 수 있다. 7 is a table showing the average absolute value error obtained by applying the mixed powder data of the mold flux to the existing FastICA, and the average absolute value error obtained by applying the NNFICA proposed by the present inventors. As shown in Figure 7, by applying the NNFICA proposed in the present specification it can be seen that the average absolute error is reduced to obtain a more stable result than when applying the conventional FastICA, thereby increasing the reliability of the accuracy of the prediction value have.
본 발명은 상술한 실시형태 및 첨부된 도면에 의해 한정되는 것이 아니고, 첨부된 청구범위에 의해 한정하고자 하며, 청구범위에 기재된 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 형태의 변형이 가능하다는 것은 당 기술분야의 통상의 지식을 가진 자에게 자명할 것이다.The present invention is not limited to the above-described embodiment and the accompanying drawings, but is intended to be limited by the appended claims, and that various modifications can be made without departing from the spirit of the invention described in the claims. It will be apparent to one of ordinary skill in the art.
도 1은 본 발명의 실시형태에 따른 혼합물 성분비 결정 방법을 설명하기 위한 흐름도이다.BRIEF DESCRIPTION OF THE DRAWINGS It is a flowchart for demonstrating the mixture component ratio determination method which concerns on embodiment of this invention.
도 2는 본 발명의 실시형태에 따른 가중치 벡터와 독립 성분을 구하는 과정을 나타낸 흐름도이다.2 is a flowchart illustrating a process of obtaining a weight vector and independent components according to an embodiment of the present invention.
도 3은 본 발명의 실시형태에 따른 혼합물 계수 산정 과정을 나타낸 흐름도이다.3 is a flowchart illustrating a mixture coefficient calculation process according to an embodiment of the present invention.
도 4는 본 발명의 실시예에 따른 비음독립성분 분석의 대상인 혼합 분말 시료의 X선 회절(XRD) 강도 스펙트럼을 나타낸 그래프이다.4 is a graph showing an X-ray diffraction (XRD) intensity spectrum of a mixed powder sample subjected to non-negative independent component analysis according to an embodiment of the present invention.
도 5는 본 발명의 실시예에 따른 비음독립성분 분석을 통해 얻은 3가지(SiO2, TiO2, MgO)의 독립성분 스펙트럼을 나타낸 그래프이다.FIG. 5 is a graph illustrating independent component spectra of three kinds (SiO 2 , TiO 2 , MgO) obtained through non-negative independent component analysis according to an embodiment of the present invention.
도 6은 본 발명의 실시예에 따른 혼합물 성분비 결정 방법에 의해 3개의 독립성분 비율을 예측한 결과를 도시한 테이블이다.6 is a table showing the results of predicting the ratio of three independent components by the mixture component ratio determining method according to an embodiment of the present invention.
도 7은 동일한 혼합 분말 데이터에 대해, FastICA를 적용하여 얻은 평균 절대값오차와 본 발명의 실시예에 따른 NNFICA를 적용하여 얻은 평균 절대값 오차를 도시한 테이블이다. 7 is a table showing the average absolute value error obtained by applying FastICA and the average absolute value error obtained by applying NNFICA according to an embodiment of the present invention for the same mixed powder data.
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070139451A KR20090071219A (en) | 2007-12-27 | 2007-12-27 | Method for determining mixing ratios in a mixture via non-negative independent component analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070139451A KR20090071219A (en) | 2007-12-27 | 2007-12-27 | Method for determining mixing ratios in a mixture via non-negative independent component analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20090071219A true KR20090071219A (en) | 2009-07-01 |
Family
ID=41322655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070139451A KR20090071219A (en) | 2007-12-27 | 2007-12-27 | Method for determining mixing ratios in a mixture via non-negative independent component analysis |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20090071219A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019180430A1 (en) * | 2018-03-20 | 2019-09-26 | Oxford University Innovation Limited | Characterisation of amporphous content of complex formulations based on non-negative matrix factorisation |
-
2007
- 2007-12-27 KR KR1020070139451A patent/KR20090071219A/en not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019180430A1 (en) * | 2018-03-20 | 2019-09-26 | Oxford University Innovation Limited | Characterisation of amporphous content of complex formulations based on non-negative matrix factorisation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Berk et al. | Significance tests for saturated orthogonal arrays | |
Lin | Total deviation index for measuring individual agreement with applications in laboratory performance and bioequivalence | |
CN101473197B (en) | Manufacture the method for multidimensional calibrating patterns | |
Taruya et al. | Forecasting the cosmological constraints with anisotropic baryon acoustic<? format?> oscillations from multipole expansion | |
Yang | A robust LM test for spatial error components | |
CN108549908B (en) | Chemical process fault detection method based on multi-sampling probability kernel principal component model | |
Yuan et al. | 8. Outliers, leverage observations, and influential cases in factor analysis: using robust procedures to minimize their effect | |
CN102435556A (en) | Accurate spectrum quantitative analysis method used for complex heterogeneous mixture system | |
CN105676833A (en) | Power generation process control system fault detection method | |
CN110567937A (en) | Competitive self-adaptive heavy-weighted key data extraction method for Raman spectrum analysis of insulating oil | |
CN106709460A (en) | Dynamic calibration method for high-frequency force balance | |
JP2007328744A (en) | Regression analyzing method and device therefor | |
Bartel et al. | Force calibration using errors-in-variables regression and Monte Carlo uncertainty evaluation | |
CN117742279B (en) | Cosmetic production control method and system | |
Busababodhin et al. | Copula modelling for multivariate statistical process control: a review | |
CN109766518B (en) | Uncertain accelerated degradation modeling and analyzing method considering sample individual difference | |
Conlin et al. | Data augmentation: an alternative approach to the analysis of spectroscopic data | |
Zhang et al. | Combining model-based measurement results of critical dimensions from multiple tools | |
KR20090071219A (en) | Method for determining mixing ratios in a mixture via non-negative independent component analysis | |
CN109783772B (en) | Method for determining partial least square regression latent variable number | |
CN116698892A (en) | Diffraction pattern analysis device, method and information storage medium for mixture | |
Ding et al. | Redundant sensor calibration monitoring using independent component analysis and principal component analysis | |
JP2000338038A (en) | Spectrum data processing method | |
Lombard et al. | Another look at the Grubbs estimators | |
Måge et al. | Split-plot design for mixture experiments with process variables: A comparison of design strategies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |