KR102666454B1 - 도메인지식을 활용한 머신러닝 기반 x선회절 광물조성분석 시스템 및 방법 - Google Patents

도메인지식을 활용한 머신러닝 기반 x선회절 광물조성분석 시스템 및 방법 Download PDF

Info

Publication number
KR102666454B1
KR102666454B1 KR1020230087820A KR20230087820A KR102666454B1 KR 102666454 B1 KR102666454 B1 KR 102666454B1 KR 1020230087820 A KR1020230087820 A KR 1020230087820A KR 20230087820 A KR20230087820 A KR 20230087820A KR 102666454 B1 KR102666454 B1 KR 102666454B1
Authority
KR
South Korea
Prior art keywords
data
ray diffraction
mineral composition
machine learning
composition analysis
Prior art date
Application number
KR1020230087820A
Other languages
English (en)
Inventor
진홍근
박주영
이경북
Original Assignee
국립공주대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국립공주대학교 산학협력단 filed Critical 국립공주대학교 산학협력단
Priority to KR1020230087820A priority Critical patent/KR102666454B1/ko
Application granted granted Critical
Publication of KR102666454B1 publication Critical patent/KR102666454B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/20Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
    • G01N23/2055Analysing diffraction patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2223/00Investigating materials by wave or particle radiation
    • G01N2223/05Investigating materials by wave or particle radiation by diffraction, scatter or reflection
    • G01N2223/056Investigating materials by wave or particle radiation by diffraction, scatter or reflection diffraction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2223/00Investigating materials by wave or particle radiation
    • G01N2223/60Specific applications or type of materials
    • G01N2223/616Specific applications or type of materials earth materials

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

도메인지식을 활용한 머신러닝 기반 X선회절 조성분석 시스템 및 방법이 개시된다. 도메인지식을 활용한 머신러닝 기반 X선회절 조성분석 방법은, 광물의 X선회절 데이터를 입력받는 단계, 입력된 X선회절 데이터를 자료별로 정규화하여 전처리하는 단계, 전처리된 X선회절 데이터를 이용하여 클러스터링 모델을 생성하는 단계, 전처리된 X선회절 데이터를 이용하여 광물조성분석 모델을 생성하는 단계, 신규 X선회절 데이터를 입력받아 전처리한 후, 전처리된 신규 X선회절 데이터를 클러스터링 모델을 이용하여 일반조성자료 또는 특이조성자료로 분류하는 단계 및 일반조성자료로 분류된 신규 X선회절 데이터를 광물조성분석 모델을 이용한 분석을 통해 광물조성을 추정하는 단계를 포함한다.

Description

도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템 및 방법{System and method for mineral composition analysis using x-ray diffraction based on machine learning utilizing domain knowledge}
본 발명은 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템 및 방법에 관한 것이다.
지구온난화 및 에너지 안보에 관한 문제로 인하여, 전 세계에 광범위하게 분포하고 3000조 입방미터의 부존량이 존재하는 가스하이드레이트(Gas Hydrate) 개발에 대한 중요성이 증가하고 있다. 특히, 우리나라는 2010년 기준 에너지 순수입 의존도가 88.1%로, 대부분의 에너지를 해외에서 수입하는 실정이다. 이에 따라, 우리나라도 주변에 부존 되어있는 가스하이드레이트에 대한 중요도가 높다. 가스하이드레이트는 주 구성성분이 메탄으로 이루어져 있어 석탄과 석유와 같은 전통적인 자원보다 이산화탄소를 적게 배출하는 친환경적인 특징이 있다. 하지만, 가스하이드레이트는 전통적인 자원과 상이한 특징으로 인하여 상업적 생산을 위해서는 부존층의 지질학적 정보, 유동특성 등에 대한 연구가 필요하다.
광물조성 자료는 퇴적물의 생성환경 및 기원 등의 정보를 제공한다. 또한, 석유자원 저류층의 특성화를 위해서도 구성광물의 조성분석은 중요하다. 이러한 광물조성 자료는 X선회절(X-ray diffraction) 실험분석을 통해 얻을 수 있다. X선회절 실험은 10μm 이하로 분말화한 시료에 X선을 주사하여 회절된 X선 강도(intensity)를 측정하는 것이다. 실험으로부터 획득된 X선회절 강도는 전문가가 분석 소프트웨어를 활용하여 광물조성을 분석한다. 개별광물은 X선의 입사각에 따라 특징적인 강도를 보유하지만, 퇴적물과 같이 여러가지 광물로 구성된 경우, 그 패턴이 복잡하여 해석에 있어 전문가의 의존도가 크다. 또한, 대량의 시료를 분석할 경우, 반복적인 작업으로 인하여 소모되는 시간이 큰 한계가 있다.
대한민국등록특허공보 제10-1975752호(2019.04.30)
본 발명은 클러스터링 모델을 이용하여 퇴적물의 X선회절 데이터를 일반조성자료 또는 특이조성자료로 분류하고, 일반조성자료인 경우 광물조성분석 모델을 이용하여 조성값을 추정하고, 특이조성자료의 경우는 전문가가 분석하게 하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템 및 방법을 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, X선회절 광물조성분석 시스템이 수행하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법이 개시된다.
본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법은, 광물의 X선회절 데이터를 입력받는 단계, 상기 입력된 X선회절 데이터를 자료별로 정규화하여 전처리하는 단계, 상기 전처리된 X선회절 데이터를 이용하여 클러스터링 모델을 생성하는 단계, 상기 전처리된 X선회절 데이터를 이용하여 광물조성분석 모델을 생성하는 단계, 신규 X선회절 데이터를 입력받아 전처리한 후, 상기 전처리된 신규 X선회절 데이터를 상기 클러스터링 모델을 이용하여 일반조성자료 또는 특이조성자료로 분류하는 단계 및 상기 일반조성자료로 분류된 신규 X선회절 데이터를 상기 광물조성분석 모델을 이용한 분석을 통해 광물조성을 추정하는 단계를 포함한다.
상기 전처리하는 단계는, 상기 X선회절 데이터에 포함된 강도값을 최대-최소 정규화(min-max scaling)를 이용하여 자료별로 전처리한다.
상기 클러스터링 모델을 생성하는 단계는, 상기 전처리된 X선회절 데이터를 훈련 및 검증 데이터와 테스트 데이터로 분리하는 단계, 상기 훈련 및 검증 데이터로 클러스터링 모델을 학습시키는 단계, 상기 훈련 및 검증 데이터를 이용하여 클러스터링 모델의 성능평가를 위한 특이조성기준을 선정하는 단계, 상기 학습된 클러스터링 모델을 이용하여 상기 선정된 특이조성기준에 따라 테스트 데이터를 일반조성자료 및 특이조성자료로 분류하는 단계, 상기 분류 결과를 이용하여 혼동행렬을 생성하는 단계, 최적 군집 수 결정을 위하여, 혼동행렬 성능평가지표 중 정밀도(precision)를 선정하는 단계 및 상기 생성된 혼동행렬의 정밀도(precision)가 가장 높은 군집수를 최적 군집수로 결정하여 최적화된 클러스팅 모델을 생성하는 단계를 포함한다.
상기 광물조성분석 모델을 생성하는 단계는, 상기 전처리된 X선회절 데이터를 훈련 데이터, 검증 데이터 및 테스트 데이터로 분리하는 단계, 상기 훈련 데이터 및 상기 검증 데이터로 딥러닝(deep-learning)을 수행하는 단계 및 상기 검증 데이터 및 상기 테스트 데이터를 이용하여, 상기 딥러닝 수행을 통해 생성된 딥러닝 모델의 하이퍼파라미터(Hyper parameters)를 최적화하여 최적화된 광물조성분석 모델을 생성하는 단계를 포함한다.
상기 특이조성자료로 분류된 신규 X선회절 데이터는 전문가에 의하여 분석되어 광물조성이 추정된다.
상기 X선회절 데이터는 강도(intensity)값 및 광물조성값을 포함한다.
본 발명의 다른 측면에 따르면, 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템이 개시된다.
본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템은, 명령어를 저장하는 메모리 및 상기 명령어를 실행하는 프로세서를 포함하되, 상기 명령어는, 광물의 X선회절 데이터를 입력받는 단계, 상기 입력된 X선회절 데이터를 자료별로 정규화하여 전처리하는 단계, 상기 전처리된 X선회절 데이터를 이용하여 클러스터링 모델을 생성하는 단계, 상기 전처리된 X선회절 데이터를 이용하여 광물조성분석 모델을 생성하는 단계, 신규 X선회절 데이터를 입력받아 전처리한 후, 상기 전처리된 신규 X선회절 데이터를 상기 클러스터링 모델을 이용하여 일반조성자료 또는 특이조성자료로 분류하는 단계 및 상기 일반조성자료로 분류된 신규 X선회절 데이터를 상기 광물조성분석 모델을 이용한 분석을 통해 광물조성을 추정하는 단계를 포함하는 X선회절 조성분석 방법을 수행한다.
본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템 및 방법은, 클러스터링 모델을 이용하여 퇴적물의 X선회절 데이터를 일반조성자료 또는 특이조성자료로 분류하고, 일반조성자료인 경우 광물조성분석 모델을 이용하여 조성값을 추정하고, 특이조성자료의 경우는 전문가가 분석하게 할 수 있다.
도 1은 본 발명의 실시예에 따른 X선회절 광물조성분석 시스템이 수행하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법을 개략적으로 예시하여 나타낸 흐름도.
도 2는 도 1의 S300 단계의 세부 단계를 개략적으로 예시하여 나타낸 흐름도.
도 3은 도 1의 S400 단계의 세부 단계를 개략적으로 예시하여 나타낸 흐름도.
도 4 내지 도 11은 도 1의 본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법을 설명하기 위한 도면.
도 12는 본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템의 구성을 개략적으로 예시하여 나타낸 도면.
본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
이하, 본 발명의 다양한 실시예들을 첨부된 도면을 참조하여 상술하겠다.
도 1은 본 발명의 실시예에 따른 X선회절 광물조성분석 시스템이 수행하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법을 개략적으로 예시하여 나타낸 흐름도이고, 도 2는 도 1의 S300 단계의 세부 단계를 개략적으로 예시하여 나타낸 흐름도이고, 도 3은 도 1의 S400 단계의 세부 단계를 개략적으로 예시하여 나타낸 흐름도이고, 도 4 내지 도 11은 도 1의 본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법을 설명하기 위한 도면이다. 이하, 도 1을 중심으로, 본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법을 설명하되, 도 2 내지 도 11을 참조하기로 한다.
S100 단계에서, X선회절 광물조성분석 시스템은, 광물의 X선회절 데이터를 입력받는다.
도 4는 동해 울릉분지에서 수행된 UBGH-1, UBGH-2 프로젝트의 8개 시추공 위치를 나타낸다. 본 발명의 실시예에서는, 2007년 및 2010년에 동해 울릉분지에서 수행된 UBGH-1, UBGH-2 대규모 시추탐사 프로젝트를 통해 획득된 488개 자료의 X선회절 데이터가 사용되었으며, 이는 가스하이트레이트 사업단으로부터 제공되었다. 이 데이터는 총 8개의 시추공으로부터 획득된 퇴적물 자료이며, 시추공 위치는 도 4에 도시된 바와 같고, 시추공별 데이터 개수는 하기 표와 같다.
전체 488개의 자료 중에서 90%인 439개가 모델 학습에 사용되었으며, 나머지 10%인 49개가 테스트로 사용되었다.
X선회절 데이터는 입사각 3.01°~64.99° 범위에서 0.02° 간격으로 구성된 3,100개의 강도값(입력층)과 이를 분석한 12개 광물조성값(출력층)으로 구성된다. 여기서, 12개 광물은 quartz(석영), albite(조장석), opal-A(오팔-A), calcite(방해석), muscovite(백운모), dolomite(백운석), chlorite(녹니석), kaolinite(고령석), illite(일라이트), pyrite(황철석), NaCl, K-feldspar(K-장석류)이다.
일 예로, 1번 자료의 입사각에 따른 강도값은 도 5에 도시된 바와 같고, 광물조성값은 하기 표와 같다.
S200 단계에서, X선회절 광물조성분석 시스템은, 입력된 X선회절 데이터를 자료별로 정규화하여 전처리한다.
예를 들어, 입력된 X선회절 데이터의 강도값은 하기의 최대-최소 정규화(min-max scaling) 수학식을 이용하여 전처리될 수 있다.
여기서, Xms는 최대-최소 정규화(min-max scaling)를 통해 정규화 된 강도값을 나타내고, Xmax,j 및 Xmin,j는 각각 j번째 자료에서의 강도 최대값 및 최소값을 나타낸다.
즉, 본 발명의 실시예에 따른 X선회절 조성분석 시스템은 입력된 X선회절 데이터를 자료별로 전처리한다. 이는, 절대적인 피크의 크기 및 정확한 위치는 해석에 중요하지 않고, 자료의 광물학적 특징 및 실험오차 등으로 인한 차이가 발생하며, 한 자료 내의 입사각에 따른 강도값의 비율과 경향성이 중요하기 때문이다. 그래서, 본 발명에서는 X선회절 데이터를 0과 1사이로 정규화하여 스케일을 일치시킨다.
도 6은 전처리 방법에 따른 X선회절 데이터 형태를 나타낸다. 일반적으로, 머신러닝에서 사용하는 인자별 전처리 시 (a)의 원시자료 형태가 (b)의 형태로 완전히 손상되는 것을 확인할 수 있으며, 자료별 최대-최소 정규화(min-max scaling)를 적용할 경우 (c)와 같이 원시자료의 형태를 유지하며 스케일 또한 0~1로 보정되는 것을 볼 수 있다. 따라서, X선회절 데이터에 한해 자료별 최대-최소 정규화(min-max scaling)를 적용하는 것은 적합하다고 판단된다.
S300 단계에서, X선회절 광물조성분석 시스템은, 전처리된 X선회절 데이터를 이용하여 클러스터링 모델을 생성한다.
이하에서는, 도 2를 참조하여, S300 단계의 세부 단계에 대하여 설명하기로 한다.
S310 단계에서, X선회절 광물조성분석 시스템은, 전처리된 X선회절 데이터를 훈련 및 검증 데이터와 테스트 데이터로 분리한다.
S320 단계에서, X선회절 광물조성분석 시스템은, 훈련 및 검증 데이터로 클러스터링 모델을 학습시킨다.
도 7은 클러스터링 알고리즘의 한 종류인 k-평균 군집화 알고리즘(k-means clustering)의 진행 과정을 나타낸다. 도 7을 참조하면, k-평균 군집화 알고리즘은 군집 수 k를 미리 결정한 후 초기 중심점을 기준으로 데이터를 각 군집에 할당하고, 더 이상 중심이 변동되지 않을 때까지 반복적으로 군집의 평균을 업데이트하여 중심과 가장 가까운 데이터들을 하나의 군집으로 분류하는 방법이다. 군집 수에 따라 결과값이 달라지기 때문에 목적에 맞는 최적의 군집 수를 선정하는 것이 중요하다.
S330 단계에서, X선회절 광물조성분석 시스템은, 훈련 및 검증 데이터를 이용하여 클러스터링 모델의 성능평가를 위한 특이조성기준을 선정한다.
예를 들어, 도 8은 12개 광물의 조성값에 대한 boxplot과 훈련 및 검증 데이터를 활용해 파악한 일반조성자료의 조성값 범위를 나타낸다. 해당 범위에 속하지 않을 경우, 특이조성자료로 분류된다.
S340 단계에서, X선회절 광물조성분석 시스템은, 학습된 클러스터링 모델을 이용하여 테스트 데이터를 일반조성자료 및 특이조성자료로 분류한다.
S350 단계에서, X선회절 광물조성분석 시스템은, 분류 결과를 이용하여 혼동행렬을 생성한다.
S360 단계에서, X선회절 광물조성분석 시스템은, 최적 군집 수 결정을 위하여, 혼동행렬 성능평가지표 중 정밀도(precision)를 선정한다.
클러스터링 결과를 정량적으로 분석하기 위한 지표로서, 혼동행렬의 재현율(recall)과 정밀도(precision)가 사용되며, 하기 수학식으로 나타낼 수 있다.
즉, 재현율은 실제 일반조성자료 중 일반조성자료로 정확히 예측된 데이터 개수의 비율이고, 정밀도는 일반조성자료로 예측된 데이터 개수 중 실제 일반조성자료인 데이터 개수의 비율이다.
일반조성군집 내 특이조성자료의 존재여부 파악이 중요한 본 발명의 목적으로 고려했을 때, 분류된 데이터 중 실제 일반조성자료의 비율을 나타내는 정밀도를 기준으로 군집 수를 결정하는 것이 합당하다.
S370 단계에서, X선회절 광물조성분석 시스템은, 생성된 혼동행렬의 정밀도(precision)가 가장 높은 군집 수를 최적 군집 수로 결정하여 최적화된 클러스터링 모델을 생성한다.
도 9는 49개의 울릉분지 테스트 데이터에 대한 혼동행렬을 나타낸다. 도 9를 참조하면, 재현율은 군집 수가 3인 경우 100%, 5일 때 92.7%로 나타났고, 정밀도는 군집 수가 3인 경우 83.7%, 5일 때 100%로 나타났다. 재현율 고려 시 최적의 군집 수는 3이어야 하나, 본 발명에 적합한 지표는 정밀도이므로, 최적의 군집 수는 5가 될 수 있다.
S400 단계에서, X선회절 광물조성분석 시스템은, 전처리된 X선회절 데이터를 이용하여 광물조성분석 모델을 생성한다.
이하에서는, 도 3을 참조하여, S400 단계의 세부 단계에 대하여 설명하기로 한다.
S410 단계에서, X선회절 광물조성분석 시스템은, 전처리된 X선회절 데이터를 훈련 데이터, 검증 데이터 및 테스트 데이터로 분리한다.
S420 단계에서, X선회절 광물조성분석 시스템은, 훈련 데이터 및 검증 데이터로 딥러닝(deep-learning)을 수행한다.
하기 표는 딥러닝 알고리즘 중 하나인 CNN(convolutional neural network)을 사용하여 전처리 방법에 따른 결정계수(coefficient of determination), 평균절대오차(mean absolute error)의 평균과 편차를 구해 나타낸 것이다. Feature_CNN과 Sample_CNN은 각각 인자별 정규화와 자료별 정규화를 수행한 경우로, 인자별 정규화 대비 자료별 정규화 시 0.757의 결정계수를 보여, 자료별 정규화가 합리적임을 확인할 수 있다.
S430 단계에서, X선회절 광물조성분석 시스템은, 검증 및 테스트 데이터를 이용하여, 딥러닝 수행을 통해 생성된 딥러닝 모델의 하이퍼파라미터(Hyper parameters)를 최적화하여 광물조성분석 모델을 생성한다.
다시, 도 1을 참조하여, S500 단계 내지 S700 단계를 설명하기로 한다.
S500 단계에서, X선회절 광물조성분석 시스템은, 신규 X선회절 데이터를 입력받아 전처리한 후, 전처리된 신규 X선회절 데이터를 생성된 클러스터링 모델을 이용하여 일반조성자료 또는 특이조성자료로 분류한다.
S600 단계에서, X선회절 광물조성분석 시스템은, 일반조성자료로 분류된 신규 X선회절 데이터를 생성된 광물조성분석 모델을 이용하여 광물조성을 추정한다.
S700 단계에서, 특이광물 조성 데이터로 분류된 신규 X선회절 데이터는 전문가에 의해 분석되어 광물조성이 추정된다.
도 10은 UBGH-1, UBGH-2 프로젝트 및 한국대지 시추공 위치를 나타내고, 도 11은 한국대지 추가 검증자료에 대한 혼동행렬 결과를 나타낸다. 도 10에 도시된 바와 같은 울릉분지 북쪽 주변부에 위치한 한국대지에서 얻은 54개의 자료를 활용하여 인근지역의 추가자료에 대한 클러스터링 모델의 적용 확장성을 파악하였다. 도 11에 도시된 바와 같이, 앞선 결과와 동일하게 군집수가 3일 때 대비 5일 때 100%의 정밀도를 보여, 일반조성군집 내에 특이조성자료가 존재하지 않음을 확인할 수 있다.
도 12는 본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템의 구성을 개략적으로 예시하여 나타낸 도면이다.
도 12를 참조하면, 본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템은 프로세서(10), 메모리(20), 통신부(30) 및 인터페이스부(40)를 포함한다.
프로세서(10)는 메모리(20)에 저장된 처리 명령어를 실행시키는 CPU 또는 반도체 소자일 수 있다.
메모리(20)는 다양한 유형의 휘발성 또는 비휘발성 기억 매체를 포함할 수 있다. 예를 들어, 메모리(20)는 ROM, RAM 등을 포함할 수 있다.
예를 들어, 메모리(20)는 본 발명의 실시예에 따른 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법을 수행하는 명령어들을 저장할 수 있다.
통신부(30)는 통신망을 통해 다른 장치들과 데이터를 송수신하기 위한 수단이다.
인터페이스부(40)는 네트워크에 접속하기 위한 네트워크 인터페이스 및 사용자 인터페이스를 포함할 수 있다.
한편, 전술된 실시예의 구성 요소는 프로세스적인 관점에서 용이하게 파악될 수 있다. 즉, 각각의 구성 요소는 각각의 프로세스로 파악될 수 있다. 또한 전술된 실시예의 프로세스는 장치의 구성 요소 관점에서 용이하게 파악될 수 있다.
또한 앞서 설명한 기술적 내용들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예들을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 하드웨어 장치는 실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
상기한 본 발명의 실시예는 예시의 목적을 위해 개시된 것이고, 본 발명에 대한 통상의 지식을 가지는 당업자라면 본 발명의 사상과 범위 안에서 다양한 수정, 변경, 부가가 가능할 것이며, 이러한 수정, 변경 및 부가는 하기의 특허청구범위에 속하는 것으로 보아야 할 것이다.
10: 프로세서
20: 메모리
30: 통신부
40: 인터페이스부

Claims (7)

  1. X선회절 조성분석 시스템이 수행하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법에 있어서,
    광물의 X선회절 데이터를 입력받는 단계;
    상기 입력된 X선회절 데이터를 자료별로 정규화하여 전처리하는 단계;
    상기 전처리된 X선회절 데이터를 설정된 특이조성기준에 따라 일반조성자료 및 특이조성자료로 분류한 결과로부터 군집수를 결정하여 클러스터링 모델을 생성하는 단계;
    상기 전처리된 X선회절 데이터를 이용하여 광물조성분석 모델을 생성하는 단계;
    신규 X선회절 데이터를 입력받아 전처리한 후, 상기 전처리된 신규 X선회절 데이터를 상기 클러스터링 모델을 이용하여 일반조성자료 또는 특이조성자료로 분류하는 단계; 및
    상기 일반조성자료로 분류된 신규 X선회절 데이터를 상기 광물조성분석 모델을 이용한 분석을 통해 광물조성을 추정하는 단계를 포함하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법.
  2. 제1항에 있어서,
    상기 전처리하는 단계는,
    상기 X선회절 데이터에 포함된 강도값을 최대-최소 정규화(min-max scaling)를 이용하여 자료별로 전처리하는 것을 특징으로 하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법.
  3. 제1항에 있어서,
    상기 클러스터링 모델을 생성하는 단계는,
    상기 전처리된 X선회절 데이터를 훈련 및 검증 데이터와 테스트 데이터로 분리하는 단계;
    상기 훈련 및 검증 데이터로 클러스터링 모델을 학습시키는 단계;
    상기 훈련 및 검증 데이터를 이용하여 클러스터링 모델의 성능평가를 위한 특이조성기준을 선정하는 단계;
    상기 학습된 클러스터링 모델을 이용하여 상기 선정된 특이조성기준에 따라 테스트 데이터를 일반조성자료 및 특이조성자료로 분류하는 단계;
    상기 테스트 데이터를 일반조성자료 및 특이조성자료로 분류한 결과를 이용하여 혼동행렬을 생성하는 단계;
    최적 군집 수 결정을 위하여, 혼동행렬 성능평가지표 중 정밀도(precision)를 선정하는 단계; 및
    상기 생성된 혼동행렬의 정밀도(precision)가 가장 높은 군집수를 최적 군집수로 결정하여 최적화된 클러스터링 모델을 생성하는 단계를 포함하는 것을 특징으로 하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법.
  4. 제1항에 있어서,
    상기 광물조성분석 모델을 생성하는 단계는,
    상기 전처리된 X선회절 데이터를 훈련 데이터, 검증 데이터 및 테스트 데이터로 분리하는 단계;
    상기 훈련 데이터 및 상기 검증 데이터로 딥러닝(deep-learning)을 수행하는 단계; 및
    상기 검증 데이터 및 상기 테스트 데이터를 이용하여, 상기 딥러닝 수행을 통해 생성된 딥러닝 모델의 하이퍼파라미터(Hyper parameters)를 최적화하여 최적화된 광물조성분석 모델을 생성하는 단계를 포함하는 것을 특징으로 하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법.
  5. 제1항에 있어서,
    상기 특이조성자료로 분류된 신규 X선회절 데이터는 전문가에 의하여 분석되어 광물조성이 추정되는 것을 특징으로 하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법.
  6. 제1항에 있어서,
    상기 X선회절 데이터는 강도(intensity)값 및 광물조성값을 포함하는 것을 특징으로 하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법.
  7. 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템에 있어서,
    명령어를 저장하는 메모리; 및
    상기 명령어를 실행하는 프로세서를 포함하되,
    상기 명령어는,
    광물의 X선회절 데이터를 입력받는 단계;
    상기 입력된 X선회절 데이터를 자료별로 정규화하여 전처리하는 단계;
    상기 전처리된 X선회절 데이터를 설정된 특이조성기준에 따라 일반조성자료 및 특이조성자료로 분류한 결과로부터 군집수를 결정하여 클러스터링 모델을 생성하는 단계;
    상기 전처리된 X선회절 데이터를 이용하여 광물조성분석 모델을 생성하는 단계;
    신규 X선회절 데이터를 입력받아 전처리한 후, 상기 전처리된 신규 X선회절 데이터를 상기 클러스터링 모델을 이용하여 일반조성자료 또는 특이조성자료로 분류하는 단계; 및
    상기 일반조성자료로 분류된 신규 X선회절 데이터를 상기 광물조성분석 모델을 이용한 분석을 통해 광물조성을 추정하는 단계를 포함하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 방법을 수행하는 것을 특징으로 하는 도메인지식을 활용한 머신러닝 기반 X선회절 광물조성분석 시스템.
KR1020230087820A 2023-07-06 2023-07-06 도메인지식을 활용한 머신러닝 기반 x선회절 광물조성분석 시스템 및 방법 KR102666454B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230087820A KR102666454B1 (ko) 2023-07-06 2023-07-06 도메인지식을 활용한 머신러닝 기반 x선회절 광물조성분석 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230087820A KR102666454B1 (ko) 2023-07-06 2023-07-06 도메인지식을 활용한 머신러닝 기반 x선회절 광물조성분석 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR102666454B1 true KR102666454B1 (ko) 2024-05-17

Family

ID=91331316

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230087820A KR102666454B1 (ko) 2023-07-06 2023-07-06 도메인지식을 활용한 머신러닝 기반 x선회절 광물조성분석 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102666454B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101975752B1 (ko) 2018-11-21 2019-05-08 대한민국 문화재시료의 비파괴 표면 x-선 회절분석을 위한 시료 거치장치
JP2021532350A (ja) * 2018-07-31 2021-11-25 ザ・リージエンツ・オブ・ザ・ユニバーシテイ・オブ・コロラド、ア・ボデイー・コーポレイト 機械学習を適用して高スループットシステムにおけるマイクロコピー画像を分析するためのシステムおよび方法
KR20220099409A (ko) * 2021-01-06 2022-07-13 주식회사 뷰노 딥러닝 모델을 사용한 분류 방법
JP2022545405A (ja) * 2019-08-16 2022-10-27 バーソロミュー、ポール 鉱物同定のためのラマン分光法
KR20230016172A (ko) * 2020-04-16 2023-02-01 비토 엔브이 재료 스트림의 구성 요소 분류를 위한 기계 학습 모델 학습 방법 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021532350A (ja) * 2018-07-31 2021-11-25 ザ・リージエンツ・オブ・ザ・ユニバーシテイ・オブ・コロラド、ア・ボデイー・コーポレイト 機械学習を適用して高スループットシステムにおけるマイクロコピー画像を分析するためのシステムおよび方法
KR101975752B1 (ko) 2018-11-21 2019-05-08 대한민국 문화재시료의 비파괴 표면 x-선 회절분석을 위한 시료 거치장치
JP2022545405A (ja) * 2019-08-16 2022-10-27 バーソロミュー、ポール 鉱物同定のためのラマン分光法
KR20230016172A (ko) * 2020-04-16 2023-02-01 비토 엔브이 재료 스트림의 구성 요소 분류를 위한 기계 학습 모델 학습 방법 및 시스템
KR20220099409A (ko) * 2021-01-06 2022-07-13 주식회사 뷰노 딥러닝 모델을 사용한 분류 방법

Similar Documents

Publication Publication Date Title
Xu et al. When petrophysics meets big data: What can machine do?
Yousefi et al. Application of staged factor analysis and logistic function to create a fuzzy stream sediment geochemical evidence layer for mineral prospectivity mapping
US8090538B2 (en) System and method for interpretation of well data
Silva et al. Petrofacies classification using machine learning algorithms
CN108952699B (zh) 一种复杂地质钻进过程地层岩性智能识别方法
WO2021040791A1 (en) Probability distribution assessment for classifying subterranean formations using machine learning
AU2020396511B2 (en) Characterization of subsurface regions using moving-window based analysis of unsegmented continuous data
Nwaila et al. Local and target exploration of conglomerate-hosted gold deposits using machine learning algorithms: a case study of the Witwatersrand gold ores, South Africa
US11733424B2 (en) Systems and methods for identifying subsurface features as functions of feature positions in a subsurface volume of interest
Yu et al. Synthetic sonic log generation with machine learning: A contest summary from five methods
Mohamed et al. Streamline rock facies classification with deep learning cognitive process
Ye et al. Drilling formation perception by supervised learning: Model evaluation and parameter analysis
WO2023091178A1 (en) Characterizing effects of co2 chemical reaction with rock minerals during carbon capture and sequestration
KR102666454B1 (ko) 도메인지식을 활용한 머신러닝 기반 x선회절 광물조성분석 시스템 및 방법
CN115330007A (zh) 基于深度融合模型的储层多分类预测方法
CN112990320A (zh) 一种岩性的分类方法、装置、电子设备及存储介质
US20230141334A1 (en) Systems and methods of modeling geological facies for well development
US20240127039A1 (en) Geologic learning framework
US11754736B2 (en) System and method for classifying seismic data by integrating petrophysical data
Merembayev et al. The Identification Models of the Copper Recovery Using Supervised Machine Learning Algorithms for the Geochemical Data.
Kuchin et al. Machine learning methods for identifying composition of uranium deposits in Kazakhstan
Daniel Machine learning for pay zone identification in the Smørbukk field using well logs and XRF data
Silversides et al. Gaussian processes based fusion of multiple data sources for automatic identification of geological boundaries in mining
Nengovhela The application of geostatistics in coal estimation and classification
Joshi et al. Predictive Analysis of Oil and Gas Using Well Log Data

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant