KR20140145753A - 기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법 - Google Patents

기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법 Download PDF

Info

Publication number
KR20140145753A
KR20140145753A KR1020130068274A KR20130068274A KR20140145753A KR 20140145753 A KR20140145753 A KR 20140145753A KR 1020130068274 A KR1020130068274 A KR 1020130068274A KR 20130068274 A KR20130068274 A KR 20130068274A KR 20140145753 A KR20140145753 A KR 20140145753A
Authority
KR
South Korea
Prior art keywords
molecules
molecule
property
property value
value
Prior art date
Application number
KR1020130068274A
Other languages
English (en)
Inventor
김양수
정원천
권윤경
박태윤
Original Assignee
주식회사 켐에쎈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 켐에쎈 filed Critical 주식회사 켐에쎈
Priority to KR1020130068274A priority Critical patent/KR20140145753A/ko
Publication of KR20140145753A publication Critical patent/KR20140145753A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 방대한 분자들로 이루어진 혼합물을 구성하는 각 분자들의 물성 값을 체계적이고도 일반적으로 예측가능도록 하는 방법에 관한 것으로서, 신뢰할만한 수준의 정확도로 빠르고 효율적으로 원하는 분자의 물성값 정보를 얻어내어, 물성정보의 부족으로 인해 초래되는 화학산업계의 문제점에 대한 대안을 마련하는 것이다.
본 발명은 혼합물의 전체집합을 정의하고 전체집합 내에 포함되는 분자구조를 생성하는 단계 1; 정의된 전체집합을 하위집합으로 나눈 후, 하위집합 내에서 기준 분자들을 결정하는 단계 2; 상기 단계 2에서 결정된 기준 분자들의 대상 물성 값을 획득하는 단계 3; 및 상기 단계 3에서 획득한 기준 분자들의 물성 값과 상기 단계 2에서 결정된 기준 분자들과 임의의 분자와의 근원적 상관성을 이용하여 임의의 분자의 물성 값을 예측하는 단계 4를 포함하는 것을 특징으로 한다.

Description

기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법{METHOD FOR EXPECTING PROPERTY OF EACH MOLECULES OF COMPOUND BY USING UNDERLYING CORELATION BETWEEN MOLECULES ON PROPERTY AND MOLECULAR DESCRIPTOR OF OF STANDARD MOLECULES}
본 발명은 방대한 수의 분자들로 이루어진 혼합물에 대해서, 각 분자들의 물성 값을 기준 분자들의 물성값 및 분자들 간의 분자 표현자에 기반한 근원적 상관성을 이용하여 신뢰할만한 수준의 정확도로 빠르고 효율적으로 예측하는 방법에 관한 것이다.
분자의 물리, 화학적 물성값은 화학반응이나 혼합물의 특성을 이해하여 관련 화학산업계에 적용하기 위해 반드시 요구되는 정보이다. 그러나 원유와 같이 수많은 분자들로 이루어진 혼합물의 경우, 모든 분자들을 순수한 형태로 분리해 내는 것은 불가능한 일이다. 그 혼합물에는 여러 비슷한 물성 값을 가지는 분자들이 무수히 많이 존재하고 동일한 분자식을 가지면서 다양한 구조를 이루는 이성질체들도 무수히 많이 존재하기 때문이다. 또한, 그 혼합물의 조성을 정량적으로 분석하는 것도 현재의 분석기술로는 불가능에 가깝다. 원유와 같은 혼합물의 경우, 끓는점과 같은 특정 물성 조건으로 정제과정을 거쳐 일정 물성 구간의 혼합물들로 분리한 후, 일부 정제된 혼합물에 포함된 분자들의 정성적인 특성을 알아내는 상황이지만, 정밀한 분석장비를 동원한다 하더라도 모든 분자들의 조성을 정량적으로 분석하는 것은 거의 불가능하다. 따라서, 해당 화학산업계에서 필수적으로 필요한 물성값을 실험적으로 측정하는 것이 현실적으로는 매우 힘든 상황이며, 이러한 상황에서는, 관련 화학산업계의 화학공정을 정밀하게 설계하고 최적화하여, 생산성을 높이고 에너지 절감을 하기가 매우 힘든 실정이다.
해당 분야의 연구자들은 이러한 물성 정보를 얻기 위해 기존의 잘 알려진 그룹기여 방법 [Joback K. G., Reid R.C., Chem. Eng. Comm., 57 (1987) 233] 등을 이용하여 물성 값을 예측하는 것이 대부분이었으나, 여러 상수값 물성이나 온도 의존성 물성과 같은 다양한 물성들을 예측하는데 있어서 불가능하거나, 가능하더라도 그 예측값의 정확도가 많이 떨어져 신뢰하기 어려운 실정이다. 그 외에 일부 물성과 구조 등의 관계를 이용하여 예측하는 방법들이 소개되었지만 일부 분자들에 국한되거나 예측성능이 만족스럽지 못했다.
최근에 분자의 여러 물성 값을 예측하는 종래의 기술적 문제를 해결하기 위해 양자역학 방법을 기반으로 상수값 및 온도 의존성 물성들을 예측하는 방법이 나와있다[KR 10-1258859 2013. 4. 23; KR 10-1258863 2013. 4. 23; KR 10-1262045 2013. 5. 2; KR 10-1267356 2013. 5. 20; KR 10-1267369 2013. 5. 20; KR 10-1267372 2013. 5. 20; KR 10-1267373 2013. 5. 20; KR 10-1267376 2013. 5. 20; KR 10-1267381 2013. 5. 20; KR 10-1267385 2013. 5. 20; KR 10-1267386 2013. 5. 20; KR 10-1267391 2013. 5. 20; KR 10-1267408 2013. 5. 20; KR 10-1267418 2013. 5. 20]. 분자구조를 양자역학 방법으로 정밀하게 계산하고 근원적인 이론을 통해 유도된 결과와 분자표현자들을 이용하여 분자의 물성을 예측하는 방법이므로 실험 오차 수준의 정확도로 물성 값을 예측하지만, 정밀한 양자역학적 구조계산을 수반하기 때문에 분자량이 아주 큰 분자의 경우 많은 계산시간이 소요되는 문제점을 안고있다.
최근에는 물성값이 필요한 임의의 분자와 구조적 상관성이 높고 물성값이 이미 알려진 기준 분자들을 선발하여, 선발된 분자들의 물성값 및 임의의 분자와 선발된 분자의 구조 간의 상관관계를 이용하여, 원하는 분자의 물성 값을 예측한 방법이 몇몇 문헌들을 통해 소개되었다. Shacham과 Brauner는 문헌 [M. Shacham, N. Brauner, Chem. Eng. Process., 38 (1999) 477]을 통해 분자구조 간의 상관관계를 이용하여 온도 의존 물성인 열용량을 예측하는 방법을 소개하였고, 이어서 Shacham과 Brauner 등은 문헌 [M. Shacham, N. Brauner, G. St. Cholakov, R. P. Stateva, AIChE J., 50 (2004) 2481]에서 여러 상수값 물성들에 대한 예측 방법과 분자 구조의 상관성을 판단하는 기준이 되는 분자 표현자(Molecular Descriptor)들을 소개하였으며, 최근에는 Shacham과 Brauner 등은 문헌 [M. Shacham, N. Brauner, H. Shore, D. Benson-Karhi, Ind. Eng. Chem. Res., 47 (2008) 4496]에서 몇몇 분자의 액체 밀도 예측에 대해서 소개하였다.
이러한 논문에서는 여러 상수값 물성 뿐만 아니라 다양한 온도 의존 물성도 좋은 예측성능으로 물성 값을 예측할 수 있음을 보여주고 있다. 임의의 분자의 물성 값을 예측하는데 있어서 다른 분자들의 물성 정보에 대한 정확성이 요구되며 정확한 물성 값을 이용했을 때 임의의 분자의 물성 값에 대한 예측성능도 실험오차 수준 이내로 좋은 예측을 하게 된다는 것을 보여주고 있다.
이러한 문헌의 연구결과들이 좋은 예측 결과들을 보여주고는 있지만 그 대상이 한정된 좁은 범위의 분자들이고 동종 계열 분자들 중 그 구조가 거의 비슷한 분자의 물성 값에 대한 예측으로 국한된다. 동종 계열에서 선형성을 나타내는 일부 물성의 경우 외삽(extrapolation)을 통한 예측도 가능하지만 그 범위가 제한적이고 임의의 분자의 물성 값을 예측하기 위해 필요한 동종 계열 분자들의 물성 값이 부족하여 알고자 하는 분자의 물성 값을 예측하지 못하거나 정확도가 떨어지는 등 상당히 제한적이어서 대상 분자 범위의 확장성이나 예측방법의 효율성도 떨어지는 상황이다. 또한 물성값이 이미 존재해야하는 기준 분자의 선정방법에 있어서, 구조가 유사해야 된다는 모호한 기준이외에 체계적이고 명확한 기준이 없어 일반화하여 적용하기 힘든 실정이며, 최종적으로 원하는 분자의 물성값을 계산함에 있어서, 분자간 상관관계를 나타내는 분자표현자에 대한 결정에도 명확한 방법이나 기준이 없는 상황이다.
본 발명은 앞서 언급된 문제점을 해결하고, 방대한 분자들로 이루어진 혼합물을 구성하는 각 분자들의 물성 값을 체계적이고도 일반적으로 예측가능도록 하는 방법에 관한 것으로서, 신뢰할만한 수준의 정확도로 빠르고 효율적으로 원하는 분자의 물성값 정보를 얻어내어, 물성정보의 부족으로 인해 초래되는 화학산업계의 문제점에 대한 대안을 마련하는 것이다.
본 발명은 원유와 같이 알고자 하는 혼합물의 전체 규모를 파악하고, 예측하고자 하는 대상 물성과 상관성이 높은 분자들을 선정하여 하위집합으로 분리한 후, 하위집합을 포괄하는 기준 분자들을 결정하고, 기준 분자들의 대상 물성 값을 획득한 후, 기준 분자들의 대상 물성값과 분자들 간의 분자 표현자에 기반한 근원적인 상관성을 이용하여, 하위집합에 포함된 임의의 분자들의 대상 물성 값을 예측하려는 것이다.
도 1은 본 발명의 전체적인 흐름을 나타낸다. 단계 1은 혼합물에 포함된 분자들을 결정하여 전체집합을 정의하고, 결정된 분자들의 분자구조를 생성하는 단계이다. 단계 2는 예측하고자 하는 대상 물성과 상관성이 높은 분자들을 선정하여 하위집합을 구성하고, 하위집합 내에 포함된 분자 중에서 하위집합을 포괄하는 기준 분자를 선발하는 단계이다. 단계 3은 각 하위집합에서 선발된 기준 분자들의 대상 물성 값을 준비하는 단계이다. 기존에 실험적으로 측정되어 널리 알려지고 신뢰할 만한 대상 물성값이 있을 경우 이 값을 사용하고, 그렇지 못할 경우 앞서 배경기술에서 언급한 바 있는 양자역학적 방법을 기반으로 한 첨단 물성예측방법을 도입하여 사용한다. 단계 4는 기준 분자들의 대상 물성 값과 물성 예측이 필요한 임의의 분자와 기준 분자들의 분자 표현자에 기반한 근원적 상관성을 이용하여, 하위집합에 포함된 임의의 분자의 대상 물성 값을 예측하는 단계이다.
상기 기술적 과제를 달성하기 위한 단계별 상세과정은 다음과 같다.
단계 1에서 혼합물을 구성하는 모든 분자를 결정하여 전체집합을 정의함에 있어, 혼합물에 관한 분석 자료와 문헌 정보 등 기존에 연구되어 알려진 내용을 토대로, 혼합물에 포함된 분자들의 특성을 발췌한다. 각각의 분자에 포함되는 원소의 종류, 핵심골격의 형태, 작용기의 형태, 고리구조의 존재 유무, 방향성 고리구조의 존재 유무 등을 정리한다. 각각의 분자들이 모여 전체 집합을 이룰 때 집합이 가지는 특정 조건의 범위를 살펴본다. 즉, 핵심원소인 탄소 개수의 범위, 작용기의 개수, 고리구조의 형태 및 개수 등을 정리한다.
전체집합을 이루는 분자들의 분자구조를 생성하기 위해서 먼저 분자들의 핵심골격의 구조를 생성하고 핵심골격에 치환되는 치환기 종류에 따라 별개의 조각을 생성한 후에 핵심골격들과 치환기 종류의 조각들의 조합의 수만큼을 가지는 분자구조들을 컴퓨터 프로그램을 제작하여 생성한다.
단계 2에서는 예측하고자 하는 대상 물성과의 근원적 상관성에 따라 혼합물에 포함되어있는 분자들을 하위집합으로 분류한다. 즉, 수학적 알고리듬에 기반한 컴퓨터 프로그램을 제작한 후, 이를 이용하여 대상 물성과 밀접한 관련이 있는 분자 표현자들을 선정하고, 선정된 분자 표현자들에 기반한 각 분자간 피어슨 곱 모멘트 상관계수의 제곱(square of Pearson product-moment correlation coefficient)값 (이하 '피어슨 결정계수'라 명명함)을 계산한 후, 피어슨 결정계수 값이 일정 기준 값 이상 되는 분자들을 모아서 하위집합으로 구성한다. 하위집합에 포함되는 분자들을 피어슨 결정계수 값이 높은 것부터 순서대로 나열한 후, 하위집합을 포괄할 수 있도록 피어슨 결정계수 값에 따라 균등하게 일정개수 만큼 분자를 선정한다. 이렇게 선정된 분자를 “기준 분자”라 지칭한다. 기준 분자들은 추후 단계 4에서 하위집합에 포함된 다른 모든 분자들의 대상 물성을 예측하는데 사용되는 분자들이므로, 기준 분자의 선정은 다른 분자의 대상 물성을 예측하는데 직접적인 영향을 주는 매우 중요한 요소이다.
전체집합을 하위집합으로 나누는 목적은 대상 물성과 상관성이 밀접한 분자들을 모아서 하나의 하위집합으로 두고, 하위집합 내에서 기준 분자들의 대상 물성값 및 분자들간의 근원적 상관성을 이용하여, 기준 분자이외 다른 모든 분자들의 대상 물성값을 빠르고 정확하게 예측하기 위한 것이다.
각 하위집합 내에서 적정한 기준 분자 개수의 결정도 대상 물성의 예측에 중요한 요소이다. 너무 적은 수로는 물성예측의 정확도가 떨어질 수 있으며, 너무 많은 수로는 전체집합의 모든 분자를 계산함에 있어 지나치게 많은 시간이 소요될 수 있기 때문이다. 본 발명에서는 여러 차례의 시행착오를 통해서 5개를 적정개수로 결정하였다.
단계 3에서는 단계 4에서 사용될 기준 분자들의 대상 물성 값을 확보하는 단계이다. 기존에 실험적으로 측정된 신뢰할 만한 대상 물성값이 있을 경우 이 값을 이용할 수 있고, 신뢰할 만한 실험 값이 없는 경우에는 여러 다양한 예측 방법을 이용하여 예측된 값을 이용할 수 있다. 원유와 같은 혼합물에 포함된 분자들의 경우 일정 분자량 이상을 가지는 분자는 분리 및 정제 과정을 통해서 순수한 분자를 얻어내는 것은 힘들기 때문에 실험적 물성 값은 거의 없는 실정이다. 물성 값을 예측하는 방법들 중 널리 사용되는 그룹기여 방법은 구조를 이루고 있는 각 구조조각의 개수와 기여하는 상수값을 곱한 값의 총합으로 간단히 예측 값을 얻어낼 수 있지만, 특이한 작용기 또는 작용기가 하나이상인 복잡한 구조를 가지는 분자의 경우 그 작용기 또는 작용기 간의 상호 작용에 대해서는 고려되지 않아 계산자체가 불가능한 경우가 발생하거나, 계산이 가능하다고 하더라도 그 예측 값의 정확도가 만족스럽지 못한 경우가 자주 발생한다. 본 발명에서는 앞서 배경기술에서 언급한 바대로 당사에서 선행 개발한 첨단 물성예측 방법들을 이용한다. 이 방법은 분자의 구조를 양자역학 방법을 이용하여 정밀하게 계산하고 그 구조를 토대로 얻어진 다양한 분자표현자를 기반으로 물성 값을 예측하는 기술이다. 이 기술을 사용하여 각 하위집합에서 결정된 5개의 기준 분자들의 대상 물성 값을 준비한다.
단계 4에서는 앞서 계산된 기준 분자들의 대상 물성 값과 물성 예측이 필요한 임의의 분자와 기준 분자들의 분자 표현자에 기반한 근원적 상관성을 이용하여 임의의 분자의 대상 물성 값을 예측하는 단계이다. 각 하위집합내 임의의 분자의 대상 물성 값은, 배경기술에서 언급한 바 있는 Shacham과 Brauner이 제시한 대로, 기준 분자들의 대상 물성값의 선형조합으로 표현된다. 각 기준 분자들의 대상 물성값이 차지하는 비중에 해당하는 계수는 임의의 분자와 기준 분자들의 여러 분자 표현자 값을 사용하여 계산하며, 이는 임의의 분자와 기준 분자들간의 근원적 상관성을 표현한다. 각 분자들의 분자 표현자들은 단계 1에서 생성한 분자구조를 이용하여 계산한다. 이렇게 계산된 계수를 단계 3에서 얻은 각 기준 분자들의 대상 물성 값과 곱하여 각 기준 분자들의 물성에 대한 기여값의 총합을 계산하며, 이 값이 임의의 분자의 대상 물성에 최종적인 예측 값이 된다.
본 발명은 다양하고 방대한 분자들로 이루어진 혼합물을 구성하는 분자들의 물성 값을 알기 위해서 모든 분자에 대해 여러 과정으로 정밀한 구조를 계산하고 복잡한 계산을 통해 정밀한 물성 예측 값을 얻는 것이 아니라, 분자들간의 근원적 상관성을 이용하여 기준 분자들의 물성 실험 값 또는 정밀한 예측 값을 기반으로 임의의 분자의 물성 값을 예측하기 때문에 신뢰할 만한 수준의 정확도로 빠른 시간 내에 예측할 수 있다.
또한 전체집합에 해당되는 혼합물은 원유, 약, 대사체 등에 국한되지 않고, 관심있어 하는 연구분야에 사용되는 분자들의 집합을 구성할 수 있으며 그 전체집합에 포함된 모든 분자들의 물성 값을 예측하는데 유용하게 이용될 수 있다.
본 발명을 통해 해당산업계의 물성정보 수요를 빠르게 충족시킬 수 있으며, 이러한 정보를 이용하여 공정의 최적화 및 생산성 향상에 기여할 수 있다.
도 1은 혼합물을 구성하는 각 분자들의 대상 물성 값을 예측하는 방법에 대한 실시예의 흐름도이다.
도 2는 실시예에서 임의의 분자(T)의 편극도 및 증기압 등을 예측하기 위해 선발된 기준 분자들(R1, R2, R3, R4, R5)이다.
도 3은 실시예에서 임의의 분자의 증기압에 대해 본 발명의 결과로 나온 물성 예측 값과 실험 값을 구분하여 함께 도시한 것이다.
본 발명을 원유 혼합물에 대해 적용한 실시예를 기술하면 아래와 같다.
단계 1로서, 원유와 같은 혼합물의 분석 정보를 토대로 분자구조를 생성하기 위해 구조의 골격 (skeleton), 작용기 (functional group), 브릿지 (bridge) 형태 등을 정의한 후, 각 분자조각 형태들의 조합에 따라 자체적으로 개발한 분자구조 생성 프로그램으로 여러 분자구조들을 생성하였다. 구조의 골격, 작용기, 브릿지의 개수를 특정 개수로 제한하여 자체 개발한 프로그램으로 생성한 분자의 총 개수는 약 3만개였다. 이 개수는 분자 구조를 생성하는 제한 조건에 따라 달라질 수 있다.
단계 2로서, 혼합물 전체집합에 포함된 분자들을 대상으로 물성과 상관성이 높은 분자들로 분류하여 하위집합을 구성하였다. 분자 하나당 얻을 수 있는 약 5,000개의 분자표현자들 중에서 해당 물성과 상관성이 높은 312개의 분자표현자들을 선정하였고, 3만개 분자들을 대상으로 각 분자간 피어슨 결정계수 값이 0.995 이상의 관계를 가지는 분자들을 모아서 하위집합을 구성하였으며, 하위집합의 총 수는 121개가 되었다. 각 하위집합을 포괄할 수 있는 기준 분자를 선정하기 위하여 하위집합에 포함된 분자들을 피어슨 결정계수 값을 내림차순으로 나열한 후에 하위집합 전체를 균등하게 나누는 위치에 있는 분자들을 선정하였다. 기준 분자들의 개수도 다양하게 변경하여 해당 하위집합에 포함된 임의의 분자들의 예측성능에 어떤 영향을 주는지 비교하였고, 최종적으로 기준 분자를 5개를 선정하였을 때 가장 좋은 예측 성능을 보여주었다. 따라서 하나의 하위집합 내에서 5개의 기준 분자들을 균등하게 선정하였다.
단계 3으로서, 단계 2에서 각 하위그룹 내에 선정된 5개의 기준 분자들의 대상 물성 값을 확보하기 위하여, 기준 분자들의 신뢰할 만한 대상 물성 실험값이 존재하는 경우에는 그 값을 기준 분자의 대상 물성 값으로 지정하고, 신뢰할 만한 대상 물성 실험값이 존재하지 않는 경우에는 앞서 언급한 대로 양자역학 기반의 첨단 물성예측 방법을 사용하여 신뢰할 만한 대상 물성 값을 예측하여, 기준 분자의 대상 물성 값으로 지정하였다. 121개의 하위그룹당 5개 분자의 물성 값이 필요하므로 최종적으로 605개 (121×5 = 605) 기준 분자들의 대상 물성 값을 확보하였다.
단계 4로서, 단계 3에서 선정한 5개 기준 분자들의 물성 값 및 임의의 분자와 기준 분자들의 분자 표현자에 기반한 근원적 상관성을 이용하여, 각 하위집합 내의임의의 분자들의 대상 물성 값을 예측하였다. 분자들 간의 근원적 상관성을 이용하기 위하여, 각 하위집합내 5개 기준 분자의 분자표현자들을 이용하였고, 해당 물성과 밀접한 관련이 있는 312개의 분자표현자를 사용하였다. 각 하위집합을 포괄하는 5개의 기준 분자들의 특정 분자표현자들의 값과 임의의 계수와의 곱으로 임의의 분자의 해당 분자표현자를 설명할 수 있는 최적의 계수를 계산하였다. 이렇게 계산된 각 분자들의 계수 값은 각 분자들의 물성 값과 곱한 후 총합을 구하여 임의의 분자의 해당 물성 값을 예측하였다.
본 실시예에서 대상 물성 예측결과의 예로서, 상수값 물성 중 편극도 (polarizability)와 온도 의존 물성 중 증기압 (vapor pressure)에 대해서 예측값을 제시하고자 한다. 상기에 언급한 총 4 단계의 과정을 통해 얻어진 결과를 살펴보면 도 2에 보이는 바와 같이 임의의 분자(T-Target)의 대상 물성 값을 예측하기 위해 5개 기준 분자(R-Reference)들 (R1, R2, R3, R4, R5)을 사용하였다. 표 1에서는 상수값 물성 중의 하나인 편극도에 대한 예측 결과를 보여주고 있다. 임의의 분자(T)의 편극도를 예측하기 위해 각 기준 분자들의 편극도 값들이 사용되었고 임의의 분자의 최종 예측된 편극도 값은 14.1804 A으로 실험값 14.2 A과 비교했을 때 0.0196 A의 오차를 가지고 0.14%의 퍼센트오차를 가져 상당히 정확한 예측을 하고 있음을 알 수 있다.
임의의 분자의 편극도 예측값과 실험값 비교 (실험값은 괄호 안에 표시, 단위 A)
T R1 R2 R3 R4 R5
14.1804
(14.2)
12.330081 14.194228 15.056505 19.488002 21.338562
도 3에서 온도 의존 물성중의 하나인 증기압에 대한 예측 결과를 보여주고 있다. 임의의 분자(T)의 증기압을 예측하기 위해 각 기준 분자들의 다양한 온도별 증기압 값들을 앞서 언급한 양자역학 기반의 첨단 물성예측 방법을 사용하여 예측하여 사용하였고, 각 기준 분자들의 비중 계수를 온도별 증기압에 반영하여 임의의 분자의 증기압 예측을 수행하였다. 임의의 분자의 최종 예측된 증기압은 도 3에 붉은색 실선으로 나타내었고 청색과 주황색 원 표식은 출처가 서로 다른 실험값을 나타내었다. 실험값과 비교했을 때 다양한 온도에 따른 증기압 예측 값이 실험 값에 아주 근접한 형태로 예측되어 상당히 정확한 예측을 하고 있음을 알 수 있다.
상기에 언급된 단계들을 통해, 임의의 분자들은 해당되는 하위집합 내에서 결정된 기준 분자들과의 근원적 상관성을 이용하여 빠르고 간단하게 대상 물성 값을 구할 수 있다.
본 발명에서는 한정된 실시예로 언급하였으나, 약 (drug), 대사체 (metabolome) 등과 같은 많은 분자들을 포함하는 혼합물이나 집합에 대해서도 적용이 가능하고, 사용자 목적에 맞게 별도로 정의된 분자 집합이나 분자구조들을 이용할 수 있으며, 각 단계의 핵심적인 절차를 거쳐서 임의의 분자의 대상 물성에 대한 예측이 가능하다.
본 발명은 상기한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.

Claims (4)

  1. 혼합물의 전체집합을 정의하고 전체집합 내에 포함되는 분자구조를 생성하는 단계 1;
    정의된 전체집합을 하위집합으로 나눈 후, 하위집합 내에서 기준 분자들을 결정하는 단계 2;
    상기 단계 2에서 결정된 기준 분자들의 대상 물성 값을 획득하는 단계 3;
    상기 단계 3에서 획득한 기준 분자들의 물성 값과 상기 단계 2에서 결정된 기준 분자들과 임의의 분자와의 근원적 상관성을 이용하여 임의의 분자의 물성 값을 예측하는 단계 4
    를 포함하여 혼합물 내의 분자의 물성 값을 예측하는 방법.
  2. 제 1항에 있어서, 상기 단계 2에서 하위집합은 대상 물성과 상관성이 높은 분자들로 구성하는 것을 특징으로 하며 임의의 분자의 물성 값을 예측하는 방법.
  3. 제 1항에 있어서, 상기 단계 2에서 하위집합 내에서 기준 분자는 하위집합을 포괄하는 것을 특징으로 하여 임의의 분자의 물성 값을 예측하는 방법.
  4. 제 3항에 있어서, 상기 단계 4에서 분자들의 근원적 상관성을 이용하는 것을 특징으로 하여 임의의 분자의 물성 값을 예측하는 방법.
KR1020130068274A 2013-06-14 2013-06-14 기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법 KR20140145753A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130068274A KR20140145753A (ko) 2013-06-14 2013-06-14 기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130068274A KR20140145753A (ko) 2013-06-14 2013-06-14 기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법

Publications (1)

Publication Number Publication Date
KR20140145753A true KR20140145753A (ko) 2014-12-24

Family

ID=52675393

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130068274A KR20140145753A (ko) 2013-06-14 2013-06-14 기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법

Country Status (1)

Country Link
KR (1) KR20140145753A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019241191A1 (en) * 2018-06-11 2019-12-19 Merck Sharp & Dohme Corp. Cut vertex method for identifying complex molecule substructures
KR20190143677A (ko) * 2018-06-21 2019-12-31 연세대학교 산학협력단 분자구조의 모사방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019241191A1 (en) * 2018-06-11 2019-12-19 Merck Sharp & Dohme Corp. Cut vertex method for identifying complex molecule substructures
JP2021527254A (ja) * 2018-06-11 2021-10-11 メルク・シャープ・エンド・ドーム・コーポレイション 錯体分子下部構造を識別する切断頂点方法
US11854664B2 (en) 2018-06-11 2023-12-26 Merck Sharp & Dohme Llc Complex molecule substructure identification systems, apparatuses and methods
US12068058B2 (en) 2018-06-11 2024-08-20 Merck Sharp & Dohme Llc Cut vertex method for identifying complex molecule substructures
KR20190143677A (ko) * 2018-06-21 2019-12-31 연세대학교 산학협력단 분자구조의 모사방법

Similar Documents

Publication Publication Date Title
Ng et al. Challenges and opportunities in computer-aided molecular design
Jiang et al. Potential energy surfaces from high fidelity fitting of ab initio points: the permutation invariant polynomial-neural network approach
Cheng et al. Nuclear quantum effects in water at the triple point: Using theory as a link between experiments
Wang et al. Full-dimensional, ab initio potential energy and dipole moment surfaces for water
Tainter et al. The water hexamer: Three-body interactions, structures, energetics, and OH-stretch spectroscopy at finite temperature
Samudra et al. Optimization‐based framework for computer‐aided molecular design
Liu et al. Machine learning‐based atom contribution method for the prediction of surface charge density profiles and solvent design
Mathias Effect of VLE uncertainties on the design of separation sequences by distillation–Study of the benzene–chloroform–acetone system
Malloum et al. Theoretical infrared spectrum of the ethanol hexamer
Maurer et al. A linear-and sublinear-scaling method for calculating NMR shieldings in atomic orbital-based second-order Møller-Plesset perturbation theory
Saber et al. Rapid and robust phase behaviour stability analysis using global optimization
Hill et al. Materials data infrastructure and materials informatics
Lysogorskiy et al. Transferability of interatomic potentials for molybdenum and silicon
Umer et al. PC-SAFT parameters from ab initio calculations
AU2017203959A1 (en) Method for predicting chemical shift values of NMR spin systems in a sample of a fluid class, in particular in a sample of biofluid
Burger et al. Simple perturbation scheme to consider uncertainty in equations of state for the use in process simulation
KR101262045B1 (ko) 양자역학 계산 프로그램과 물성정보 예측모듈을 이용하여 일괄처리를 자동화한 방법 및 그 시스템
Chen et al. Generalizing property prediction of ionic liquids from limited labeled data: a one-stop framework empowered by transfer learning
Suzuki Quantitative structure—property relationships for auto‐ignition temperatures of organic compounds
KR20140145753A (ko) 기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법
Varandas et al. Extrapolating potential energy surfaces by scaling electron correlation at a single geometry
Wang et al. Synthesis and optimization of low-temperature gas separation processes
Sciabola et al. Novel TOPP descriptors in 3D-QSAR analysis of apoptosis inducing 4-aryl-4H-chromenes: Comparison versus other 2D-and 3D-descriptors
CN117198417A (zh) 基于机器学习和目标优化的稳定晶体结构预测方法及系统
Vandewiele et al. Symmetry calculation for molecules and transition states

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination