KR101375672B1 - Method for Predicting a Property of Compound and System for Predicting a Property of Compound - Google Patents

Method for Predicting a Property of Compound and System for Predicting a Property of Compound Download PDF

Info

Publication number
KR101375672B1
KR101375672B1 KR1020110110691A KR20110110691A KR101375672B1 KR 101375672 B1 KR101375672 B1 KR 101375672B1 KR 1020110110691 A KR1020110110691 A KR 1020110110691A KR 20110110691 A KR20110110691 A KR 20110110691A KR 101375672 B1 KR101375672 B1 KR 101375672B1
Authority
KR
South Korea
Prior art keywords
compound
molecular
information
physical properties
server
Prior art date
Application number
KR1020110110691A
Other languages
Korean (ko)
Other versions
KR20120085178A (en
Inventor
정원천
김양수
성애리
전정재
권오형
권윤경
조준혁
박태윤
Original Assignee
주식회사 켐에쎈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 켐에쎈 filed Critical 주식회사 켐에쎈
Priority to KR1020110110691A priority Critical patent/KR101375672B1/en
Publication of KR20120085178A publication Critical patent/KR20120085178A/en
Priority to PCT/KR2012/007999 priority patent/WO2012177108A2/en
Application granted granted Critical
Publication of KR101375672B1 publication Critical patent/KR101375672B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 화합물의 물성을 예측하는 방법 및 화합물의 물성을 예측하는 시스템에 관한 것으로, 보다 상세하게는 최적의 분자구조를 기반으로 양자역학 계산을 하는 프로그램과 물성정보 예측모듈을 이용하여 얻은 다양한 물성 데이터를 관리하고 사용자의 요구에 맞추어 서비스하는 방법 및 물성 데이터를 계산하고 관리하는 서버와 사용자가 화합물의 검색 조건을 입력하고 서버로부터 결과를 전송받아 스크린에 디스플레이하는 클라이언트로 이루어진 화합물의 물성을 예측하는 시스템에 관한 것이다.
본 발명은 사용자가 사용하기에 편리하도록 GUI를 통하여 분자명, 분자식, 분자구조에 기반한 검색기능 제공하고, 단순한 원자, 분자, functional group의 개수비교가 아니라. Subgraph Isomorphism 방법을 통해서 분자의 구조적 동일성을 온라인 상에서 직접 확인할 수 있다.
따라서, 본 발명은 실험에 드는 비용과 시간을 절감해줄 뿐만이 아니라 실험이 불가능한 경우에도 그 값을 짐작하게 해주어 관련 산업의 연구개발활동을 용이하게 함은 물론 더 나아가 학계와 관(官)계 등 그 값을 필요로 하는 모든 곳에 합당한 정보를 제공하여 그 활동을 보다 원활히 수행할 수 있게 해주는 효과를 낳는다 하겠다.
The present invention relates to a method for predicting the properties of a compound and a system for predicting the properties of a compound. More specifically, various properties obtained by using a program and a property information prediction module for quantum mechanical calculation based on an optimal molecular structure. How to manage the data and service according to the user's needs, and the server that calculates and manages the property data and the client that inputs the search condition of the compound and receives the results from the server and displays the results on the screen to predict the properties of the compound It's about the system.
The present invention provides a search function based on molecular names, molecular formulas, and molecular structures through a GUI for user convenience, and is not a simple comparison of numbers of atoms, molecules, and functional groups. Subgraph Isomorphism can be used to directly confirm the structural identity of molecules online.
Therefore, the present invention not only reduces the cost and time required for the experiment, but also makes it possible to estimate the value even when the experiment is impossible, thereby facilitating the R & D activities of related industries, as well as the academic and related fields. Providing reasonable information wherever you need the value will have the effect of making the activity smoother.

Description

화합물의 물성을 예측하는 방법 및 화합물의 물성을 예측하는 시스템{Method for Predicting a Property of Compound and System for Predicting a Property of Compound}Method for Predicting a Property of Compound and System for Predicting a Property of Compound

본 발명은 화합물의 물성을 예측하는 방법 및 화합물의 물성을 예측하는 시스템에 관한 것으로, 보다 상세하게는 최적의 분자구조를 기반으로 양자역학 계산을 하는 프로그램과 물성정보 예측모듈을 이용하여 얻은 다양한 물성 데이터를 관리하고 사용자의 요구에 맞추어 서비스하는 방법 및 물성 데이터를 계산하고 관리하는 서버와 사용자가 화합물의 검색 조건을 입력하고 서버로부터 결과를 전송받아 스크린에 디스플레이하는 클라이언트로 이루어진 화합물의 물성을 예측하는 시스템에 관한 것이다.
The present invention relates to a method for predicting the properties of a compound and a system for predicting the properties of a compound. More specifically, various properties obtained by using a program and a property information prediction module for quantum mechanical calculation based on an optimal molecular structure. How to manage the data and service according to the user's needs, and the server that calculates and manages the property data and the client that inputs the search condition of the compound and receives the results from the server and displays the results on the screen to predict the properties of the compound It is about the system.

현재까지 화합물의 화학적, 물리적 물성을 제공하는 방법 또는 시스템은 실험에 의해서 얻어진 값들을 데이터베이스에 입력하고 이들 화합물에 대해서 텍스트 기반으로 검색하고 있는 실정이다. 이들 데이터베이스는 최대 2만여개의 화합물에 대해서 알려져 있는 물성 데이터를 제공하고 있으며, 그 이외의 화합물에 대한 물성은 필요에 따라서 실험을 통하여 얻어지고 있다.To date, a method or system for providing chemical and physical properties of compounds has been entered into a database of experimental values and searched textually for these compounds. These databases provide known physical property data for up to 20,000 compounds, and physical properties for other compounds are obtained through experiments as necessary.

화합물의 물리, 화학적 물성정보는 실험기구의 적절한 설계와 적절히 제어된 실험조건에서 측정이 되어야 정확한 결과를 얻어낼 수 있다. 전문적인 실험기구가 설계된 연구소나 기관에서 실험값을 측정할 수 있지만 화합물의 수많은 물성정보를 모두 얻기 위해서는 상당한 장비, 인력, 비용을 필요로 하고 많은 시간이 소요되므로 화학공정과 관련된 연구를 수행하는 실무자는 당장 물성정보가 필요한 상황인데도 불구하고 기존의 데이터베이스에 존재하지 않는 수천만개 화합물의 물성 데이터를 온라인 상에서 실시간으로 얻을 수가 없다. 따라서, 종래의 방법 또는 시스템으로는 하나의 화합물에 대한 물성값을 얻는데 실험에 의해서 얻어져야 하므로 많은 노력과 시간이 필요하기에 시간소모적이고 비효율적이라는 문제점을 가지고 있으므로 실험값이 존재하지 않는 수 많은 화합물에 대한 물성을 실시간으로 사용자에게 제공할 수 있는 방법 또는 시스템의 필요성이 증대되고 있다. Physical and chemical property information of the compound should be measured under the proper design of the experimental instruments and under the controlled experimental conditions to obtain accurate results. Although experimental values can be measured in a laboratory or institution where professional experimental instruments are designed, practitioners who conduct research related to chemical processes require considerable equipment, manpower, cost, and time to obtain all of the properties of a compound. Although property information is needed right now, property data of tens of millions of compounds that do not exist in the existing database cannot be obtained online in real time. Therefore, the conventional method or system has a problem that it is time-consuming and inefficient because it requires a lot of effort and time because it has to be obtained by experiments to obtain the physical property value for a single compound, and therefore, for a large number of compounds for which no experimental value exists. There is an increasing need for a method or system that can provide physical properties to a user in real time.

또한, 기존의 데이터베이스를 이용한 검색은 텍스트를 입력하여 검색을 하기에 복잡한 분자 구조를 갖는 화합물을 검색하는데 많은 어려움이 존재하고 있다.In addition, the existing search using a database has a lot of difficulties in searching for a compound having a complex molecular structure to search by entering a text.

이에, 본 발명자들은 상기 문제점을 해결하기 위하여 예의 노력한 결과, 한국특허공보 10-2010-0042453호에 개시된 종래의 기술과는 달리, 최적의 분자구조를 기반으로 양자역학 계산을 하는 프로그램과 물성정보 예측모듈을 이용하여 얻은 다양한 물성 데이터를 관리하고 사용자의 요구에 맞추어 서비스하는 방법 및 물성 데이터를 계산하고 관리하는 서버와 사용자가 화합물의 검색 조건을 입력하고 서버로부터 결과를 전송받아 스크린에 디스플레이하는 클라이언트로 이루어진 화합물의 물성을 예측하는 시스템을 확인하고, 본 발명을 완성하게 되었다.
Therefore, the present inventors have made diligent efforts to solve the above problems, and unlike the prior art disclosed in Korean Patent Publication No. 10-2010-0042453, the program and the property information prediction for quantum mechanical calculation based on the optimal molecular structure It is a server that manages various property data obtained by using the module and service it according to user's needs, and a server that calculates and manages property data and a user who inputs the search condition of a compound and receives the results from the server and displays them on the screen. The system which predicts the physical property of the formed compound was confirmed, and the present invention was completed.

본 발명의 목적은 상기 언급된 기존의 방법 및 시스템의 한계를 뛰어넘어 보다 신뢰성 있고 보다 우수한 예측성능을 보이는, 수소(H), 탄소(C), 질소(N), 산소(O), 황(S) 등 5가지 이내의 원소로 구성되고, 수소를 제외한 원자의 개수가 25개 이하인 분자로 이루어진 순수한 유기화합물의 물성을 예측하는 방법 및 시스템을 구축하는 것으로, 실험 데이터가 존재하지 않는 화합물의 물성을 계산하여 데이터베이스에 저장할 뿐만 아니라 사용자가 편리하게 화합물을 검색할 수 있는 환경을 제공하는 것과 동시에 그 화합물의 물성 예측값을 사용자에게 친숙한 방법으로 제공하는 것을 목적으로 한다.
The object of the present invention is to overcome the limitations of the above-mentioned conventional methods and systems and to achieve more reliable and better predictive performance, hydrogen (H), carbon (C), nitrogen (N), oxygen (O), sulfur ( S) A method and system for estimating the properties of pure organic compounds composed of up to 5 elements, including molecules of 25 or less atoms except hydrogen, and the properties of compounds without experimental data In addition to calculating and storing the data in a database, a user may conveniently search for a compound, and at the same time, provide a predictive property of the compound in a user-friendly manner.

본 발명은 상기의 목적을 달성하기 위하여, 보다 많은 실험데이터를 바탕으로 보다 다양한 분자표현자들을 고려한 QSPR(quantitative structure-property relationship) 모형의 일례인 다중선형회귀-인공신경망 혼성모형에 의해서 화합물의 물성을 계산하여 데이터베이스화하고, 웹어플리케이션 서버, 관계형 데이터베이스, 파일스토리지, 온도의존물성정보를 계산하기 위한 계산프로그램, 분자구조기반검색프로그램 등으로 이루어져 있는 서버가 클라이언트에서 사용자에 의해서 입력되는 화합물을 분자식, 분자명, 분자구조, 원하는 온도 범위, 사용자의 검색조건, 원소의 개수, 분자량, InChI(The IUPAC International Chemical Identifier), 물성범위에 대응하여 해당하는 물성을 클라이언트에게 제공한다.In order to achieve the above object, the present invention provides a physical property of a compound by a multiple linear regression-artificial neural network hybrid model, which is an example of a quantitative structure-property relationship (QSPR) model that considers various molecular presenters based on more experimental data. Database consisting of a web application server, a relational database, a file storage, a calculation program for calculating temperature dependency information, and a molecular structure-based search program. Corresponding physical properties are provided to clients according to molecular name, molecular structure, desired temperature range, user search condition, number of elements, molecular weight, InChI (The IUPAC International Chemical Identifier), and physical properties.

본 발명은 또한, ‘화합물’은 수소(H), 탄소(C), 질소(N), 산소(O), 황(S) 등 5가지 이내의 원소로 구성되고, 수소를 제외한 원자의 개수가 25개 이하인 분자로 이루어진 순수한 화합물을 지칭하며, 예측모형을 적용할 수 있는 화합물의 범위를 이와 같이 제한을 두는 이유는 주로, 사용된 분자표현자들 중 그 값을 구하기 위해서는 양자역학적 계산이 필요한 것들이 존재하는 경우, 현재의 기술수준으로는 언급된 범위를 넘어서는 화합물에 대해서는 정확도와 계산시간의 측면에서 곤란한 문제가 발행한다는 사실에 기인하고 있다. 그러나 상기의 제한범위 내라 할지라도 대단히 많은 화합물들이 존재하며 산업적으로 중요한 화합물들이 상당 부분 포함되므로 본 발명이 인류사회에 큰 유익을 끼칠 수 있을 것으로 판단된다.
In the present invention, the 'compound' is composed of five elements such as hydrogen (H), carbon (C), nitrogen (N), oxygen (O), sulfur (S), and the number of atoms except hydrogen It refers to a pure compound consisting of 25 or fewer molecules, and the reason for limiting the range of compounds to which the predictive model can be applied is mainly due to the fact that among the molecular descriptors used, quantum mechanical calculations are required. If present, it is due to the fact that for the compounds beyond the stated range with the current state of the art, problems arise in terms of accuracy and calculation time. However, even within the above limitations, since there are a great many compounds and industrially important compounds are included, it is considered that the present invention can greatly benefit human society.

오늘날 인류는 플라스틱, 섬유, 고무, 도료, 비료, 의약품, 연료 등, 방대한 종류의 유기화합물에 의존하여 살아가고 있으며 이러한 경향은 더욱 심화될 것으로 예상된다. 미국 화학회(ACS)에 따르면 2010년 7월 기준으로 등록된 전체 화합물의 수는 54,000,000개를 넘는다고 한다. 이에 비해 물성값이 한가지라도 실험적으로 알려져 있는 화합물의 수는 고작해야 수만에 지나지 않는다. 화합물의 물성값은 신물질과 신약의 개발, 화학플랜트의 최적 설계, 기존 설비의 생산성 향상, 자원의 개발과 절약, 안전성 확보, 환경보호 등 인류의 보다 나은 물질생활에 필수적인 요소이다.Humans today depend on a wide variety of organic compounds, including plastics, fibers, rubber, paints, fertilizers, medicines and fuels, and this trend is expected to intensify. According to the American Chemical Society (ACS), as of July 2010, the total number of compounds registered was over 54,000,000. In comparison, even if the physical property value is only one, the number of experimentally known compounds is only tens of thousands. The physical property value of compounds is essential for the better life of mankind, such as the development of new materials and new drugs, the optimal design of chemical plants, the improvement of the productivity of existing facilities, the development and saving of resources, the securing of safety, and the protection of the environment.

본 발명은 사용자가 사용하기에 편리하도록 GUI를 통하여 분자명, 분자식, 분자구조에 기반한 검색기능 제공하고, 단순한 원자, 분자, functional group의 개수비교가 아니라. Subgraph Isomorphism 방법을 통해서 분자의 구조적 동일성을 온라인 상에서 직접 확인할 수 있다.The present invention provides a search function based on molecular names, molecular formulas, and molecular structures through a GUI for user convenience, and is not a simple comparison of numbers of atoms, molecules, and functional groups. Subgraph Isomorphism can be used to directly confirm the structural identity of molecules online.

따라서, 본 발명은 실험에 드는 비용과 시간을 절감해줄 뿐만이 아니라 실험이 불가능한 경우에도 그 값을 짐작하게 해주어 관련 산업의 연구개발활동을 용이하게 함은 물론 더 나아가 학계와 관(官)계 등 그 값을 필요로 하는 모든 곳에 합당한 정보를 제공하여 그 활동을 보다 원활히 수행할 수 있게 해주는 효과를 낳는다 하겠다.
Therefore, the present invention not only reduces the cost and time required for the experiment, but also makes it possible to estimate the value even when the experiment is impossible, thereby facilitating the R & D activities of related industries, as well as the academic and related fields. Providing reasonable information wherever you need the value will have the effect of making the activity smoother.

도 1은 본 발명이 제공하는 화합물의 물성을 예측하는 방법 또는 시스템의 흐름도이다.
도 2는 본 발명의 서버/클라이언트 시스템의 구성도이다.
도 3은 화합물의 물성을 예측하는 시스템의 검색창에서 분자식을 입력한 예이다.
도 4는 화합물의 물성을 예측하는 시스템에 입력된 분자식을 포함하고 있는 화합물의 검색결과이다.
도 5는 화합물의 물성을 예측하는 시스템의 검색창에서 분자구조를 입력한 예이다.
도 6는 화합물의 물성을 예측하는 시스템에 입력된 분자구조를 포함하고 있는 화합물의 검색결과이다.
도 7은 화합물의 물성을 예측하는 시스템의 검색창에서 원자수, 분자량, , 물성의 범위를 입력한 예이다.
도 8는 화합물의 물성을 예측하는 시스템에 입력된 조건에 대한 특정 화합물의 물성 결과이다.
도 9는 화합물의 물성을 예측하는 시스템에 입력된 조건에 대한 특정 화합물의 분자표현자 값 결과이다.
도 10는 화합물의 물성을 예측하는 시스템에 입력된 조건에 대한 특정 화합물의 양자역학 계산값 결과이다.
도 11는 화합물의 물성을 예측하는 시스템에 입력된 조건에 대한 특정 화합물의 제약물성 결과이다.
도 12는 화합물의 물성을 예측하는 시스템에 입력된 온도범위 조건에 대한 특정 화합물의 물성 결과이다.
도 13은 화합물의 물성을 예측하는 시스템에 입력된 조건에 대한 특정 화합물의 3차원 측정정보 결과이다.
도 14는 화합물의 물성을 예측하는 시스템에 입력된 조건에 대한 특정 화합물의 3차원 분자진동 결과이다.
도 15는 화합물의 물성을 예측하는 시스템에 입력된 조건에 대한 특정 화합물의 3차원 오비탈 결과이다.
1 is a flowchart of a method or system for predicting physical properties of a compound provided by the present invention.
2 is a block diagram of a server / client system of the present invention.
Figure 3 is an example of entering the molecular formula in the search box of the system for predicting the physical properties of the compound.
4 is a search result of a compound including a molecular formula input to a system for predicting the physical properties of the compound.
5 illustrates an example of inputting a molecular structure in a search window of a system for predicting the properties of a compound.
6 is a search result of a compound including a molecular structure input to the system for predicting the physical properties of the compound.
7 is an example of inputting the number of atoms, molecular weight, and the range of physical properties in a search window of a system for predicting the physical properties of a compound.
8 is a result of physical properties of specific compounds with respect to conditions entered into a system for predicting physical properties of compounds.
9 is a result of molecular descriptor values of specific compounds for conditions entered into a system for predicting the properties of the compounds.
FIG. 10 shows the results of quantum mechanical calculations for specific compounds with respect to conditions entered into a system for predicting the properties of the compounds. FIG.
FIG. 11 shows the results of pharmaceutical properties of certain compounds with respect to conditions entered into a system for predicting the properties of the compounds. FIG.
12 is a result of physical properties of certain compounds against temperature range conditions entered into a system for predicting physical properties of the compounds.
FIG. 13 is a result of three-dimensional measurement information of a specific compound with respect to conditions entered into a system for predicting the physical properties of the compound. FIG.
14 is a three-dimensional molecular vibration result of a specific compound for the conditions entered into the system for predicting the physical properties of the compound.
15 is a three-dimensional orbital result of a specific compound against the conditions entered into the system for predicting the properties of the compound.

본 발명은 일관점에서, 도 1은 본원 발명에 의한 화합물의 물성을 예측하는 방법 및 시스템에 관한 흐름도이며, 서버에 접근할 수 있는 클라이언트에 사용자가 로그인하는 제1단계; 검색하고자 하는 화합물을 분자식, 분자명, 분자구조 중 어느 하나 이상을 선택하여 입력하는 제2단계; 상기 제2단계에서 상기 화합물의 온도에 의존하는 경우의 물성에 대하여 원하는 온도 범위를 선택하는 제3단계; 상기 제2단계 및 상기 제3단계에서 입력된 정보를 클라이언트가 서버로 전송하는 제4단계; 상기 제4단계에서 전송된 정보를 통하여 입력된 상기 화합물에 대한 물성을 분자 정보 데이터베이스, 물성정보를 가지고 있는 파일스토리지, 온도의존물성 계산 모듈, 분자구조기반 검색 모듈로부터 전송 받아 서버에서 클라이언트로 반환하는 제5단계; 상기 제2단계 및 상기 제3단계에서 입력된 상기 화합물에 대한 IR, VCD, NMR 스펙트라 정보를 서버에서 클라이언트로 반환하는 제6단계; 상기 제2단계 및 상기 제3단계에서 입력된 상기 화합물에 대한 3차원 구조정보를 서버에서 클라이언트로 반환하는 제7단계; 상기 제5단계 내지 제7단계에서 클라이언트로 전송된 상기 물성, 스펙트라 정보, 3차원 구조정보를 클라이언트가 화면에 디스플레이 하는 제8단계;를 포함하는 화합물의 물성을 예측하는 방법에 관한 것이다. 상기 제2단계에서 화합물을 선택할 때에 원소의 개수, 분자량, InChI(The IUPAC International Chemical Identifier), 물성범위에서 선택되는 어느 하나 이상을 선택할 수 있는 것도 포함한다. 상기 제2단계에서 분자구조는 사용자가 분자구조를 가지고 있는 테이블에서 선택되거나 사용자에 의해서 직접 입력될 수 있으며, 입력되는 상기 분자구조는 분자구조의 전체 구조 또는 전체 구조 중의 일부분이 입력된다. 상기 제7단계에서 3차원 구조정보는 화합물 분자 내의 원자간의 거리, 인접 원자간의 각도, 분자의 비틀림 정도, 분자 진동수, 오비탈을 포함한다.1 is a flow chart of a method and system for predicting the properties of a compound according to the invention in a consistent manner, the first step of a user logging in to a client capable of accessing a server; A second step of selecting and inputting at least one of a molecular formula, a molecular name, and a molecular structure of a compound to be searched for; A third step of selecting a desired temperature range with respect to physical properties when the second step depends on the temperature of the compound; A fourth step of transmitting, by the client, the information input in the second and third steps to the server; The physical property of the compound input through the information transmitted in the fourth step is received from the molecular information database, file storage having the physical property information, temperature dependency calculation module, molecular structure-based search module and returned to the client from the server The fifth step; A sixth step of returning IR, VCD, and NMR spectra information on the compound input in the second and third steps from the server to the client; A seventh step of returning three-dimensional structure information of the compound input in the second and third steps from the server to the client; And an eighth step of displaying, on the screen, the physical properties, the spectra information, and the 3D structure information transmitted to the client in the fifth to seventh steps. When the compound is selected in the second step, any one or more selected from the number of elements, molecular weight, InChI (The IUPAC International Chemical Identifier), and physical properties may be selected. In the second step, the molecular structure may be selected from a table in which the user has a molecular structure or directly input by the user, and the molecular structure to be input is a whole structure or a part of the whole structure of the molecular structure. In the seventh step, the 3D structure information includes the distance between atoms in the compound molecule, the angle between adjacent atoms, the degree of twisting of the molecule, the molecular frequency, and the orbital.

본 발명은 다른 관점에서, 도 2는 본원 발명인 화합물의 물성을 예측하는 시스템의 구성도로서, 화합물의 물성을 예측하는 시스템은 사용자가 검색하고자 하는 화합물의 분자식, 분자명, 분자구조 중 어느 하나 이상을 선택하여 입력하고, 확장된 상세검색에서는 원소의 개수, 분자량, InChI(The IUPAC International Chemical Identifier), 물성범위에서 선택되는 어느 하나 이상이 입력될 수 있으며, 접근이 가능한 서버에서 반환되는 물성, IR, VCD, NMR 스펙트라 정보, 3차원 구조정보를 화면에 디스플레이하는 클라이언트; 상기 클라이언트에서 입력된 화합물의 물성, IR, VCD, NMR 스펙트라 정보, 3차원 구조정보를 계산하고 검색하는 서버; 상기 서버는 웹어플리케이션 서버, 관계형 데이터베이스, 물성 정보를 가지고 있는 파일스토리지, 온도의존물성정보를 계산하기 위한 계산 모듈, 분자구조기반 검색 모듈을 포함하는 화합물의 물성을 예측하는 시스템에 관한 것이며, 상기 클라이언트에서 입력되는 상기 분자구조는 사용자에 의해서 분자구조를 가지고 있는 테이블에서 선택되거나 사용자에 의해서 직접 입력될 수 있으며, 입력되는 상기 분자구조는 분자구조의 전체 구조 또는 전체 구조 중의 일부분이 입력된다. 상기 서버에서 상기 클라이언트로 전송하는 상기 3차원 구조정보는 화합물 분자 내의 원자간의 거리, 인접 원자간의 각도, 분자의 비틀림 정도, 분자 진동수, 오비탈을 포함한다.In another aspect, Figure 2 is a block diagram of a system for predicting the physical properties of the compound of the present invention, the system for predicting the physical properties of the compound is one or more of the molecular formula, molecular name, molecular structure of the compound to be searched by the user In the extended refinement, one or more selected from the number of elements, molecular weight, InChI (The IUPAC International Chemical Identifier), and the property range can be entered. A client displaying VCD, NMR spectra information, and 3D structure information on a screen; A server for calculating and retrieving physical properties, IR, VCD, NMR spectra information, and three-dimensional structure information of a compound input from the client; The server relates to a system for predicting properties of a compound including a web application server, a relational database, a file storage having property information, a calculation module for calculating temperature dependent property information, and a molecular structure-based search module. The molecular structure to be inputted at may be selected from a table having a molecular structure by the user or directly input by the user, and the molecular structure to be inputted is a whole structure or a part of the whole structure of the molecular structure. The 3D structural information transmitted from the server to the client includes a distance between atoms in a compound molecule, an angle between adjacent atoms, a degree of twist of a molecule, a molecular frequency, and an orbital.

본 발명은 화합물의 분자식이라는 아주 작은 정보에서 시작해서 다양한 물리, 화학적 물성정보를 활용할 수 있도록 설계되어 있다. 본 발명은 화합물의 분자식이라는 아주 작은 정보에서 시작해서 다양한 물리, 화학적 물성정보를 활용할 수 있도록 설계되어 있다. 본 발명에서 지칭하는 물성은 하나의 화합물에 대해 하나의 값을 가지는 상수값 물성과 온도에 따라 다른 값을 가지는 온도의존 물성을 포함한다. 본 발명에서 지칭하는 상수값 물성은 분자량, 정상끓는점, 임계 온도, 임계 압력, 임계 부피, 임계 압축인자, 이심인자, 회전 반경, 이상기체의 절대 엔트로피, 이상기체의 생성에너지, 이상기체의 생성 깁스에너지, 액체 몰부피, 융해열, 굴절률, 수용해도, 표준상태의 절대 엔트로피, 표준상태의 생성에너지, 표준상태의 생성 깁스에너지, 표준상태의 연소열, 반데르발스 면적, 반데르발스 부피, 자기 감수율, 편극도, 이온화 에너지, 전자 친화도, 파라코드, 인화점, 인화 하한 온도, 인화 하한 부피퍼센트, 인화 상한 온도, 인화 상한 부피퍼센트, 정상끓는점의 액체 밀도, 298.15K에서의 기화열, 정상끓는점에서의 기화열이며, 본 발명에서 지칭하는 온도의존 물성은 적어도 이상기체의 열용량, 액체의 열용량, 기화열, 포화액체밀도, 표면장력, 액체 열전도율, 기체 열전도율, 액체 증기압, 액체 점성도, 기체 점성도, 2차 비리얼계수이다.The present invention is designed to utilize a variety of physical and chemical properties information starting from a very small information of the molecular formula of the compound. The present invention is designed to utilize a variety of physical and chemical properties information starting from a very small information of the molecular formula of the compound. Physical properties referred to in the present invention include a constant value physical property having one value for a compound and a temperature dependent property having a different value depending on temperature. The constant physical properties referred to in the present invention are molecular weight, normal boiling point, critical temperature, critical pressure, critical volume, critical compression factor, eccentric factor, radius of rotation, absolute entropy of ideal gas, energy generated by ideal gas, production gas of ideal gas Energy, liquid molar volume, heat of fusion, refractive index, water solubility, absolute entropy in standard state, generated energy in standard state, generated Gibbs energy in standard state, heat of combustion in standard state, van der Waals area, van der Waals volume, magnetic susceptibility, Polarization degree, ionization energy, electron affinity, paracode, flash point, lower flash point temperature, lower flash volume percentage, upper flash point temperature, upper flash volume percentage, liquid density at normal boiling point, heat of vaporization at 298.15K, heat of vaporization at normal boiling point The temperature-dependent physical properties referred to in the present invention include at least the heat capacity of the ideal gas, the heat capacity of the liquid, the heat of vaporization, the saturated liquid density, the surface tension, and the liquid thermal conductivity. , Gas thermal conductivity, liquid vapor pressure, fluid viscosity, gas viscosity, and the second virial coefficient.

본 발명인 화합물의 물성정보시스템은 서버/클라이언트 형식으로 구성되어 있다. 서버는 웹어플리케이션서버, 분자의 정보를 포함하는 관계형 데이터베이스, 물성정보를 포함하는 파일스토리지, 온도의존물성정보를 계산하기 위한 계산 프로그램, 분자구조기반검색 프로그램 등으로 이루어져 있다. 실제 사용자가 물성정보를 조회하기 위해 사용하는 프로그램인 클라이언트는 미리 정의된 네트워크 프로토콜을 구현하고 있어서 서버에서 원하는 분자를 검색하고 해당 분자의 물성정보를 검색해 볼 수 있다.The property information system of the compound of the present invention is configured in a server / client format. The server consists of a web application server, a relational database containing molecular information, a file storage containing physical property information, a calculation program for calculating temperature dependent property information, and a molecular structure based retrieval program. The client, which is a program used by the actual user to search for property information, implements a predefined network protocol so that the server can search for desired molecules and search for property information about the molecules.

관계형 데이터베이스는 분자의 검색에 필요한 정보를 가지고 있는 테이블과 물성에 관한 정보를 가지고 있는 테이블을 포함하고, 분자의 검색에 필요한 정보를 가지고 있는 테이블은 분자 정보를 갖는 테이블,‘몰파일’로 지칭되는 분자의 구조를 가지고 있는 테이블, 분자의 작용기 정보를 가지고 있는 테이블이다. 분자 정보는 화합물의 분자식, 분자명, SMILES(simplified molecular input line entry specification), 분자량, InChIkey(문자열의 길이가 긴 InChI를 해시 알고리즘을 적용하여 25글자의 고정된 길이를 가지는 축약된 문자열), 라디칼의 포함 여부 등의 정보를 포함하며, 물성 정보를 이용한 검색 또는 온도에 의존하는 물성을 계산할 시에 계산인자로서 사용된다.A relational database includes a table containing information necessary for the search of molecules and a table containing information on physical properties. A table containing information necessary for searching for molecules is referred to as a 'mole' table. This table contains the structure of the molecule and the table contains the functional group information of the molecule. Molecular information includes the compound's molecular formula, molecular name, simplified molecular input line entry specification (SMILES), molecular weight, InChIkey (an abbreviated string with a fixed length of 25 characters by applying a hash algorithm to a long InChI string), and radicals. It is used as a calculation factor when searching for property information or calculating a property depending on temperature.

물성정보를 가지고 있는 파일스토리지 시스템은 사용자의 요구에 따라서 클라이언트로 반환되는 정보를 포함하고 있으며, 일정한 값을 갖는 물성 파일, 온도에 의존하는 계산 인자 파일, 제약(drug) 물성 파일, 표현자 물성 파일, 양자역학 정보 파일, 분자 썸네일(thumbnail) 파일을 포함하고, 이들은 시스템의 부하분산을 위해서 각 파일들은 헤시안(hessian) 함수를 이용하여 생성된 폴더에 나누어져서 보관된다. 양자역학 정보 파일은 분자의 오비탈에 관한 물성과 양자계산에 관한 물성을 저장하고 있는 파일로서 양자역학 계산을 통해 얻어지는 결과파일로 2차적인 추가계산의 시작점 (starting point)으로 사용하기 위한 정보를 포함하며, 전자의 발견확률을 그래픽 환경에서 볼 수 있도록 오비탈(궤도함수)과 관련된 정보를 포함한다.File storage system with property information contains information returned to client according to user's request, property file with constant value, calculation factor file depending on temperature, drug property file, presenter property file It includes a quantum mechanical information file, a molecular thumbnail file, and these files are divided and stored in a folder created using a hessian function for load balancing of the system. The quantum mechanics information file is a file that stores the properties of the orbitals of molecules and the properties of quantum calculations. It is a result file obtained through quantum mechanical calculations and contains information for use as a starting point for secondary additional calculations. It contains information related to the orbitals so that the probability of discovery of the former can be seen in a graphical environment.

온도의존물성정보를 계산하기 위한 계산 프로그램은 물성을 확인하고 해당하는 물성에 맞는 계산 모듈을 실행하여 각 물성별 모듈에서 분자별 계수를 확인하여 계산을 수행한다.The calculation program for calculating the temperature dependent property information checks the properties and executes a calculation module for the corresponding properties to check the molecular coefficients in the module for each property to perform the calculation.

서버에 저장되어 있는 화합물 분자들의 물성에 관한 정보는 기존의 실험값에 기초한 물성데이터베이스하고는 달리 양자역학적 계산에 근거한 QSPR(quantitative structure-property relationship) [Todeschini R., V. Consonni V., Molecular Descriptors for Chemoinformatics : Second , Revised and Enlarged Edition : Volume I/ II, Wiley-VCH, 2009] 모형의 일례인 다중선형회귀-인공신경망 혼성모형에 의해서 직접 계산한 수많은 물성정보들이 저장되어 있다. 양자역학적 계산에 의한 분자의 전자구조 계산을 하기 위해서는 보통 순이론인 방법으로 슈뢰딩거(Schrodinger) 방정식을 풀어 전자에너지에 대한 해를 구하게 되는데, 전자가 많은 계의 경우 전자상관관계(electron correlation)를 무시한 근사법을 적용한 하트리-포크(Hartree-Fock, HF) 방법[C.C. J. Roothan, Rev. Mod. Phys. 23, 69 (1951)]을 사용하여 해를 풀게 된다. 이런 근사법으로 인해 계산된 결과에서 근본적인 오차가 유발되어 다차원의 이론적인 섭동항을 추가한 포스트 하트리-포크(Post Hartree-Fock) 방법[C. Moller and M. S. Plesset, Phys. Rev. 46, 618 (1934)]들을 사용하여 더 정확한 해를 구하긴 하지만 상대적으로 엄청나게 많은 계산량이 요구된다. Information on the properties of compound molecules stored on the server is based on quantitative structure-property relationship (QSPR) based on quantum mechanical calculations, unlike physical data based on existing experimental values [Todeschini R., V. Consonni V., Molecular Descriptors for Chemoinformatics : Second , Revised and Enlarged Edition : Volume I / II , Wiley-VCH, 2009] A large number of property information are directly stored by the multiple linear regression-artificial neural network hybrid model. In order to calculate the electronic structure of a molecule by quantum mechanical calculation, the Schrodinger equation is solved by a general theory method to solve the electron energy. In the case of a system with many electrons, the electron correlation is ignored. Hartree-Fock (HF) method using approximation [CCJ Roothan, Rev. Mod. Phys. 23, 69 (1951)]. This approximation introduces a fundamental error in the calculated results and adds a multidimensional theoretical perturbation term to the Post Hartree-Fock method [C. Moller and MS Plesset, Phys. Rev. 46, 618 (1934)], to obtain a more accurate solution, but require a relatively large amount of computation.

또한, 다른 방법인 하트리-포크와 포스트 하트리-포크를 조합한 가우시안 방법[L. A. Curtiss, K. Raghavachari, G. W. Trucks, and J. A. Pople, J. Chem. Phys. 94, 7221 (1991); L. A. Curtiss, K. Raghavachari, P. C. Redfern, V. Rassolov, and J. A. Pople, J. Chem. Phys. 109, 7764 (1998)]은 에너지 예측에 있어 아주 적은 오차를 보이지만 여러 포스트 하트리-포크 방법에 대한 에너지 계산을 수행하기 때문에 더 엄청난 계산량이 요구된다.In addition, a Gaussian method that combines another method, Hartley-Fork and Post Hartley-Fork [L. A. Curtiss, K. Raghavachari, G. W. Trucks, and J. A. Pople, J. Chem. Phys. 94, 7221 (1991); L. A. Curtiss, K. Raghavachari, P. C. Redfern, V. Rassolov, and J. A. Pople, J. Chem. Phys. 109, 7764 (1998) show very little error in energy prediction, but more computation is required because of the energy calculations for several post-Hartley-Fork methods.

본 발명에서는 많은 전자로 이루어진 분자에 대한 전자들간의 상관관계를 고려하기 위해 다차원의 섭동항이 추가된 파동함수 대신 전자 밀도함수를 써서 총에너지의 범함수를 이용해서 바닥상태를 구하는 밀도 범함수 이론(density functional theory)[ R. Seeger and J. A. Pople, J. Chem. Phys. 66, 3045 (1977)]을 적용하여 분자구조에 대한 최적화 및 진동수 계산을 수행하였다.In the present invention, in order to consider the correlation between electrons for molecules consisting of a large number of electrons, density function theory that calculates the ground state using the function of the total energy using the electron density function instead of the wave function to which the multidimensional perturbation term is added ( density functional theory) [R. Seeger and JA Pople, J. Chem. Phys. 66, 3045 (1977)] were used to optimize the molecular structure and calculate the frequency.

또한, 기존 실험값 기반 데이터베이스에서 처리하는 분자 개수인 수만개 수준을 넘어서 수천만개 수준의 물성정보 데이터를 처리하기 위하여, 사용자가 불편을 느끼지 않을 만큼 빠른 시간 내에 응답을 하도록 분자검색에는 모든 데이터를 2차원 테이블로 표현하는 관계형 데이터 베이스를 사용하고, 분자의 물성조회에는 트리구조를 이루는 파일 시스템을 사용한다. In addition, in order to process tens of millions of property information data beyond tens of thousands of molecules, which are processed in the existing experimental value-based database, the molecular search includes all data in a two-dimensional table so that the user responds as quickly as possible without inconvenience. A relational database is expressed using the file system, and a file system that forms a tree structure is used for querying the properties of molecules.

서버구조는 클라이언트에서 접근할 수 있도록 웹어플리케이션 서버가 외부로 노출되어 있다. 웹어플리케이션이 서버자원을 이용해서 서버시스템 내부에서 사용자 로그인, 분자 검색, 물성조회 같은 기능을 처리한 다음 결과를 클라이언트로 반환한다. In the server structure, the web application server is exposed to the outside for client access. The web application uses server resources to process functions such as user login, molecular search, and property lookup inside the server system, and then return the results to the client.

사용자가 로그인을 한 후에 분자식, 분자명, 분자구조를 이용하여 일반 검색(General search)을 수행하며, 도 3에서 보여주는 바와 같이 분자식 C6H6를 입력하면 도면 4와 같이 C6H6를 포함하는 화합물인 벤젠을 비롯한 6개의 분자가 검색되어지나, 분자명으로 벤젠만을 입력하면 C6H6를 입력하는 경우에서 5개의 분자는 검색되지 않고 벤젠만이 검색되어 화면에 디스플레이 된다. After the user logs in, a general search is performed using a molecular formula, a molecular name, and a molecular structure. As shown in FIG. 3, when the molecular formula C6H6 is input, a compound including benzene, which is a compound including C6H6, is shown in FIG. 4. 6 molecules are searched, but if only benzene is entered as the molecular name, when entering C6H6, 5 molecules are not searched and only benzene is searched and displayed on the screen.

또한, 본원 발명의 일반검색은 종래 실험값 데이터베이스에서는 제공하지 않는 본 발명인 물성정보 시스템만의 고유 기능인 분자구조를 이용한 검색기능을 포함하고 있다. 다양한 분자구조를 포함하고 있는 파일인 몰파일을 불러와서 몰파일 내의 분자구조를 선택하여 검색조건으로 이용할 수도 있고, 사용자가 직접 원하는 분자 구조를 그려서 그 분자구조를 기반으로 검색을 수행할 수도 있다. 몰파일에서 선택된 분자구조 또는 사용자가 직접 입력한 구조를 전체구조검색의 조건으로 설정할 수 있을 뿐만 아니라 이를 전체 구조 중 하나의 일부분, 다시 말하면 전체 구조 중에 선택된 구조가 포함되어 있는 것을 조건으로 설정하는 부분구조검색이 가능하다. 따라서, 벤젠 분자구조를 검색조건으로 이용해서 검색하면 각각 도 5, 도 6에서 검색결과를 볼 수 있다. 도 5는 벤젠이 검색하고자 하는 검색 구조로 설정했을 경우에 대하여 전체구조검색의 결과로서, 벤젠만이 검색되었다. 도 6은 전체 구조 중에 벤젠 구조를 포함하는 분자를 검색한 것으로10055개의 화합물이 검색되어졌다. In addition, the general search of the present invention includes a search function using a molecular structure, which is a unique function of the physical property information system of the present invention, which is not provided in a conventional experimental value database. You can import a mole file, which is a file that contains various molecular structures, and select the molecular structure in the mole file to use as a search condition, or you can draw the desired molecular structure and perform a search based on the molecular structure. In addition to setting the molecular structure selected in the mole file or the structure entered directly by the user as a condition of the entire structure search, it is part of one of the whole structures, that is, the condition that the selected structure is included in the whole structure. Structure search is possible. Accordingly, if the benzene molecular structure is used as the search condition, the search results can be seen in FIGS. 5 and 6, respectively. FIG. 5 shows only benzene as a result of the overall structure search in the case where benzene is set as the search structure to be searched. FIG. 6 is a search for molecules including a benzene structure in the entire structure. 10055 compounds were searched.

화합물의 검색은 확장검색(extended search)에 의해서도 검색되어진다. 일반검색은 분자명, 분자식, 분자구조에 의해서 검색되지만 확장검색은 원소의 개수, 분자량, InChI(The IUPAC International Chemical Identifier) 또는 물성의 범위를 이용하여 검색을 수행할 수 있다. 도 7에서 보여주는 바와 같이 기본 원소인 C, H, O, N, S의 개수를 사용자가 원하는 수로 설정할 수 있으며, 분자량 역시 사용자가 일정 범위를 한정할 수 있다. 상기한 검색조건을 도 7에서 보여주는 확장검색 창에 입력을 한 후에 검색된 화합물 결과 목록 중에서 화합물을 클릭하여 선택하면 해당 화합물 분자에 대하여 도 8 내지 도 11에서와 같이 물성치, 분자표현자 값, 양자역학 계산값, 제약물성치가 사용자의 화면으로 반환되어 디스플레이된다.Searches for compounds are also searched by extended search. General search is searched by molecular name, molecular formula, molecular structure, but extended search can be searched by using the number of elements, molecular weight, InChI (The IUPAC International Chemical Identifier) or a range of physical properties. As shown in FIG. 7, the number of basic elements C, H, O, N, and S may be set to a number desired by the user, and the molecular weight may be limited by the user. After inputting the above search conditions in the extended search window shown in FIG. 7 and selecting a compound from the searched compound result list by clicking on the compound, the properties, molecular expression values and quantum mechanics of the compound molecule are shown in FIGS. 8 to 11. The calculated values and the constraint properties are returned to the user's screen and displayed.

물성 중에 온도에 의존하는 물성인 경우에는 원하는 온도대역을 직접 선택해서 물성을 조회할 수 있다. 사용자가 원하는 온도 대역을 입력하면 클라이언트는 그 온도들을 서버로 보내고 서버는 해당 온도에 대하여 온도의존물성정보를 계산하기 위한 모듈에 의해서 온도의존 물성을 계산한 다음 클라이언트로 값을 돌려준다. 종래의 실험값 물성 데이터베이스는 이미 실험이 수행되어서 데이터베이스에 저장되어 있는 값만을 조회해 볼 수 있지만, 본 발명인 물성정보 시스템은 사용자가 원하는 온도 범위에 대한 값을 실시간으로 계산해서 조회할 수 있다. 도 12는 온도 범위가 273K에서 1500K로 설정된 경우, 이상기체의 열용량 값을 보여주며, 실험치가 존재하는 경우에 대하여 실험에 의해서 얻어진 값과 본 발명의 계산값을 비교할 수 있도록 두가지 값을 함께 보여주고 있으며 상당히 정확한 이상기체의 열용량 값을 계산에 의해서 얻을 수 있다는 것을 알 수 있다.In the case of physical properties depending on temperature among physical properties, the desired physical temperature can be directly selected to inquire the physical properties. When the user inputs the desired temperature range, the client sends the temperatures to the server, and the server calculates the temperature-dependent properties by the module for calculating temperature-dependent property information for the temperature, and then returns the value to the client. In the conventional experimental value property database, the experiment has already been performed and can only query the values stored in the database. However, the property information system of the present invention can calculate and inquire a value for a desired temperature range in real time. Figure 12 shows the heat capacity of the ideal gas when the temperature range is set from 273K to 1500K, and shows the two values together to compare the calculated value of the present invention with the value obtained by the experiment for the presence of the experimental value And it can be seen that the heat capacity value of the ideal gas can be obtained by calculation.

그 밖에도 IR, VCD, NMR의 스펙트라 정보 역시 사용자가 선택한 화합물에 대하여 클라이언트로 제공되며, 도 13 내지 도 15에서 보여주는 바와 같이 선택된 화합물의 측정정보, 분자진동수, 오비탈 등의 3차원 구조 정보 역시 제공된다. 측정정보는 화합물 분자 내의 원자간의 거리, 원자와 원자 간의 배열 각도 등을 포함하고, 분자진동은 도 14에서 보여주는 것처럼 해당하는 분자진동에 대한 방향과 세기를 화살표 형식으로 표현해주고 분자가 해당하는 분자진동에 맞게 움직이도록 애니메이션이 구현되어 있어서 사용자가 역동적인 분자의 이미지를 확인할 수 있다. 도 15는 오비탈 정보로서, 본 발명은 양자역학 계산에 의해서 얻어진 결과이며 이는 종래의 데이터베이스에서는 제공할 수 없는 본 발명에서만 제공할 수 있는 고유한 분자 정보이다.In addition, the spectra information of IR, VCD, and NMR are also provided to the client for the compound selected by the user, and as shown in FIGS. 13 to 15, measurement information, molecular frequency, and orbital of the selected compound are also provided. . The measurement information includes the distance between atoms in a compound molecule, the angle of arrangement between atoms, and the like. The molecular vibration represents the direction and intensity of the corresponding molecular vibration in the form of an arrow as shown in FIG. The animation is implemented to move in line with the user, allowing the user to see the image of dynamic molecules. Fig. 15 is orbital information, and the present invention is a result obtained by quantum mechanical calculation, which is unique molecular information that can be provided only in the present invention which cannot be provided in a conventional database.

이렇게 본 화학물성정보시스템은 단순히 수치적 물성정보만 가지고 있는 데이터베이스가 아니라 하나의 분자에 대한 거의 모든 정보들을 하나의 프로그램에서 찾아볼 수 있도록 설계된 시스템이다. 이 시스템에서 정해진 네트워크 프로토콜을 이용하면 클라이언트는 일반 PC와 모바일 기기를 가리지 않고 모두에서 구현될 수 있다.
This chemical information system is not a database that contains only numerical information but is designed to find almost all information about one molecule in one program. Using the defined network protocols in this system, clients can be implemented on both regular PCs and mobile devices.

이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
While the present invention has been particularly shown and described with reference to specific embodiments thereof, those skilled in the art will appreciate that such specific embodiments are merely preferred embodiments and that the scope of the present invention is not limited thereto will be. Accordingly, the actual scope of the present invention will be defined by the appended claims and their equivalents.

Claims (9)

화합물의 물성을 예측하는 방법에 있어서,
서버에 접근할 수 있는 클라이언트에 사용자가 로그인하는 제1단계;
검색하고자 하는 화합물을 분자식, 분자명, 분자구조, 원소 C, H, O, N, S의 개수, 분자량, InChI(The IUPAC International Chemical Identifier), 물성범위 중 어느 하나 이상을 선택하여 입력하는 제2단계;
상기 제2단계에서 상기 화합물의 온도에 의존하는 경우의 물성에 대하여 원하는 온도 범위를 선택하는 제3단계;
상기 제2단계 및 상기 제3단계에서 입력된 정보를 클라이언트가 서버로 전송하는 제4단계;
상기 제4단계에서 전송된 정보를 통하여 입력된 상기 화합물에 대한 물성을 다중선형회귀-인공신경망 혼성모형에 의해서 얻어진 화합물의 물성 예측값을 갖고 있는 분자 정보 데이터베이스, 물성정보를 가지고 있는 파일스토리지, 상기 제3단계에서 선택된 온도 범위에 대한 물성을 계산하는 온도의존물성 계산 모듈, 분자구조기반 검색 모듈로부터 전송 받아 서버에서 클라이언트로 반환하는 제5단계;
상기 제2단계 및 상기 제3단계에서 입력된 상기 화합물에 대한 IR, VCD, NMR 스펙트라 정보를 서버에서 클라이언트로 반환하는 제6단계;
상기 제2단계 및 상기 제3단계에서 입력된 상기 화합물에 대한 3차원 구조정보를 서버에서 클라이언트로 반환하는 제7단계; 및 상기 제5단계 내지 제7단계에서 클라이언트로 전송된 상기 물성, 스펙트라 정보, 화합물 분자 내의 원자 간의 거리, 인접 원자 간의 각도, 분자의 비틀림 정도, 분자 진동수, 오비탈을 포함하는 3차원 구조정보를 클라이언트가 화면에 디스플레이하는 제8단계;를 포함하는 화합물의 물성을 예측하는 방법.
In the method of predicting the physical properties of the compound,
A first step of the user logging in to a client that can access the server;
A second method for selecting and inputting one or more of a molecular formula, molecular name, molecular structure, number of elements C, H, O, N, and S, molecular weight, InChI (The IUPAC International Chemical Identifier), and a property range step;
A third step of selecting a desired temperature range with respect to physical properties when the second step depends on the temperature of the compound;
A fourth step of transmitting, by the client, the information input in the second and third steps to the server;
A molecular information database having physical property prediction values of the compound obtained by the multiple linear regression-artificial neural network hybrid model, and the file storage having the physical property information. A fifth step of receiving a temperature dependency calculation module for calculating physical properties of the temperature range selected in step 3 and a molecular structure-based search module and returning them from the server to the client;
A sixth step of returning IR, VCD, and NMR spectra information on the compound input in the second and third steps from the server to the client;
A seventh step of returning three-dimensional structure information of the compound input in the second and third steps from the server to the client; And 3D structural information including the physical properties, spectra information, distances between atoms in compound molecules, angles between adjacent atoms, degree of torsion of molecules, molecular frequency, and orbitals transmitted to the client in steps 5-7. The eighth step of displaying on the screen; Method of predicting the physical properties of the compound comprising.
삭제delete 제1항에 있어서, 상기 제2단계에서 분자구조는 사용자에 의해서 분자구조를 가지고 있는 테이블에서 선택되거나 사용자에 의해서 직접 입력될 수 있으며, 입력되는 상기 분자구조는 분자구조의 전체 구조 또는 전체 구조 중의 일부분이 입력되는 것을 특징으로 하는 화합물의 물성을 예측하는 방법.
The method of claim 1, wherein in the second step, the molecular structure is selected from a table having a molecular structure by a user or directly input by a user, and the input molecular structure is selected from among the entire structure or the entire structure of the molecular structure. A method of predicting the physical properties of a compound, characterized in that a portion is input.
삭제delete 제1항 또는 제3항 중 어느 한 항에 의한 화합물의 물성을 예측하는 방법을 컴퓨터에서 실행시키기 위한 프로그램으로 기록하고 컴퓨터로 읽을 수 있는 저장 매체.
A computer-readable storage medium having recorded thereon a program for executing on a computer a method for predicting the physical properties of a compound according to claim 1.
화합물의 물성을 예측하는 시스템에 있어서,
사용자가 검색하고자 하는 화합물의 분자식, 분자명, 분자구조, 원소 C, H, O, N, S의 개수, 분자량, InChI(The IUPAC International Chemical Identifier), 물성범위 중 어느 하나 이상을 선택하여 입력하고, 접근이 가능한 서버에서 반환되는 물성, IR, VCD, NMR 스펙트라 정보, 화합물 분자 내의 원자간의 거리, 인접 원자간의 각도, 분자의 비틀림 정도, 분자 진동수, 오비탈을 포함하는 3차원 구조정보를 화면에 디스플레이하는 클라이언트;
상기 클라이언트에서 입력된 화합물의 물성, IR, VCD, NMR 스펙트라 정보, 3차원 구조정보를 계산하고 검색하는 서버; 및
상기 서버는 웹어플리케이션 서버, 분자의 검색에 필요한 정보를 가지고 있는 테이블과 물성에 관한 정보를 가지고 있는 테이블을 포함하는 관계형데이터베이스, 다중선형회귀-인공신경망 혼성모형에 의해서 얻어진 화합물의 물성 예측값, 온도의존물성 계산인자, 제약 물성, 분자표현자, 양자역학 정보를 포함하고 있는 파일스토리지, 선택된 온도 범위에 대한 온도의존물성정보를 계산하기 위한 계산 모듈, 분자구조기반 검색모듈을 포함하는 화합물의 물성을 예측하는 시스템.
In the system for predicting the physical properties of the compound,
Select and enter one or more of the molecular formula, molecular name, molecular structure, number of elements C, H, O, N, S, molecular weight, InChI (The IUPAC International Chemical Identifier), and physical property range of the compound 3D structural information including properties returned from accessible server, IR, VCD, NMR spectra information, distance between atoms in compound molecule, angle between adjacent atoms, degree of torsion of molecules, molecular frequency, orbital Client;
A server for calculating and retrieving physical properties, IR, VCD, NMR spectra information, and 3D structure information of the compound input from the client; And
The server is a web application server, a relational database including a table containing information necessary for the retrieval of molecules and a table containing information on physical properties, predicted properties of compounds obtained by a multiple linear regression-artificial neural network hybrid model, and temperature dependence. Predict physical properties of compounds, including physical properties calculation factors, pharmaceutical properties, molecular descriptors, pile storage containing quantum mechanical information, calculation modules for calculating temperature dependent property information for selected temperature ranges System.
삭제delete 제6항에 있어서, 상기 클라이언트에서 입력되는 상기 분자구조는 사용자에 의해서 분자구조를 가지고 있는 테이블에서 선택되거나 사용자에 의해서 직접 입력될 수 있으며, 입력되는 상기 분자구조는 분자구조의 전체 구조 또는 전체 구조 중의 일부분이 입력되는 것을 특징으로 하는 화합물의 물성을 예측하는 시스템.



The molecular structure of claim 6, wherein the molecular structure input from the client is selected from a table having a molecular structure by a user or directly input by the user, and the input molecular structure is the entire structure or the entire structure of the molecular structure. A system for predicting the physical properties of a compound, characterized in that a part of the input.



삭제delete
KR1020110110691A 2011-10-04 2011-10-27 Method for Predicting a Property of Compound and System for Predicting a Property of Compound KR101375672B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110110691A KR101375672B1 (en) 2011-10-27 2011-10-27 Method for Predicting a Property of Compound and System for Predicting a Property of Compound
PCT/KR2012/007999 WO2012177108A2 (en) 2011-10-04 2012-10-04 Model, method and system for predicting, processing and servicing online physicochemical and thermodynamic properties of pure compound

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110110691A KR101375672B1 (en) 2011-10-27 2011-10-27 Method for Predicting a Property of Compound and System for Predicting a Property of Compound

Publications (2)

Publication Number Publication Date
KR20120085178A KR20120085178A (en) 2012-07-31
KR101375672B1 true KR101375672B1 (en) 2014-03-20

Family

ID=46715852

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110110691A KR101375672B1 (en) 2011-10-04 2011-10-27 Method for Predicting a Property of Compound and System for Predicting a Property of Compound

Country Status (1)

Country Link
KR (1) KR101375672B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190123002A (en) 2018-04-23 2019-10-31 한국과학기술연구원 An analysis method of sulfide-based solid electrolyte using computer simulation technique and an analysis program of sulfide-based solid electrolyte using computer simulation technique

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101801226B1 (en) * 2015-08-27 2017-11-24 고려대학교 산학협력단 Classification Algorithm for Chemical Compound Using InChI
KR102587959B1 (en) 2018-01-17 2023-10-11 삼성전자주식회사 Method and apparatus for generating chemical structure using neural network
KR102538144B1 (en) * 2018-01-29 2023-05-30 주식회사 켐에쎈 System for analysing lc-ms/ms data of nature products
KR102564473B1 (en) * 2018-01-29 2023-08-07 주식회사 켐에쎈 Method for analysing lc-ms/ms data of nature products
KR102186852B1 (en) * 2018-06-21 2020-12-04 연세대학교 산학협력단 A method for simulating molecular structure
JP7082414B2 (en) * 2018-10-15 2022-06-08 国立研究開発法人物質・材料研究機構 Search system and search method
KR102214634B1 (en) * 2018-10-22 2021-02-10 한국화학연구원 Properties prediction system based on artificial intelligence
KR102288059B1 (en) * 2018-10-31 2021-08-10 주식회사 인실리코 Recommendation method of meterial formulation using artificial intelligence and apparatus using thereof
CN114464273A (en) * 2021-12-22 2022-05-10 天翼云科技有限公司 Molecular structure database construction method and device, electronic equipment and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190123002A (en) 2018-04-23 2019-10-31 한국과학기술연구원 An analysis method of sulfide-based solid electrolyte using computer simulation technique and an analysis program of sulfide-based solid electrolyte using computer simulation technique
US11562108B2 (en) 2018-04-23 2023-01-24 Korea Institute Of Science And Technology Method for analyzing sulfide-based solid electrolyte using computer simulation and program for analyzing sulfide-based solid electrolyte using computer simulation

Also Published As

Publication number Publication date
KR20120085178A (en) 2012-07-31

Similar Documents

Publication Publication Date Title
KR101375672B1 (en) Method for Predicting a Property of Compound and System for Predicting a Property of Compound
Bursch et al. Best‐practice DFT protocols for basic molecular computational chemistry
Son et al. First-principles united atom force field for the ionic liquid BMIM+ BF4–: An alternative to charge scaling
Frenkel et al. ThermoData Engine (TDE): software implementation of the dynamic data evaluation concept
Wormit et al. Investigating excited electronic states using the algebraic diagrammatic construction (ADC) approach of the polarisation propagator
McDaniel et al. Next-generation force fields from symmetry-adapted perturbation theory
Wang et al. Force field for water based on neural network
Hayat et al. Quality testing of spectrum-based valency descriptors for polycyclic aromatic hydrocarbons with applications
Hill et al. Materials data infrastructure and materials informatics
Hofmann et al. A discrete algorithm for crystal structure prediction of organic molecules
Fias et al. Alchemical normal modes unify chemical space
Willighagen et al. Linking the resource description framework to cheminformatics and proteochemometrics
Vainio et al. Scaffold hopping by fragment replacement
Diky et al. ThermoData Engine (TDE): software implementation of the dynamic data evaluation concept. 3. Binary mixtures
Yang et al. Density prediction models for energetic compounds merely using molecular topology
Paduszyński et al. Predicting melting point of ionic liquids using QSPR approach: Literature review and new models
Wu et al. Prediction of Henry's law constants of CO 2 in imidazole ionic liquids using machine learning methods based on empirical descriptors
Liu et al. Toward high-level machine learning potential for water based on quantum fragmentation and neural networks
Cerecedo-Cordoba et al. Melting temperature estimation of imidazole ionic liquids with clustering methods
Shabbir et al. Computational analysis of topological index-based entropies of carbon nanotube Y-junctions
Schmidt et al. Probing phase transitions in organic crystals using atomistic md simulations
Yokogawa et al. Analytical second derivatives of the free energy in solution by the reference interaction site model self-consistent field explicitly including constrained spatial electron density distribution
Diky et al. ThermoData engine (TDE): software implementation of the dynamic data evaluation concept. 4. Chemical reactions
Thakur et al. Nuclear quantum effects in the acetylene: ammonia plastic co-crystal
Huang et al. EM Database v1. 0: A benchmark informatics platform for data-driven discovery of energetic materials

Legal Events

Date Code Title Description
A201 Request for examination
G15R Request for early opening
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170307

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180309

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190312

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20200310

Year of fee payment: 7