KR101995511B1 - Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments - Google Patents

Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments Download PDF

Info

Publication number
KR101995511B1
KR101995511B1 KR1020170079166A KR20170079166A KR101995511B1 KR 101995511 B1 KR101995511 B1 KR 101995511B1 KR 1020170079166 A KR1020170079166 A KR 1020170079166A KR 20170079166 A KR20170079166 A KR 20170079166A KR 101995511 B1 KR101995511 B1 KR 101995511B1
Authority
KR
South Korea
Prior art keywords
compounds
compound
pharmacological activity
fragment
pharmacologically active
Prior art date
Application number
KR1020170079166A
Other languages
Korean (ko)
Other versions
KR20190000167A (en
Inventor
이관수
이보아
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020170079166A priority Critical patent/KR101995511B1/en
Publication of KR20190000167A publication Critical patent/KR20190000167A/en
Application granted granted Critical
Publication of KR101995511B1 publication Critical patent/KR101995511B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템이 제공된다. 이 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계, 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.A novel lead substance predicting method and system is provided based on the fragment property relationship association rules of similar pharmacological active group compounds. The method comprises the steps of: a system operating by at least one processor for predicting a new lead material candidate, comprising the steps of collecting information of the various pharmacological activities and of compounds having a distinct pharmacological activity, statistically Grouping compounds by pharmacological activity, fragmenting the compounds in pseudo-pharmacologically active groups into minimum chemical functional units to derive fragmented structures for each compound, Selecting at least one particular fragment structure derived and predicting the selected at least one particular fragment structure to a new leader material candidate for pharmacological activity of the compounds in the group.

Description

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING NEW DRUG LEAD COMPOUND CANDIDATE BY APPLYING ASSOCIATION RULES BETWEEN PHARMACOLOGICALLY ACTIVE SIMILAS COMPOUNDS AND THEIR FRAGMENTS}FIELD OF THE INVENTION The present invention relates to a new lead substance predicting method and system based on fragment association property association rules of similar pharmacologically active group compounds. BACKGROUND ART < RTI ID = 0.0 > [0002] <

본 발명은 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템에 관한 것이다.The present invention relates to a novel lead substance predicting method and system based on associative structure property association rules of similar pharmacologically active group compounds.

선도물질 발굴과정(lead generation)은 새로운 약물의 개발을 위한 기초연구부터 임상 그리고 허가에 이르는 여러 단계의 신약개발 사슬에서 중요한 단계이며 고품질의 선도물질은 임상 성공을 위한 기초를 다져주는 출발점이다. Lead generation is an important step in the development of new drugs, from basic research to the development of new drugs, to clinical trials and licensing, and high quality lead compounds are the starting point for building the foundation for clinical success.

신약개발은 일반적으로 개발하고자 하는 질병의 타깃 선정으로 시작되고 알려진 화합물을 스크리닝하고, 초기 선도물질을 고르고 검증하고, 간단한 최적화 과정을 거쳐서 선도물질을 선정하게 된다. 선정된 선도물질은 의약화학의 여러가지 방법을 통하여 1년 이상의 최적화 과정을 통하여 후보물질로 만들어지고 임상실험에 사용된다. 이러한 이유로 선도물질의 선정과정은 후보물질의 임상에서의 약리활성 및 독성에 관계되는 화합물의 구조적 특성의 출발점이고, 신약개발 사슬에서 중요한 단계이다.New drug development usually begins with selecting the target of the disease to be developed, screening the known compounds, selecting and testing the initial lead substance, and selecting the leading substance through a simple optimization process. The selected leading substances are made into candidate materials through optimization process of more than one year through various methods of pharmaceutical chemistry and used in clinical experiments. For this reason, the selection process of lead compounds is a starting point for the structural characteristics of compounds related to the pharmacological activity and toxicity of candidate compounds in clinical use, and is an important step in the development of new drugs.

최근에는 조각구조가 선도물질이 되어, 이를 기반으로 한 약물발견 및 가상 스크리닝이 사용되고 있고, 작은 규모의 화합물로도 시작이 가능하여 신약 개발 단계에서 널리 이용될 것이다. In recent years, sculptural structures have become the leading materials, drug discovery and virtual screening based on them have been used, and it is possible to start with small-scale compounds, which will be widely used in the development stage of new drugs.

선도물질 발굴에 해당하는 종래기술은, 천연물을 이용한 신약발굴 과정에서 살펴 볼 수 있다. 이러한 천연물 유래의 많은 활성물질 내의 공통 구조를 선도물질로 하여 합성을 통한 신약개발 발굴 과정은, 일반적으로 하나의 천연물 소재로부터 추출된, 대량의 천연물 화합물의 약효 스크리닝 과정부터 출발한다. 스크리닝 과정을 통해 도출해낸 초기 약리활성을 지니는 공통 구조를 선도물질로 하여, 구조적으로 유사한 화합물이나 유도체를 합성하여 보다 약리활성도를 증가시키며 독성이나 부작용을 줄이고 체내 약물 전달 시스템의 문제를 해결하는 과정을 거친다. The conventional technology for finding lead compounds can be found in the process of discovering new drugs using natural products. The process of discovering a new drug through synthesis using a common structure in many active materials derived from such natural materials as a starting material generally starts with a process for screening a large amount of a natural compound extracted from one natural material. A common structure with initial pharmacological activity derived from the screening process is used as a lead compound to synthesize a structurally similar compound or derivative to increase pharmacological activity, reduce toxicity or side effects, and solve problems in the body drug delivery system It goes through.

이러한 천연물 화합물의 약효 스크리닝 과정은 근본적인 경험적 방법으로서 결과에 대한 사전 예측 없이 진행되기 때문에 새로운 선도물질을 도출할 수 있다는 장점이 있다. 반면, 약효시험 비용이나 화합물 확보 및 관리비용 측면에서 막대한 비용과 시간이 필요하다는 문제점이 있다. The beneficial screening process of these natural compounds is a fundamental empirical method, and it is advantageous that a new leading substance can be derived because it proceeds without prior prediction of the result. On the other hand, there is a problem that enormous cost and time are required in terms of the cost of the test for pharmacological activity and the cost for securing and managing the compound.

또한, 다중 스크리닝법을 통한 선도물질의 발굴과정이 있다. 현재 세계적으로, 우수한 선도물질을 잘 고르기 위하여 기술혁신 및 다양성 기반 연구가 진행되고 있다. 특히, 고속 다중 스크리닝법을 통하여 스크리닝 할 수 있는 물질의 수가 획기적으로 증가하자, 회사들은 새로운 선도물질을 확보하기 위하여, 전 세계의 화학자들에게 접근하여 합성 화합물들을 저가에 구입하려는 시도를 하였다. 다양한 화합물 라이브러리를 최대한 확보하고자, 화합물의 다양성을 획기적으로 개선할 것을 목표로 대대적으로 투자하였다. In addition, there is a process of extracting a lead substance through a multiple screening method. At present, research on technological innovation and diversity is proceeding in order to select good leading substances globally. Particularly, as the number of substances that can be screened through the high-speed multiple screening method has been drastically increased, companies have tried to purchase synthetic compounds at low cost by approaching chemists around the world in order to secure new leading substances. We have invested heavily in order to dramatically improve the diversity of compounds in order to maximize the variety of compound libraries.

그러나 실제로 응용할 수 있는 합성 방법이 제한되어 있고, 따라서 얻어지는 물질의 수에 비해서 그 다양성은 실제로 감소하는 경향이 있어, 결과적으로 초기비용을 더 지불해야 하는 상황을 초래하였다. However, practical synthesis methods are limited, and thus the variability tends to actually decrease relative to the number of materials obtained, resulting in a situation in which the initial cost has to be paid more.

또한, 고속 다중 스크리닝법에 비교하여 낮은 분자량을 갖는 양질의 조각구조를 X-레이 구조결정학이나 핵자기 공명 기술을 사용하여 도출하는 방법이 있다. 그러나 이러한 선도물질 도출방법 또한 시간적으로나 비용적으로 탐색 비용이 매우 높다. Further, there is a method of deriving a high-quality fragment structure having a low molecular weight as compared with a high-speed multiple screening method using an X-ray structure crystallography or a nuclear magnetic resonance technique. However, the method of deriving such a lead substance is also very expensive in terms of time and cost.

또한, 화합물의 단순 조각화를 통해 도출된 조각구조들을 약효시험 과정을 거쳐 일부 약리활성 조각구조를 발굴하는 시도도 있었으나, 이는 보다 중요한 조각구조를 찾는 과정이 빠져있는 단점이 있다.In addition, there has been an attempt to discover some pharmacologically active fragment structures through a drug-eluting test on fragments obtained by simple fragmentation of the compound, but this has the disadvantage that the process of finding more important fragments is not found.

실제로 새로운 혁신 신약을 개발하기 위해서는 신약으로 개발할 가능성이 높은 선도물질의 선정이 중요하다. 그러나, 전술한 바와 같이, 대부분의 종래기술들은 약리활성을 갖는 다양한 최소 단위의 구조를 발굴하기까지, 대단위의 약리활성 화합물 및 약효 시험 비용을 비롯하여, 후보 탐색을 위한 전처리 과정에 소요되는 비용과 시간이 막대하다는 문제가 있다.In fact, in order to develop new innovative drugs, it is important to select leading substances that are likely to be developed as new drugs. However, as described above, most of the prior art techniques are limited to finding the structures of various minimum units having pharmacological activity, including the cost of the pretreatment process for the candidate search, including the large amount of the pharmacologically active compound and the cost of the pharmacological test, There is a problem with this bar.

본 발명이 해결하고자 하는 과제는 약리활성 유사도에 따라 그룹핑된 약리활성을 갖는 화합물에 대해 화합물 조각화 기법을 이용하여 그룹 내 약리활성 유사 화합물들을 최소 화학적 기능 단위로 조각화하고, 연관 규칙 출원 기법을 이용하여 조각구조와 약리활성의 연관도 점수를 도출한 후, 신약개발에 있어 선도물질로 제시 가능한 약리활성을 나타내는 최적의 조각구조를 발굴하는 방법 및 이를 수행하는 시스템을 제공하는 것이다.Disclosure of the Invention Problem to be solved by the present invention is to provide a compound having a pharmacological activity grouped according to the pharmacological activity similarity by fragmenting pharmacologically active compounds in the group into a minimum chemical functional unit using a compound fragmentation technique, The present invention provides a method for identifying an optimal fragment structure exhibiting a pharmacological activity that can be presented as a leading substance in the development of a new drug, and a system for carrying out the method.

본 발명의 하나의 특징에 따르면, 신규 선도물질 후보 예측 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계, 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.According to one aspect of the present invention, a new lead material candidate prediction method is a method for a system operating by at least one processor to predict a new lead material candidate, comprising: Collecting the compounds determined to have statistically significant similarities to the individual pharmacological activities and grouping them according to their pharmacological activity, fragmenting the compounds in the similar pharmacological active group into the minimum chemical functional units, Selecting at least one particular fragment structure that is commonly derived from the in-group compounds, and selecting the at least one particular fragment structure as a new leader material candidate for pharmacological activity of the in-group compounds .

상기 그룹핑하는 단계는, 모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)와, 통계적으로 유의미한지를 나타내는 유의 확률에 기초하여, 약리활성이 유사한 화합물들을 발굴할 수 있다.The grouping step may comprise the step of selecting compounds which have similar pharmacological activity on the basis of the odds ratio between the compound and the pharmacological activity calculated on the basis of the frequency with respect to the individual pharmacological activity of all the compounds and the significance probability indicating statistically significant It can be excavated.

상기 그룹핑하는 단계는, 상기 승산비에 기초하여 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들 중에서 상기 유의 확률이 0.05 이하 이하인 화합물들을 해당 약리활성이 유사한 화합물로 발굴할 수 있다.The grouping step may include ranking the compounds having pharmacological activity by pharmacological activity on the basis of the multiplication ratio and comparing the compounds having the significance probability of 0.05 or less among the ranked compounds to compounds having similar pharmacological activity Can be excavated.

상기 선정하는 단계는, 상기 그룹 내 모든 화합물과, 조각화를 통해 도출된 조각구조들 간에 발생 빈도수를 이용하여 특정 화합물과 특정 조각구조 간에 연관도 점수를 산출하고, 상기 연관도 점수가 기준값을 충족하는 조각구조와 화합물 쌍을 선정할 수 있다.Wherein the step of selecting comprises calculating a score of association between a specific compound and a particular fragment structure using the frequency of occurrence between all the compounds in the group and fragmented structures derived through fragmentation and if the association score satisfies the reference value The sculpture structure and compound pairs can be selected.

상기 연관도 점수는, 상기 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들의 모든 발생 빈도 중에서 특정 조각구조와 특정 화합물이 동시에 발생할 확률을 나타내는 지지도, 특정 조각구조가 발생할 때, 특정 화합물이 발생할 확률을 나타내는 신뢰도, 그리고 상기 지지도와 신뢰도의 비율인 향상도를 포함하고, 상기 선정하는 단계는, 상기 지지도와 상기 신뢰도가 기준값을 충족하는 조각구조와 화합물 쌍 중에서 상기 향상도를 기준으로 특정 조각구조가 특정 화합물에 대해 유의미한 연관성이 있는지 평가하여, 유의미한 연관성이 있다고 판단된 적어도 하나의 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 선정할 수 있다.The degree of association refers to a degree of support indicating the probability that a specific fragment structure and a specific compound occur at the same time from all occurrence frequencies of all compounds in the group and fragment structures derived from all the compounds, And a degree of reliability which is a ratio of the degree of support to the degree of reliability, wherein the step of selecting includes selecting a specific piece from among a piece structure and a compound pair satisfying the reference value, It is possible to evaluate at least one fragment structure that is determined to be of significant relevance and at least one fragment structure that is common from the pair of compounds by evaluating whether the structure has a significant association with a particular compound.

상기 선정하는 단계는, 상기 향상도가 1보다 큰 조각구조와 화합물 쌍은 유의미한 연관성이 있다고 평가할 수 있다.The selecting step may be evaluated as having a significant association between the sculpture structure having the degree of improvement of greater than 1 and the compound pair.

상기 향상도는, 특정 약리활성에 대한 신규 선도물질 후보의 예측 점수로 사용될 수 있다.The improvement may be used as a predictive score of a new lead substance candidate for a particular pharmacological activity.

본 발명의 다른 특징에 따르면, 신규 선도물질 후보 예측 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 화합물들로부터 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.According to another aspect of the present invention, a new lead material candidate prediction method is a method for a system operating by at least one processor to predict a new lead material candidate, the method comprising: Fragmentation of the at least one specific fragment structure into a plurality of fragmented structures, deriving fragmented structures for each compound, selecting at least one particular fragmented structure commonly derived from the compounds, And predicting with the lead material candidates.

상기 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들은, 온라인 상의 공개 데이터베이스 및 공신력이 있는 자료들과, 사용자가 입력한 정보들로부터 다양한 약리활성과, 개별 약리활성을 가지는 화합물들로부터, 특정 약리활성과 특정 화합물간의 발생 빈도수에 기초하여 산출된 승산비와, 피셔의 정확 검증(fisher exact test)에 따른 유의 확률에 기초하여 선정될 수 있다.Compounds having pharmacological activity with statistically significant similarity can be obtained from compounds having various pharmacological activities and individual pharmacological activities from a public database on the on-line database and publicly available data and user-input information, The multiplication ratio calculated based on the frequency of occurrence between the specific compound and the specific compound, and the significance probability according to the fisher exact test.

상기 선정하는 단계는, 특정 화합물과 특정 조각구조 간에 발생 빈도수를 이용하여 산출된 연관도 점수가 기준값을 충족하는 화합물과 조각구조 쌍들에 공통으로 포함된 적어도 하나의 특정 조각구조를 선정할 수 있다.The selecting may select at least one specific fragment structure that is common to the pair of fragment pairs and the compound whose association score calculated using the occurrence frequency between the specific fragment and the specific fragment structure satisfies the reference value.

상기 선정하는 단계는, 상기 약리활성을 가지는 모든 화합물들과 모든 조각구조들의 발생 빈도수와 특정 화합물과 특정 조각구조가 동시에 발생할 확률인 지지도와, 특정 조각구조가 발생할 때 특정 화합물이 발생할 확률인 신뢰도가 모두 기준값을 충족하고, 상기 지지도와 상기 신뢰도의 비율인 향상도가 기 정의된 유의미한 척도를 만족하는 각각의 조각구조와 화합물 쌍들로부터 공통된 적어도 하나의 조각구조를 선정할 수 있다.Wherein the step of selecting includes: determining whether a specific compound is present in a specific fragmented structure, a degree of support that is a probability that all the compounds having pharmacological activity and all fragmented structures occur at the same time, At least one piece structure common to each piece structure and compound pair that satisfies all of the reference values and satisfies a predefined significant measure of the degree of improvement that is the ratio of the degree of support to the reliability can be selected.

본 발명의 또 다른 특징에 따르면, 신규 선도물질 후보 예측 방법은, 적어도 하나의 프로세서에 의해 동작하고, 신규 선도물질 후보를 예측하는 시스템으로서, 외부 공개 자료 및 사용자가 입력한 자료로부터 수집한 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들로부터 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 약리활성 유사 화합물 발굴부, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 화합물 조각화부, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 조각구조 발굴부, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 선도물질 후보 제공부를 포함한다.According to another aspect of the present invention, a method for predicting a new lead material candidate is a system that is operated by at least one processor and predicts a new lead material candidate, the system comprising: Compounds that have been determined to have statistically significant similarity to the individual pharmacological activities from the compounds having activity information and individual pharmacological activities are searched to find pharmacologically active compounds that are grouped by pharmacological activity and compounds in pseudo- A fragment scouring unit for fragmenting the compound into a minimum chemical functional unit to derive fragmented structures for each compound, a fragment structure extracting unit for selecting at least one specific fragmented structure commonly derived from the compounds in the group, When a specific fragment structure is formed by substituting Include Li provide new leading candidate lead compounds for predicting a candidate of a material for the active part.

상기 약리활성 유사 화합물 발굴부는, 모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)를 기준으로 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들중에서 통계적으로 유의미한지를 나타내는 유의 확률(p-value)이 기준값 이하인 화합물들을 선별하며, 선별된 화합물들을 약리활성이 유사한 화합물들로 발굴하여, 그룹핑할 수 있다.The pharmacologically active analogue compound extracting unit selects a compound having a pharmacological activity for each pharmacological activity based on the odds ratio between the compound and the pharmacological activity calculated based on the frequency of the individual pharmacological activities of all the compounds , Compounds having a p-value of less than a reference value indicating statistically significant among the ranked compounds are selected, and the selected compounds can be grouped by finding compounds having similar pharmacological activity.

상기 조각구조 발굴부는, 유사 약리활성 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들 간에 동시 발생 빈도수에 기초하여 중요성의 척도로 사용되는 지지도, 신뢰성의 척도로 사용되는 신뢰도, 및 지지도와 신뢰도의 비율로 산출되는 향상도를 산출하고, 상기 지지도, 상기 신뢰도 및 상기 향상도가 유의미한지 평가하여, 유의미한 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 발굴할 수 있다.The sculptural structure extracting unit can be used as a measure of significance based on the coincidence frequency between all the compounds in the pseudo-pharmacological active group and the sculptural structures derived from all the compounds, reliability used as a measure of reliability, It is possible to find a significant piece structure and at least one piece structure common to the pair of compounds by evaluating the degree of improvement calculated as a ratio of the reliability and evaluating whether the degree of support, the reliability and the degree of improvement are significant.

상기 조각구조 발굴부가 출력하는 상기 공통된 적어도 하나의 조각구조와 화합물간의 정보를 저장하는 조각구조-화합물 데이터베이스, 그리고 상기 조각구조-화합물 데이터베이스와 연결되고, 통신망을 통해 접속된 단말에게 상기 조각구조-화합물 데이터베이스로의 접근을 관리하는 사용자 인터페이스부를 더 포함할 수 있다.A fragmented structure storing information of the at least one fragmented structure and the compound that the fragmented structure extraction unit outputs, a compound database connected to the fragmented structure-compound database, and connected to the terminal through a communication network, And a user interface unit for managing access to the database.

본 발명의 실시예에 따르면, 화합물과 약리활성의 정보가 수집 및 통합된 데이터 베이스의 구축으로, 대단위의 약리활성 화합물 및 약효 시험에 필요한 과정을 없앨 수 있다. 그리고 약리활성도가 유사한 화합물들로부터 유래된 조각구조를 이용함으로써, 약리활성과 연관관계가 높은 화학적 기능을 갖는 최소 단위의 조각구조들을 도출 할 수 있는 장점이 있다.According to an embodiment of the present invention, the construction of a database in which information on compounds and pharmacological activity are collected and integrated can eliminate the processes required for large-scale pharmacologically active compounds and pharmacological activity tests. By using a fragment structure derived from compounds having similar pharmacological activity, it is possible to derive the minimum unit fragment structures having a chemical function highly related to pharmacological activity.

또한, 구조와 활성간의 정성적인 분석과 유효성 평가가 가능하도록 구조적으로 잘 분포된 화합물들을 사용하므로 일단 유효물질이 도출되면 신속하게 후속연구결과를 진행할 수 있다는 장점이 있다.In addition, since the compounds are structurally well distributed to enable qualitative analysis and validation of the structure and activity, once the active substance is derived, the results of subsequent studies can be rapidly performed.

도 1은 본 발명의 한 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
도 2는 본 발명의 한 실시예에 따른 신규 선도물질 예측 방법의 순서도이다.
도 3은 본 발명의 다른 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
도 4는 본 발명의 실시예에 따른 약리활성 유사 화합물 발굴 과정을 나타낸 순서도이다.
도 5는 본 발명의 실시예에 따른 조각화 과정을 나타낸 순서도이다.
도 6은 본 발명의 실시예에 따른 조각화 과정을 설명하기 위한 개념도이다.
도 7은 본 발명의 실시예에 따른 신규 선도물질 후보로 제공할 조각구조를 추출하는 과정을 나타낸 순서도이다.
도 8은 본 발명의 또 다른 실시예에 따른 신규 선도물질 예측 시스템의 하드웨어 구성을 나타낸 블록도이다.
1 is a schematic block diagram of a novel lead material prediction system in accordance with an embodiment of the present invention.
2 is a flowchart of a new lead material predicting method according to an embodiment of the present invention.
3 is a schematic block diagram of a novel lead material prediction system in accordance with another embodiment of the present invention.
FIG. 4 is a flowchart illustrating a process for discovering a pharmacologically active analogous compound according to an embodiment of the present invention.
5 is a flowchart illustrating a fragmentation process according to an embodiment of the present invention.
6 is a conceptual diagram illustrating a fragmentation process according to an embodiment of the present invention.
7 is a flowchart illustrating a process of extracting a piece structure to be provided as a new lead material candidate according to an embodiment of the present invention.
8 is a block diagram illustrating a hardware configuration of a new lead material predicting system according to another embodiment of the present invention.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly illustrate the present invention, parts not related to the description are omitted, and similar parts are denoted by like reference characters throughout the specification.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. Throughout the specification, when an element is referred to as "comprising ", it means that it can include other elements as well, without excluding other elements unless specifically stated otherwise.

또한, 명세서에 기재된 "…부", "…기", "…모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.Also, the terms " part, "" ... "," module ", and the like described in the specification mean a unit for processing at least one function or operation and may be implemented by hardware or software or a combination of hardware and software .

본 명세서에서, 약리활성(pharmacological effect)은 어떤 물질이 생체 내 들어가서 단독으로 또는 생체 내 어떤 물질과 결합해 원하는 약물학적 효과를 내는 것을 의미한다.In this specification, a pharmacological effect means that a substance enters the organism in vivo, alone or in combination with any substance in vivo, to produce the desired pharmacological effect.

또한, 선도물질(Lead compound)은 약리학적으로 또는 생물학적으로 효과가 있다고 생각 되어지고, 목적하는 효과를 내기 위해 어느 정도 개선이 필요할 수 있는 물질을 의미한다.Lead compounds are substances that are thought to be pharmacologically or biologically effective and may require some improvement in order to achieve the desired effect.

또한, 조각화(Chemical fragmentation)는 화합물을 최소 화학적 기능 단위인 '조각구조(Fragmentation Structure)'로 생성하는 것을 의미한다. In addition, the term "chemical fragmentation" refers to the generation of a compound as a minimum chemical functional unit, a "fragmentation structure".

도 1은 본 발명의 한 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이고, 도 2는 본 발명의 한 실시예에 따른 신규 선도물질 예측 방법의 순서도이며, 도 3은 본 발명의 다른 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.FIG. 1 is a schematic block diagram of a novel lead material predicting system according to an embodiment of the present invention, FIG. 2 is a flowchart of a new lead material predicting method according to an embodiment of the present invention, Figure 2 is a schematic block diagram of a novel lead material prediction system according to an embodiment.

먼저, 도 1을 참조하면, 신규 선도물질 예측 시스템(100)은 약리활성-화합물 데이터베이스(101), 약리활성 유사 화합물 발굴부(103), 화합물 조각화부(105), 조각구조 발굴부(107), 선도물질 후보 제공부(109) 및 조각구조-화합물 데이터베이스(111)를 포함하고, 이들 구성의 동작에 대해 설명하면, 도 2와 같다.1, the novel lead substance prediction system 100 includes a pharmacological activity-compound database 101, a pharmacologically active compound-like compound discovery unit 103, a compound fragmentation unit 105, a fragment structure discovery unit 107, A lead material candidate providing unit 109, and a sculptural structure-compound database 111. Operations of these structures will be described with reference to FIG.

도 2를 참조하면, 약리활성 유사 화합물 발굴부(103)는 인터넷 등을 통해 수집된 정보 및/또는 사용자가 입력한 정보를 토대로 약리활성과, 약리활성을 갖는 화합물을 매핑한 약리활성-화합물 데이터베이스(101)를 구축한다(S101).Referring to FIG. 2, the pharmacologically active compound-based compound search unit 103 searches pharmacological activity-compound database (pharmacological activity-compound database) in which compounds having pharmacological activity and pharmacological activity are mapped based on information collected via the Internet and / (S101).

약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)에 저장된 정보들에 대해 유의성 평가를 수행하여 약리활성이 유사한 화합물을 발굴하고, 약리활성을 갖는 화합물의 약리활성 유사도에 따라 그룹핑한다(S103).The pharmacologically active analogue compound locating unit 103 performs a significance evaluation on the information stored in the pharmacological activity-compound database 101 to identify compounds having similar pharmacological activity and group them according to the pharmacological activity similarity of the pharmacologically active compounds. (S103).

화합물 조각화부(105)는 화합물 조각화 기법을 이용하여 그룹내 약리활성 유사 화합물을 최소 화학적 기능 단위로 조각화한다(S105). The compound fragmentation unit 105 slices the pharmacologically active compound in the group into the minimum chemical functional units using the compound fragmentation technique (S105).

조각구조 발굴부(107)는 약리활성 유사 화합물로부터 조각화된 조각구조와 약리활성 유사 화합물 간의 연관도를 나타내는 연관도 점수를 산출한다(S107).The fragment structure extracting unit 107 calculates the degree of association score indicating the degree of association between the fragmented structure fragmented from the pharmacologically active compound and the pharmacologically active compound (S107).

선도물질 후보 제공부(109)는 연관도 점수에 기초하여 신약개발에 있어 선도물질로 제시 가능한 약리활성을 나타내는 최적의 조각구조를 발굴하고, 발굴된 조각구조와 연관된 약리활성 유사 화합물들의 정보를 통합하여 조각구조-화합물 데이터베이스(111)를 구축한다(S109). Based on the association score, the lead substance candidate providing unit 109 finds an optimal fragment structure exhibiting a pharmacological activity that can be presented as a lead substance in the development of a new drug, and integrates information of the pharmacologically active analogous compounds associated with the extracted fragment structure To construct a fragment structure-compound database 111 (S109).

이후, 선도물질 후보 제공부(109)는 조각구조-화합물 데이터베이스(111)에 저장된 조각구조 그 자체를 신규 선도물질 후보로 제공한다(S111). 또한, 선도물질 후보 제공부(109)는 조각구조의 조합을 제공(S111)하여 이를 통해 다양한 활성을 갖는 신약개발에 활용될 수 있도록 한다. Thereafter, the lead material candidate providing unit 109 provides the fragment structure itself, which is stored in the fragment structure-compound database 111, as a new lead material candidate (S111). Also, the lead material candidate providing unit 109 provides a combination of fragmented structures (S111) so that it can be utilized in the development of new drugs having various activities.

도 3을 참조하면, 선도물질 후보 제공부(109)는 표시 장치(200)와 연결되어, 표시 장치(200)의 화면에 신규 선도물질 후보를 출력할 수 있다.Referring to FIG. 3, the lead material candidate providing unit 109 may be connected to the display device 200 to output a new lead material candidate to the screen of the display device 200.

또한, 신규 선도물질 예측 시스템(100)은 사용자 인터페이스부(113)를 추가로 포함할 수 있다. 사용자 인터페이스부(113)는 통신망(300)을 통해 연결된 단말(400)과 연결된다. 사용자 인터페이스부(113)는 조각구조-화합물 데이터베이스(111)에 대한 접근을 제공하는 수단으로, 통신망(300)을 통해 단말(400)과 연결되어 각종 정보를 교환할 수 있도록 구성될 수 있다. 예를들면, 사용자 인터페이스부(113)는 단말(400)이 신규 선도물질 후보로 조각구조를 검색할 수 있는 환경을 제공할 수 있다. 통신망(300)은 동일한 하드웨어에서의 통신은 물론, 구내 정보 통신망(local area network, LAN), 도시권 통신망(metropolitan area network, MAN), 광역 통신망(wide area network, WAN), 인터넷, 2G, 3G, 4G 이동 통신망, 와이파이(Wi-Fi), 와이브로(Wibro) 등을 포함할 수 있으며, 통신 방식도 유선, 무선을 가리지 않으며 어떠한 통신 방식이라도 상관없다. 단말(400)은 스마트 폰, PC(Personal Computer), 태블릿 PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA), 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 통신 기능을 구비할 수 있다.In addition, the new leading material prediction system 100 may further include a user interface unit 113. The user interface unit 113 is connected to the terminal 400 connected through the communication network 300. The user interface unit 113 is a means for providing access to the fragmented structure-compound database 111 and can be configured to be connected to the terminal 400 through the communication network 300 to exchange various information. For example, the user interface unit 113 can provide an environment in which the terminal 400 can search for the fragment structure as a new lead material candidate. The communication network 300 may be a network such as a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN) 4G mobile communication network, Wi-Fi, WiBro, etc. The communication method does not depend on wired or wireless, and any communication method may be used. The terminal 400 is equipped with a memory means such as a smart phone, a personal computer (PC), a tablet PC, a personal digital assistant (PDA), a web pad and the like, .

이제, 도 4 ~ 도 7을 참고하여, 신규 선도물질 예측 시스템(100)의 세부 동작에 대해 설명하기로 한다. Now, with reference to FIGS. 4 to 7, the detailed operation of the new leading material prediction system 100 will be described.

도 4는 본 발명의 실시예에 따른 약리활성 유사 화합물 발굴 과정을 나타낸 순서도로서, 약리활성 유사 화합물 발굴부(103)의 동작을 나타낸다.FIG. 4 is a flow chart showing a process for searching for a pharmacologically active compound, according to an embodiment of the present invention, and shows the operation of the pharmacologically active compound-searching unit 103.

도 4를 참조하면, 약리활성 유사 화합물 발굴부(103)는 약리활성 정보, 천연물을 포함한 화합물 정보, 질병 정보 등을 수집(S201)하고, 통합하여 약리활성-화합물 데이터베이스(101)를 구축한다(S203). 4, the pharmacologically active compound-identifying unit 103 collects pharmacological activity information, compound information including natural products, disease information and the like (S201), and integrates them to construct a pharmacological activity-compound database 101 S203).

이때, 약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)를 구축하는데 필요한 정보를 인터넷 상에서 수집하거나 또는 사용자로부터 입력받을 수 있다. At this time, the pharmacologically active compound-identifying unit 103 may collect information necessary for constructing the pharmacological activity-compound database 101 on the Internet or input from the user.

약리활성 유사 화합물 발굴부(103)는 온라인 상에서 공개 데이터베이스, 예를들면, DrugBank, 한국전통지식포탈(KTKP), Traditional Chinese Medicine System Pharmacology Database(TCMSP), Traditional Chinese Medicine Integrated Database(TCMID), BindingDB, UMLS, Icd10, ClinicalTrial, SIDER Side Effect Resource, Comparative Toxicogenomics Database(CTD), Therapeutic Target Database(TTD) 등을 통해 수집한 정보들을 약리활성-화합물 데이터베이스(101)에 저장할 수 있다. 또한, 약리활성 유사 화합물 발굴부(103)는 공개 데이터베이스로 구성되지는 않았어도, 온라인 상에서 신뢰도가 높은 공식적인 정보를 수집하여 약리활성-화합물 데이터베이스(101)에 저장할 수 있다. The pharmacologically active compound-based compound searching unit 103 can acquire pharmacologically active compounds such as DrugBank, Korean Traditional Knowledge Portal (KTKP), Traditional Chinese Medicine System Pharmacology Database (TCMSP), Traditional Chinese Medicine Integrated Database (TCMID) Information collected through UMLS, Icd10, ClinicalTrial, SIDER Side Effect Resource, Comparative Toxicogenomics Database (CTD), Therapeutic Target Database (TTD) and the like can be stored in the pharmacologically active compound database 101. In addition, the pharmacologically active compound-identifying unit 103 may collect the official information with high reliability on-line and store it in the pharmacological activity-compound database 101 even though the pharmacologically active compound-identifying unit 103 is not configured as a public database.

약리활성-화합물 데이터베이스(101)는 개별 약리활성 정보와, 그 약리활성을 갖는 화합물의 정보를 저장할 수 있다. 예를들면, Nintedanib은 다중 수용체 티로신 키나아제(RTKs)와 비 수용체 티로신 키나아제(nRTKs)를 표적으로하는 특발성 폐 섬유증(IPF)의 치료제로 사용되는 약물이다. Nintedanib은 혈소판 유래 성장 인자 수용체(PDGFR) 및, 섬유 아세포 성장 인자 수용체(FGFR), 혈관 내피 성장 인자 수용체(VEGFR) 및 Fms- 유사 티로신 키나아제 -3(FLT3) 등의 수용체의 아데노신 3 인산염(ATP) 결합 주머니에 경쟁적으로 결합하여 IPF 병리학의 필수 메커니즘을 나타내는 섬유 아세포의 증식, 이동 및 형질 전환에 중요한 세포 내 신호 전달을 차단한다. 또한, nintedanib은 nRTKs, Lck, Lyn 및 Src 키나아제를 억제하는데 이러한 내용이 약리활성-화합물 데이터베이스(101)에 저장될 수 있다. 물론, 여기서는 약리활성을 하나만 기재하였지만, 하나의 화합물은 복수의 약리활성을 가질 수 있다.The pharmacological activity-compound database 101 can store individual pharmacological activity information and information of a compound having pharmacological activity. For example, Nintedanib is a drug used to treat idiopathic pulmonary fibrosis (IPF) targeting multiple receptor tyrosine kinases (RTKs) and nonreceptor tyrosine kinases (nRTKs). Nintedanib has been shown to inhibit platelet derived growth factor receptor (PDGFR) and adenosine triphosphate (ATP) receptors such as fibroblast growth factor receptor (FGFR), vascular endothelial growth factor receptor (VEGFR) and Fms-like tyrosine kinase- Binds competitively to binding pouches and blocks intracellular signaling, which is critical for the proliferation, migration and transformation of fibroblasts, which represents the essential mechanism of IPF pathology. In addition, nintedanib inhibits nRTKs, Lck, Lyn and Src kinases, and this content can be stored in the pharmacological activity-compound database 101. Of course, although only one pharmacological activity is described here, one compound may have a plurality of pharmacological activities.

약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)를 이용하여 화합물의 개별 약리활성에 해당하는 빈도수를 도출하여 빈도표를 생성한다(S203). The pharmacologically active compound-based discovering unit 103 generates a frequency table by deriving frequency numbers corresponding to individual pharmacological activities of the compound using the pharmacological activity-compound database 101 (S203).

예를들어, 약리활성 N1에 해당하는 화합물이 M1, M2, M3, 약리활성 N2에 해당하는 화합물이 M1, M3, M4, M5, 약리활성 N3에 해당하는 화합물이 M1, M2가 있다고 가정하면, M1의 약리활성 N1에 대한 빈도수는 1이 되고, M1이 나타나는 그 외의 약리활성은 N2, N3이므로, 그 외의 약리활성에 대한 빈도수는 2가 된다. 그리고 약리활성 N1이 나타나는 화합물은 M1, M2, M3이므로, 그 외의 화합물에 대한 약리활성 N1의 빈도수는 2가 된다. 이때, 하나의 화합물(M)은 n개의 약리활성(N1, …, NK, K≥1)을 가질 수 있다. 이러한 방식으로, 천연물의 개별 약리활성 별로 해당하는 화합물의 빈도수를 반영한 약리활성-화합물 빈도표를 아래 표 1과 같이 정리할 수 있다. 빈도표는 2×2로 구현된다.For example, the compound is a compound corresponding to a pharmacologically active N 1 corresponds to M1, M2, M3, pharmacologically active N 2 the compound M1, M3, M4, M5, pharmacological activity of the N 3 M1, that the M2 Assuming, the frequency of the pharmacologically active N 1 of the M1 is to be 1, because M1 is other pharmacological activity of N 2, N 3 appear, the frequency of the other pharmacologically active is the second. Since the compounds exhibiting pharmacological activity N 1 are M 1 , M 2 and M 3, the frequency of pharmacological activity N 1 for other compounds is 2. At this time, one compound (M) may have n pharmacological activities (N 1 , ..., N K , K ? 1 ). In this way, the pharmacological activity-compound frequency table reflecting the frequency of the corresponding compound for each pharmacological activity of the natural product can be summarized as shown in Table 1 below. The frequency table is implemented as 2x2.

약리활성N1 Pharmacologically active N 1 그 외의 약리활성Other pharmacological activity system 화합물 M1Compound M1 빈도수 aFrequency a 빈도수 cFrequency c a+ca + c 그 외의 화합물Other compounds 빈도수 bFrequency b 빈도수 dFrequency d b+db + d system a+ba + b c+dc + d a+b+c+da + b + c + d

이때, a는 표 1의 1행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 약리활성 N1의 특정 화합물 M1에 대한 빈도수를 의미하는 변수(variable)를 나타낸다. Here, a represents the frequency recorded in the first column of the first row of Table 1. That is, it shows a variable (variable) indicating the number of occurrences for a particular compound M1 of specific pharmacologically active N 1.

b는 표 1의 2행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1을 제외한 나머지 화합물의 특정 약리활성 N1에 대한 빈도수를 의미하는 변수이다.b " means the frequency recorded in the first column of the second row of Table 1. That is, it means a frequency for the specific pharmacological activity N 1 of the other compounds except the specific compound M1.

c는 표 1의 1행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1의 특정 약리활성 N1을 제외한 나머지 약리활성에 대한 빈도수를 의미하는 변수이다.c means the frequency recorded in the second column of the first row of Table 1. < tb >< TABLE > That is, it means a frequency for the pharmacological activity other than the specific pharmacological activity N 1 of the specific compound M1.

d는 표 1의 2행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1을 제외한 나머지 화합물의 특정 약리활성 N1을 제외한 나머지 약리활성에 대한 빈도수를 의미하는 변수이다.d means the frequency recorded in the second column of the second row of Table 1. < tb >< TABLE > That is, it means a frequency with respect to pharmacological activities other than the specific pharmacological activity N 1 of the remaining compounds other than the specific compound M1.

이와 같은 방식으로, 약리활성 유사 화합물 발굴부(130)는 약리활성-화합물 데이터베이스(101)에 저장된 모든 약리활성과 화합물에 관하여 표 1과 같이 빈도표를 생성한다(S205).In this way, the pharmacologically active analogue compound locating unit 130 generates a frequency table as shown in Table 1 for all pharmacological activities and compounds stored in the pharmacological activity-compound database 101 (S205).

약리활성 유사 화합물 발굴부(130)는 유의성 평가를 통해 빈도표에 포함된 약리활성별 화합물의 승산비를 도출(S207)하고 승산비에 기초하여 연관성을 평가한다(S209). The pharmacologically active compound-based discovering unit 130 derives the multiplication ratio of the pharmacological activity-related compound contained in the frequency table (S207) through the significance evaluation (S209) and evaluates the association based on the multiplication ratio (S209).

약리활성 유사 화합물 발굴부(130)는 S205 단계에서 생성된 빈도표들에 대하여 화합물이 해당 약리활성에 실제 유의한지 판단할 수 있는 기준으로 피셔의 정확 검정(fisher exact test)을 활용할 수 있다.The pharmacologically active analogue compound locating unit 130 may utilize the fisher exact test as a criterion for determining whether the compound actually has a significant pharmacological activity on the frequency tables generated in step S205.

약리활성 유사 화합물 발굴부(130)는 승산비에 기초하여 화합물의 순위를 선정하고, 선정된 화합물들의 유의 확률(p-value)을 기반으로 특정 약리활성을 나타내는 화합물을 그룹핑(S211)하여 약리활성 유사도가 유의하다고 판단되는 화합물, 즉, 약리활성 유사 화합물을 발굴한다(S213).The pharmacologically active analogue compound locating unit 130 selects compounds on the basis of multiplication ratios and groups the compounds exhibiting a specific pharmacological activity based on the significance (p-value) of the selected compounds (S211) A compound judged to be significant in terms of similarity, i.e., a pharmacologically active compound, is searched (S213).

여기서, 약리활성 유사 화합물 발굴부(130)가 약리활성과 화합물간의 유의성 평가를 수행하기 위하여 그려야 하는 초기하 분포(Hypergeometric distribution)는 표 1과 동일한 약리활성 N1 에 해당하는 화합물 M11의 빈도수를 가정할 때, 약리활성에 연관된 화합물이 다양한 경우에 따른 확률값의 분포이며, 구성하는 각 확률값은 아래 수학식 1과 같이 구할 수 있다.Herein, the hypergeometric distribution that the pharmacologically active analogue compound extracting unit 130 should draw in order to perform the significance evaluation between the pharmacological activity and the compound has a frequency of the compound M1 1 corresponding to the pharmacological activity N 1 as shown in Table 1 Assuming that the compounds related to pharmacological activity are variously distributed according to various cases, each probability value constituting the pharmacological activity can be obtained by the following equation (1).

Figure 112017060020415-pat00001
Figure 112017060020415-pat00001

여기서, a, b, c, d는 각각 표 1에서 해당 빈도수를 나타낸다. Here, a, b, c, and d represent the corresponding frequencies in Table 1, respectively.

약리활성 유사 화합물 발굴부(130)는 수학식 1을 통해 약리활성 별로 화합물의 승산비를 도출할 수 있다. 이러한 승산비는 복수개의 빈도표에 대해 각각 생성된다. The pharmacologically active analogue compound locating unit 130 can derive the compounding ratio for each pharmacological activity through Equation (1). These multiplication ratios are respectively generated for a plurality of frequency tables.

또한, 약리활성 유사 화합물 발굴부(130)는 복수개의 약리활성-화합물 빈도표를 구성하는 약리활성과 화합물 간의 유의성을 나타내고, 초기하 분포에 대한 빈도표의 우측 검정 유의 확률(p-value)을 다음 수학식 2를 통해 계산한다. In addition, the pharmacologically active analogue compound locating unit 130 shows the significance between the compound and the pharmacological activity constituting the plurality of pharmacological activity-compound frequency tables, and the probability (p-value) of the right-hand side of the frequency table for the initial sub- (2) < / RTI >

Figure 112017060020415-pat00002
Figure 112017060020415-pat00002

수학식 2에서 n은 0부터 a+b+c+d까지의 값을 가질 수 있다. In Equation (2), n may have a value from 0 to a + b + c + d.

이때, 수학식 2에서 구한 유의 확률(p-value)에 대하여 임계값 0.05 이하의 값을 가지면, 약리활성 유사 화합물 발굴부(130)는 해당 화합물이 해당 약리활성에 유의하다고 판단한다. 예를들면, 표 1에 대한 유의성 검증값이 0.05 이하라면, 약리활성 유사 화합물 발굴부(130)는 화합물(M1)가 약리활성(N1)에 대해 유의하다고 판단한다.At this time, when the significance value (p-value) obtained in Equation (2) has a value of 0.05 or less, the pharmacologically active analogue compound finding unit 130 determines that the compound is significant for the pharmacological activity. For example, if the significance test value for Table 1 is 0.05 or less, the pharmacologically active compound-like compound finding unit 130 judges that the compound (M1) is significant for the pharmacological activity (N 1 ).

약리활성 유사 화합물 발굴부(130)는 수학식 1에서 구한 승산비(OddsRatio)를 기준으로 특정 약리활성에 대한 하나 이상의 화합물의 순위를 선정한다. 예를들면, 승산비가 높을 수록 순위도 높게 선정될 수 있다.The pharmacologically active analogue compound locating unit 130 selects one or more compounds for a specific pharmacological activity based on the odds ratio obtained in Equation (1). For example, the higher the odds ratio, the higher the ranking.

약리활성 유사 화합물 발굴부(130)는 선정한 화합물들 중에서 유의 확률(p-value)이 0.05 이하인 화합물들, 즉, 특정 약리활성에 대해 유사도가 유의하다고 판단되는 화합물들을 추려낸다. 이렇게 추려낸 화합물들을 그 특정 약리활성을 나타내는 화합물로 그룹핑(S211)하고, 그룹 내 화합물들을 약리활성 유사 화합물로 발굴한다(S213).The pharmacologically active analogue compound locating unit 130 selects compounds having a p-value of 0.05 or less among the selected compounds, i.e., compounds for which similarity is judged to be significant for a specific pharmacological activity. These select compounds are grouped into a compound exhibiting the specific pharmacological activity (S211), and compounds in the group are excluded as pharmacologically active compounds (S213).

도 5는 본 발명의 실시예에 따른 조각화 과정을 나타낸 순서도이고, 도 6은 본 발명의 실시예에 따른 조각화 과정을 설명하기 위한 개념도로서, 화합물 조각화부(105)의 동작을 나타낸다.FIG. 5 is a flowchart illustrating a fragmentation process according to an embodiment of the present invention. FIG. 6 is a conceptual diagram illustrating a fragmentation process according to an embodiment of the present invention, and shows the operation of the compound fragmentation unit 105.

도 5를 참조하면, 화합물 조각화부(105)는 약리활성과 화합물간의 유의성 평가를 통해 유의하다고 판단된 약리활성 유사 화합물들을 약리활성 유사 화합물 발굴부(130)로부터 입력받는다(S301)5, the compound fragmentation unit 105 receives the pharmacological activity-similar compounds determined to be significant through the evaluation of the pharmacological activity between the pharmacological activity and the compound from the pharmacologically active compound-based drug discovery unit 130 (S301)

화합물 조각화부(105)는 화합물 조각화 기법을 이용하여 약리활성 유사 화합물을 최소 화학적 기능단위로 조각화하는데, 도 6과 같이 도식화할 수 있다. 도 6을 참조하면, 약리활성 유사 화합물1은 조각구조1과 조각구조2로 조각화될 수 있다. 이러한 도면은 조각화의 개념도로서, 실제 화합물 및 조각구조와는 다소 상이할 수 있다.The compound fragmentation unit 105 fragmentizes the pharmacologically active compound into a minimum chemical functional unit using a compound fragmentation technique, which can be schematically illustrated in FIG. Referring to FIG. 6, the pharmacologically active compound 1 can be fragmented into fragmented structure 1 and fragmented structure 2. This diagram is a conceptual view of fragmentation, and may be somewhat different from the actual compound and fragment structure.

통상적으로, 유전체의 일부가 약물의 표적이 될 수 있는(druggable) 화합물이 'rule of 5'라는 기준을 따르듯이 '조각 구조(Fragmentation Structure)'는 'rule of 3(molecular weight < 300, ClogP < 3, the number of hydrogen bond donors and acceptors each should be < 3 and the number of rotatable bonds should be < 3)'를 따르는 것으로 알려져 있다. 본 발명의 실시예에서는, 디스커버리 스튜디오(Discovery Studio) 소프트웨어를 사용하여 조각 구조를 생성한다. 화합물 조각화부(105)는 5가지 항목(Rings, RingAssemblies, BridgeAssemblies, Chains, BemisMurckoAssemblies) 중에서 선택(S303, S307, S311, S315, S319)하여 조각화를 수행(S305, S309, S313, S317, S321)함으로써, 작용기 역할을 할 수 있는 구조 및 역할에 따라 다양한 조각 구조를 생성(S323)한다. 여기서, 5가지 항목, 즉, Rings, RingAssemblies, BridgeAssemblies, Chains, BemisMurckoAssemblies는 조각화 기법에 사용될 수 있는 조각화 단위로서, 연결 구조, 연결 형태 들을 달리하는 조각화 단위로 설명할 수 있다. 예를들면, RingAssemblies 조각화는 화합물을 RingAssemblies 단위로 조각화를 수행하는 것을 의미할 수 있다.Typically, as a druggable compound in which some of the dielectrics are drug targets conforms to the rule of 5, the Fragmentation Structure has the rule of 3 (molecular weight <300, ClogP < 3, the number of hydrogen bond donors and acceptors each should be <3 and the number of rotatable bonds should be <3. In an embodiment of the present invention, a piece structure is created using Discovery Studio software. The compound segmentation unit 105 performs fragmentation (S305, S309, S313, S317, and S321) by selecting one of five items (Rings, RingAssemblies, BridgeAssemblies, Chains, BemisMurckoAssemblies) (S303, S307, S311, S315, , Various sculptural structures are formed according to the structure and role that can act as functional groups (S323). Here, the five items, Rings, RingAssemblies, BridgeAssemblies, Chains, and BemisMurckoAssemblies, are the fragmentation units that can be used in the fragmentation technique. For example, RingAssemblies segmentation can mean that the compound performs segmentation in RingAssemblies units.

도 7은 본 발명의 실시예에 따른 신규 선도물질 후보로 제공할 조각구조를 추출하는 과정을 나타낸 순서도로서, 조각구조 발굴부(107) 및 선도물질 후보 제공부(109)의 동작을 나타낸다. FIG. 7 is a flowchart illustrating a process of extracting a piece structure to be provided as a candidate for a new lead material according to an embodiment of the present invention, and shows operations of the piece structure searching unit 107 and the lead material candidate providing unit 109.

조각구조 발굴부(107)는 조각화를 통해 도출된 조각구조와, 해당하는 약리활성 화합물을 매핑(S401)하는데, 표 2와 같이 매핑할 수 있다. The fragment structure extracting unit 107 maps the fragment structure derived through fragmentation and the corresponding pharmacologically active compound (S401), and maps the fragment structure as shown in Table 2.

표 2는 약리활성 화합물 조각구조와 약리활성 화합물 관계에 대한 연관 규칙 분석을 위한 목록을 예시한다. Table 2 illustrates a list for analysis of association rules for pharmacologically active compound fragment structures and pharmacologically active compound relationships.

순번(number)Number 항목(items)Items 1One 조각구조1, 화합물2Fragment structure 1, compound 2 22 조각구조1, 조각구조2, 화합물1Fragment structure 1, fragment structure 2, compound 1 33 조각구조1, 화합물3Fragment structure 1, compound 3 44 조각구조1, 화합물2, 화합물3Fragment structure 1, compound 2, compound 3 55 조각구조2, 화합물2Fragment structure 2, compound 2

표 2에서 순번은 조각화 순번으로서, 예를들면, 순번 1은 첫번째 수행된 조각화를 나타내고, 순번 1에 해당하는 항목은 화합물2에 대해 조각화를 통해 도출된 조각구조 1을 의미한다. 이때, 각 순번 별로 조각화는 도 5에서 선택된 항목이 상이할 수 있다. 예를들면, 순번 1에서는 Rings 단위로 조각화를 하고, 순번 2에서는 BridgeAssemblies 단위로 조각화를 한 것일 수 있다.In Table 2, the order number is a fragmentation sequence number, for example, sequence number 1 indicates fragmentation performed first, and item number 1 corresponds to fragmentation structure 1 derived through fragmentation with respect to compound 2. In this case, the segmentation in each order may be different from that in FIG. For example, in Sequence 1, segmentation may be done in units of Rings, and Sequence 2 may be segmented in BridgeAssemblies.

조각구조 발굴부(107)는 약리활성 화합물 및 조각구조 간의 연관 규칙을 도출(S403)하고, 연관 규칙에 따라 연관도 점수를 산출한다(S405). The fragment structure extracting unit 107 derives the association rule between the pharmacologically active compound and the fragment structure (S403), and calculates the relevance score according to the association rule (S405).

이때, 연관 규칙을 도출하기 위해서, 조각구조 발굴부(107)는 표 2에 기초하여 조각구조 별로 화합물에서의 발생 빈도를 표 3과 같이 동시 발생표로 나타낸다. At this time, in order to derive the association rule, the fragment structure search unit 107 displays the occurrence frequencies of the compounds in the fragment structure on the basis of Table 2 as a concurrent occurrence table as shown in Table 3.

표 2에 따르면, 조각구조1과 화합물1의 동시 발생 빈도는 1이고, 화합물3와 조각구조1의 동시 발생 빈도는 2가 된다. 이러한 동시 발생 빈도를 표로 나타낸 것이 표 3이다. 표 3은 대칭 행렬의 모형을 보인다.According to Table 2, the co-occurrence frequency of fragmented structure 1 and compound 1 is 1, and the co-occurrence frequency of compound 3 and fragmented structure 1 is 2. Table 3 shows the frequency of such coincidence. Table 3 shows a model of a symmetric matrix.

조각구조1Sculpture structure 1 조각구조2Sculpture structure 2 화합물1Compound 1 화합물2Compound 2 화합물3Compound 3 조각구조1Sculpture structure 1 44 1One 1One 22 22 조각구조2Sculpture structure 2 1One 22 1One 1One 00 화합물1Compound 1 1One 1One 1One 00 00 화합물2Compound 2 22 1One 00 33 1One 화합물3Compound 3 22 00 00 1One 22

표 3에 따르면, 각각의 조각구조와 화합물이 몇 번이나 함께 도출되었는지 알 수 있다. 예를 들면, 조각구조1과 화합물2가 교차하는 값을 살펴보면 두 항목이 두 번 같이 발생되었음을 알 수 있다. According to Table 3, it is possible to know how many times each piece structure and compound were derived together. For example, if we look at the intersection of fragmented structure 1 and compound 2, we can see that two items occurred together.

또한, 표 3에서 대각선 상의 자료 값은 바로 그 항목을 포함하는 총 발생 수ㅏ를 나타낸다. 예를 들면, 조각구조1과 조각구조1이 교차하는 항목에는 표 2에서 조각구조1이 총 발생한 빈도수가 기록되는데, 표 2의 순번 1, 2, 3, 4에서 총 4번 발생하였으므로, 동시 발생 빈도는 4이다. 그리고 조각구조2와 조각구조1이 교차하는 항목에는 조각구조2와 조각구조1이 동시에 발생한 빈도수가 기록되는데, 표 2의 순번 2에서 한번 발생하였으므로, 동시 발생 빈도는 1이다. 이러한 표 3을 통해 연관 규칙은, 지지도(Support), 신뢰도(Confidence), 향상도(Improvement)로 산출된다.In addition, the data value on the diagonal in Table 3 represents the total number of occurrences including the item. For example, in the items where the fragment structure 1 and the fragment structure 1 intersect, the frequency of occurrence of the fragment structure 1 in Table 2 is recorded. Since four occurrences occurred in the order numbers 1, 2, 3 and 4 in Table 2, The frequency is 4. In the items where the fragmented structure 2 and the fragmented structure 1 intersect, the frequency at which the fragmented structure 2 and the fragmented structure 1 occur simultaneously is recorded. Since the occurrence occurs once in the order 2 in Table 2, the coincidence frequency is 1. Through these Table 3, association rules are calculated as Support, Confidence, and Improvement.

여기서, 지지도는 전체 중에서 조각구조(A)와 약리활성 화합물(성분)(B)를 함께 포함하는 사건에 대한 확률을 나타낸다. 이때, 확률값이 클수록 자주 발생하는 규칙이며, 규칙의 중요성에 대한 척도로 사용된다. Here, the degree of support represents a probability for an event including the fragment structure (A) and the pharmacologically active compound (component) (B) together. In this case, the larger the probability value is, the more frequent the rule is used as a measure of the importance of the rule.

두 항목 A와 B의 지지도는 전체 발생항목 중 항목 A와 항목 B가 동시에 포함하는 발생의 비율을 나타내고, 수학식 3을 통해 산출될 수 있다.The support of two items A and B represents the proportion of occurrences that both item A and item B simultaneously include, and can be calculated through equation (3).

Figure 112017060020415-pat00003
Figure 112017060020415-pat00003

또한, 신뢰도는 조각구조(A)가 있을때 약리활성 화합물(성분)(B)가 있을 확률 의미한다. 이때, 확률값이 클 수록 조각구조(A)가 있을시 약리활성 화합물(성분)(B)가 있을 확률이 높으며, 규칙의 신뢰성에 대한 척도로 사용되며, 수학식 4를 통해 산출될 수 있다.In addition, the reliability means the probability that there is a pharmacologically active compound (component) (B) when there is a fragment structure (A). At this time, the higher the probability value, the higher the probability that the pharmacologically active compound (component) (B) exists when the fragment structure (A) is present, and is used as a measure for the reliability of the rule.

Figure 112017060020415-pat00004
Figure 112017060020415-pat00004

또한, 향상도는 연관 규칙의 신뢰도와 지지도의 비율 도출되는 값으로서, 수학식 5를 통해 산출될 수 있다.Further, the degree of improvement is a value derived from the ratio of the reliability of the association rule to the degree of support, and can be calculated through Equation (5).

Figure 112017060020415-pat00005
Figure 112017060020415-pat00005

향상도는 항목 A가 주어지지 않았을 때의 항목 B의 확률 대비, 항목 A가 주어졌을 때의 항목 B의 확률의 증가 비율을 나타낸다. 이 값이 클 수록, 항목 A의 발생 여부가 항목 B의 발생 여부에 큰 영향을 미친다. The degree of improvement represents the rate of increase of the probability of item B when item A is given, compared to the probability of item B when item A is not given. The larger this value is, the greater whether the occurrence of item A affects the occurrence of item B.

항목 A와 항목 B의 발생여부가 상호 관련이 없다면, P(

Figure 112017060020415-pat00006
)와 P(B)가 같게 되어 향상도가 1이 된다. 어떤 규칙의 향상도가 1보다 크면, 이 규칙은 결과를 예측하는데 있어서 우연적 기회보다 우수하다는 것을 의미하고, 향상도가 1보다 작으면 이러한 규칙은 결과를 예측하는데 있어서 우연적 기회보다 나쁠 것이다. If the occurrence of item A and item B are not related, P (
Figure 112017060020415-pat00006
) And P (B) are the same, and the degree of improvement becomes 1. If the improvement of any rule is greater than 1, this rule means that it is better than the chance chance in predicting the outcome, and if the improvement is less than 1, this rule will be worse than the chance chance in predicting the outcome.

이처럼, 조각구조 발굴부(107)는 표 3의 동시발생 빈도표로부터 연관 규칙을 생성하는데, 조각구조간, 화합물간, 조각구조와 화합물 간에 연관 규칙을 모두 생성한다. 그러나, 본 발명이 약리활성을 지닌 화합물들과 연관도가 높은 조각구조를 선도물질로 제시하고자 하므로, 화합물과 조각구조의 연관 규칙이 중요한 반면, 조각 구조 간의 연관규칙관계는 무의미하다. Thus, the fragment structure search unit 107 generates association rules from the concurrent occurrence frequency table in Table 3, and generates association rules between the fragment structures, between the compounds, between the fragment structures and the compounds. However, since the present invention proposes a fragment structure having a high correlation with the compounds having pharmacological activity as a leading substance, the association rule of the compound and the fragment structure is important, but the relation rule relationship between the fragment structures is meaningless.

조각구조 발굴부(107)는 생성된 연관 규칙들에 대해 지지도, 신뢰도, 향상도에 기초하여 최종적으로 연관도 점수가 높은 조각구조와 화합물을 선별한다. The piece structure searching unit 107 finally selects a piece structure and a compound having a high degree of association score based on the degree of support, reliability, and degree of improvement for the generated association rules.

이때, 조각구조 발굴부(107)는 지지도 및 신뢰도가 일정 기준값 이상이면, 의미 있는 연관 규칙으로 판단한다. 즉, 그 연관 규칙을 도출한 조각구조(A)와 약리활성 유사 화합물(B)는 연관된 것으로 판별한다. 그리고 판별된 연관 규칙 내의 향상도 점수로 최종 평가한다. 이때, 향상도가 1보다 클 경우, 예측도가 우수하다고 판단된다.At this time, if the degree of support and the reliability are equal to or more than a predetermined reference value, the piece structure searching unit 107 judges a meaningful association rule. That is, the fragmentation structure (A) derived from the association rule and the pharmacologically active compound (B) are determined to be related. And finally evaluation is made by the score of improvement in the determined association rule. At this time, when the degree of improvement is larger than 1, it is judged that the degree of prediction is excellent.

조각구조 발굴부(107)는 연관도 점수에 기초하여 약리활성 연관 주 조각구조 또는 공통된 조각구조와, 개별 조각구조가 조합된 조합 조각구조를 추출한다(S407). 예를들면, 약리활성 N1을 갖는 화합물 M1, 화합물 M2, 화합물 M3가 있을 때, 화합물 M1, 화합물 M2, 화합물 M3 각각의 조각구조들에 대해 표 3과 같이 빈도표를 구성하고, 이들 빈도표에 기초한 지지도, 신뢰도가 일정 기준값을 충족하고, 향상도 점수가 1보다 크면, 조각구조 발굴부(107)는 그 조각구조들을 약리활성 N1에 대하여 연관된 것으로 판단한다. 이때, 조각구조 발굴부(107)는 향상도 점수가 가장 높은 조각구조를 약리활성 N1에 대한 주 조각구조 또는 공통 조각구조로 추출할 수 있다. 또한, 조각구조 발굴부(107)는 향상도 점수가 1보다 큰 조각구조들을 약리활성 N1 에 대한 조합 조각구조로 추출할 수 있다.The fragment structure finding unit 107 extracts a pharmacokinetic association main fragment structure or a common fragment structure and a combination fragment structure in which individual fragment structures are combined based on the association score (S407). For example, when there is a compound M1 having a pharmacologically active N 1 , a compound M2, and a compound M3, a frequency table is constructed as shown in Table 3 for the fragment structures of each of the compounds M1, M2, and M3, And the degree of improvement score is greater than 1, the fragment structure finding unit 107 judges that the fragment structures are related to the pharmacological activity N 1 . At this time, the fragment structure extracting unit 107 can extract the fragment structure having the highest degree of improvement score into the main fragment structure or common fragment structure for pharmacological activity N 1 . In addition, the fragment structure extracting unit 107 can extract fragment structures having an enhancement score of greater than 1 into a combinatorial fragment structure for pharmacological activity N 1 .

선도물질 제공부(109)는 S407 단계에서 추출된 주 조각구조 및 조합 조각구조를 해당하는 연관된 약리활성 화합물과 함께 조각구조-화합물 데이터베이스(111)에 저장하고, 저장된 조각구조들을 신규 선도물질 후보로 제공한다(S409). 예를들면, 조각구조1은 약리활성 N1을 나타내는 주 신규 선도물질 후보로 제공될 수 있다. 또한, 조각구조1과 조각구조2는 약리활성 N1을 나타내는 조합 신규 선도물질 후보로 제공될 수 있다.The lead material provider 109 stores the main fragment structure and the combination fragment structure extracted in step S407 into the fragment structure-compound database 111 together with the corresponding pharmacologically active compound and stores the fragment structures into a new leader material candidate (S409). For example, fragmented structure 1 may be provided as a candidate new starting material that exhibits pharmacological activity N 1 . In addition, fragmented structure 1 and fragmented structure 2 can be provided as a candidate for a combination new leader material exhibiting pharmacological activity N 1 .

또한, 선도물질 제공부(109)는 향상도를 특정 약리활성에 대한 특정 조각구조의 예측도로 제공하여, 향상도를 기준으로 조각구조들의 특정 약리활성에 대한 예측도를 평가하기 위한 자료로 사용할 수 있다. 예를들면, 약리활성 N1에 대한 조각구조1의 향상도가 1.3이고, 약리활성 N1에 대한 조각구조2의 향상도가 1.5라면, 약리활성 N1에 대한 예측도는 조각구조2가 조각구조1보다 더 높다고 평가될 수 있다. In addition, the lead material provider 109 can provide the prediction of the specific fragment structure for a specific pharmacological activity, and can be used as a material for evaluating the degree of predictability of the specific pharmacological activity of the fragment structures based on the degree of improvement have. For example, if the degree of enhancement of fragmented structure 1 against pharmacological activity N 1 is 1.3 and the degree of enhancement of fragmented structure 2 against pharmacological activity N 1 is 1.5, the predictive value for pharmacological activity N 1 is Can be estimated to be higher than structure 1.

이와 같이, 약리활성 화합물들의 조각구조와 약리활성 화합물간의 연관 규칙 발견을 통해 약리활성과 구조가 유사한 화합물들이 갖는 공통 조각구조를 발굴하고, 결과를 통합하여 데이터베이스를 구축하여, 조각구조 그 자체로 신규 약물 선도물질 후보로 제공하고, 또한 그 조합을 통해 다양한 활성을 갖는 신약개발에 활용 될 수 있도록 제공할 수 있다. 이렇게 하면, 종래 기술의 문제점이자 한계점이었던 선도물질 발굴 과정에 필요한, 약리활성 화합물 확보 및 약효 시험 과정등과 같은 대단위의 비용과 시간이 소요되는 과정을 화합물과 약리활성의 정보가 수집 및 통합된 데이터베이스의 구축으로 해결할 수 있다. 또한, 화합물의 단순 조각화를 통해 도출된 조각구조들을 제한된 일부의 약효시험 과정을 거쳐 일부 약리활성 조각구조를 발굴하는 시도에서 발생하는 보다 중요한 조각구조를 찾는 과정이 빠져있는 단점을, 약리활성도가 유사한 화합물들로부터 유래된 조각구조를 이용하고 약리활성과 연관 관계 점수가 높은 최소 조각구조들을 발굴함으로써, 해결할 수 있다.In this way, the common fragment structure possessed by the compounds having similar pharmacological activity and structure can be discovered through the discovery of the association rule between the fragment structure of the pharmacologically active compounds and the pharmacologically active compound, and a database is constructed by integrating the results, It can be provided as a candidate for a drug substance, and can be provided for use in the development of a new drug having various activities through the combination thereof. In this way, a large amount of costly and time-consuming processes such as securing of a pharmacologically active compound and a process for testing pharmacological activity, which are necessary for a lead substance discovery process, which was a problem and a problem of the prior art, Can be solved by constructing In addition, the disadvantage of missing sculptural structures derived from simple fragmentation of compounds is the lack of a process for finding more important sculptural structures that occur in an attempt to discover some pharmacologically active fragment structures through a limited drug efficacy testing process. Can be solved by using fragmentation structures derived from the compounds and identifying minimal fragment structures with high pharmacological activity and association scores.

한편, 도 8은 본 발명의 또 다른 실시예에 따른 신규 선도물질 예측 시스템의 하드웨어 구성을 나타낸 블록도이다.8 is a block diagram illustrating a hardware configuration of a new leading material prediction system according to another embodiment of the present invention.

도 8을 참조하면, 신규 선도물질 예측 시스템(500)은 적어도 하나의 저장부(501), 적어도 하나의 출력부(503), 적어도 하나의 입력부(505), 적어도 하나의 통신부(507) 및 적어도 하나의 프로세서(509)를 포함하는 하드웨어로 구성된다. 신규 선도물질 예측 시스템(500)은 하드웨어와 결합하여 동작하는 운영체제, 미들웨어, 프로그램 등 각종 소프트웨어를 포함한다. 신규 선도물질 예측 시스템(500)의 하드웨어와 소프트웨어는 본 발명을 실행할 수 있는 구성과 성능을 가진다.8, the new lead material prediction system 500 includes at least one storage unit 501, at least one output unit 503, at least one input unit 505, at least one communication unit 507, And hardware including one processor 509. The new lead material prediction system 500 includes various software such as an operating system, middleware, and programs that operate in combination with hardware. The hardware and software of the new leading material prediction system 500 have the configuration and capabilities to implement the present invention.

저장부(501)는 도 1 ~ 도 7에서 설명한 구성 및 방법을 구현하기 위한 프로그램을 저장한다. 저장부(501)는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함하고, 예를 들면 ROM(read only memory), RAM(random access memory), 자기디스크 저장 매체, 광저장 매체, 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함할 수 있다. 저장부(501)에 저장된 프로그램은 도 1 ~ 도 7에서 설명한 신규 선도물질 예측 시스템(500)의 동작을 구현한 명령어들(instructions)를 포함한다. 프로세서(509)는 프로그램을 로딩하여 본 발명에서 설명한 도 1 ~ 도 7에서 설명한 신규 선도물질 예측 시스템(500)의 동작을 수행한다.The storage unit 501 stores a program for implementing the configuration and method described with reference to Figs. 1 to 7. The storage unit 501 includes any medium that stores or transmits data in a form readable by an apparatus such as a computer, and includes, for example, a read only memory (ROM), a random access memory (RAM) Storage media, flash memory devices, and other electrical, optical, or acoustic signal transmission media, and the like. The program stored in the storage unit 501 includes instructions that implement the operation of the new leading material prediction system 500 described with reference to FIGS. The processor 509 loads the program and performs the operations of the new leading material prediction system 500 described in FIGS. 1 to 7 described in the present invention.

출력부(503)는 프로세서(509)의 동작에 따른 정보를 화면에 출력하는데, 예를들면, 조각구조 및/또는 조각구조 조합을 신규 선도물질로 출력한다. 이때, 화면 상에 출력할 수도 있고, 인쇄물로 출력할 수도 있고, 사용자가 인지할 수 있는 다양한 방식으로 출력할 수 있다. 입력부(505)는 약리활성-화합물 데이터베이스(101)를 구축하는데 필요한 정보를 인터넷 상에서 수집하거나 또는 사용자로부터 입력받아 프로세서(509)로 출력한다.The output unit 503 outputs information according to the operation of the processor 509 to the screen. For example, a piece structure and / or a piece structure combination is output as a new lead material. At this time, it can be outputted on the screen, printed matter, or output in various ways which can be recognized by the user. The input unit 505 collects the information necessary for constructing the pharmacological activity-compound database 101 on the Internet or inputs it from the user and outputs it to the processor 509.

통신부(507)는 통신망(300)에 연결되어 데이터 송수신 기능을 수행한다. The communication unit 507 is connected to the communication network 300 and performs a data transmission / reception function.

이때, 각 구성(501, 503, 505, 507)은 하나의 프로세서(509) 내에 탑재된 형태로 도시하였으나, 이는 각 구성(501, 503, 505, 507)이 프로세서 기반으로 동작하는 것을 의미하는 것으로, 하나의 프로세서(509)로 구현될 수도 있지만, 이더넷이나 네트워크를 통해 서로 연결된 별개의 서버로 구현될 수도 있다.In this case, each of the configurations 501, 503, 505, and 507 is shown mounted in one processor 509, which means that the configurations 501, 503, 505, and 507 operate on a processor basis , A single processor 509, but may be implemented as separate servers connected to each other via Ethernet or a network.

이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.The embodiments of the present invention described above are not implemented only by the apparatus and method, but may be implemented through a program for realizing the function corresponding to the configuration of the embodiment of the present invention or a recording medium on which the program is recorded.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, It belongs to the scope of right.

Claims (15)

적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서,
다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계,
상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계,
유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계,
상기 유사 약리활성 그룹 내 화합물들과, 조각화를 통해 도출된 조각구조들 간에 발생 빈도수를 이용하여 화합물들과 조각구조들 간에 각각의 연관도 점수를 산출하고, 연관도 점수가 기 정의된 임계값을 충족하는 특정 화합물과 특정 조각구조를 선정하는 단계, 그리고
선정된 상기 특정 조각구조를 상기 특정 화합물의 약리활성에 대한 신규 선도물질 후보로 제공하는 단계를 포함하고,
상기 선정하는 단계는,
상기 발생 빈도수에 기초하여 특정 조각구조와 특정 화합물이 동시에 발생할 확률을 나타내는 지지도, 상기 특정 조각구조가 발생할 때 상기 특정 화합물이 발생할 확률을 나타내는 신뢰도, 및 상기 지지도와 신뢰도의 비율인 향상도가 기 정의된 각각의 임계치 이상인 상기 특정 조각구조 및 상기 특정 화합물을 선정하는, 신규 선도물질 후보 예측 방법.
WHAT IS CLAIMED IS: 1. A method for predicting a new lead material candidate by a system operating by at least one processor,
Collecting information of the compounds having various pharmacological activities and individual pharmacological activities,
Identifying the compounds that are found to have statistically significant similarity to the individual pharmacological activities and grouping them by pharmacological activity,
Fragmenting the compounds in the pseudo-pharmacologically active group into minimal chemical functional units to derive fragmented structures for each compound,
The association scores are calculated between the compounds and the fragment structures using the frequency of occurrence between the compounds in the pseudo-pharmacologically active group and the fragment structures derived through fragmentation, and the association score is calculated based on the predefined threshold value Selecting a particular compound to meet and a particular fragment structure, and
Providing said selected fragment structure as a new lead material candidate for pharmacological activity of said particular compound,
Wherein the selecting comprises:
A degree of support indicating a probability that a specific fragment structure and a specific compound occur at the same time based on the occurrence frequency, a reliability indicating a probability of occurrence of the specific compound when the specific fragment structure is generated, And selecting the specific fragment structure and the specific compound that are not less than the respective threshold values.
제1항에서,
상기 그룹핑하는 단계는,
모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)와, 통계적으로 유의미한지를 나타내는 유의 확률에 기초하여, 약리활성이 유사한 화합물들을 발굴하는, 신규 선도물질 후보 예측 방법.
The method of claim 1,
Wherein the grouping comprises:
Based on the odds ratio between the compound and the pharmacological activity calculated on the basis of the frequency for the individual pharmacological activity of all the compounds and the significance probability indicating that the pharmacological activity is statistically significant, Candidate prediction method.
제2항에서,
상기 그룹핑하는 단계는,
상기 승산비에 기초하여 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들 중에서 상기 유의 확률이 0.05 이하 이하인 화합물들을 해당 약리활성이 유사한 화합물로 발굴하는, 신규 선도물질 후보 예측 방법.
3. The method of claim 2,
Wherein the grouping comprises:
Selecting a compound having a pharmacological activity by pharmacological activity on the basis of the multiplication ratio and finding a compound having a similar probability of 0.05 or less among the ranked compounds as a compound having a similar pharmacological activity; Material candidate prediction method.
삭제delete 삭제delete 제1항에서,
상기 선정하는 단계는,
상기 향상도가 1보다 큰 조각구조와 화합물 쌍은 유의미한 연관성이 있다고 평가하는, 신규 선도물질 후보 예측 방법.
The method of claim 1,
Wherein the selecting comprises:
Wherein the improvement is evaluated as having a significant association with a sculptural structure larger than one pair of compounds.
제1항에서,
상기 향상도는,
특정 약리활성에 대한 신규 선도물질 후보의 예측 점수로 사용되는, 신규 선도물질 후보 예측 방법.
The method of claim 1,
The above-
A method for predicting a new lead substance candidate, which is used as a predictive score of a new lead substance candidate for a particular pharmacological activity.
적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서,
통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계,
상기 화합물들로부터 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고
선정된 상기 적어도 하나의 특정 조각구조를 상기 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함하고,
상기 선정하는 단계는,
상기 유사성이 있는 약리활성을 가지는 모든 화합물들과 모든 조각구조들의 발생 빈도수를 이용하여 특정 화합물과 특정 조각구조가 동시에 발생할 확률인 지지도, 특정 조각구조가 발생할 때 특정 화합물이 발생할 확률인 신뢰도, 및 상기 지지도와 상기 신뢰도의 비율인 향상도를 계산하는 단계, 그리고
상기 지지도 및 상기 신뢰도가 모두 기 정해진 기준값을 충족하고, 상기 향상도가 기 정의된 유의미한 척도를 만족하는 각각의 조각구조와 화합물 쌍들로부터 공통된 적어도 하나의 조각구조를 선정하는 단계
를 포함하는, 신규 선도물질 후보 예측 방법.
WHAT IS CLAIMED IS: 1. A method for predicting a new lead material candidate by a system operating by at least one processor,
Fragmenting the compounds having pharmacological activity having statistically significant similarities into minimum chemical functional units to derive fragment structures for each compound,
Selecting at least one particular fragment structure commonly derived from said compounds, and
Predicting said selected at least one particular fragment structure to a new lead material candidate for said pharmacological activity,
Wherein the selecting comprises:
A support which is a probability that a specific compound and a specific fragment structure occur at the same time using all the compounds having similar pharmacological activity and the occurrence frequency of all fragment structures, reliability that is the probability of occurrence of a specific compound when a specific fragment structure occurs, Calculating a degree of improvement that is a ratio of the degree of support to the reliability; and
Selecting at least one piece structure common to each piece structure and compound pairs in which the degree of support and the reliability both meet a predetermined reference value and the degree of improvement satisfies a predefined significant measure
Wherein the new candidate material candidate prediction method comprises:
제8항에서,
상기 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들은,
특정 약리활성과 특정 화합물간의 승산비 및 피셔의 정확 검증(fisher exact test)에 따른 유의 확률에 기초하여 선정되고,
상기 승산비는,
온라인 상의 공개 데이터베이스로부터 수집되거나 또는 사용자에 의해 입력된 다양한 약리활성 정보 및 개별 약리활성을 가지는 화합물들로부터 계산된 특정 약리활성과 특정 화합물간의 발생 빈도수를 이용하여 산출되는, 신규 선도물질 후보 예측 방법.
9. The method of claim 8,
Compounds having pharmacological activity with statistically significant similarity,
Based on the multiplication ratio between the specific pharmacological activity and the specific compound and the significance probability according to the fisher exact test,
The multiplication ratio may be,
Which is calculated using a specific pharmacological activity calculated from compounds having various pharmacologically active information and individual pharmacological activities collected from a public database on-line or inputted by a user and the occurrence frequency between a specific compound.
삭제delete 삭제delete 신규 선도물질 후보를 예측하는 프로그램을 저장하는 메모리, 그리고
상기 프로그램을 실행하는 적어도 하나의 프로세서를 포함하고,
상기 프로그램은,
외부 공개 자료 및 사용자가 입력한 자료로부터 수집한 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들로부터 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하고,
유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하며,
상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하고,
선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규선도물질 후보로 제공하며,
상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하기 위해 유사 약리활성 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들 간에 동시 발생 빈도수에 기초하여 중요성의 척도로 사용되는 지지도, 신뢰성의 척도로 사용되는 신뢰도, 및 지지도와 신뢰도의 비율로 산출되는 향상도를 산출하고,
상기 지지도, 상기 신뢰도 및 상기 향상도가 유의미한지 평가하여, 유의미한 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 발굴하는 명령어들(instructions)을 포함하는, 신규 선도물질 후보 예측 시스템.
A memory for storing a program for predicting a new lead material candidate, and
And at least one processor for executing the program,
The program includes:
Compounds that have been determined to have statistically significant similarity to the individual pharmacological activities from compounds having an individual pharmacological activity and information of various pharmacological activities collected from external disclosure data and user input data are grouped by pharmacological activity ,
Fragments in pseudo-active groups are fragmented into minimal chemical functional units, resulting in fragmented structures for each compound,
Selecting at least one specific fragment structure commonly derived from the compounds in the group,
Providing said selected at least one particular fragment structure as a novel lead material candidate for pharmacological activity of said in-group compounds,
To select at least one particular fragment structure commonly derived from the compounds in the group, to be used as a measure of significance based on the coincidence frequency between all compounds in the pseudo-pharmacologically active group and the fragmented structures derived from all of the compounds Reliability that is used as a measure of reliability, and degree of improvement calculated by the ratio of the degree of support and reliability,
Evaluating whether the degree of support, the reliability and the degree of improvement are significant to identify significant piece structures and at least one piece structure common to the pair of compounds.
제12항에서,
상기 프로그램은,
모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)를 기준으로 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고,
상기 순위가 선정된 화합물들중에서 통계적으로 유의미한지를 나타내는 유의 확률(p-value)이 기준값 이하인 화합물들을 선별하며,
선별된 화합물들을 약리활성이 유사한 화합물들로 발굴하여, 그룹핑하는 명령어들을 포함하는, 신규 선도물질 후보 예측 시스템.
The method of claim 12,
The program includes:
Ranking the compounds having the pharmacological activity by pharmacological activity on the basis of the odds ratio between the compound and the pharmacological activity calculated based on the frequency of the individual pharmacological activities of all the compounds,
Compounds with a p-value less than or equal to a reference value indicating statistically significant among the ranked compounds are selected,
A candidate agent candidate prediction system comprising instructions for identifying and grouping selected compounds as compounds with similar pharmacological activity.
삭제delete 제12항에서,
상기 공통으로 도출된 적어도 하나의 조각구조와 화합물간의 정보를 저장하는 조각구조-화합물 데이터베이스, 그리고
상기 조각구조-화합물 데이터베이스와 연결되고, 통신망을 통해 접속된 단말에게 상기 조각구조-화합물 데이터베이스로의 접근을 관리하는 사용자 인터페이스부
를 더 포함하는, 신규 선도물질 후보 예측 시스템.
The method of claim 12,
A fragmented structure-compound database for storing information between at least one piece structure and the compound derived in common, and
A user interface unit connected to the fragmented structure-compound database and managing access to the fragmented structure-compound database to a terminal connected through a communication network;
Wherein the new candidate material candidate prediction system further comprises:
KR1020170079166A 2017-06-22 2017-06-22 Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments KR101995511B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170079166A KR101995511B1 (en) 2017-06-22 2017-06-22 Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170079166A KR101995511B1 (en) 2017-06-22 2017-06-22 Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments

Publications (2)

Publication Number Publication Date
KR20190000167A KR20190000167A (en) 2019-01-02
KR101995511B1 true KR101995511B1 (en) 2019-07-02

Family

ID=65021519

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170079166A KR101995511B1 (en) 2017-06-22 2017-06-22 Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments

Country Status (1)

Country Link
KR (1) KR101995511B1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210026301A (en) 2019-08-29 2021-03-10 (주)비아이매트릭스 A decision making support system for distributing agricultural products
KR20210026541A (en) 2019-08-30 2021-03-10 주식회사 에일론 A system of predicting compound activity for target protein using Homology and artificial neural network
KR20210027668A (en) 2019-08-30 2021-03-11 주식회사 에일론 A system of predicting compound activity for target protein using Fourier descriptor and artificial neural network
KR20210026542A (en) 2019-08-30 2021-03-10 주식회사 에일론 A system of predicting biological activity for compound with target protein using geometry images and artificial neural network
KR20210026543A (en) 2019-08-30 2021-03-10 주식회사 에일론 A system of predicting biological activity for compound with target protein using geometry images and artificial neural network
KR102452150B1 (en) 2021-01-25 2022-10-11 주식회사 카이팜 Drug information extracting method based on bioactivity data, constructing method for drug screening library and analysis apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005038618A2 (en) 2003-10-14 2005-04-28 Verseon Lead molecule cross-reaction prediction and optimization system
US20110282910A1 (en) 2010-01-29 2011-11-17 Cramer Richard D Template Constrained Fragment Alignment Used To Identify Fragments Of Similar Shape and Activity In Drug Development

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020028925A (en) * 2002-01-08 2002-04-17 신환철 New method for desiging molaculars of new medicines

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005038618A2 (en) 2003-10-14 2005-04-28 Verseon Lead molecule cross-reaction prediction and optimization system
US20110282910A1 (en) 2010-01-29 2011-11-17 Cramer Richard D Template Constrained Fragment Alignment Used To Identify Fragments Of Similar Shape and Activity In Drug Development

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
정보과학회지 31(8), 이지영 외 3명. 컴퓨터를 이용한 신약개발, 향후 기술 전망. (2013.08.)*

Also Published As

Publication number Publication date
KR20190000167A (en) 2019-01-02

Similar Documents

Publication Publication Date Title
KR101995511B1 (en) Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments
Xue et al. Review of drug repositioning approaches and resources
Heikamp et al. The future of virtual compound screening
Clemons et al. Quantifying structure and performance diversity for sets of small molecules comprising small-molecule screening collections
Schnecke et al. Computational chemistry-driven decision making in lead generation
Hu et al. Exploring compound promiscuity patterns and multi-target activity spaces
Bajorath Modeling of activity landscapes for drug discovery
KR101963331B1 (en) Method and system for predicting drug repositioning candidate based on similarity between drug and metabolite
US20060106544A1 (en) Method and system for predicting functions of compound
US20070156343A1 (en) Stochastic method to determine, in silico, the drug like character of molecules
Shanmugasundaram et al. Hit-directed nearest-neighbor searching
Cockroft et al. STarFish: a stacked ensemble target fishing approach and its application to natural products
KR20060103165A (en) Classified web sites search system and method
Abdo et al. Ligand expansion in ligand-based virtual screening using relevance feedback
Abdo et al. Implementing relevance feedback in ligand-based virtual screening using Bayesian inference network
Ferreira et al. In silico screening strategies for novel inhibitors of parasitic diseases
CN110046216A (en) The proximity search method that spatial key applied to electronic map is inquired
Das et al. Machine-learning technique, QSAR and molecular dynamics for hERG–drug interactions
Geppert et al. Advances in 2D fingerprint similarity searching
Doctor et al. The apoptosis database
Arif et al. The use of weighted 2D fingerprints in similarity-Based virtual screening
Atomwise AIMS Program izhar@ atomwise. com Wallach Izhar 2 Bernard Denzil 2 Nguyen Kong 2 Ho Gregory 2 Morrison Adrian 2 Stecula Adrian 2 Rosnik Andreana 2 O’Sullivan Ann Marie 2 Davtyan Aram 2 Samudio Ben 2 Thomas Bill 2 Worley Brad 2 Butler Brittany 2 Laggner Christian 2 Thayer Desiree 2 Moharreri Ehsan 2 Friedland Greg 2 Truong Ha 2 van den Bedem Henry 2 Ng Ho Leung 2 Stafford Kate 2 Sarangapani Krishna 2 Giesler Kyle 2 Ngo Lien 2 Mysinger Michael 2 Ahmed Mostafa 2 Anthis Nicholas J. 2 Henriksen Niel 2 Gniewek Pawel 2 Eckert Sam 2 de Oliveira Saulo 2 Suterwala Shabbir 2 PrasadPrasad Srimukh Veccham Krishna 2 Shek Stefani 2 Contreras Stephanie 2 Hare Stephanie 2 Palazzo Teresa 2 O’Brien Terrence E. 2 Van Grack Tessa 2 Williams Tiffany 2 Chern Ting-Rong 2 Kenyon Victor 2 Lee Andreia H. 3 Cann Andrew B. 4 Bergman Bastiaan 5 Anderson Brandon M. 6 Cox Bryan D. 7 Warrington Jeffrey M. 8 Sorenson Jon M. 9 Goldenberg Joshua M. 10 Young Matthew A. 11 DeHaan Nicholas 12 Pemberton Ryan P. 13 Schroedl Stefan 14 Abramyan Tigran M. 11 15 Gupta Tushita 16 Mysore Venkatesh 17 Presser Adam G. 18 Ferrando Adolfo A. 19 Andricopulo Adriano D. 20 Ghosh Agnidipta 21 Ayachi Aicha Gharbi 22 Mushtaq Aisha 23 Shaqra Ala M. 24 Toh Alan Kie Leong 25 Smrcka Alan V. 26 Ciccia Alberto 27 de Oliveira Aldo Sena 28 Sverzhinsky Aleksandr 29 de Sousa Alessandra Mara 30 Agoulnik Alexander I. 31 Kushnir Alexander 32 Freiberg Alexander N. 33 Statsyuk Alexander V. 34 Gingras Alexandre R. 35 Degterev Alexei 36 Tomilov Alexey 37 Vrielink Alice 38 Garaeva Alisa A. 39 Bryant-Friedrich Amanda 40 Caflisch Amedeo 41 Patel Amit K. 35 Rangarajan Amith Vikram 42 Matheeussen An 43 Battistoni Andrea 44 Caporali Andrea 45 Chini Andrea 46 Ilari Andrea 47 Mattevi Andrea 48 Foote Andrea Talbot 49 Trabocchi Andrea 50 Stahl Andreas 51 Herr Andrew B. 52 Berti Andrew 40 Freywald Andrew 53 Reidenbach Andrew G. 54 Lam Andrew 55 Cuddihy Andrew R. 56 White Andrew 57 Taglialatela Angelo 19 Ojha Anil K. 58 Cathcart Ann M. 59 Motyl Anna AL 45 Borowska Anna 39 D’Antuono Anna 60 Hirsch Anna KH 61 Porcelli Anna Maria 62 Minakova Anna 48 Montanaro Anna 60 Müller Anna 41 Fiorillo Annarita 63 Virtanen Anniina 64 O’Donoghue Anthony J. 35 Del Rio Flores Antonio 51 Garmendia Antonio E. 65 Pineda-Lucena Antonio 66 Panganiban Antonito T. 67 Samantha Ariela 38 Chatterjee Arnab K. 68 Haas Arthur L. 69 Paparella Ashleigh S. 21 John Ashley L. St. 70 Prince Ashutosh 71 ElSheikh Assmaa 72 Apfel Athena Marie 57 Colomba Audrey 73 O’Dea Austin 74 Diallo Bakary N’tji 75 Ribeiro Beatriz Murta Rezende Moraes 76 Bailey-Elkin Ben A. 77 Edelman Benjamin L. 78 Liou Benjamin 52 Perry Benjamin 79 Chua Benjamin Soon Kai 80 Kováts Benjámin 81 Englinger Bernhard 59 Balakrishnan Bijina 82 Gong Bin 33 Agianian Bogos 21 Pressly Brandon 37 Salas Brenda P. Medellin 83 Duggan Brendan M. 35 Geisbrecht Brian V. 84 Dymock Brian W. 85 Morten Brianna C. 85 Hammock Bruce D. 37 Mota Bruno Eduardo Fernandes 76 Dickinson Bryan C. 86 Fraser Cameron 87 Lempicki Camille 88 Novina Carl D. 89 Torner Carles 90 Ballatore Carlo 35 Bon Carlotta 91 Chapman Carly J. 92 Partch Carrie L. 93 Chaton Catherine T. 94 Huang Chang 65 Yang Chao-Yie 95 Kahler Charlene M. 38 Karan Charles 27 Keller Charles 96 Dieck Chelsea L. 97 Huimei Chen 70 Liu Chen 98 Peltier Cheryl 77 Mantri Chinmay Kumar 70 Kemet Chinyere Maat 55 Müller Christa E. 99 Weber Christian 100 Zeina Christina M. 59 Muli Christine S. 101 Morisseau Christophe 37 Alkan Cigdem 33 Reglero Clara 19 Loy Cody A. 101 Wilson Cornelia M. 102 Myhr Courtney 31 Arrigoni Cristina 48 Paulino Cristina 39 Santiago César 103 Luo Dahai 22 Tumes Damon J. 104 Keedy Daniel A. 105 Lawrence Daniel A. 57 Chen Daniel 106 Manor Danny 71 Trader Darci J. 101 Hildeman David A. 52 Drewry David H. 107 Dowling David J. 108 Hosfield David J. 86 Smith David M. 109 Moreira David 110 Siderovski David P. 111 Shum David 112 Krist David T. 113 Riches David WH 78 Ferraris Davide Maria 114 Anderson Deborah H. 115 Coombe Deirdre R. 116 Welsbie Derek S. 35 Hu Di 71 Ortiz Diana 117 Alramadhani Dina 118 Zhang Dingqiang 119 Chaudhuri Dipayan 82 Slotboom Dirk J. 39 Ronning Donald R. 120 Lee Donghan 121 Dirksen Dorian 122 Shoue Douglas A. 123 Zochodne Douglas William 124 Krishnamurthy Durga 125 Duncan Dustin 126 Glubb Dylan M. 92 Gelardi Edoardo Luigi Maria 127 Hsiao Edward C. 128 Lynn Edward G. 129 Silva Elany Barbosa 130 Aguilera Elena 131 Lenci Elena 50 Abraham Elena Theres 132 Lama Eleonora 62 Mameli Eleonora 45 Leung Elisa 126 Christensen Emily M. 133 Mason Emily R. 134 Petretto Enrico 70 Trakhtenberg Ephraim F. 135 Rubin Eric J. 18 Strauss Erick 136 Thompson Erik W. 25 Cione Erika 137 Lisabeth Erika Mathes 138 Fan Erkang 139 Kroon Erna Geessien 76 Jo Eunji 112 García-Cuesta Eva M. 103 Glukhov Evgenia 35 Gavathiotis Evripidis 21 Yu Fang 140 Xiang Fei 141 Leng Fenfei 142 Wang Feng 143 Ingoglia Filippo 82 van den Akker Focco 71 Borriello Francesco 144 Vizeacoumar Franco J. 145 Luh Frank 146 Buckner Frederick S. 139 Vizeacoumar Frederick S. 53 Bdira Fredj Ben 147 Svensson Fredrik 73 Rodriguez G. Marcela 148 Bognár Gabriella 81 Lembo Gaia 149 Zhang Gang 150 Dempsey Garrett 51 Eitzen Gary 151 Mayer Gaétan 152 Greene Geoffrey L. 86 Garcia George A. 57 Lukacs Gergely L. 153 Prikler Gergely 81 Parico Gian Carlo G. 93 Colotti Gianni 47 De Keulenaer Gilles 154 Cortopassi Gino 37 Roti Giovanni 60 Girolimetti Giulia 62 Fiermonte Giuseppe 155 Gasparre Giuseppe 156 Leuzzi Giuseppe 19 Dahal Gopal 157 Michlewski Gracjan 158 159 Conn Graeme L. 160 Stuchbury Grant David 85 Bowman Gregory R. 161 Popowicz Grzegorz Maria 162 Veit Guido 153 de Souza Guilherme Eduardo 20 Akk Gustav 163 Caljon Guy 43 Alvarez Guzmán 164 Rucinski Gwennan 165 Lee Gyeongeun 112 Cildir Gökhan 166 Li Hai 27 Breton Hairol E. 167 Jafar-Nejad Hamed 168 Zhou Han 169 Moore Hannah P. 170 Tilford Hannah 165 Yuan Haynes 171 Shim Heesung 37 Wulff Heike 37 Hoppe Heinrich 75 Chaytow Helena 45 Tam Heng-Keat 172 Van Remmen Holly 173 Xu Hongyang 174 Debonsi Hosana Maria 175 Lieberman Howard B. 27 Jung Hoyoung 176 Fan Hua-Ying 177 Feng Hui 55 Zhou Hui 19 Kim Hyeong Jun 178 Greig Iain R. 179 Caliandro Ileana 180 Corvo Ileana 181 Arozarena Imanol 182 Mungrue Imran N. 183 Verhamme Ingrid M. 184 Qureshi Insaf Ahmed 185 Lotsaris Irina 186 Cakir Isin 57 Perry J. Jefferson P. 195 Kwiatkowski Jacek 85 Boorman Jacob 71 Ferreira Jacob 188 Fries Jacob 189 Kratz Jadel Müller 79 Miner Jaden 82 Siqueira-Neto Jair L. 35 Granneman James G. 190 Ng James 165 Shorter James 161 Voss Jan Hendrik 99 Gebauer Jan M. 132 Chuah Janelle 109 Mousa Jarrod J. 191 Maynes Jason T. 192 Evans Jay D. 193 Dickhout Jeffrey 194 MacKeigan Jeffrey P. 138 Jossart Jennifer N. 195 Zhou Jia 33 Lin Jiabei 161 Xu Jiake 196 Wang Jianghai 146 Zhu Jiaqi 197 Liao Jiayu 195 Xu Jingyi 195 Zhao Jinshi 198 Lin Jiusheng 199 Lee Jiyoun 200 Reis Joana 48 Stetefeld Joerg 77 Bruning John B. 201 Bruning John Burt 80 Coles John G. 202 Tanner John J. 167 Pascal John M. 29 So Jonathan 59 Pederick Jordan L. 80 Costoya Jose A. 110 Rayman Joseph B. 19 Maciag Joseph J. 52 Nasburg Joshua Alexander 37 Gruber Joshua J. 203 Finkelstein Joshua M. 55 Watkins Joshua 165 Rodríguez-Frade José Miguel 204 Arias Juan Antonio Sanchez 205 Lasarte Juan José 206 Oyarzabal Julen 205 Milosavljevic Julian 88 Cools Julie 154 Lescar Julien 22 Bogomolovas Julijus 35 Wang Jun 148 Kee Jung-Min 176 Kee Jung-Min 178 Liao Junzhuo 207 Sistla Jyothi C. 118 Abrahão Jônatas Santos 76 Sishtla Kamakshi 208 Francisco Karol R. 35 Hansen Kasper B. 209 Molyneaux Kathleen A. 71 Cunningham Kathryn A. 33 Martin Katie R. 138 Gadar Kavita 210 Ojo Kayode K. 139 Wong Keith S. 126 Wentworth Kelly L. 128 Lai Kent 82 Lobb Kevin A. 75 Hopkins Kevin M. 27 Parang Keykavous 211 Machaca Khaled 212 Pham Kien 98 Ghilarducci Kim 213 Sugamori Kim S. 126 McManus Kirk James 77 Musta Kirsikka 64 Faller Kiterie ME 45 Nagamori Kiyo 96 Mostert Konrad J. 136 Korotkov Konstantin V. 94 Liu Koting 214 Smith Kristiana S. 215 Sarosiek Kristopher 216 Rohde Kyle H. 217 Kim Kyu Kwang 218 Lee Kyung Hyeon 219 Pusztai Lajos 98 Lehtiö Lari 220 Haupt Larisa M. 25 Cowen Leah E. 126 Byrne Lee J. 102 Su Leila 146 Wert-Lamas Leon 89 Puchades-Carrasco Leonor 221 Chen Lifeng 86 Malkas Linda H. 187 Zhuo Ling 222 Hedstrom Lizbeth 223 Hedstrom Lizbeth 223 Walensky Loren D. 59 Antonelli Lorenzo 63 Iommarini Luisa 62 Whitesell Luke 126 Randall Lía M. 224 Fathallah M. Dahmani 225 Nagai Maira Harume 198 Kilkenny Mairi Louise 226 Ben-Johny Manu 19 Lussier Marc P. 213 Windisch Marc P. 112 Lolicato Marco 48 Lolli Marco Lucio 180 Vleminckx Margot 43 Caroleo Maria Cristina 227 Macias Maria J. 90 Valli Marilia 20 Barghash Marim M. 126 Mellado Mario 204 Tye Mark A. 228 Wilson Mark A. 199 Hannink Mark 229 Ashton Mark R. 85 Cerna Mark Vincent C. dela 121 Giorgis Marta 179 Safo Martin K. 118 Maurice Martin St. 230 McDowell Mary Ann 123 Pasquali Marzia 82 Mehedi Masfique 231 Serafim Mateus Sá Magalhães 76 Soellner Matthew B. 57 Alteen Matthew G. 232 Champion Matthew M. 123 Skorodinsky Maxim 233 O’Mara Megan L. 234 Bedi Mel 40 Rizzi Menico 114 Levin Michael 119 Mowat Michael 235 Jackson Michael R. 236 Paige Mikell 219 Al-Yozbaki Minnatallah 102 Giardini Miriam A. 130 Maksimainen Mirko M. 220 De Luise Monica 62 Hussain Muhammad Saddam 208 Christodoulides Myron 165 Stec Natalia 158 Zelinskaya Natalia 160 Van Pelt Natascha 43 Merrill Nathan M. 57 Singh Nathanael 105 Kootstra Neeltje A. 237 Singh Neeraj 238 Gandhi Neha S. 25 Chan Nei-Li 214 Trinh Nguyen Mai 22 Schneider Nicholas O. 230 Matovic Nick 85 Horstmann Nicola 239 Longo Nicola 82 Bharambe Nikhil 22 Rouzbeh Nirvan 209 Mahmoodi Niusha 21 Gumede Njabulo Joyfull 240 Anastasio Noelle C. 33 Khalaf Noureddine Ben 225 Rabal Obdulia 205 Kandror Olga 216 Escaffre Olivier 33 Silvennoinen Olli 64 Bishop Ozlem Tastan 75 Iglesias Pablo 110 Sobrado Pablo 241 Chuong Patrick 242 O’Connell Patrick 138 Martin-Malpartida Pau 90 Mellor Paul 53 Fish Paul V. 73 Moreira Paulo Otávio Lourenço 30 Zhou Pei 198 Liu Pengda 107 Liu Pengda 107 Wu Pengpeng 243 Agogo-Mawuli Percy 111 Jones Peter L. 244 Ngoi Peter 93 Toogood Peter 57 Ip Philbert 126 von Hundelshausen Philipp 100 Lee Pil H. 57 Rowswell-Turner Rachael B. 218 Balaña-Fouce Rafael 245 Rocha Rafael Eduardo Oliveira 76 Guido Rafael VC 20 Ferreira Rafaela Salgado 76 Agrawal Rajendra K. 58 Harijan Rajesh K. 21 Ramachandran Rajesh 246 Verma Rajkumar 247 Singh Rakesh K. 248 Tiwari Rakesh Kumar 249 Mazitschek Ralph 228 Koppisetti Rama K. 167 Dame Remus T. 147 Douville Renée N. 250 Austin Richard C. 194 Taylor Richard E. 123 Moore Richard G. 218 Ebright Richard H. 148 Angell Richard M. 73 Yan Riqiang 238 Kejriwal Rishabh 65 Batey Robert A. 126 Blelloch Robert 128 Vandenberg Robert J. 186 Hickey Robert J. 187 Kelm Robert J. Jr. 49 Lake Robert J. 177 Bradley Robert K. 251 Blumenthal Robert M. 106 Solano Roberto 46 Gierse Robin Matthias 252 Viola Ronald E. 157 McCarthy Ronan R. 210 Reguera Rosa Maria 245 Uribe Ruben Vazquez 253 do Monte-Neto Rubens Lima 30 Gorgoglione Ruggiero 155 Cullinane Ryan T. 223 Katyal Sachin 171 Hossain Sakib 105 Phadke Sameer 57 Shelburne Samuel A. 239 Geden Sandra E. 217 Johannsen Sandra 61 Wazir Sarah 220 Legare Scott 77 Landfear Scott M. 117 Radhakrishnan Senthil K. 118 Ammendola Serena 44 Dzhumaev Sergei 254 Seo Seung-Yong 141 Li Shan 143 Zhou Shan 168 Chu Shaoyou 134 Chauhan Shefali 255 Maruta Shinsaku 256 257 Ashkar Shireen R. 57 Shyng Show-Ling 117 Conticello Silvestro G. 149 257 Buroni Silvia 48 Garavaglia Silvia 114 White Simon J. 65 Zhu Siran 158 159 Tsimbalyuk Sofiya 258 Chadni Somaia Haque 142 Byun Soo Young 112 Park Soonju 112 Xu Sophia Q. 259 Banerjee Sourav 260 Zahler Stefan 222 Espinoza Stefano 91 Gustincich Stefano 91 Sainas Stefano 180 Celano Stephanie L. 138 Capuzzi Stephen J. 107 Waggoner Stephen N. 261 Poirier Steve 262 Olson Steven H. 236 Marx Steven O. 263 Van Doren Steven R. 167 Sarilla Suryakala 184 Brady-Kalnay Susann M. 71 Dallman Sydney 231 Azeem Syeda Maryam 105 Teramoto Tadahisa 264 Mehlman Tamar 105 Swart Tarryn 75 Abaffy Tatjana 265 Akopian Tatos 216 Haikarainen Teemu 64 Moreda Teresa Lozano 266 Ikegami Tetsuro 33 Teixeira Thaiz Rodrigues 175 Jayasinghe Thilina D. 120 Gillingwater Thomas H. 45 Kampourakis Thomas 267 Richardson Timothy I. 208 Herdendorf Timothy J. 84 Kotzé Timothy J. 136 O’Meara Timothy R. 268 Corson Timothy W. 208 Hermle Tobias 88 Ogunwa Tomisin Happy 256 Lan Tong 86 Su Tong 229 Banjo Toshihiro 269 O’Mara Tracy A. 92 Chou Tristan 42 Chou Tsui-Fen 143 Baumann Ulrich 132 Desai Umesh R. 118 Pai Vaibhav P. 119 Thai Van Chi 38 Tandon Vasudha 260 Banerji Versha 77 Robinson Victoria L. 65 Gunasekharan Vignesh 169 Namasivayam Vigneshwaran 99 Segers Vincent FM 43 Maranda Vincent 53 Dolce Vincenza 137 Maltarollo Vinícius Gonçalves 76 Scoffone Viola Camilla 48 Woods Virgil A. 105 Ronchi Virginia Paola 270 Van Hung Le Vuong 271 Clayton W. Brent 101 Lowther W. Todd 272 Houry Walid A. 126 Li Wei 273 Tang Weiping 207 Zhang Wenjun 51 Van Voorhis Wesley C. 139 Donaldson William A. 230 Hahn William C. 59 Kerr William G. 274 Gerwick William H. 130 Bradshaw William J. 275 Foong Wuen Ee 276 Blanchet Xavier 277 Wu Xiaoyang 86 Lu Xin 123 Qi Xin 246 Xu Xin 84 Yu Xinfang 168 Qin Xingping 278 Wang Xingyou 223 Yuan Xinrui 95 Zhang Xu 279 Zhang Yan Jessie 83 Hu Yanmei 148 Aldhamen Yasser Ali 138 Chen Yicheng 71 Li Yihe 71 Sun Ying 52 Zhu Yini 123 Gupta Yogesh K. 280 Pérez-Pertejo Yolanda 245 Li Yong 168 Tang Young 65 He Yuan 40 Tse-Dinh Yuk-Ching 142 Sidorova Yulia A. 281 Yen Yun 146 Li Yunlong 282 Frangos Zachary J. 283 Chung Zara 22 Su Zhengchen 33 Wang Zhenghe 71 Zhang Zhiguo 27 Liu Zhongle 126 Inde Zintis 216 Artía Zoraima 164 Heifets Abraham 2 AI is a viable alternative to high throughput screening: a 318-target study
Lajiness et al. Dissimilarity-based approaches to compound acquisition
Ashenden Screening library design
Hu et al. Global assessment of scaffold hopping potential for current pharmaceutical targets

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant