KR20190000167A - 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템 - Google Patents

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템 Download PDF

Info

Publication number
KR20190000167A
KR20190000167A KR1020170079166A KR20170079166A KR20190000167A KR 20190000167 A KR20190000167 A KR 20190000167A KR 1020170079166 A KR1020170079166 A KR 1020170079166A KR 20170079166 A KR20170079166 A KR 20170079166A KR 20190000167 A KR20190000167 A KR 20190000167A
Authority
KR
South Korea
Prior art keywords
compounds
compound
pharmacological activity
fragment
candidate
Prior art date
Application number
KR1020170079166A
Other languages
English (en)
Other versions
KR101995511B1 (ko
Inventor
이관수
이보아
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020170079166A priority Critical patent/KR101995511B1/ko
Publication of KR20190000167A publication Critical patent/KR20190000167A/ko
Application granted granted Critical
Publication of KR101995511B1 publication Critical patent/KR101995511B1/ko

Links

Images

Classifications

    • G06F19/704
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • G06F19/707
    • G06F19/709
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템이 제공된다. 이 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계, 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.

Description

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING NEW DRUG LEAD COMPOUND CANDIDATE BY APPLYING ASSOCIATION RULES BETWEEN PHARMACOLOGICALLY ACTIVE SIMILAS COMPOUNDS AND THEIR FRAGMENTS}
본 발명은 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템에 관한 것이다.
선도물질 발굴과정(lead generation)은 새로운 약물의 개발을 위한 기초연구부터 임상 그리고 허가에 이르는 여러 단계의 신약개발 사슬에서 중요한 단계이며 고품질의 선도물질은 임상 성공을 위한 기초를 다져주는 출발점이다.
신약개발은 일반적으로 개발하고자 하는 질병의 타깃 선정으로 시작되고 알려진 화합물을 스크리닝하고, 초기 선도물질을 고르고 검증하고, 간단한 최적화 과정을 거처서 선도물질을 선정하게 된다. 선정된 선도물질은 의약화학의 여러가지 방법을 통하여 1년 이상의 최적화 과정을 통하여 후보물질로 만들어지고 임상실험에 사용된다. 이러한 이유로 선도물질의 선정과정은 후보물질의 임상에서의 약리활성 및 독성에 관계되는 화합물의 구조적 특성의 출발점이고, 신약개발 사슬에서 중요한 단계이다.
최근에는 조각구조가 선도물질이 되어, 이를 기반으로 한 약물발견 및 가상 스크리닝이 사용되고 있고, 작은 규모의 화합물로도 시작이 가능하여 신약 개발 단계에서 널리 이용될 것이다.
선도물질 발굴에 해당하는 종래기술은, 천연물을 이용한 신약발굴 과정에서 살펴 볼 수 있다. 이러한 천연물 유래의 많은 활성물질 내의 공통 구조를 선도물질로 하여 합성을 통한 신약개발 발굴 과정은, 일반적으로 하나의 천연물 소재로부터 추출된, 대량의 천연물 화합물의 약효 스크리닝 과정부터 출발한다. 스크리닝 과정을 통해 도출해낸 초기 약리활성을 지니는 공통 구조를 선도물질로 하여, 구조적으로 유사한 화합물이나 유도체를 합성하여 보다 약리활성도를 증가시키며 독성이나 부작용을 줄이고 체내 약물 전달 시스템의 문제를 해결하는 과정을 거친다.
이러한 천연물 화합물의 약효 스크리닝 과정은 근본적인 경험적 방법으로서 결과에 대한 사전 예측 없이 진행되기 때문에 새로운 선도물질을 도출할 수 있다는 장점이 있다. 반면, 약효시험 비용이나 화합물 확보 및 관리비용 측면에서 막대한 비용과 시간이 필요하다는 문제점이 있다.
또한, 다중 스크리닝법을 통한 선도물질의 발굴과정이 있다. 현재 세계적으로, 우수한 선도물질을 잘 고르기 위하여 기술혁신 및 다양성 기반 연구가 진행되고 있다. 특히, 고속 다중 스크리닝법을 통하여 스크리닝 할 수 있는 물질의 수가 획기적으로 증가하자, 회사들은 새로운 선도물질을 확보하기 위하여, 전 세계의 화학자들에게 접근하여 합성 화합물들을 저가에 구입하려는 시도를 하였다. 다양한 화합물 라이브러리를 최대한 확보하고자, 화합물의 다양성을 획기적으로 개선할 것을 목표로 대대적으로 투자하였다.
그러나 실제로 응용할 수 있는 합성 방법이 제한되어 있고, 따라서 얻어지는 물질의 수에 비해서 그 다양성은 실제로 감소하는 경향이 있어, 결과적으로 초기비용을 더 지불해야 하는 상황을 초래하였다.
또한, 고속 다중 스크리닝법에 비교하여 낮은 분자량을 갖는 양질의 조각구조를 X-레이 구조결정학이나 핵자기 공명 기술을 사용하여 도출하는 방법이 있다. 그러나 이러한 선도물질 도출방법 또한 시간적으로나 비용적으로 탐색 비용이 매우 높다.
또한, 화합물의 단순 조각화를 통해 도출된 조각구조들을 약효시험 과정을 거쳐 일부 약리활성 조각구조를 발굴하는 시도도 있었으나, 이는 보다 중요한 조각구조를 찾는 과정이 빠져있는 단점이 있다.
실제로 새로운 혁신 신약을 개발하기 위해서는 신약으로 개발할 가능성이 높은 선도물질의 선정이 중요하다. 그러나, 전술한 바와 같이, 대부분의 종래기술들은 약리활성을 갖는 다양한 최소 단위의 구조를 발굴하기까지, 대단위의 약리활성 화합물 및 약효 시험 비용을 비롯하여, 후보 탐색을 위한 전처리 과정에 소요되는 비용과 시간이 막대하다는 문제가 있다.
본 발명이 해결하고자 하는 과제는 약리활성 유사도에 따라 그룹핑된 약리활성을 갖는 화합물에 대해 화합물 조각화 기법을 이용하여 그룹 내 약리활성 유사 화합물들을 최소 화학적 기능 단위로 조각화하고, 연관 규칙 출원 기법을 이용하여 조각구조와 약리활성의 연관도 점수를 도출한 후, 신약개발에 있어 선도물질로 제시 가능한 약리활성을 나타내는 최적의 조각구조를 발굴하는 방법 및 이를 수행하는 시스템을 제공하는 것이다.
본 발명의 하나의 특징에 따르면, 신규 선도물질 후보 예측 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계, 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.
상기 그룹핑하는 단계는, 모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)와, 통계적으로 유의미한지를 나타내는 유의 확률에 기초하여, 약리활성이 유사한 화합물들을 발굴할 수 있다.
상기 그룹핑하는 단계는, 상기 승산비에 기초하여 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들 중에서 상기 유의 확률이 0.05 이하 이하인 화합물들을 해당 약리활성이 유사한 화합물로 발굴할 수 있다.
상기 선정하는 단계는, 상기 그룹 내 모든 화합물과, 조각화를 통해 도출된 조각구조들 간에 발생 빈도수를 이용하여 특정 화합물과 특정 조각구조 간에 연관도 점수를 산출하고, 상기 연관도 점수가 기준값을 충족하는 조각구조와 화합물 쌍을 선정할 수 있다.
상기 연관도 점수는, 상기 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들의 모든 발생 빈도 중에서 특정 조각구조와 특정 화합물이 동시에 발생할 확률을 나타내는 지지도, 특정 조각구조가 발생할 때, 특정 화합물이 발생할 확률을 나타내는 신뢰도, 그리고 상기 지지도와 신뢰도의 비율인 향상도를 포함하고, 상기 선정하는 단계는, 상기 지지도와 상기 신뢰도가 기준값을 충족하는 조각구조와 화합물 쌍 중에서 상기 향상도를 기준으로 특정 조각구조가 특정 화합물에 대해 유의미한 연관성이 있는지 평가하여, 유의미한 연관성이 있다고 판단된 적어도 하나의 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 선정할 수 있다.
상기 선정하는 단계는, 상기 향상도가 1보다 큰 조각구조와 화합물 쌍은 유의미한 연관성이 있다고 평가할 수 있다.
상기 향상도는, 특정 약리활성에 대한 신규 선도물질 후보의 예측 점수로 사용될 수 있다.
본 발명의 다른 특징에 따르면, 신규 선도물질 후보 예측 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 화합물들로부터 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.
상기 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들은, 온라인 상의 공개 데이터베이스 및 공신력이 있는 자료들과, 사용자가 입력한 정보들로부터 다양한 약리활성과, 개별 약리활성을 가지는 화합물들로부터, 특정 약리활성과 특정 화합물간의 발생 빈도수에 기초하여 산출된 승산비와, 피셔의 정확 검증(fisher exact test)에 따른 유의 확률에 기초하여 선정될 수 있다.
상기 선정하는 단계는, 특정 화합물과 특정 조각구조 간에 발생 빈도수를 이용하여 산출된 연관도 점수가 기준값을 충족하는 화합물과 조각구조 쌍들에 공통으로 포함된 적어도 하나의 특정 조각구조를 선정할 수 있다.
상기 선정하는 단계는, 상기 약리활성을 가지는 모든 화합물들과 모든 조각구조들의 발생 빈도수와 특정 화합물과 특정 조각구조가 동시에 발생할 확률인 지지도와, 특정 조각구조가 발생할 때 특정 화합물이 발생할 확률인 신뢰도가 모두 기준값을 충족하고, 상기 지지도와 상기 신뢰도의 비율인 향상도가 기 정의된 유의미한 척도를 만족하는 각각의 조각구조와 화합물 쌍들로부터 공통된 적어도 하나의 조각구조를 선정할 수 있다.
본 발명의 또 다른 특징에 따르면, 신규 선도물질 후보 예측 방법은, 적어도 하나의 프로세서에 의해 동작하고, 신규 선도물질 후보를 예측하는 시스템으로서, 외부 공개 자료 및 사용자가 입력한 자료로부터 수집한 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들로부터 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 약리활성 유사 화합물 발굴부, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 화합물 조각화부, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 조각구조 발굴부, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 선도물질 후보 제공부를 포함한다.
상기 약리활성 유사 화합물 발굴부는, 모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)를 기준으로 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들중에서 통계적으로 유의미한지를 나타내는 유의 확률(p-value)이 기준값 이하인 화합물들을 선별하며, 선별된 화합물들을 약리활성이 유사한 화합물들로 발굴하여, 그룹핑할 수 있다.
상기 조각구조 발굴부는, 유사 약리활성 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들 간에 동시 발생 빈도수에 기초하여 중요성의 척도로 사용되는 지지도, 신뢰성의 척도로 사용되는 신뢰도, 및 지지도와 신뢰도의 비율로 산출되는 향상도를 산출하고, 상기 지지도, 상기 신뢰도 및 상기 향상도가 유의미한지 평가하여, 유의미한 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 발굴할 수 있다.
상기 조각구조 발굴부가 출력하는 상기 공통된 적어도 하나의 조각구조와 화합물간의 정보를 저장하는 조각구조-화합물 데이터베이스, 그리고 상기 조각구조-화합물 데이터베이스와 연결되고, 통신망을 통해 접속된 단말에게 상기 조각구조-화합물 데이터베이스로의 접근을 관리하는 사용자 인터페이스부를 더 포함할 수 있다.
본 발명의 실시예에 따르면, 화합물과 약리활성의 정보가 수집 및 통합된 데이터 베이스의 구축으로, 대단위의 약리활성 화합물 및 약효 시험에 필요한 과정을 없앨 수 있다. 그리고 약리활성도가 유사한 화합물들로부터 유래된 조각구조를 이용함으로써, 약리활성과 연관관계가 높은 화학적 기능을 갖는 최소 단위의 조각구조들을 도출 할 수 있는 장점이 있다.
또한, 구조와 활성간의 정성적인 분석과 유효성 평가가 가능하도록 구조적으로 잘 분포된 화합물들을 사용하므로 일단 유효물질이 도출되면 신속하게 후속연구결과를 진행할 수 있다는 장점이 있다.
도 1은 본 발명의 한 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
도 2는 본 발명의 한 실시예에 따른 신규 선도물질 예측 방법의 순서도이다.
도 3은 본 발명의 다른 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
도 4는 본 발명의 실시예에 따른 약리활성 유사 화합물 발굴 과정을 나타낸 순서도이다.
도 5는 본 발명의 실시예에 따른 조각화 과정을 나타낸 순서도이다.
도 6은 본 발명의 실시예에 따른 조각화 과정을 설명하기 위한 개념도이다.
도 7은 본 발명의 실시예에 따른 신규 선도물질 후보로 제공할 조각구조를 추출하는 과정을 나타낸 순서도이다.
도 8은 본 발명의 또 다른 실시예에 따른 신규 선도물질 예측 시스템의 하드웨어 구성을 나타낸 블록도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "…부", "…기", "…모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
본 명세서에서, 약리활성(pharmacological effect)은 어떤 물질이 생체 내 들어가서 단독으로 또는 생체 내 어떤 물질과 결합해 원하는 약물학적 효과를 내는 것을 의미한다.
또한, 선도물질(Lead compound)은 약리학적으로 또는 생물학적으로 효과가 있다고 생각 되어지고, 목적하는 효과를 내기 위해 어느 정도 개선이 필요할 수 있는 물질을 의미한다.
또한, 조각화(Chemical fragmentation)는 화합물을 최소 화학적 기능 단위인 '조각구조(Fragmentation Structure)'로 생성하는 것을 의미한다.
도 1은 본 발명의 한 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이고, 도 2는 본 발명의 한 실시예에 따른 신규 선도물질 예측 방법의 순서도이며, 도 3은 본 발명의 다른 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
먼저, 도 1을 참조하면, 신규 선도물질 예측 시스템(100)은 약리활성-화합물 데이터베이스(101), 약리활성 유사 화합물 발굴부(103), 화합물 조각화부(105), 조각구조 발굴부(107), 선도물질 후보 제공부(109) 및 조각구조-화합물 데이터베이스(111)를 포함하고, 이들 구성의 동작에 대해 설명하면, 도 2와 같다.
도 2를 참조하면, 약리활성 유사 화합물 발굴부(103)는 인터넷 등을 통해 수집된 정보 및/또는 사용자가 입력한 정보를 토대로 약리활성과, 약리활성을 갖는 화합물을 매핑한 약리활성-화합물 데이터베이스(101)를 구축한다(S101).
약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)에 저장된 정보들에 대해 유의성 평가를 수행하여 약리활성이 유사한 화합물을 발굴하고, 약리활성을 갖는 화합물의 약리활성 유사도에 따라 그룹핑한다(S103).
화합물 조각화부(105)는 화합물 조각화 기법을 이용하여 그룹내 약리활성 유사 화합물을 최소 화학적 기능 단위로 조각화한다(S105).
조각구조 발굴부(107)는 약리활성 유사 화합물로부터 조각화된 조각구조와 약리활성 유사 화합물 간의 연관도를 나타내는 연관도 점수를 산출한다(S107).
선도물질 후보 제공부(109)는 연관도 점수에 기초하여 신약개발에 있어 선도물질로 제시 가능한 약리활성을 나타내는 최적의 조각구조를 발굴하고, 발굴된 조각구조와 연관된 약리활성 유사 화합물들의 정보를 통합하여 조각구조-화합물 데이터베이스(111)를 구축한다(S109).
이후, 선도물질 후보 제공부(109)는 조각구조-화합물 데이터베이스(111)에 저장된 조각구조 그 자체를 신규 선도물질 후보로 제공한다(S111). 또한, 선도물질 후보 제공부(109)는 조각구조의 조합을 제공(S111)하여 이를 통해 다양한 활성을 갖는 신약개발에 활용될 수 있도록 한다.
도 3을 참조하면, 선도물질 후보 제공부(109)는 표시 장치(200)와 연결되어, 표시 장치(200)의 화면에 신규 선도물질 후보를 출력할 수 있다.
또한, 신규 선도물질 예측 시스템(100)은 사용자 인터페이스부(113)를 추가로 포함할 수 있다. 사용자 인터페이스부(113)는 통신망(300)을 통해 연결된 단말(400)과 연결된다. 사용자 인터페이스부(113)는 조각구조-화합물 데이터베이스(111)에 대한 접근을 제공하는 수단으로, 통신망(300)을 통해 단말(400)과 연결되어 각종 정보를 교환할 수 있도록 구성될 수 있다. 예를들면, 사용자 인터페이스부(113)는 단말(400)이 신규 선도물질 후보로 조각구조를 검색할 수 있는 환경을 제공할 수 있다. 통신망(300)은 동일한 하드웨어에서의 통신은 물론, 구내 정보 통신망(local area network, LAN), 도시권 통신망(metropolitan area network, MAN), 광역 통신망(wide area network, WAN), 인터넷, 2G, 3G, 4G 이동 통신망, 와이파이(Wi-Fi), 와이브로(Wibro) 등을 포함할 수 있으며, 통신 방식도 유선, 무선을 가리지 않으며 어떠한 통신 방식이라도 상관없다. 단말(400)은 스마트 폰, PC(Personal Computer), 태블릿 PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA), 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 통신 기능을 구비할 수 있다.
이제, 도 4 ~ 도 7을 참고하여, 신규 선도물질 예측 시스템(100)의 세부 동작에 대해 설명하기로 한다.
도 4는 본 발명의 실시예에 따른 약리활성 유사 화합물 발굴 과정을 나타낸 순서도로서, 약리활성 유사 화합물 발굴부(103)의 동작을 나타낸다.
도 4를 참조하면, 약리활성 유사 화합물 발굴부(103)는 약리활성 정보, 천연물을 포함한 화합물 정보, 질병 정보 등을 수집(S201)하고, 통합하여 약리활성-화합물 데이터베이스(101)를 구축한다(S203).
이때, 약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)를 구축하는데 필요한 정보를 인터넷 상에서 수집하거나 또는 사용자로부터 입력받을 수 있다.
약리활성 유사 화합물 발굴부(103)는 온라인 상에서 공개 데이터베이스, 예를들면, DrugBank, 한국전통지식포탈(KTKP), Traditional Chinese Medicine System Pharmacology Database(TCMSP), Traditional Chinese Medicine Integrated Database(TCMID), BindingDB, UMLS, Icd10, ClinicalTrial, SIDER Side Effect Resource, Comparative Toxicogenomics Database(CTD), Therapeutic Target Database(TTD) 등을 통해 수집한 정보들을 약리활성-화합물 데이터베이스(101)에 저장할 수 있다. 또한, 약리활성 유사 화합물 발굴부(103)는 공개 데이터베이스로 구성되지는 않았어도, 온라인 상에서 신뢰도가 높은 공식적인 정보를 수집하여 약리활성-화합물 데이터베이스(101)에 저장할 수 있다.
약리활성-화합물 데이터베이스(101)는 개별 약리활성 정보와, 그 약리활성을 갖는 화합물의 정보를 저장할 수 있다. 예를들면, Nintedanib은 다중 수용체 티로신 키나아제(RTKs)와 비 수용체 티로신 키나아제(nRTKs)를 표적으로하는 특발성 폐 섬유증(IPF)의 치료제로 사용되는 약물이다. Nintedanib은 혈소판 유래 성장 인자 수용체(PDGFR) 및, 섬유 아세포 성장 인자 수용체(FGFR), 혈관 내피 성장 인자 수용체(VEGFR) 및 Fms- 유사 티로신 키나아제 -3(FLT3) 등의 수용체의 아데노신 3 인산염(ATP) 결합 주머니에 경쟁적으로 결합하여 IPF 병리학의 필수 메커니즘을 나타내는 섬유 아세포의 증식, 이동 및 형질 전환에 중요한 세포 내 신호 전달을 차단한다. 또한, nintedanib은 nRTKs, Lck, Lyn 및 Src 키나아제를 억제하는데 이러한 내용이 약리활성-화합물 데이터베이스(101)에 저장될 수 있다. 물론, 여기서는 약리활성을 하나만 기재하였지만, 하나의 화합물은 복수의 약리활성을 가질 수 있다.
약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)를 이용하여 화합물의 개별 약리활성에 해당하는 빈도수를 도출하여 빈도표를 생성한다(S203).
예를들어, 약리활성 N1에 해당하는 화합물이 M1, M2, M3, 약리활성 N2에 해당하는 화합물이 M1, M3, M4, M5, 약리활성 N3에 해당하는 화합물이 M1, M2가 있다고 가정하면, M1의 약리활성 N1에 대한 빈도수는 1이 되고, M1이 나타나는 그 외의 약리활성은 N2, N3이므로, 그 외의 약리활성에 대한 빈도수는 2가 된다. 그리고 약리활성 N1이 나타나는 화합물은 M1, M2, M3이므로, 그 외의 화합물에 대한 약리활성 N1의 빈도수는 2가 된다. 이때, 하나의 화합물(M)은 n개의 약리활성(N1, ?, NK, K≥1)을 가질 수 있다. 이러한 방식으로, 천연물의 개별 약리활성 별로 해당하는 화합물의 빈도수를 반영한 약리활성-화합물 빈도표를 아래 표 1과 같이 정리할 수 있다. 빈도표는 2×2로 구현된다.
약리활성N1 그 외의 약리활성
화합물 M1 빈도수 a 빈도수 c a+c
그 외의 화합물 빈도수 b 빈도수 d b+d
a+b c+d a+b+c+d
이때, a는 표 1의 1행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 약리활성 N1의 특정 화합물 M1에 대한 빈도수를 의미하는 변수(variable)를 나타낸다.
b는 표 1의 2행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1을 제외한 나머지 화합물의 특정 약리활성 N1에 대한 빈도수를 의미하는 변수이다.
c는 표 1의 1행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1의 특정 약리활성 N1을 제외한 나머지 약리활성에 대한 빈도수를 의미하는 변수이다.
d는 표 1의 2행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1을 제외한 나머지 화합물의 특정 약리활성 N1을 제외한 나머지 약리활성에 대한 빈도수를 의미하는 변수이다.
이와 같은 방식으로, 약리활성 유사 화합물 발굴부(130)는 약리활성-화합물 데이터베이스(101)에 저장된 모든 약리활성과 화합물에 관하여 표 1과 같이 빈도표를 생성한다(S205).
약리활성 유사 화합물 발굴부(130)는 유의성 평가를 통해 빈도표에 포함된 약리활성별 화합물의 승산비를 도출(S207)하고 승산비에 기초하여 연관성을 평가한다(S209).
약리활성 유사 화합물 발굴부(130)는 S205 단계에서 생성된 빈도표들에 대하여 화합물이 해당 약리활성에 실제 유의한지 판단할 수 있는 기준으로 피셔의 정확 검정(fisher exact test)을 활용할 수 있다.
약리활성 유사 화합물 발굴부(130)는 승산비에 기초하여 화합물의 순위를 선정하고, 선정된 화합물들의 유의 확률(p-value)을 기반으로 특정 약리활성을 나타내는 화합물을 그룹핑(S211)하여 약리활성 유사도가 유의하다고 판단되는 화합물, 즉, 약리활성 유사 화합물을 발굴한다(S213).
여기서, 약리활성 유사 화합물 발굴부(130)가 약리활성과 화합물간의 유의성 평가를 수행하기 위하여 그려야 하는 초기하 분포(Hypergeometric distribution)는 표 1과 동일한 약리활성 N1 에 해당하는 화합물 M11의 빈도수를 가정할 때, 약리활성에 연관된 화합물이 다양한 경우에 따른 확률값의 분포이며, 구성하는 각 확률값은 아래 수학식 1과 같이 구할 수 있다.
Figure pat00001
여기서, a, b, c, d는 각각 표 1에서 해당 빈도수를 나타낸다.
약리활성 유사 화합물 발굴부(130)는 수학식 1을 통해 약리활성 별로 화합물의 승산비를 도출할 수 있다. 이러한 승산비는 복수개의 빈도표에 대해 각각 생성된다.
또한, 약리활성 유사 화합물 발굴부(130)는 복수개의 약리활성-화합물 빈도표를 구성하는 약리활성과 화합물 간의 유의성을 나타내고, 초기하 분포에 대한 빈도표의 우측 검정 유의 확률(p-value)을 다음 수학식 2를 통해 계산한다.
Figure pat00002
수학식 2에서 n은 0부터 a+b+c+d까지의 값을 가질 수 있다.
이때, 수학식 2에서 구한 유의 확률(p-value)에 대하여 임계값 0.05 이하의 값을 가지면, 약리활성 유사 화합물 발굴부(130)는 해당 화합물이 해당 약리활성에 유의하다고 판단한다. 예를들면, 표 1에 대한 유의성 검증값이 0.05 이하라면, 약리활성 유사 화합물 발굴부(130)는 화합물(M1)가 약리활성(N1)에 대해 유의하다고 판단한다.
약리활성 유사 화합물 발굴부(130)는 수학식 1에서 구한 승산비(OddsRatio)를 기준으로 특정 약리활성에 대한 하나 이상의 화합물의 순위를 선정한다. 예를들면, 승산비가 높을 수록 순위도 높게 선정될 수 있다.
약리활성 유사 화합물 발굴부(130)는 선정한 화합물들 중에서 유의 확률(p-value)이 0.05 이하인 화합물들, 즉, 특정 약리활성에 대해 유사도가 유의하다고 판단되는 화합물들을 추려낸다. 이렇게 추려낸 화합물들을 그 특정 약리활성을 나타내는 화합물로 그룹핑(S211)하고, 그룹 내 화합물들을 약리활성 유사 화합물로 발굴한다(S213).
도 5는 본 발명의 실시예에 따른 조각화 과정을 나타낸 순서도이고, 도 6은 본 발명의 실시예에 따른 조각화 과정을 설명하기 위한 개념도로서, 화합물 조각화부(105)의 동작을 나타낸다.
도 5를 참조하면, 화합물 조각화부(105)는 약리활성과 화합물간의 유의성 평가를 통해 유의하다고 판단된 약리활성 유사 화합물들을 약리활성 유사 화합물 발굴부(130)로부터 입력받는다(S301)
화합물 조각화부(105)는 화합물 조각화 기법을 이용하여 약리활성 유사 화합물을 최소 화학적 기능단위로 조각화하는데, 도 6과 같이 도식화할 수 있다. 도 6을 참조하면, 약리활성 유사 화합물1은 조각구조1과 조각구조2로 조각화될 수 있다. 이러한 도면은 조각화의 개념도로서, 실제 화합물 및 조각구조와는 다소 상이할 수 있다.
통상적으로, 유전체의 일부가 약물의 표적이 될 수 있는(druggable) 화합물이 'rule of 5'라는 기준을 따르듯이 '조각 구조(Fragmentation Structure)'는 'rule of 3(molecular weight < 300, ClogP < 3, the number of hydrogen bond donors and acceptors each should be < 3 and the number of rotatable bonds should be < 3)'를 따르는 것으로 알려져 있다. 본 발명의 실시예에서는, 디스커버리 스튜디오(Discovery Studio) 소프트웨어를 사용하여 조각 구조를 생성한다. 화합물 조각화부(105)는 5가지 항목(Rings, RingAssemblies, BridgeAssemblies, Chains, BemisMurckoAssemblies) 중에서 선택(S303, S307, S311, S315, S319)하여 조각화를 수행(S305, S309, S313, S317, S321)함으로써, 작용기 역할을 할 수 있는 구조 및 역할에 따라 다양한 조각 구조를 생성(S323)한다. 여기서, 5가지 항목, 즉, Rings, RingAssemblies, BridgeAssemblies, Chains, BemisMurckoAssemblies는 조각화 기법에 사용될 수 있는 조각화 단위로서, 연결 구조, 연결 형태 들을 달리하는 조각화 단위로 설명할 수 있다. 예를들면, RingAssemblies 조각화는 화합물을 RingAssemblies 단위로 조각화를 수행하는 것을 의미할 수 있다.
도 7은 본 발명의 실시예에 따른 신규 선도물질 후보로 제공할 조각구조를 추출하는 과정을 나타낸 순서도로서, 조각구조 발굴부(107) 및 선도물질 후보 제공부(109)의 동작을 나타낸다.
조각구조 발굴부(107)는 조각화를 통해 도출된 조각구조와, 해당하는 약리활성 화합물을 매핑(S401)하는데, 표 2와 같이 매핑할 수 있다.
표 2는 약리활성 화합물 조각구조와 약리활성 화합물 관계에 대한 연관 규칙 분석을 위한 목록을 예시한다.
순번(number) 항목(items)
1 조각구조1, 화합물2
2 조각구조1, 조각구조2, 화합물1
3 조각구조1, 화합물3
4 조각구조1, 화합물2, 화합물3
5 조각구조2, 화합물2
표 2에서 순번은 조각화 순번으로서, 예를들면, 순번 1은 첫번째 수행된 조각화를 나타내고, 순번 1에 해당하는 항목은 화합물2에 대해 조각화를 통해 도출된 조각구조 1을 의미한다. 이때, 각 순번 별로 조각화는 도 5에서 선택된 항목이 상이할 수 있다. 예를들면, 순번 1에서는 Rings 단위로 조각화를 하고, 순번 2에서는 BridgeAssemblies 단위로 조각화를 한 것일 수 있다.
조각구조 발굴부(107)는 약리활성 화합물 및 조각구조 간의 연관 규칙을 도출(S403)하고, 연관 규칙에 따라 연관도 점수를 산출한다(S405).
이때, 연관 규칙을 도출하기 위해서, 조각구조 발굴부(107)는 표 2에 기초하여 조각구조 별로 화합물에서의 발생 빈도를 표 3과 같이 동시 발생표로 나타낸다.
표 2에 따르면, 조각구조1과 화합물1의 동시 발생 빈도는 1이고, 화합물3와 조각구조1의 동시 발생 빈도는 2가 된다. 이러한 동시 발생 빈도를 표로 나타낸 것이 표 3이다. 표 3은 대칭 행렬의 모형을 보인다.
조각구조1 조각구조2 화합물1 화합물2 화합물3
조각구조1 4 1 1 2 2
조각구조2 1 2 1 1 0
화합물1 1 1 1 0 0
화합물2 2 1 0 3 1
화합물3 2 0 0 1 2
표 3에 따르면, 각각의 조각구조와 화합물이 몇 번이나 함께 도출되었는지 알 수 있다. 예를 들면, 조각구조1과 화합물2가 교차하는 값을 살펴보면 두 항목이 두 번 같이 발생되었음을 알 수 있다.
또한, 표 3에서 대각선 상의 자료 값은 바로 그 항목을 포함하는 총 발생 수ㅏ를 나타낸다. 예를 들면, 조각구조1과 조각구조1이 교차하는 항목에는 표 2에서 조각구조1이 총 발생한 빈도수가 기록되는데, 표 2의 순번 1, 2, 3, 4에서 총 4번 발생하였으므로, 동시 발생 빈도는 4이다. 그리고 조각구조2와 조각구조1이 교차하는 항목에는 조각구조2와 조각구조1이 동시에 발생한 빈도수가 기록되는데, 표 2의 순번 2에서 한번 발생하였으므로, 동시 발생 빈도는 1이다. 이러한 표 3을 통해 연관 규칙은, 지지도(Support), 신뢰도(Confidence), 향상도(Improvement)로 산출된다.
여기서, 지지도는 전체 중에서 조각구조(A)와 약리활성 화합물(성분)(B)를 함께 포함하는 사건에 대한 확률을 나타낸다. 이때, 확률값이 클수록 자주 발생하는 규칙이며, 규칙의 중요성에 대한 척도로 사용된다.
두 항목 A와 B의 지지도는 전체 발생항목 중 항목 A와 항목 B가 동시에 포함하는 발생의 비율을 나타내고, 수학식 3을 통해 산출될 수 있다.
Figure pat00003
또한, 신뢰도는 조각구조(A)가 있을때 약리활성 화합물(성분)(B)가 있을 확률 의미한다. 이때, 확률값이 클 수록 조각구조(A)가 있을시 약리활성 화합물(성분)(B)가 있을 확률이 높으며, 규칙의 신뢰성에 대한 척도로 사용되며, 수학식 4를 통해 산출될 수 있다.
Figure pat00004
또한, 향상도는 연관 규칙의 신뢰도와 지지도의 비율 도출되는 값으로서, 수학식 5를 통해 산출될 수 있다.
Figure pat00005
향상도는 항목 A가 주어지지 않았을 때의 항목 B의 확률 대비, 항목 A가 주어졌을 때의 항목 B의 확률의 증가 비율을 나타낸다. 이 값이 클 수록, 항목 A의 발생 여부가 항목 B의 발생 여부에 큰 영향을 미친다.
항목 A와 항목 B의 발생여부가 상호 관련이 없다면, P(
Figure pat00006
)와 P(B)가 같게 되어 향상도가 1이 된다. 어떤 규칙의 향상도가 1보다 크면, 이 규칙은 결과를 예측하는데 있어서 우연적 기회보다 우수하다는 것을 의미하고, 향상도가 1보다 작으면 이러한 규칙은 결과를 예측하는데 있어서 우연적 기회보다 나쁠 것이다.
이처럼, 조각구조 발굴부(107)는 표 3의 동시발생 빈도표로부터 연관 규칙을 생성하는데, 조각구조간, 화합물간, 조각구조와 화합물 간에 연관 규칙을 모두 생성한다. 그러나, 본 발명이 약리활성을 지닌 화합물들과 연관도가 높은 조각구조를 선도물질로 제시하고자 하므로, 화합물과 조각구조의 연관 규칙이 중요한 반면, 조각 구조 간의 연관규칙관계는 무의미하다.
조각구조 발굴부(107)는 생성된 연관 규칙들에 대해 지지도, 신뢰도, 향상도에 기초하여 최종적으로 연관도 점수가 높은 조각구조와 화합물을 선별한다.
이때, 조각구조 발굴부(107)는 지지도 및 신뢰도가 일정 기준값 이상이면, 의미 있는 연관 규칙으로 판단한다. 즉, 그 연관 규칙을 도출한 조각구조(A)와 약리활성 유사 화합물(B)는 연관된 것으로 판별한다. 그리고 판별된 연관 규칙 내의 향상도 점수로 최종 평가한다. 이때, 향상도가 1보다 클 경우, 예측도가 우수하다고 판단된다.
조각구조 발굴부(107)는 연관도 점수에 기초하여 약리활성 연관 주 조각구조 또는 공통된 조각구조와, 개별 조각구조가 조합된 조합 조각구조를 추출한다(S407). 예를들면, 약리활성 N1을 갖는 화합물 M1, 화합물 M2, 화합물 M3가 있을 때, 화합물 M1, 화합물 M2, 화합물 M3 각각의 조각구조들에 대해 표 3과 같이 빈도표를 구성하고, 이들 빈도표에 기초한 지지도, 신뢰도가 일정 기준값을 충족하고, 향상도 점수가 1보다 크면, 조각구조 발굴부(107)는 그 조각구조들을 약리활성 N1에 대하여 연관된 것으로 판단한다. 이때, 조각구조 발굴부(107)는 향상도 점수가 가장 높은 조각구조를 약리활성 N1에 대한 주 조각구조 또는 공통 조각구조로 추출할 수 있다. 또한, 조각구조 발굴부(107)는 향상도 점수가 1보다 큰 조각구조들을 약리활성 N1 에 대한 조합 조각구조로 추출할 수 있다.
선도물질 제공부(109)는 S407 단계에서 추출된 주 조각구조 및 조합 조각구조를 해당하는 연관된 약리활성 화합물과 함께 조각구조-화합물 데이터베이스(111)에 저장하고, 저장된 조각구조들을 신규 선도물질 후보로 제공한다(S409). 예를들면, 조각구조1은 약리활성 N1을 나타내는 주 신규 선도물질 후보로 제공될 수 있다. 또한, 조각구조1과 조각구조2는 약리활성 N1을 나타내는 조합 신규 선도물질 후보로 제공될 수 있다.
또한, 선도물질 제공부(109)는 향상도를 특정 약리활성에 대한 특정 조각구조의 예측도로 제공하여, 향상도를 기준으로 조각구조들의 특정 약리활성에 대한 예측도를 평가하기 위한 자료로 사용할 수 있다. 예를들면, 약리활성 N1에 대한 조각구조1의 향상도가 1.3이고, 약리활성 N1에 대한 조각구조2의 향상도가 1.5라면, 약리활성 N1에 대한 예측도는 조각구조2가 조각구조1보다 더 높다고 평가될 수 있다.
이와 같이, 약리활성 화합물들의 조각구조와 약리활성 화합물간의 연관 규칙 발견을 통해 약리활성과 구조가 유사한 화합물들이 갖는 공통 조각구조를 발굴하고, 결과를 통합하여 데이터베이스를 구축하여, 조각구조 그 자체로 신규 약물 선도물질 후보로 제공하고, 또한 그 조합을 통해 다양한 활성을 갖는 신약개발에 활용 될 수 있도록 제공할 수 있다. 이렇게 하면, 종래 기술의 문제점이자 한계점이었던 선도물질 발굴 과정에 필요한, 약리활성 화합물 확보 및 약효 시험 과정등과 같은 대단위의 비용과 시간이 소요되는 과정을 화합물과 약리활성의 정보가 수집 및 통합된 데이터베이스의 구축으로 해결할 수 있다. 또한, 화합물의 단순 조각화를 통해 도출된 조각구조들을 제한된 일부의 약효시험 과정을 거쳐 일부 약리활성 조각구조를 발굴하는 시도에서 발생하는 보다 중요한 조각구조를 찾는 과정이 빠져있는 단점을, 약리활성도가 유사한 화합물들로부터 유래된 조각구조를 이용하고 약리활성과 연관 관계 점수가 높은 최소 조각구조들을 발굴함으로써, 해결할 수 있다.
한편, 도 8은 본 발명의 또 다른 실시예에 따른 신규 선도물질 예측 시스템의 하드웨어 구성을 나타낸 블록도이다.
도 8을 참조하면, 신규 선도물질 예측 시스템(500)은 적어도 하나의 저장부(501), 적어도 하나의 출력부(503), 적어도 하나의 입력부(505), 적어도 하나의 통신부(507) 및 적어도 하나의 프로세서(509)를 포함하는 하드웨어로 구성된다. 신규 선도물질 예측 시스템(500)은 하드웨어와 결합하여 동작하는 운영체제, 미들웨어, 프로그램 등 각종 소프트웨어를 포함한다. 신규 선도물질 예측 시스템(500)의 하드웨어와 소프트웨어는 본 발명을 실행할 수 있는 구성과 성능을 가진다.
저장부(501)는 도 1 ~ 도 7에서 설명한 구성 및 방법을 구현하기 위한 프로그램을 저장한다. 저장부(501)는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함하고, 예를 들면 ROM(read only memory), RAM(random access memory), 자기디스크 저장 매체, 광저장 매체, 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함할 수 있다. 저장부(501)에 저장된 프로그램은 도 1 ~ 도 7에서 설명한 신규 선도물질 예측 시스템(500)의 동작을 구현한 명령어들(instructions)를 포함한다. 프로세서(509)는 프로그램을 로딩하여 본 발명에서 설명한 도 1 ~ 도 7에서 설명한 신규 선도물질 예측 시스템(500)의 동작을 수행한다.
출력부(503)는 프로세서(509)의 동작에 따른 정보를 화면에 출력하는데, 예를들면, 조각구조 및/또는 조각구조 조합을 신규 선도물질로 출력한다. 이때, 화면 상에 출력할 수도 있고, 인쇄물로 출력할 수도 있고, 사용자가 인지할 수 있는 다양한 방식으로 출력할 수 있다. 입력부(505)는 약리활성-화합물 데이터베이스(101)를 구축하는데 필요한 정보를 인터넷 상에서 수집하거나 또는 사용자로부터 입력받아 프로세서(509)로 출력한다.
통신부(507)는 통신망(300)에 연결되어 데이터 송수신 기능을 수행한다.
이때, 각 구성(501, 503, 505, 507)은 하나의 프로세서(509) 내에 탑재된 형태로 도시하였으나, 이는 각 구성(501, 503, 505, 507)이 프로세서 기반으로 동작하는 것을 의미하는 것으로, 하나의 프로세서(509)로 구현될 수도 있지만, 이더넷이나 네트워크를 통해 서로 연결된 별개의 서버로 구현될 수도 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (15)

  1. 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서,
    다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계,
    상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계,
    유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계,
    상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고
    선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계
    를 포함하는, 신규 선도물질 후보 예측 방법.
  2. 제1항에서,
    상기 그룹핑하는 단계는,
    모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)와, 통계적으로 유의미한지를 나타내는 유의 확률에 기초하여, 약리활성이 유사한 화합물들을 발굴하는, 신규 선도물질 후보 예측 방법.
  3. 제2항에서,
    상기 그룹핑하는 단계는,
    상기 승산비에 기초하여 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들 중에서 상기 유의 확률이 0.05 이하 이하인 화합물들을 해당 약리활성이 유사한 화합물로 발굴하는, 신규 선도물질 후보 예측 방법.
  4. 제1항에서,
    상기 선정하는 단계는,
    상기 그룹 내 모든 화합물과, 조각화를 통해 도출된 조각구조들 간에 발생 빈도수를 이용하여 특정 화합물과 특정 조각구조 간에 연관도 점수를 산출하고, 상기 연관도 점수가 기준값을 충족하는 조각구조와 화합물 쌍을 선정하는, 신규 선도물질 후보 예측 방법.
  5. 제4항에서,
    상기 연관도 점수는,
    상기 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들의 모든 발생 빈도 중에서 특정 조각구조와 특정 화합물이 동시에 발생할 확률을 나타내는 지지도,
    특정 조각구조가 발생할 때, 특정 화합물이 발생할 확률을 나타내는 신뢰도, 그리고
    상기 지지도와 신뢰도의 비율인 향상도를 포함하고,
    상기 선정하는 단계는,
    상기 지지도와 상기 신뢰도가 기준값을 충족하는 조각구조와 화합물 쌍 중에서 상기 향상도를 기준으로 특정 조각구조가 특정 화합물에 대해 유의미한 연관성이 있는지 평가하여, 유의미한 연관성이 있다고 판단된 적어도 하나의 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 선정하는, 신규 선도물질 후보 예측 방법.
  6. 제5항에서,
    상기 선정하는 단계는,
    상기 향상도가 1보다 큰 조각구조와 화합물 쌍은 유의미한 연관성이 있다고 평가하는, 신규 선도물질 후보 예측 방법.
  7. 제5항에서,
    상기 향상도는,
    특정 약리활성에 대한 신규 선도물질 후보의 예측 점수로 사용되는, 신규 선도물질 후보 예측 방법.
  8. 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서,
    통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계,
    상기 화합물들로부터 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고
    선정된 상기 적어도 하나의 특정 조각구조를 상기 약리활성에 대한 신규 선도물질 후보로 예측하는 단계
    를 포함하는, 신규 선도물질 후보 예측 방법.
  9. 제8항에서,
    상기 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들은,
    온라인 상의 공개 데이터베이스 및 공신력이 있는 자료들과, 사용자가 입력한 정보들로부터 다양한 약리활성과, 개별 약리활성을 가지는 화합물들로부터, 특정 약리활성과 특정 화합물간의 발생 빈도수에 기초하여 산출된 승산비와, 피셔의 정확 검증(fisher exact test)에 따른 유의 확률에 기초하여 선정되는, 신규 선도물질 후보 예측 방법.
  10. 제8항에서,
    상기 선정하는 단계는,
    특정 화합물과 특정 조각구조 간에 발생 빈도수를 이용하여 산출된 연관도 점수가 기준값을 충족하는 화합물과 조각구조 쌍들에 공통으로 포함된 적어도 하나의 특정 조각구조를 선정하는, 신규 선도물질 후보 예측 방법.
  11. 제10항에서,
    상기 선정하는 단계는,
    상기 약리활성을 가지는 모든 화합물들과 모든 조각구조들의 발생 빈도수와 특정 화합물과 특정 조각구조가 동시에 발생할 확률인 지지도와, 특정 조각구조가 발생할 때 특정 화합물이 발생할 확률인 신뢰도가 모두 기준값을 충족하고,
    상기 지지도와 상기 신뢰도의 비율인 향상도가 기 정의된 유의미한 척도를 만족하는 각각의 조각구조와 화합물 쌍들로부터 공통된 적어도 하나의 조각구조를 선정하는, 신규 선도물질 후보 예측 방법.
  12. 적어도 하나의 프로세서에 의해 동작하고, 신규 선도물질 후보를 예측하는 시스템으로서,
    외부 공개 자료 및 사용자가 입력한 자료로부터 수집한 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들로부터 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 약리활성 유사 화합물 발굴부,
    유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 화합물 조각화부,
    상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 조각구조 발굴부, 그리고
    선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 선도물질 후보 제공부
    를 포함하는, 신규 선도물질 후보 예측 시스템.
  13. 제12항에서,
    상기 약리활성 유사 화합물 발굴부는,
    모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)를 기준으로 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고,
    상기 순위가 선정된 화합물들중에서 통계적으로 유의미한지를 나타내는 유의 확률(p-value)이 기준값 이하인 화합물들을 선별하며,
    선별된 화합물들을 약리활성이 유사한 화합물들로 발굴하여, 그룹핑하는, 신규 선도물질 후보 예측 시스템.
  14. 제12항에서,
    상기 조각구조 발굴부는,
    유사 약리활성 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들 간에 동시 발생 빈도수에 기초하여 중요성의 척도로 사용되는 지지도, 신뢰성의 척도로 사용되는 신뢰도, 및 지지도와 신뢰도의 비율로 산출되는 향상도를 산출하고,
    상기 지지도, 상기 신뢰도 및 상기 향상도가 유의미한지 평가하여, 유의미한 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 발굴하는, 신규 선도물질 후보 예측 시스템.
  15. 제12항에서,
    상기 조각구조 발굴부가 출력하는 상기 공통된 적어도 하나의 조각구조와 화합물간의 정보를 저장하는 조각구조-화합물 데이터베이스, 그리고
    상기 조각구조-화합물 데이터베이스와 연결되고, 통신망을 통해 접속된 단말에게 상기 조각구조-화합물 데이터베이스로의 접근을 관리하는 사용자 인터페이스부
    를 더 포함하는, 신규 선도물질 후보 예측 시스템.
KR1020170079166A 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템 KR101995511B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170079166A KR101995511B1 (ko) 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170079166A KR101995511B1 (ko) 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20190000167A true KR20190000167A (ko) 2019-01-02
KR101995511B1 KR101995511B1 (ko) 2019-07-02

Family

ID=65021519

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170079166A KR101995511B1 (ko) 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101995511B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210026541A (ko) 2019-08-30 2021-03-10 주식회사 에일론 호몰로지를 이용한 인공신경망 기반 타겟 단백질의 화합물 활성 예측 시스템
KR20210026301A (ko) 2019-08-29 2021-03-10 (주)비아이매트릭스 딥러닝 기반 농산물 물동량 분배 의사결정 지원 시스템
KR20210026542A (ko) 2019-08-30 2021-03-10 주식회사 에일론 기하학적 이미지를 이용한 인공신경망 기반 단백질 결합 화합물의 생물학적 활성 예측 시스템
KR20210026543A (ko) 2019-08-30 2021-03-10 주식회사 에일론 복수의 인공신경망 모델 기반 단백질 결합 화합물의 활성 예측 시스템
KR20210027668A (ko) 2019-08-30 2021-03-11 주식회사 에일론 푸리에 디스크립터와 인공신경망을 이용한 타겟 단백질에 대한 화합물 활성 예측 시스템
KR20220107413A (ko) 2021-01-25 2022-08-02 주식회사 카이팜 화합물 활성 데이터 기반 약물 정보 추출 방법, 약물 탐색 라이브러리 구축 방법 및 분석장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240136757A (ko) 2023-03-07 2024-09-19 한국화학연구원 웹 기반 유기태양전지 데이터 통합 관리 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020028925A (ko) * 2002-01-08 2002-04-17 신환철 신약 개발을 위한 새로운 분자 설계방법
WO2005038618A2 (en) * 2003-10-14 2005-04-28 Verseon Lead molecule cross-reaction prediction and optimization system
US20110282910A1 (en) * 2010-01-29 2011-11-17 Cramer Richard D Template Constrained Fragment Alignment Used To Identify Fragments Of Similar Shape and Activity In Drug Development

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020028925A (ko) * 2002-01-08 2002-04-17 신환철 신약 개발을 위한 새로운 분자 설계방법
WO2005038618A2 (en) * 2003-10-14 2005-04-28 Verseon Lead molecule cross-reaction prediction and optimization system
US20110282910A1 (en) * 2010-01-29 2011-11-17 Cramer Richard D Template Constrained Fragment Alignment Used To Identify Fragments Of Similar Shape and Activity In Drug Development

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
정보과학회지 31(8), 이지영 외 3명. 컴퓨터를 이용한 신약개발, 향후 기술 전망. (2013.08.)* *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210026301A (ko) 2019-08-29 2021-03-10 (주)비아이매트릭스 딥러닝 기반 농산물 물동량 분배 의사결정 지원 시스템
KR20210026541A (ko) 2019-08-30 2021-03-10 주식회사 에일론 호몰로지를 이용한 인공신경망 기반 타겟 단백질의 화합물 활성 예측 시스템
KR20210026542A (ko) 2019-08-30 2021-03-10 주식회사 에일론 기하학적 이미지를 이용한 인공신경망 기반 단백질 결합 화합물의 생물학적 활성 예측 시스템
KR20210026543A (ko) 2019-08-30 2021-03-10 주식회사 에일론 복수의 인공신경망 모델 기반 단백질 결합 화합물의 활성 예측 시스템
KR20210027668A (ko) 2019-08-30 2021-03-11 주식회사 에일론 푸리에 디스크립터와 인공신경망을 이용한 타겟 단백질에 대한 화합물 활성 예측 시스템
KR20220107413A (ko) 2021-01-25 2022-08-02 주식회사 카이팜 화합물 활성 데이터 기반 약물 정보 추출 방법, 약물 탐색 라이브러리 구축 방법 및 분석장치

Also Published As

Publication number Publication date
KR101995511B1 (ko) 2019-07-02

Similar Documents

Publication Publication Date Title
KR101995511B1 (ko) 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템
Xue et al. Review of drug repositioning approaches and resources
Hofmarcher et al. Large-scale ligand-based virtual screening for SARS-CoV-2 inhibitors using deep neural networks
Willett Similarity-based virtual screening using 2D fingerprints
Dreiman et al. Changing the HTS paradigm: AI-driven iterative screening for hit finding
Micheletti et al. Recurrent oligomers in proteins: an optimal scheme reconciling accurate and concise backbone representations in automated folding and design studies
Vogt et al. Scaffold hopping using two-dimensional fingerprints: true potential, black magic, or a hopeless endeavor? Guidelines for virtual screening
Yan et al. Chemical structure similarity search for ligand-based virtual screening: methods and computational resources
Hu et al. Exploring compound promiscuity patterns and multi-target activity spaces
KR101963331B1 (ko) 인체 대사 물질과의 유사도 기반 약물 재창출 후보 예측 방법 및 그 시스템
Atomwise AIMS Program izhar@ atomwise. com Wallach Izhar 2 Bernard Denzil 2 Nguyen Kong 2 Ho Gregory 2 Morrison Adrian 2 Stecula Adrian 2 Rosnik Andreana 2 O’Sullivan Ann Marie 2 Davtyan Aram 2 Samudio Ben 2 Thomas Bill 2 Worley Brad 2 Butler Brittany 2 Laggner Christian 2 Thayer Desiree 2 Moharreri Ehsan 2 Friedland Greg 2 Truong Ha 2 van den Bedem Henry 2 Ng Ho Leung 2 Stafford Kate 2 Sarangapani Krishna 2 Giesler Kyle 2 Ngo Lien 2 Mysinger Michael 2 Ahmed Mostafa 2 Anthis Nicholas J. 2 Henriksen Niel 2 Gniewek Pawel 2 Eckert Sam 2 de Oliveira Saulo 2 Suterwala Shabbir 2 PrasadPrasad Srimukh Veccham Krishna 2 Shek Stefani 2 Contreras Stephanie 2 Hare Stephanie 2 Palazzo Teresa 2 O’Brien Terrence E. 2 Van Grack Tessa 2 Williams Tiffany 2 Chern Ting-Rong 2 Kenyon Victor 2 Lee Andreia H. 3 Cann Andrew B. 4 Bergman Bastiaan 5 Anderson Brandon M. 6 Cox Bryan D. 7 Warrington Jeffrey M. 8 Sorenson Jon M. 9 Goldenberg Joshua M. 10 Young Matthew A. 11 DeHaan Nicholas 12 Pemberton Ryan P. 13 Schroedl Stefan 14 Abramyan Tigran M. 11 15 Gupta Tushita 16 Mysore Venkatesh 17 Presser Adam G. 18 Ferrando Adolfo A. 19 Andricopulo Adriano D. 20 Ghosh Agnidipta 21 Ayachi Aicha Gharbi 22 Mushtaq Aisha 23 Shaqra Ala M. 24 Toh Alan Kie Leong 25 Smrcka Alan V. 26 Ciccia Alberto 27 de Oliveira Aldo Sena 28 Sverzhinsky Aleksandr 29 de Sousa Alessandra Mara 30 Agoulnik Alexander I. 31 Kushnir Alexander 32 Freiberg Alexander N. 33 Statsyuk Alexander V. 34 Gingras Alexandre R. 35 Degterev Alexei 36 Tomilov Alexey 37 Vrielink Alice 38 Garaeva Alisa A. 39 Bryant-Friedrich Amanda 40 Caflisch Amedeo 41 Patel Amit K. 35 Rangarajan Amith Vikram 42 Matheeussen An 43 Battistoni Andrea 44 Caporali Andrea 45 Chini Andrea 46 Ilari Andrea 47 Mattevi Andrea 48 Foote Andrea Talbot 49 Trabocchi Andrea 50 Stahl Andreas 51 Herr Andrew B. 52 Berti Andrew 40 Freywald Andrew 53 Reidenbach Andrew G. 54 Lam Andrew 55 Cuddihy Andrew R. 56 White Andrew 57 Taglialatela Angelo 19 Ojha Anil K. 58 Cathcart Ann M. 59 Motyl Anna AL 45 Borowska Anna 39 D’Antuono Anna 60 Hirsch Anna KH 61 Porcelli Anna Maria 62 Minakova Anna 48 Montanaro Anna 60 Müller Anna 41 Fiorillo Annarita 63 Virtanen Anniina 64 O’Donoghue Anthony J. 35 Del Rio Flores Antonio 51 Garmendia Antonio E. 65 Pineda-Lucena Antonio 66 Panganiban Antonito T. 67 Samantha Ariela 38 Chatterjee Arnab K. 68 Haas Arthur L. 69 Paparella Ashleigh S. 21 John Ashley L. St. 70 Prince Ashutosh 71 ElSheikh Assmaa 72 Apfel Athena Marie 57 Colomba Audrey 73 O’Dea Austin 74 Diallo Bakary N’tji 75 Ribeiro Beatriz Murta Rezende Moraes 76 Bailey-Elkin Ben A. 77 Edelman Benjamin L. 78 Liou Benjamin 52 Perry Benjamin 79 Chua Benjamin Soon Kai 80 Kováts Benjámin 81 Englinger Bernhard 59 Balakrishnan Bijina 82 Gong Bin 33 Agianian Bogos 21 Pressly Brandon 37 Salas Brenda P. Medellin 83 Duggan Brendan M. 35 Geisbrecht Brian V. 84 Dymock Brian W. 85 Morten Brianna C. 85 Hammock Bruce D. 37 Mota Bruno Eduardo Fernandes 76 Dickinson Bryan C. 86 Fraser Cameron 87 Lempicki Camille 88 Novina Carl D. 89 Torner Carles 90 Ballatore Carlo 35 Bon Carlotta 91 Chapman Carly J. 92 Partch Carrie L. 93 Chaton Catherine T. 94 Huang Chang 65 Yang Chao-Yie 95 Kahler Charlene M. 38 Karan Charles 27 Keller Charles 96 Dieck Chelsea L. 97 Huimei Chen 70 Liu Chen 98 Peltier Cheryl 77 Mantri Chinmay Kumar 70 Kemet Chinyere Maat 55 Müller Christa E. 99 Weber Christian 100 Zeina Christina M. 59 Muli Christine S. 101 Morisseau Christophe 37 Alkan Cigdem 33 Reglero Clara 19 Loy Cody A. 101 Wilson Cornelia M. 102 Myhr Courtney 31 Arrigoni Cristina 48 Paulino Cristina 39 Santiago César 103 Luo Dahai 22 Tumes Damon J. 104 Keedy Daniel A. 105 Lawrence Daniel A. 57 Chen Daniel 106 Manor Danny 71 Trader Darci J. 101 Hildeman David A. 52 Drewry David H. 107 Dowling David J. 108 Hosfield David J. 86 Smith David M. 109 Moreira David 110 Siderovski David P. 111 Shum David 112 Krist David T. 113 Riches David WH 78 Ferraris Davide Maria 114 Anderson Deborah H. 115 Coombe Deirdre R. 116 Welsbie Derek S. 35 Hu Di 71 Ortiz Diana 117 Alramadhani Dina 118 Zhang Dingqiang 119 Chaudhuri Dipayan 82 Slotboom Dirk J. 39 Ronning Donald R. 120 Lee Donghan 121 Dirksen Dorian 122 Shoue Douglas A. 123 Zochodne Douglas William 124 Krishnamurthy Durga 52 Duncan Dustin 125 Glubb Dylan M. 92 Gelardi Edoardo Luigi Maria 126 Hsiao Edward C. 127 Lynn Edward G. 128 Silva Elany Barbosa 129 Aguilera Elena 130 Lenci Elena 50 Abraham Elena Theres 131 Lama Eleonora 62 Mameli Eleonora 45 Leung Elisa 125 Giles Ellie 102 Christensen Emily M. 132 Mason Emily R. 133 Petretto Enrico 70 Trakhtenberg Ephraim F. 134 Rubin Eric J. 18 Strauss Erick 135 Thompson Erik W. 25 Cione Erika 136 Lisabeth Erika Mathes 137 Fan Erkang 138 Kroon Erna Geessien 76 Jo Eunji 112 García-Cuesta Eva M. 103 Glukhov Evgenia 35 Gavathiotis Evripidis 21 Yu Fang 139 Xiang Fei 140 Leng Fenfei 141 Wang Feng 142 Ingoglia Filippo 82 van den Akker Focco 71 Borriello Francesco 143 Vizeacoumar Franco J. 144 Luh Frank 145 Buckner Frederick S. 138 Vizeacoumar Frederick S. 53 Bdira Fredj Ben 146 Svensson Fredrik 73 Rodriguez G. Marcela 147 Bognár Gabriella 81 Lembo Gaia 148 Zhang Gang 149 Dempsey Garrett 51 Eitzen Gary 150 Mayer Gaétan 151 Greene Geoffrey L. 86 Garcia George A. 57 Lukacs Gergely L. 152 Prikler Gergely 81 Parico Gian Carlo G. 93 Colotti Gianni 47 De Keulenaer Gilles 153 Cortopassi Gino 37 Roti Giovanni 60 Girolimetti Giulia 62 Fiermonte Giuseppe 154 Gasparre Giuseppe 155 Leuzzi Giuseppe 19 Dahal Gopal 156 Michlewski Gracjan 157 158 Conn Graeme L. 159 Stuchbury Grant David 85 Bowman Gregory R. 160 Popowicz Grzegorz Maria 161 Veit Guido 152 de Souza Guilherme Eduardo 20 Akk Gustav 162 Caljon Guy 43 Alvarez Guzmán 163 Rucinski Gwennan 164 Lee Gyeongeun 112 Cildir Gökhan 165 Li Hai 27 Breton Hairol E. 166 Jafar-Nejad Hamed 167 Zhou Han 168 Moore Hannah P. 169 Tilford Hannah 164 Yuan Haynes 170 Shim Heesung 37 Wulff Heike 37 Hoppe Heinrich 75 Chaytow Helena 45 Tam Heng-Keat 171 Van Remmen Holly 172 Xu Hongyang 173 Debonsi Hosana Maria 174 Lieberman Howard B. 27 Jung Hoyoung 175 Fan Hua-Ying 176 Feng Hui 55 Zhou Hui 19 Kim Hyeong Jun 177 Greig Iain R. 178 Caliandro Ileana 179 Corvo Ileana 180 Arozarena Imanol 181 Mungrue Imran N. 182 Verhamme Ingrid M. 183 Qureshi Insaf Ahmed 184 Lotsaris Irina 185 Cakir Isin 57 Perry J. Jefferson P. 194 Kwiatkowski Jacek 85 Boorman Jacob 71 Ferreira Jacob 187 Fries Jacob 188 Kratz Jadel Müller 79 Miner Jaden 82 Siqueira-Neto Jair L. 35 Granneman James G. 189 Ng James 164 Shorter James 160 Voss Jan Hendrik 99 Gebauer Jan M. 131 Chuah Janelle 109 Mousa Jarrod J. 190 Maynes Jason T. 191 Evans Jay D. 192 Dickhout Jeffrey 193 MacKeigan Jeffrey P. 137 Jossart Jennifer N. 194 Zhou Jia 33 Lin Jiabei 160 Xu Jiake 195 Wang Jianghai 145 Zhu Jiaqi 196 Liao Jiayu 194 Xu Jingyi 194 Zhao Jinshi 197 Lin Jiusheng 198 Lee Jiyoun 199 Reis Joana 48 Stetefeld Joerg 77 Bruning John B. 200 Bruning John Burt 80 Coles John G. 201 Tanner John J. 166 Pascal John M. 29 So Jonathan 59 Pederick Jordan L. 80 Costoya Jose A. 110 Rayman Joseph B. 19 Maciag Joseph J. 52 Nasburg Joshua Alexander 37 Gruber Joshua J. 202 Finkelstein Joshua M. 55 Watkins Joshua 164 Rodríguez-Frade José Miguel 203 Arias Juan Antonio Sanchez 204 Lasarte Juan José 205 Oyarzabal Julen 204 Milosavljevic Julian 88 Cools Julie 153 Lescar Julien 22 Bogomolovas Julijus 35 Wang Jun 147 Kee Jung-Min 175 Kee Jung-Min 177 Liao Junzhuo 206 Sistla Jyothi C. 118 Abrahão Jônatas Santos 76 Sishtla Kamakshi 207 Francisco Karol R. 35 Hansen Kasper B. 208 Molyneaux Kathleen A. 71 Cunningham Kathryn A. 33 Martin Katie R. 137 Gadar Kavita 209 Ojo Kayode K. 138 Wong Keith S. 125 Wentworth Kelly L. 127 Lai Kent 82 Lobb Kevin A. 75 Hopkins Kevin M. 27 Parang Keykavous 210 Machaca Khaled 211 Pham Kien 98 Ghilarducci Kim 212 Sugamori Kim S. 125 McManus Kirk James 77 Musta Kirsikka 64 Faller Kiterie ME 45 Nagamori Kiyo 96 Mostert Konrad J. 135 Korotkov Konstantin V. 94 Liu Koting 213 Smith Kristiana S. 214 Sarosiek Kristopher 215 Rohde Kyle H. 216 Kim Kyu Kwang 217 Lee Kyung Hyeon 218 Pusztai Lajos 98 Lehtiö Lari 219 Haupt Larisa M. 25 Cowen Leah E. 125 Byrne Lee J. 102 Su Leila 145 Wert-Lamas Leon 89 Puchades-Carrasco Leonor 220 Chen Lifeng 86 Malkas Linda H. 186 Zhuo Ling 221 Hedstrom Lizbeth 222 Hedstrom Lizbeth 222 Walensky Loren D. 59 Antonelli Lorenzo 63 Iommarini Luisa 62 Whitesell Luke 125 Randall Lía M. 223 Fathallah M. Dahmani 224 Nagai Maira Harume 197 Kilkenny Mairi Louise 225 Ben-Johny Manu 19 Lussier Marc P. 212 Windisch Marc P. 112 Lolicato Marco 48 Lolli Marco Lucio 179 Vleminckx Margot 43 Caroleo Maria Cristina 226 Macias Maria J. 90 Valli Marilia 20 Barghash Marim M. 125 Mellado Mario 203 Tye Mark A. 227 Wilson Mark A. 198 Hannink Mark 228 Ashton Mark R. 85 Cerna Mark Vincent C. dela 121 Giorgis Marta 179 Safo Martin K. 118 Maurice Martin St. 229 McDowell Mary Ann 123 Pasquali Marzia 82 Mehedi Masfique 230 Serafim Mateus Sá Magalhães 76 Soellner Matthew B. 57 Alteen Matthew G. 231 Champion Matthew M. 123 Skorodinsky Maxim 232 O’Mara Megan L. 233 Bedi Mel 40 Rizzi Menico 114 Levin Michael 119 Mowat Michael 234 Jackson Michael R. 235 Paige Mikell 218 Al-Yozbaki Minnatallah 102 Giardini Miriam A. 129 Maksimainen Mirko M. 219 De Luise Monica 62 Hussain Muhammad Saddam 207 Christodoulides Myron 164 Stec Natalia 157 Zelinskaya Natalia 159 Van Pelt Natascha 43 Merrill Nathan M. 57 Singh Nathanael 105 Kootstra Neeltje A. 236 Singh Neeraj 237 Gandhi Neha S. 25 Chan Nei-Li 213 Trinh Nguyen Mai 22 Schneider Nicholas O. 229 Matovic Nick 85 Horstmann Nicola 238 Longo Nicola 82 Bharambe Nikhil 22 Rouzbeh Nirvan 208 Mahmoodi Niusha 21 Gumede Njabulo Joyfull 239 Anastasio Noelle C. 33 Khalaf Noureddine Ben 224 Rabal Obdulia 204 Kandror Olga 215 Escaffre Olivier 33 Silvennoinen Olli 64 Bishop Ozlem Tastan 75 Iglesias Pablo 110 Sobrado Pablo 240 Chuong Patrick 241 O’Connell Patrick 137 Martin-Malpartida Pau 90 Mellor Paul 53 Fish Paul V. 73 Moreira Paulo Otávio Lourenço 30 Zhou Pei 197 Liu Pengda 107 Liu Pengda 107 Wu Pengpeng 242 Agogo-Mawuli Percy 111 Jones Peter L. 243 Ngoi Peter 93 Toogood Peter 57 Ip Philbert 125 von Hundelshausen Philipp 100 Lee Pil H. 57 Rowswell-Turner Rachael B. 217 Balaña-Fouce Rafael 244 Rocha Rafael Eduardo Oliveira 76 Guido Rafael VC 20 Ferreira Rafaela Salgado 76 Agrawal Rajendra K. 58 Harijan Rajesh K. 21 Ramachandran Rajesh 245 Verma Rajkumar 246 Singh Rakesh K. 247 Tiwari Rakesh Kumar 248 Mazitschek Ralph 227 Koppisetti Rama K. 166 Dame Remus T. 146 Douville Renée N. 249 Austin Richard C. 193 Taylor Richard E. 123 Moore Richard G. 217 Ebright Richard H. 147 Angell Richard M. 73 Yan Riqiang 237 Kejriwal Rishabh 65 Batey Robert A. 125 Blelloch Robert 127 Vandenberg Robert J. 185 Hickey Robert J. 186 Kelm Robert J. Jr. 49 Lake Robert J. 176 Bradley Robert K. 250 Blumenthal Robert M. 106 Solano Roberto 46 Gierse Robin Matthias 251 Viola Ronald E. 156 McCarthy Ronan R. 209 Reguera Rosa Maria 244 Uribe Ruben Vazquez 252 do Monte-Neto Rubens Lima 30 Gorgoglione Ruggiero 154 Cullinane Ryan T. 222 Katyal Sachin 170 Hossain Sakib 105 Phadke Sameer 57 Shelburne Samuel A. 238 Geden Sandra E. 216 Johannsen Sandra 61 Wazir Sarah 219 Legare Scott 77 Landfear Scott M. 117 Radhakrishnan Senthil K. 118 Ammendola Serena 44 Dzhumaev Sergei 253 Seo Seung-Yong 140 Li Shan 142 Zhou Shan 167 Chu Shaoyou 133 Chauhan Shefali 254 Maruta Shinsaku 255 256 Ashkar Shireen R. 57 Shyng Show-Ling 117 Conticello Silvestro G. 148 256 Buroni Silvia 48 Garavaglia Silvia 114 White Simon J. 65 Zhu Siran 157 158 Tsimbalyuk Sofiya 257 Chadni Somaia Haque 141 Byun Soo Young 112 Park Soonju 112 Xu Sophia Q. 258 Banerjee Sourav 259 Zahler Stefan 221 Espinoza Stefano 91 Gustincich Stefano 91 Sainas Stefano 179 Celano Stephanie L. 137 Capuzzi Stephen J. 107 Waggoner Stephen N. 52 Poirier Steve 260 Olson Steven H. 235 Marx Steven O. 261 Van Doren Steven R. 166 Sarilla Suryakala 183 Brady-Kalnay Susann M. 71 Dallman Sydney 230 Azeem Syeda Maryam 105 Teramoto Tadahisa 262 Mehlman Tamar 105 Swart Tarryn 75 Abaffy Tatjana 263 Akopian Tatos 215 Haikarainen Teemu 64 Moreda Teresa Lozano 264 Ikegami Tetsuro 33 Teixeira Thaiz Rodrigues 174 Jayasinghe Thilina D. 120 Gillingwater Thomas H. 45 Kampourakis Thomas 265 Richardson Timothy I. 207 Herdendorf Timothy J. 84 Kotzé Timothy J. 135 O’Meara Timothy R. 266 Corson Timothy W. 207 Hermle Tobias 88 Ogunwa Tomisin Happy 255 Lan Tong 86 Su Tong 228 Banjo Toshihiro 267 O’Mara Tracy A. 92 Chou Tristan 42 Chou Tsui-Fen 142 Baumann Ulrich 131 Desai Umesh R. 118 Pai Vaibhav P. 119 Thai Van Chi 38 Tandon Vasudha 259 Banerji Versha 77 Robinson Victoria L. 65 Gunasekharan Vignesh 168 Namasivayam Vigneshwaran 99 Segers Vincent FM 43 Maranda Vincent 53 Dolce Vincenza 136 Maltarollo Vinícius Gonçalves 76 Scoffone Viola Camilla 48 Woods Virgil A. 105 Ronchi Virginia Paola 268 Van Hung Le Vuong 269 Clayton W. Brent 101 Lowther W. Todd 270 Houry Walid A. 125 Li Wei 271 Tang Weiping 206 Zhang Wenjun 51 Van Voorhis Wesley C. 138 Donaldson William A. 229 Hahn William C. 59 Kerr William G. 272 Gerwick William H. 129 Bradshaw William J. 273 Foong Wuen Ee 274 Blanchet Xavier 275 Wu Xiaoyang 86 Lu Xin 123 Qi Xin 245 Xu Xin 84 Yu Xinfang 167 Qin Xingping 276 Wang Xingyou 222 Yuan Xinrui 95 Zhang Xu 277 Zhang Yan Jessie 83 Hu Yanmei 147 Aldhamen Yasser Ali 137 Chen Yicheng 71 Li Yihe 71 Sun Ying 52 Zhu Yini 123 Gupta Yogesh K. 278 Pérez-Pertejo Yolanda 244 Li Yong 167 Tang Young 65 He Yuan 40 Tse-Dinh Yuk-Ching 141 Sidorova Yulia A. 279 Yen Yun 145 Li Yunlong 280 Frangos Zachary J. 281 Chung Zara 22 Su Zhengchen 33 Wang Zhenghe 71 Zhang Zhiguo 27 Liu Zhongle 125 Inde Zintis 215 Artía Zoraima 163 Heifets Abraham 2 AI is a viable alternative to high throughput screening: a 318-target study
Steindl et al. High-throughput structure-based pharmacophore modelling as a basis for successful parallel virtual screening
Shanmugasundaram et al. Hit-directed nearest-neighbor searching
Willett A bibliometric analysis of the Journal of Molecular Graphics and Modelling
Ciriaco et al. Quantitative polypharmacology profiling based on a multifingerprint similarity predictive approach
Montanari et al. Virtual screening of DrugBank reveals two drugs as new BCRP inhibitors
Warchal et al. Evaluation of machine learning classifiers to predict compound mechanism of action when transferred across distinct cell lines
Hao et al. Web search and data mining of natural products and their bioactivities in PubChem
JP2006146380A (ja) 化合物の機能予測方法及び機能予測システム
US12061613B2 (en) System and method for evaluating chemical compound data using and applying a virtual landscape
Doctor et al. The apoptosis database
Sciabola et al. Critical Assessment of State‐of‐the‐Art Ligand‐Based Virtual Screening Methods
Ashenden Screening library design
Mendoza et al. Reducing hardware hit by queries in web search engines
Machado et al. Ranking the scientific output of researchers in fractional calculus

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20170622

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20181211

Patent event code: PE09021S01D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20190326

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20190626

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20190626

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20220607

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20240527

Start annual number: 6

End annual number: 6