KR20190000167A - 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템 - Google Patents

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템 Download PDF

Info

Publication number
KR20190000167A
KR20190000167A KR1020170079166A KR20170079166A KR20190000167A KR 20190000167 A KR20190000167 A KR 20190000167A KR 1020170079166 A KR1020170079166 A KR 1020170079166A KR 20170079166 A KR20170079166 A KR 20170079166A KR 20190000167 A KR20190000167 A KR 20190000167A
Authority
KR
South Korea
Prior art keywords
compounds
compound
pharmacological activity
fragment
candidate
Prior art date
Application number
KR1020170079166A
Other languages
English (en)
Other versions
KR101995511B1 (ko
Inventor
이관수
이보아
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020170079166A priority Critical patent/KR101995511B1/ko
Publication of KR20190000167A publication Critical patent/KR20190000167A/ko
Application granted granted Critical
Publication of KR101995511B1 publication Critical patent/KR101995511B1/ko

Links

Images

Classifications

    • G06F19/704
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • G06F19/707
    • G06F19/709
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템이 제공된다. 이 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계, 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.

Description

유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING NEW DRUG LEAD COMPOUND CANDIDATE BY APPLYING ASSOCIATION RULES BETWEEN PHARMACOLOGICALLY ACTIVE SIMILAS COMPOUNDS AND THEIR FRAGMENTS}
본 발명은 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템에 관한 것이다.
선도물질 발굴과정(lead generation)은 새로운 약물의 개발을 위한 기초연구부터 임상 그리고 허가에 이르는 여러 단계의 신약개발 사슬에서 중요한 단계이며 고품질의 선도물질은 임상 성공을 위한 기초를 다져주는 출발점이다.
신약개발은 일반적으로 개발하고자 하는 질병의 타깃 선정으로 시작되고 알려진 화합물을 스크리닝하고, 초기 선도물질을 고르고 검증하고, 간단한 최적화 과정을 거처서 선도물질을 선정하게 된다. 선정된 선도물질은 의약화학의 여러가지 방법을 통하여 1년 이상의 최적화 과정을 통하여 후보물질로 만들어지고 임상실험에 사용된다. 이러한 이유로 선도물질의 선정과정은 후보물질의 임상에서의 약리활성 및 독성에 관계되는 화합물의 구조적 특성의 출발점이고, 신약개발 사슬에서 중요한 단계이다.
최근에는 조각구조가 선도물질이 되어, 이를 기반으로 한 약물발견 및 가상 스크리닝이 사용되고 있고, 작은 규모의 화합물로도 시작이 가능하여 신약 개발 단계에서 널리 이용될 것이다.
선도물질 발굴에 해당하는 종래기술은, 천연물을 이용한 신약발굴 과정에서 살펴 볼 수 있다. 이러한 천연물 유래의 많은 활성물질 내의 공통 구조를 선도물질로 하여 합성을 통한 신약개발 발굴 과정은, 일반적으로 하나의 천연물 소재로부터 추출된, 대량의 천연물 화합물의 약효 스크리닝 과정부터 출발한다. 스크리닝 과정을 통해 도출해낸 초기 약리활성을 지니는 공통 구조를 선도물질로 하여, 구조적으로 유사한 화합물이나 유도체를 합성하여 보다 약리활성도를 증가시키며 독성이나 부작용을 줄이고 체내 약물 전달 시스템의 문제를 해결하는 과정을 거친다.
이러한 천연물 화합물의 약효 스크리닝 과정은 근본적인 경험적 방법으로서 결과에 대한 사전 예측 없이 진행되기 때문에 새로운 선도물질을 도출할 수 있다는 장점이 있다. 반면, 약효시험 비용이나 화합물 확보 및 관리비용 측면에서 막대한 비용과 시간이 필요하다는 문제점이 있다.
또한, 다중 스크리닝법을 통한 선도물질의 발굴과정이 있다. 현재 세계적으로, 우수한 선도물질을 잘 고르기 위하여 기술혁신 및 다양성 기반 연구가 진행되고 있다. 특히, 고속 다중 스크리닝법을 통하여 스크리닝 할 수 있는 물질의 수가 획기적으로 증가하자, 회사들은 새로운 선도물질을 확보하기 위하여, 전 세계의 화학자들에게 접근하여 합성 화합물들을 저가에 구입하려는 시도를 하였다. 다양한 화합물 라이브러리를 최대한 확보하고자, 화합물의 다양성을 획기적으로 개선할 것을 목표로 대대적으로 투자하였다.
그러나 실제로 응용할 수 있는 합성 방법이 제한되어 있고, 따라서 얻어지는 물질의 수에 비해서 그 다양성은 실제로 감소하는 경향이 있어, 결과적으로 초기비용을 더 지불해야 하는 상황을 초래하였다.
또한, 고속 다중 스크리닝법에 비교하여 낮은 분자량을 갖는 양질의 조각구조를 X-레이 구조결정학이나 핵자기 공명 기술을 사용하여 도출하는 방법이 있다. 그러나 이러한 선도물질 도출방법 또한 시간적으로나 비용적으로 탐색 비용이 매우 높다.
또한, 화합물의 단순 조각화를 통해 도출된 조각구조들을 약효시험 과정을 거쳐 일부 약리활성 조각구조를 발굴하는 시도도 있었으나, 이는 보다 중요한 조각구조를 찾는 과정이 빠져있는 단점이 있다.
실제로 새로운 혁신 신약을 개발하기 위해서는 신약으로 개발할 가능성이 높은 선도물질의 선정이 중요하다. 그러나, 전술한 바와 같이, 대부분의 종래기술들은 약리활성을 갖는 다양한 최소 단위의 구조를 발굴하기까지, 대단위의 약리활성 화합물 및 약효 시험 비용을 비롯하여, 후보 탐색을 위한 전처리 과정에 소요되는 비용과 시간이 막대하다는 문제가 있다.
본 발명이 해결하고자 하는 과제는 약리활성 유사도에 따라 그룹핑된 약리활성을 갖는 화합물에 대해 화합물 조각화 기법을 이용하여 그룹 내 약리활성 유사 화합물들을 최소 화학적 기능 단위로 조각화하고, 연관 규칙 출원 기법을 이용하여 조각구조와 약리활성의 연관도 점수를 도출한 후, 신약개발에 있어 선도물질로 제시 가능한 약리활성을 나타내는 최적의 조각구조를 발굴하는 방법 및 이를 수행하는 시스템을 제공하는 것이다.
본 발명의 하나의 특징에 따르면, 신규 선도물질 후보 예측 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계, 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.
상기 그룹핑하는 단계는, 모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)와, 통계적으로 유의미한지를 나타내는 유의 확률에 기초하여, 약리활성이 유사한 화합물들을 발굴할 수 있다.
상기 그룹핑하는 단계는, 상기 승산비에 기초하여 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들 중에서 상기 유의 확률이 0.05 이하 이하인 화합물들을 해당 약리활성이 유사한 화합물로 발굴할 수 있다.
상기 선정하는 단계는, 상기 그룹 내 모든 화합물과, 조각화를 통해 도출된 조각구조들 간에 발생 빈도수를 이용하여 특정 화합물과 특정 조각구조 간에 연관도 점수를 산출하고, 상기 연관도 점수가 기준값을 충족하는 조각구조와 화합물 쌍을 선정할 수 있다.
상기 연관도 점수는, 상기 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들의 모든 발생 빈도 중에서 특정 조각구조와 특정 화합물이 동시에 발생할 확률을 나타내는 지지도, 특정 조각구조가 발생할 때, 특정 화합물이 발생할 확률을 나타내는 신뢰도, 그리고 상기 지지도와 신뢰도의 비율인 향상도를 포함하고, 상기 선정하는 단계는, 상기 지지도와 상기 신뢰도가 기준값을 충족하는 조각구조와 화합물 쌍 중에서 상기 향상도를 기준으로 특정 조각구조가 특정 화합물에 대해 유의미한 연관성이 있는지 평가하여, 유의미한 연관성이 있다고 판단된 적어도 하나의 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 선정할 수 있다.
상기 선정하는 단계는, 상기 향상도가 1보다 큰 조각구조와 화합물 쌍은 유의미한 연관성이 있다고 평가할 수 있다.
상기 향상도는, 특정 약리활성에 대한 신규 선도물질 후보의 예측 점수로 사용될 수 있다.
본 발명의 다른 특징에 따르면, 신규 선도물질 후보 예측 방법은 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서, 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계, 상기 화합물들로부터 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 약리활성에 대한 신규 선도물질 후보로 예측하는 단계를 포함한다.
상기 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들은, 온라인 상의 공개 데이터베이스 및 공신력이 있는 자료들과, 사용자가 입력한 정보들로부터 다양한 약리활성과, 개별 약리활성을 가지는 화합물들로부터, 특정 약리활성과 특정 화합물간의 발생 빈도수에 기초하여 산출된 승산비와, 피셔의 정확 검증(fisher exact test)에 따른 유의 확률에 기초하여 선정될 수 있다.
상기 선정하는 단계는, 특정 화합물과 특정 조각구조 간에 발생 빈도수를 이용하여 산출된 연관도 점수가 기준값을 충족하는 화합물과 조각구조 쌍들에 공통으로 포함된 적어도 하나의 특정 조각구조를 선정할 수 있다.
상기 선정하는 단계는, 상기 약리활성을 가지는 모든 화합물들과 모든 조각구조들의 발생 빈도수와 특정 화합물과 특정 조각구조가 동시에 발생할 확률인 지지도와, 특정 조각구조가 발생할 때 특정 화합물이 발생할 확률인 신뢰도가 모두 기준값을 충족하고, 상기 지지도와 상기 신뢰도의 비율인 향상도가 기 정의된 유의미한 척도를 만족하는 각각의 조각구조와 화합물 쌍들로부터 공통된 적어도 하나의 조각구조를 선정할 수 있다.
본 발명의 또 다른 특징에 따르면, 신규 선도물질 후보 예측 방법은, 적어도 하나의 프로세서에 의해 동작하고, 신규 선도물질 후보를 예측하는 시스템으로서, 외부 공개 자료 및 사용자가 입력한 자료로부터 수집한 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들로부터 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 약리활성 유사 화합물 발굴부, 유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 화합물 조각화부, 상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 조각구조 발굴부, 그리고 선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 선도물질 후보 제공부를 포함한다.
상기 약리활성 유사 화합물 발굴부는, 모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)를 기준으로 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들중에서 통계적으로 유의미한지를 나타내는 유의 확률(p-value)이 기준값 이하인 화합물들을 선별하며, 선별된 화합물들을 약리활성이 유사한 화합물들로 발굴하여, 그룹핑할 수 있다.
상기 조각구조 발굴부는, 유사 약리활성 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들 간에 동시 발생 빈도수에 기초하여 중요성의 척도로 사용되는 지지도, 신뢰성의 척도로 사용되는 신뢰도, 및 지지도와 신뢰도의 비율로 산출되는 향상도를 산출하고, 상기 지지도, 상기 신뢰도 및 상기 향상도가 유의미한지 평가하여, 유의미한 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 발굴할 수 있다.
상기 조각구조 발굴부가 출력하는 상기 공통된 적어도 하나의 조각구조와 화합물간의 정보를 저장하는 조각구조-화합물 데이터베이스, 그리고 상기 조각구조-화합물 데이터베이스와 연결되고, 통신망을 통해 접속된 단말에게 상기 조각구조-화합물 데이터베이스로의 접근을 관리하는 사용자 인터페이스부를 더 포함할 수 있다.
본 발명의 실시예에 따르면, 화합물과 약리활성의 정보가 수집 및 통합된 데이터 베이스의 구축으로, 대단위의 약리활성 화합물 및 약효 시험에 필요한 과정을 없앨 수 있다. 그리고 약리활성도가 유사한 화합물들로부터 유래된 조각구조를 이용함으로써, 약리활성과 연관관계가 높은 화학적 기능을 갖는 최소 단위의 조각구조들을 도출 할 수 있는 장점이 있다.
또한, 구조와 활성간의 정성적인 분석과 유효성 평가가 가능하도록 구조적으로 잘 분포된 화합물들을 사용하므로 일단 유효물질이 도출되면 신속하게 후속연구결과를 진행할 수 있다는 장점이 있다.
도 1은 본 발명의 한 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
도 2는 본 발명의 한 실시예에 따른 신규 선도물질 예측 방법의 순서도이다.
도 3은 본 발명의 다른 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
도 4는 본 발명의 실시예에 따른 약리활성 유사 화합물 발굴 과정을 나타낸 순서도이다.
도 5는 본 발명의 실시예에 따른 조각화 과정을 나타낸 순서도이다.
도 6은 본 발명의 실시예에 따른 조각화 과정을 설명하기 위한 개념도이다.
도 7은 본 발명의 실시예에 따른 신규 선도물질 후보로 제공할 조각구조를 추출하는 과정을 나타낸 순서도이다.
도 8은 본 발명의 또 다른 실시예에 따른 신규 선도물질 예측 시스템의 하드웨어 구성을 나타낸 블록도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "…부", "…기", "…모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
본 명세서에서, 약리활성(pharmacological effect)은 어떤 물질이 생체 내 들어가서 단독으로 또는 생체 내 어떤 물질과 결합해 원하는 약물학적 효과를 내는 것을 의미한다.
또한, 선도물질(Lead compound)은 약리학적으로 또는 생물학적으로 효과가 있다고 생각 되어지고, 목적하는 효과를 내기 위해 어느 정도 개선이 필요할 수 있는 물질을 의미한다.
또한, 조각화(Chemical fragmentation)는 화합물을 최소 화학적 기능 단위인 '조각구조(Fragmentation Structure)'로 생성하는 것을 의미한다.
도 1은 본 발명의 한 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이고, 도 2는 본 발명의 한 실시예에 따른 신규 선도물질 예측 방법의 순서도이며, 도 3은 본 발명의 다른 실시예에 따른 신규 선도물질 예측 시스템의 개략적인 블록도이다.
먼저, 도 1을 참조하면, 신규 선도물질 예측 시스템(100)은 약리활성-화합물 데이터베이스(101), 약리활성 유사 화합물 발굴부(103), 화합물 조각화부(105), 조각구조 발굴부(107), 선도물질 후보 제공부(109) 및 조각구조-화합물 데이터베이스(111)를 포함하고, 이들 구성의 동작에 대해 설명하면, 도 2와 같다.
도 2를 참조하면, 약리활성 유사 화합물 발굴부(103)는 인터넷 등을 통해 수집된 정보 및/또는 사용자가 입력한 정보를 토대로 약리활성과, 약리활성을 갖는 화합물을 매핑한 약리활성-화합물 데이터베이스(101)를 구축한다(S101).
약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)에 저장된 정보들에 대해 유의성 평가를 수행하여 약리활성이 유사한 화합물을 발굴하고, 약리활성을 갖는 화합물의 약리활성 유사도에 따라 그룹핑한다(S103).
화합물 조각화부(105)는 화합물 조각화 기법을 이용하여 그룹내 약리활성 유사 화합물을 최소 화학적 기능 단위로 조각화한다(S105).
조각구조 발굴부(107)는 약리활성 유사 화합물로부터 조각화된 조각구조와 약리활성 유사 화합물 간의 연관도를 나타내는 연관도 점수를 산출한다(S107).
선도물질 후보 제공부(109)는 연관도 점수에 기초하여 신약개발에 있어 선도물질로 제시 가능한 약리활성을 나타내는 최적의 조각구조를 발굴하고, 발굴된 조각구조와 연관된 약리활성 유사 화합물들의 정보를 통합하여 조각구조-화합물 데이터베이스(111)를 구축한다(S109).
이후, 선도물질 후보 제공부(109)는 조각구조-화합물 데이터베이스(111)에 저장된 조각구조 그 자체를 신규 선도물질 후보로 제공한다(S111). 또한, 선도물질 후보 제공부(109)는 조각구조의 조합을 제공(S111)하여 이를 통해 다양한 활성을 갖는 신약개발에 활용될 수 있도록 한다.
도 3을 참조하면, 선도물질 후보 제공부(109)는 표시 장치(200)와 연결되어, 표시 장치(200)의 화면에 신규 선도물질 후보를 출력할 수 있다.
또한, 신규 선도물질 예측 시스템(100)은 사용자 인터페이스부(113)를 추가로 포함할 수 있다. 사용자 인터페이스부(113)는 통신망(300)을 통해 연결된 단말(400)과 연결된다. 사용자 인터페이스부(113)는 조각구조-화합물 데이터베이스(111)에 대한 접근을 제공하는 수단으로, 통신망(300)을 통해 단말(400)과 연결되어 각종 정보를 교환할 수 있도록 구성될 수 있다. 예를들면, 사용자 인터페이스부(113)는 단말(400)이 신규 선도물질 후보로 조각구조를 검색할 수 있는 환경을 제공할 수 있다. 통신망(300)은 동일한 하드웨어에서의 통신은 물론, 구내 정보 통신망(local area network, LAN), 도시권 통신망(metropolitan area network, MAN), 광역 통신망(wide area network, WAN), 인터넷, 2G, 3G, 4G 이동 통신망, 와이파이(Wi-Fi), 와이브로(Wibro) 등을 포함할 수 있으며, 통신 방식도 유선, 무선을 가리지 않으며 어떠한 통신 방식이라도 상관없다. 단말(400)은 스마트 폰, PC(Personal Computer), 태블릿 PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA), 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 통신 기능을 구비할 수 있다.
이제, 도 4 ~ 도 7을 참고하여, 신규 선도물질 예측 시스템(100)의 세부 동작에 대해 설명하기로 한다.
도 4는 본 발명의 실시예에 따른 약리활성 유사 화합물 발굴 과정을 나타낸 순서도로서, 약리활성 유사 화합물 발굴부(103)의 동작을 나타낸다.
도 4를 참조하면, 약리활성 유사 화합물 발굴부(103)는 약리활성 정보, 천연물을 포함한 화합물 정보, 질병 정보 등을 수집(S201)하고, 통합하여 약리활성-화합물 데이터베이스(101)를 구축한다(S203).
이때, 약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)를 구축하는데 필요한 정보를 인터넷 상에서 수집하거나 또는 사용자로부터 입력받을 수 있다.
약리활성 유사 화합물 발굴부(103)는 온라인 상에서 공개 데이터베이스, 예를들면, DrugBank, 한국전통지식포탈(KTKP), Traditional Chinese Medicine System Pharmacology Database(TCMSP), Traditional Chinese Medicine Integrated Database(TCMID), BindingDB, UMLS, Icd10, ClinicalTrial, SIDER Side Effect Resource, Comparative Toxicogenomics Database(CTD), Therapeutic Target Database(TTD) 등을 통해 수집한 정보들을 약리활성-화합물 데이터베이스(101)에 저장할 수 있다. 또한, 약리활성 유사 화합물 발굴부(103)는 공개 데이터베이스로 구성되지는 않았어도, 온라인 상에서 신뢰도가 높은 공식적인 정보를 수집하여 약리활성-화합물 데이터베이스(101)에 저장할 수 있다.
약리활성-화합물 데이터베이스(101)는 개별 약리활성 정보와, 그 약리활성을 갖는 화합물의 정보를 저장할 수 있다. 예를들면, Nintedanib은 다중 수용체 티로신 키나아제(RTKs)와 비 수용체 티로신 키나아제(nRTKs)를 표적으로하는 특발성 폐 섬유증(IPF)의 치료제로 사용되는 약물이다. Nintedanib은 혈소판 유래 성장 인자 수용체(PDGFR) 및, 섬유 아세포 성장 인자 수용체(FGFR), 혈관 내피 성장 인자 수용체(VEGFR) 및 Fms- 유사 티로신 키나아제 -3(FLT3) 등의 수용체의 아데노신 3 인산염(ATP) 결합 주머니에 경쟁적으로 결합하여 IPF 병리학의 필수 메커니즘을 나타내는 섬유 아세포의 증식, 이동 및 형질 전환에 중요한 세포 내 신호 전달을 차단한다. 또한, nintedanib은 nRTKs, Lck, Lyn 및 Src 키나아제를 억제하는데 이러한 내용이 약리활성-화합물 데이터베이스(101)에 저장될 수 있다. 물론, 여기서는 약리활성을 하나만 기재하였지만, 하나의 화합물은 복수의 약리활성을 가질 수 있다.
약리활성 유사 화합물 발굴부(103)는 약리활성-화합물 데이터베이스(101)를 이용하여 화합물의 개별 약리활성에 해당하는 빈도수를 도출하여 빈도표를 생성한다(S203).
예를들어, 약리활성 N1에 해당하는 화합물이 M1, M2, M3, 약리활성 N2에 해당하는 화합물이 M1, M3, M4, M5, 약리활성 N3에 해당하는 화합물이 M1, M2가 있다고 가정하면, M1의 약리활성 N1에 대한 빈도수는 1이 되고, M1이 나타나는 그 외의 약리활성은 N2, N3이므로, 그 외의 약리활성에 대한 빈도수는 2가 된다. 그리고 약리활성 N1이 나타나는 화합물은 M1, M2, M3이므로, 그 외의 화합물에 대한 약리활성 N1의 빈도수는 2가 된다. 이때, 하나의 화합물(M)은 n개의 약리활성(N1, ?, NK, K≥1)을 가질 수 있다. 이러한 방식으로, 천연물의 개별 약리활성 별로 해당하는 화합물의 빈도수를 반영한 약리활성-화합물 빈도표를 아래 표 1과 같이 정리할 수 있다. 빈도표는 2×2로 구현된다.
약리활성N1 그 외의 약리활성
화합물 M1 빈도수 a 빈도수 c a+c
그 외의 화합물 빈도수 b 빈도수 d b+d
a+b c+d a+b+c+d
이때, a는 표 1의 1행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 약리활성 N1의 특정 화합물 M1에 대한 빈도수를 의미하는 변수(variable)를 나타낸다.
b는 표 1의 2행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1을 제외한 나머지 화합물의 특정 약리활성 N1에 대한 빈도수를 의미하는 변수이다.
c는 표 1의 1행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1의 특정 약리활성 N1을 제외한 나머지 약리활성에 대한 빈도수를 의미하는 변수이다.
d는 표 1의 2행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 화합물 M1을 제외한 나머지 화합물의 특정 약리활성 N1을 제외한 나머지 약리활성에 대한 빈도수를 의미하는 변수이다.
이와 같은 방식으로, 약리활성 유사 화합물 발굴부(130)는 약리활성-화합물 데이터베이스(101)에 저장된 모든 약리활성과 화합물에 관하여 표 1과 같이 빈도표를 생성한다(S205).
약리활성 유사 화합물 발굴부(130)는 유의성 평가를 통해 빈도표에 포함된 약리활성별 화합물의 승산비를 도출(S207)하고 승산비에 기초하여 연관성을 평가한다(S209).
약리활성 유사 화합물 발굴부(130)는 S205 단계에서 생성된 빈도표들에 대하여 화합물이 해당 약리활성에 실제 유의한지 판단할 수 있는 기준으로 피셔의 정확 검정(fisher exact test)을 활용할 수 있다.
약리활성 유사 화합물 발굴부(130)는 승산비에 기초하여 화합물의 순위를 선정하고, 선정된 화합물들의 유의 확률(p-value)을 기반으로 특정 약리활성을 나타내는 화합물을 그룹핑(S211)하여 약리활성 유사도가 유의하다고 판단되는 화합물, 즉, 약리활성 유사 화합물을 발굴한다(S213).
여기서, 약리활성 유사 화합물 발굴부(130)가 약리활성과 화합물간의 유의성 평가를 수행하기 위하여 그려야 하는 초기하 분포(Hypergeometric distribution)는 표 1과 동일한 약리활성 N1 에 해당하는 화합물 M11의 빈도수를 가정할 때, 약리활성에 연관된 화합물이 다양한 경우에 따른 확률값의 분포이며, 구성하는 각 확률값은 아래 수학식 1과 같이 구할 수 있다.
Figure pat00001
여기서, a, b, c, d는 각각 표 1에서 해당 빈도수를 나타낸다.
약리활성 유사 화합물 발굴부(130)는 수학식 1을 통해 약리활성 별로 화합물의 승산비를 도출할 수 있다. 이러한 승산비는 복수개의 빈도표에 대해 각각 생성된다.
또한, 약리활성 유사 화합물 발굴부(130)는 복수개의 약리활성-화합물 빈도표를 구성하는 약리활성과 화합물 간의 유의성을 나타내고, 초기하 분포에 대한 빈도표의 우측 검정 유의 확률(p-value)을 다음 수학식 2를 통해 계산한다.
Figure pat00002
수학식 2에서 n은 0부터 a+b+c+d까지의 값을 가질 수 있다.
이때, 수학식 2에서 구한 유의 확률(p-value)에 대하여 임계값 0.05 이하의 값을 가지면, 약리활성 유사 화합물 발굴부(130)는 해당 화합물이 해당 약리활성에 유의하다고 판단한다. 예를들면, 표 1에 대한 유의성 검증값이 0.05 이하라면, 약리활성 유사 화합물 발굴부(130)는 화합물(M1)가 약리활성(N1)에 대해 유의하다고 판단한다.
약리활성 유사 화합물 발굴부(130)는 수학식 1에서 구한 승산비(OddsRatio)를 기준으로 특정 약리활성에 대한 하나 이상의 화합물의 순위를 선정한다. 예를들면, 승산비가 높을 수록 순위도 높게 선정될 수 있다.
약리활성 유사 화합물 발굴부(130)는 선정한 화합물들 중에서 유의 확률(p-value)이 0.05 이하인 화합물들, 즉, 특정 약리활성에 대해 유사도가 유의하다고 판단되는 화합물들을 추려낸다. 이렇게 추려낸 화합물들을 그 특정 약리활성을 나타내는 화합물로 그룹핑(S211)하고, 그룹 내 화합물들을 약리활성 유사 화합물로 발굴한다(S213).
도 5는 본 발명의 실시예에 따른 조각화 과정을 나타낸 순서도이고, 도 6은 본 발명의 실시예에 따른 조각화 과정을 설명하기 위한 개념도로서, 화합물 조각화부(105)의 동작을 나타낸다.
도 5를 참조하면, 화합물 조각화부(105)는 약리활성과 화합물간의 유의성 평가를 통해 유의하다고 판단된 약리활성 유사 화합물들을 약리활성 유사 화합물 발굴부(130)로부터 입력받는다(S301)
화합물 조각화부(105)는 화합물 조각화 기법을 이용하여 약리활성 유사 화합물을 최소 화학적 기능단위로 조각화하는데, 도 6과 같이 도식화할 수 있다. 도 6을 참조하면, 약리활성 유사 화합물1은 조각구조1과 조각구조2로 조각화될 수 있다. 이러한 도면은 조각화의 개념도로서, 실제 화합물 및 조각구조와는 다소 상이할 수 있다.
통상적으로, 유전체의 일부가 약물의 표적이 될 수 있는(druggable) 화합물이 'rule of 5'라는 기준을 따르듯이 '조각 구조(Fragmentation Structure)'는 'rule of 3(molecular weight < 300, ClogP < 3, the number of hydrogen bond donors and acceptors each should be < 3 and the number of rotatable bonds should be < 3)'를 따르는 것으로 알려져 있다. 본 발명의 실시예에서는, 디스커버리 스튜디오(Discovery Studio) 소프트웨어를 사용하여 조각 구조를 생성한다. 화합물 조각화부(105)는 5가지 항목(Rings, RingAssemblies, BridgeAssemblies, Chains, BemisMurckoAssemblies) 중에서 선택(S303, S307, S311, S315, S319)하여 조각화를 수행(S305, S309, S313, S317, S321)함으로써, 작용기 역할을 할 수 있는 구조 및 역할에 따라 다양한 조각 구조를 생성(S323)한다. 여기서, 5가지 항목, 즉, Rings, RingAssemblies, BridgeAssemblies, Chains, BemisMurckoAssemblies는 조각화 기법에 사용될 수 있는 조각화 단위로서, 연결 구조, 연결 형태 들을 달리하는 조각화 단위로 설명할 수 있다. 예를들면, RingAssemblies 조각화는 화합물을 RingAssemblies 단위로 조각화를 수행하는 것을 의미할 수 있다.
도 7은 본 발명의 실시예에 따른 신규 선도물질 후보로 제공할 조각구조를 추출하는 과정을 나타낸 순서도로서, 조각구조 발굴부(107) 및 선도물질 후보 제공부(109)의 동작을 나타낸다.
조각구조 발굴부(107)는 조각화를 통해 도출된 조각구조와, 해당하는 약리활성 화합물을 매핑(S401)하는데, 표 2와 같이 매핑할 수 있다.
표 2는 약리활성 화합물 조각구조와 약리활성 화합물 관계에 대한 연관 규칙 분석을 위한 목록을 예시한다.
순번(number) 항목(items)
1 조각구조1, 화합물2
2 조각구조1, 조각구조2, 화합물1
3 조각구조1, 화합물3
4 조각구조1, 화합물2, 화합물3
5 조각구조2, 화합물2
표 2에서 순번은 조각화 순번으로서, 예를들면, 순번 1은 첫번째 수행된 조각화를 나타내고, 순번 1에 해당하는 항목은 화합물2에 대해 조각화를 통해 도출된 조각구조 1을 의미한다. 이때, 각 순번 별로 조각화는 도 5에서 선택된 항목이 상이할 수 있다. 예를들면, 순번 1에서는 Rings 단위로 조각화를 하고, 순번 2에서는 BridgeAssemblies 단위로 조각화를 한 것일 수 있다.
조각구조 발굴부(107)는 약리활성 화합물 및 조각구조 간의 연관 규칙을 도출(S403)하고, 연관 규칙에 따라 연관도 점수를 산출한다(S405).
이때, 연관 규칙을 도출하기 위해서, 조각구조 발굴부(107)는 표 2에 기초하여 조각구조 별로 화합물에서의 발생 빈도를 표 3과 같이 동시 발생표로 나타낸다.
표 2에 따르면, 조각구조1과 화합물1의 동시 발생 빈도는 1이고, 화합물3와 조각구조1의 동시 발생 빈도는 2가 된다. 이러한 동시 발생 빈도를 표로 나타낸 것이 표 3이다. 표 3은 대칭 행렬의 모형을 보인다.
조각구조1 조각구조2 화합물1 화합물2 화합물3
조각구조1 4 1 1 2 2
조각구조2 1 2 1 1 0
화합물1 1 1 1 0 0
화합물2 2 1 0 3 1
화합물3 2 0 0 1 2
표 3에 따르면, 각각의 조각구조와 화합물이 몇 번이나 함께 도출되었는지 알 수 있다. 예를 들면, 조각구조1과 화합물2가 교차하는 값을 살펴보면 두 항목이 두 번 같이 발생되었음을 알 수 있다.
또한, 표 3에서 대각선 상의 자료 값은 바로 그 항목을 포함하는 총 발생 수ㅏ를 나타낸다. 예를 들면, 조각구조1과 조각구조1이 교차하는 항목에는 표 2에서 조각구조1이 총 발생한 빈도수가 기록되는데, 표 2의 순번 1, 2, 3, 4에서 총 4번 발생하였으므로, 동시 발생 빈도는 4이다. 그리고 조각구조2와 조각구조1이 교차하는 항목에는 조각구조2와 조각구조1이 동시에 발생한 빈도수가 기록되는데, 표 2의 순번 2에서 한번 발생하였으므로, 동시 발생 빈도는 1이다. 이러한 표 3을 통해 연관 규칙은, 지지도(Support), 신뢰도(Confidence), 향상도(Improvement)로 산출된다.
여기서, 지지도는 전체 중에서 조각구조(A)와 약리활성 화합물(성분)(B)를 함께 포함하는 사건에 대한 확률을 나타낸다. 이때, 확률값이 클수록 자주 발생하는 규칙이며, 규칙의 중요성에 대한 척도로 사용된다.
두 항목 A와 B의 지지도는 전체 발생항목 중 항목 A와 항목 B가 동시에 포함하는 발생의 비율을 나타내고, 수학식 3을 통해 산출될 수 있다.
Figure pat00003
또한, 신뢰도는 조각구조(A)가 있을때 약리활성 화합물(성분)(B)가 있을 확률 의미한다. 이때, 확률값이 클 수록 조각구조(A)가 있을시 약리활성 화합물(성분)(B)가 있을 확률이 높으며, 규칙의 신뢰성에 대한 척도로 사용되며, 수학식 4를 통해 산출될 수 있다.
Figure pat00004
또한, 향상도는 연관 규칙의 신뢰도와 지지도의 비율 도출되는 값으로서, 수학식 5를 통해 산출될 수 있다.
Figure pat00005
향상도는 항목 A가 주어지지 않았을 때의 항목 B의 확률 대비, 항목 A가 주어졌을 때의 항목 B의 확률의 증가 비율을 나타낸다. 이 값이 클 수록, 항목 A의 발생 여부가 항목 B의 발생 여부에 큰 영향을 미친다.
항목 A와 항목 B의 발생여부가 상호 관련이 없다면, P(
Figure pat00006
)와 P(B)가 같게 되어 향상도가 1이 된다. 어떤 규칙의 향상도가 1보다 크면, 이 규칙은 결과를 예측하는데 있어서 우연적 기회보다 우수하다는 것을 의미하고, 향상도가 1보다 작으면 이러한 규칙은 결과를 예측하는데 있어서 우연적 기회보다 나쁠 것이다.
이처럼, 조각구조 발굴부(107)는 표 3의 동시발생 빈도표로부터 연관 규칙을 생성하는데, 조각구조간, 화합물간, 조각구조와 화합물 간에 연관 규칙을 모두 생성한다. 그러나, 본 발명이 약리활성을 지닌 화합물들과 연관도가 높은 조각구조를 선도물질로 제시하고자 하므로, 화합물과 조각구조의 연관 규칙이 중요한 반면, 조각 구조 간의 연관규칙관계는 무의미하다.
조각구조 발굴부(107)는 생성된 연관 규칙들에 대해 지지도, 신뢰도, 향상도에 기초하여 최종적으로 연관도 점수가 높은 조각구조와 화합물을 선별한다.
이때, 조각구조 발굴부(107)는 지지도 및 신뢰도가 일정 기준값 이상이면, 의미 있는 연관 규칙으로 판단한다. 즉, 그 연관 규칙을 도출한 조각구조(A)와 약리활성 유사 화합물(B)는 연관된 것으로 판별한다. 그리고 판별된 연관 규칙 내의 향상도 점수로 최종 평가한다. 이때, 향상도가 1보다 클 경우, 예측도가 우수하다고 판단된다.
조각구조 발굴부(107)는 연관도 점수에 기초하여 약리활성 연관 주 조각구조 또는 공통된 조각구조와, 개별 조각구조가 조합된 조합 조각구조를 추출한다(S407). 예를들면, 약리활성 N1을 갖는 화합물 M1, 화합물 M2, 화합물 M3가 있을 때, 화합물 M1, 화합물 M2, 화합물 M3 각각의 조각구조들에 대해 표 3과 같이 빈도표를 구성하고, 이들 빈도표에 기초한 지지도, 신뢰도가 일정 기준값을 충족하고, 향상도 점수가 1보다 크면, 조각구조 발굴부(107)는 그 조각구조들을 약리활성 N1에 대하여 연관된 것으로 판단한다. 이때, 조각구조 발굴부(107)는 향상도 점수가 가장 높은 조각구조를 약리활성 N1에 대한 주 조각구조 또는 공통 조각구조로 추출할 수 있다. 또한, 조각구조 발굴부(107)는 향상도 점수가 1보다 큰 조각구조들을 약리활성 N1 에 대한 조합 조각구조로 추출할 수 있다.
선도물질 제공부(109)는 S407 단계에서 추출된 주 조각구조 및 조합 조각구조를 해당하는 연관된 약리활성 화합물과 함께 조각구조-화합물 데이터베이스(111)에 저장하고, 저장된 조각구조들을 신규 선도물질 후보로 제공한다(S409). 예를들면, 조각구조1은 약리활성 N1을 나타내는 주 신규 선도물질 후보로 제공될 수 있다. 또한, 조각구조1과 조각구조2는 약리활성 N1을 나타내는 조합 신규 선도물질 후보로 제공될 수 있다.
또한, 선도물질 제공부(109)는 향상도를 특정 약리활성에 대한 특정 조각구조의 예측도로 제공하여, 향상도를 기준으로 조각구조들의 특정 약리활성에 대한 예측도를 평가하기 위한 자료로 사용할 수 있다. 예를들면, 약리활성 N1에 대한 조각구조1의 향상도가 1.3이고, 약리활성 N1에 대한 조각구조2의 향상도가 1.5라면, 약리활성 N1에 대한 예측도는 조각구조2가 조각구조1보다 더 높다고 평가될 수 있다.
이와 같이, 약리활성 화합물들의 조각구조와 약리활성 화합물간의 연관 규칙 발견을 통해 약리활성과 구조가 유사한 화합물들이 갖는 공통 조각구조를 발굴하고, 결과를 통합하여 데이터베이스를 구축하여, 조각구조 그 자체로 신규 약물 선도물질 후보로 제공하고, 또한 그 조합을 통해 다양한 활성을 갖는 신약개발에 활용 될 수 있도록 제공할 수 있다. 이렇게 하면, 종래 기술의 문제점이자 한계점이었던 선도물질 발굴 과정에 필요한, 약리활성 화합물 확보 및 약효 시험 과정등과 같은 대단위의 비용과 시간이 소요되는 과정을 화합물과 약리활성의 정보가 수집 및 통합된 데이터베이스의 구축으로 해결할 수 있다. 또한, 화합물의 단순 조각화를 통해 도출된 조각구조들을 제한된 일부의 약효시험 과정을 거쳐 일부 약리활성 조각구조를 발굴하는 시도에서 발생하는 보다 중요한 조각구조를 찾는 과정이 빠져있는 단점을, 약리활성도가 유사한 화합물들로부터 유래된 조각구조를 이용하고 약리활성과 연관 관계 점수가 높은 최소 조각구조들을 발굴함으로써, 해결할 수 있다.
한편, 도 8은 본 발명의 또 다른 실시예에 따른 신규 선도물질 예측 시스템의 하드웨어 구성을 나타낸 블록도이다.
도 8을 참조하면, 신규 선도물질 예측 시스템(500)은 적어도 하나의 저장부(501), 적어도 하나의 출력부(503), 적어도 하나의 입력부(505), 적어도 하나의 통신부(507) 및 적어도 하나의 프로세서(509)를 포함하는 하드웨어로 구성된다. 신규 선도물질 예측 시스템(500)은 하드웨어와 결합하여 동작하는 운영체제, 미들웨어, 프로그램 등 각종 소프트웨어를 포함한다. 신규 선도물질 예측 시스템(500)의 하드웨어와 소프트웨어는 본 발명을 실행할 수 있는 구성과 성능을 가진다.
저장부(501)는 도 1 ~ 도 7에서 설명한 구성 및 방법을 구현하기 위한 프로그램을 저장한다. 저장부(501)는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함하고, 예를 들면 ROM(read only memory), RAM(random access memory), 자기디스크 저장 매체, 광저장 매체, 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함할 수 있다. 저장부(501)에 저장된 프로그램은 도 1 ~ 도 7에서 설명한 신규 선도물질 예측 시스템(500)의 동작을 구현한 명령어들(instructions)를 포함한다. 프로세서(509)는 프로그램을 로딩하여 본 발명에서 설명한 도 1 ~ 도 7에서 설명한 신규 선도물질 예측 시스템(500)의 동작을 수행한다.
출력부(503)는 프로세서(509)의 동작에 따른 정보를 화면에 출력하는데, 예를들면, 조각구조 및/또는 조각구조 조합을 신규 선도물질로 출력한다. 이때, 화면 상에 출력할 수도 있고, 인쇄물로 출력할 수도 있고, 사용자가 인지할 수 있는 다양한 방식으로 출력할 수 있다. 입력부(505)는 약리활성-화합물 데이터베이스(101)를 구축하는데 필요한 정보를 인터넷 상에서 수집하거나 또는 사용자로부터 입력받아 프로세서(509)로 출력한다.
통신부(507)는 통신망(300)에 연결되어 데이터 송수신 기능을 수행한다.
이때, 각 구성(501, 503, 505, 507)은 하나의 프로세서(509) 내에 탑재된 형태로 도시하였으나, 이는 각 구성(501, 503, 505, 507)이 프로세서 기반으로 동작하는 것을 의미하는 것으로, 하나의 프로세서(509)로 구현될 수도 있지만, 이더넷이나 네트워크를 통해 서로 연결된 별개의 서버로 구현될 수도 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (15)

  1. 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서,
    다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들의 정보를 수집하는 단계,
    상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 단계,
    유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계,
    상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고
    선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 단계
    를 포함하는, 신규 선도물질 후보 예측 방법.
  2. 제1항에서,
    상기 그룹핑하는 단계는,
    모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)와, 통계적으로 유의미한지를 나타내는 유의 확률에 기초하여, 약리활성이 유사한 화합물들을 발굴하는, 신규 선도물질 후보 예측 방법.
  3. 제2항에서,
    상기 그룹핑하는 단계는,
    상기 승산비에 기초하여 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고, 상기 순위가 선정된 화합물들 중에서 상기 유의 확률이 0.05 이하 이하인 화합물들을 해당 약리활성이 유사한 화합물로 발굴하는, 신규 선도물질 후보 예측 방법.
  4. 제1항에서,
    상기 선정하는 단계는,
    상기 그룹 내 모든 화합물과, 조각화를 통해 도출된 조각구조들 간에 발생 빈도수를 이용하여 특정 화합물과 특정 조각구조 간에 연관도 점수를 산출하고, 상기 연관도 점수가 기준값을 충족하는 조각구조와 화합물 쌍을 선정하는, 신규 선도물질 후보 예측 방법.
  5. 제4항에서,
    상기 연관도 점수는,
    상기 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들의 모든 발생 빈도 중에서 특정 조각구조와 특정 화합물이 동시에 발생할 확률을 나타내는 지지도,
    특정 조각구조가 발생할 때, 특정 화합물이 발생할 확률을 나타내는 신뢰도, 그리고
    상기 지지도와 신뢰도의 비율인 향상도를 포함하고,
    상기 선정하는 단계는,
    상기 지지도와 상기 신뢰도가 기준값을 충족하는 조각구조와 화합물 쌍 중에서 상기 향상도를 기준으로 특정 조각구조가 특정 화합물에 대해 유의미한 연관성이 있는지 평가하여, 유의미한 연관성이 있다고 판단된 적어도 하나의 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 선정하는, 신규 선도물질 후보 예측 방법.
  6. 제5항에서,
    상기 선정하는 단계는,
    상기 향상도가 1보다 큰 조각구조와 화합물 쌍은 유의미한 연관성이 있다고 평가하는, 신규 선도물질 후보 예측 방법.
  7. 제5항에서,
    상기 향상도는,
    특정 약리활성에 대한 신규 선도물질 후보의 예측 점수로 사용되는, 신규 선도물질 후보 예측 방법.
  8. 적어도 하나의 프로세서에 의해 동작하는 시스템이 신규 선도물질 후보를 예측하는 방법으로서,
    통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 단계,
    상기 화합물들로부터 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 단계, 그리고
    선정된 상기 적어도 하나의 특정 조각구조를 상기 약리활성에 대한 신규 선도물질 후보로 예측하는 단계
    를 포함하는, 신규 선도물질 후보 예측 방법.
  9. 제8항에서,
    상기 통계적으로 유의미한 유사성이 있는 약리활성을 가지는 화합물들은,
    온라인 상의 공개 데이터베이스 및 공신력이 있는 자료들과, 사용자가 입력한 정보들로부터 다양한 약리활성과, 개별 약리활성을 가지는 화합물들로부터, 특정 약리활성과 특정 화합물간의 발생 빈도수에 기초하여 산출된 승산비와, 피셔의 정확 검증(fisher exact test)에 따른 유의 확률에 기초하여 선정되는, 신규 선도물질 후보 예측 방법.
  10. 제8항에서,
    상기 선정하는 단계는,
    특정 화합물과 특정 조각구조 간에 발생 빈도수를 이용하여 산출된 연관도 점수가 기준값을 충족하는 화합물과 조각구조 쌍들에 공통으로 포함된 적어도 하나의 특정 조각구조를 선정하는, 신규 선도물질 후보 예측 방법.
  11. 제10항에서,
    상기 선정하는 단계는,
    상기 약리활성을 가지는 모든 화합물들과 모든 조각구조들의 발생 빈도수와 특정 화합물과 특정 조각구조가 동시에 발생할 확률인 지지도와, 특정 조각구조가 발생할 때 특정 화합물이 발생할 확률인 신뢰도가 모두 기준값을 충족하고,
    상기 지지도와 상기 신뢰도의 비율인 향상도가 기 정의된 유의미한 척도를 만족하는 각각의 조각구조와 화합물 쌍들로부터 공통된 적어도 하나의 조각구조를 선정하는, 신규 선도물질 후보 예측 방법.
  12. 적어도 하나의 프로세서에 의해 동작하고, 신규 선도물질 후보를 예측하는 시스템으로서,
    외부 공개 자료 및 사용자가 입력한 자료로부터 수집한 다양한 약리활성의 정보 및 개별 약리활성을 갖는 화합물들로부터 상기 개별 약리활성에 대하여 통계적으로 유의미한 유사성이 있다고 판단된 화합물들을 발굴하여, 약리활성 별로 그룹핑하는 약리활성 유사 화합물 발굴부,
    유사 약리활성 그룹 내 화합물들을 최소 화학적 기능 단위로 조각화하여, 화합물 별로 조각구조들을 도출하는 화합물 조각화부,
    상기 그룹 내 화합물들에서 공통으로 도출된 적어도 하나의 특정 조각구조를 선정하는 조각구조 발굴부, 그리고
    선정된 상기 적어도 하나의 특정 조각구조를 상기 그룹 내 화합물들의 약리활성에 대한 신규 선도물질 후보로 예측하는 선도물질 후보 제공부
    를 포함하는, 신규 선도물질 후보 예측 시스템.
  13. 제12항에서,
    상기 약리활성 유사 화합물 발굴부는,
    모든 화합물의 개별 약리활성에 대한 빈도수에 기초하여 산출된 화합물과 약리활성 간의 승산비(odds ratio)를 기준으로 약리활성 별로 해당 약리활성을 갖는 화합물들의 순위를 선정하고,
    상기 순위가 선정된 화합물들중에서 통계적으로 유의미한지를 나타내는 유의 확률(p-value)이 기준값 이하인 화합물들을 선별하며,
    선별된 화합물들을 약리활성이 유사한 화합물들로 발굴하여, 그룹핑하는, 신규 선도물질 후보 예측 시스템.
  14. 제12항에서,
    상기 조각구조 발굴부는,
    유사 약리활성 그룹 내 모든 화합물과, 상기 모든 화합물로부터 도출된 조각구조들 간에 동시 발생 빈도수에 기초하여 중요성의 척도로 사용되는 지지도, 신뢰성의 척도로 사용되는 신뢰도, 및 지지도와 신뢰도의 비율로 산출되는 향상도를 산출하고,
    상기 지지도, 상기 신뢰도 및 상기 향상도가 유의미한지 평가하여, 유의미한 조각구조와 화합물 쌍으로부터 공통된 적어도 하나의 조각구조를 발굴하는, 신규 선도물질 후보 예측 시스템.
  15. 제12항에서,
    상기 조각구조 발굴부가 출력하는 상기 공통된 적어도 하나의 조각구조와 화합물간의 정보를 저장하는 조각구조-화합물 데이터베이스, 그리고
    상기 조각구조-화합물 데이터베이스와 연결되고, 통신망을 통해 접속된 단말에게 상기 조각구조-화합물 데이터베이스로의 접근을 관리하는 사용자 인터페이스부
    를 더 포함하는, 신규 선도물질 후보 예측 시스템.
KR1020170079166A 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템 KR101995511B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170079166A KR101995511B1 (ko) 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170079166A KR101995511B1 (ko) 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20190000167A true KR20190000167A (ko) 2019-01-02
KR101995511B1 KR101995511B1 (ko) 2019-07-02

Family

ID=65021519

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170079166A KR101995511B1 (ko) 2017-06-22 2017-06-22 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101995511B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210026541A (ko) 2019-08-30 2021-03-10 주식회사 에일론 호몰로지를 이용한 인공신경망 기반 타겟 단백질의 화합물 활성 예측 시스템
KR20210026301A (ko) 2019-08-29 2021-03-10 (주)비아이매트릭스 딥러닝 기반 농산물 물동량 분배 의사결정 지원 시스템
KR20210026542A (ko) 2019-08-30 2021-03-10 주식회사 에일론 기하학적 이미지를 이용한 인공신경망 기반 단백질 결합 화합물의 생물학적 활성 예측 시스템
KR20210026543A (ko) 2019-08-30 2021-03-10 주식회사 에일론 복수의 인공신경망 모델 기반 단백질 결합 화합물의 활성 예측 시스템
KR20210027668A (ko) 2019-08-30 2021-03-11 주식회사 에일론 푸리에 디스크립터와 인공신경망을 이용한 타겟 단백질에 대한 화합물 활성 예측 시스템
KR20220107413A (ko) 2021-01-25 2022-08-02 주식회사 카이팜 화합물 활성 데이터 기반 약물 정보 추출 방법, 약물 탐색 라이브러리 구축 방법 및 분석장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240136757A (ko) 2023-03-07 2024-09-19 한국화학연구원 웹 기반 유기태양전지 데이터 통합 관리 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020028925A (ko) * 2002-01-08 2002-04-17 신환철 신약 개발을 위한 새로운 분자 설계방법
WO2005038618A2 (en) * 2003-10-14 2005-04-28 Verseon Lead molecule cross-reaction prediction and optimization system
US20110282910A1 (en) * 2010-01-29 2011-11-17 Cramer Richard D Template Constrained Fragment Alignment Used To Identify Fragments Of Similar Shape and Activity In Drug Development

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020028925A (ko) * 2002-01-08 2002-04-17 신환철 신약 개발을 위한 새로운 분자 설계방법
WO2005038618A2 (en) * 2003-10-14 2005-04-28 Verseon Lead molecule cross-reaction prediction and optimization system
US20110282910A1 (en) * 2010-01-29 2011-11-17 Cramer Richard D Template Constrained Fragment Alignment Used To Identify Fragments Of Similar Shape and Activity In Drug Development

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
정보과학회지 31(8), 이지영 외 3명. 컴퓨터를 이용한 신약개발, 향후 기술 전망. (2013.08.)* *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210026301A (ko) 2019-08-29 2021-03-10 (주)비아이매트릭스 딥러닝 기반 농산물 물동량 분배 의사결정 지원 시스템
KR20210026541A (ko) 2019-08-30 2021-03-10 주식회사 에일론 호몰로지를 이용한 인공신경망 기반 타겟 단백질의 화합물 활성 예측 시스템
KR20210026542A (ko) 2019-08-30 2021-03-10 주식회사 에일론 기하학적 이미지를 이용한 인공신경망 기반 단백질 결합 화합물의 생물학적 활성 예측 시스템
KR20210026543A (ko) 2019-08-30 2021-03-10 주식회사 에일론 복수의 인공신경망 모델 기반 단백질 결합 화합물의 활성 예측 시스템
KR20210027668A (ko) 2019-08-30 2021-03-11 주식회사 에일론 푸리에 디스크립터와 인공신경망을 이용한 타겟 단백질에 대한 화합물 활성 예측 시스템
KR20220107413A (ko) 2021-01-25 2022-08-02 주식회사 카이팜 화합물 활성 데이터 기반 약물 정보 추출 방법, 약물 탐색 라이브러리 구축 방법 및 분석장치

Also Published As

Publication number Publication date
KR101995511B1 (ko) 2019-07-02

Similar Documents

Publication Publication Date Title
KR101995511B1 (ko) 유사 약리활성 그룹 화합물들의 조각구조 특성 연관규칙을 기반으로 신규 선도물질 예측 방법 및 시스템
Hofmarcher et al. Large-scale ligand-based virtual screening for SARS-CoV-2 inhibitors using deep neural networks
Rogers et al. Using extended-connectivity fingerprints with Laplacian-modified Bayesian analysis in high-throughput screening follow-up
Willett Similarity-based virtual screening using 2D fingerprints
López-Vallejo et al. Expanding the medicinally relevant chemical space with compound libraries
Hu et al. Exploring compound promiscuity patterns and multi-target activity spaces
KR101963331B1 (ko) 인체 대사 물질과의 유사도 기반 약물 재창출 후보 예측 방법 및 그 시스템
US20060106544A1 (en) Method and system for predicting functions of compound
Liao et al. DeepDock: enhancing ligand-protein interaction prediction by a combination of ligand and structure information
Shanmugasundaram et al. Hit-directed nearest-neighbor searching
Medina‐Franco Interrogating novel areas of chemical space for drug discovery using chemoinformatics
Habibi et al. Protein complex prediction based on k-connected subgraphs in protein interaction network
Ciriaco et al. Quantitative polypharmacology profiling based on a multifingerprint similarity predictive approach
Kunimoto et al. Combining similarity searching and network analysis for the identification of active compounds
Hao et al. Web search and data mining of natural products and their bioactivities in PubChem
Ferreira et al. In silico screening strategies for novel inhibitors of parasitic diseases
Takeuchi et al. Systematic mapping of R-group space enables the generation of an R-group replacement system for medicinal chemistry
Sciabola et al. Critical Assessment of State‐of‐the‐Art Ligand‐Based Virtual Screening Methods
Doctor et al. The apoptosis database
Zhu et al. Semantic and layered protein function prediction from PPI networks
Banerjee A survey on mining and analysis of uncertain graphs
Mendoza et al. Reducing hardware hit by queries in web search engines
Paulose et al. A big data approach with artificial neural network and molecular similarity for chemical data mining and endocrine disruption prediction
Ashenden Screening library design
US20200411137A1 (en) Drug Recommendation Method and System

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant