KR20170043418A - 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법 - Google Patents

천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법 Download PDF

Info

Publication number
KR20170043418A
KR20170043418A KR1020150179267A KR20150179267A KR20170043418A KR 20170043418 A KR20170043418 A KR 20170043418A KR 1020150179267 A KR1020150179267 A KR 1020150179267A KR 20150179267 A KR20150179267 A KR 20150179267A KR 20170043418 A KR20170043418 A KR 20170043418A
Authority
KR
South Korea
Prior art keywords
efficacy
natural
component
frequency
drug
Prior art date
Application number
KR1020150179267A
Other languages
English (en)
Other versions
KR101848074B1 (ko
Inventor
이관수
이보아
차기훈
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to PCT/KR2015/013811 priority Critical patent/WO2017065351A1/ko
Publication of KR20170043418A publication Critical patent/KR20170043418A/ko
Application granted granted Critical
Publication of KR101848074B1 publication Critical patent/KR101848074B1/ko

Links

Images

Classifications

    • G06F19/704
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • G06F19/705
    • G06F19/708
    • G06F19/709
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicines Containing Plant Substances (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)

Abstract

천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법이 제공된다. 여기서 시스템은 컴퓨터 기반의 천연물 소재 및 성분의 신규 효능 예측 시스템으로서, 이미 알려진 다양한 천연물 소재들에 관한 성분, 효능 및 처방 정보를 포함하는 천연물 관련 정보가 저장된 천연물 데이터베이스, 상기 천연물 관련 정보로부터 산출된 천연물 소재에 대한 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 소재를 판별 및 선정하는 소재 추출부, 그리고 상기 천연물 관련 정보로부터 산출된 상기 다양한 천연물 소재를 구성하는 각각의 천연물 성분 및 약물 성분에 대한 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 성분 및 약물 성분을 판별 및 선정하는 성분 추출부, 그리고 상기 성분 추출부에서 추출된 개별 성분 및 성분 조합으로 이루어진 단일 천연물 소재들과 상기 단일 천연물 소재들의 조합을 추출하는 소재 추출부를 포함하고, 상기 성분 추출부에서 추출된 성분들 및 성분들의 조합과, 상기 소재 추출부에서 추출된 소재들 및 소재들의 조합을 통해 새로운 효능을 예측할 수 있다.

Description

천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법{SYSTEM AND METHOD FOR PREDICTION OF NOVEL EFFECTS OF NATURAL SUBSTANCES AND COMBINATION OF THEIR COMPONENTS}
본 발명은 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법에 관한 것이다.
현재 다양한 천연물 소재들의 효능이 동양의학 또는 민간요법으로 알려져 실생활에서 대체 치료 또는 건강보조 요법으로 활용되고 있다.
장기간 사용된 효능이 알려진 천연물 소재들은 빠르고 안전하게 새로운 신약, 건강식품, 기능성 화장품의 소재로 개발될 수 있다. 그러나 기존에 효능이 알려지고 오래 사용된 물질의 대다수는 이미 상품화 되었거나 상품화시 보호될 수 있는 권리나 진입 장벽이 없는 상태라 할 수 있다. 이들의 새로운 효능을 탐색하기 위해 다양한 수준의 효능 검증 실험을 하거나 변형된 물질을 고안하여 효능을 극대화 시키는 등의 기술은 개발기간과 비용이 과다하여 사업화 할 수 있는 대상이 매우 한정적이다.
또한, 특정 효능에 적합한 천연물 소재 또는 그 성분들의 조합을 찾는 작업은 신약 개발에 버금가는 비용과 시간이 투자되어야 한다. 따라서, 현재 건강기능식품, 기능성 화장품, 천연물 신약, 천연물 유래 신약 개발에 활용되는 천연물 들은 제한적이며 알려진 본래의 효능 외에 새로운 효능에 적용된 경우가 극히 드물다.
현재 천연물들에 대해 알려진 효능들은 대부분 효능을 한정시킨 확증적 시험이나 무작위 시험을 통해 얻어진 편의(bias)된 결과이다.
IMS 보고서에 따르면, 세계 천연물의약품 시장은 25조원 이상으로 추정되고 있으며, 이 중 처방 의약품이 18조 이상을 차지하고 있으며, 연간 8~10%의 성장률을 기록하고 있다. 판매되는 의약품의 50% 정도가 천연물 의약품이거나 천연물에서 유래된 단일물질이다.
천연물 의약품의 개발을 위한 규정 마련 및 정부 과제 지원에 있어서 미국은 미국 FDA가 천연물의약품 가이던스 제정과 함께 암젠(Amgen), 바이오젠(Biogen), 젠자임(Genzyme) 등 대형 제약회사들을 중심으로 천연화합물 연구 개발 프로젝트를 추진하였고, 독일의 경우 정부와 민간 제약회사가 공동으로 체계적인 생리활성검색을 통한 천연물 신약개발 프로그램을 진행하였다. 특히, 머크(Merck)사는 50만종의 열대 동식물에서 10년내 신약 25종 개발을 목표로 투자하고 있는 것으로 알려져 있다.
중국의 경우, 업계에서는 중국 전통의 약초의학산업을 바탕으로 한 천연물 연구가 진행 중에 있다. 국내 건강식품 시장은 2004년 건강식품 제도 시행 이후 꾸준히 성장세를 보여 2012년 상위 추정 23개 판매업체 소비자 매출액은 약 4조 가량으로 추정되고 있고, 오메가3두부, 헛개나무요구르트 등 다양하고 새로운 원료를 이용한 건강식품이 출시되고 있다. 특히, 매일 유업과 대웅 제약이 당뇨 환자를 위한 특수의료용도 식품을 개발한 점이나, 롯데칠성음료와 차병원계열사가 가르시니아캄보지아 추출물을 이용하여 체지방 감소에 도움을 주는 식음료 개발과 같이 식음료업체들의 단독 진출보단 제약사 의약관련 업체들과 진출하고 있다.
또한, 주름개선, 보습, 항산화, 미백, 세포재생, 자외선차단과 같은 기능성 천연물 화장품 시장은 세계적으로 급격한 성장추세를 이어가고 있으며 그 시장규모는 약 127억 달러를 기록할 것으로 전망되고 있고 특히 우리나라의 경우 약 3조 271억원의 시장 규모를 형성할 것으로 보인다. 이처럼 천연물 소재와 개별 성분 및 조합의 가치는 의약품, 식품, 화장품 산업에서 높아지고 있으나, 후보 발굴 방법은 여전히 초기부터 효능 검증 실험을 수반하는 고비용 프로세스라 접근이 용이하지 않다.
따라서, 본 발명이 이루고자 하는 기술적 과제는 다양한 천연물 및 천연물을 구성하는 각종 성분이 가지는 알려진 효능 정보들을 이용하여 천연물 소재 및 천연물 및 성분의 새로운 효능을 발굴할 수 있는 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법을 제공하는 것이다.
본 발명의 하나의 특징에 따르면, 천연물 소재 및 성분의 신규 효능 예측 시스템은 컴퓨터 기반의 천연물 소재 및 성분의 신규 효능 예측 시스템으로서, 이미 알려진 다양한 천연물 소재들에 관한 성분, 효능 및 처방 정보를 포함하는 천연물 관련 정보가 저장된 천연물 데이터베이스, 상기 천연물 관련 정보로부터 산출된 천연물 소재에 대한 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 소재를 판별 및 선정하는 소재 추출부, 상기 천연물 관련 정보로부터 산출된 상기 다양한 천연물 소재를 구성하는 각각의 천연물 성분 및 약물 성분에 대한 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 성분 및 약물 성분을 판별 및 선정하는 성분 추출부, 그리고 상기 성분 추출부에서 추출된 개별 성분 및 성분 조합으로 이루어진 단일 천연물 소재들과 상기 단일 천연물 소재들의 조합을 추출하는 소재 추출부를 포함하고,
상기 성분 추출부에서 추출된 성분들 및 성분들의 조합과, 상기 소재 추출부에서 추출된 소재들 및 소재들의 조합을 통해 새로운 효능이 예측될 수 있다.
상기 통계적 유의성의 판별은,
승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 이용할 수 있다.
상기 천연물 소재 및 성분의 신규 효능 예측 시스템은,
상기 천연물 관련 정보로부터 천연물 소재가 가질 수 있는 다양한 효능 별로 각각 대응되는 처방으로 구성된 천연물 효능-처방 테이블, 천연물 소재가 포함된 처방 별로 각각 대응되는 천연물 소재로 구성된 천연물 처방-소재 테이블 및 천연물 소재 별로 각각의 천연물 소재를 구성하는 성분들로 구성된 천연물 소재-성분 테이블을 생성하고, 이미 알려진 약물 효능 별로 대응하는 상기 약물을 구성하는 성분으로 구성된 약물 효능-성분 테이블을 생성하는 데이터 통합부를 더 포함하고,
상기 천연물 소재에 대한 효능 빈도수는 상기 천연물 효능-처방 테이블 및 상기 천연물 처방-소재 테이블로부터 도출되고,
상기 천연물 성분 및 약물 성분에 대한 효능 빈도수는 상기 천연물 효능-처방 테이블, 상기 천연물 처방-소재 테이블, 상기 천연물 소재-성분 테이블 및 상기 약물 효능-성분 테이블로부터 도출될 수 있다.
상기 천연물 소재 및 성분의 신규 효능 예측 시스템은,
상기 천연물 효능-처방 테이블 및 상기 천연물 처방-소재 테이블로부터 추출된 모든 효능 및 모든 천연물 소재에 대해 천연물 소재의 효능 빈도수로 구성된 복수개의 효능-소재 빈도표를 생성하는 효능-소재 빈도표 생성부, 그리고 상기 복수개의 효능-소재 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 소재별 효능 점수 산출부를 더 포함하고,
상기 소재 추출부는,
상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-소재 빈도표를 선정하고, 선정된 하나 이상의 효능-소재 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 소재의 순위를 선정하며, 선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 소재를 순서대로 나열하여 출력할 수 있다.
상기 효능-소재 빈도표는,
특정 효능에 대한 특정 천연물 소재의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 소재의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 소재들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 소재들의 빈도수(d)로 구성되고,
상기 소재별 효능 점수 산출부는,
상기 효능-소재 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 특정 효능에 대한 상기 특정 천연물 소재의 효능-소재 빈도표의 승산비 및 유의확률을 각각 계산할 수 있다.
상기 천연물 소재 및 성분의 신규 효능 예측 시스템은,
상기 천연물 효능-처방 테이블, 상기 천연물 처방-소재 테이블, 상기 천연물 소재-성분 테이블 및 상기 약물 효능-성분 테이블로부터 추출된 모든 효능 및 모든 천연물 성분 및 약물 성분에 대해 천연물 성분 및 약물 성분의 효능 빈도수로 구성된 복수개의 효능-성분 빈도표를 생성하는 효능-성분 빈도표 생성부, 그리고 상기 복수개의 효능-성분 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 성분별 효능 점수 산출부를 더 포함하고,
상기 성분 추출부는,
상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-성분 빈도표를 선정하고, 선정된 하나 이상의 효능-성분 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 성분 및 약물 성분의 순위를 선정하며, 선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 성분 및 약물 성분을 순서대로 나열하여 출력하고,
출력된 상기 특정 효능에 대한 성분들을 통해 성분의 새로운 효능 또는 상기 특정 효능을 가지는 새로운 성분을 예측할 수 있다.
상기 소재 추출부는,
상기 성분 추출부로부터 상기 하나 이상의 천연물 성분 및 약물 성분을 전달받고, 상기 하나 이상의 천연물 성분 및 약물 성분과, 상기 천연물 소재-성분 테이블을 이용하여 상기 하나 이상의 천연물 성분 및 약물 성분으로 구성된 천연물 소재들 및 상기 천연물 소재들의 조합을 출력할 수 있다.
상기 효능-성분 빈도표는,
특정 효능에 대한 특정 천연물 성분 및 약물 성분의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 성분 및 약물 성분의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 성분들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 성분 및 약물 성분의 빈도수(d)로 구성되고,
상기 성분별 효능 점수 산출부는,
상기 효능-성분 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 유의확률 및 상기 승산비를 산출할 수 있다.
본 발명의 다른 특징에 따르면, 천연물 소재의 신규 효능 예측 방법은 이미 알려진 다양한 천연물 소재들에 관한 성분, 효능 및 처방 정보를 포함하는 천연물 관련 정보가 저장된 천연물 데이터베이스를 구축하는 단계, 상기 천연물 관련 정보를 이용하여 천연물 소재에 대한 효능 빈도수를 산출하는 단계, 그리고 상기 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 소재 및 그 조합과 소재의 신규 효능을 판별 및 선정하는 단계를 포함한다.
상기 구축하는 단계와 상기 산출하는 단계 사이에
천연물 효능-처방 테이블, 천연물 처방-소재 테이블, 천연물 소재-성분 테이블 및 약물 효능-성분 테이블을 생성하는 단계를 더 포함하고,
상기 천연물 효능-처방 테이블은,
천연물 소재가 가질 수 있는 다양한 효능 별로 각각 대응되는 처방으로 구성되고, 상기 천연물 처방-소재 테이블은 천연물 소재가 포함된 처방 별로 각각 대응되는 천연물 소재로 구성되며, 상기 천연물 소재-성분 테이블은 천연물 소재 별로 각각의 천연물 소재를 구성하는 성분들로 구성되며, 상기 약물 효능-성분 테이블은 이미 알려진 약물 효능 별로 대응하는 상기 약물을 구성하는 성분으로 구성되고,
상기 산출하는 단계는,
상기 천연물 효능-처방 테이블 및 상기 천연물 처방-소재 테이블로부터 추출된 모든 효능 및 모든 천연물 소재에 대해 천연물 소재의 효능 빈도수로 구성된 복수개의 효능-소재 빈도표를 생성할 수 있다.
상기 효능-소재 빈도표는,
특정 효능에 대한 특정 천연물 소재의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 소재의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 소재들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 소재들의 빈도수(d)로 구성되고,
상기 선정하는 단계는,
상기 효능-소재 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 복수개의 효능-소재 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 단계, 상기 복수개의 효능-소재 빈도표 중에서 상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-소재 빈도표를 선정하는 단계, 선정된 하나 이상의 효능-소재 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 소재의 순위를 선정하는 단계, 그리고 선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 소재를 순서대로 나열하여 출력하는 단계를 포함하고,
출력된 상기 하나 이상의 천연물 소재를 통해 특정 효능에 해당하는 신규 천연물 소재 또는 천연물 소재의 신규 효능을 알 수 있다.
본 발명의 또 다른 특징에 따르면, 천연물 소재의 신규 효능 예측 방법은 이미 알려진 다양한 천연물 소재들에 관한 성분, 효능 및 처방 정보를 포함하는 천연물 관련 정보가 저장된 천연물 데이터베이스를 구축하는 단계,상기 천연물 관련 정보를 이용하여 천연물 소재를 구성하는 성분에 대한 효능 빈도수를 산출하는 단계, 상기 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 성분 및 약물 성분을 판별 및 선정하여 특정 효능에 대한 신규 천연물 성분 및 약물 성분을 예측하거나 또는 판별 및 선정된 하나 이상의 천연물 성분 및 약물 성분의 새로운 효능을 예측하는 단계, 그리고 상기 하나 이상의 천연물 성분 및 약물 성분들의 조합으로 구성된 새로운 천연물 소재를 예측하는 단계를 포함한다.
상기 구축하는 단계와 상기 산출하는 단계 사이에
천연물 효능-처방 테이블, 천연물 처방-소재 테이블, 천연물 소재-성분 테이블 및 약물 효능-성분 테이블을 생성하는 단계를 더 포함하고,
상기 천연물 효능-처방 테이블은 천연물 소재가 가질 수 있는 다양한 효능 별로 각각 대응되는 처방으로 구성되고, 상기 천연물 처방-소재 테이블은 천연물 소재가 포함된 처방 별로 각각 대응되는 천연물 소재로 구성되며, 상기 천연물 소재-성분 테이블은 천연물 소재 별로 각각의 천연물 소재를 구성하는 성분들로 구성되며, 상기 약물 효능-성분 테이블은 이미 알려진 약물 효능 별로 대응하는 상기 약물을 구성하는 성분으로 구성되고,
상기 산출하는 단계는,
상기 천연물 효능-처방 테이블, 상기 천연물 처방-소재 테이블, 상기 천연물 소재-성분 테이블 및 상기 약물 효능-성분 테이블로부터 추출된 모든 효능 및 모든 천연물 성분 및 약물 성분에 대해 천연물 성분 및 약물 성분의 효능 빈도수로 구성된 복수개의 효능-성분 빈도표를 생성할 수 있다.
상기 효능-성분 빈도표는,
특정 효능에 대한 특정 천연물 성분 및 약물 성분의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 성분 및 약물 성분의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 성분 및 약물 성분들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 성분들의 빈도수(d)로 구성되고,
상기 선정하는 단계는,
상기 효능-성분 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 복수개의 효능-성분 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 단계, 상기 복수개의 효능-성분 빈도표 중에서 상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-성분 빈도표를 선정하는 단계, 선정된 하나 이상의 효능-성분 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 성분 및 약물 성분의 순위를 선정하는 단계, 그리고 선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 성분 및 약물 성분을 순서대로 나열하여 출력하는 단계를 포함할 수 있다.
본 발명의 실시예에 따르면, 기업들이 초기 단계 비용을 대폭 축소할 수 있는 기술로서 관련 기업들이 구매하거나 기술이전을 받아 대규모 무작위 실험 검증이전에 범용으로 활용하게 될 가능성이 높다.
또한, 현재 천연물 신약, 건강식품, 기능성 화장품 개발에 있어 절대적인 수요가 있는 유효 천연물 후보 소재 및 후보 성분 발굴을 저 비용으로 단 시간에 수행할 수 있게 된다.
또한, 유효 천연물 후보 물질들은 사업화 목적과 발굴된 정보의 수준에 따라 검증 없이 상품화 할 수 있거나 소규모 실험 검증을 통한 상품화가 가능해져 천연물 소재가 요구되는 관련 산업분야에 적극적으로 활용될 수 있다.
또한, 종래에 신약 개발에서 오랫동안 제기되어 왔으나 이루지 못했던 후보 물질의 필요성 문제를 해결할 수 있다.
또한, 발굴 가능한 각 개별 성분들의 효능 유의성 정보는 천연물 성분 유래 신약 개발 신규 후보로 제공될 수 있고, 신약 개발 초기에 들어가는 대규모 후보 탐색 비용을 크게 절감할 수 있는 대체 기법으로 활용될 수 있다.
도 1은 본 발명의 실시예에 따른 천연물 소재 및 성분의 신규 효능 예측 시스템을 도시한 구성도이다.
도 2는 본 발명의 실시예에 따른 천연물 소재 및 성분의 신규 효능 예측 시스템의 세부적인 구성들간의 연결 관계를 나타낸 구성도이다.
도 3은 본 발명의 실시예에 따른 천연물 소재 및 성분의 신규 효능 예측 방법을 나타낸 순서도이다.
도 4는 본 발명의 한 실시예에 따른 천연물 소재를 발굴하는 과정을 나타낸 순서도이다.
도 5는 본 발명의 한 실시예에 따른 복수개의 효능-소재 빈도표의 예시도이다.
도 6은 본 발명의 한 실시예에 따른 천연물 소재 창출 예시도이다.
도 7은 본 발명의 다른 실시예에 따른 천연물 성분 및 약물 성분을 발굴하는 과정을 나타낸 순서도이다.
도 8은 본 발명의 다른 실시예에 따른 천연물 성분 및 약물 성분 창출 예시도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "…부", "…모듈" 의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이하, 도면을 참조로 하여 본 발명의 실시예에 따른 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법에 대하여 상세히 설명한다.
본 발명의 실시예에서 천연물 소재는 일반적으로 우리나라를 비롯한 동양권에서 오랜 기간 동안 질병 치료와 예방의 목적으로 사용되어온 것으로서, 천연 재료를 말한다. 천연물 성분의 예시로서, 녹차 카테킨(catechin), 포도씨 추출물(grape seed extract), 천연물 소재의 예시로서, 검정콩, 홍삼 등을 들 수 있다. 물론, 이에 국한되는 것은 아니다.
효능은 효험을 나타내는 능력으로서, 질병의 증상을 완화하거나 개선하는 능력을 나타내며, 예를 들면 미백 효과, 해열 등이 될 수 있다.
처방은 효능을 발현되도록 하기 위한 방법으로서, 예를 들면, '해열제로 버드나무 껍질을 끓여낸 물을 사용'하는 것이 될 수 있다.
천연물 소재는 다양한 성분의 조합으로 구성된다. 예컨대 버드나무 껍질은 천연물 소재에 해당하고, 버드나무 껍질에 포함된 살리실산은 성분이 된다. 그리고 이러한 살리실산 성분의 효능은 해열 작용이 된다.
여기서, 천연물 소재를 구성하는 성분들의 특성을 고려한다면, 천연물 소재의 알려진 편의(bias)된 효능 외에 다양한 효능을 가질 수 있는 가능성이 존재한다. 따라서, 알려진 부분적 효능 정보들을 종합하여 천연물 소재를 구성하는 성분들에 대한 요소 정보로 변환하고 성분 별로 효능 정보들을 다시 천연물 소재 수준으로 재조합하면, 현재까지 알려진 정보 수준에서 천연물 소재가 보유할 수 있는 가능한 모든 효능을 예측할 수 있다. 이러한 효능 예측을 구현하는 시스템은 다음과 같다.
도 1은 본 발명의 실시예에 따른 천연물 소재 및 성분의 신규 효능 예측 시스템을 도시한 구성도이고, 도 2는 본 발명의 실시예에 따른 천연물 소재 및 성분의 신규 효능 예측 시스템의 세부적인 구성들간의 연결 관계를 나타낸 구성도이다.
먼저, 도 1을 참조하면, 신규 효능 예측 시스템(100)은 입력부(101), 프로세서(103), 저장부(105) 및 출력부(107)를 포함하는 컴퓨터 기반 시스템일 수 있다. 이때, 입력부(101), 프로세서(103), 저장부(105) 및 출력부(107)는 하나의 장치 내에 구현될 수도 있지만, 이더넷이나 네트워크를 통해 서로 연결된 별개의 서버로 구현될 수도 있다.
입력부(101)는 데이터 수집 및 데이터 입력을 수행한다. 입력부(100)는 천연물 데이터베이스를 구축하는데 필요한 정보를 인터넷 상에서 수집하거나 또는 사용자로부터 입력받아 프로세서(103)로 출력한다.
프로세서(103)는 중앙처리 유닛(central processing unit, CPU)이나 기타 칩셋, 마이크로프로세서 등으로 구현될 수 있다.
저장부(105)는 저장 수단으로서, 도 2를 참조하면, 천연물 데이터베이스(123), 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127), 천연물 소재-성분 테이블(129) 및 약물 효능-성분 테이블(131)을 저장한다.
이때, 저장부(105)에 저장되는 정보들은 입력부(101)를 통해 새로 수집되거나 또는 입력되는 정보에 따라 갱신이 가능하다.
출력부(107)는 프로세서(103)의 동작에 따른 천연물 소재 및 성분의 신규 효능 예측 정보를 출력한다. 이때, 화면 상에 출력할 수도 있고, 인쇄물로 출력할 수도 있고, 사용자가 인지할 수 있는 다양한 방식으로 출력할 수 있다.
여기서, 프로세서(103)는 데이터 통합부(109), 효능-소재 빈도표 생성부(111), 효능-성분 빈도표 생성부(113), 소재별 효능 점수 산출부(115), 성분별 효능 점수 산출부(117), 소재 추출부(119) 및 성분 추출부(121)를 포함한다.
이때, 각 구성(109, 111, 113, 115, 117, 119, 121)은 하나의 프로세서(103) 내에 탑재된 형태로 도시하였으나, 이는 각 구성(109, 111, 113, 115, 117, 119, 121)이 프로세서 기반으로 동작하는 것을 의미하는 것으로, 하나의 프로세서(103)로 구현될 수도 있지만, 이더넷이나 네트워크를 통해 서로 연결된 별개의 서버로 구현될 수도 있다.
도 1 및 도 2를 참조하면, 데이터 통합부(109)는 입력부(101)를 통해 입력받거나 또는 수집된 다양한 천연물 및 이러한 다양한 천연물을 구성하는 성분들의 알려진 효능 정보 및 처방 정보들을 통합한다.
이때, 데이터 통합부(109)는 천연물 데이터베이스(123)에 저장된 천연물 관련 정보를 토대로 천연물 효능-처방 정보, 천연물 처방-소재 정보, 천연물 소재-성분 정보 및 약물 효능-성분 정보를 테이블 형태로 생성한다.
여기서, 천연물 데이터베이스(123)는 천연물 관련 정보를 저장하는데, 이러한 천연물 관련 정보는 다양한 천연물 소재들, 상기 다양한 천연물 소재들 각각의 효능들, 상기 다양한 천연물 소재들을 구성하는 각각의 성분들, 상기 각각의 성분들 별로 각각의 효능들, 처방들을 포함한다. 천연물 데이터베이스(123)는 논문과 서적을 포함하는 문헌 정보와, 인터넷 상의 문헌 정보를 포함한 퍼블릭 DB로부터 수작업으로 수집되어 구축된다. 퍼블릭 DB의 예시로서, Disease Ontology, DrugBank, TCM_ID 가 포함될 수 있으나, 이러한 퍼블릭 DB만으로 국한되는 것은 아니다.
데이터 통합부(109)는 천연물 데이터베이스(123)에 저장된 천연물 관련 정보를 토대로 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127), 천연물 소재-성분 테이블(129)을 생성한다. 그리고 약물 데이터베이스(200)에 저장된 약물 정보를 토대로 약물 효능-성분 테이블(131)을 생성한다. 여기서, 약물 데이터베이스(200)는 인터넷 상에 공개된 약물 DB일 수 있다. 약물 데이터베이스(200)는 약물 별로 성분, 효능 및 처방 중 적어도 하나 이상의 정보를 포함한다.
천연물 효능-처방 테이블(125)은 천연물 소재가 가질 수 있는 다양한 효능 별로 대응되는 처방으로 구성된다. 천연물 효능-처방 정보의 예시로서, '해열 작용(효능)-버드나무 껍질로 끓여낸 물(처방)'이 될 수 있다.
천연물 처방-소재 테이블(127)은 천연물 소재가 포함된 처방 별로 대응되는 천연물 소재로 구성된다. 천연물 처방-소재 정보의 예시로서, '버드나무 껍질로 끓여낸 물(처방)-버드나무 껍질(천연물 소재)'가 될 수 있다.
천연물 소재-성분 테이블(129)은 천연물 소재 별로 각각의 천연물 소재를 구성하는 성분들로 구성된다. 천연물 소재-성분 정보의 예시로서, '버드나무 껍질(천연물 소재)-살리실산(성분)'이 될 수 있다.
약물 효능-성분 테이블(131)은 약물 효능 별로 대응하는 상기 약물을 구성하는 성분으로 구성된다. 약물 효능-성분 정보의 예시로서, '뇌기능 개선 약물(nootropic drugs)(약물 효능)-인삼사포닌(성분)'이 될 수 있다.
효능-소재 빈도표 생성부(111)는 천연물 소재에 대한 효능 빈도를 정규화(normalization)한 효능-소재 빈도표(frequency table)를 생성한다. 이러한 효능-소재 빈도표는 천연물 효능-처방 테이블(125) 및 천연물 처방-소재 테이블(127)에 각각 저장된 정보들을 대상으로 생성되며, 복수개가 생성된다.
효능-성분 빈도표 생성부(113)는 천연물 소재를 구성하는 각각의 성분에 대한 효능 빈도를 정규화한 효능-성분 빈도표를 생성한다. 이러한 효능-성분 빈도표는 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127), 천연물 소재-성분 테이블(129) 및 약물 효능-성분 테이블(131)에 각각 저장된 정보들을 대상으로 생성되며, 복수개가 생성된다.
소재별 효능 점수 산출부(115)는 복수개의 효능-소재 빈도표를 개별 천연물 소재에 대한 효능 점수로 요소화한다. 그리고 각 천연물 소재의 효능 빈도를 이용한 천연물 소재 및 효능에 대한 상대적 유의성(significance)을 피셔 정확성 검증(Fisher's exact test)을 이용한 유의성값(p-value)과 승산비(Odds ratio, OR)를 통해 계산한다. 즉, 소재별 효능 점수 산출부(115)는 복수개의 효능-소재 빈도표에 대하여 실제로 해당 천연물 소재가 해당 효능에 유의한지 판단한다. 이때, 판단을 위해 피셔의 정확 검증을 이용한다. 그리고 유의성값(p-value) 0.05 이하의 값이 도출되어 유의하다고 판단된 하나 이상의 효능-소재 빈도표에 대해 각각의 승산비(ODDS)를 계산한다.
성분별 효능 점수 산출부(117)는 복수개의 효능-성분 빈도표를 개별 성분에 대한 효능 점수로 요소화한다. 그리고 각 천연물 성분 및 약물 성분의 효능 빈도를 이용한 천연물 성분 및 약물 성분 및 효능에 대한 상대적 유의성을 피셔 정확성 검증을 이용한 유의성값(p-value)과 승산비(OR)를 통해 계산한다. 즉, 복수개의 효능-성분 빈도표에 대하여 실제로 해당 천연물 성분 및 약물 성분이 해당 효능에 유의한지 판단한다. 이때, 판단을 위해 피셔의 정확 검증을 이용한다. 그리고 유의성값(p-value)이 0.05 이하의 값이 도출되어 유의하다고 판단된 하나 이상의 효능-소재 빈도표에 대해 각각의 승산비(ODDS)를 계산한다.
하나의 실시예에 따르면, 소재 추출부(119)는 소재별 효능 점수 산출부(115)가 요소화한 효능 점수들을 이용하여 천연물 소재의 새로운 효능을 예측 및 발굴한다.
소재 추출부(119)는 유의하다고 판단된 하나 이상의 효능-소재 빈도표에 대한 각각의 승산비(ODDS)를 기준으로 효능 별 천연물 소재의 순위를 선정한다. 그리고 선정된 천연물 소재의 유의성값(p-value)을 기준으로 특정 효능을 나타내는 천연물 소재 및 천연물 소재들의 조합을 추출하여 출력부(107)로 출력한다.
다른 실시예에 따르면, 소재 추출부(119)는 성분 추출부(121)에서 추출되어 전달된 성분들과 천연물 소재-성분 테이블(129)을 이용하여 개별 천연물 소재를 추출한다.
천연물 소재-성분 테이블(129)에는 천연물 소재 별로 천연물 소재를 구성하는 하나 이상의 성분을 포함하므로, 천연물 소재-성분 테이블(129)을 이용하면, 성분 추출부(121)에서 추출되어 전달된 성분이 어떤 개별 천연물 소재에 포함되는지를 알 수 있다.
따라서, 소재 추출부(119)는 성분 추출부(121)에서 추출되어 전달된 개별 성분을 포함하고 있는 단일 신규 소재와 효능, 그리고 개별 성분들의 조합으로 이루어진 단일 신규 소재와 효능, 그리고 개별 성분들을 포함하고 있는 소재들의 조합과 그 효능을 예측한다. 예를들어, 후술할 도 8의 RANK 28과 RANK 35를 보면, DRUGTYPE에 소재 M1의 성분이라고 명시되어 있다. 이처럼 천연물 소재-성분 테이블(129)을 이용하면, RNAK 28과 RANK 35로부터 소재 M1을 예측할 수 있다. 이처럼, 유의한 개별 성분이 포함되어 신규 효능을 지닌 개별 천연물 소재들과, 이러한 개별 천연물 소재들의 조합을 출력부(107)로 출력할 수 있다.
성분 추출부(121)는 성분별 효능 점수 산출부(117)가 요소화한 효능 점수들을 이용하여 천연물 성분 및 약물 성분의 새로운 효능을 예측 및 발굴한다.
성분 추출부(121)는 유의하다고 판단된 하나 이상의 효능-성분 빈도표에 대한 각각의 승산비(ODDS)를 기준으로 효능 별 천연물 성분 및 약물 성분의 순위를 선정한다. 그리고 선정된 천연물 성분 및 약물 성분의 유의성값(p-value)을 기준으로 특정 효능을 나타내는 천연물 및 약물의 개별 성분 및 조합을 추출하여 출력부(107)로 출력한다. 그리고 추출한 천연물 성분들의 조합은 소재 추출부(119)로 전달된다.
성분 추출부(121)는 천연물 및 약물의 개별 성분을 추출함으로써, 성분 자체의 새로운 효능을 예측할 수 있다.
여기서, 효능-소재 빈도표 생성부(111), 효능-성분 빈도표 생성부(113), 소재별 효능 점수 산출부(115), 성분별 효능 점수 산출부(117), 소재 추출부(119) 및 성분 추출부(121)의 동작은 수집된 정보 양에 따라 수만에서 수십만 번의 유의성 계산을 포함하는 것으로서, 고속 계산을 위해 분산 컴퓨팅을 이용하여 병렬화 계산기법을 활용할 수 있다.
전술한 천연물 소재 및 성분의 신규 효능 예측 시스템(100)의 동작에 대해 설명하면 다음과 같다.
도 3은 본 발명의 실시예에 따른 천연물 소재 및 성분의 신규 효능 예측 방법을 나타낸 순서도이다.
도 3을 참조하면, 데이터 통합부(109)는 천연물 데이터베이스(도 2의 105)를 구축(S101)한다. 그리고 데이터 통합부(109)는 천연물 데이터베이스(도 2의 105)에 저장된 정보를 토대로 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127), 천연물 소재-성분 테이블(129)을 생성하고, 약물 데이터베이스(200)에 저장된 약물 정보를 토대로 약물 효능-성분 테이블(131)을 생성한다(S103).
효능-소재 빈도표 생성부(111)는 S103 단계에서 생성된 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127)을 토대로 천연물 소재에 대한 효능 빈도를 정규화한 효능-소재 빈도표를 생성한다(S105).
소재별 효능 점수 산출부(115) 및 소재 추출부(119)는 S105 단계에서 생성한 효능-소재 빈도표를 이용하여 효능과 소재간 유의성을 검증하고, 유의성이 검증된 효능-소재 빈도표에 대한 승산비를 기준으로 하나 이상의 천연물 소재를 선정하여 출력한다(S107).
효능-성분 빈도표 생성부(113)는 S103 단계에서 생성된 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127), 천연물 소재-성분 테이블(129), 약물 효능-성분 테이블(131)을 토대로 천연물 성분 및 약물 성분에 대한 효능 빈도를 정규화한 효능-성분 빈도표를 생성한다(S109).
성분별 효능 점수 산출부(117) 및 성분 추출부(121)는 S107 단계에서 생성한 효능-성분 빈도표를 이용하여 효능과 성분간 유의성을 검증하고, 유의성이 검증된 효능-성분 빈도표에 대한 승산비를 기준으로 하나 이상의 천연물 성분 및 약물 성분을 선정하여 출력한다(S111).
도 4는 본 발명의 한 실시예에 따른 신규 천연물 소재를 발굴하는 과정을 나타낸 순서도로서, 도 3의 S105 단계 및 S107 단계를 상세히 나타낸 순서도이다.
도 4를 참조하면, 효능-소재 빈도표 생성부(111)는 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127)을 참고하여 효능 별로 해당 효능을 발현하는 여러가지 천연물 소재의 빈도수를 계산한다. 그리고 효능 및 천연물 소재 간의 빈도수로 구성된 효능-소재 빈도표를 생성한다(S201).
효능 N1에 해당하는 천연물 소재(M1, M2, M3), 효능 N2에 해당하는 천연물 소재(M1, M3, M4, M5), 효능 N3에 해당하는 천연물 소재(M1, M2)가 있다고 가정하면, M1의 효능 N1에 대한 빈도수(a)는 1이 되고, M1이 나타나는 그 외의 효능은 N2, N3이므로, 그 외의 효능에 대한 빈도수(c)는 2가 된다. 그리고 효능 N1이 나타나는 천연물 소재는 M1, M2, M3이므로, 그 외의 천연물 소재에 대한 효능 N1의 빈도수(b)는 2가 된다. 이때, 하나의 천연물 소재(M)는 n개의 효능(N1, …, NK, K≥1)을 가질 수 있다.
이와 같은 방식으로, 효능-소재 빈도표를 생성하면, 다음 표 1과 같이 구현될 수 있다. 빈도표는 2×2로 구현된다.
천연물 소재 효능 N1 그 외의 효능
M1 빈도수 a 빈도수 c a+c
그 외의 천연물 소재 빈도수 b 빈도수 d b+d
a+b c+d a+b+c+d
여기서, 표 1의 첫번째 행은 특정 효능을 나타내는 특정 천연물 소재가 수록되고, 두번째 행은 특정 효능을 나타내되 특정 천연물 소재를 제외한 나머지 천연물 소재가 수록된다. 그리고 첫번째 열은 특정 천연물 소재의 특정 효능이 수록되고, 두번째 열은 특정 천연물 소재의 특정 효능을 제외한 나머지 효능이 수록된다.
이때, a는 표 1의 1행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 천연물 소재의 특정 효능에 대한 빈도수를 의미하는 변수를 나타낸다.
b는 표 1의 2행의 1열에 수록되는 빈도수를 의미한다. 즉, 특정 천연물 소재를 제외한 나머지 천연물 소재의 특정 효능에 대한 빈도수를 의미하는 변수(variable)이다.
c는 표 1의 1행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 천연물 소재의 특정 효능을 제외한 나머지 효능에 대한 빈도수를 의미하는 변수이다.
d는 표 1의 2행의 2열에 수록되는 빈도수를 의미한다. 즉, 특정 천연물 소재를 제외한 나머지 천연물 소재의 특정 효능을 제외한 나머지 효능에 대한 빈도수를 의미하는 변수이다.
효능-소재 빈도표 생성부(111)는 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127)에 저장된 모든 효능 및 모든 천연물 소재에 대해 표 1과 같은 복수개의 효능-소재 빈도표를 생성(S201)하며, 복수개의 효능-소재 빈도표는 도 5와 같이 생성될 수 있다.
도 5는 본 발명의 한 실시예에 따른 복수개의 효능-소재 빈도표의 예시도이다. 특히, 도 5는 특정 효능(N1)에 대한 다수의 천연물 소재(M1, M2, M3)간의 빈도표를 나타낸 것으로서, 도 5의 (a)는 효능 N1에 대한 천연물 소재 M1의 빈도표를 나타낸 것이고, 도 5의 (b)는 효능 N1에 대한 천연물 소재 M2의 빈도표를 나타낸 것이며, 도 5의 (c)는 효능 N1에 대한 천연물 소재 M3의 빈도표를 나타낸 것이다.
도 5는 효능 N1에 대한 빈도표들을 나타냈지만, 다른 효능에 대한 빈도표들도 마찬가지로 생성된다.
다시, 도 4를 참조하면, 다음, 소재별 효능 점수 산출부(115)는 복수개의 효능-소재 빈도표를 개별 천연물 소재에 대한 효능 점수로 요소화한다(S203). 즉, 복수개의 효능-소재 빈도표에 대해 각각의 승산비(ODDS) 및 각각의 유의성 검증값(p-value)을 계산한다.
소재별 효능 점수 산출부(115)는 표 1과 같은 효능-소재 빈도표에 대한 승산비를 계산하는데, 다음 수학식 1과 같이 계산된다.
Figure pat00001
여기서, a, b, c, d는 각각 표 1에서 해당 빈도수를 나타낸다.
이러한 승산비는 복수개의 효능-소재 빈도표에 대해 각각 생성되는데, 예를 들면, 도 5의 (a), (b), (c)에 대해 각각의 승산비가 계산된다.
복수개의 효능-소재 빈도표를 구성하는 효능과 천연물 소재 간의 유의성은 피셔의 정확 검증을 통해 검증된다. 즉, 표 1을 구성하는 각 정보에 대한 유의성 검증값(p-value)은 다음 수학식 2를 통해 계산된다.
Figure pat00002
여기서, a, b, c, d는 표 1에서 해당 빈도수를 나타낸다. n은 a+b+c+d와 같다.
이때, 소재별 효능 점수 산출부(115)는 복수개의 효능-소재 빈도표 중에서 유의성 검증값(p-value)이 기 정의된 임계치, 예를 들면, 0.05 이하에 해당하는 효능-소재 빈도표를 선정하고, 선정된 효능-소재 빈도표의 천연물 소재가 해당 효능에 대해 유의하다고 판단한다. 예를들면, 표 1에 대한 유의성 검증값이 0.05 이하라면, 천연물 소재(M1)가 효능(N1)에 대해 유의하다고 판단한다.
소재 추출부(119)는 S203 단계에서 계산된 효능 점수를 기준으로 효능 별 천연물 소재의 순위를 선정한다(S205). 즉, 소재 추출부(119)는 유의하다고 판단된 천연물 소재와 효능 정보를 추출하고, 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 소재의 순위를 선정한다(S205).
예를들면, 도 5의 (a), (b), (c) 모두 유의하다고 판단된 경우, 도 5의 (a)의 승산비가 386.9866, 도 5의 (b)의 승산비가 683.4677, 도 5의 (c)의 승산비가 208.4295이라면, 소재 추출부(119)는 효능 N1에 대해 M2, M1, M3 순으로 순위를 선정한다. 즉, M2가 가장 순위가 높고, 그 다음으로 M1, M3의 순서로 순위가 선정된다.
소재 추출부(119)는 S205 단계에서 선정된 효능 별로 하나 이상의 천연물 소재를 순위대로 나열하여 출력한다(S207). 예를 들면, 도 6과 같이 출력할 수 있다.
도 6은 본 발명의 한 실시예에 따른 천연물 소재 창출 예시도이다.
도 6을 참조하면, 소재 추출부(119)가 출력하는 정보는 RANK(순위) 필드, HERBID(식별자) 필드, ODDS(승산비) 필드, PVALUE(유의성 검증값) 필드 및 HERBNAME 필드로 구성된다.
소재 추출부(119)는 효능 N1에 대해 승산비가 높은 순서대로 M2, M1, M3 순으로 천연물 소재를 나열한다. 이때, 순서가 RANK(순위) 필드에 수록된다. HERBID(식별자) 필드에는 소재를 구분하기 위한 식별자가 수록된다. ODDS(승산비) 필드 및 PVALUE(유의성 검증값) 필드에는 전술한 방식에 따라 계산된 승산비 및 유의성 검증값(p-value)이 각각 수록된다. HERBNAME 필드에는 천연물 소재명이 수록된다.
소재 M1에 해당하는 Cephalotaxus fortunei는 현재 해당 질병에 효능이 있다고 알려진 천연물 소재이다. 즉, 현재 약물에서는 효능 N1에 대해 천연물 소재 M1을 이용하고 있지만, 소재 추출부(119)의 출력 결과를 통해서 M2라는 천연물 소재가 효능 N1에 대해 더 효능이 있음을 알 수 있다.
이처럼, 소재 추출부(119)의 출력 결과를 통해 효능 N1에 대해 기존에는 알려지지 않거나 또는 사용되고 있지 않은 신규 천연물 소재를 발굴할 수 있게 된다.
또한, HERBNAME에 기재된 소재의 효능이 효능 N1과 다르다면, 기존에는 N2라는 효능을 나타내는 것으로 알려져 있던 M2이라는 천연물 소재가 효능 N1을 나타내는 것을 알 수 있으므로, 천연물 소재 M2의 새로운 효능을 발굴할 수 있게 된다.
도 7은 본 발명의 다른 실시예에 따른 신규 천연물 성분 및 약물 성분을 발굴하는 과정을 나타낸 순서도로서, 도 3의 S109 단계 및 S111 단계를 상세히 나타낸 순서도이다.
효능-성분 빈도표 생성부(113)는 효능-성분 빈도표는 천연물 효능-처방 테이블(125), 천연물 처방-소재 테이블(127), 천연물 소재-성분 테이블(129) 및 약물 효능-성분 테이블(131)을 토대로 효능 별로 해당 효능을 발현하는 여러가지 천연물 성분 및 약물 성분의 빈도수를 계산한다. 그리고 효능 및 천연물 성분 및 약물 성분간의 빈도수로 구성된 효능-성분 빈도표를 생성한다(S301).
여기서, 1개의 천연물 소재(M)는 n개의 성분(M1, …, Mn, n≥1)으로 구성된다. 1개의 성분(Mn)은 n개의 효능(N1, …, NK, K≥1)을 가질 수 있다.
이때, 효능 N1에 해당하는 천연물 소재(M1, M2, M3)가 있다고 가정한다. M1은 3개의 성분(M11, M12, M13)으로 구성된다. M2는 2개의 성분(M21, M22)으로 구성된다. M3는 4개의 성분(M11, M31, M32, M33)으로 구성된다.
여기서, 성분 M11이 효능 N1에 해당하는 빈도수는 2이다. 즉, 천연물 소재 M1, M3에서 각각 2번 나타났으므로, 빈도수(a)는 2가 된다. 그리고 그 외의 성분에 대한 효능 N1의 빈도수(b)는 성분 M11을 제외하고, 효능 N1이 나타나는 M1, M2, M3를 구성하는 모든 성분이 된다.
여기서, 모든 성분은 M12, M13, M21, M22, M31, M32, M33로, 빈도수(b)는 7이 된다. 이와 같은 방식으로, 효능-성분 간의 빈도표를 구현하면, 다음 표 2와 같다. 빈도표는 2×2로 구현된다. 아래 표 2는 표 1과 대상, 즉 천연물 소재인지 천연물 성분인지만 달리할 뿐 구성은 동일하다. 즉, 표 1과 달리 표 2의 행에는 천연물 성분이 수록된다. 그리고 천연물 성분 및 약물 성분에 대한 빈도수가 수록된다.
효능 N1 그 외의 효능
성분 M11 빈도수 a 빈도수 c a+c
그 외의 성분 빈도수 b 빈도수 d b+d
a+b c+d a+b+c+d
이때, 효능 N1이 나타나는 천연물 성분 및 약물 성분은 M12, M13, M21, M22, M31, M32, M33이므로 효능 N1에 대한 효능-성분 빈도표는 M11을 포함하여 총 8개이다. 이처럼, 효능-성분 빈도표 생성부(113)는 천연물 처방-소재 테이블(127), 천연물 소재-성분 테이블(129) 및 약물 효능-성분 테이블(131)에 저장된 모든 효능 및 모든 천연물 성분 및 약물 성분에 대해 표 2와 같은 복수개의 효능-성분 빈도표를 생성(S301)한다.
다음, 성분별 효능 점수 산출부(117)는 복수개의 효능-성분 빈도표를 개별 천연물 성분 및 약물 성분에 대한 효능 점수로 요소화한다(S303). 즉, 복수개의 효능-성분 빈도표에 대해 각각의 승산비(ODDS) 및 각각의 유의성 검증값(p-value)을 계산한다. 이때, 승산비(ODDS) 및 유의성 검증값(p-value)은 수학식 1, 수학식 2와 같이 계산된다. 그리고 수학식1, 2에 대한 변수(a, b, c, d, n)는 표 2의 빈도수를 이용한다.
성분별 효능 점수 산출부(117)는 복수개의 효능-성분 빈도표 중에서 유의성 검증값(p-value)이 기 정의된 임계치를 충족(예, 0.05 이하)하면, 해당 효능-성분 빈도표의 천연물 성분 및 약물 성분은 해당 효능에 대해 유의하다고 판단한다.
성분 추출부(121)는 S303 단계에서 계산된 효능 점수를 기준으로 효능 별 천연물 소재의 순위를 선정한다(S305). 즉, 성분 추출부(121)는 유의하다고 판단된 천연물 성분 및 약물 성분과 효능 정보를 추출하고, 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 성분 및 약물 성분의 순위를 선정한다(S305).
성분 추출부(121)는 S305 단계에서 선정된 효능 별로 하나 이상의 천연물성분을 순위대로 나열하여 출력한다(S307).
여기서, S305 단계, S307 단계는 도 4의 S205 단계, S207 단계의 절차와 동일하게 이루어진다.
이때, 성분 추출부(121)는 도 8과 같이 출력할 수 있다. 도 8은 본 발명의 다른 실시예에 따른 천연물 성분 및 약물 성분의 창출 예시도이다.
도 8을 참조하면, 성분 추출부(121)가 출력하는 정보는 RANK(순위) 필드, COMPID(식별자) 필드, ODDS(승산비) 필드, PVALUE(유의성 검증값) 필드, DRUGTYPE 필드 및 COMPNAME 필드로 구성된다.
여기서, RANK(순위) 필드는 ODDS(승산비) 필드에 수록된 승산비 값에 따른 순위를 나타낸다. 이때, 승산비값이 높은 순서대로 순위가 정해진다. COMPID(식별자) 필드는 천연물 성분 및 약물 성분을 구분하기 위해 부여된 식별자가 수록된다. 이때, 모든 식별자를 기록하지 않고, 설명에 필요한 해당 부분의 식별자만 기재하였다. ODDS(승산비) 필드 및 PVALUE(유의성 검증값) 필드는 전술한 방식에 따라 계산된 승산비값 및 유의성 검증값(p-value)이 각각 수록된다. DRUGTYPE 필드에 DRUG이라고 명시된 성분은 현재 해당 질병에 사용되고 있는 실제 약물을 나타낸다. COMPNAME 필드는 성분명 또는 약물 성분명이 수록된다.
성분 추출부(121)는 효능 N1에 대해 승산비가 높은 순서대로 천연물 성분 및 약물 성분을 나열한다.
즉, 현재는 효능 N1에 대해 성분 Pegaspargase을 이용하고 있지만, 성분 추출부(121)의 출력 결과를 통해서 M21, M32라는 성분이 효능 N1에 대해 더 효능이 있음을 알 수 있다.
이처럼, 성분 추출부(121)의 출력 결과를 통해 효능 N1에 대해 기존에는 알려지지 않거나 또는 사용되고 있지 않은 신규 성분을 발굴할 수 있게 된다.
또한, 성분 추출부(121)에서 출력된 기존에는 N2라는 효능을 나타내는 것으로 알려져 있던 성분 M41이 효능 N1을 나타내는 것을 알 수 있으므로, 성분 M41의 새로운 효능을 발굴할 수 있게 된다. 그리고 성분 M41가 포함된 천연물 소재의 새로운 효능을 발굴할 수 있게 된다.
또한, deoxyharringtonine으로 알려진 M11와, apigenin으로 알려진 M12는 소재 M1의 성분이므로, 특정 효능에 대한 성분을 추출함으로써, 해당 성분의 천연물 소재 M1을 예측할 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (14)

  1. 컴퓨터 기반의 천연물 소재 및 성분의 신규 효능 예측 시스템으로서,
    이미 알려진 다양한 천연물 소재들에 관한 성분, 효능 및 처방 정보를 포함하는 천연물 관련 정보가 저장된 천연물 데이터베이스,
    상기 천연물 관련 정보로부터 산출된 천연물 소재에 대한 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 소재를 판별 및 선정하는 소재 추출부,
    상기 천연물 관련 정보로부터 산출된 상기 다양한 천연물 소재를 구성하는 각각의 천연물 성분 및 약물 성분에 대한 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 성분 및 약물 성분을 판별 및 선정하는 성분 추출부, 그리고
    상기 성분 추출부에서 추출된 개별 성분 및 성분 조합으로 이루어진 단일 천연물 소재들과 상기 단일 천연물 소재들의 조합을 추출하는 소재 추출부를 포함하고,
    상기 성분 추출부에서 추출된 성분들 및 성분들의 조합과, 상기 소재 추출부에서 추출된 소재들 및 소재들의 조합을 통해 새로운 효능을 예측할 수 있는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  2. 제1항에 있어서,
    상기 통계적 유의성의 판별은,
    승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 이용하는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  3. 제1항에 있어서,
    상기 천연물 관련 정보로부터 천연물 소재가 가질 수 있는 다양한 효능 별로 각각 대응되는 처방으로 구성된 천연물 효능-처방 테이블, 천연물 소재가 포함된 처방 별로 각각 대응되는 천연물 소재로 구성된 천연물 처방-소재 테이블 및 천연물 소재 별로 각각의 천연물 소재를 구성하는 성분들로 구성된 천연물 소재-성분 테이블을 생성하고, 이미 알려진 약물 효능 별로 대응하는 상기 약물을 구성하는 성분으로 구성된 약물 효능-성분 테이블을 생성하는 데이터 통합부를 더 포함하고,
    상기 천연물 소재에 대한 효능 빈도수는
    상기 천연물 효능-처방 테이블 및 상기 천연물 처방-소재 테이블로부터 도출되고,
    상기 천연물 성분 및 약물 성분에 대한 효능 빈도수는
    상기 천연물 효능-처방 테이블, 상기 천연물 처방-소재 테이블, 상기 천연물 소재-성분 테이블 및 상기 약물 효능-성분 테이블로부터 도출되는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  4. 제3항에 있어서,
    상기 천연물 효능-처방 테이블 및 상기 천연물 처방-소재 테이블로부터 추출된 모든 효능 및 모든 천연물 소재에 대해 천연물 소재의 효능 빈도수로 구성된 복수개의 효능-소재 빈도표를 생성하는 효능-소재 빈도표 생성부, 그리고 상기 복수개의 효능-소재 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 소재별 효능 점수 산출부를 더 포함하고,
    상기 소재 추출부는,
    상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-소재 빈도표를 선정하고, 선정된 하나 이상의 효능-소재 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 소재의 순위를 선정하며, 선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 소재를 순서대로 나열하여 출력하는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  5. 제4항에 있어서,
    상기 효능-소재 빈도표는,
    특정 효능에 대한 특정 천연물 소재의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 소재의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 소재들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 소재들의 빈도수(d)로 구성되고,
    상기 소재별 효능 점수 산출부는,
    상기 효능-소재 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 특정 효능에 대한 상기 특정 천연물 소재의 효능-소재 빈도표의 승산비 및 유의확률을 각각 계산하는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  6. 제3항에 있어서,
    상기 천연물 효능-처방 테이블, 상기 천연물 처방-소재 테이블, 상기 천연물 소재-성분 테이블 및 상기 약물 효능-성분 테이블로부터 추출된 모든 효능 및 모든 천연물 성분 및 약물 성분에 대해 천연물 성분 및 약물 성분의 효능 빈도수로 구성된 복수개의 효능-성분 빈도표를 생성하는 효능-성분 빈도표 생성부, 그리고
    상기 복수개의 효능-성분 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 성분별 효능 점수 산출부를 더 포함하고,
    상기 성분 추출부는,
    상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-성분 빈도표를 선정하고, 선정된 하나 이상의 효능-성분 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 성분 및 약물 성분의 순위를 선정하며, 선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 성분 및 약물 성분을 순서대로 나열하여 출력하고,
    출력된 상기 특정 효능에 대한 성분들을 통해 성분의 새로운 효능 또는 상기 특정 효능을 가지는 새로운 성분을 예측할 수 있는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  7. 제6항에 있어서,
    상기 성분 추출부로부터 상기 하나 이상의 천연물 성분 및 약물 성분을 전달받고, 상기 하나 이상의 천연물 성분 및 약물 성분과, 상기 천연물 소재-성분 테이블을 이용하여 상기 하나 이상의 천연물 성분 및 약물 성분으로 구성된 천연물 소재들 및 상기 천연물 소재들의 조합을 출력하는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  8. 제6항에 있어서,
    상기 효능-성분 빈도표는,
    특정 효능에 대한 특정 천연물 성분 및 약물 성분의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 성분 및 약물 성분의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 성분들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 성분 및 약물 성분의 빈도수(d)로 구성되고,
    상기 성분별 효능 점수 산출부는,
    상기 효능-성분 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 유의확률 및 상기 승산비를 산출하는 천연물 소재 및 성분의 신규 효능 예측 시스템.
  9. 이미 알려진 다양한 천연물 소재들에 관한 성분, 효능 및 처방 정보를 포함하는 천연물 관련 정보가 저장된 천연물 데이터베이스를 구축하는 단계,
    상기 천연물 관련 정보를 이용하여 천연물 소재에 대한 효능 빈도수를 산출하는 단계, 그리고
    상기 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 소재 및 그 조합과 소재의 신규 효능을 판별 및 선정하는 단계
    를 포함하는 천연물 소재의 신규 효능 예측 방법.
  10. 제9항에 있어서,
    상기 구축하는 단계와 상기 산출하는 단계 사이에
    천연물 효능-처방 테이블, 천연물 처방-소재 테이블, 천연물 소재-성분 테이블 및 약물 효능-성분 테이블을 생성하는 단계를 더 포함하고,
    상기 천연물 효능-처방 테이블은 천연물 소재가 가질 수 있는 다양한 효능 별로 각각 대응되는 처방으로 구성되고, 상기 천연물 처방-소재 테이블은 천연물 소재가 포함된 처방 별로 각각 대응되는 천연물 소재로 구성되며, 상기 천연물 소재-성분 테이블은 천연물 소재 별로 각각의 천연물 소재를 구성하는 성분들로 구성되며, 상기 약물 효능-성분 테이블은 이미 알려진 약물 효능 별로 대응하는 상기 약물을 구성하는 성분으로 구성되고,
    상기 산출하는 단계는,
    상기 천연물 효능-처방 테이블 및 상기 천연물 처방-소재 테이블로부터 추출된 모든 효능 및 모든 천연물 소재에 대해 천연물 소재의 효능 빈도수로 구성된 복수개의 효능-소재 빈도표를 생성하는 천연물 소재의 신규 효능 예측 방법.
  11. 제10항에 있어서,
    상기 효능-소재 빈도표는,
    특정 효능에 대한 특정 천연물 소재의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 소재의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 소재들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 소재들의 빈도수(d)로 구성되고,
    상기 선정하는 단계는,
    상기 효능-소재 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 복수개의 효능-소재 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 단계,
    상기 복수개의 효능-소재 빈도표 중에서 상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-소재 빈도표를 선정하는 단계,
    선정된 하나 이상의 효능-소재 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 소재의 순위를 선정하는 단계, 그리고
    선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 소재를 순서대로 나열하여 출력하는 단계를 포함하고,
    출력된 상기 하나 이상의 천연물 소재를 통해 특정 효능에 해당하는 신규 천연물 소재 또는 천연물 소재의 신규 효능을 알 수 있는 단계를 포함하는 천연물 소재의 신규 효능 예측 방법.
  12. 이미 알려진 다양한 천연물 소재들에 관한 성분, 효능 및 처방 정보를 포함하는 천연물 관련 정보가 저장된 천연물 데이터베이스를 구축하는 단계,
    상기 천연물 관련 정보를 이용하여 천연물 소재를 구성하는 성분에 대한 효능 빈도수를 산출하는 단계,
    상기 효능 빈도수를 이용하여 효능 별로 해당 효능에 대해 통계적으로 유의성을 갖는 하나 이상의 천연물 성분 및 약물 성분을 판별 및 선정하여 특정 효능에 대한 신규 천연물 성분 및 약물 성분을 예측하거나 또는 판별 및 선정된 하나 이상의 천연물 성분 및 약물 성분의 새로운 효능을 예측하는 단계, 그리고
    상기 하나 이상의 천연물 성분 및 약물 성분들의 조합으로 구성된 새로운 천연물 소재를 예측하는 단계
    를 포함하는 천연물 성분 및 약물 성분의 신규 효능 예측 방법.
  13. 제12항에 있어서,
    상기 구축하는 단계와 상기 산출하는 단계 사이에
    천연물 효능-처방 테이블, 천연물 처방-소재 테이블, 천연물 소재-성분 테이블 및 약물 효능-성분 테이블을 생성하는 단계를 더 포함하고,
    상기 천연물 효능-처방 테이블은 천연물 소재가 가질 수 있는 다양한 효능 별로 각각 대응되는 처방으로 구성되고, 상기 천연물 처방-소재 테이블은 천연물 소재가 포함된 처방 별로 각각 대응되는 천연물 소재로 구성되며, 상기 천연물 소재-성분 테이블은 천연물 소재 별로 각각의 천연물 소재를 구성하는 성분들로 구성되며, 상기 약물 효능-성분 테이블은 이미 알려진 약물 효능 별로 대응하는 상기 약물을 구성하는 성분으로 구성되고,
    상기 산출하는 단계는,
    상기 천연물 효능-처방 테이블, 상기 천연물 처방-소재 테이블, 상기 천연물 소재-성분 테이블 및 상기 약물 효능-성분 테이블로부터 추출된 모든 효능 및 모든 천연물 성분 및 약물 성분에 대해 천연물 성분 및 약물 성분의 효능 빈도수로 구성된 복수개의 효능-성분 빈도표를 생성하는 천연물 성분 및 약물 성분의 신규 효능 예측 방법.
  14. 제13항에 있어서,
    상기 효능-성분 빈도표는,
    특정 효능에 대한 특정 천연물 성분 및 약물 성분의 빈도수(a), 상기 특정 효능을 제외한 나머지 효능에 대한 상기 특정 천연물 성분 및 약물 성분의 빈도수(b), 상기 특정 효능에 대한 상기 특정 천연물 소재를 제외한 나머지 천연물 성분 및 약물 성분들의 빈도수(c) 및 상기 나머지 효능에 대한 상기 나머지 천연물 성분들의 빈도수(d)로 구성되고,
    상기 선정하는 단계는,
    상기 효능-성분 빈도표에 포함된 빈도수들(a, b, c, d)을 이용하여 상기 복수개의 효능-성분 빈도표 각각에 대해 승산비(Odds ratio, OR) 및 피셔의 정확성 검증(Fisher's exact test)의 유의확률(p-value)을 산출하는 단계,
    상기 복수개의 효능-성분 빈도표 중에서 상기 유의확률이 기 정의된 임계치를 충족하는 하나 이상의 효능-성분 빈도표를 선정하는 단계,
    선정된 하나 이상의 효능-성분 빈도표의 승산비를 기준으로 특정 효능에 대한 하나 이상의 천연물 성분 및 약물 성분의 순위를 선정하는 단계, 그리고
    선정된 순위에 따라 상기 특정 효능에 대한 상기 하나 이상의 천연물 성분 및 약물 성분을 순서대로 나열하여 출력하는 단계
    를 포함하는 천연물 성분의 신규 효능 예측 방법.
KR1020150179267A 2015-10-13 2015-12-15 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법 KR101848074B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2015/013811 WO2017065351A1 (ko) 2015-10-13 2015-12-16 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020150142763 2015-10-13
KR20150142763 2015-10-13

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020180039961A Division KR101927911B1 (ko) 2015-10-13 2018-04-05 구성성분 및 효능정보 기반 천연물 소재 및 성분의 신규 효능 예측 시스템

Publications (2)

Publication Number Publication Date
KR20170043418A true KR20170043418A (ko) 2017-04-21
KR101848074B1 KR101848074B1 (ko) 2018-04-11

Family

ID=58705550

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020150179267A KR101848074B1 (ko) 2015-10-13 2015-12-15 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법
KR1020180039961A KR101927911B1 (ko) 2015-10-13 2018-04-05 구성성분 및 효능정보 기반 천연물 소재 및 성분의 신규 효능 예측 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020180039961A KR101927911B1 (ko) 2015-10-13 2018-04-05 구성성분 및 효능정보 기반 천연물 소재 및 성분의 신규 효능 예측 시스템

Country Status (1)

Country Link
KR (2) KR101848074B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102157579B1 (ko) * 2018-10-04 2020-09-18 재단법인 전통천연물기반 유전자동의보감 사업단 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템
KR20220069209A (ko) 2020-11-20 2022-05-27 김남희 식약동원 천연원료에 관한 정보제공 시스템

Also Published As

Publication number Publication date
KR101848074B1 (ko) 2018-04-11
KR101927911B1 (ko) 2018-12-11
KR20180039042A (ko) 2018-04-17

Similar Documents

Publication Publication Date Title
Bailey Current regulatory guidelines and resources to support research of dietary supplements in the United States
Shim et al. Socioeconomic characteristics and trends in the consumption of ultra-processed foods in Korea from 2010 to 2018
Elliott et al. Nutritional genomics
Itz et al. Clinical course of non‐specific low back pain: A systematic review of prospective cohort studies set in primary care
Daviglus et al. Risk factors and preventive interventions for Alzheimer disease: state of the science
Elsner et al. Transcranial direct current stimulation (tDCS) for improving function and activities of daily living in patients after stroke
Bongaarts Human population growth and the demographic transition
Zhou et al. Mapping theme trends and recognizing hot spots in postmenopausal osteoporosis research: a bibliometric analysis
Weerasekara et al. Nutrition transition and traditional food cultural changes in Sri Lanka during colonization and post-colonization
Ning et al. Premedication for the prevention of nonhemolytic transfusion reactions: a systematic review and meta‐analysis
Moazzami et al. Granulocyte colony stimulating factor therapy for acute myocardial infarction
Hadjigeorgiou et al. A network meta‐analysis of randomized controlled trials for comparing the effectiveness and safety profile of treatments with marketing authorization for relapsing multiple sclerosis
Gao et al. Sample size calculations for the design of cluster randomized trials: a summary of methodology
Nazar et al. Challenges in medicinal and aromatic plants DNA barcoding—lessons from the Lamiaceae
KR101927911B1 (ko) 구성성분 및 효능정보 기반 천연물 소재 및 성분의 신규 효능 예측 시스템
Laponogov et al. Network machine learning maps phytochemically rich “Hyperfoods” to fight COVID-19
Palomeras-Vilches et al. Adherence to the mediterranean diet and bone fracture risk in middle-aged women: A case control study
US20160342769A1 (en) Systems for making personalized medicine
Loss-Oliveira et al. Testing synchrony in historical biogeography: the case of New World primates and Hystricognathi rodents
Koncz et al. The safety and efficacy of Citrus aurantium (bitter orange) extracts and p-synephrine: a systematic review and meta-analysis
Khan et al. Assessment of above-ground biomass in pakistan forest ecosystem’s carbon pool: A review
Perez-Bilbao et al. Effects of combined interventions of exercise and diet or exercise and supplementation on breast cancer patients: A systematic review
Tung Public databases of plant natural products for computational drug discovery
Wang et al. Risk Factors for Venous Thrombosis after Spinal Surgery: A Systematic Review and Meta‐analysis
Tan et al. A systematic review of the effects of caffeine on basketball performance outcomes

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
GRNT Written decision to grant