KR102157579B1 - 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템 - Google Patents

표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템 Download PDF

Info

Publication number
KR102157579B1
KR102157579B1 KR1020180118437A KR20180118437A KR102157579B1 KR 102157579 B1 KR102157579 B1 KR 102157579B1 KR 1020180118437 A KR1020180118437 A KR 1020180118437A KR 20180118437 A KR20180118437 A KR 20180118437A KR 102157579 B1 KR102157579 B1 KR 102157579B1
Authority
KR
South Korea
Prior art keywords
phenotypic
plant
natural compounds
network
phenotype
Prior art date
Application number
KR1020180118437A
Other languages
English (en)
Other versions
KR20200038786A (ko
Inventor
이도헌
유선용
Original Assignee
재단법인 전통천연물기반 유전자동의보감 사업단
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 전통천연물기반 유전자동의보감 사업단, 한국과학기술원 filed Critical 재단법인 전통천연물기반 유전자동의보감 사업단
Priority to KR1020180118437A priority Critical patent/KR102157579B1/ko
Priority to PCT/KR2019/008242 priority patent/WO2020071621A1/ko
Publication of KR20200038786A publication Critical patent/KR20200038786A/ko
Application granted granted Critical
Publication of KR102157579B1 publication Critical patent/KR102157579B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템에 관한 것이다. 구체적으로, 본 발명에 따른 식물의 표현형 벡터를 이용한 천연 화합물의 약리 효과 예측 방법은 천연 화합물에 대한 부족한 분자적 정보에 기반하지 않고, 식물의 표현형에 대한 풍부한 정보에 기반하여 천연 화합물의 잠재적 약리 효과를 대규모로 분석할 수 있으므로, 상기 방법 및 이를 위한 시스템은 오랜 사용으로 안전성이 높은 천연 화합물을 이용한 약물 개발에 유용하게 사용될 수 있다.

Description

표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템{Method and system for predicting pharmacological effects of natural compounds using phenotype-oriented network analysis}
본 발명은 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템에 관한 것이다.
천연 화합물 및 그 유도체들은 의약품의 유용한 자원으로 사용되어 왔고, 이들의 대다수는 한방 의약적 사용에 기반하고 있다. 한방 의약에 기반한 천연물 의약품은 대체로 인체에 무해하고 부작용이 없을 것으로 추정되기 때문에, 세계적으로 35,000 개가 넘는 식물 종(species)이 의약적 목적으로 사용되어 왔으며, 최근 조사에 따르면 세계 인구의 약 70 내지 80%가 일차적 건강관리를 위하여 한방 의약에 의존하는 것으로 나타났다(Yirga, G. et al., International Journal of Biodiversity and Conservation, 3, 709-714, 2011). 그러나, 상기와 같은 천연물에 대한 큰 관심과 사용에 비하여 아직까지 적은 수의 식물 종만이 과학적으로 연구되고, 상업화되었다.
한방 의약에 기반한 천연물 의약품 후보를 찾기 위한 기존 연구들은 대부분 특정 질환과 관련된 식물을 찾고, 그 식물 자체를 추출하거나 식물에 포함된 천연 화합물을 찾은 뒤에 이들의 생물학적 활성을 in vitro 스크리닝 방법을 통해 확인하는 방법으로 이루어져 왔다. 하지만, 상기와 같은 방법으로는 대량의 천연 화합물들을 분석하기 위하여 대규모의 실험이 요구되기 때문에, 생산성이 낮고 시간과 비용이 크게 소요된다는 문제점이 있다.
이에, 최근에는 유사성-기반, 네트워크-기반 또는 메커니즘-기반의 in silico 접근 방법이 제안되어 왔다. 이러한 in silico 접근 방법은 한방 의약 정보를 특정 질환에 적용하기 위한 식물 또는 천연 화합물을 선택하기 위한 초기 수단으로만 사용하며, 천연 화합물들의 잠재적 약리 효과를 예측하는데 분자 구조 또는 표적 단백질의 유사성과 같은 분자적 분석에 집중하여 이루어진다. 그러나, 대부분의 천연 화합물들은 그 분자 구조에 대한 정보 또는 표적 단백질에 대한 정보가 알려져 있지 않기 때문에 대규모 분석을 수행하기 어렵다는 문제점이 있다. 따라서, 한방 의약의 축적된 정보를 활용하여 분자적 분석에 의존하지 않고 잠재적 약리 효과를 갖는 천연 화합물을 탐색함으로써, 대규모 분석에 활용 가능한 새로운 in silico 분석 방법의 발굴이 필요하다.
본 발명의 목적은 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템을 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명은 식물의 표현형 네트워크를 이용하여 식물의 표현형 벡터를 제작하는 단계(단계 1); 상기 표현형 벡터를 대상으로 계층 클러스터링(hierarchical clustering) 분석을 수행하여 표현형 유사성에 따른 식물 클러스터를 도출하는 단계(단계 2); 상기 식물 클러스터 내의 천연 화합물들을 대상으로 피셔 정확 검정(Fisher's exact test)을 수행하여 식물 클러스터 내에 유의하게 포함된(enriched) 천연 화합물들을 도출하는 단계(단계 3); 및 상기 도출된 천연 화합물들이 포함된 식물 클러스터 내 식물들의 표현형 벡터값에 대한 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 수치화하는 단계(단계 4)를 포함하는 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법을 제공한다.
또한, 본 발명은 상기 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법을 실행시키기 위한 명령들을 포함하는 프로그램이 저장된 컴퓨터로 판독가능한 매체를 제공한다.
또한, 본 발명은 식물의 표현형 네트워크를 이용하여 식물의 표현형 벡터를 제작하는 모듈; 상기 표현형 벡터를 대상으로 계층 클러스터링 분석을 수행하여 표현형 유사성에 따른 식물 클러스터를 도출하는 모듈; 상기 식물 클러스터 내의 천연 화합물들을 대상으로 피셔 정확 검정을 수행하여 식물 클러스터 내에 유의하게 포함된 천연 화합물들을 도출하는 모듈; 및 상기 도출된 천연 화합물들이 포함된 식물 클러스터 내 식물들의 표현형 벡터값에 대한 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 수치화하는 수치분석모듈을 포함하는 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 시스템을 제공한다.
본 발명에 따른 식물의 표현형 벡터를 이용한 천연 화합물의 약리 효과 예측 방법은 천연 화합물에 대한 부족한 분자적 정보에 기반하지 않고, 식물의 표현형에 대한 풍부한 정보에 기반하여 천연 화합물의 잠재적 약리 효과를 대규모로 분석할 수 있으므로, 상기 방법 및 이를 위한 시스템은 오랜 사용으로 안전성이 높은 천연 화합물을 이용한 약물 개발에 유용하게 사용될 수 있다.
도 1은 본 발명에 따른 천연 화합물들의 약리 효과 예측 방법의 과정을 나타낸 도면이다.
도 2는 식물의 표현형 벡터를 제작하는 단계를 나타낸 도면이다(A 및 B: 의미 유사도 계산 예시; C 및 D: RWR 알고리즘 및 컬럼 표준화를 통한 전이확률 벡터값 도출 예시).
도 3은 본 발명에 따른 방법, 계층적 관계를 고려하지 않은 방법 또는 표적-접근 방법으로 예측된 천연 화합물의 치료적 효과 및 잠재적 후보 효과에 대한 수용자 작동 특성 곡선(receiver operating characteristic curve, ROC) 및 정밀도-민감도 곡선(precision-recall curve, PR)의 이하 면적(area under the curve, AUC)을 나타낸 그래프(A), 및 상기 분석 결과에서 표현형 발생을 표준화한 결과 그래프(B)이다.
이하 본 발명을 상세히 설명한다.
본 발명은 식물의 표현형 네트워크를 이용하여 식물의 표현형 벡터를 제작하는 단계(단계 1); 상기 표현형 벡터를 대상으로 계층 클러스터링(hierarchical clustering) 분석을 수행하여 표현형 유사성에 따른 식물 클러스터를 도출하는 단계(단계 2); 상기 식물 클러스터 내의 천연 화합물들을 대상으로 피셔 정확 검정(Fisher's exact test)을 수행하여 식물 클러스터 내에 유의하게 포함된 천연 화합물들을 도출하는 단계(단계 3); 및 상기 도출된 천연 화합물들이 포함된 식물 클러스터 내 식물들의 표현형 벡터값에 대한 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 수치화하는 단계(단계 4)를 포함하는 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법을 제공한다.
상기 단계 1은 식물의 표현형 네트워크에서 표현형 간의 양적 거리를 측정하는 의미 유사도(semantic similarity)를 계산하는 단계(단계 1-1); 상기 계산된 의미 유사도 점수를 기반으로 표현형 네트워크의 엣지(edge)에 가중치(weight)를 부여하는 단계(단계 1-2); 및 가중치가 부여된 표현형 네트워크를 대상으로 RWR(Random Walk with Restart) 알고리즘을 수행하여 도출된 각 식물의 표현형 값으로 식물의 표현형 벡터를 제작하는 단계(단계 1-3)를 포함할 수 있다.
상기 단계 1-1의 의미 유사도는 하기 수학식 1로 표현되는 수식에 의해 계산되는 것일 수 있다:
[수학식 1]
Figure 112018098061849-pat00001
(sim: 의미 유사도;
depth: 근원 표현형(root UMLS)으로부터 해당 표현형까지의 깊이;
path: 각 표형형 간의 거리; 및
lcs(c1, c2): c1 및 c2 개념의 공통적인 가장 낮은 계층의(가장 구체적인) 개념(the lowest common subsumer)).
상기 단계 1-3은 하기의 단계를 포함하는 것일 수 있다:
(a) 식물의 알려진 약리 효과 정보에 기반하여 표현형 네트워크의 시드 노드(seed nodes)에 초기값을 할당하는 단계 및 (b) 하나의 노드에서 이웃한 노드로의 전이확률(transition probability)을 계산하는 단계, 여기서 각 노드의 전이확률은 시간 단계가 t+1일 때 하기 수학식 2로 정의된다;
[수학식 2]
Figure 112018098061849-pat00002
(r: 각 시간 단계의 랜덤 워커(random walker)의 재시작 확률(restarting probability);
W: 표현형 네트워크의 엣지 가중치에 기반한 인접 행렬(adjacency matrix)의 컬럼 정규화(column normalization)를 나타내는 전이 행렬(transition matrix); 및
Pt 및 P0: 시간단계가 t일 때 및 초기 각 노드의 확률 벡터).
상기 단계 1의 식물의 표현형 네트워크는 식물의 표현형에 대한 정보를 제공하는 데이터베이스로부터 추출된 정보를 이용하여 제작되는 것일 수 있다.
상기 데이터베이스는 KTKP(http://www.koreantk.com/ktkp2014/), TCMID(Xue, R. et al., Nucleic Acids Res. 1089-1095, 2012), TCMSP(Ru, J. et al., J. Cheminform. 6, 13, 2014), TCM@Taiwan(Chen, C. Y. -C. PLoS One 6, e15939, 2011), TCM-ID(Wang, J. et al., Clin. Pharmacol. Ther. 78, 92-93, 2005), KAMPO(http://kampo.ca/) 및 UMLS(unified medical language system; Bodenreider, O. Nucleic Acids Res. 32, D267-270, 2004)로 이루어진 군으로부터 선택되는 어느 하나 이상일 수 있으나, 이에 제한되지 않는다.
상기 단계 4 이후에는 시각화 수단을 통해 도출된 정보에 대한 시각화 데이터를 생성하는 단계 및 이를 출력 수단을 통해 시각화 데이터로 출력하는 단계를 추가적으로 포함할 수 있다. 상기 출력 수단은 모니터, 프린터 및 플로터로 이루어진 군으로부터 선택되는 어느 하나일 수 있으며, 결과물을 출력할 수 있는 어떠한 수단이어도 무방하다.
또한, 본 발명은 상기 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법을 실행시키기 위한 명령들을 포함하는 프로그램이 저장된 컴퓨터로 판독가능한 매체를 제공한다. 컴퓨터로 판독가능한 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터로 판독가능한 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터로 판독가능한 기록매체에는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 본 발명은 식물의 표현형 네트워크를 이용하여 식물의 표현형 벡터를 제작하는 모듈; 상기 표현형 벡터를 대상으로 계층 클러스터링 분석을 수행하여 표현형 유사성에 따른 식물 클러스터를 도출하는 모듈; 상기 식물 클러스터 내의 천연 화합물들을 대상으로 피셔 정확 검정을 수행하여 식물 클러스터 내에 유의하게 포함된 천연 화합물들을 도출하는 모듈; 및 상기 도출된 천연 화합물들이 포함된 식물 클러스터 내 식물들의 표현형 벡터값에 대한 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 수치화하는 수치분석모듈을 포함하는 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 시스템을 제공한다.
상기 시스템은 상기 모듈들에 의해 도출된 정보에 대한 시각화 데이터를 생성하는 모듈 및 이를 시각화 데이터로 출력하는 출력 모듈을 추가적으로 포함할 수 있다.
상기 출력 모듈은 모니터, 프린터 및 플로터로 이루어진 군으로부터 선택되는 어느 하나일 수 있으며, 결과물을 출력할 수 있는 어떠한 수단이어도 무방하다.
본 발명의 구체적인 실시예에서, 본 발명자들은 복수의 표현형 간 연결 관계인 표현형 네트워크를 제작하고, 표현형 간의 양적 거리를 측정하는 의미 유사도를 계산하여 이를 기반으로 엣지에 가중치를 부여하고, RWR 알고리즘을 수행하여 식물의 표현형 벡터를 제작하였다(도 1 및 2 참조).
또한 본 발명자들은 상기 식물의 표현형 벡터를 행렬로 표현하여 계층 클러스터링 분석을 수행한 후, 피셔 정확 검정을 수행하여 식물 클러스터 내에 유의하게 포함된 천연 화합물들을 도출하고, 도출된 천연 화합물들이 포함된 식물 클러스터 내 식물들의 표현형 벡터값에 대한 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 수치화하여 확인하였다(도 1 참조).
또한 본 발명자들은 본 발명에 따른 천연 화합물의 약리 효과 예측 방법이 기존의 표적-접근 방법(target-closeness method)보다 치료적 효과(therapeutic effects) 및 잠재적 후보 효과(potential candidate effects)를 예측하는 성능이 우수함을 확인하였고(도 3 참조), 본 발명의 방법에 따라 예측된 천연 화합물의 약리 효과가 외부 문헌에서 확인됨에 따라, 본 발명의 예측 방법이 신뢰성 있는 방법임을 확인하였다.
따라서, 본 발명에 따른 천연 화합물의 약리 효과 예측 방법, 이를 실행시키기 위한 명령들을 포함하는 프로그램이 저장된 컴퓨터로 판독가능한 매체, 및 상기 방법을 실행하기 위한 시스템은 천연 화합물을 이용한 약물 개발에 유용하게 사용될 수 있다.
이하 본 발명을 실시예에 의해 상세히 설명한다.
단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 의해서 한정되는 것은 아니다.
데이터 수집
식물 및 천연 화합물 정보는 대한민국, 중국 및 일본의 천연물을 다루는 KTKP(http://www.koreantk.com/ktkp2014/), TCMID(Xue, R. et al., Nucleic Acids Res. 1089-1095, 2012), TCMSP(Ru, J. et al., J. Cheminform. 6, 13, 2014), TCM@Taiwan(Chen, C. Y. -C. PLoS One 6, e15939, 2011), TCM-ID(Wang, J. et al., Clin. Pharmacol. Ther. 78, 92-93, 2005) 및 KAMPO(http://kampo.ca/)로부터 수집하였다. 표현형 네트워크는 생물의약에 관한 다양한 용어들에 대한 통합 정보를 제공하는 UMLS(unified medical language system; Bodenreider, O. Nucleic Acids Res. 32, D267-270, 2004)의 2017AA 버전으로부터 얻었다. UMLS에서 각각의 구별되는 생물의학적 개념에는 개념 고유 식별자(concept unique identifier, CUI)가 할당되는데, MRREL 목록으로부터의 넓은 관계(broder relationships, RB) 및 좁은 관계(narrower relationships, RN)를 갖는 CUI들을 수집하여, 총 786,002 개의 CUI 및 2,487,620 개의 관계를 수집하였다.
식물의 표현형 벡터 제작
먼저, UMLS에서 수집한 데이터의 계층적 관계를 기반으로, 복수의 표현형 간 연결 관계인 표현형 네트워크를 제작하고(도 2A), 표현형 간의 양적 거리를 측정하는 의미 유사도(semantic similarity)를 계산하였다. 예를 들어, 염증 및 호르몬 불균형과 같은 일반적인 표현형 개념 간의 관계는 큰 차이를 의미하고, 당뇨병 및 당뇨병성 신증과 같은 특정 개념 간의 관계는 작은 차이를 의미한다. 이에, Wu, Z. 및 Palmer, M.이 제안하고, 하기 수학식 1로 표현되는 의미 유사도 측정 방법(Wu, Z. & Palmer, M. 133-138 (Association for Computational Linguistics))을 적용하였다(도 2B):
[수학식 1]
Figure 112018098061849-pat00003
(sim: 의미 유사도;
depth: 근원 표현형(root UMLS)으로부터 해당 표현형까지의 깊이;
path: 각 표형형 간의 거리; 및
lcs(c1, c2): c1 및 c2 개념의 공통적인 가장 낮은 계층의(가장 구체적인) 개념(the lowest common subsumer))
계산된 표현형 노드 간의 의미 유사도 점수를 기반으로 표현형 네트워크의 엣지(edge)에 가중치(weight)를 부여하였다. 이후, 엣지에 가중치가 부여된 표현형 네트워크로부터 천연물의 정량적 약리 효과를 조사하기 위하여 RWR(Random Walk with Restart) 알고리즘을 수행하였다. 구체적으로, 식물의 알려진 약리 효과 정보에 기반하여 표현형 네트워크의 시드 노드(seed nodes)에 초기값을 할당한 후, 한 노드에서 이웃한 노드로의 전이확률(transition probability)을 계산하였다. 상기 전이확률은 표현형 네트워크 상의 표현형 간의 정량적 관계의 값이 되는 것으로 가정하였고, 시간 단계가 t + 1일 때의 각 노드의 전이확률 벡터는 하기 수학식 2에 의해 정의되었다(도 2C 및 2D):
[수학식 2]
Figure 112018098061849-pat00004
(r: 각 시간 단계의 랜덤 워커(random walker)의 재시작 확률(restarting probability)로 본 발명에서는 0.7로 설정함;
W: 표현형 네트워크의 엣지 가중치에 기반한 인접 행렬(adjacency matrix)의 컬럼 정규화(column normalization)를 나타내는 전이 행렬(transition matrix); 및
Pt 및 P0: 시간단계가 t일 때 및 초기 각 노드의 확률 벡터)
RWR 알고리즘을 통하여 모든 노드가 정상 상태(steady state, Pt+1 - Pt < 10-8)에 도달할 때까지 랜덤 워커를 시뮬레이션하였고, 도출된 각 식물의 표현형 값을 표현형 벡터로 정의하여, 최종적으로 2,286 개 식물의 표현형 벡터를 제작하였다.
표현형 유사성에 기반한 식물 클러스터링(clustering)
유사한 약리 효과를 갖는 식물들을 추출하기 위하여, 상기 실시예 2에서 도출한 식물의 표현형 벡터를 행렬로 표현한 후, 계층 클러스터링(hierarchical clustering) 분석을 수행하였다. 구체적으로, 계층 클러스터링은 R module pvclust(Suzuki, R. & Shimodaira, H. Bioinformatics 22, 1540-1542, 2006)를 이용하여 수행하였다. AU(approximately unbiased) p 값이 0.95보다 큰 클러스터들을 신뢰성 있는 결과로 보아 해당 클러스터들을 선별하였고, 코사인 거리(cosine distance)에 의해 상관관계를 계산하였다. 클러스터링 분석 결과, 5,021 개의 표현형 중에서 유사한 약리 효과를 갖는 51 개의 식물 클러스터를 확인하였다.
식물 클러스터 내에 유의하게 포함된(enriched) 천연 화합물들의 추출
식물 클러스터 내에 유의하게 포함된 천연 화합물들을 확인하기 위하여, 피셔 정확 검정(Fisher's exact test)을 수행하였다. 피셔 정확 검정은 분할표(contingency table) 수치의 초기하분포(hypergeometric distribution)를 적용함으로써 수행된다. 각 식물 클러스터 내의 각 천연 화합물을 포함하는 식물의 수를 계산하여, 식물 클러스터 내의 각 천연 화합물의 분할표를 제작하였고, 식물 클러스터 내의 각 천연 화합물에 대하여 0.001의 p 값을 임계값으로 적용하여 식물 클러스터 내에 유의하게 포함된 화합물을 추출하였다. 최종적으로 도출된 천연 화합물들은 식물 클러스터 당 평균 2.4 개였으며, 해당 식물 클러스터에 속하는 식물들의 표현형 벡터들의 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 조사하였다.
본 발명에 따른 천연 화합물들의 약리 효과 예측 방법의 성능 평가
하기와 같은 방법으로 상기 실시예 1 내지 4를 통해 구축한 천연 화합물들의 약리 효과 예측 방법의 성능을 평가하였다.
5-1. 데이터 수집
약물에 대한 정보는 DrugBank(v. 4.0, Law, V. et al., Nucleic Acids Res. 42, D1091-1097, 2014)에서, 천연 화합물들의 잠재적인 약리 효과에 대한 정보는 CTD(Davis, A. P. et al., Nucleic Acids Res. 43, D914-920, 2015) 및 ClinicalTrials.gov(Gillen, J. E. et al., Stud. health Technol. Inform. 107, 1466-1470, 2004)에서 수집하였다. 화합물-유전자 관련성에 대한 정보는 DrugBank, DCDB(v. 2.0, Liu, Y. et al., Database, bau124, 2014), CTD, TTD(Zhu, F. et al., Nucleic Acids Res. gkr797, 2011), BindingDB(Gilson, M. K. et al., Nucleic Acids Res. 44, D1045-1053, 2016), MATADOR(Gunther, S. et al., Nucleic Acids Res. 36, D919-922, 2008) 및 STITCH(Kuhn, M. et al., Nucleic Acids Res. gkt1207, 2013)에서 수집하였고, 유전자-표현형 관련성에 대한 정보는 CTD, DisGeNET(Pinero, J. et al., Database, 2015) 및 OMIM(Amberger, J. S. et al., Nucleic Acids Res. 43, D789-798, 2014)에서 수집하였다. 단백질-단백질 상호작용 네트워크 데이터는 BioGrid(v. 3.0.136, Chatr-Aryamontri, A. et al., Nucleic Acids Res. 43, D470-478, 2015) 및 CODA(v. 1.0, Yu, H. et al., Sci. Rep. 7, 7519, 2017)에서 수집하였다.
5-2. 성능 평가를 위한 수학식
하기 수학식 3 내지 6에 의해 정밀도(precision), 민감도(recall), 수용자 작동 특성 곡선 이하 면적(area under the receiver operating characteristic curve, AUROC) 및 정밀도-민감도 곡선 이하 면적(area under the precision-recall curve, AUPR)을 계산하였다:
[수학식 3]
정밀도 = TP/P;
[수학식 4]
민감도 = TP/(TP + FN);
[수학식 5]
Figure 112018098061849-pat00005
; 및
[수학식 6]
Figure 112018098061849-pat00006
(TP: 실제 양성인 데이터가 양성으로 검출된 경우(true positive);
TN: 실제 음성인 데이터가 음성으로 검출된 경우(true negative);
FP: 실제 음성인 데이터가 양성으로 검출된 경우(false positive);
FN: 실제 양성인 데이터가 음성으로 검출된 경우(false negative);
P: 실제 양성인 데이터(= TP + FN); 및
N: 실제 음성인 데이터(= TN + FP)).
5-3. 천연 화합물의 약리 효과 예측 성능 검증 (1)
본 발명에 따른 천연 화합물의 약리 효과 예측 방법의 성능을 검증하기 위하여, DrugBank의 21 개 약물 및 CTD의 92 개 화합물을 표준 데이터 세트로 하여 상기 실시예 5-2에 기재된 수학식에 따라 AUROC 및 AUPR 값을 계산하였다. 계산된 값을 분석하여 화합물들의 치료적 효과(therapeutic effects) 및 잠재적 후보 효과(potential candidate effects)에 대한 예측 성능을 평가하였다. 계층적 관계의 고려 여부에 따른 영향을 확인하고자, 본 발명에 따른 방법에서 계층적 관계를 고려하지 않은 경우의 예측 결과를 비교하였으며, 기존의 분자적 분석을 이용하는 네트워크 기반 접근법인 표적-접근 방법(target-closeness method)의 예측 결과를 비교하였다.
본 발명에 따른 방법의 분석 결과, 치료적 효과에 대한 ROC 및 PR 곡선의 이하 면적(AUC)은 각각 0.725 ± 0.085 및 0.649 ± 0.080, 잠재적 후보 효과에 대한 ROC 및 PR 곡선의 이하 면적은 각각 0.754 ± 0.077 및 0.685 ± 0.071로 계산되었다. 계층적 관계를 고려하지 않은 경우, 치료적 효과에 대한 ROC 및 PR 곡선의 이하 면적은 각각 0.689 ± 0.079 및 0.605 ± 0.082, 잠재적 후보 효과에 대한 ROC 및 PR 곡선의 이하 면적은 각각 0.719 ± 0.060 및 0.644 ± 0.073으로 계산되었다. 표적-접근 방법의 경우, 치료적 효과에 대한 ROC 및 PR 곡선의 이하 면적은 각각 0.706 ± 0.089 및 0.622 ± 0.068, 잠재적 후보 효과에 대한 ROC 및 PR 곡선의 이하 면적은 각각 0.727 ± 0.081 및 0.653 ± 0.062로 계산되었다(도 3A). 이는 본 발명에 따른 방법에 있어 계층적 관계를 고려하는 것이 약리 효과 예측 성능을 증가시킴을 의미하며, 어떠한 분자적 분석 없이 천연물에 관한 정보만을 이용하는 본 발명의 방법이 기존의 표적-접근 방법에 비하여 화합물의 치료적 효과 및 잠재적 후보 효과 예측 모두에서 우수한 성능을 나타냄을 의미한다.
5-4. 천연 화합물의 약리 효과 예측 성능 검증 (2)
본 발명에 따른 천연 화합물의 약리 효과 예측 방법이 특정 표현형의 예측에만 유용한지 여부를 확인하기 위하여, 표현형 발생을 표준화하는 과정을 추가한 것을 제외하고는 상기 실시예 5-3에 기재된 것과 동일한 방법으로 본 발명에 따른 방법의 성능을 검증하였다.
구체적으로, 상기 실시예 2에서 제작한 식물의 표현형 벡터에 기반하여 각 천연 화합물의 표현형 순위를 계산하고, 모든 천연 화합물의 순위에 따라 표현형의 ROC 및 PR 곡선의 이하 면적을 계산함으로써, 표현형 발생을 표준화하였다.
그 결과, 상기 실시예 5-3에서 확인한 성능 평가 결과와 유사하게, 본 발명에 따른 방법이 계층적 관계를 고려하지 않은 방법 및 기존의 표적-접근 방법에 비하여 치료적 효과 및 잠재적 후보 효과 모두에서 높은 AUC 수치를 나타냄으로써, 보다 우수한 예측 성능을 나타내었다(도 3B).
본 발명에 따른 천연 화합물들의 약리 효과 예측 방법과 기존 표적-접근 방법과의 비교 분석
본 발명에 따른 천연 화합물의 약리 효과 예측 방법이 기존의 표적-접근 방법을 대체하여 약물 개발에 유용하게 사용될 수 있는지 조사하고자, 본 발명에 따른 방법에 의한 결과와 기존의 표적-접근 방법에 의한 결과를 비교 분석하였다.
먼저, 본 발명의 방법 및 표적-접근 방법으로부터 얻은 천연 화합물들의 예측된 약리 효과들을 점수에 따라 분류하고, 순위상관(rank correlation)을 분석하였다. 그 결과, 두 데이터 세트 간의 순위상관계수(rc)는 0.0019로 매우 낮았고, 본 발명의 방법에 따른 결과와 무작위로 추출한 데이터 간의 순위상관계수(0.0012)와 유의한 차이가 없었다.
다음으로, 본 발명의 방법 및 표적-접근 방법에 따른 데이터에서 상위 10%의 표현형들을 추출하고, 이에 대한 타니모토 계수(Tanimoto coefficient, Tc)를 계산하였다. 그 결과, 순위상관계수와 유사하게 두 데이터 간의 타니모토 계수는 0.065 ± 0.013으로 매우 낮았고, 본 발명의 방법에 따른 결과와 무작위로 추출한 데이터 간의 타니모토 계수(0.051 ± 0.010)와 유의한 차이가 없었다.
상기 결과들은 본 발명에 따른 천연 화합물의 약리 효과 예측 방법에 따른 결과가 기존의 표적-접근 방법에 따른 결과와 유의적으로 상이함을 의미하며, 이에 따라, 본 발명에 따른 방법이 기존의 분자적 분석 방법을 보완하여 천연 화합물의 약리 효과를 예측하는 수단으로 유용하게 사용될 수 있음을 제시한다.
본 발명에 따른 천연 화합물들의 약리 효과 예측 방법의 신뢰성 검증
본 발명에 따른 천연 화합물들의 약리 효과 예측 방법의 신뢰성을 검증하기 위하여, 예측된 천연 화합물 및 그 약리 효과들이 외부 문헌에서 확인되는지 조사하였다.
7-1. 데이터 세트 추출
1,294 개의 천연 화합물들의 예측된 약리 효과들을 그 점수에 따라 순위를 매기고, 상위 10%, 하위 10% 및 무작위 10%의 결과를 선택하여 495,602 개의 천연 화합물-표현형 관계를 포함하는 독립적인 3 개의 데이터 세트를 만들었다.
7-2. 공동발생(co-occurrence) 분석
각 데이터 세트의 천연 화합물들의 약리 효과들에 대하여, PubMed의 초록들로부터 공동발생 수를 세어 분석하였다.
공동발생 자카드 인덱스 피셔 정확 검정a
고득점(H) 1.41 2.2 × 10-4 3,281
저득점(L) 0.11 1.1 × 10-5 746
무작위(R) 0.37 7.8 × 10-5 1,136
Mann-Whitney
U test, p 값
H vs L < 0.001 < 0.001 < 0.001
H vs R < 0.001 < 0.001 < 0.001
L vs R 0.028 0.73 0.052
a피셔 정확 검정에서 p 값의 임계값은 0.001로 함
그 결과, 고득점 데이터 세트의 공동발생 평균값(1.41)은 저득점 및 무작위 데이터 세트의 공동발생 평균값(0.11 및 0.37)보다 각각 12.8 배 및 3.8 배 더 크게 나타났다(표 1).
7-3. 자카드 인덱스(Jaccard index) 분석
이를 천연 화합물들 및 표현형의 빈도수에 있어 차이를 보정하기 위하여 자카드 인덱스를 계산하여 공동발생 값을 표준화하였다.
그 결과, 고득점 데이터 세트의 평균 자카드 인덱스 값(2.2 × 10-4)은 저득점 및 무작위 데이터 세트의 평균 자카드 인덱스 값(1.1 × 10-5 및 7.8 × 10-5)보다 각각 20.0 배 및 2.8 배 더 크게 나타났다(표 1).
7-4. 피셔 정확 검정 분석
각 천연 화합물 및 표적 표현형을 모두 포함하는 PubMed 초록의 수를 세어, 각 연관성(association)에 대한 피셔 정확 검정 값을 얻고, p 값이 0.001보다 낮은 유의적인 연관성(significant association)을 조사하였다.
그 결과, 고득점 데이터 세트의 유의적인 연광성의 수(3,281)는 저득점 및 무작위 데이터 세트의 수치(746 및 1,136)보다 4.4 배 및 2.8 배 더 크게 나타났다(표 1).
7-5. Mann-Whitney U test 분석
고득점, 저득점 및 무작위 데이터 세트에 대한 문헌 증거 간의 유의한 차이를 조사하기 위하여 Mann-Whitney U test를 수행하고, 해당하는 p 값을 계산하였으며, p 값이 0.05보다 낮은 경우를 통계적으로 유의한 것으로 판단하였다.
공동발생 평균값, 평균 자카드 인덱스 값 및 피셔 정확 검정에 따른 유의적인 연관성의 수에 있어서 고득점 데이터 세트는 저득점 및 무작위 데이터 세트와 각각 통계적으로 유의한 차이를 보였다(표 1). 이러한 결과는 본 발명에 따른 천연 화합물들의 약리 효과 예측 방법이 신뢰성 있는 예측 방법으로, 천연 화합물의 약리 효과를 동정하는 수단으로 유용하게 사용될 수 있음을 제시한다.
본 발명의 방법에 따른 천연 화합물들의 새로운 약리 효과 예측
본 발명의 방법에 따라 천연 화합물들의 새로운 약리 효과를 예측하여 기존의 표적-접근 방법과 비교 분석하였다.
구체적으로, 정밀도 및 민감도의 조화평균(harmonic mean)에 해당하는 F1 값을 계산하여, 0부터 0.95까지 0.05의 간격으로 임계값을 설정하였다. 임계값이 0.20일 때 가장 우수한 성능을 보여, F1 값이 0.20 이상인 천연 화합물들의 예측된 약리 효과들을 선별하여 목록화하였다. 선별된 목록에 해당하는 천연 화합물 들 중 10개의 천연 화합물을 선택하여, 각 천연 화합물에 대한 1 내지 3 개의 표현형을 선택하여, 해당 약리 효과에 대한 PubMed 문헌을 조사하고, 표적-접근 방법과 비교하였다(표 2).
화합물명 표현형 점수 문헌 증거(PMID)
Puerarin 뇌졸중
발열
0.773
0.731
28072733
22401764
Berberine 불면증
황달
0.819
0.731
28579756
415839
Quercitrin 무월경
위 통증(stomach pain)
0.804
0.707
22212502
26758066
Spermidine 출혈
난청
정신(mental)
0.765
0.729
0.705
14913342
19001365
21501848
Choline 빈혈
변비
건선
습진
0.818
0.791
0.775
0.762
15571243
13135586
10730754
14896505
Genistein 뇌졸중
말라리아
0.773
0.758
29063799
27585499
Eugenol 폐뇨(retention of urine)
요로감염(urinary tract infection)
0.853
0.771
28733207
28792229
Daidzein 뇌졸중 0.773 26558782
Amentoflavone 천식 0.755 27916586
Ononin 만성 질환 0.726 19103273
그 결과, puerarin의 경우 상기 목록 및 PubMed 문헌에 따라 뇌졸중 치료 용도가 확인되었으나, 분자적 네트워크에서 puerain의 표적 단백질과 뇌졸중 관련 단백질 간의 계산된 거리는 가장 짧은 거리의 평균값이 3.32로, 무작위에 가까울 정도로 멀리 떨어져 있음(p < 0.001)을 나타냈다. 이는 기존의 표적-접근 방법에 따라 도출할 수 없는 천연 화합물의 약리 효과를 본 발명의 방법에 의해 예측할 수 있고, 그 예측 결과 또한 신뢰성 있는 결과임을 제시한다.

Claims (8)

  1. 식물의 표현형 네트워크를 이용하여 식물의 표현형 벡터를 제작하는 단계(단계 1);
    상기 표현형 벡터를 대상으로 계층 클러스터링(hierarchical clustering) 분석을 수행하여 표현형 유사성에 따른 식물 클러스터를 도출하는 단계(단계 2);
    상기 식물 클러스터 내의 천연 화합물들을 대상으로 피셔 정확 검정(Fisher's exact test)을 수행하여 식물 클러스터 내에 유의하게 포함된(enriched) 천연 화합물들을 도출하는 단계(단계 3); 및
    상기 도출된 천연 화합물들이 포함된 식물 클러스터 내 식물들의 표현형 벡터값에 대한 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 수치화하는 단계(단계 4)를 포함하는 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법.
  2. 제1항에 있어서, 상기 단계 1은 식물의 표현형 네트워크에서 표현형 간의 양적 거리를 측정하는 의미 유사도(semantic similarity)를 계산하는 단계(단계 1-1);
    상기 계산된 의미 유사도 점수를 기반으로 표현형 네트워크의 엣지(edge)에 가중치(weight)를 부여하는 단계(단계 1-2); 및
    가중치가 부여된 표현형 네트워크를 대상으로 RWR(Random Walk with Restart) 알고리즘을 수행하여 도출된 각 식물의 표현형 값으로 식물의 표현형 벡터를 제작하는 단계(단계 1-3)를 포함하는, 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법.
  3. 제2항에 있어서, 상기 단계 1-1의 의미 유사도는 하기 수학식 1로 표현되는 수식에 의해 계산되는 것인, 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법:
    [수학식 1]
    Figure 112018098061849-pat00007

    (sim: 의미 유사도;
    depth: 근원 표현형(root UMLS)으로부터 해당 표현형까지의 깊이;
    path: 각 표형형 간의 거리; 및
    lcs(c1, c2): c1 및 c2 개념의 공통적인 가장 낮은 계층의(가장 구체적인) 개념(the lowest common subsumer)).
  4. 제2항에 있어서, 상기 단계 1-3은 하기의 단계를 포함하는 것인, 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법:
    (a) 식물의 알려진 약리 효과 정보에 기반하여 표현형 네트워크의 시드 노드(seed nodes)에 초기값을 할당하는 단계 및
    (b) 하나의 노드에서 이웃한 노드로의 전이확률(transition probability)을 계산하는 단계,
    여기서 각 노드의 전이확률은 시간 단계가 t+1일 때 하기 수학식 2로 정의됨;
    [수학식 2]
    Figure 112018098061849-pat00008

    (r: 각 시간 단계의 랜덤 워커(random walker)의 재시작 확률(restarting probability);
    W: 표현형 네트워크의 엣지 가중치에 기반한 인접 행렬(adjacency matrix)의 컬럼 정규화(column normalization)를 나타내는 전이 행렬(transition matrix); 및
    Pt 및 P0: 시간단계가 t일 때 및 초기 각 노드의 확률 벡터).
  5. 제1항에 있어서, 상기 단계 1의 식물의 표현형 네트워크는 식물의 표현형에 대한 정보를 제공하는 데이터베이스로부터 추출된 정보를 이용하여 제작되는 것인, 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 따른 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법을 실행시키기 위한 명령들을 포함하는 프로그램이 저장된 컴퓨터로 판독가능한 매체.
  7. 식물의 표현형 네트워크를 이용하여 식물의 표현형 벡터를 제작하는 모듈;
    상기 표현형 벡터를 대상으로 계층 클러스터링 분석을 수행하여 표현형 유사성에 따른 식물 클러스터를 도출하는 모듈;
    상기 식물 클러스터 내의 천연 화합물들을 대상으로 피셔 정확 검정을 수행하여 식물 클러스터 내에 유의하게 포함된 천연 화합물들을 도출하는 모듈; 및
    상기 도출된 천연 화합물들이 포함된 식물 클러스터 내 식물들의 표현형 벡터값에 대한 산술적인 평균값을 계산하여 각 천연 화합물들의 잠재적인 약리 효과를 수치화하는 수치분석모듈을 포함하는 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 시스템.
  8. 제7항에 있어서, 상기 식물의 표현형 벡터를 제작하는 모듈은 식물의 표현형 네트워크에서 표현형 간의 양적 거리를 측정하는 의미 유사도를 계산하는 모듈;
    상기 계산된 의미 유사도 점수를 기반으로 표현형 네트워크의 엣지에 가중치를 부여하는 모듈; 및
    가중치가 부여된 표현형 네트워크를 대상으로 RWR 알고리즘을 수행하여 도출된 각 식물의 표현형 값으로 식물의 표현형 벡터를 제작하는 모듈을 포함하는, 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 시스템.
KR1020180118437A 2018-10-04 2018-10-04 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템 KR102157579B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180118437A KR102157579B1 (ko) 2018-10-04 2018-10-04 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템
PCT/KR2019/008242 WO2020071621A1 (ko) 2018-10-04 2019-07-04 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180118437A KR102157579B1 (ko) 2018-10-04 2018-10-04 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템

Publications (2)

Publication Number Publication Date
KR20200038786A KR20200038786A (ko) 2020-04-14
KR102157579B1 true KR102157579B1 (ko) 2020-09-18

Family

ID=70054616

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180118437A KR102157579B1 (ko) 2018-10-04 2018-10-04 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템

Country Status (2)

Country Link
KR (1) KR102157579B1 (ko)
WO (1) WO2020071621A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080138799A1 (en) * 2005-10-12 2008-06-12 Siemens Aktiengesellschaft Method and a system for extracting a genotype-phenotype relationship
KR101848074B1 (ko) * 2015-10-13 2018-04-11 한국과학기술원 천연물 소재 및 성분의 신규 효능 예측 시스템 및 그 방법
KR102145617B1 (ko) * 2017-01-23 2020-08-19 한국과학기술연구원 표현형 기반 식물체 선발 시스템 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A. A. Lagunin 외, Nat. Prod. Res., 2014, 31, pp.1585-1611.
H. Yuan 외, Molecules, 2017, 22, 1135.

Also Published As

Publication number Publication date
KR20200038786A (ko) 2020-04-14
WO2020071621A1 (ko) 2020-04-09

Similar Documents

Publication Publication Date Title
Tazin et al. Stroke disease detection and prediction using robust learning approaches
Lampos et al. Flu detector-tracking epidemics on Twitter
CN109712678B (zh) 关系预测方法、装置及电子设备
Shaukat et al. Dengue fever prediction: A data mining problem
Karaglani et al. Accurate blood-based diagnostic biosignatures for Alzheimer’s disease via automated machine learning
Zou et al. Approaches for recognizing disease genes based on network
KR101450784B1 (ko) 전자의무기록과 약물/질환 네트워크 정보 기반의 신약 재창출 후보 예측 방법
Hijazi et al. Wearable devices, smartphones, and interpretable artificial intelligence in combating COVID-19
Krittanawong et al. Big data, artificial intelligence, and cardiovascular precision medicine
del Valle et al. Evaluating Wikipedia as a source of information for disease understanding
Zhao et al. Detecting adverse drug events using concept hierarchies of clinical codes
Folino et al. A recommendation engine for disease prediction
Stamate et al. Predicting risk of dementia with survival machine learning and statistical methods: results on the english longitudinal study of ageing cohort
Papaiz et al. Machine learning solutions applied to amyotrophic lateral sclerosis prognosis: a review
Tsiouris et al. Predicting rapid progression of Parkinson's disease at baseline patients evaluation
Tovilla‐Sierra et al. The spatial analysis of biological interactions: morphological variation responding to the co‐occurrence of competitors and resources
WO2021240275A1 (en) Real-time method of bio big data automatic collection for personalized lifespan prediction
KR102157579B1 (ko) 표현형 중심의 네트워크 분석을 이용한 천연 화합물의 약리 효과 예측 방법 및 이를 위한 시스템
Lee et al. Benchmarking community detection methods on social media data
Jalali-Heravi et al. Classification of anti-HIV compounds using counterpropagation artificial neural networks and decision trees
KR102519848B1 (ko) 생의학적 연관성 예측 방법 및 장치
Khan et al. Survival analysis for white non-Hispanic female breast cancer patients
Lee et al. Feature extraction for starcraft ii league prediction
Zhang et al. The Role of Big Data in Aging and Older People’s Health Research: A Systematic Review and Ecological Framework
Lütz Unsupervised machine learning to detect patient subgroups in electronic health records

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant