KR20230021955A - 서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법 - Google Patents

서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법 Download PDF

Info

Publication number
KR20230021955A
KR20230021955A KR1020210103996A KR20210103996A KR20230021955A KR 20230021955 A KR20230021955 A KR 20230021955A KR 1020210103996 A KR1020210103996 A KR 1020210103996A KR 20210103996 A KR20210103996 A KR 20210103996A KR 20230021955 A KR20230021955 A KR 20230021955A
Authority
KR
South Korea
Prior art keywords
drug
pathway
network
sub
analyzed
Prior art date
Application number
KR1020210103996A
Other languages
English (en)
Inventor
남승윤
박태성
이성영
Original Assignee
가천대학교 산학협력단
서울대학교산학협력단
서울대학교병원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가천대학교 산학협력단, 서울대학교산학협력단, 서울대학교병원 filed Critical 가천대학교 산학협력단
Priority to KR1020210103996A priority Critical patent/KR20230021955A/ko
Publication of KR20230021955A publication Critical patent/KR20230021955A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Abstract

본 발명은 약물재창출 대상 약물을 선정하는 방법에 있어서, (a) 특정 질병에 대한 전체 신호전달 네트워크를 분해하여, 복수의 타겟 유전자를 포함하는 전사체에 대한 서브 패스웨이 네트워크가 생성되는 단계; (b) 상기 서브 패스웨이 네트워크에 단백질-단백질 상호작용(PPI; Protein-protein interaction)이 추가되는 단계; (c) 분석대상 약물과 상기 서브 패스웨이 네트워크에 설정된 타겟 유전자 간 관계정보 및 상기 분석대상 약물의 물리화학적 특성정보를 이용하여, 상기 분석대상 약물과 상기 타겟 유전자에 대한 악물유사성 데이터베이스가 구축되는 단계; (d) 상기 약물유사성 데이터베이스를 이용하여, 상기 서브 패스웨이 네트워크에서 상기 타겟 유전자와 상기 분석대상 약물 간 결합 정도가 분석되는 단계; 및 (e) 상기 (d) 단계에서의 분석 결과를 통계분석하여, 복수의 상기 분석대상 약물 중 복수의 상기 타겟 유전자와 다중 결합하는 약물이 선정되는 단계를 포함하여, 복수의 질환에 적용가능한 다제약제 특성을 가지는 약물을 선정하는 것이 가능하여 약물재창출 가능성이 높은 약물을 선정할 수 있는 것을 특징으로 한다.

Description

서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법{Method for selecting polypharmacology subject to drug-repositioning based on subpathway}
본 발명은 약물재창출 대상 약물을 선정하는 방법에 관한 것으로, 보다 상세하게는 다양한 유전자에 작용하는 다제약제를 선정하는 방법에 관한 것이다.
약물재창출은 기존 약물에 대한 새로운 적응증을 밝히는 것을 목표로 하는데, 특히 특정 적응증에서 사용할 수 있는 약물이 없는 경우 약물재창출이 중요하게 이용될 수 있다. 약물재창출은 임상 소모율과 시간을 절약할 수 있다는 점에서 유용하다.
종래에 컴퓨터를 이용한 약물재창출 접근은 유전체학 데이터를 사용하였으며, 대표적인 전산 약물재창출 방법으로는 이전 네트워크에서 약물 처리된 유전자 발현형(GES) 또는 약물 표적과 질병 단백질의 근접성을 측정하는 방법이 제안되었다. ‘유전자 발현형‘을 이용한 방법은 약물 치료 전후의 발현 변화와 관련된 기준 유전자 발현형(또는 유전자 세트)를 설정하고, 그 후 유전자 세트 분석(GSA)을 사용하여 환자(또는 질병 모델)의 것과 반대되는 유전자 발현형을 갖는 약물을 선택하는 방법이다. 많은 omics 기반 약물재창출 도구는 유전자 발현형 기법에 속한다. 그러나, 이 방법만으로는 잠재적인 약물이 선택될 수 있는 신호전달경로를 설명할 수 없는 한계가 있다.
또한, 또다른 종래의 약물재창출 방법으로 약물-표적 관계를 사전 신호전달과 단백질-단백질 상호작용(PPI; protein-protein interaction) 데이터베이터에 연결하는 것이다. 관련 정보가 저장된 데이터베이스의 생물학적 네트워크를 잘 알려진 질병 유전자 목록에 연결하면, 기존 약물-표적 단백질 관계가 네트워크에 중첩되다. 따라서, 이미 알려진 약물의 표적이 네트워크에 새롭게 연결되거나 근접한 경우를 이를 약물재창출에 이용할 수 있다. 그러나, 이 방법은 전사체 정보를 활용하지 않아 네트워크에서 유전자 발현형을 고려하지 않는 문제가 있다.
이렇듯, 유전자 발현형을 이용하는 방법은 약물재창출에 있어 네트워크를 이용하지 않으며, 기존의 약물-표적 관계를 PPI 네트워크에 결합하는 방법은 유전자 발현 데이터(즉, 전사체)를 입력으로 사용하지 않으므로, 양 방법 모두 네트워크에서 생물학적 실체의 상태(예: 유전자 발현)를 고려할 수 없는 한계를 지닌다. 또한, 종래의 방법들은 잠재적인 약물이 새롭게 선택될 수 있도록 신호 하위부분이 설명되지 않으며, 특정 하위부분에서 다제약제, 즉 이미 알려진 기존 약물이 작용하는 다중 표적을 고려하지 않는 한계가 있다.
한편, 다제약제(Polypharmacolgy)란, 특정 표적이 아닌 여러 표적과 결합하는 약물을 의미한다. 특정 약물이 높은 처리량 데이터에서 추론된 새로운 특정 생물학적 네트워크(기존 약물 적응증과 다른 질병)에서 다중 표적과 반응하는 것이 밝혀지면, 해당 약물은 효과적이고 안전할 가능성이 높다고 판단된다. 그러나, 전술한 종래 두 가지 방법은, 네트워크에서 다제약제의 중요성을 고려하지 않아 문제된다.
관련 종래기술 한국공개특허 제10-2021-0055314호(이하, ‘선행특허’라 약칭한다)는 신약 재창출 후보를 선정함에 있어서, 환자에 대한 임상 지표 값과 그 변화량을 이용하여 각 약물의 효과를 측정하는 방법을 개시한다. 그러나, 선행특허와 같이 개별 환자의 임상 지표 값으로는 해당 질환이 신호전달경로 중 어느 부분에 이상을 발생시키는지 명확하게 발굴하지 못하는 한계가 있으며, 개별 환자 간 약물의 효과 차이로 인해 해당 약물에 대한 정확한 성능 검증이 불가한 한계가 있다.
한편, 본 출원인은 약물재창출 대상 약물을 선정함에 있어서, 전사체를 사용하여 신호전달경로 중 서브 패스웨이를 이용하는 방법에 관한 연구 개발을 진행하였다. 이에, 상기 선행특허보다 신호전달경로에서 이상이 발생하는 부분을 정확히 발굴할 수 있고, 조사대상 약물에 대한 신뢰성 있는 검증이 가능함을 확인하게 되었다.
한국공개특허 제10-2021-0055314호
본 발명은 약물재창출에 적합한 약물을 선정하는 방법으로서, 특정 질환은 신호전달 경로 중 어느 위치에서 이상이 발생하는지 분석하고, 해당 위치에서 약물재창출이 가능하며, 다양한 질환에 적용가능한 다제약제를 선정하는 방법을 제공하고자 한다.
본 발명이 해결하려는 과제들은 앞에서 언급한 과제들로 제한되지 않는다. 본 발명의 다른 과제 및 장점들은 아래 설명에 의해 더욱 분명하게 이해될 것이다.
상기 목적을 달성하기 위하여 본 발명은, 약물재창출 대상 약물을 선정하는 방법에 있어서, (a) 특정 질병에 대한 전체 신호전달 네트워크를 분해하여, 복수의 타겟 유전자를 포함하는 전사체에 대한 서브 패스웨이 네트워크가 생성되는 단계; (b) 상기 서브 패스웨이 네트워크에 단백질-단백질 상호작용(PPI; Protein-protein interaction)이 추가되는 단계; (c) 분석대상 약물과 상기 서브 패스웨이 네트워크에 설정된 타겟 유전자 간 관계정보 및 상기 분석대상 약물의 물리화학적 특성정보를 이용하여, 상기 분석대상 약물과 상기 타겟 유전자에 대한 악물유사성 데이터베이스가 구축되는 단계; (d) 상기 약물유사성 데이터베이스를 이용하여, 상기 서브 패스웨이 네트워크에서 상기 타겟 유전자와 상기 분석대상 약물 간 결합 정도가 분석되는 단계; 및 (e) 상기 (d) 단계에서의 분석 결과를 통계분석하여, 복수의 상기 분석대상 약물 중 복수의 상기 타겟 유전자와 다중 결합하는 약물이 선정되는 단계를 포함하여, 상기 (e) 단계에서 선정된 약물은 다제약제 특성을 갖는 것을 특징으로 한다.
바람직하게, 상기 (a) 단계에서 분해되는 상기 전체 신호전달 네트워크는, KEGG(Kyoto Encyclopedia of Genes and Genomes) 패스웨이 데이터베이스에 저장된 신호 경로 중 어느 하나일 수 있다.
바람직하게, 상기 (a) 단계에서 생성되는 상기 서브 패스웨이 네트워크는, 노드(V)와 엣지(E)로 구성된 서브 패스웨이 그래프 S(V, E)로 표현될 수 있으며, 상기 노드는 인접한 노드와 하기 수학식의 관계로 정의될 수 있다.
[수학식]
Figure pat00001
(여기서 cor(i, j)는 상기 노드의 유전자 발현 프로파일 사이의 pearson 상관 계수이며, reg(i, j)는 KEGG 경로에서 활성화(reg=1) 또는 억제(reg=-1)를 의미한다.)
바람직하게, 상기 (b) 단계에서 추가되는 상기 PPI는, 상기 서브 패스웨이 네트워크의 1단계에 포함된 상기 타겟 유전자와 관련되어, 추가적인 생물학적 관계를 밝힐 수 있다.
바람직하게, 상기 (b) 단계는, 상관계수가 0.9 이상인 상기 PPI를 추가할 수 있다.
바람직하게, 상기 (c) 단계의 상기 물리화학적 특성정보는, 상기 분석대상 약물의 3차원 구조를 바탕으로 생성될 수 있다.
바람직하게, 상기 (c) 단계의 상기 물리화학적 특성정보는, 수소결합 공여체/수용체 수, 분자 질량 또는 옥탄올-물 분배계수(logP) 중 적어도 어느 하나를 포함할 수 있다.
바람직하게, 상기 (e) 단계에서 선정되는 약물은, 수소결합 공여체 수 5 미만, 수소결합 수용체 수 10 미만, 분자 질량 500 미만, 옥탄올-물 분할 계수(logP) 5 미만, 회전 가능한 결합 수 10 미만 또는 중원자 수 100 이하인 물리화학적 특성을 가질 수 있다.
바람직하게, 상기 (e) 단계는, 상기 타겟 유전자 여부와 상기 서브 패스웨이 네트워크 여부를 변수로 하는 피셔의 정확 검정(Fisher exact test)이 수행될 수 있다.
본 발명에 따르면, 표현형 변화(예를 들어, 질병의 상태 변화)와 관련된 신호전달경로의 서브 패스웨이를 발견하고 이를 이용함으로써, 특정 질병이 신호전달경로에서 어떤 특정 부분에 이상을 발생시키는지 정확하게 발굴하는 것이 가능하다. 이를 통해 치료제가 없는 다양한 질환에 대해서도 전사체 데이터만으로 약물재창출 가능성이 높은 약물을 선정할 수 있다.
본 발명에 의해 선정되는 약물은 다제약제 특성을 가지므로, 다양한 질환에 이용가능하여 활용도가 높은 장점을 가진다.
또한, 통계적 분석을 통해 특정 약물에 대한 성능을 검증함으로써 약물의 효과를 정량적으로 판단할 수 있다는 장점을 가진다.
도 1은 본 발명의 실시 예에 따른 약물재창출 대상 약물을 선정하는 방법의 각 단계를 나타낸 구성도이다.
도 2는 본 발명의 실험례로서, 정상 샘플과 위암 샘플에서 WNT 신호 전달에 대한 유전자 발현 시뮬레이션을 수행하여, 본 발명의 선정방법(PATHOME-Drug)과 WebGestalt 방법에서의 신호 검출 성능 평가를 수행한 결과이다.
도 3은 본 발명의 실험례로서, 본 발명의 선정방법(PATHOME-Drug)과 WebGastalt을 8개의 GC 데이터셋에서 분석된 분석대상 화합물(compound)의 수 측면에서 비교한 그래프이다.
도 4는 본 발명의 실험례로서, 이전 네트워크 구조를 고려한 시뮬레이션 유전자 발현 데이터에서 본 발명의 선정방법(PATHOME-Drug)과 WebGestalt의 신호 검출의 성능 평가 결과를 나타낸다.
도 5는 본 발명의 실험례로서, 이전 네트워크 구조를 고려하여 합성 유전자 발현 데이터의 약물재창출 성능을 평가한 그래프이다.
이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명을 상세히 설명한다. 다만, 본 발명이 예시적 실시 예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일 참조부호는 실질적으로 동일한 기능을 수행하는 부재를 나타낸다.
본 발명의 목적 및 효과는 하기의 설명에 의해서 자연스럽게 이해되거나 보다 분명해질 수 있으며, 하기의 기재만으로 본 발명의 목적 및 효과가 제한되는 것은 아니다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이, 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다.
도 1은 본 발명의 실시 예에 따른 약물재창출 대상 약물을 선정하는 방법의 각 단계를 나타낸 구성도이다.
본 발명은 약물재창출 대상 약물로, 다제약제 특성을 갖는 약물을 선정할 수 있으며, 약물을 선정함에 있어서 기존의 신호전달경로(pathway)의 하위 경로인 서브 패스웨이(sub-pathway)를 추출하여 이를 기반으로 하는 점에 주목한다.
본 발명의 방법은 서브 패스웨이 네트워크(50)를 생성하는 (a) 단계(S110), 단백질-단백질 상호작용(70)이 추가되는 (b) 단계(S130), 악물유사성 데이터베이스(90)가 구축되는 (c) 단계(S150), 결합 정도가 분석되는 (d) 단계(S170) 및 최종적으로 약물재창출 대상 약물이 선정되는 (e) 단계(S190)를 포함할 수 있다. 도 1에서는 화살표로 이어지는 순서에 따라 Phase 1 내지 Phase 4로 구성하여 도시하였다. Phase 1은 (a) 단계(S110)와 대응하고, Phase 2는 (b) 단계(S130)와 대응하며, Phase 3은 (c) 단계(S150)와 대응한다. Phase 4는 (d) 단계(S170)와 (e) 단계(S190)를 통합하여 도시하였다.
(a) 단계(S110)에서는 특정 질병에 대한 전체 신호전달 네트워크(30)를 분해하여, 복수의 타겟 유전자를 포함하는 전사체(10)에 대한 서브 패스웨이 네트워크(50)가 생성될 수 있다. 본 발명에 대한 입력으로, 전사체(10)는 사용자가 구성한 전사체 데이터 세트 또는 TCGA, GEO 및 ArrayExpress의 전사체 데이터 세트가 사용될 수 있다. 서브 패스웨이 네트워크(50)는 전체 신호전달 네트워크(30)로부터 일부가 추출되어 생성되는데, 이때 본 발명의 서브 패스웨이 네트워크(50)는 생물학적 규정이 상이한 두 그룹(예를 들어, 정상 그룹과 암 그룹)이 유전자 발현 측면에서 통계적으로 차이를 갖도록 추출될 수 있다.
(a) 단계(S110)에서 분해되는 전체 신호전달 네트워크(30)는 질병의 표현형 변화를 나타내는 KEGG 패스웨이 데이터베이스에 저장된 신호 경로일 수 있다. KEGG는 Kyoto Encyclopedia of Genes and Genomes의 약자로, 생화학 신호전달경로 관련 데이터베이스이다. KEGG를 활용하면 알려진 효소에 매핑(mapping)하여 물질대사, 환경적 경로, 유전적 경로 등의 패스웨이 분석이 가능하다.
서브 패스웨이 네트워크(50)는 노드(V)와 엣지(E)로 구성된 서브 패스웨이 그래프 S(V, E)로 표현될 수 있으며, 노드는 인접한 노드와 하기 수학식의 관계로 정의될 수 있다.
[수학식]
Figure pat00002
(여기서 cor(i, j)는 노드의 유전자 발현 프로파일 사이의 pearson 상관 계수이며, reg(i, j)는 KEGG 경로에서 활성화(reg=1) 또는 억제(reg=-1)를 의미한다.)
서브 패스웨이 네트워크(50)(S)가 기설정된 유전자 발현 데이터의 대조군과 실험군의 규칙을 만족하는 경우, 두 그룹 사이의 E(S) 상관 관계의 크기는 차이가 없으며, 이 상태에서 추가적인 통계 검정이 수행될 수 있다. 통계 검정을 통해서, 추출된 서브 패스웨이 네트워크(50) 중 보다 유의한 서브 패스웨이 네트워크(50)가 선정될 수 있다, 이러한 과정을 통해 이후 단백질-단백질 상호작용(PPI; Protein-protein interaction)(70) 등과 병합하는 데 유리하게 작용될 수 있으며, 특정 유전자 또는 약물과 선택적으로 작용할 수 있는지 설명할 수 있다.
(b) 단계(S130)에서는 서브 패스웨이 네트워크(50)에 PPI(70)가 추가될 수 있다. PPI(70)는 생물학 네트워크 중 하나로, 세포 내에서 다양한 신호전달 경로 및 대사, 전사 네트워크를 매개하는 기능적인 핵심 단위이다. 세포의 외부자극 및 환경에 따른 반응은 세포 내부의 PPI(70) 변화를 통해 일어날 수 있다. 특히, (b) 단계(S130)에서 추가되는 PPI(70)는 서브 패스웨이 네트워크(50)의 1 단계에 포함된 타겟 유전자와 관련됨으로써, 추가적인 생물학적 관계를 밝힐 수 있는 점에서 유용하다. 또한, 상관계수가 0.9 이상인 PPI(70)가 서브 패스웨이 네트워크(50)에 추가되는 경우 보다 관련성 깊은 생물학적 관계에 대한 분석이 가능하다.
(c) 단계(S150)에서는 분석대상 약물과 타겟 유전자에 대한 악물유사성 데이터베이스(90)가 구축될 수 있다. 여기에, 분석대상 약물과 서브 패스웨이 네트워크(50)에 설정된 타겟 유전자(또는 타겟 단백질) 간 관계정보 및 분석대상 약물의 물리화학적 특성정보가 이용될 수 있다. 즉, (c) 단계(S150)는 분석대상 약물의 물리화학적 특성정보를 이용함으로써 (b) 단계(S130)에서 결합된 서브 패스웨이 네트워크(50)와 PPI(70) 간 통합이 수행될 수 있다. 이를 통해 약물-표적(유전자 또는 단백질) 관계 분석과 함께 약물유사성 특징을 갖는 약물을 발굴할 수 있다.
이때, 본 명세서에서는 최종적으로 검출하고자 하는 대상이 다중 표적과 반응할 수 있는 ‘다제약제 약물’이므로, 이와 궤를 일치시키기 위해 분석하는 대상도 ‘분석대상 약물’이라 명명하였다. 그러나, 본 발명의 초기 단계에서 분석대상을 선정할 때 선정된 ‘분석대상 약물’은 실질적으로 약제로서 기능하는 ‘약물’이 아닐 수 있다. 즉, 본 명세서에서 ‘분석대상 약물’이라 지칭하는 것은 약물 성분의 화합물과 약물 성분이 없는 일반 화합물을 통칭하는 것으로 이해될 수 있다. 따라서, 이하 기재하는 ‘분석대상 화합물’은 ‘분석대상 약물’을 의미하는 것으로 이해될 수 있다.
분석대상 약물에 관한 정보 및 분석대상 약물이 타겟으로 하는 표적(단백질 또는 유전자)에 관한 정보는 DrugBank와 PharmGKB 데이터베이스를 이용하여 획득될 수 있다. DrugBank와 PharmGKB는 세계적으로 가장 많이 사용되고 있는 약물 관련 데이터베이스로서, 사람의 유전적 차이에 따른 약물의 영향에 대한 다양한 정보를 저장한다. DrugBank는 특정 약물이 표적으로 하는 표적 정보(단백질 또는 유전자)를 중심으로 특정 약물에 대한 데이터를 보유하며, PharmGKB는 축적된 유전자-약-질병 간의 관계 데이터부터 약물 자체에 대한 다양한 정보 특히, 약물이 작용하는 패스웨이 정보를 저장한다.
그러나, DrugBank와 PharmGKB 데이터베이스에서는 물리화학적 특성을 사용할 수 없는 한계가 있었다. 이에 본 발명은 기존의 DrugBank와 PharmGKB 데이터베이스를 이용하되, 분석대상 약물의 물리화학적 특성까지 고려된 악물유사성 데이터베이스(90)를 구축하였다.
먼저, DrugBank와 PharmGKB 데이터베이스를 분석하여, 복합 대상 유전자, 분석대상 약물에 대한 PubChem의 식별자를 추출할 수 있다. PubChem(https://pubchem.ncbi.nlm.nih.gov)은 수백만 가지의 화합물 구조가 저장되어 화학 분자 및 생물학 논문에 활용되는 데이터베이스이다. 이때 PubChem는 약물(화합물)에 대한 별도의 식별자를 부여한다. 따라서, 분석대상 약물에 대해 DrugBank, PharmGKB와 PubChem를 연계시키기 위해 식별자를 추출할 수 있다. 식별자가 선정되면 PubChem에서 분석대상 약물의 3차원 복합 구조를 내려받기할 수 있다. 이 3차원 복합 구조를 이용한 계산을 통해 (c) 단계(S150)에서 이용되는 물리화학적 특성정보가 생성될 수 있다. 물리화학적 특성정보 계산에는 Marvin 소프트웨어(ChemAxon, Cambridge, MA, USA)가 이용될 수 있다. 이때, 분석대상 약물의 복합 구조는 2차원 또는 3차원 구조일 수 있다. 2차원 구조인 경우에는 3차원 구조와 달리 2차원 구조를 바로 적용할 수 없고, Marvin 소프트웨어를 이용하여 주어진 2차원 구조에서 3차원 구조를 생성함으로써, 물리화학적 특성정보를 계산할 수 있다.
물리화학적 특성정보는, 3차원 구조를 바탕으로 수소결합 공여체/수용체 수, 분자 질량 또는 옥탄올-물 분배계수(logP) 중 적어도 어느 하나를 포함할 수 있다.
본 발명에서 초기에 분석대상으로 설정한 분석대상 화합물이 모두 약물 성분인 것은 아니므로, 분석대상 화합물의 물리화학적 성질을 바탕으로 분석하여 실질적으로 약물 성분인 것으로 범위를 좁혀야 한다. 이에, 본 발명은 Lipinski의 5가지 규칙(이하, RO5 규칙)이라는 물리화학적 특성 규칙을 적용하여 분석대상 화합물 중 약물이 아닌 경우를 제외하고, "약물유사성" 특징을 가지는 약물인 것으로 선별하였다. 즉, 전체 분석대상 화합물 중 일정 조건(예를 들어, RO5 규칙)에 부합하는 화합물을 선별하였고, 선별된 화합물(이하 ‘약물-유사 화합물’)은 약물유사 특성을 가진다.
RO5 규칙은 약물-유사 화합물의 물리적 화학적 특성에 대한 경험적 규칙으로 정의될 수 있다. 보다 상세하게, 수소결합 공여체 수 5 미만, 수소결합 수용체 수 10 미만, 분자 질량 500 미만, 옥탄올-물 분할 계수(logP) 5 미만, 회전 가능한 결합 수 10 미만인 것으로 설정될 수 있다. 또한, RO5 규칙에 이어 두 가지 필터가 추가적으로 적용될 수 있다. 추가 필터는 중원자 수 100 이하, 화합물 수 = 1일 수 있다. RO5 규칙과 두 가지 추가 필터(따라서, RO5 변종)를 충족하는 이러한 약물-유사 화합물은 다음 (d) 단계(S170) 내지 (e) 단계(S190)에서 약물재창출 대상 약물을 서브 패스웨이 네트워크(50) 내에서 선정하는 데 보다 적합할 수 있다.
(d) 단계(S170)에서는 약물유사성 데이터베이스(90)를 이용하여, 서브 패스웨이 네트워크(50)에서 타겟 유전자와 분석대상 약물 간 결합 정도가 분석될 수 있다. 도 1의 약물유사성 데이터베이스(90)를 참고하면, 분석대상 약물 c1은 G1, G2, G4와 약물유사성을 가지는 것을 확인할 수 있고, c2는 G8과 약물유사성이 없는 대신 G7과 관련된다. c3은 G8과 약물유사성이 있다. 약물유사성 데이터베이스(90)에서 정리된 이러한 관계는 (d) 단계(S170)에서 실질적인 결합 관계가 드러나 분석될 수 있다. 약물유사성 데이터베이스(90)에서와 마찬가지로, c1은 G1, G2, G4 모두와 결합하며, c2는 G7과, c3은 G8과 관계를 가질 수 있다.
(e) 단계(S190)에서는 (d) 단계(S170)에서의 분석 결과 중, 복수의 분석대상 약물 중 복수의 타겟 유전자와 다중 결합하는 약물, 즉 '다중 대상에 영향을 미치는 다제약제'가 선정될 수 있으며 이는 통계분석을 통하여 수행될 수 있다. 다제약제는 서브 패스웨이의 여러 대상을 조절함으로써 서브 패스웨이의 생물학적 실체의 상태(예: 유전자 발현)를 변화시킬 수 있으며, 또는 질병 표현형을 역전시킬 수 있으므로 유의미하다.
(e) 단계(S190)는, 타겟 유전자 여부와 서브 패스웨이 네트워크(50) 여부를 변수로 하는 피셔의 정확 검정(Fisher exact test)이 수행될 수 있다. 특히 본 발명의 일 실시예에서는 피셔의 정확 검정을 위해 각 분석대상 약물에 대해 2 x 2 분할표를 구성할 수 있다. 2 x 2 분할표 중 한 인자는 타겟 유전자 여부(타겟 대 비타겟)로 설정되고, 다른 인자는 서브 패스웨이 네트워크 여부(네트워크 항목 대 비네트워크 항목)일 수 있다. 인간의 모든 단백질 코딩 유전자는 이 두 인자에 따라 각 분할표에 할당될 수 있다. 분석대상 약물에 대한 피셔의 정확 검정(등가, 초기하 검정) 후에는 q 값을 제공하기 위해 잘못된 발견률을 사용하여 다중 비교 조정이 적용될 수 있다.
전술한 (c) 단계(S150)에서 분석대상 약물을 추출하는 기준으로 RO5 규칙(또는 RO5 변종으로서 7개 규칙)이 설정되었으므로, (e) 단계(S190)에서 선정되는 약물은 위 기준이 충족된 약물일 수 있다. 즉, (e) 단계(S190)에서 선정되는 약물은 수소결합 공여체 수 5 미만, 수소결합 수용체 수 10 미만, 분자 질량 500 미만, 옥탄올-물 분할 계수(logP) 5 미만, 회전 가능한 결합 수 10 미만 또는 중원자 수 100 이하인 물리화학적 특성을 가진 화합물일 수 있다.
도 2는 본 발명의 실험례로서, 정상 샘플과 위암 샘플에서 WNT 신호전달에 대한 유전자 발현 시뮬레이션을 수행하여, 본 발명의 선정방법(PATHOME-Drug)과 WebGestalt 방법에서의 신호 검출 성능 평가를 수행한 결과이다.
WNT는 시스테인(Cys)을 다량 함유하는 분비형 단백질로서, WNT 신호전달 과정은 다세포 생물체의 발생 과정 중 세포의 증식·분화를 조절하거나 성인 조직에서 항상성을 유지한다. 따라서 WNT 신호전달의 이상은 암을 비롯한 다양한 질병을 유발할 수 있다.
도 2의 상단부를 참고하면, WNT 신호전달은 정상 샘플과 위암 샘플에서 차등적인 경로를 생성하는 반면, WNT를 제외한 나머지 패스웨이에 대해서는 신호전달 경로가 상이하지 않도록 설정하였다. 이전 GEO(Gene Expression Omnibus) 데이터셋(수탁 번호: GSE36968)을 사용하여 네트워크 구조가 반영되지 않은 시뮬레이션 데이터셋을 생성하였다. GSE36968 데이터셋에는 6개의 정상 샘플과 24개의 위암 샘플에 대한 18,890개의 유전자 발현이 포함되어 있다. 그리고 실험적 유효성 검사를 수행허여 데이터셋이 WNT 신호전달 경로를 나타내는 것임을 재확인했다. 따라서, 본 발명은 일실시예로서, KEGG에 따라 실제 인과 경로는 WNT 신호전달 경로이며, 이 경로의 입력은 150개의 유전자에 해당된다고 가정하였다. 그리고, 도 2의 중앙부와 같이, WNT 신호전달 내에서 150개의 유전자 발현을 재샘플링하여 100개의 시뮬레이션 데이터셋을 생성했으며, 100개의 데이터셋을 참양성(true positive)으로 가정했다.
참음성(true negative) 데이터셋의 경우, WNT 신호전달 경로 유전자에 속하지 않는 나머지 18,740개 유전자(18,890개 - 150개, non-WNT 신호 경로 유전자에서도 동일)의 유전자 발현은 참음성으로 가정하여 위암 샘플과 정상 샘플 간에 차이가 없도록 설계하였다. 즉, 정상 샘플과 위암 샘플은 동일한 정규 분포를 가지며, 각 유전자에 대한 평균과 분산은 정상 샘플에서 도출된 것이다. 결과적으로, 본 발명의 일실시예는 이러한 설계를 기반으로하여 18,740개의 유전자의 정규 분포에 대한 100개의 시뮬레이션 데이터셋을 생성했다. 그 후, 참양성 데이터셋과 참음성 데이터셋을 모두 결합하여 100개의 최종 시뮬레이션 데이터셋을 생성했다.
그리고, 도 2의 하단부와 같이, 100개의 시뮬레이션 데이터셋에 대해 각 PATHOME-Drug과 WebGestalt 방법을 검정력(power)(도 2 하단부 왼쪽 그래프)과 false discovery 횟수(도 2 하단부 오른쪽 그래프)을 평가하였다.
도 2 하단부 왼쪽의 검정력(power) 그래프는 두 가지 방법별로 시뮬레이션된 100개의 데이터셋에서 통계적으로 유의한 WNT 신호전달 경로 검출 수를 세어 검정력을 평가한 것이다. 이때 검정력이란, 특정 경로의 p-값이 모든 반복에 대해 유의한 횟수의 비율을 의미한다.
도 2 하단부 오른쪽의 false discovery 횟수는 두 가지 방법별로 시뮬레이션된 100개의 데이터셋에서 통계적으로 유의한 non-WNT 신호전달 경로 검출 수를 계산하여 산출된 것이다. 도 2 하단부 그래프의 분석 결과, WNT 신호 전달 성능(검정력)(왼쪽 그래프)은 PATHOME-Drug의 성능이 더 우수하며, false discovery 횟수(오른쪽 그래프)는 PATHOME-Drug이 WebGestalt보다 적으므로, PATHOME-Drug의 성능이 더 우수함을 확인할 수 있다.
도 3은 본 발명의 실험례로서, 본 발명의 선정방법(PATHOME-Drug)과 WebGastalt을 8개의 GC 데이터셋에서 분석된 분석대상 화합물(compound)의 수 측면에서 비교한 그래프이다. 전술한 바와 같이 분석대상 화합물은 본 발명에서 분석대상 약물을 의미한다. 도 3은 어떤 방법에서 더 많은 분석대상 화합물을 약물재창출 가능한 다제약제로 제안할 수 있는지 확인할 수 있다는 점에서 의미를 갖는다.
보다 상세하게, 도 3a의 분석대상 화합물은 약물유사성인 경우뿐만 아니라 비약물유사성인 경우도 포함되어 있다. 도 3b의 분석대상 화합물은 약물유사성인 경우만 해당된다. 도 3a의 경우, PATHOME-Drug가 8개 데이터셋 중 6개 데이터셋(GSE15459, GSE15081, GSE47007, GSE63089, GSE27342, GSE37023)에서 WebGastalt 보다 많은 화합물이 발견된다. 도 3b의 경우, PATHOME-Drug가 8개 데이터셋 중 5개 데이터셋(GSE15459, GSE15081, GSE47007, GSE63089, GSE27342)에서 더 많은 약물유사 화합물이 발견된다. 결론적으로, GC 데이터셋의 어떠한 분석대상 화합물의 경우라도 PATHOME-Drug에서 더 많은 수의 통계적으로 유의한 약물유사성 화합물을 발견할 수 있음을 확인할 수 있다.
도 4는 본 발명의 실험례로서, 이전 네트워크 구조를 고려한 시뮬레이션 유전자 발현 데이터에서 본 발명의 선정방법(PATHOME-Drug)과 WebGestalt의 신호 검출의 성능 평가 결과를 나타낸다. 도 4에서 수행된 시뮬레이션은 4개의 KEGG 경로에 대한 이전 네트워크 구조를 반영하도록 설계되었으므로, 이러한 네트워크 구조를 반영하지 않은 기전의 시뮬레이션 보다 생물학적으로 실질적인 시뮬레이션 수행이 가능하다. 특히, 본 발명의 일실시예로서 패스웨이 네트워크 구조를 고려한 베이지안 학습 패키지(bnlearn)를 사용한 가우스 베이지안 네트워크(GBN; Gaussian Bayesian Network) 모델에서 수행될 수 있다. 시뮬레이션 데이터셋은 신호 검출 및 약물 검출의 성능을 계산하는데 사용되었다.
보다 상세하게, 도 4a는 GBN을 사용하여 4개의 KEGG 경로(hsa04310, hsa04010, hsa04151 및 hsa04630)를 시뮬레이션한 과정 및 결과를 나타낸다. 잘 확립된 4개의 GC 신호 경로(예: ‘true' 패스웨이)의 네트워크 구조는 KEGG(WNT 신호: KEGG hsa04310, mTOR 신호: KEGG: hsa04151, MAPK 신호: KEGG hsa04010, JAK- STAT 신호: KEGG hsa04630)에서 선택될 수 있다. ‘true' 패스웨이는 GC 샘플과 대조군 샘플에서 상이한 경로일 수 있다.
GEO GSE36968 데이터 세트에서 30개의 실제 GC 생물학적 샘플(GC 샘플 24개와 정상 샘플 6개)의 정규화된 유전자 표현(log2)은 유전자 발현 시뮬레이션에 사용되었다. 주어진 실제 신호전달 경로에 대한 시뮬레이션 유전자 발현 데이터는 bnlearn 패키지의 GBN 모델에 의해 생성되었다. 한편, 주어진 경로에 속하지 않는 다른 경로(예: null 패스웨이)에 대한 유전자 발현 데이터는 GSE36968의 표현형에 관계없이 재샘플링을 통해 정규 표본으로부터의 발현으로 구성된다. Null 경로는 GC 대 정규 표본에서 비차등 경로일 수 있다. 따라서, 이 유전자들은 두 표현형 간에 다르지 않았고, 4 가지 ‘true' 패스웨이를 제외한 어떤 경로도 유의하게 상이한 결과를 나타내지 않을 수 있다.
도 4b는 4개의 각 KEGG 경로에서 PATHOME-Drug(PD)와 WebGestalt(WG)의 검정력(power)을 비교하여 나타낸 그래프이다. 도 4b는 두 방법에 대해 GBN 모델에서 매개변수를 다양하게 설정하여 도출한 결과이다. 매개변수는 유전자별 효과(효과 크기), 샘플별 효과(절편)일 수 있다.
여기에서 검정력은 전술한 100개의 데이터셋에서 통계적으로 유의한 경로 또는 유전자 세트가 각 방법(PATHOME-Drug 또는 WebGestalt)에서 실제 경로로 발견되는 빈도로 정의될 수 있다. 따라서, 검정력은 100개의 데이터 세트에서 각 방법에 의해 실제 시뮬레이션 경로의 단백질을 대상으로 하는 통계적으로 유의한 분석대상 약물이 얼마나 자주 관찰되는지를 의미할 수 있다. 결과적으로는 도 4b와 같이, PATHOME-Drug는 4개의 KEGG 경로(hsa04310, hsa04010, hsa04151 및 hsa04630) 모두에서 WebGestalt보다 더 나은 성능을 보임을 확인할 수 있다.
도 5는 본 발명의 실험례로서, 이전 네트워크 구조를 고려하여 합성 유전자 발현 데이터의 약물재창출 성능을 평가한 그래프이다. 각 막대는 GBN 시뮬레이션의 매개변수를 나타낸다. 도 5의 PATHOME-Drug(PD) 및 WebGestalt(WG)의 검정력 그래프는 실제 경로(KEGG 경로; hsa04310, hsa04010, hsa04151 및 hsa04630)에 대해 일반 화합물이 검출된 경우와 약물유사성 특징을 가지는 화합물이 측정된 두 경우를 나타낸다.
도 5의 검정력은 분석대상 화합물 중 시뮬레이션된 경로에서 단백질을 표적으로 하는 통계적으로 유의한 약물이 시뮬레이션된 데이터셋에서 얼마나 자주 관찰되었는지로 정의된다. 모든 분석대상 화합물은 약물유사성을 갖지 않으므로, 각 분석대상 화합물의 물리화학적 특성을 기반으로 약물유사성을 가지는 것만 선택되었다. 즉, 4개의 KEGG 경로에 대한 그래프 중 각 그래프의 왼쪽 그래프는 분석대상 화합물이 비약물유사성과 약물유사성을 모두 포함하는 경우이다. 그리고 각 KEGG 경로에 대한 그래프 중 오른쪽 그래프는, 분석대상 화합물이 약물유사성에 대한 물리화학적 특성을 만족하는 경우이다. 결과적으로, 도 5는 도 4b와 유사하게 KEGG의 모든 경우에 PD가 WG보다 더 나은 성능을 보이는 것으로 분석될 수 있다.
이상에서 대표적인 실시예를 통하여 본 발명을 상세하게 설명하였으나, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리 범위는 설명한 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 특허청구범위와 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태에 의하여 정해져야 한다.
10: 전사체
30: 전체 신호전달 네트워크
50: 서브 패스웨이 네트워크
70: 단백질-단백질 상호작용(PPI)
90: 약물유사성 데이터베이스

Claims (9)

  1. 약물재창출 대상 약물을 선정하는 방법에 있어서,
    (a) 특정 질병에 대한 전체 신호전달 네트워크를 분해하여, 복수의 타겟 유전자를 포함하는 전사체에 대한 서브 패스웨이 네트워크가 생성되는 단계;
    (b) 상기 서브 패스웨이 네트워크에 단백질-단백질 상호작용(PPI; Protein-protein interaction)이 추가되는 단계;
    (c) 분석대상 약물과 상기 서브 패스웨이 네트워크에 설정된 타겟 유전자 간 관계정보 및 상기 분석대상 약물의 물리화학적 특성정보를 이용하여, 상기 분석대상 약물과 상기 타겟 유전자에 대한 악물유사성 데이터베이스가 구축되는 단계;
    (d) 상기 약물유사성 데이터베이스를 이용하여, 상기 서브 패스웨이 네트워크에서 상기 타겟 유전자와 상기 분석대상 약물 간 결합 정도가 분석되는 단계; 및
    (e) 상기 (d) 단계에서의 분석 결과를 통계분석하여, 복수의 상기 분석대상 약물 중 복수의 상기 타겟 유전자와 다중 결합하는 약물이 선정되는 단계를 포함하여,
    상기 (e) 단계에서 선정된 약물은 다제약제 특성을 갖는 것을 특징으로 하는 방법.
  2. 제 1 항에 있어서,
    상기 (a) 단계에서 분해되는 상기 전체 신호전달 네트워크는,
    질병의 표현형 변화를 나타내는 KEGG(Kyoto Encyclopedia of Genes and Genomes) 패스웨이 데이터베이스에 저장된 신호 경로 중 어느 하나인 것을 특징으로 하는 방법.
  3. 제 2 항에 있어서,
    상기 (a) 단계에서 생성되는 상기 서브 패스웨이 네트워크는,
    노드(V)와 엣지(E)로 구성된 서브 패스웨이 그래프 S(V, E)로 표현될 수 있으며,
    상기 노드는
    인접한 노드와 하기 수학식의 관계로 정의될 수 있는 것을 특징으로 하는 방법.
    [수학식]
    Figure pat00003

    (여기서 cor(i, j)는 상기 노드의 유전자 발현 프로파일 사이의 pearson 상관 계수이며, 과 reg(i, j)는 KEGG 경로에서 활성화(reg=1) 또는 억제(reg=-1)를 의미한다.)
  4. 제 1 항에 있어서,
    상기 (b) 단계에서 추가되는 상기 PPI는,
    상기 서브 패스웨이 네트워크의 1단계에 포함된 상기 타겟 유전자와 관련되어, 추가적인 생물학적 관계를 밝힐 수 있는 것을 특징으로 하는 방법.
  5. 제 1 항에 있어서,
    상기 (b) 단계는,
    상관계수가 0.9 이상인 상기 PPI를 추가하는 것을 특징으로 하는 방법.
  6. 제 1 항에 있어서,
    상기 (c) 단계의 상기 물리화학적 특성정보는,
    상기 분석대상 약물의 3차원 구조를 바탕으로 생성되는 것을 특징으로 하는 방법.
  7. 제 1 항에 있어서,
    상기 (c) 단계의 상기 물리화학적 특성정보는,
    수소결합 공여체/수용체 수, 분자 질량 또는 옥탄올-물 분배계수(logP) 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 방법.
  8. 제 1 항에 있어서,
    상기 (e) 단계에서 선정되는 약물은,
    수소결합 공여체 수 5 미만, 수소결합 수용체 수 10 미만, 분자 질량 500 미만, 옥탄올-물 분할 계수(logP) 5 미만, 회전 가능한 결합 수 10 미만 또는 중원자 수 100 이하인 물리화학적 특성을 가지는 것을 특징으로 하는 방법.
  9. 제 1 항에 있어서,
    상기 (e) 단계는,
    상기 타겟 유전자 여부와 상기 서브 패스웨이 네트워크 여부를 변수로 하는 피셔의 정확 검정(Fisher exact test)이 수행되는 것을 특징으로 하는 방법.
KR1020210103996A 2021-08-06 2021-08-06 서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법 KR20230021955A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210103996A KR20230021955A (ko) 2021-08-06 2021-08-06 서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210103996A KR20230021955A (ko) 2021-08-06 2021-08-06 서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법

Publications (1)

Publication Number Publication Date
KR20230021955A true KR20230021955A (ko) 2023-02-14

Family

ID=85220885

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210103996A KR20230021955A (ko) 2021-08-06 2021-08-06 서브 패스웨이를 기반으로 한 약물재창출 대상 다제약제 선정방법

Country Status (1)

Country Link
KR (1) KR20230021955A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210055314A (ko) 2019-11-07 2021-05-17 울산대학교 산학협력단 신약 재창출 후보 선정 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210055314A (ko) 2019-11-07 2021-05-17 울산대학교 산학협력단 신약 재창출 후보 선정 방법 및 시스템

Similar Documents

Publication Publication Date Title
Tavassoly et al. Systems biology primer: the basic methods and approaches
Mathur et al. Gene set analysis methods: a systematic comparison
Rosato et al. From correlation to causation: analysis of metabolomics data using systems biology approaches
Meier‐Schellersheim et al. Multiscale modeling for biologists
Wang et al. Boolean modeling in systems biology: an overview of methodology and applications
Guo et al. Assessing semantic similarity measures for the characterization of human regulatory pathways
Motta et al. Mathematical modeling of biological systems
Najmanovich et al. Detection of 3D atomic similarities and their use in the discrimination of small molecule protein-binding sites
Marjoram et al. Post-GWAS: where next? More samples, more SNPs or more biology?
Xia et al. A cross-study analysis of drug response prediction in cancer cell lines
Zhou et al. Network-based approaches for multi-omics integration
Geistlinger et al. From sets to graphs: towards a realistic enrichment analysis of transcriptomic systems
Das et al. Genome-scale analysis of interaction dynamics reveals organization of biological networks
Ayati et al. CoPhosK: A method for comprehensive kinase substrate annotation using co-phosphorylation analysis
Richards et al. Assessing the functional coherence of gene sets with metrics based on the Gene Ontology graph
Ji et al. JDINAC: joint density-based non-parametric differential interaction network analysis and classification using high-dimensional sparse omics data
Eriksson et al. Uncertainty quantification, propagation and characterization by Bayesian analysis combined with global sensitivity analysis applied to dynamical intracellular pathway models
Hao et al. Knowledge-guided deep learning models of drug toxicity improve interpretation
Ramos et al. Leveraging user-friendly network approaches to extract knowledge from high-throughput omics datasets
Yin et al. Multiple imputation and analysis for high‐dimensional incomplete proteomics data
Shaddox et al. Bayesian inference of networks across multiple sample groups and data types
Chroni et al. Migrations of cancer cells through the lens of phylogenetic biogeography
Jiang et al. A dynamic programing approach to integrate gene expression data and network information for pathway model generation
Pechenick et al. Phenotypic robustness and the assortativity signature of human transcription factor networks
Petković et al. Biomarker discovery by feature ranking: evaluation on a case study of embryonal tumors

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right