WO2020242130A1

WO2020242130A1 - 물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치

Info

Publication number: WO2020242130A1
Application number: PCT/KR2020/006630
Authority: WO
Inventors: 최진우
Original assignee: 주식회사 바이오릿지
Priority date: 2019-05-24
Filing date: 2020-05-21
Publication date: 2020-12-03
Also published as: KR20200135004A; KR102331324B1

Abstract

적어도 하나의 프로세서를 포함하는 전자 디바이스에서 수행되는 방법으로서, 상기 적어도 하나의 프로세서가, 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하는 단계; 상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하는 단계; 및 상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하는 단계를 포함하는, 의약 용도 예측 방법이 개시된다.

Description

물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치

개시된 실시예는 물질, 예를 들어, 식물 추출물이나 천연물과 같은 약물 후보물질의 의약용도 또는 생물학적 메카니즘을 예측하기 위한 방법, 장치, 컴퓨터에서 실행시키기 위한 프로그램, 및 그 프로그램을 기록한 기록매체에 관한 것이다.

컴퓨팅 방법(computational method)과 생명 정보학을 이용함으로써, 연구원은 기존 약제의 새로운 사용법을 찾기 위해 많은 양의 표현 데이터를 기초로 물질의 새로운 의약용도를 예측할 수 있다. 이러한 방식은 천연물이나 식물 추출물 등으로부터 신규 약제 발견에 많이 사용되고 있다.

신약 발견과 개발은 항상 많은 시간 및 비용을 필요로 하며, 복잡한 공정을 거치게 된다. 이에 따라, 최근에는 다른 분야의 학문, 예를 들면 생명정보학(bio-informatics), 케미-인포메틱(chemi-informatics), 컴퓨터 공학 및 CADD(computer-aided drug discovery/design) 등을 융합하여, 신약 발견과 개발에 드는 시간을 줄이고 그 효과를 높이려는 연구가 이루어지고 있다.

특히, 시뮬레이션을 통한 신약 개발을 위한 많은 데이터베이스들이 통합되고 있다. 예를 들어, 복잡한 신약 타겟의 데이터베이스인 drugbank(2006)가 있으며, 웹으로 접근가능한 신약 타겟 확인을 위한 단백질 데이터베이스인 PDTD가 있다. 이외에도 의약품 및 유전자 정보를 포함한 다양한 퍼블릭 데이터베이스가 제공되었다. 예를 들면 Connectivity Map (CMAP)은 의약품, 유전자와 질병의 관계를 밝힐 수 있는 데이터베이스이다. 특히, CMAP은 유전자표현 프로파일등을 이용하여 의약품사용에 따른 생물학적 상태간의 연결성을 보여줄 수 있다. CMAP의 참조 데이터베이스는 많은 수의 perturbagen을 처리한 배양된 인간 세포들에서 얻어진 유전자 발현 프로파일을 포함하고 있다.

따라서, 본 개시는 생물학적 메카니즘이 밝혀지지 않은 물질의 새로운 의약용도 또는 작용기전을 예측하기 위하여, 기 생성된 데이터베이스를 이용하는 장치, 방법, 컴퓨터 프로그램, 및 그 프로그램을 기록한 기록 매체를 제공하고자 한다.

적어도 하나의 프로세서를 포함하는 전자 디바이스에서 수행되는 방법으로서: 상기 적어도 하나의 프로세서가, 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하는 단계; 상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하는 단계; 및 상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하는 단계를 포함하는, 방법이 제공될 수 있다.

상기 유전체 수준의 전사 발현 데이터는 실험 데이터에 기초하여 업데이트되는, 방법이 제공될 수 있다.

상기 제 1 물질은 천연물이고, 상기 제 2 물질은 용도가 알려진 화합물인, 방법이 제공될 수 있다.

상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하는, 방법이 제공될 수 있다.

상기 제 1 유전자 발현 패턴은, 대상체에 상기 제 1 물질을 투여함으로써 차등적으로 발현되는 유전자 (differentially expressed genes;DEG) 를 통해 결정되는, 방법이 제공될 수 있다.

상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 상향 조정된 (upregulated) 유전자를 포함하는, 방법이 제공될 수 있다.

상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 하향 조정된 (downregulated) 유전자를 포함하는, 방법이 제공될 수 있다.

상기 제 2 유전자 발현 패턴은, 복수의 제 2 유전자 발현 패턴들 중 상기 제 1 유전자 발현 패턴과 동일하거나 가장 유사한, 방법이 제공될 수 있다.

상기 제 2 물질을 식별하는 단계는, 미리 결정된 기준에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 복수의 제 2 유전자 발현 패턴들 각각을 야기하는 복수의 제 2 물질들을 식별하는 단계를 포함하고, 상기 제 1 물질의 상기 용도를 출력하는 단계는, 상기 복수의 제 2 물질들 간에 가장 많이 공통되는 용도에 기초하여, 상기 제 1 물질의 상기 용도를 출력하는 단계를 포함하는, 방법이 제공될 수 있다.

상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하고, 상기 제 2 유전자 발현 패턴은 상기 CMAP 상에서 상기 제 1 유전자 발현 패턴과 중첩되는 영역을, 복수의 제 2 유전자 발현 패턴들 중에서 가장 많이 포함하는, 방법이 제공될 수 있다.

본 개시에 의해, 하드웨어와 결합하여 상기 방법을 실행시키기 위해 매체에 저장되는 컴퓨터 프로그램이 제공될 수 있다.

본 개시에 의해, 상기 방법을 컴퓨터에서 실행하는 프로그램이 수록된 컴퓨터 판독가능 기록매체가 제공될 수 있다.

본 개시에 의해, 인스트럭션들을 저장하는 메모리; 및 상기 인스트럭션들을 실행하여: 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하고, 상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하고, 상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하도록 구성된 적어도 하나의 프로세서를 포함하는 전자 디바이스가 제공될 수 있다.

본 개시의 방법 및 장치를 이용하여, 물질, 예를 들어, 천연물이나 식물 추출물의 메카니즘 또는 새로운 용도를 빠르고 정확하게 예측할 수 있다.

도 1은 일 실시예에 따른, 화합물 (chemical compound) 및 식물 추출물 (plant extract) 간의 유전자 발현 패턴 간의 유사도를 설명하기 위한 도면이다.

도 2는 일 실시예에 따라, 후보물질과 화합물의 유전자 발현 패턴을 비교하는 방법의 흐름도이다.

도 3은 일 실시예에 따라, 후보물질의 유전자 발현 패턴과 유사한 패턴을 보이는 화합물들의 순위를 결정하는 방법의 흐름도이다.

도 4a는 일 실시예에 따른 방법의 흐름도이다.

도 4b는 일 실시에 따른 의약용도 또는 생물학적 메카니즘을 예측하는 방법을 설명하기 위한 흐름도이다.

도 5는 일 실시예에 따른 인삼 추출물의 국소이성질화효소 I(topoisomerage I) 억제제로서의 효과를 캠프토더신(camptothecin)과 비교한 결과이다.

도 6은 일 실시예에 따른 인삼 추출물과 topoisomerase I 억제제로 잘 알려진 캠프토더신(camptothecin)의 직장암 세포 사멸효과를 비교한 결과이다.

도 7은 일 실시예에 따른 인삼 추출물 또는 길경(platycodon grandiflorum) 추출물과 HDAC(histone deacetylase) 억제제로 잘 알려진 보리노스타트(Vorinostat)의 p21 및 p53의 단백질 발현 수준을 비교한 결과이다.

도 8은 일 실시예 따른 인삼 추출물 또는 길경 추출물과 보리노스타트의 골수성 백혈병 세포의 세포자멸사 정도를 비교한 결과이다.

도 9는 일 실시예에 생물학적 메카니즘 또는 의약용도 예측 장치의 블록도이다.

본 개시에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.

본 개시에서 사용되는 용어는 실시예에서 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 해당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 실시예의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.

이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.

식물 추출물과 같은 천연물의 경우, 단일 화합물에 기반한 화합물과 달리 생물학적 메카니즘등이 밝혀지지 않은 경우가 많고, 천연물 내에 많은 화합물이 포함되고 있어 유전자 발현 패턴의 확인만으로 약학적 용도 및 상기 약학적 용도의 작용기전(mode of action)을 밝히는 것에 대한 문제점이 있다. Connectivity Map (CMAP) 은, 유전자 발현 프로파일 또는 의약용도등이 알려진 화합물의 데이터를 기반으로, 데이터베이스에 기록된 화합물에 대해서만 다른 의약용도, 타겟 및 메카니즘등을 예측하는데 이용되는 것이 일반적이고, 데이터베이스에 기록되지 않은 화합물의 특성을 밝히기는 쉽지 않은 문제점이 있다.

도 1을 참조하면, 약물 후보물질과 화합물과의 유전자 발현 패턴의 유사도를 분석하여, 약물 후보물질과 가장 유사한 유전자 발현 패턴을 보이는 화합물이 식별될 수 있다. 본 개시에서 약물 후보물질은 천연물, 추출물, 화합물, 혼합물을 포함한 다양한 물질을 이용할 수 있다.

일 실시예에서, 약물 후보물질과 화합물과의 유전자 발현 패턴의 유사도는 Connectivity Map (CMAP) 상에서 중첩되는 영역에 기초하여 결정될 수 있다. 예를 들어, 중첩되는 영역의 개수가 많을수록 유사한 것으로 결정될 수 있다. 예를 들어, 연이어 중첩되는 영역의 개수가 많을수록 유사한 것으로 결정될 수 있다. 도 1에서 중첩되는 영역은 노란색으로 표시된다.

일 실시예에서, 후보물질은 길경 추출물 또는 인산추출물과 같은 식물 추출물일 수 있다.

도 2를 참조하면, 일 실시예에 따르면, 전자 디바이스는, 후보물질을 대상체, 예를 들어, 인간 폐암 세포에 처리한 경우와 처리하지 않은 경우와 비교하여 차등적으로 발현되는 유전자(differentially expressed genes;DEG)를 통해 결정된, 후보물질의 유전자 표현 프로필을 수신할 수 있다. 후보물질의 유전자 표현 프로필은 실험 결과를 통해 전자 디바이스에 입력될 수 있다. 이러한 실험 결과는, 기존에 공개된 cDNA 마이크로어레이 데이터를 포함할 수 있다.

DEG는 대상체, 예를 들어, 인간 폐암 세포에 후보물질을 처리함으로써, 미리 결정된 기준 이상 상향 조정된 (upregulated) 유전자를 포함할 수 있다. DEG는 대상체에 후보물질을 처리함으로써, 미리 결정된 기준 이상 하향 조정된 (upregulated) 유전자를 포함할 수 있다. 일 실시예에서, 미리 결정된 기준은 2배일 수 있다. 예를 들어, 2배 이상 상향 조정되거나 2배 이상 하향 조정된 유전자가 DEG 로 선별될 수 있다.

일 실시예에 따르면, 전자 디바이스는 후보물질의 유전자 표현 프로필을 수집할 수 있고, 수집된 유전자 표현 프로필을 통계적으로 분석할 수 있다. 일 실시예에 따르면, 전자 디바이스는 통계적으로 분석된 유전자 표현 프로필을 이용하여 후보물질의 유전자 발현 패턴을 결정할 수 있다.

일 실시예에서, 전자 디바이스는 기 생성된 데이터베이스를 이용하여 상기 유전자 발현 패턴과 유사도가 높은 유전자 발현 패턴을 보이는 화합물을 식별할 수 있다. 여기서 기 생성된 데이터베이스는, CMAP 데이터베이스일 수 있다. 상기 일 실시예에서는 유전자의 차등 발현은 후보물질을 처리한 경우와 처리하지 않은 경우의 유전자 발현양의 차이가 2배 이상 차이나는 것을 선별하였으나, 상기 기준은 하나의 예시일뿐 본 개시는 이에 제한되지 않는다. 또한, 본 개시의 일 실시예로 인간 폐암세포를 이용하였으나, 이용할 수 있는 세포는 제한은 없으며, 목적에 맞게 당업자가 변경이 가능하다.

도 3을 참조하면, 일 실시예에 따르면, 전자 디바이스는 후보물질을 인비트로에서 처리한 경우와 처리하지 않은 경우, 차등 발현 양상을 보이는 유전자를 선별 후, 기 생성된 데이터베이스에 적용하여, 상기 후보물질의 유전자 발현 양상과 기 생성된 데이터베이스에 저장된 물질의 유전자 발현 양상과 비교하여 유사정도를 점수화하여 순위를 나열할 수 있다. 보다 구체적으로 상기 유사도를 기반으로 물질의 순위(Rank)를 결정하여, 이를 순서대로 나열한 리스트 형태로 적어도 하나의 물질에 대한 관한 정보를 생성할 수 있다. 또한, 본 개시의 일 실시예로는 상기 기 생성된 데이터베이스는 CMAP일 수 있으나, 이에 한정되지 않는다. 상기 CMAP은 1,309가지의 생물체 작용 저분자 (bioactive small molecule)를 처리한 인간 세포를 배양하여 얻은 유전체 수준의 전사 발현 데이터 (genome-wide transcriptional expression data)를 모아 놓은 데이터베이스를 의미한다.

도 3을 참조하면, 후보물질, 즉, 인삼 추출물 또는 길경 추출물의 유전자 발현 패턴에 대응하는 유전자 발현 패턴을 보이는 물질들이 식별되어, 인삼 추출물 또는 길경 추출물의 유전자 발현 패턴과 유사한 순서대로 물질들 간의 순위가 결정될 수 있다. 도 3은 인삼 추출물과 길경 추출물을 예시하나, 이에 제한되지 않고 다른 식물 추출물의 유전자 발현 패턴과 유사한 유전자 발현 패턴을 보이는 화합물들도 식별될 수 있다.

일 실시예에서, CMAP 상에서 중첩되는 영역이 많은 순서대로, 물질들 간의 순위가 결정될 수 있다. 예를 들어, CMAP 상에서 후보물질과 중첩되는 영역을 가장 가지는 화합물이, 해당 후보물질과 가장 유사한 화합물로 식별될 수 있다.

일 실시예에서, CMAP 상에서 연이어 중첩되는 영역의 개수가 많은 순서대로, 물질들 간의 순위가 결정될 수 있다. 예를 들어, CMAP 상에서 후보물질과 중첩되는 영역들 중 서로 인접한 영역이 많을수록, 해당 후보물질과 가장 유사한 화합물로 식별될 수 있다. 예를 들어, 표 1 을 참조하면, 화합물 1 의 중첩영역들 중에서 서로 인접한 영역이 없고, 화합물 2 의 중첩 영역들 중에서 2개 영역이 서로 인접하고, 화합물 3 의 중첩 영역들 중에서 3개 영역이 서로 인접하는 경우, 화합물 3, 화합물2, 및 화합물 1 의 순서대로 후보물질과 유사한 것으로 결정될 수 있다. 일 실시예에서, 연이어 중첩되는 영역의 개수에 비례하여 가중치가 적용될 수 있다. 예를 들어, 화합물 3 과 같이 3개의 중첩되는 영역이 서로 인접하는 경우 3의 가중치를 적용함으로써, 9개의 영역이 중첩되는 것으로 계산하고, 화합물 2와 같이 2개의 중첩되는 영역이 서로 인접하는 경우 2의 가중치를 적용함으로써, 6개의 영역이 중첩되는 것으로 계산하고, 화합물 1과 같이 중첩되는 영역들 중 서로 인접하는 영역이 없는 경우에는 가중치를 적용하지 않음으로써, 3개의 영역이 중첩되는 것으로 계산할 수 있으나, 이에 제한되지 않는다. 예를 들어, 화합물 1과 같이 중첩되는 영역들 중 서로 인접하는 영역이 없는 경우에는 1 이하의 가중치를 적용할 수도 있다.

중첩영역: ■비중첩영역: □	화합물 1	화합물 2	화합물 3
중첩 영역 패턴	□■□■□■	□■■□□■	□■■■□□

표 1 은 하나의 축만을 도시하고 있으나, 패턴이 2차원으로 표현되는 경우에는 2개의 축을 따라 인접 여부가 판단될 수 있고, 패턴이 3차원으로 표현되는 경우에는 3개의 축을 따라 인접 여부가 판단될 수 있다. 예를 들어, 표 2 를 참조하면, 화합물 4 의 중첩영역들 중에서 서로 인접한 영역이 없고, 화합물 5 의 중첩 영역들 중에서는 6개 영역이 서로 인접하고, 화합물 3 의 중첩 영역들 중에서 9개 영역이 서로 인접하는 경우, 화합물 3, 화합물2, 및 화합물 1 의 순서대로 후보물질과 유사한 것으로 결정될 수 있다.

일 실시예에서, CMAP 상에서 연이어 중첩되는 영역의 밀도가 높은 순서대로, 물질들 간의 순위가 결정될 수도 있다. 예를 들어, 후보물질과 중첩되는 영역의 개수가 같은 화합물들 중에서도, 중첩되는 영역이 산재해 있는 (scattered) 화합물보다, 중첩되는 영역이 더 조밀한 화합물이 후보물질과 더 유사한 것으로 결정될 수 있다.

중첩영역: ■비중첩영역: □	화합물 4	화합물 5	화합물 6
중첩 영역 패턴	□■□■□■■□■□■□□■□■□■	□■■□□■■□■■□□□■■□□■	□■■■□□□□■■■□□■■■□□

일 실시예에 따르면, 인삼 추출물 또는 길경 추출물의 용도는, 가장 높은 순위의 화합물 a 와 동일한 용도로 결정될 수 있으나, 이에 제한되지 않는다.

일 실시예에 따르면, 인삼 추출물 또는 길경 추출물의 용도는, 상위 순위, 예를 들어, 1순위와 2순위의 화합물들에서 공통되는 용도로 결정될 수 있으나, 이에 제한되지 않는다. 인삼 추출물 또는 길경 추출물의 용도는, 인삼 추출물 또는 길경 추출물의 유전자 발현 패턴과 유사한, 상위 N개의 화합물들에서 가장 많이 공통되는 용도로 결정될 수 있다. 이에 따라, 후보물질의 적합한 용도를 예측할 수 있다.

도 4a는 일 실시예에 따른 방법의 흐름도이다.

402에서, 전자 디바이스는 제 1 물질의 제 1 유전자 발현 패턴을 결정할 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴은, 대상체에 제 1 물질이 투여된 경우와, 대상체에 제 1 물질이 투여되지 않은 경우를 비교하여 획득될 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴은 이전의 제 1 물질에 대한 실험 데이터를 수집하여 통계적으로 결정될 수 있다. 제 1 물질의 제 1 유전자 발현 패턴을 결정하는 방법은 도 1 및 도 2 를 참조하여 설명되었으므로, 중복 설명은 생략한다.

일 실시예에서, 제 1 물질은 식물 추출물과 같은 천연물질일 수 있다.

404에서, 전자 디바이스는 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별할 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 보이는 제 2 물질은, 다양한 화합물들 중 제 1 유전자 발현 패턴과 동일하거나 가장 유사한 유전자 발현 패턴을 보이는 물질일 수 있다.

일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 보이는 제 2 물질은, 다양한 화합물들 중 제 1 유전자 발현 패턴과 소정 기준 이상 유사한 유전자 발현 패턴을 보이는 물질들일 수 있다. 제 2 물질은 해당 물질들 중 제 1 유전자 발현 패턴과의 유사도 순위에 따라 결정될 수도 있다.

일 실시예에서, 제 2 물질은 이미 그 의학적 용도가 알려진 화합물일 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 보이는 제 2 물질은, 다양한 화합물들 중 제 1 유전자 발현 패턴과 높은 유사성, 예를 들어, 1순위 및 2순위의 유사성을 가지고, 서로 공통되는 용도를 가지는 물질들일 수 있다.

제 2 물질을 식별하는 방법은 도 3, 도 4a 및 도 4b 를 참조하여 설명되었으므로, 중복 설명은 생략한다.

406에서, 전자 디바이스는 제 2 물질의 용도에 기초하여 제 1 물질의 용도를 출력할 수 있다. 제 1 물질의 용도를 결정하여 출력하는 방법은 도 3 을 참조하여 설명되었으므로, 중복 설명은 생략한다.

단계 S410에서 인 비트로에서 후보 물질을 투여한 경우의 제 1 데이터 및 상기 후보 물질을 투여하지 않은 경우의 제 2 데이터를 획득할 수 있다. 상기 단계에서는 분리된 세포, 조직, 혈장, 혈액 및 다양한 시료에 후보 물질을 투여한 경우와 투여하지 않은 경우의 유전자 발현의 변화의 정보를 얻기 위한 단계이다.

단계 S420에서는 S410에서 얻은 제 1 데이터 및 상기 제 2 데이터에 기초하여, 발현 양상이 변화한 유전자들을 결정할 수 있다. 유전자 발현 양상이 변화하였다는 기준은 당업계에서 발현 양상이 유의성 있게 변화하였다고 판단할 수 있는 정도를 의미한다. 또한, 유전자 발현의 양상이 변화하는 방향은 후보물질을 처리한 경우와 처리하지 않은 경우를 비교하여, 유전자 발현양이 소정기준 이상 감소한 경우와 소정기준 이상 증가한 경우가 존재하고, 본 개시의 일 실시예에서는 2배이상 변화한 경우 유전자의 발현양상이 변화하였다고 결정할 수 있으나, 상기 기준은 설정에 의하여 변경될 수 있다.

단계 S430에서는 상기 발현 양상이 변화한 유전자들의 발현양상과 소정 기준 이상 일치하는 발현 양상을 갖는 물질들을 결정할 수 있다. 상기 물질들을 결정하는 방법을 구체적으로 설명하면, 기 생성된 데이터베이스에는 다양한 물질들의 유전자 발현 양상 및 알려진 의약용도, 타겟 유전자 또는 단백질 등의 생물학적 정보가 저장되어 있고, 상기 저장된 유전자 발현 양상의 정보를 기반으로 후보물질의 유전자 발현 양상과 유사도가 높은 순서대로 물질들을 리스트화 할 수 있으며, 후보물질과 기 생성된 데이터베이스 내의 물질의 유사도가 높은 순위대로 나열할 수 있으며, 바람직하게는 20개 이하의 물질을 리스트화 시킬 수 있으나, 이는 당업자가 필요에 따라 변경이 가능하다. 또한, 본원 개시에서의 상기 소정 기준이란, 예를들어 후보물질의 유전자 발현의 증감 방향과 기 생성된 데이터베이스의 물질의 유전자 발현의 증감 방향과 일치하는 유전자의 개수에 가중치를 주어 기준을 설정할 수 있다. 만약 증감 방향이 일치하는 유전자의 개수가 40개이고, 각 일치하는 유전자에 가중치를 1로 하면 40*1이 되어 기 생성된 데이터 내의 물질은 40점의 점수를 부여받을 수 있고, 설정된 기준을 40으로 설정한다면, 상기 물질은 리스트화 되어질 수 있다. 상기 설정된 기준은 하나의 예시일 뿐 본 개시를 한정하는 것은 아니다.

단계 S440은 상기 물질들에 기초하여, 상기 물질들이 공유하는 특성을 결정하는 단계이다. 상기 특성은 물질의 특정 인간 세포 내에서의 유전자 발현 양상, 의약용도, 타겟 단백질, 타겟 유전자등이 있으나, 이에 제한되는 것은 아니다.

단계 S450은 상기 공유되는 특성에 기초하여 상기 후보 물질의 특성의 예측을 출력하는 단계에 관한 것이다. 본 개시의 일 실시예에 따르면, 후보물질로 인삼 추출물을 이용한 경우, 물질의 리스트화가 20개가 되었고, 이 중 5개의 물질에서 항암 활성을 공유하고 있고, 2개의 물질은 항염제였고, 2개는 항균제였고, 이 중 가장 높은 순위를 차지하는 물질은 Camptothecin이었고, 2위는 irinotecan으로 모두 topoisomerase I의 억제제라는 특성을 공유한다. 따라서, 상기 후보 물질은 topoisomerase I의 억제제라고 예측할 수 있으며, 항암제라고 예측할 수 있다.

인삼 및 길경과 같은 천연물의 경우, 단일 화합물에 기반한 화합물과 달리 생물학적 메카니즘등이 밝혀지지 않은 경우가 많고, 천연물 내에 많은 화합물이 포함되고 있어 유전자 발현 패턴의 확인만으로 약학적 용도 및 상기 약학적 용도의 작용기전(mode of action)을 밝히는 것에 대한 문제점이 있다. CMAP은, 유전자 발현 프로파일 또는 의약용도등이 알려진 화합물의 데이터를 기반으로, 데이터베이스에 기록된 화합물에 대해서만 다른 의약용도, 타겟 및 메카니즘등을 예측하는데 이용되는 것이 일반적이고, 데이터베이스에 기록되지 않은 화합물의 특성을 밝히기는 쉽지 않은 문제점이 있다.

도 5는 일 실시예에 따른 인삼 추출물의 국소이성질화효소 I(topoisomerage I) 억제제로서의 효과를 캠프토더신(camptothecin)과 비교한 결과이다를 나타내고,도 6은 일 실시예에 따른 인삼 추출물과 topoisomerase I 억제제로 잘 알려진 캠프토더신(camptothecin)의 직장암 세포 사멸효과를 비교한 결과를 나타낸다.

도 5 및 도 6을 참조하면, 본 개시의 일 실시예에서는 인삼 추출물을 후보 물질로 이용하였고, 부탄올 기반 인삼 추출물을 인간 폐암 세포주에 50 μg/mL를 처리하거나, 처리하지 않은 경우에 cDNA 마이크로어레이를 이용항 유전자 발현 양상을 조사하였다. 그 결과, 80개의 유전자 발현이 증가한 유전자와 29개의 유전자 발현이 감소한 유전자를 도출하였고, 이때 유전자 발현의 변화가 2배이상 차이가 나는 유전자를 선별하였다. 상기 유전자 발현 양상을 CMAP을 이용하여 유사한 유전자 발현 양상을 보이는 20개의 물질을 도출하였다. 이 중 5개의 물질에서 항암 활성을 공유하고 있고, 2개의 물질은 항염제였고, 2개는 항균제였고, 이 중 가장 높은 순위를 차지하는 물질은 camptothecin이었고, 2위는 irinotecan으로 모두 topoisomerase I의 억제제라는 특성을 공유하고 있었다. 따라서, 인삼 추출물은 topoisomerase I의 억제제로서의 생물학적 메카니즘을 가질 것이라고 예측하였고, 이 같은 예측을 검증하기 위하여, 인산 추출물이 topoisomerage I 활성 억제 및 직장암 세포의 사멸효과 있어 Camptothecin과 동일한 생물학적 메카니즘 및 의약용도가 있음을 확인하였다. 따라서, 일시예에 따라 인삼 추출물이 topoisomerase I 억제제로서의 생물학적 메카니즘을 갖고, 항암 효과가 있을 것이라는 예측이 정확함을 확인할 수 있었다.

도 7 은 일 실시예에 따른 인삼 추출물 또는 길경(platycodon grandiflorum) 추출물과 HDAC(histone deacetylase) 억제제로 잘 알려진 보리노스타트(Vorinostat)의 p21 및 p53의 단백질 발현 수준을 비교한 결과이고, 도 8은 일 실시예 따른 인삼 추출물 또는 길경 추출물과 보리노스타트의 골수성 백혈병 세포의 세포자멸사 정도를 비교한 결과이다. 도 7 또는 도 8을 참조하면 인삼 추출물 또는 길경을 인간 폐암 세포주에 처리한 경우와 처리하지 않은 경우 유전자 발현 양상이 변화하는 유전자를 기반으로, CMAP를 이용하여 상기 발현 양상과 유사한 발현 양상을 갖는 물질 리스트를 확보하였고, 이 때 상기 물질들이 HDAC 억제제로서의 생물학적 메카니즘을 공유하고 있음을 확인하였다. 따라서, 이 같은 예측을 검증하기 위하여, HDAC 억제시 유도되는 p53, p21의 단백질 발현 정도를 분석하여 HDAC로 잘알려진 보리노스타트와 비교하였고, 골수 백혈병 세포주에서의 세포 사멸효과를 확인하였다. 이의 결과, HDAC 억제제로서의 작용함을 확인하여, 본 개시의 일 실시예의 효과를 검증하였다.

본 개시에서 식물 추출물의 의약 용도를 예측하는 방법이 실시예로서 설명되었으나, 본 개시는 설명된 실시예에 한정되지 않음이 이해되어야 한다. 예를 들어, 본 개시에 따른 예측 방법은 식물 추출물뿐만 아니라 용도가 밝혀지지 않은 다른 물질에 대해서도 발명의 사상을 벗어나지 않는 범위에서 충분히 적용될 수 있을 것이다.

도 9는 일 실시예에 따른, 생물학적 메카니즘 또는 의약용도 예측 장치의 블록도이다. 전술된 전자 디바이스는 도 9 의 생물학적 메카니즘 또는 의약용도 예측 장치일 수 있다.

도 9를 참조하면, 생물학적 메카니즘 또는 의약용도 예측장치(900)는 메모리(910), 입력부(920) 및 적어도 하나의 프로세서(930)를 포함할 수 있다. 상기 실시 예들에서 제안한 방법에 따라, 메모리(910), 입력부(920) 및 적어도 하나의 프로세서(930)가 동작할 수 있다. 다만, 일 실시예에 따른 장치(900)의 구성 요소가 전술한 예에 한정되는 것은 아니다. 다른 실시예에 따라, 생물학적 메카니즘 또는 의약용도 예측장치(900)는 전술한 구성 요소들 보다 더 많은 구성 요소를 포함하거나 더 적은 구성 요소를 포함할 수도 있다.

프로세서 (930) 는 장치 (900) 의 전반적인 동작을 제어할 수 있다. 프로세서 (930) 는 사용자의 입력에 기초하여 장치 (900) 를 제어하거나, 프로세서 (930) 에 의해 실행되는 프로그램에 기초하여 장치 (900) 를 제어할 수 있다. 프로그램은 메모리 (910) 에 저장될 수 있다.

메모리 (910) 는 인스트럭션들을 저장할 수 있고, 프로세서 (930) 는 인스트럭션들을 실행하여, 본 개시에서 설명된 방법을 수행하도록 구성될 수 있다. 메모리 (910) 는 본 개시에서 설명된 방법을 수행하는 데 필요한 데이터를 저장할 수 있으나, 이에 제한되지 않는다. 예를 들어, 이러한 데이터는 장치 (900) 와 다른 디바이스, 예를 들어, 서버에 저장될 수 있다.

일 실시예에 따른 메모리(910)는 유전체 수준의 전사 발현 데이터를 기초로 기 생성된 데이터 베이스를 저장할 수 있다. 예를 들어, 메모리(910)는 데이터베이스의 일 예로 CMAP을 저장할 수 있으나, 이에 제한되지 않는다. 또한, 다른 실시예에 따라, 메모리(910)는 CMAP을 통해 획득한 물질의 유전체 수준의 전사 발현 데이터, 의약용도 및 타겟 단백질등을 저장할 수 있다.

일 실시예에 따른 입력부(920)는 인 비트로에서 후보 물질을 투여한 경우와 투여하지 않은 경우의 차별적 유전자 발현 수준을 입력할 수 있다. 다만, 이는 일 실시예일 뿐, 입력부(920)는 요구되는 모든 사용자 입력을 수신할 수 있다.

일 실시예에 따른 적어도 하나의 프로세서(930)는 인 비트로에서 후보 물질을 투여한 경우의 제 1 데이터 및 상기 후보 물질을 투여하지 않은 경우의 제 2 데이터를 기초로, 발현 양상이 변화한 유전자를 결정하고, 결정된 유전자들의 발현양상과 소정 기준 이상 일치하는 발현 양상을 갖는 물질을 결정할 수 있고, 상기 물질들에 기초하여, 상기 물질들이 공유하는 특성을 결정할 수 있다. 또한, 상기 특성에 기초하여 상기 후보 물질의 특성의 예측을 출력할 수 있다.

본 개시에 따른 장치는 프로세서, 프로그램 데이터를 저장하고 실행하는 메모리, 디스크 드라이브와 같은 영구 저장부(permanent storage), 외부 장치와 통신하는 통신 포트, 터치 패널, 키(key), 버튼 등과 같은 사용자 인터페이스 장치 등을 포함할 수 있다. 소프트웨어 모듈 또는 알고리즘으로 구현되는 방법들은 상기 프로세서상에서 실행 가능한 컴퓨터가 읽을 수 있는 코드들 또는 프로그램 명령들로서 컴퓨터가 읽을 수 있는 기록 매체 상에 저장될 수 있다. 여기서 컴퓨터가 읽을 수 있는 기록 매체로 마그네틱 저장 매체(예컨대, ROM(read-only memory), RAM(random-access memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다. 매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.

본 개시에서 인용하는 공개 문헌, 특허 출원, 특허 등을 포함하는 모든 문헌들은 각 인용 문헌이 개별적으로 및 구체적으로 병합하여 나타내는 것 또는 본 개시에서 전체적으로 병합하여 나타낸 것과 동일하게 본 개시에 병합될 수 있다.

본 개시의 이해를 위하여, 도면에 도시된 바람직한 실시 예들에서 참조 부호를 기재하였으며, 본 개시의 실시 예들을 설명하기 위하여 특정 용어들을 사용하였으나, 특정 용어에 의해 본 개시가 한정되는 것은 아니며, 본 개시는 당업자에 있어서 통상적으로 생각할 수 있는 모든 구성 요소들을 포함할 수 있다.

본 개시의 실시예들은 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 본 개시의 실시예들은 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 본 개시의 실시예들의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 본 개시는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 개시는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. "매커니즘", "요소", "수단", "구성"과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.

본 개시에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 개시의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 본 개시의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.

본 개시에서 "상기"의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 본 개시의 실시예에서 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 적용한 실시예를 포함하는 것으로서(이에 반하는 기재가 없다면) 이해되어야 하고, 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 동일한 것으로 이해되어야 한다. 본 개시의 실시예에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 개시가 한정되는 것은 아니다. 본 개시에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 개시를 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 개시의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.

<실시예 1> 세포 및 시약 준비

1-1. 인삼

HCT116 대장암 세포주는 한국 세포주 은행(Korea Cell Line Bank)에서 구입하였고 10% FBS(fetal bovine serum) 및 1% 페니실린(penicillin)/스트렙토마이신(streptomycin)을 포함하는 RPMI(Roswell Park Memorial Institute)-1649 배지(HyClone,USA)에 배양하였다. 시약 및 인삼 추출물은 FBS가 없는 상태에서 처리하였다. siRNA 실험을 위하여,　 Werner syndrome gene (WRN)을 타겟하는 siRNA( 5'-UUCUUGUCACGUCCUCUG-3', 서열번호 1) 및 음성 대조군 siRNA(5'-UUCUCCGACGUGUCACGUdTdT-3', 서열번호 2)를 준비하였다.

1-2. 길경

인간 비소폐암세포주(non-small-cell lung cancer cell) A549 및 NCI-H460 를 10% FBS(fetal bovine serum) 및 1% 항생제를 포함하는 RPMI 21에 배양하였다. 도라지(Platycodon grandiflorum) 및 인삼 추출물은 공급 받았다(Dr. Young Pyo Jang, Kyung Hee University, Seoul, Korea). 보리노스타트(Vorinostat)는 Sigma Aldrich (#SML0061)에서 구입하였다.

<실시예 2> 유전자 발현 및 커넥티비티 맵(connectivity map)

2-1. 인삼

인삼 추출물이 처리된 세포에 대한 유전자 발현 프로파일을 확인하기 위하여, cDNA 마이크로어레이 데이터를 이용하였고(Kwon et al., 2013, 16, 30.), 상기 데이터를 바탕으로 CMAP analysis (http://www.broad.mit.edu/cmap/)를 수행하였다. 80개의 상향 조절된 유전자(upregulated genes) 및 29개의 하향 조절된 유전자(downregulated genes)는 인삼의 효능에 대한 새로운 메카니즘을 밝히기 위한 인풋 데이터로 이용되었다. 통계적으로 유의미한 상위 랭킹된 20개의 화합물을 선택하고 중복 리스트를 체크하여 확인하였다.

<실시예 3>　 인삼의 국소이성질화효소(Topoisomerase) I 활성 확인

국소이성질화효소 I 활성을 확인하기 위하여, 분석 키트(TG1018-1; Topogen, USA)를 제조사 메뉴얼에 따라 수행하여 확인하였다. 구체적으로, 2 μL의 10×국소이성질화효소 I 반응 완충액 및 200 ng의 수퍼코일 및 리랙스트(supercoiled and relaxed) plasmid DNA(예컨대, 10 μL of 20 μg/mL stock solution)을 각 튜브에 옮겨 담았다. 그 후, 인삼 추출물을 각 농도(50, 500, and 5000 μg/mL)별로 추가하였다. 5 U/mL 정제된 국소이성질화효소 I 효소를 추가하고, 각 튜브는 37도에서 30분 동안 배양하였다. 각 샘플은 1%의 아가로스 겔에 로딩하였다.

<실시예 4> 웨스턴 블랏 분석

4-1. 인삼

캠프토더신(camptothecin) 및 인삼이 처리된 세포를 150 mM NaCl,20 mM Tris-HCl [pH 7.5], 1 mM EGTA, 1% NP-40, 1% 디옥시콜린산나트륨(sodium deoxycholate), 1 mM EDTA 및 포스파타아제(phosphatase) 억제제를 포함하는 버퍼로 용해되었다. 상기 용해물은 면역블로팅으로 분석하였다. 단백질 발현은 DNA damage antibody sampler kit (#9947, Cell Signaling Technology, USA)를 이용하여 수행되었고, 항체는 anti-phospho-Chk1 Ser 345 (#2348; Cell Signaling Technology), anti-phospho-Chk2 Thr 68 (#2197; Cell Signaling Technology), anti-phospho- Histone H2A.X Ser 139 (#9718; Cell Signaling Technology), anti-phospho-p53 Ser 15(#9286; Cell Signaling Technology) 및 anti-β-actin (A5441; Sigma-Aldrich, USA)을 이용하였다.

4-2. 길경

추출물이 처리된 A549 세포를 수득하고 RIPA 용해 버퍼[150 mM NaCl, 20mM Tris-HCl (pH 7.5), 1 mM EGTA, 1% NP-40, 1% 디옥시콜린산나트륨, 1 mM EDTA 및 포스파타아제(phosphatase) 억제제]를 처리하여 용해하였다. 추출된 단백질은 다음과 같은 항체를 이용하여 SDS-PAGE를 수행하였다: p21 antibody (Santa Cruz Biotechnology, #sc-53870), p53 antibody(Santa Cruz Biotechnology, #sc-126), and β-actin antibody (Sigma-Aldrich, #A5441).

<실시예 5> MTT 분석

5-1. 인삼

세포 생존력 측정은 3-(4,5-dimethylthiazol-2-yl)-2,5-diphenyltetrazolium bromide assay (MTT; Promega, Ltd, USA.)를 이용하여 제조사의 프로토콜에 따라 수행하였다. 구체적으로, 세포를 96-웰 플레이트에 5×10³세포 농도로 웰 당 접종하였다. 접종 후, 세포를 5 mg/mL MTT로 4시간 동안 배양하였다. 배지를 제거하고 150 μL 가용화 용액 및 정지 용액을 첨가한 후, 37도에서 4시간 동안 배양하였고, 반응액의 흡광도는 570 nm에서 측정하였다.

5-2. 길경

NCI-H460 세포의 세포 생존률을 평가하기 위하여, 96-웰 플레이트 당 5 × 10³로 세포를 접종하였다. 세포는 vehicle, 보리노스타트(Vorinostat) 및 각 추출물을 24시간 동안 처리하고, 5 mg/ml MTT [3-(4,5-dimethylthiazol-2-yl)-2,5- diphenyltetrazolium bromide)]로 배양하였다. 4시간 후, 배양 배지를 제거하고, 150 μl의 DMSO를 세포에 첨가하여 포르마잔 생성물에 용해시켰다. MTT 착색 용액의 흡광도는 마이크로 플레이트 판독기를 이용하여 570 nm로 측정하였다.

<실시예 6> 길경 HDAC 활성 분석

NCI-H460 세포를　 10-cm2 페트리디쉬에 70% 컨플루언스(confluence)로 접종하였고, 4시간 동안 추출물을 각 세포에 처리하였다. HDAC 활성 발색 분석 키트(BioVision, #K331)를 이용하여 HDAC 활성을 분석하였다. 핵산 추출물(50 μg)은 10 μl HDAC 분석 버퍼 및 5 μl HDAC 표색 기질로 37도, 1시간 조건으로 배양하였다. 그 후, 세포에 10 μl 라이신 중화제를 첨가하고 37도, 30분 조건으로 반응이 종료될때까지 배양하였다. 흡광도는 마이크로 플레이트 판독기를 이용하여 405 nm로 측정하였다.

<실시예 7> 길경 TUNEL 분석

A549 세포는 vehicle, 보리노스타트(Vorinostat) 및 각 추출물로 24시간 동안 처리하였다. 처리 후, 4% PFA (paraformaldehyde)로 고정하였고 0.1% Triton X-100로 투과시켰다. 손상된 세포는 In Situ Cell Death Detection Kit (Roche, #12 156 792 910)를 이용하여 염색하고 공 초점 현미경으로 분석하였다.

Claims

적어도 하나의 프로세서를 포함하는 전자 디바이스에서 수행되는 방법으로서:

상기 적어도 하나의 프로세서가, 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하는 단계;

상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하는 단계; 및

상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하는 단계를 포함하는, 의약 용도 예측 방법.
제 1 항에 있어서,

상기 유전체 수준의 전사 발현 데이터는 실험 데이터에 기초하여 업데이트되는, 의약 용도 예측 방법.
제 1 항에 있어서,

상기 제 1 물질은 식물 추출물이고, 상기 제 2 물질은 용도가 알려진 화합물인, 의약 용도 예측 방법.
제 1 항에 있어서,

상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하는, 의약 용도 예측 방법.
제 1 항에 있어서,

상기 제 1 유전자 발현 패턴은, 대상체에 상기 제 1 물질을 투여함으로써 차등적으로 발현되는 유전자 (differentially expressed genes;DEG) 를 통해 결정되는, 의약 용도 예측 방법.
제 5 항에 있어서,

상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 상향 조정된 (upregulated) 유전자를 포함하는, 의약 용도 예측 방법.
제 5 항에 있어서,

상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 하향 조정된 (downregulated) 유전자를 포함하는, 의약 용도 예측 방법.
제 1 항에 있어서,

상기 제 2 유전자 발현 패턴은, 복수의 제 2 유전자 발현 패턴들 중 상기 제 1 유전자 발현 패턴과 동일하거나 가장 유사한, 의약 용도 예측 방법.
제 1 항에 있어서,

상기 제 2 물질을 식별하는 단계는,

미리 결정된 기준에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 복수의 제 2 유전자 발현 패턴들 각각을 야기하는 복수의 제 2 물질들을 식별하는 단계를 포함하고,

상기 제 1 물질의 상기 용도를 출력하는 단계는,

상기 복수의 제 2 물질들 간에 가장 많이 공통되는 용도에 기초하여, 상기 제 1 물질의 상기 용도를 출력하는 단계를 포함하는, 의약 용도 예측 방법.
제 1 항에 있어서,

상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하고, 상기 제 2 유전자 발현 패턴은 상기 CMAP 상에서 상기 제 1 유전자 발현 패턴과 중첩되는 영역을, 복수의 제 2 유전자 발현 패턴들 중에서 가장 많이 포함하는, 의약 용도 예측 방법.
하드웨어와 결합하여 제 1 항 내지 제 10 항 중 어느 한 항의상기 방법을 실행시키기 위해 매체에 저장되는 의약 용도 예측 컴퓨터 프로그램.
제 1 항 내지 제 10 항 중 어느 한 항의 상기 방법을 컴퓨터에서 실행하기 위한 의약 용도 예측 프로그램이 수록된 컴퓨터 판독가능 기록매체.
인스트럭션들을 저장하는 메모리; 및

상기 인스트럭션들을 실행하여:

제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하고,

상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하고,

상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하도록 구성된 적어도 하나의 프로세서를 포함하는 의약 용도 예측 디바이스.