KR101783689B1 - 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치 - Google Patents
질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치 Download PDFInfo
- Publication number
- KR101783689B1 KR101783689B1 KR1020150086898A KR20150086898A KR101783689B1 KR 101783689 B1 KR101783689 B1 KR 101783689B1 KR 1020150086898 A KR1020150086898 A KR 1020150086898A KR 20150086898 A KR20150086898 A KR 20150086898A KR 101783689 B1 KR101783689 B1 KR 101783689B1
- Authority
- KR
- South Korea
- Prior art keywords
- drug
- disease
- clinical
- specific clinical
- vector
- Prior art date
Links
Images
Classifications
-
- G06F19/706—
-
- G06F19/707—
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
본 발명은 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치에 관한 것이다. 구체적으로 제 1저장부(100)에 임상학적 변수들의 상태를 나타내는 질병 특이적 임상학적 특징 벡터(10)가 저장되는 단계(S100); 제 2저장부(200)에 약물 투여시 나타나는 임상학적 변수들의 상태를 나타내는 약물 특이적 임상학적 효과 벡터(20)가 저장되는 단계(S200); 비교부(300)가 상기 질병 특이적 임상학적 특징 벡터(10)와 약물 특이적 임상학적 효과 벡터(20)의 임상학적 변수가 가지는 방향성을 비교하는 단계(S300); 비교부(300)의 결과에 기초하여 상기 약물이 상기 질병에 대해 약효가 있는지 여부를 판단하는 단계(S400);를 포함한다.
Description
본 발명은 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치에 관한 것으로, 보다 상세하게는 질병 특이적 임상학적 특징 벡터(Clinical Disease Signature Vector) 및 약물 특이적 임상학적 효과 벡터(Clinical Drug Effect Vector)를 생성하여 이들이 포함하는 방향성 정보(Relation Directionality)를 바탕으로 한 신약 재창출 기법 및 장치에 관한 것이다.
최근 다국적 제약 회사들은 특허 기간 만료와 신약 개발 비용의 증가에 따른 수익성 악화로 큰 위기를 맞고 있다. 다양한 신약 개발 기술과 생명공학 분야의 대용량 데이터의 축적에도 불구하고, 신약 허가 건수는 감소하고 있다.
이는 신약 물질 발굴에 요구되는 비용 증가와, 높아진 안전성 규정에 따른 결과로 이런 위기를 극복하기 위해 저비용/고효율의 신약 개발 방안이 요구되는데, 신약 재창출(Drug Reposition)이 그 요구를 충족시킬 수 있는 새로운 방법으로 주목받고 있다.
신약 재창출(Drug Reposition)이란 독성 및 안전성 검사를 통과한 기존 약물에 대해 약물의 새로운 치료 효과를 밝혀내는 것으로, 신약 개발에 필요한 비용 및 시간을 절감할 수 있는 장점이 있다.
신약 재창출을 위한 기존 연구는 약물의 구조적 유사성(Chemical Structure Similarity), 약물과 표적 간의 물리적 상호작용(Physical Interaction Between Chemical and Target Protein) 그리고 약물과 질병 간의 유전자 발현 패턴(Gene Expression Pattern of Chemical and Disease)정보를 이용하고 있다. 이러한 분자 중심적(Molecular-Centered) 접근 방법은 약물, 표적 그리고 질병 간의 관계성을 체계적이고 종합적인 방법으로 분석하고 있지만, 인체의 생리학적 시스템이 가지는 복잡성으로 인해, 분자수준에서 증명된 약물의 치료효과가 실제 임상에서 재현되지 않는 경우가 있다(Translational Problem). 또한, 약물과 표적의 3차원 구조적 정보의 경우, 대부분 예측에 의해 제공되기 때문에 약물과 표적 간의 관계성을 정확하게 밝혀내기 어렵다.
최근 전자의무기록(Electronic Health Records, EHR) 시스템이 보급되어 대규모 임상 정보(Clinical Information) 데이터베이스가 구축되고 있다. 이러한 임상 정보는 약물 및 질병 상태의 표현형적 반응(Phenotypic Reaction)을 반영한다는 점에서 기존 연구들의 한계점을 극복할 수 있는, 신약 재창출을 위한 새로운 정보로 각광받고 있다.
본 발명에서는 대규모 임상정보를 기반으로 질병의 임상학적 특징(Clinical Disease Signature)과 약물의 임상학적 효과(Clinical Drug Effect) 사이의 상보성(Complementarity)을 활용한 새로운 신약 재창출 프레임워크를 제안하고자 한다.
본 발명은 상술한 신약 재창출을 위한 기존 연구의 문제점을 해소하기 위해 창출된 것으로서, 본 발명의 목적은 대규모 임상정보를 기반으로 질병의 임상학적 특징(Clinical Disease Signature)과 약물의 임상학적 효과(Clinical Drug Effect)를 나타내는 각각의 벡터를 생성하고, 각각의 벡터가 포함하고 있는 방향성 정보로부터 질병과 약물 사이의 상보성(Complementarity)을 측정하여 새로운 신약 재창출 기법 및 그 장치를 제공하는 데 있다.
본 발명의 해결과제는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 해결과제들은 아래의 기재로부터 당해 기술분야에 있어서의 통상의 지식을 가진 자에게 명확하게 이해되어질 수 있을 것이다.
상기와 같은 목적을 달성하기 위하여 본 발명은 질병 상태에서 임상학적 변수들의 상태를 나타내는 질병 특이적 임상학적 특징 벡터를 생성하여 저장하는 제 1저장부; 약물 투여시 나타나는 임상학적 변수들의 상태를 나타내는 약물 특이적 임상학적 효과 벡터를 생성하여 저장하는 제 2저장부; 상기 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터의 임상학적 변수가 가지는 방향성을 비교하는 비교부; 및 상기 비교부의 결과에 기초하여 약물이 상기 질병에 대해 약효가 있는지 여부를 판단하는 판단부를 포함하고, 상기 판단부는 상기 질병 특이적 임상학적 특징 벡터와 상기 약물 특이적 임상학적 효과 벡터 사이의 상보성을 활용하여 신약 재창출 지수를 산출하고, 상기 신약 재창출 지수는 하기 수식으로 정의된다.
(여기서, ScoreDisease-Drug : 신약 재창출 지수,α:사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 ASSOCIATION 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
또한, 상기 질병 특이적 임상학적 특징 벡터는 t 검증(t-test)을 통하여 특정 질병 상태에서 유의미하게 증가되거나 감소되어 있는 임상학적 변수를 찾아내어, 오류 발견률(FDR)이 5% 이하의 값을 가지는 임상학적 변수들만 선정하여 저장되는 단계를 포함할 수 있다.
(여기서, ScoreDisease-Drug : 신약 재창출 지수,α:사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 ASSOCIATION 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
또한, 상기 질병 특이적 임상학적 특징 벡터는 t 검증(t-test)을 통하여 특정 질병 상태에서 유의미하게 증가되거나 감소되어 있는 임상학적 변수를 찾아내어, 오류 발견률(FDR)이 5% 이하의 값을 가지는 임상학적 변수들만 선정하여 저장되는 단계를 포함할 수 있다.
또한, 상기 약물 특이적 임상학적 효과 벡터는 약물과 관련 있는 임상학적 변수를 발견하여, 상기 약물과 상기 임상학적 변수 간의 방향성을 파악하여 저장할 수 있다.
삭제
삭제
삭제
또한, 제 1저장부에 임상학적 변수들의 상태를 나타내는 질병 특이적 임상학적 특징 벡터가 저장되는 단계; 제 2저장부에 약물 투여시 나타나는 임상학적 변수들의 상태를 나타내는 약물 특이적 임상학적 효과 벡터가 저장되는 단계; 비교부가 상기 질병 특이적 임상학적 특징 벡터와 상기 약물 특이적 임상학적 효과 벡터의 임상학적 변수가 가지는 방향성을 비교하는 단계; 및 판단부가 상기 비교부의 결과에 기초하여 상기 약물이 상기 질병에 대해 약효가 있는지 여부를 판단하는 단계를 포함하고, 상기 판단 단계는 상기 판단부가 상기 질병 특이적 임상학적 특징 벡터와 상기 약물 특이적 임상학적 효과 벡터 사이의 상보성을 활용하여 신약 재창출 지수를 산출하고, 상기 신약 재창출 지수는 하기 수식으로 정의된다.
(여기서, ScoreDisease-Drug : 신약 재창출 지수, α:사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 ASSOCIATION 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
(여기서, ScoreDisease-Drug : 신약 재창출 지수, α:사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 ASSOCIATION 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
또한, 상기 질병 특이적 임상학적 특징 벡터는 t 검증(t-test)을 통하여 특정 질병 상태에서 유의미하게 증가되거나 감소되어 있는 임상학적 변수를 찾아내어, 오류 발견률(FDR)이 5% 이하의 값을 가지는 임상학적 변수들만 선정하여 저장되는 단계를 포함할 수 있다.
또한, 상기 약물 특이적 임상학적 효과 벡터는 약물과 관련 있는 임상학적 변수를 발견하여, 상기 약물과 상기 임상학적 변수 간의 방향성을 파악하여 저장될 수 있다.
삭제
삭제
삭제
삭제
본 발명에서는 전자의무기록을 활용하여 인체의 생리학적 시스템이 가지는 복잡성을 고려한 신약 재창출 방법 및 장치를 제안한다. 이는 약물의 구조적 유사성, 약물과 표적 간의 물리적 상호 작용 그리고 약물과 질병 간의 유전자 발현 패턴 정보를 이용하는 기존의 분자 중심적 접근 방법에서 나타날 수 있는 Translational Problem(분자 수준에서 증명된 약물의 치료 효과가 실제 임상에서 재현되지 않는 문제)를 해결할 수 있다.
또한, 전자의무기록(EHR)은 시간이 지날수록 그 양이 계속해서 증가하므로, 방대하게 축적된 데이터를 바탕으로 미래에는 보다 정확한 신약 재창출 후보 약물을 예측할 수 있다.
본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당해 기술분야에 있어서 통상의 지식을 가진 자에게 명확하게 이해되어질 수 있을 것이다.
도 1은 질병과 약물의 임상학적 변수와의 관계를 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 질병 특이적 임상학적 효과 벡터와 약물 특이적 임상학적 효과 벡터를 생성하여 약물 재창출 스코어를 계산하는 프레임워크를 나타낸 도면이다.
도 3은 본 발명의 일 실시예에 따른 신약 재창출 지수를 계산하는 방법을 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 질병과 약물과의 관계의 유의확률(P-Value)을 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 신약 재창출 지수를 계산하는 장치의 구성도이다.
도 6은 본 발명의 일 실시예에 따른 신약 재창출 지수를 계산하는 과정을 나타낸 순서도이다.
도 2는 본 발명의 일 실시예에 따른 질병 특이적 임상학적 효과 벡터와 약물 특이적 임상학적 효과 벡터를 생성하여 약물 재창출 스코어를 계산하는 프레임워크를 나타낸 도면이다.
도 3은 본 발명의 일 실시예에 따른 신약 재창출 지수를 계산하는 방법을 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 질병과 약물과의 관계의 유의확률(P-Value)을 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 신약 재창출 지수를 계산하는 장치의 구성도이다.
도 6은 본 발명의 일 실시예에 따른 신약 재창출 지수를 계산하는 과정을 나타낸 순서도이다.
이하에서는 첨부한 도면을 참조하여 본 발명에 의한 질병 및 약물 특이적 임상변수의 상보성을 활용한 신약 재창출 기법의 바람직한 실시예들을 자세히 설명한다. 우선 각 도면의 구성 요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면 상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1 내지 도 6을 참조하면, 본 발명에서는 대규모 임상정보를 기반으로 질병의 임상학적 특징(Clinical Disease Signature)과 약물의 임상학적 효과(Clinical Drug Effect) 사이의 상보성(Complementarity)을 활용한 새로운 신약 재창출 프레임워크를 제안하고 있다. 제안하는 방법은 데이터 전처리(Data Preprocessing), 질병 특이적 임상학적 특징 벡터(Clinical Disease Signature Vector) 생성, 약물 특이적 임상학적 효과 벡터(Clinical Drug Effect Vector) 생성, 상기 벡터의 상보성을 활용하여 신약 재창출 지수(ScoreDisease -Drug)를 계산하는 과정으로 구성된다.
도 1 및 도 2에서는 본 발명의 데이터 전처리(Data Preprocessing) 과정의 일부를 나타내고 있으며, 본 발명의 데이터 전처리(Data Preprocessing) 과정은 다음과 같이 수행된다.
우선, 데이터 소스로는 NHANES라는 역학적 데이터 베이스의 표본을 통하여 전자의무기록 시스템에 기반한(EHRs-based) 임상정보를 획득하였다. NHANES는 질병 통제 예방 센터(CDC)의 주요 프로그램이며, 그 목적은 미국에서 성인과 어린이의 건강과 영양 상태를 평가하는 것이다. NHANES는 인구 통계, 식습관, 건강 관련 질문과 실험실 테스트의 결과를 포함한다. 약물 정보는 DrugBank 데이터베이스로부터 검색하였으며, 문헌 정보는 PubMed의 생물 의학 문헌 자료로부터 획득하였다.
NHANES 데이터를 기초로 하여 각각의 샘플을 질병 상태로 계층화하여 분석하였다. 다음으로, 질병 관련 임상 변수의 분석을 수행하기 위해서, 다음과 같은 기준을 통하여 실험실 테스트를 거쳐 임상 변수를 필터링하였다.
첫째, 각 변수는 통계 분석(t-test)의 수치값으로 표현되어야 한다.
둘째, 각 변수는 임상적 의미를 나타내어야 한다.(예: 포도당 또는 트리글리세라이드 등)
셋째, 각 변수는 측정 상의 일관성 있는 단위로 표현되어야 한다.
전술한 기준에 따라 임상 변수를 필터링하여, 총 717개의 임상 변수를 연구에 고려하였다. 또한, 질병 상태의 샘플 크기는 통계적 유의성을 나타내는 중요한 요인이다. 따라서, 통계학적 분석을 수행하기에 충분한 환자의 수를 확보하여 이의 질병 상태에 대해서 고려하였다.
신뢰도 높은 결과를 얻기 위해서 두 가지 전처리 방법론적 단계(로그 변환 및 Z-변환)가 수행된다. 처음에 대부분의 임상 변수 측정은 소규모 범위의 비대칭 분포를 하였기 때문에, 로그 변환은 각 임상 변수에 적용되었다. 이어, 평균치와 표준편차를 조정하기 위해서 각각의 변수를 Z-변환하였다. 이 두 단계는 SAS에서 구현되었다.
이하, 본 발명에서 제안된 프레임워크에서는 상기 과정을 거친 임상 및 문헌 정보가 주요 데이터로 사용되며, 이 두 가지 데이터로부터 질병 특이적 임상학적 특징 벡터(Clinical Disease Signature Vector) 및 약물 특이적 임상학적 효과벡터(Clinical Drug Effect Vector)를 생성한다. 각 벡터는 717개의 임상 변수(Clinical Variable)와 질병에 따른 임상 변수 상태 변화 및 약물이 임상 변수에 미치는 영향을 나타내는 방향성 정보(Relation Directionality)를 포함하고 있다. 이러한 정보들을 바탕으로 질병과 약물 간의 상보성을 측정하게 되고, 동시에 이 약물의 신약 재창출 지수(Repositioning Score)로 표현된다.
도 1 및 도 2는 질병 특이적 임상학적 특징 벡터(Clinical Disease Signature Vector)의 생성 단계에 대해서 나타낸 것이다.
전자의무기록(EHR)에 기록되어 있는 각각의 개인들의 질병 정보를 이용하여, EHR의 샘플들을 질병 상태와 정상 상태로 구분한다. 이 때, 각각의 샘플들은 717개의 임상 변수(Clinical Variable)들로 표현이 된다.
각각의 임상 변수에 대해서 t-test를 통해 특정 질병 상태에서 유의미하게 증가, 혹은 감소되어 있는 변수들을 찾아내고, 이 과정에서 Multiple Statistical Test에 대한 에러를 보정하기 위해 오류 발견률(FDR)을 5% 이하로 하는 임상 변수들만 질병 특이적 임상학적 변수로 선정된다.
유의미하다고 판단된 임상 변수들에 대해서, 정상 그룹, 질병 그룹에서의 그 변수의 평균값을 이용하여 변수의 방향성을 결정한다. 즉, 정상 상태에 비해서 질병 상태에서 높은 값을 가지면 방향성은 UP, 반대의 경우에는 DOWN이다.
최종적으로 각 질병에 대한 벡터(Vector)값은 717개의 임상 변수들과 그 변수들의 방향성(UP 또는 DOWN)으로 구성된다.
또한, 도 1 및 도 2는 약물 특이적 임상학적 효과 벡터(Clinical Drug Effect Vector)의 생성 단계에 대하여 나타내고 있다.
이 벡터는 약물이 717개의 임상학적 변수에 대해서 어떠한 영향을 미치는지에 대한 정보를 제공해 준다. DrugBank로부터 1,578개 FDA 승인을 받은 약물 목록을 얻었고, 문헌 정보는 PubMed abstract를 이용하였다.
이 과정은 크게 두 가지로 구분이 되는데, 첫 번째는 약물과 관련 있는 임상학적 변수를 발견하고, 두 번째는 약물과 임상학적 변수 간의 방향성을 알아내는 것이다.(약물을 투여했을 때, 임상 변수의 값이 증가하면 UP, 반대의 경우에는 DOWN이 된다.)
먼저, 약물과 유의하게 관련 있는 임상학적 변수들은 Co-Occurrence 기반의 Literature Mining 기술을 이용한다. 그리고 약물과 임상학적 변수 간의 통계학적 유의미성은 Fisher's Exact Test를 통해서 얻을 수 있으며, Multiple Statistical Test에 대한 에러를 보정하기 위해 오류 발견률(FDR)을 5% 이하로 하여 임상학적 변수를 선정하였다.
또한, 약물과 변수 간의 방향성 정보를 얻기 위해서는 Supervised Learning 기반의 Literature Mining 기법(Shallow Linguistic Kernel)을 적용한다.
이 때, Co-Occurrence 기반의 Literature Mining에서 유의미하다고 밝혀진 임상학적 변수라 할지라도, Supervised Learning 기반의 Literature Mining에서 그 둘 사이의 관계성이 무조건 정의될 수 없는데, 이러한 경우의 방향성을 ASSOCIATION이라고 정의한다.
최종적으로 각 약물에 대한 벡터(Vector)값은 717개의 임상 변수들과 그 변수들의 방향성(UP, DOWN 또는 ASSOCIATION)으로 구성이 된다.
도 3은 상기 과정을 통하여 얻어진, 질병 특이적 임상학적 특징 벡터(Clinical Disease Signature Vector) 및 약물 특이적 임상학적 효과 벡터(Clinical Drug Effect Vector)에 존재하는 방향성의 상보성을 이용하여 신약 재창출 지수를 계산하는 단계를 나타낸다.
도 3의 수식의 분모는 전체 임상학적 변수의 개수이며, Complementarity는 상보성 점수로서, 질병 특이적 임상학적 특징 벡터(Clinical Disease Signature Vector) 및 약물 특이적 임상학적 효과 벡터(Clinical Drug Effect Vector)의 방향성이 서로 반대 방향을 가지는 임상학적 변수의 수이고, ASSOCIATION은 질병 특이적 임상학적 특징 벡터(Clinical Disease Signature Vector)에서는 UP 또는 DOWN 방향성을 가지고, 약물 특이적 임상학적 효과 벡터(Clinical Drug Effect Vector)에서는 ASSOCIATION 방향성을 가지는 임상학적 변수들의 수이다. 이를 통해 신약 재창출 지수가 계산된다.
본 발명의 실시예로서, 제안된 프레임워크를 통해 5가지 질병에 대해 신약 재창출 가능성이 높은 순서(신약 재창출 지수)로 약물을 정렬하였다. 이 때 신약 재창출 지수가 높을수록 약물의 신약 재창출 가능성은 더욱 유의미해지며, 이는 낮은 유의확률(p-value)을 가지게 된다.
도 4는 이를 CTD(Comparative Toxicogenomics Database) 및 Clinical Trials 데이터 베이스(정답셋)에서 제공하고 있는 질병-약물 관계쌍(Disease-Drug Pair)과 비교한 것을 나타낸 도면이다. 도 4를 참조하면, 2가지 독립적인 정답 데이터베이스에서 입증된 각각의 질병-약물 관계쌍들은 정답 데이터베이스에서 입증되지 않은 질병-약물 관계쌍들에 비해서 낮은 유의확률, 즉 높은 신약 재창출 지수를 가진다는 것을 확인할 수 있다.
구체적으로, 도 4의 그래프의 X축은 Disease-Drug Score(ScoreDisease - Drug ,신약 재창출 지수)의 유의확률(p-value)을 나타낸 것으로, 다음과 같이 계산한다. 조합 가능한 모든 질병-약물 관계쌍의 신약 재창출 지수를 계산한 후 이를 백그라운드 분포(Background Distribution)로 둔다. 특정 질병-약물 관계쌍의 신약 재창출 지수가 이 분포 상에서 어디에 위치하는지를 고려하여 해당 지수의 유의확률(p-value)를 계산하게 된다. 유의확률(p-value)을 계산하고자 하는 질병-약물 관계쌍의 신약 재창출 지수가 백그라운드 분포상의 평균 수치보다 높은 수치를 가지게 된다면, 이러한 수치가 나올 확률은 낮아지게 된다. 이 확률이 유의확률(p-value)이기 때문에 신약 재창출 지수의 수치가 높을수록 유의확률은 낮아진다.
도 4의 그래프의 Y축은 Density(밀도)를 나타낸다. 해당 유의확률(p-value)를 가지는 질병-약물 쌍의 숫자를 세어, 전체 개수에 대하여 어느 정도 비율을 차지하는지를 나타낸다. 이 때, 질병-약물 쌍의 개수가 많으면 Density(밀도)는 올라간다.
도 4를 참조하면, 그래프의 푸른색은 CTD 및 Clinical Trials 데이터베이스(정답셋)에서 실제 질병-약물 관계가 존재하는 쌍의 Density Plot 이며, 붉은색은 실제 질병-약물 관계가 존재하지 않는 쌍의 Density Plot이다. 제안하는 방법이 신뢰도가 높기 위해서는 CTD 및 Clinical Trials 데이터베이스에서 제공하고 있는 질병-약물 관계쌍들이 신약 재창출 지수가 높은 수치(낮은 유의확률(p-value))를 가져야 한다.
그래프에서 보면, CTD 및 Clinical Trials 데이터베이스에서 제공하고 있는 질병-약물 관계쌍(푸른색 Density Plot)들은 낮은 p-value(신약 재창출 지수가 높은 수치)에 치우쳐서 분포하고, 그렇지 않은 질병-약물 관계쌍(붉은 색 Density Plot)은 높은 p-value(신약 재창출 지수가 낮은 수치)에 치우쳐 분포하고 있다는 것을 확인할 수 있다.
따라서, 제안하는 방법론이 실제 정답인 질병-약물 관계쌍에 대해서 높은 지수를 부여하고 있고, 이 방법을 통해서 높은 지수(낮은 p-value)를 부여받은 질병-약물 관계쌍들은 새로운 신약 재창출 후보가 될 수 있게 된다. 도 5는 질병 상태에서 임상학적 변수들의 상태를 나타내는 질병 특이적 임상학적 특징 벡터(10)를 생성하여 저장하는 제 1저장부(100), 약물 투여시 나타나는 임상학적 변수들의 상태를 나타내는 약물 특이적 임상학적 효과 벡터(20)를 생성하여 저장하는 제 2저장부(200), 질병 특이적 임상학적 특징 벡터(10)와 약물 특이적 임상학적 효과 벡터(20)의 임상학적 변수가 가지는 방향성을 비교하는 비교부(300) 및 비교부(300)의 결과에 기초하여 상기 약물이 상기 질병에 대해 약효가 있는지 여부를 판단하는 판단부(400)를 포함하는 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법에 대한 장치를 나타낸 구성도이다.
또한, 질병 특이적 임상학적 특징 벡터(10)는 t 검증(t-test)을 통하여 특정 질병 상태에서 유의미하게 증가되거나 감소되어 있는 임상학적 변수를 찾아내어, 오류 발견률(FDR)이 5% 이하의 값을 가지는 임상학적 변수들만 선정하여 저장되는 단계를 포함한다.
또한, 약물 특이적 임상학적 효과 벡터(20)는 약물과 관련 있는 임상학적 변수를 발견하여, 약물과 임상학적 변수 간의 방향성을 파악하여 저장된다.
또한, 약물과 관련있는 임상학적 변수는 Co-Occurrence 기반의 Literature Mining 기술을 이용하고, 약물과 임상학적 변수 간의 통계학적 유의미성을 획득하기 위하여 Fisher's Exact Test에 의한 오류 발견률(FDR)이 5% 이하에서 산출된다.
또한, 약물과 상기 임상학적 변수 간의 방향성 정보는 Supervised Learning 기반의 Literature Mining 기법(Shallow Linguistic Kernel)을 적용하여 획득한다.
또한, 판단부(400)는 상기 질병 특이적 임상학적 특징 벡터(10)와 상기 약물 특이적 임상학적 효과 벡터(20) 사이의 상보성을 활용하여 신약 재창출 지수를 산출하고, 상기 신약 재창출 지수는 하기 수식으로 정의된다.
(여기서, ScoreDisease -Drug : 신약 재창출 지수, α: 사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 무관한 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
도 6은 제 1저장부(100)에 임상학적 변수들의 상태를 나타내는 질병 특이적 임상학적 특징 벡터(10)가 저장되는 단계(S100), 제 2저장부(200)에 약물 투여시 나타나는 임상학적 변수들의 상태를 나타내는 약물 특이적 임상학적 효과 벡터가 저장되는 단계(S200), 비교부(300)가 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터의 임상학적 변수가 가지는 방향성을 비교하는 단계(S300), 비교부(300)의 결과에 기초하여 약물이 질병에 대해 약효가 있는지 여부를 판단하는 단계(S400)를 포함하는 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법을 나타내는 순서도이다.
또한, 질병 특이적 임상학적 특징 벡터(10)는 t 검증(t-test)을 통하여 특정 질병 상태에서 유의미하게 증가되거나 감소되어 있는 임상학적 변수를 찾아내어, 오류 발견률(FDR)이 5% 이하의 값을 가지는 임상학적 변수들만 선정하여 저장되는 단계를 포함한다.
또한, 약물 특이적 임상학적 효과 벡터(20)는 약물과 관련 있는 임상학적 변수를 발견하여,약물과 임상학적 변수 간의 방향성을 파악하여 저장된다.
또한, 약물과 관련있는 임상학적 변수는 Co-Occurrence 기반의 Literature Mining 기술을 이용하고, 약물과 임상학적 변수 간의 통계학적 유의미성을 획득하기 위하여 Fisher's Exact Test에 의한 오류 발견률(FDR)이 5% 이하에서 산출된다.
또한, 약물과 임상학적 변수 간의 방향성 정보는 Supervised Learning 기반의 Literature Mining 기법(Shallow Linguistic Kernel)을 적용하여 획득한다.
또한, 판단 단계는 질병 특이적 임상학적 특징 벡터(10)와 약물 특이적 임상학적 효과 벡터(20) 사이의 상보성을 활용하여 신약 재창출 지수는 하기 수식으로 정의된다.
(여기서, ScoreDisease -Drug : 신약 재창출 지수,α: 사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 ASSOCIATION 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래 청구범위에 의해 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
10 : 질병 특이적 임상학적 특징 벡터
20 : 약물 특이적 임상학적 효과 벡터
100 : 제 1 저장부 200: 제 2 저장부
300 : 비교부 400: 판단부
20 : 약물 특이적 임상학적 효과 벡터
100 : 제 1 저장부 200: 제 2 저장부
300 : 비교부 400: 판단부
Claims (8)
- 질병 상태에서 임상학적 변수들의 상태를 나타내는 질병 특이적 임상학적 특징 벡터(10)를 생성하여 저장하는 제 1저장부(100);
약물 투여시 나타나는 임상학적 변수들의 상태를 나타내는 약물 특이적 임상학적 효과 벡터(20)를 생성하여 저장하는 제 2저장부(200);
상기 질병 특이적 임상학적 특징 벡터(10)와 상기 약물 특이적 임상학적 효과 벡터(20)의 임상학적 변수가 가지는 방향성을 비교하는 비교부(300); 및
상기 비교부(300)의 결과에 기초하여 상기 약물이 상기 질병에 대해 약효가 있는지 여부를 판단하는 판단부(400)를 포함하고,
상기 판단부(400)는
상기 질병 특이적 임상학적 특징 벡터(10)와 상기 약물 특이적 임상학적 효과 벡터(20) 사이의 상보성을 활용하여 신약 재창출 지수를 산출하고, 상기 신약 재창출 지수는 하기 수식으로 정의되는 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법에 대한 장치.
(여기서, ScoreDisease-Drug : 신약 재창출 지수,α:사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 ASSOCIATION 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
- 제 1항에 있어서,
상기 질병 특이적 임상학적 특징 벡터(10)는 t 검증(t-test)을 통하여 특정 질병 상태에서 유의미하게 증가되거나 감소되어 있는 임상학적 변수를 찾아내어, 오류 발견률(FDR)이 5% 이하의 값을 가지는 임상학적 변수들만 선정하여 저장되는 단계를 포함하는 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법에 대한 장치.
- 제 1항에 있어서,
상기 약물 특이적 임상학적 효과 벡터(20)는 약물과 관련 있는 임상학적 변수를 발견하여, 상기 약물과 상기 임상학적 변수 간의 방향성을 파악하여 저장되는 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법에 대한 장치.
- 삭제
- 제 1저장부(100)에 임상학적 변수들의 상태를 나타내는 질병 특이적 임상학적 특징 벡터(10)가 저장되는 단계(S100);
제 2저장부(200)에 약물 투여시 나타나는 임상학적 변수들의 상태를 나타내는 약물 특이적 임상학적 효과 벡터가 저장되는 단계(S200);
비교부(300)가 상기 질병 특이적 임상학적 특징 벡터와 상기 약물 특이적 임상학적 효과 벡터의 임상학적 변수가 가지는 방향성을 비교하는 단계(S300); 및
판단부(400)가 상기 비교부(300)의 결과에 기초하여 상기 약물이 상기 질병에 대해 약효가 있는지 여부를 판단하는 단계(S400)를 포함하고,
상기 판단 단계(S400)는
상기 판단부(400)가 상기 질병 특이적 임상학적 특징 벡터(10)와 상기 약물 특이적 임상학적 효과 벡터(20) 사이의 상보성을 활용하여 신약 재창출 지수를 산출하고, 상기 신약 재창출 지수는 하기 수식으로 정의되는 질병 및 약물 특이적 임상변수의 상보성을 활용한 신약 재창출 기법.
(여기서, ScoreDisease-Drug : 신약 재창출 지수, α:사용자에 의해 설정된 상보성 점수에 대한 가중 인자, C: 질병과 약 사이의 상보성을 가지는 임상학적 변수의 숫자, A: 질병 특이적 임상학적 특징 벡터에서는 UP 또는 DOWN에 해당하고, 약물 특이적 임상학적 효과 벡터에서는 ASSOCIATION 방향성 정보를 갖는 임상학적 변수의 숫자, CV: 임상학적 벡터, C(CVDisease, CVDrug): 질병 특이적 임상학적 특징 벡터와 약물 특이적 임상학적 효과 벡터 사이의 상보성 점수, A(CVDisease, CVDrug): 질병 특이적 임상학적 효과 벡터 사이의 ASSOCIATION 점수이다.)
- 제 5항에 있어서,
상기 질병 특이적 임상학적 특징 벡터(10)는 t 검증(t-test)를 통하여 특정 질병 상태에서 유의미하게 증가되거나 감소되어 있는 임상학적 변수를 찾아내어, 오류 발견률(FDR)이 5% 이하의 값을 가지는 임상학적 변수들만 선정하여 저장되는 단계를 포함하는 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법.
- 제 5항에 있어서,
상기 약물 특이적 임상학적 효과 벡터(20)는 약물과 관련있는 임상학적 변수를 발견하여, 상기 약물과 상기 임상학적 변수 간의 방향성을 파악하여 저장되는 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법.
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150086898A KR101783689B1 (ko) | 2015-06-18 | 2015-06-18 | 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150086898A KR101783689B1 (ko) | 2015-06-18 | 2015-06-18 | 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160149620A KR20160149620A (ko) | 2016-12-28 |
KR101783689B1 true KR101783689B1 (ko) | 2017-10-10 |
Family
ID=57724379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150086898A KR101783689B1 (ko) | 2015-06-18 | 2015-06-18 | 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101783689B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021091348A1 (ko) * | 2019-11-07 | 2021-05-14 | 울산대학교 산학협력단 | 신약 재창출 후보 선정 방법 및 장치 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102035162B1 (ko) * | 2019-03-12 | 2019-11-08 | 한국과학기술원 | 질병 표적 대사 효소에 특이적인 인체 대사 물질을 이용하여 질병에 대한 약물 후보를 예측하는 방법 |
JP2021144615A (ja) * | 2020-03-13 | 2021-09-24 | 富士通株式会社 | 情報処理方法、情報処理プログラム及び情報処理装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100692319B1 (ko) | 2006-02-20 | 2007-03-12 | 한국생명공학연구원 | 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120016554A (ko) | 2010-08-16 | 2012-02-24 | 아주대학교산학협력단 | 전자 의무 기록 및 심전도 데이터를 이용한 약물 또는 시술 부작용 감지 방법 |
-
2015
- 2015-06-18 KR KR1020150086898A patent/KR101783689B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100692319B1 (ko) | 2006-02-20 | 2007-03-12 | 한국생명공학연구원 | 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021091348A1 (ko) * | 2019-11-07 | 2021-05-14 | 울산대학교 산학협력단 | 신약 재창출 후보 선정 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20160149620A (ko) | 2016-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108109700B (zh) | 一种慢性病药物疗效评价方法和装置 | |
KR101450784B1 (ko) | 전자의무기록과 약물/질환 네트워크 정보 기반의 신약 재창출 후보 예측 방법 | |
US20070026365A1 (en) | Defining virtual patient populations | |
US20090150134A1 (en) | Simulating Patient-Specific Outcomes | |
CA2702408A1 (en) | Self-improving method of using online communities to predict health-related outcomes | |
Hajirasouliha et al. | Precision medicine and artificial intelligence: overview and relevance to reproductive medicine | |
KR101783689B1 (ko) | 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치 | |
JP2022524083A (ja) | 薬物に依存しない患者固有の投薬レジメンのためのシステムおよび方法 | |
US20230330668A1 (en) | Neurodegenerative target discovery platform | |
Hasanzad et al. | Artificial intelligence perspective in the future of endocrine diseases | |
CN114999674B (zh) | Qsp-pbpk-td模型构建方法及药源性心功能损伤预测方法 | |
CN116543867A (zh) | 基于预测模型指导t2dm患者mtm模式的方法及装置 | |
CN113257436A (zh) | 一种帕金森病治疗的药物治疗管理方法和系统 | |
Han et al. | Risk prediction of diabetes and pre-diabetes based on physical examination data | |
CN112071439B (zh) | 药物副作用关系预测方法、系统、计算机设备和存储介质 | |
Saab et al. | Comparison of machine learning algorithms for classifying adverse-event related 30-day hospital readmissions: potential implications for patient safety | |
Wosiak et al. | On integrating clustering and statistical analysis for supporting cardiovascular disease diagnosis | |
US10083274B2 (en) | Non-hypergeometric overlap probability | |
Bangs | Predictive Biosimulation and Virtual Patients in Pharmaceutical RD | |
EP3203911A1 (en) | Personalized antibiotic dosing platform | |
WO2015169810A1 (en) | Method for prediction of a placebo response in an individual | |
Niehaus et al. | Phenotypic characterisation of Crohn's disease severity | |
WO2020142035A1 (en) | Disease diagnosis system | |
WO2017205733A1 (en) | Decision support system for cns drug development | |
CN114386530B (zh) | 基于深度学习的溃疡性结肠炎免疫分型的分类方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |