KR100924328B1 - 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측시스템 및 방법과 그 프로그램을 저장한 기록매체 - Google Patents

수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측시스템 및 방법과 그 프로그램을 저장한 기록매체 Download PDF

Info

Publication number
KR100924328B1
KR100924328B1 KR1020060108504A KR20060108504A KR100924328B1 KR 100924328 B1 KR100924328 B1 KR 100924328B1 KR 1020060108504 A KR1020060108504 A KR 1020060108504A KR 20060108504 A KR20060108504 A KR 20060108504A KR 100924328 B1 KR100924328 B1 KR 100924328B1
Authority
KR
South Korea
Prior art keywords
mathematical model
peptide sequence
peptide
small intestine
predicting
Prior art date
Application number
KR1020060108504A
Other languages
English (en)
Other versions
KR20080040481A (ko
Inventor
김준형
정은경
김민경
이호경
정동현
최승훈
신재민
강상기
김민국
최윤재
Original Assignee
주식회사 인실리코텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 인실리코텍 filed Critical 주식회사 인실리코텍
Priority to KR1020060108504A priority Critical patent/KR100924328B1/ko
Priority to US12/513,279 priority patent/US20100121791A1/en
Priority to PCT/KR2007/002568 priority patent/WO2008054052A1/en
Publication of KR20080040481A publication Critical patent/KR20080040481A/ko
Application granted granted Critical
Publication of KR100924328B1 publication Critical patent/KR100924328B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof

Abstract

본 발명은 수학적 모델을 이용하여 펩타이드 서열의 약동학적 성질을 예측하는 시스템 및 방법과 그 프로그램을 저장한 기록매체에 관한 것이다.
본 발명은 실험기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 단계와; 이들 서열을 근거로 소장을 통과하지 않는 펩타이드의 서열의 표본을 획득하는 단계와; 상기 획득한 표본 각각을 집합으로 저장한 후 이들을 일정한 비율이 되도록 임의로 추출하여 수학적 모델 훈련용 집합과 수학적 모델 검증용 집합으로 분류하는 단계와; 개별 펩타이드 서열에 표현자값과 활성값을 부여하는 단계와; 훈련용 펩타이드 집합과 수학적 모델을 이용하여 훈련하는 단계와; 훈련된 수학적 모델을 이용하여 검증용 펩타이드 집합에 대해 소장통과 여부를 예측하는 단계와; 훈련된 수학적 모델을 검증하는 단계로 이루어져 펩타이드 약물의 경구 투여에 의한 약물 전달시 필요한 특성중의 하나인 펩타이드 서열의 소장 통과 여부를 항상 실험으로 확인하지 않고 프로그램을 저장한 기록매체를 이용하여 미리 예측함으로써 실험으로 소요되는 비용과 시간을 절감할 수 있는 각별한 장점이 있는 유용한 발명이다.
수학적 모델, 펩타이드 서열, 표현자, 활성값, 약동학적 성질

Description

수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템 및 방법과 그 프로그램을 저장한 기록매체{System, method and program for pharmacokinetic parameter prediction of peptide sequence by mathematical model}
도 1은 본 발명에 따른 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템의 일실시예를 도시한 블록 구성도,
도 2는 본 발명 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법의 일실시예를 도시한 순서도,
도 3은 본 발명 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법의 일실시예를 도시한 순서도,
도 4는 본 발명에서 약동학적 성질 예측 모델을 재훈련하는 방법의 순서도이다.
〈도면의 주요부분에 대한 부호의 설명〉
10 : 마이크로 컴퓨터 11 : 프로그램 기록매체
12 : CPU 13 : 입출력부
20 : 입력수단 30 : 출력수단
본 발명은 수학적 모델을 이용하여 펩타이드 서열의 소장 통과 여부를 예측하는 시스템 및 방법과 그 프로그램을 저장한 기록매체에 관한 것이다.
일반적으로 신약 또는 신물질을 개발함에 있어서, 구조와 활성간의 상관관계에 대한 정략적 모델을 만드는 것은 실험에 대한 비용을 줄이면서 활성을 미리 예측하는데 있어 매우 유용한 방법 중의 하나이다.
그러나 종래의 기술로는 이러한 방법을 이용하여 작은 유기 물질 화합물에 대해서 소장 통과 여부, 용해도, 독성과 같은 신약 개발에 있어 반드시 필요한 여러 가지 특성을 예측하는 프로그램이 있기는 하지만 현재까지 펩타이드 서열에 대해서는 이러한 특성을 미리 예측해 볼 수 있는 프로그램이 없었다.
최근 신약을 개발함에 있어서, 펩타이드는 효능이 강력하고 독성 및 부작용이 거의 없으며 인체에 잔류하지 않는 것과 같은 장점으로 인해 새로운 신약을 개발하는데 있어 각광받는 연구물질중의 하나로서 시장의 비율이 점점 성장하고 있다. 하지만 대부분의 펩타이드 약물은 경구로 투여할 경우 체내 흡수율이 낮아지는 단점이 있다. 이와 같은 이유로 인해 경구 투여 약물 전달 물질이나 신약을 개발하는데에는 반드시 필요한 활성중의 하나인 펩타이드 서열의 소장 통과 여부에 대해서 예측할 수 있는 기술의 개발이 절실히 요구되고 있는 실정이다.
본 발명은 상기한 실정을 감안하여 발명한 것으로서, 수학적 모델을 이용하여 펩타이드 서열의 소장 통과 여부를 예측하는 시스템 및 방법과 그 프로그램을 저장한 기록매체를 제공하여 펩타이드 서열의 소장 통과 여부를 예측하고 검증하는 모델을 제시하는데 그 목적이 있다.
상기한 목적을 달성하기 위한 본 발명 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템은 프로그램 기록매체(11)와 CPU(12) 및 입출력부(13)로 이루어진 마이크로컴퓨터(10)와; 입력수단(20) 및; 출력수단(30)으로 이루어진 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템에 있어서, 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템은 상기 마이크로컴퓨터(10)의 제어하에 상기 프로그램기록매체(11)가 동작을 수행하되, 상기 프로그램기록매체(11)는 실험 기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 프로세스와; 이들 서열을 근거로 소장을 통과하지 않는 펩타이드의 서열의 표본을 획득하는 프로세스와; 상기 획득한 표본 각각을 집합으로 저장한 후 이들을 일정한 비율이 되도록 임의로 추출하여 수학적 모델 훈련용 집합과 수학적 모델 검증용 집합으로 분류하는 프로세스와; 개별 펩타이드 서열에 표현자값과 활성값을 부여하는 프로세스와; 훈련용 펩타이드 집합과 수학적 모델을 이용하여 훈련하는 프로세스와; 훈련된 수학적 모델을 이용하여 검증용 펩타이드 집합에 대해 소장통과 여부를 예측하는 프로세스와; 훈련된 수학적 모델을 검증하는 프로세스를 포함하는 것을 특징으로 한다.
상기 프로그램 기록매체(11)는 사용자가 소장 통과 여부를 알고자 하는 펩타이드 서열을 입력하면 이를 아미노산 표현자로 변환하는 프로그램과, 훈련된 수학적 모델을 사용하여 소장 통과 여부를 예측하는 프로그램을 포함하고, 사용자가 실험기법으로 소장 통과 여부 활성값을 획득한 새로운 소장 통과 펩타이드 서열을 추가하면, 이를 원래의 소장 통과 펩타이드 집합에 추가한 다음 분류하는 프로그램과, 추가된 펩타이드에 표현자값과 활성값을 부여하는 프로그램과, 훈련용 펩타이드 집합을 이용하여 수학적 모델로 훈련하는 프로그램과, 검증용 펩타이드 집합에 대해 소장통과 여부를 예측할 수 있도록 하는 프로그램과, 훈련된 수학적 모델에 대해 검증하는 프로그램을 포함하는 것을 특징으로 한다.
또한 상기한 목적을 달성하기 위한 프로그램 기록매체(11)와 CPU(12) 및 입출력부(13)로 이루어진 마이크로컴퓨터(10)와; 입력수단(20) 및; 출력수단(30)으로 이루어진 펩타이드 서열의 약동학적 성질 예측 시스템을 통한 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법에 있어서, 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질을 예측하는 방법은 상기 마이크로컴퓨터(10)의 제어하에 상기 프로그램기록매체(11)의 동작을 통해 실험 기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 단계와; 실험기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 단계와; 이들 서열을 근거로 소장을 통과하지 않는 펩타이드의 서열의 표본을 획득하는 단계와; 상기 획득한 표본 각각을 집합으로 저장한 후 이들을 일정한 비율이 되도록 임의로 추출하여 수학적 모델 훈련용 집합과 수학적 모델 검증용 집합으로 분류하는 단계와; 개별 펩타이드 서열에 표현자값과 활성값을 부여하는 단계와; 훈련용 펩타이드 집합과 수학적 모델을 이용하여 훈련하는 단계와; 훈련된 수학적 모델을 이용하여 검증용 펩타이드 집합에 대해 소장통과 여부를 예측하는 단계와; 훈련된 수학적 모델을 검증하는 단계로 이루어지는 것을 특징으로 한다.
상기 수학적 모델은 회귀분석법, 기계학습법, 유전자 알고리즘을 이용한 다중 회귀분석법, 유전자 알고리즘을 이용한 편최소제곱법, 주성분 분석을 활용한 편최소제곱법, 주성분 분석을 활용한 다중 회귀분석법을 포함하는 정량적 구조-특성 상관관계 방법인 것을 특징으로 하는 수학적 모델 방법이며, 상기 기계학습법은 신경망, 데이터마이닝, 의사결정트리, 귀납논리, 사례기반 추론, 패턴 인식, 강화 학습, 베이지안 망, 은닉마코프 모델, 확률 문법 방법이고, 특히 신경망 기법인 것을 특징으로 한다.
상기 펩타이드 서열의 약동학적 성질은 소장 내 흡수이고, 상기 표현자값은 분자구조, 아미노산, 펩타이드를 정량적으로 나타낸 것으로, 바이너리 아미노산 표현자, VHSE 아미노산 표현자, Z3 아미노산 표현자, Z5 아미노산 표현자 중 적어도 어느 하나를 포함하는 것을 특징으로 한다.
상기 기계학습 모델을 구축하기 위해 수집되는 데이터는 in vivo(생체내), ex vivo(생체외), in vitro(시험관내) 실험 중 적어도 어느 하나로부터 얻은 데이터이고, 특히 파지 디스플레이 실험 기법을 이용한 in vivo(생체내), ex vivo(생체외), in vitro(시험관내) 실험 중 적어도 어느 하나로부터 얻은 데이터인 것을 특징으로 한다. 상기 펩타이드 서열은 2 ~ 12개의 펩타이드, 더 바람직하게는 3 ~ 7개의 펩타이드로 이루어진 서열이며, 본 발명 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법을 적용하는 종은 포유류이며, 특히 사람을 대상으로 한다.
또한 본 발명 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 프로그램을 저장한 기록매체는 실험 기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 프로세스와; 이들 서열을 근거로 소장을 통과하지 않는 펩타이드의 서열의 표본을 획득하는 프로세스와; 상기 획득한 표본 각각을 집합으로 저장한 후 이들을 일정한 비율이 되도록 임의로 추출하여 수학적 모델 훈련용 집합과 수학적 모델 검증용 집합으로 분류하는 프로세스와; 개별 펩타이드 서열에 표현자값과 활성값을 부여하는 프로세스와; 훈련용 펩타이드 집합과 수학적 모델을 이용하여 훈련하는 프로세스와; 훈련된 수학적 모델을 이용하여 검증용 펩타이드 집합에 대해 소장통과 여부를 예측하는 프로세서와; 훈련된 수학적 모델을 검증하는 프로세서를 포함하는 것을 특징으로 한다.
상기 본 발명의 목적과 특징 및 장점은 첨부 도면 및 다음의 상세한 설명을 참조함으로써 더욱 쉽게 이해될 수 있을 것이다.
이하, 첨부도면을 참조하여 본 발명 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템 및 방법과 그 프로그램을 저장한 기록매체를 바람직한 실시예로서 상세하게 설명한다.
도 1은 본 발명에 따른 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템의 일실시예를 도시한 블록 구성도, 도 2는 본 발명 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법의 일실시예를 도시한 순서도로서, 도 2에 도시한 바와 같이 먼저 파지디스플레이 실험 기법으로 소장을 통과 하는 펩타이드 서열의 표본(수)을 수집한다(S1단계). 여기서 펩타이드 서열의 길이는 하나의 펩타이드에 있는 아미노산의 수를 의미하며, 펩타이드 서열 길이 3은 아미노산이 3개로 이루어진 펩타이드를 나타낸다. 수집한 펩타이드 서열의 수는 하기 표 1과 같다. 표 1에서 아미노산 3개로 이루어진 펩타이드 서열의 경우 파지디스플레이 실험 기법으로 얻은 소장을 통과 하는 펩타이드 서열의 수는 4252개이다.
또한 상기 S1단계에서 사용된 파지디스플레이 펩타이드 라이브러리는 'ph.D.-C7CTM(New England BioLab.)'으로, 이는 M13 박테리오파지(bacteriophage)의 게놈(genome) 중에서 코트 단백질(coat protein)의 일정인 pⅢ를 생산하는 유전자 말단에 7개의 무작위 아미노산 서열(random amino acid sequence)의 펩타이드(peptide)가 발현되도록 인위적으로 유전자 서열을 삽입한 후, 대장균(E. coli)에 감염시켜 얻은 수억 종 이상의 서로 다른 펩타이드를 발현한 재조합 박테리오파지로 구성되어 있다. 한편, M13 파지에 도입되어 있는 7개의 무작위 아미노산 서열은 양쪽에 cysteine 잔기를 보유하도록 설계되어 펩타이드 발현시 자연적으로 이황화 결합(disulfide bond)을 형성함으로써 고리모양(loop shape)을 이루도록 하여 목적 단백질과 더욱 강한 결합을 유도할 수 있도록 되어 있다. 경구 파지디스플레이 기법은 1.2 X 1012 pfu의 파지 펩타이드 라이브러리(~1,000 copies of individual recombinant phage clone)를 절식(overnight)시킨 쥐에 경구 주입한 후, 1시간 뒤에 대표적인 내부 장기 조직(간, 폐, 콩팥, 지라)을 적출하여 소장 점막층을 통과한 뒤 혈류를 따라 각 장기에 분포한 파지를 회수하여 정량하는 순서로 이루어져 있다.
[표 1] 펩타이드 서열의 수
펩타이드 서열의 길이 펩타이드 서열의 수(개)
소장 통과 소장 비통과 훈련용 검증용
3 4252 4252 6786 1718
4 3402 3402 5428 1376
5 2552 2552 4078 1026
6 1702 1702 2748 656
7 852 852 1400 304
이와 더불어 임의의 아미노산을 선택하게 하는 프로그램을 이용하여 소장 통과 펩타이드 서열의 길이 3에 대한 3개의 아미노산을 뽑아낸 후 실험에서 획득한 소장 통과 펩타이드 집합과 비교하여 동일한 서열의 펩타이드가 없는 경우 소장 비통과 펩타이드 서열의 집합으로 분류한다(S2단계). 여기서 임의의 아미노산을 선택하게 하는 프로그램은 공지의 프로그램을 이용한다.
다음으로 기계학습 훈련을 위하여 펩타이드 서열의 집합을 분류한다(S3단계). 이 단계(S3단계)에는 소장을 통과하는 펩타이드 서열 집합의 수가 소장을 통과하지 않는 펩타이드 서열 집합의 수보다 양이 적기 때문에 두 집합간의 개체수를 동일하게 만드는 과정을 포함한다. 이 단계(S3단계)에서 펩타이드 서열 길이 3의 경우 소장 비통과 펩타이드를 표 1에서와 같이 4252개 획득하였다.
이어 상기 소장 통과 펩타이드 집합에서 임의의 펩타이드 서열을 대략 80% 추출하고, 소장 비통과 펩타이드 집합에서 임의의 펩타이드 서열을 대략 80% 추출한 다음 이 둘을 모아서 기계학습 훈련용 펩타이드 집합으로 분류한다(S4단계).
상기 S4단계와 마찬가지로 소장 통과 펩타이드 집합에서 대략 나머지 20%와 소장 비통과 펩타이드 집합에서의 나머지 20%를 모두 모아서 기계학습 검증용 펩타이드 집합으로 분류한다(S5단계).
그 결과 표 1에서와 같이 펩타이드 서열의 길이 3의 경우 기계학습용 펩타이드의 수는 6786개, 기계학습 검증용 펩타이드의 수는 1718개 이다.
다음에는 기계학습법을 이용하여 상기 S4단계에서 획득한 기계학습 훈련용 집합으로 소장 통과 예측 모델을 훈련하고 획득하는 단계(S10단계)를 진행한다. 즉, 소장 통과 펩타이드 집합이 입력되는 순서를 임의로 변경하는 단계로서, 소장 통과 펩타이드 서열과 소장 비통과 펩타이드 서열이 동등한 비율로 번갈아 가면서 기계학습 훈련 과정에 입력값으로 들어갈 수 있도록 기계학습 훈련용 집합의 순서를 조정하여 기계학습 모델 훈련을 위한 입력값으로 입력한다(S11단계).
그 후에는 기계학습 훈련용 집합에 포함된 펩타이드 개별 서열을 아미노산 표현자값으로 변환한다(S12단계). 여기서 아미노산 표현자값은 바이너리 아미노산 표현자, VHSE 아미노산 표현자, Z3 아미노산 표현자, Z5 아미노산 표현자 중 적어도 어느 하나를 포함하여 사용하며, 아미노산에 대한 바이너리 아미노산 표현자는 하나의 아미노산에 대해서 19개의 "0"과 하나의 "1"로 구성된 20자리의 수로 표현하고, 20개의 아미노산 각각에 대해서는 "1"의 값이 위치하는 순서가 서로 다르도 록 설정한다. 펩타이드 서열 길이 3의 경우 60개의 표현자로 구성되며, 소장 통과 활성값의 경우 소장 통과 펩타이드는 0.9로, 소장 비통과 펩타이드는 0.1로 한다.
이와 같이 기계학습 훈련용 집합에 포함된 펩타이드 개별 서열을 표현자값으로의 변환은 VHSE(principal components score Vectors of Hydrophobic, Steric and Electronic properties) 아미노산 표현자를 사용하여서도 변환할 수 있으며, 이에 대해 정의된 값은 아래 표 3과 같다. VHSE(principal components score Vectors of Hydrophobic, Steric and Electronic properties) 아미노산 표현자는 하나의 아미노산에 대해서 8개의 표현자로 이루어져 있으며, 이들은 아미노산의 소수성(hydrophobicity), 전자기적(electronic), 입체적(steric) 특성을 나타내는 것으로 알려져 있으며, 펩타이드 서열 길이 3의 경우 24개의 입력값으로 구성된다.
[표 2] VHSE 아미노산 표현자
Amino Acids VHSE 1 VHSE 2 VHSE 3 VHSE 4 VHSE 5 VHSE 6 VHSE 7 VHSE 8
Ala A 0.15 -1.11 -1.35 -0.92 0.02 -0.91 0.36 -0.48
Arg R -1.47 1.45 1.24 1.27 1.55 1.47 1.30 0.83
Asn N -0.99 0.00 -0.37 0.69 -0.55 0.85 0.73 -0.80
Asp D -1.15 0.67 -0.41 -0.01 -2.68 1.31 0.03 0.56
Cys C 0.18 -1.67 -0.46 -0.21 0.00 1.20 -1.61 -0.19
Gln Q -0.96 0.12 0.18 0.16 0.09 0.42 -0.20 -0.41
Glu E -1.18 0.40 0.10 0.36 -2.16 -0.17 0.91 0.02
Gly G -0.20 -1.53 -2.63 2.28 -0.53 -1.18 2.01 -1.34
His H -0.43 -0.25 0.37 0.19 0.51 1.28 0.93 0.65
Ile I 1.27 -0.14 0.30 -1.80 0.30 -1.61 -0.16 -0.13
Leu L 1.36 0.07 0.26 -0.80 0.22 -1.37 0.08 -0.62
Lys K -1.17 0.70 0.70 0.80 1.64 0.67 1.63 0.13
Met M 1.01 -0.53 0.43 0.00 0.23 0.10 -0.86 -0.68
Phe F 1.52 0.61 0.96 -0.16 0.25 0.28 -1.33 -0.20
Pro P 0.22 -0.17 -0.50 0.05 -0.01 -1.34 -0.19 3.56
Ser S -0.67 -0.86 -1.07 -0.41 -0.32 0.27 -0.64 0.11
Thr T -0.34 -0.51 -0.55 -1.06 -0.06 -0.01 -0.79 0.39
Trp W 1.50 2.06 1.79 0.75 0.75 -0.13 -1.01 -0.85
Tyr Y 0.61 1.61 1.17 0.73 0.53 0.25 -0.96 -0.52
Val V 0.76 -0.92 -0.17 -1.91 0.22 -1.40 -0.24 -0.03
계속하여 기계학습 훈련용 펩타이드 집합에 대한 소장 통과 여부의 실험값과 펩타이드 서열에 대한 표현자값을 입력값으로 사용하여 기계학습 훈련을 실시한다(S13단계). 여기서 기계학습을 위한 방법으로는 신경망(Neural Network), 데이터 마이닝(Data Mining), 의사결정 트리(Decision Tree), 사례기반 추론(Case Based Reasoning), 패턴 인식(Pattern Recognition), 강화 학습(Reinforcement Learning)을 사용하며, 예컨대 피드 포워드 신경망을 사용할 경우는 기계학습 훈련용 펩타이드 집합을 사용하여 피드 포워드 신경망 학습 훈련을 실시하는데 기계학습법을 위한 피드 포워드 신경망의 구조는 입력층, 은닉층, 출력층으로 구성되고, 입력층은 입력노드로 구성되어 있으며, 입력 노드의 수는 펩타이드 서열 길이의 수에 표현자값이 갖는 성분의 수를 곱하여 결정되며, 하나의 입력 노드는 하나의 표현자값 성분인 실수 또는 정수이다. 은닉층은 하나로서 0 ~ 2 개의 은닉노드로 구성되며, 출력층은 출력노드로 구성되며 출력노드의 수는 하나이다. 펩타이드 서열 길이 3에 대해 20자리 바이너리 아미노산 표현자를 사용하는 경우 피드 포워드 신경망의 구조는 60개의 입력노드로 구성되고, 각 노드의 입력값은 상기 S12단계에서 만들어진 60개의 표현자값 "0" 또는 "1"이다. 모든 펩타이드 서열 길이에 대한 피드 포워드 신경망의 구조는 은닉층을 사용하지 않고 바로 하나의 출력노드가 있는 출력층으로 구성할 수도 있다.
다음에는 상기 S13 단계의 적절한 기계학습 훈련을 통하여 펩타이드 서열의 소장 통과 여부를 예측할 수 있는 소장 통과 예측 모델을 획득한다(S14단계).
이어 상기 S14단계에서 획득한 소장통과 예측 모델과 상기 S5단계에서 획득한 기계학습 검증용 집합을 이용하여 소장 통과 여부에 대한 예측값을 획득하고 실험값과 비교하여 소장 통과 예측 모델을 검증하고 평가한다(S20단계). 이 S20단계는 S21단계 ~ S24단계로 이루어지며, 즉, 먼저 기계학습 모델 검증을 위한 입력값 을 준비한다(S21단계). 이 S21단계에서는 상기 S5단계에서 획득한 기계학습 검증용 집합을 그대로 사용한다.
계속하여 기계학습 검증용 집합에 포함된 펩타이드 개별 서열을 표현자값으로 변환한다(S22단계). 이때 표현자는 상기 S14단계에서 획득한 소장 통과 예측 모델이 S13단계의 훈련과정에서 사용한 표현자와 반드시 동일한 표현자를 사용한다.
이어 기계학습 검증용 펩타이드 집합으로 펩타이드 서열에 대한 아미노산 표현자값을 입력값으로 사용하고, 소장 통과 여부를 예측하기 위하여 상기 S14단계에서 획득한 소장 통과 예측 모델을 획득한다(S23단계).
그 후 기계학습 검증용 집합을 이용하여 소장 통과 여부에 대한 예측값을 획득하고 이를 이용하여 상기 S23단계에서 획득한 소장 통과 예측 모델을 검증하고 그 결과를 하기 표 3에 나타냈다(S24단계).
상기 S22단계에서 표현자를 20자리 바이너리 아미노산 표현자로 사용하여 기계학습 모델을 훈련하여 상기 S24단계를 실행하고 그 결과를 하기 표 3에 나타냈다.
[표 3] 소장 통과 예측 모델의 검증결과
펩타이드 서열 길이 반응자 작용특성 점수(ROC score)
입력 순서 임의 변경 전체 집합 5등분
훈련용(80%) 검증용(20%) 훈련용(80%) 검증용(20%)
3 0.8885±0.0014 0.8876±0.0056 0.8894±0.0035 0.8855±0.0152
4 0.7203±0.0065 0.6907±0.0068 0.7242±0.0047 0.7059±0.0173
5 0.7475±0.0047 0.7212±0.0140 0.7471±0.0032 0.7279±0.0070
6 0.7813±0.0068 0.7444±0.0244 0.7870±0.0033 0.7447±0.0136
7 0.8228±0.0457 0.7707±0.0209 0.8452±0.0060 0.7884±0.0412
표 3으로부터 알 수 있는 바와 같이 피드 포워드 신경망의 입력값 순서를 임의로 변경하여 검증을 5번 실시한 결과 펩타이드 서열 길이 3에 대한 반응자 작용 특성 점수가 훈련용 집합이 0.8885±0.0014, 검증용 집합이 0.8876±0.0056이었으며, 전체 집합을 5등분하여 4등분은 훈련용으로 실시하고 나머지 1등분을 검증용으로 사용하면서 훈련용 등분과 검증용 등분을 번갈아가며 교환하여 검증한 결과는 반응자 작용특성 점수가 펩타이드 서열 길이 3의 경우 훈련용 집합이 0.8894±0.0035, 검증용 집합이 0.8855±0.0152이었다.
상기 S22단계에서 표현자를 VHSE 아미노산 표현자로 사용하여 기계학습 모델을 훈련하여 상기 S24단계를 실행하고 그 결과를 하기 표 4에 나타냈다.
[표 4] 소장 통과 예측 모델의 검증결과
펩타이드 서열 길이 반응자 작용특성 점수(ROC score)
입력 순서 임의 변경 전체 집합 5등분
훈련용(80%) 검증용(20%) 훈련용(80%) 검증용(20%)
3 0.8371±0.0025 0.8305±0.0121 0.8358±0.0024 0.8321±0.0098
4 0.6937±0.0069 0.6828±0.0099 0.7032±0.0040 0.6930±0.0148
5 0.7129±0.0071 0.6833±0.0158 0.7149±0.0031 0.7014±0.0128
6 0.7460±0.0080 0.7184±0.2445 0.7537±0.0032 0.7299±0.0156
7 0.7964±0.0074 0.7497±0.0170 0.7999±0.0062 0.7605±0.0220
표 4으로부터 알 수 있는 바와 같이 피드 포워드 신경망의 입력값 순서를 임의로 변경하여 검증을 5번 실시한 결과 펩타이드 서열 길이 3에 대한 반응자 작용특성 점수가 훈련용 집합이 0.8371±0.0025, 검증용 집합이 0.8305±0.0121이었으며, 전체 집합을 5등분하여 4등분은 훈련용으로 실시하고 나머지 1등분을 검증용으로 사용하면서 훈련용 등분과 검증용 등분을 번갈아가며 교환하여 검증한 결과는 반응자 작용특성 점수가 펩타이드 서열 길이 3의 경우 훈련용 집합이 0.8358±0.0024, 검증용 집합이 0.8321±0.0098이었다.
다음에 상기 S24단계에서 실제 소장 통과 펩타이드 집합에 대해 소장 비통과 펩타이드를 동일한 수만큼 임의로 선별한 집합으로 대체하고 이를 이용하여 피드 포워드 신경망 모델을 훈련하였을 때 피드 포워드 신경망 모델이 소장 통과 펩타이드 서열과 소장 비통과 펩타이드 서열을 우연히 구별하는 것인지 또는 정확한 학습모델이 만들어지는 것인지를 검증하기 위하여 아미노산에 대해 바이너리 표현자를 사용한 실시예에서 5회 검증하고 그 결과를 하기 표 5에 나타냈다.
[표 5] 소장 통과 예측 모델의 검증결과
펩타이드 서열 길이 반응자 작용특성 점수(ROC score)
훈련용(80%) 검증용(20%)
3 0.5705±0.0024 0.4935±0.0079
4 0.5745±0.0070 0.4970±0.0244
5 0.5947±0.0021 0.4989±0.0114
6 0.6156±0.0096 0.4849±0.0353
7 0.6959±0.0105 0.4969±0.0216
표 5으로부터 알 수 있는 바와 같이 펩타이드 서열 길이 3에 대한 반응자 작용특성 점수가 훈련용 집합이 0.5705±0.0024, 검증용 집합이 0.4935±0.0079로 낮은 점수이었다.
또한 상기 S24단계에서 VHSE 아미노산 표현자를 사용한 실시예에서 5회 검증을 실시하고 그 결과를 하기 표6에 나타냈다.
[표 6] 소장 통과 예측 모델의 검증결과
펩타이드 서열 길이 반응자 작용특성 점수(ROC score)
훈련용(80%) 검증용(20%)
3 0.5523±0.0037 0.5171±0.0142
4 0.5521±0.0080 0.4968±0.0197
5 0.5564±0.0041 0.4807±0.0213
6 0.5727±0.0050 0.4750±0.0234
7 0.6265±0.0094 0.4926±0.0155
표 6으로부터 알 수 있는 바와 같이 펩타이드 서열 길이 3에 대한 반응자 작용특성 점수가 훈련용 집합이 0.5523±0.0037, 검증용 집합이 0.5171±0.0142로 낮은 점수이었다. 이와 같이 두 가지 다른 표현자를 사용한 실시예를 통하여 거짓 소 장 통과 펩타이드를 입력값으로 사용하는 경우 기계 학습 모델이 만들어지지 않음을 의미하고, 펩타이드 서열에 대해 입력층, 은닉층, 출력층으로 구성된 피드 포워드 인공 신경망 모델이 실제 소장 통과 펩타이드 서열과 소장 비통과 펩타이드 서열을 구별하였음을 알 수 있다.
도 3은 본 발명 기계학습법을 이용한 새로운 펩타이드 서열의 약동학적 성질 예측방법의 일실시예를 도시한 순서도로서, 먼저 입력수단(20)을 통해 약동학적 성질을 알고자 하는 펩타이드 서열을 입력하여 프로그램 기록매체(11)에 저장한다(S101단계).
다음에 입력된 펩타이드 개별 서열을 도 2의 과정을 통하여 훈련된 예측 모델(S23단계)에서 요구하는 표현자값으로 변환한다(S102단계).
그 후 훈련된 예측 모델(S23단계)로 구성된 약동학적 성질 예측 모델에 적용한다(S103단계).
약동학적 성질을 알고자 사용자가 입력한 새로운 펩타이드 서열의 소장 통과 여부를 출력한다(S104단계).
도 4는 본 발명에 따른 약동학적 성질 예측 모델을 재훈련하는 방법을 나타낸 순서도로서, 우선 소장 통과 여부 활성값을 실험기법으로 획득한 새로운 소장 통과 펩타이드 서열 및 소장 비통과 펩타이드 서열을 입력수단(20)을 통해 프로그램 기록매체(11)에 저장한다(S201단계).
이어 상기한 도 2의 S3단계 ~ S5단계 및 S10단계, S20단계를 수행하여 기계학습 모델을 훈련한 다음 이를 검증하고 기존의 기계학습 모델과의 비교값을 자동 화 하여 실행한다(S210단계). 먼저 새로이 입력된 펩타이드 서열이 이미 지정되어 있는 서열과 동일한 것인지를 판명한 후 이들 서열을 활성값에 따라 소장 통과 펩타이드 집합과 소장 비통과 펩타이드 집합에 추가하여 저장한다(S211단계).
다음에 기존에 저장되어 있는 펩타이드 서열에 새로이 입력된 펩타이드 서열을 추가하여 상기한 도 2의 S3단계의 기계학습 훈련을 위하여 펩타이드 서열 집합을 분류하고, S4단계의 기계학습 훈련용 펩타이드 집합을 획득하며, S5단계의 기계학습 검증용 펩타이드 집합을 획득하고, S10단계의 기계학습법을 이용하여 소장 통과 예측 모델을 훈련하여 획득하며, S20단계의 기계학습법을 이용하여 소장 통과 예측 모델을 검증한다(S212단계).
그 후 기존에 저장되어 있는 소장 통과 예측 모델의 반응자 작용특성 점수와 상기 S212단계에서 획득한 소장 통과 예측 모델의 반응자 작용특성 점수를 비교한다(S213단계).
이어 상기 S213단계에서 계산된 반응자 작용특성 점수를 사용자에게 출력하며 이를 근거로 사용자가 새로이 훈련된 소장 통과 예측 모델을 저장한다(S202단계).
이와 같이 함으로써 사용자가 실험을 통해 새로 획득한 소장 통과 펩타이드 서열을 이용하여 수학적 모델 기반의 예측 모델을 재훈련하고 검증할 수 있다.
지금까지 바람직한 실시예로서 본 발명을 설명하였지만 본 발명은 이에 한정되지 않고 발명의 요지를 이탈하지 않는 범위 내에서 다양하게 변형하여 실시할 수 있음은 물론이다.
상기한 바와 같이 본 발명에 의하면, 펩타이드 약물의 경구 투여에 의한 약물 전달시 필요한 특성중의 하나인 펩타이드 서열의 소장 통과 여부를 항상 실험으로 확인하지 않고 프로그램을 저장한 기록매체를 이용하여 미리 예측함으로써 실험으로 소요되는 비용과 시간을 절감할 수 있는 각별한 장점이 있다.

Claims (16)

  1. 프로그램 기록매체(11)와 CPU(12) 및 입출력부(13)로 이루어진 마이크로컴퓨터(10)와; 입력수단(20) 및; 출력수단(30)으로 이루어진 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템에 있어서,
    상기 마이크로컴퓨터(10)의 제어하에 상기 프로그램기록매체(11)가 동작을 수행하되, 상기 프로그램기록매체(11)는 실험 기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 프로세스와; 이들 서열을 근거로 소장을 통과하지 않는 펩타이드의 서열의 표본을 획득하는 프로세스와; 상기 획득한 표본 각각을 집합으로 저장한 후 이들을 일정한 비율이 되도록 임의로 추출하여 수학적 모델 훈련용 집합과 수학적 모델 검증용 집합으로 분류하는 프로세스와; 개별 펩타이드 서열에 표현자값과 활성값을 부여하는 프로세스와; 훈련용 펩타이드 집합과 수학적 모델을 이용하여 훈련하는 프로세스와; 훈련된 수학적 모델을 이용하여 검증용 펩타이드 집합에 대해 소장통과 여부를 예측하는 프로세스와; 훈련된 수학적 모델을 검증하는 프로세스를 포함하는 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템.
  2. 제 1항에 있어서, 상기 프로그램 기록매체(11)가 사용자가 소장 통과 여부를 알고자 하는 펩타이드 서열을 입력하면 이를 표현자로 변환하는 프로그램과, 훈련된 수학적 모델을 사용하여 소장 통과 여부를 예측하는 프로그램을 포함하고, 사용자가 실험 기법으로 소장 통과 여부 활성값을 획득한 새로운 소장 통과 펩타이드 서열을 추가하면, 이를 원래의 소장 통과 펩타이드 집합에 추가한 다음 분류하는 프로그램과, 추가된 펩타이드에 표현자값 및 활성값을 부여하는 프로그램과, 훈련용 펩타이드 집합을 이용하여 수학적 모델로 훈련하는 프로그램과, 검증용 펩타이드 집합에 대해 소장통과 여부를 예측할 수 있도록 하는 프로그램, 훈련된 수학적 모델에 대해 검증하는 프로그램을 포함하는 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 시스템.
  3. 프로그램 기록매체(11)와 CPU(12) 및 입출력부(13)로 이루어진 마이크로컴퓨터(10)와; 입력수단(20) 및; 출력수단(30)으로 이루어진 펩타이드 서열의 약동학적 성질 예측 시스템을 통한 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법에 있어서,
    상기 마이크로컴퓨터(10)의 제어하에 상기 프로그램기록매체(11)의 동작을 통해 실험 기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 단계와; 이들 서열을 근거로 소장을 통과하지 않는 펩타이드의 서열의 표본을 획득하는 단계와; 상기 획득한 표본 각각을 집합으로 저장한 후 이들을 일정한 비율이 되도록 임의로 추출하여 수학적 모델 훈련용 집합과 수학적 모델 검증용 집합으로 분류하는 단계와; 개별 펩타이드 서열에 표현자값과 활성값을 부여하는 단계와; 훈련용 펩타이드 집합과 수학적 모델을 이용하여 훈련하는 단계와; 훈련된 수학적 모델을 이용하여 검증용 펩타이드 집합에 대해 소장통과 여부를 예측하는 단계와; 훈련된 수학적 모델을 검증하는 단계로 이루어지는 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  4. 제 3항에 있어서, 상기 수학적 모델은 회귀분석법, 기계학습법, 유전자 알고리즘을 이용한 다중 회귀분석법, 유전자 알고리즘을 이용한 편최소제곱법, 주성분 분석을 활용한 편최소제곱법, 주성분 분석을 활용한 다중 회귀분석법을 포함하는 정량적 구조-특성 상관관계 방법인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  5. 제 4항에 있어서, 상기 기계학습법은 신경망, 데이터마이닝, 의사결정트리, 귀납논리, 사례기반 추론, 패턴인식, 강화학습, 베이지안 망, 은닉마코프 모델, 확률 문법 방법인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  6. 제 4항에 있어서, 상기 기계학습법은 신경망 기법인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  7. 제 3항에 있어서, 상기 펩타이드 서열의 약동학적 성질이 소장 내 흡수인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  8. 제 3항에 있어서, 상기 표현자값이 분자구조, 아미노산, 펩타이드를 정량적으로 나타낸 것임을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  9. 제 8항에 있어서, 상기 표현자값이 바이너리 아미노산 표현자, VHSE( principal components score Vectors of Hydrophobic, Steric and Electronic properties) 아미노산 표현자 중 어느 하나를 포함하는 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  10. 제 3항에 있어서, 상기 수학적 모델을 구축하기 위해 수집되는 데이터가 in vivo(생체내), ex vivo(생체외), in vitro(시험관내) 실험 중 적어도 어느 하나로부터 얻은 데이터인 것을 특징으로 하는 수학적모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  11. 제 3항에 있어서, 상기 수학적 모델을 구축하기 위해 수집되는 데이터가 파지 디스플레이 기법을 이용한 in vivo(생체내), ex vivo(생체외), in vitro(시험관내) 실험 중 적어도 어느 하나로부터 얻은 데이터인 것을 특징으로 하는 수학적모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  12. 제 3항에 있어서, 상기 펩타이드 서열이 2 ~ 12개의 펩타이드로 이루어진 서열인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  13. 제 3항에 있어서, 상기 펩타이드 서열이 3 ~ 7개의 펩타이드로 이루어진 서열인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  14. 제 3 항에 따른 펩타이드 서열의 약동학적 성질 예측방법을 적용하는 종이 포유류인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  15. 제 3 항에 따른 펩타이드 서열의 약동학적 성질 예측방법을 적용하는 종이 사람인 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측방법.
  16. 제 3 항 내지 제 13 항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로서, 실험 기법을 이용하여 소장을 통과하는 펩타이드 서열의 표본을 획득하는 프로세스와; 이들 서열을 근거로 소장을 통과하지 않는 펩타이드의 서열의 표본을 획득하는 프로세스와; 상기 획득한 표본 각각을 집합으로 저장한 후 이들을 일정한 비율이 되도록 임의로 추출하여 수학적 모델 훈련용 집합과 수학적 모델 검증용 집합으로 분류하는 프로세스와; 개별 펩타이드 서열에 표현자값과 활성값을 부여하는 프로세스와; 훈련용 펩타이드 집합과 수학적 모델을 이용하여 훈련하는 프로세스와; 훈련된 수학적 모델을 이용하여 검증용 펩타이드 집합에 대해 소장통과 여부를 예측하는 프로세스와; 훈련된 수학적 모델을 검증하는 프로세스를 포함하는 것을 특징으로 하는 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측 프로그램을 저장한 기록매체.
KR1020060108504A 2006-11-03 2006-11-03 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측시스템 및 방법과 그 프로그램을 저장한 기록매체 KR100924328B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020060108504A KR100924328B1 (ko) 2006-11-03 2006-11-03 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측시스템 및 방법과 그 프로그램을 저장한 기록매체
US12/513,279 US20100121791A1 (en) 2006-11-03 2007-05-28 System, method and program for pharmacokinetic parameter prediction of peptide sequence by mathematical model
PCT/KR2007/002568 WO2008054052A1 (en) 2006-11-03 2007-05-28 System, method and program for pharmacokinetic parameter prediction of peptide sequence by mathematical model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060108504A KR100924328B1 (ko) 2006-11-03 2006-11-03 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측시스템 및 방법과 그 프로그램을 저장한 기록매체

Publications (2)

Publication Number Publication Date
KR20080040481A KR20080040481A (ko) 2008-05-08
KR100924328B1 true KR100924328B1 (ko) 2009-11-02

Family

ID=39648147

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060108504A KR100924328B1 (ko) 2006-11-03 2006-11-03 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측시스템 및 방법과 그 프로그램을 저장한 기록매체

Country Status (1)

Country Link
KR (1) KR100924328B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4002383A3 (en) * 2020-11-13 2022-08-03 Tokyo Institute of Technology Information processing device, information processing method, recording medium recording information processing program, and information processing system

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833971A (zh) * 2019-04-23 2020-10-27 上海云贵信息科技有限公司 一种基于逻辑回归的药物化合物药代动力学参数预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030036364A (ko) * 2003-03-14 2003-05-09 주식회사 넷플랫 모듈화 컴퓨터 구조
KR20040055521A (ko) * 2002-12-21 2004-06-26 한국전자통신연구원 단백질의 기능을 예측하는 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040055521A (ko) * 2002-12-21 2004-06-26 한국전자통신연구원 단백질의 기능을 예측하는 시스템 및 방법
KR20030036364A (ko) * 2003-03-14 2003-05-09 주식회사 넷플랫 모듈화 컴퓨터 구조

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4002383A3 (en) * 2020-11-13 2022-08-03 Tokyo Institute of Technology Information processing device, information processing method, recording medium recording information processing program, and information processing system
EP4213158A1 (en) * 2020-11-13 2023-07-19 Ahead Biocomputing, Co. Ltd Information processing device, information processing method, recording medium recording information processing program, and information processing system

Also Published As

Publication number Publication date
KR20080040481A (ko) 2008-05-08

Similar Documents

Publication Publication Date Title
Zhavoronkov et al. Deep biomarkers of aging and longevity: from research to applications
CN112513990A (zh) 使用经训练的统计模型进行多模态预测的方法和装置
CN111640512B (zh) 肾脏替代疗法启动策略评估方法、装置及电子设备
CN112599187B (zh) 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法
CN113470741B (zh) 药物靶标关系预测方法、装置、计算机设备及存储介质
Bhatt et al. Deep surrogate assisted generation of environments
KR100924328B1 (ko) 수학적 모델을 이용한 펩타이드 서열의 약동학적 성질 예측시스템 및 방법과 그 프로그램을 저장한 기록매체
Zakaria et al. Procedural level generation for sokoban via deep learning: An experimental study
Jadhav et al. Tile embedding: a general representation for level generation
Guan et al. Cohortgpt: An enhanced gpt for participant recruitment in clinical study
CN113436686A (zh) 基于人工智能的化合物库构建方法、装置、设备及存储介质
Wong et al. The New Answer to Drug Discovery: Quantum Machine Learning in Preclinical Drug Development
KR100856517B1 (ko) 수학적 모델을 이용한 펩타이드 서열의 조직 표적 예측시스템 및 방법과 그 프로그램을 저장한 기록매체
Moghaddasi et al. Comparing the efficiency of artificial neural network and gene expression programming in predicting coronary artery disease
CN115331728B (zh) 一种稳定折叠的富含二硫键的多肽设计方法及其电子设备
US20230093507A1 (en) Data processing method and apparatus, computer device, and storage medium
Torge et al. Diffhopp: A graph diffusion model for novel drug design via scaffold hopping
WO2008054052A1 (en) System, method and program for pharmacokinetic parameter prediction of peptide sequence by mathematical model
CN113284553B (zh) 一种用于治疗药物成瘾的药物靶点结合能力测试方法
KR102187594B1 (ko) 신약 후보 물질 발굴을 위한 멀티오믹스 데이터 처리 장치 및 방법
CN114005529A (zh) 一种具有编码蛋白潜力的ncRNA的识别方法
US11915832B2 (en) Apparatus and method for processing multi-omics data for discovering new drug candidate substance
Ramachandran et al. Deep learning for better variant calling for cancer diagnosis and treatment
Budhraja et al. Mosaic LSM: A liquid state machine approach for multimodal longitudinal data analysis
Mazidi et al. PSPGA: A New Method for Protein Structure Prediction based on Genetic Algorithm

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee