KR20230129775A - 개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법 - Google Patents

개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법 Download PDF

Info

Publication number
KR20230129775A
KR20230129775A KR1020220026805A KR20220026805A KR20230129775A KR 20230129775 A KR20230129775 A KR 20230129775A KR 1020220026805 A KR1020220026805 A KR 1020220026805A KR 20220026805 A KR20220026805 A KR 20220026805A KR 20230129775 A KR20230129775 A KR 20230129775A
Authority
KR
South Korea
Prior art keywords
information
drug
candidate
genetic
disease
Prior art date
Application number
KR1020220026805A
Other languages
English (en)
Inventor
박해정
이강표
Original Assignee
(주)인트젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)인트젠 filed Critical (주)인트젠
Priority to KR1020220026805A priority Critical patent/KR20230129775A/ko
Publication of KR20230129775A publication Critical patent/KR20230129775A/ko

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioethics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

개개인의 유전자정보 데이터베이스와 약물의 데이터베이스를 바탕으로, 어떠한 약제 내지는 약물 후보물질에 대하여 약물효능 및 부작용을 예측하고, 이를 통하여 시험된 후보물질에 대하여 효능 예측 및 약물로서의 적합성을 판단할 수 있는 개인 유전체정보 기반 후보물질의 약물 효능 및 부작용 예측 시스템과, 이를 통한 후보물질의 효능예측 및 적합성 판단방법을 개시한다. 본 발명의 시스템은 서비스 제공자의 서버를 포함하고, 상기 서버는 하나 이상의 후보물질의 데이터를 포함하는 사용자 데이터베이스; 알려져 있는 약물의 정보가 하나 이상 포함되어 저장되어 있는 약물정보 데이터베이스; 알려져 있는 유전정보가 하나 이상 포함되어 저장되어 있는 유전정보 데이터베이스; 알려져 있는 질환정보가 하나 이상 포함되어 저장되어 있는 질환정보 데이터베이스; 알려져 있는 약물과 유전정보에 대한 유전정보-약물간 상관관계정보가 하나 이상 포함되어 있는 유전-약물반응 데이터베이스; 알려져 있는 둘 이상의 약물간 상관관계정보가 하나 이상 포함되어 있는 약물-약물반응 데이터베이스; 하나 이상의 운영 프로그램을 포함하는 관리부; 그리고 기계학습 알고리즘 내지는 모델이 적용되어 있는 스크리닝 모델을 포함하며, 상기 한명 이상의 사용자 각각에 대한 약물 위험도 및 부작용을 예측하고 개인별 약물 점수를 산출하는 예측/학습부를 포함한다.

Description

개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법{A SYSTEM FOR PREDICTING DRUG EFFICACY AND SIDE EFFECTS OF CANDIDATE SUBSTANCES BASED ON PERSONAL GENOMIC INFORMATION, AND METHOD FOR PREDICTING EFFICACY AND SUITABILITY OF CANDIDATE SUBSTANCES}
본 발명은 개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템과, 이를 통한 후보물질의 효능 예측 및 적합성을 판단하는 방법에 대한 것으로, 보다 상세하게는 개개인의 유전자정보 데이터베이스와 약물의 데이터베이스를 바탕으로, 어떠한 약제 내지는 약물 후보물질에 대하여 약물효능 및 부작용을 예측하고, 이를 통하여 시험된 후보물질에 대하여 효능 예측 및 약물로서의 적합성을 판단할 수 있는 개인 유전체정보 기반 후보물질의 약물 효능 및 부작용 예측 시스템과, 이를 통한 후보물질의 효능예측 및 적합성 판단방법에 대한 것이다.
1953년 제임스 왓슨(James Watson)이 '네이처' 지에 DNA 이중나선에 대한 논문을 발표한 후, DNA 분석 방법은 극적으로 발전하고 있으며, 발견된 DNA를 토대로 종별로 유전자 전체를 연구하는 학문인 유전체학(Genomics)이 급부상하여 이러한 학문을 토대로 다양한 활용 방안들 또한 연구 개발되고 있다. 개인에 대한 유전체 검사 비용이 초기에는 상당하여 연구 이상의 활용방안을 모색하기 어려웠지만, 지속적인 가격 하락으로 인하여 이제는 개인이 유전체 검사를 실시하고 이를 이용하여 개인이 모르고 있었던 유전자 변형 정도와 질환 유전자를 파악하여 유전 질환의 예측 및 파악을 비롯한 다양한 신체적, 정신적 건강에 활용될 수 있다.
하지만 이러한 유전체 검사 비용이 산업적으로 활용 가능한 정도로 낮춰진 것은 비교적 최근으로서, 아직 개발되지 않은 다양한 활용방안들이 있을 것으로 파악하고 있다. 현재 유전체 정보에 대한 활용 방안 중 약물과 유전자에 대한 상관관계에 대한 연구 및 활용의 경우, 약물과 유전체 변이에 대한 1대 1 관계쌍을 나타내어 유전체 변이에 대한 약물 부작용 가능성 및 효능, 효과 정보를 단편적으로 제공해 주는 수준으로서 둘 이상의 약물을 섭취하는 질환자의 경우 약물 간 상호작용이 어떻게 이루어지는지, 또한 다수의 약물이 질환자의 유전체와의 상관관계가 어떻게 되는지에 대하여는 아직 개발이 미흡한 수준이다.
특히 정신질환자의 경우, 다수의 약물을 장기적으로 복용하게 되는 경우가 많은데, 이러한 경우에는 복용하는 다수의 약물들 간 상호작용이 예상치 못한 변수로 작용하여 약물과 유전자에 대한 상관관계를 정확하게 파악하기 어렵다.
정신신경계 약물은 1950년대 클로르프로마진(Chlorpromazine)을 시작으로 꾸준히 개발되고 있다. 정신신경계 약물의 개발 전 정신질환에 대한 치료는, 전기충격 요법 또는 뇌절제 수술, 병동 감금 등 치료라고 부르기도 애매한 방식이었으나, 정신신경계 약물의 발견 및 발전으로 정신질환 치료에 획기적인 지평이 열렸으며 클로르프로마진 이후에도 클로로자핀, 리튬리스페리돈, 선택적 세로토닌 재흡수 억제제(Selective serotonin reuptake inhibitor; SSRI)로 불리는 올란자핀 등과 같은 수많은 정신신경계 약물이 개발 및 사용되고 있다.
그러나 많은 정신 신경계 약물들은 투여 후 예측하지 못한 부작용 또는 사람에 따라 효과가 전혀 나타나지 않거나 과하게 나타나는 등 개인에 따라 또는 약물에 따라 반응이 다르게 나타난다. 이러한 부분이 정신질환자에 대하여 유효한 약물의 개발을 어렵게 하고 있다.
예를 들어 조현병 치료 효과가 높다고 여겨지는 클로자핀에 경우, 무과립구증이 부작용으로 나타날 수 있으며 이 경우 심각한 경우 사망을 초래할 수 있다. 또한, 리스페리돈, 올란자핀 등과 같은 약물의 경우 체증 증가 및 혈당증가가 나타날 수 있는데 상기 설명한 부작용의 경우 개인별로 전혀 나타나지 않거나 또는 여러 강도로 나타난다.
이러한 다른 양상으로 나타나는 약물의 치료 효과가에 따라 단독 요법으로 투여하다가 개인에 따라 복합투여로 진행되는 경우가 많으며, 복합 투여를 진행할 때 적게는 2개 이상, 많게는 5~7개까지도 같은 계열의 항정신약물을 섭취하게 된다. 조현병 환자들을 대상으로 약물치료 전략을 수립하기 위해 KMAP이라는 약물치료 지침서가 발간되었지만 이는 완벽하게 임상상황을 반영하지 못하여 모든 환자에게 적용할 수 없는 등의 한계가 존재한다.
이러한 한계를 극복하기 위해 약물과 유전자 내지는 유전체와의 상관관계를 연구하는 약물 유전학 또는 약물유전체학이 지속적으로 연구되고 있다. 약물 유전체학은 개인별 유전체 염기서열 차이에 따른 환자에게 적합한 약물과 용량을 선택할 수 있는 개인 맞춤 약물을 선택하는 것을 말하며, 특히 단일염기다형성(Single Nucleotide Polymorphism, SNP) 등의 유전체 정보를 기반으로 하는 데이터 연구가 이미 활발히 이루어 지고 있다.
약물유전체학에 따르면, 현재 약물의 대사와 관련된 유전자로는 ABCB1, ABCC2, ABCG2, CYP1A1, CYP1A2, CYP2A6, CYP2B6, CYP2C19, CYP2C8, CYP2C9, CYP2D6, CYP2E1, CYP3A4, CYP3A5, DPYD, GSTM1, GSTP1, GSTT1, HRT2A, HRT2B, NAT1, NAT2, SLC15A2, SLC22A1, SLC22A2, SLC22A6, SLCO1B1, SLCO1B3, SLCO2B1, SULT1A1, TPMT, UGT1A1, UGT2B15, UGT2B17, UGT2B7, VKORC1 등이 보고되어 있으며 조현병 및 우울증 등의 정신질환을 타겟으로 하는 약물 대사체의 경우 rsID라고 불리우는 SNP 정보에 따라, 독성 또는 효능을 판별하는 임상 연구가 지속적으로 진행되고 있다.
임상연구에서 이미 수많은 부작용 사례가 발견이 되고 있으며 약물의 효용성 및 작용에 대한 논의도 꾸준히 이루어지고 있다. 항정신약물의 경우 발진 및 추제외로장애 그리고 약물 중독과 같은 부작용이 꾸준히 발생하고 있는 것도 문제이다. 보통의 약물개발은 부작용을 줄이고 약효는 높은 방향으로 진행 된다. 예를 들어 처음 개발된 제 1세대 항정신약물은 신경 세포중 하나인 Dopamine만을 타겟으로 하여 약물의 부작용이 심했다면 2세대 항정신약물의 경우 Dopamine 뿐만 아니라 다른 유전자 타겟(Serotonin)을 동시에 작용하는 약물을 개발함으로써 부작용을 줄이고 약효를 보전하는 방향으로 개발이 이루어졌다. 그럼에도 불구하고 아직까지도 부작용이 아예 나타나지 않는 것은 아니기 때문에 새로운 약물을 찾거나 약이 될 수 있는 새로운 물질을 발견하는 과정이 중요하다. 특히, 약물의 후보물질이 적게는 100개 많게는 만개이상이 있기 때문에 이를 빠르게 약이 될 수 있는 선도물질인지 아닌지 판단하기위한 다량의 약물스크리닝(Drug screening, 약물의 동태 및 기전에 대해 전반적으로 파악하는 것)이 필요한 실정이고 이에 따라 기존 동물들을 대상으로 하는 동물실험 약물스크리닝에서 AI나 머신러닝(ML, Machine Learning)을 결합한 약물 스크리닝 기법이 빠르게 개발되고 있다.
이러한 약물스크리닝의 궁극적인 목적은 부작용은 최소화하면서도 사용자의 질환에 유효한 약물을 개발하는 것이며, 이러한 약물 개발의 핵심은 약효가 있을 것으로 판단되는 후보물질을 검증하여 실제로 약효가 있을 것인지 판단하는 것이다.
상기 스크리닝에서는, 인체의 단백질이나 DNA, RNA의 변화 지표를 총칭하는 생체표지자 정보인 바이오마커(Biomarker)와, 후보물질간의 상관관계를 추정하여, 후보물질의 약효 여부에 대하여 판단하는 것이 일반적이다. 상기한 바와 같이 바이오마커는 포괄적인 개념으로, 상술한 SNP 정보 또한 바이오마커의 일부로서 포함될 수 있는 것이다.
이때 일반적인 스크리닝 방식은, 하나의 바이오마커에 대하여 후보물질의 약효 여부를 판단하게 되어 여러 원인이 복합적으로 관계하여 나타나는 실제적인 약동학적 자료를 반영하지 못할 수 있다. 이러한 종래의 스크리닝 방식은 물론, 바이오마커 뿐 아니라 이온채널 정보 등 추가적인 요소들을 더하여 실행함으로서 정밀도를 높이려는 시도가 더 이루어지고 있지만 이 또한 약물간 복합적인 관계정보를 반영하지는 못하는 실정이다.
특히 이는 약물에 따른 개개인간 약효 편차가 큰 정신질환 관련 약물의 경우 두드러지게 발생하는 단점으로서, 정신질환의 경우 약물 그룹들이 일정하게 정해져 있으나, 동일 약물 내지는 약물군을 동량으로 투여하더라도 사람에 따라 투여 반응간 편차가 매우 크게 나타날 수 있기 때문에 종래의 약물 스크리닝 방식으로는 환자에게 적합한 후보물질의 선별 및 약물정보의 제공에 한계가 발생하고 있다.
또한 종래의 스크리닝을 위한 약동학 파악절차 또한, in vivo(체내) 및 in vitro(체외) 모델 및 시스템 방식을 사용하기 때문에, 고비용 및 오랜 시간이 발생하여 후보물질에 대한 선별이 경제적 부담을 발생시키고 있는 실정으로서, 이러한 부분을 개선해야 할 필요성이 대두되었다.
KR공개특허 제10-2018-0076717호 KR공개특허 제10-2015-0018354호 KR공개특허 제10-2020-7002402호 KR공개특허 제10-2020-0070504호
본 발명은 상기와 같은 종래 기술의 문제점을 개선하고, 종래 방식과는 다른 방식으로 보다 빠르면서도 유전정보와 질환정보, 약물 상호간 영향력을 충분히 고려할 수 있는 후보물질에 대한 스크리닝 및 평가를 실시하기 하기 위한 시스템 및 그 방법을 제공하는 데 그 목적이 있다.
본 발명은 상기와 같은 본 발명의 목적을 달성하기 위하여,
개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템으로서, 서비스 제공자의 서버를 포함하고, 상기 서버는 하나 이상의 후보물질의 데이터를 포함하는 사용자 데이터베이스; 알려져 있는 약물의 정보가 하나 이상 포함되어 저장되어 있는 약물정보 데이터베이스; 알려져 있는 유전정보가 하나 이상 포함되어 저장되어 있는 유전정보 데이터베이스; 알려져 있는 질환정보가 하나 이상 포함되어 저장되어 있는 질환정보 데이터베이스; 알려져 있는 약물과 유전정보에 대한 유전정보-약물간 상관관계정보가 하나 이상 포함되어 있는 유전-약물반응 데이터베이스; 알려져 있는 둘 이상의 약물간 상관관계정보가 하나 이상 포함되어 있는 약물-약물반응 데이터베이스; 하나 이상의 운영 프로그램을 포함하는 관리부; 그리고 기계학습 알고리즘 내지는 모델이 적용되어 있는 스크리닝 모델을 포함하며, 상기 한명 이상의 사용자 각각에 대한 약물 위험도 및 부작용을 예측하고 개인별 약물 점수를 산출하는 예측/학습부를 포함하는 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템을 제공한다.
상기에서, 상기 시스템은 상기 서버로부터 제공받은 정보를 전송받아 가시적으로 확인할 수 있는 하나 이상의 단말기를 더 포함하는 것이 바람직하다.
상기에서, 후보물질 데이터베이스는 하나 이상의 개별 후보물질 데이터베이스를 포함하고, 상기 하나 이상의 개별 후보물질 데이터베이스는 각각 해당 후보물질에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 물질 ID; 해당 후보물질의 구성정보가 하나 이상 포함되어 저장되는 물질 구성정보; 해당 후보물질의 특성정보가 하나 이상 포함되어 저장되는 물질 특성정보; 그리고 상기 예측/학습부에 의하여 예측된 데이터가 하나 이상 포함되어 저장되는 물질 예측정보를 포함하는 것이 바람직하다.
상기에서, 약물정보 데이터베이스는 하나 이상의 개별 약물정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 약물정보 데이터베이스는 각각 해당 약물에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 약물 ID; 해당 약물의 일반적인 정보 데이터가 하나 이상 포함되어 저장되는 약물 일반정보; 해당 약물의 유효성분이 하나 이상 포함되어 저장되는 약물 유효성분정보; 그리고 상기 약물 유효성분정보 내 각각의 유효성분에 대한 특성정보를 하나 이상 포함하고 있는 성분 특성정보를 포함하는 것이 바람직하다.
상기에서, 유전정보 데이터베이스는 하나 이상의 개별 유전정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 유전정보 데이터베이스는 각각 해당 유전정보에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 유전정보 ID; 해당 유전정보와 관련된 유전정보가 하나 이상 포함되어 저장되는 일반 유전정보; 상기 일반 유전정보 내 유전정보 각각에 대한 변이정보가 하나 이상 포함되어 저장되는 변이형태 정보; 그리고 상기 변이형태 정보 내 저장된 각각의 변이정보에 대하여 알려진 인체에 대한 신체적 또는 정신적 변화 특징, 발생할 수 있는 질환이 하나 이상 포함되는 변이영향 정보를 포함하는 것이 바람직하다.
상기에서, 질환정보 데이터베이스는 하나 이상의 개별 질환정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 질환정보 데이터베이스는 각각 해당 질환정보에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 질환정보 ID; 해당 질환에 대하여 잘 알려진 정보가 하나 이상 포함되어 저장되는 질환내용 정보; 해당 질환에 대하여 관여하는 유전자 또는 유전체, 유전자 변이내용 중 어느 하나 이상 포함되어 있는 관여유전자 목록; 해당 질환을 외부에서 식별할 수 있는 식별자 정보가 하나 이상 포함되어 있는 질환 식별정보; 그리고 하나 이상의 약물정보가 포함되어 있는 치료약물 정보를 포함하는 것이 바람직하다.
상기에서, 유전-약물반응 데이터베이스는 하나 이상의 개별 유전정보-약물반응 데이터베이스를 포함하고, 상기 하나 이상의 개별 유전정보-약물반응 데이터베이스는 각각 해당 유전정보에 따른 약물반응에 있어서 관여하는 유전정보의 ID 또는 고유번호가 하나 이상 포함되어 저장되는 관여 유전정보 ID목록; 해당 유전정보에 따른 약물반응에 있어서 관여하는 약물의 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되어 저장되는 관여 약물정보 ID목록; 해당 유전정보에 따른 약물반응에 있어서 연관되어 있는 질환의 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되어 저장되는 연관 질환정보 ID목록; 그리고 해당 유전정보에 따른 약물반응의 기전, 임상반응, 투여결과 중 어느 하나 이상 포함되어 저장되는 유전정보-약물간 상관관계정보를 포함하는 것이 바람직하다.
상기에서, 약물-약물반응 데이터베이스는 하나 이상의 개별 약물간 반응정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 약물간 반응정보 데이터베이스는 각각 해당 약물 상호간 반응에 있어서 관여하는 약물의 ID 또는 고유번호를 둘 이상 포함하고 있는 관여 약물정보 ID 목록; 해당 약물 상호간 반응에 있어서 관여하는 질환의 ID 또는 고유번호를 하나 이상 포함하고 있는 연관 질환정보 ID목록; 그리고 해당 약물 상호간 반응의 기전, 임상반응, 투여 결과가 하나 이상 포함되어 있는 약물간 상관 데이터를 포함하는 것이 바람직하다.
상기에서, 관리부는 외부 공중의 전기통신망에서 상기 데이터베이스 내 포함될 수 있는 정보 및 데이터 중 어느 하나 이상을 참조하여 저장시킬 수 있는 봇 프로그램을 포함하는 것이 바람직하다.
상기에서, 예측/학습부는 기계학습 알고리즘 내지는 모델이 적용되어 있는 점수화 모델을 더 포함하는 것이 바람직하다.
상기의 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템을 통한 후보물질의 효능예측 및 적합성 판단방법으로서, 하나 이상의 후보물질과 하나 이상의 대상 질환을 선택하여 평가의 요청을 하는 후보물질 평가요청단계(S1); 상기 예측/학습부가 상기 단계(S1)를 통해 선택된 하나 이상의 후보물질에 대하여 선택된 하나 이상의 대상 질환에 대해 유효정도 및 부작용을 예측하는 후보물질 위험도 및 부작용 예측단계(S2); 상기 단계(S2)를 통해 생성된 해당 후보물질에 대한 약물의 위험도 및 부작용에 대하여 점수화하여 후보물질 약물 점수를 산출하는 개인별 약물 점수 산출단계(S3); 상기 단계(S3) 후, 해당 후보물질의 후보물질 예측정보를 갱신하는 후보물질 예측정보 갱신단계(S4); 상기 단계(S4) 후, 상기 후보물질 예측정보 내 데이터에 대하여 평가하는 모델 평가 및 최적화 단계(S5)를 포함하는 것이 바람직하다.
상기 단계(S2, S3)을 실시하기 위하여, 상기 스크리닝 모델은 해당 후보물질의 개별 데이터베이스 중 물질 구성정보 및 물질 특성정보와, 약물정보 데이터베이스, 유전정보 데이터베이스, 질환정보 데이터베이스, 유전정보-약물반응 데이터베이스, 그리고 약물-약물반응 데이터베이스를 사용 데이터셋에 포함시켜 사용할 수 있다.
상기 단계(S2)를 통해 후보물질 예측 데이터(D1)가 생성되고, 상기 후보물질 예측 데이터(D1)는 후보물질 정보(D11), 질환대비 평가정보(D12), 그리고 약물대비 평가정보(D13)를 포함할 수 있다.
상기 후보물질 예측 데이터(D1)는, 상기 단계(S3)가 실행되면서 생성되는 후보물질 점수정보(D14)가 더 포함될 수 있다.
상기 후보물질 점수정보(D14)는 질환대비 점수정보(D141), 그리고 약물대비 점수정보(D142)를 포함할 수 있다.
상기 약물대비 점수정보(D142)는 약물 상호간 반응등급, 반응수준 및 상호작용점수를 포함하고, 상기 반응등급은 상호간에 효과를 증가시키는 'Synergic', 반응을 서로 경감시키는 'Antagonist', 그리고 서로간에 반응하여 인체 내에서 독성이 나타나게 되는 'Toxicity' 의 세 가지 분류를 포함할 수 있다.
상기에서, 상기 단계(S6)는 상기 데이터(D1)와 해당 후보물질이 포함된 개별 약물정보 데이터베이스 내 가장 최신의 데이터를 비교하는 데이터간 비교단계(S61); 상기 단계(S61) 후, 정확도를 계산하는 정확도 계산 단계(S62); 그리고 상기 단계(S62) 상기 예측/학습부 내 하나 이상의 모델의 변수를 조정하는 상관관계 모델 변수조정 단계(S63)를 포함하는 것이 바람직하다.
본 발명에 의하면, 종래의 스크리닝 방식보다 경제적이면서도 빠르게 후보물질의 유효성 여부 및 약물로서의 적합성 여부를 판단할 수 있을 뿐 아니라 하나의 후보물질에 대해서 다양한 질환에 대하여 적합성 여부를 평가할 수도 있고, 유전정보와 약물간 상호작용을 고려하여 보다 정밀한 스크리닝을 실시할 수 있다.
도 1은 본 발명의 시스템의 개략구조도.
도 2 및 도 3은 본 발명의 시스템에서 서버의 구조도.
도 4a 및 도 4b는 본 발명 시스템에서 데이터베이스 예시 구조도.
도 5는 본 발명 시스템의 동작 순서도.
도 6은 본 발명 시스템의 구체화된 동작 단계 구조도.
도 7a 및 도 7b는 본 발명에서 데이터의 예시 구조도.
도 8은 본 발명 시스템의 구체화된 동작 단계 구조도.
이하에서는 첨부하는 도면을 참조하여 본 발명을 보다 상세히 설명한다. 하기의 설명은 본 발명의 이해와 실시를 돕기 위한 것이지 본 발명을 이에 한정하려는 것은 아니다. 본 발명이 속한 기술분야에서 통상의 지식을 가진 자들은 이하의 청구범위에 기재된 본 발명의 사상 내에서 다양한 변형이나 수정 또는 변경이 있을 수 있음을 이해할 것이다.
도 1은 본 발명의 시스템을 제공하는 서비스 제공자의 서버(10)의 구성 및 기능에 대하여 간략하게 도시한 구조도이다. 이하에서는 도 1을 통하여 본 발명의 시스템의 구성 및 동작 방식에 대하여 간략하게 설명한다.
본 발명의 시스템에서, 서비스 제공자는 본 발명의 시스템을 수행하기 위한 하나 이상의 서버(10)를 포함한다.
여기서 상기 서버(10)는, CPU 등 하나 이상의 연산장치와 기억장치를 포함하고 프로그램 및 데이터베이스 설치 및 구축이 가능한 종래의 컴퓨터를 사용하면 된다. 이러한 컴퓨터는 서버 전용의 컴퓨터 또는 데스크탑 컴퓨터, 랩톱 컴퓨터 등 다양한 형태의 기기 중 하나를 선택하여 사용하면 되므로, 이에 대한 설명은 생략한다.
그리고 본 발명의 시스템은, 상기 서버(10)에 데이터를 입력하거나, 또는 상기 서버(10)로부터 제공받은 정보를 전자적으로 전송받아 가시적으로 확인할 수 있는 하나 이상의 단말기(20)를 더 포함하여, 관리자(P)가 상기 하나 이상의 단말기(20)를 통해 상기 서버(10)가 전송하는 데이터를 유선 또는 무선 통신을 이용하여 제공받아 관리자(P)에게 제공할 수 있다.
여기서 상기 관리자(P)는 상기 서버(10)를 통하여 본 발명의 시스템을 사용할 수 있는 위치에 있는 사람을 의미하며, 서비스 제공자의 소속 직원이나 의사나 약사 등 의료기관 종사자 등의 사람들이 될 수도 있다.
여기서 상기 사용자 단말기(20) 또한, 하나 이상의 연산장치와 기억장치를 포함하고 프로그램을 설치할 수 있으며 디스플레이 등 입출력장치가 있는 종래의 스마트폰 내지는 랩톱 컴퓨터 등의 단말기를 사용하면 되므로 이에 대한 설명은 생략한다.
물론, 상기 단말기(20)는 본 발명의 시스템에서 필수적인 구성요소는 아니며, 예를 들어 인쇄된 서면 등의 방식으로 서버(10)는 상기 관리자(P)에게 상기 단말기(20) 외의 방법으로 정보를 제공할 수 있다. 따라서 상기 서버(10)가 관리자(P)에게 정보를 제공하는 수단은 한정되지 않는다.
상기 서버(10)는 또한, 도 1에 도시된 바와 같이, 하나 이상의 데이터베이스를 포함하며 또한 기계학습 모델이 적용되어 있는 하나 이상의 프로그램이 포함되어 있다.
상기 하나 이상의 데이터베이스는 상기 기계학습 모델의 학습을 위한 데이터셋(Dataset)이 되며, 이를 통하여, 신약 후보물질에 대하여 상기 기계학습 모델이 적합성을 판단하고, 이를 상기 관리자(P)가 제공받게 되는 것이다.
도 2는 본 발명의 서버(10)의 구조도이며, 도 3은 상기 서버(10) 내 데이터베이스(100~150)의 구체적인 구조도이다. 이하에서는 도 2 및 도 3을 통하여 본 발명의 서버(10)의 구조 및 구성, 기능에 대하여 자세히 설명한다.
상술한 바와 같이, 본 발명의 서버(10)는 일반적인 서버 컴퓨터 등을 사용하게 되며, 따라서 하나 이상의 연산장치와 기억장치를 포함한다. 따라서 이하의 서버(10) 내의 데이터베이스 및 기능부 또한 상기 서버(10) 내의 연산장치 및 기억장치 상에서 동작하는 하나 이상의 프로그램과 데이터 중 어느 하나 이상의 조합을 포함한다.
먼저 본 발명의 시스템에 포함되는 서버(10)는, 스크리닝 대상이 되는 후보물질의 데이터를 포함하는 후보물질 데이터베이스(100), 알려져 있는 약물의 정보를 하나 이상 포함하여 저장하고 있는 약물정보 데이터베이스(110), 알려져 있는 유전자정보, 유전체 정보 및 변이정보 등의 유전정보가 하나 이상 포함되어 있는 유전정보 데이터베이스(120), 알려져 있는 질환정보가 하나 이상 포함되어 있는 질환정보 데이터베이스(130), 알려져 있는 약물과 유전정보에 따른 상관관계 내지는 신체 또는 정신의 상태변화정보(이하 유전정보-약물간 상관관계정보)가 하나 이상 포함되어 있는 유전-약물반응 데이터베이스(140), 그리고 알려져 있는 둘 이상의 약물이 인체 내에 투입되었을 때의 상관관계 내지는 신체 또는 정신의 상태변화정보(이하 약물간 상관관계정보)가 하나 이상 포함되어 있는 약물-약물반응 데이터베이스(150)를 포함한다.
여기서, 상기 질환정보 데이터베이스(130)에서 포함되어 있는 상기 하나 이상의 알려져 있는 질환정보는, 그 대상이 되는 질환에 대하여 한정되지는 않지만, 바람직하게는 본 발명의 목적을 유효하게 달성하기 위하여 인체의 정신과 관련된 정신질환인 것이 바람직하다. 따라서 상기 질환정보의 대상이 되는 질환은 조현병, 자폐, 간질, 우울증 및 조울증, ADHD와 같이 DSM-5(The Diagnostic and Statistical Manual of Mental Disorders 5th Edition)에 등재된 전반적인 정신질환을 포함하며, 이외에 새롭게 발견되거나 보고된 정신질환을 더 포함하는 것이 바람직하다.
그리고 상기 서버(10)는, 서버(10)의 데이터베이스 및 프로그램들을 운용하는 하나 이상의 운영 프로그램을 포함하는 관리부(160), 그리고 상기 서버(10) 내의 데이터를 이용하여 해당 사용자에 대한 약물 위험도 및 부작용을 예측하고, 개인별 약물 점수를 산출하는 예측/학습부(170)를 포함한다.
상기의 구성요소(160, 170)는 상기한 구성요소들의 목적을 달성하기 위한 하나 이상의 프로그램 및 저장공간, 그리고 필요한 하나 이상의 하드웨어적 구성요소들을 모두 포함할 수 있다.
특히 상기 예측/학습부(170)는, 상기 사용자에 대한 약물 위험도 및 부작용을 예측하기 위하여, 반복적 학습이 가능한 기계학습 알고리즘/모델이 적용 프로그램으로서, 분석 대상이 되는, 상기 후보물질 데이터베이스(100)에 포함되어 있는 하나 이상의 후보물질에 대하여, 상기 질환정보 데이터베이스(130)에 포함되어 있는 하나 이상의 질환 대비 유효수준 및 발현 가능한 부작용, 적합성 등을 예측할 수 있는, 수정 가능하게 정의되어 있는 스크리닝 모델(171)을 포함한다.
상기 스크리닝 모델(171)은 하나 이상의 후보물질에 대하여, 인체에서 발현 중인 질환에 대한 유효수준 및 부작용의 발연 가능성, 다른 약물과의 상관성, 약물로서의 적합성 등을 예측하여 데이터를 생성하고, 이 예측 데이터는 상기 대상이 된 후보물질이 실제 임상 및 시판 후 인체 투여 후의 객관적인 결과 데이터와 대비시켜 상기 예측 데이터가 얼마나 정확한지 비교하고 이를 참고하여 모델에 사용되는 변수를 최적화함으로서, 상기 스크리닝 모델(171)의 예측 정확성을 높일 수 있다.
또한 상기 데이터베이스(100~150) 중 외부 공중의 전기통신망에서 참조하여 가져올 수 있는 데이터가 하나 이상 있을 수 있는데, 따라서 상기 관리부(160)는 외부 공중의 전기통신망에서 상기 데이터베이스(100~140) 내 정보 및 데이터 중 어느 하나 이상을 외부 공중의 전기통신망에서 참조하여 저장시킬 수 있는 하나 이상의 프로그램을 포함하게 된다. 따라서, 상기 관리부(160)는 하나 이상의 어느 특정 데이터를 외부 공중의 전기통신망을 이용하여 주기적으로 크롤링(Crawling)하여 구분 저장할 수 있는 봇(Bot) 프로그램(161)을 하나 이상 포함하는 것이 바람직하다.
여기서 크롤링 등의 기법을 이용하여 상기 봇 프로그램(161)이 외부의 전기통신망으로부터 데이터를 참조하여 가져오는 방식은, 종래의 방식 및 표준을 사용하여 구현되므로 이에 대한 자세한 설명은 생략한다.
아니면 상기 데이터베이스(100~150)의 내용은 상기 관리자(P)가 자신의 단말기(20)를 통해 입력하여 구축할 수도 있으며, 이러한 구성은 서비스 제공자가 본 발명의 시스템을 구축하는 형태에 따라 하나 이상 선택하여 사용할 수도 있다.
이때 상기 데이터베이스(100~150)의 내용 중에는, 개인의료정보보호법에 따라 상기 봇 프로그램(161)에 의한 참조 및 상기 관리자(P)에 의한 입력에 있어서 별도의 절차가 필요하거나, 또는 암호화된 내용으로 제공받을 수도 있다. 따라서 상기 관리부(160) 및 봇 프로그램(161)은, 상기 데이터베이스(100~150)의 내용을 입력하여 구축하는 데 있어서 개인의료정보보호법 등의 외부적 요인에 따라 추가적인 입력 절차를 수행하거나 또는 암호화된 내용의 복호화 등의 데이터 가공에 따른 추가적인 구성요소들을 더 포함할 수 있다.
도 3은 상기 데이터베이스(100~150)의 구체적인 구성요소들에 대한 구조도이다. 이하에서는 도 2 및 도 3을 통하여 상기 데이터베이스(100~150) 각각의 구체적인 구성요소들에 대하여 설명한다.
도 2에 도시된 바와 같이, 상기 후보물질 데이터베이스(100)는 각각의 후보물질에 대한 데이터를 구분하여 저장하고 있는 하나 이상의 개별 후보물질 데이터베이스(101, 102...), 상기 약물정보 데이터베이스(110)는 하나 이상의 약물에 대하여 약물 정보를 각각 포함하여 저장하는 개별 약물정보 데이터베이스(111, 112...)를 포함한다.
또한 상기 유전정보 데이터베이스(120)는 상기한 하나 이상의 유전정보를 각각 구분하여 저장하고 있는 하나 이상의 개별 유전정보 데이터베이스(121, 122...)를 포함하고, 상기 질환정보 데이터베이스(130)는 하나 이상의 개별 질환정보를 각각 구분하여 저장하고 있는 하나 이상의 개별 질환정보 데이터베이스(131, 132...)를 포함한다.
그리고 상기 유전-약물반응 데이터베이스(140)는 상기 하나 이상의 유전-약물 상관관계정보를 각각 구분하여 저장하고 있는 하나 이상의 개별 유전정보-약물반응 데이터베이스(141, 142...), 그리고 상기 약물-약물반응 데이터베이스(150)는 상기 하나 이상의 약물간 상관관계정보를 각각 구분하여 저장하고 있는 하나 이상의 개별 약물간 반응정보 데이터베이스(151, 152...)를 포함한다.
상기의 개별 데이터베이스들에 대하여 자세히 설명하면, 우선 각각의 개별 후보물질 데이터베이스(101, 102...)는 각각 해당 후보물질 고유하게 구분하기 위하여 설정된 ID 또는 고유번호를 포함하는 물질 ID(1011), 해당 물질의 화학식, 화학적 구조, 구성 원소 및 분자구조 등의 구성정보가 하나 이상 포함되어 저장되는 물질 구성정보(1012), 해당 물질의 알려진 화학적, 생물학적 특성정보를 하나 이상 포함하고 있는 물질 특성정보(1013), 그리고 상기 예측/학습부(170)에 의하여 예측된 데이터가 하나 이상 포함되어 저장되는 물질 예측정보(1014)를 포함한다.
그리고 각각의 개별 약물정보 데이터베이스(111, 112...)는 각각 해당 약물에 대하여 다른 약물과 구분지을 수 있도록 고유하게 설정된 ID 또는 고유번호를 포함하는 약물 ID(1111), 해당 약물의 이름, 제조사, 효능 등의 일반적인 정보 데이터가 저장되어 있는 약물 일반정보(1112), 약물의 유효성분이 하나 이상 저장되어 있는 약물 유효성분정보(1113), 그리고 상기 약물 유효성분정보(1113) 내 유효성분 각각에 대한 알려진 화학적, 생물학적 특성정보를 하나 이상 포함하고 있는 성분 특성정보(1114)를 포함한다.
여기서 상기 약물 유효성분 데이터(1113)는 예를 들어, 약물의 유효성분에 대한 화학적 구조를 특정화하기 위한 단순 분자입력 라인입력 시스템(Simplified molecular-input line-entry system; SMILES) 형태의 데이터나, 화학적 지문(Chemical fingerprint) 데이터, ECFP(Extened connectivity fingerprint) 데이터와 같은 화학적 구조 관련 데이터를 어느 하나 이상을 포함할 수 있다.
그리고 각각의 개별 유전정보 데이터베이스(121, 122...)는 각각 해당 유전정보에 대하여 다른 유전정보와 구분지을 수 있도록 고유하게 부여된 ID 또는 고유번호를 포함하는 유전정보 ID(1211), 해당 유전정보에 있어서 관여하는 유전체 내지는 유전자의 코드명 등의 잘 알려진 일반적인 유전정보가 하나 이상 포함되는 일반 유전정보(1212), 상기 일반 유전정보(1212) 내 유전정보 각각에 대하여 변이될 수 있는 내용 또는 알려진 변이수준과 같은 변이정보가 하나 이상 포함되는 변이형태 정보(1213), 상기 변이형태 정보(1213) 내 변이로 인한 알려진 인체에 대한 신체적 또는 정신적 변화 특징, 발생할 수 있는 질환 등의 내용이 하나 이상 포함되는 변이영향 정보(1214)를 포함한다.
이때 상기 변이형태 정보(1213)는 유전체의 변이에 관한 모든 내용이 제한없이 포함될 수 있는데, 예를 들어 하나 이상의 코돈(Codon) 돌연변이, 엑손 결실(Exon Deletion), 치환, 유전자 재배열과 같이 현재 잘 알려져 있는 변이정보들이 포함될 수 있다.
또한 상기 일반 유전정보(1212) 및 변이형태 정보(1213)는 유전체의 변이 뿐 아니라 유전체의 고유한 특징들 역시 더 포함될 수 있는데, 예를 들어 구조 RNA, 조절 RNA, 전령 RNA, 단백질 및 펩타이드와 관련된 정보를 하나 이상 포함할 수 있다.
그리고 각각의 개별 질환정보 데이터베이스(131, 132...)는 각각 해당 질환정보에 대하여 다른 질환정보와 구분지을 수 있도록 고유하게 부여된 ID 또는 고유번호를 포함하는 질환정보 ID(1311), 해당 질환정보에 대하여 질환의 증상, 원인 등 질환에 대하여 잘 알려진 정보가 하나 이상 포함되어 있는 질환내용 정보(1312), 해당 질환에 대하여 관여되어 있는 유전자 또는 유전체, 유전자 변이내용 중 어느 하나 이상 포함되는 관여유전자 목록(1313), 해당 질환을 외부에서 식별할 수 있는 바이오마커 등의 식별자 정보가 하나 이상 포함되어 있는 질환 식별정보(1314), 그리고 해당 질환을 치료할 수 있는 것으로 알려져 있는 하나 이상의 약물정보가 포함되어 있는 치료약물 정보(1315)를 포함한다.
여기서, 상기 관여유전자 목록(1313)에 포함되는 데이터는, 상기 유전정보 데이터베이스(120) 내 하나 이상의 개별 유전정보 데이터베이스에 대한 유전정보 ID(1211)를 하나 이상 포함할 수 있다.
또한, 상기 치료약물 정보(1315)에 포함되는 데이터는, 상기 약물정보 데이터베이스(110) 내 하나 이상의 개별 약물정보 데이터베이스에 대한 약물 ID(1111)를 하나 이상 포함할 수 있다.
그리고 상기 개별 유전정보-약물반응 데이터베이스(141, 142...)는 각각 해당 유전정보에 따른 약물반응에 있어서 상기 유전정보 데이터베이스(120)에 저장되어 있는, 관여하는 유전정보의 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되는 관여 유전정보 ID 목록(1411), 해당 유전정보에 따른 약물반응에 있어서 상기 약물정보 데이터베이스(110)에 저장되어 있는, 관여하는 약물의 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되는 관여 약물정보 ID 목록(1412), 해당 유전정보에 따른 약물반응에 있어서 상기 질환정보 데이터베이스(130)에 저장되어 있는, 연관되어 있는 질환의 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되는 연관 질환정보 ID목록(1413), 그리고 해당 유전정보에 따른 약물반응의 구체적인 기전 및 임상반응, 투여 결과 등이 하나 이상 포함되어 있는 유전정보-약물간 상관관계정보(1414)를 포함한다.
그리고 상기 개별 약물간 반응정보 데이터베이스(151, 152...)는 각각 해당 약물 상호간 반응에 있어서 상기 약물정보 데이터베이스(110)에 저장되어 있는, 관여하는 약물의 고유하게 부여된 ID 또는 고유번호가 둘 이상 포함되는 관여 약물정보 ID 목록(1511), 해당 약물 상호간 반응에 있어서 상기 질환정보 데이터베이스(130)에 저장되어 있는, 연관 질환에 대하여 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되는 연관 질환정보 ID목록(1512), 그리고 해당 약물간 상호반응의 구체적인 기전 및 임상반응, 투여 결과 등이 하나 이상 포함되어 있는 약물간 상관관계 정보(1513)를 포함한다.
이러한 상기 개별 유전정보-약물반응 데이터베이스(141, 142...)와 개별 약물간 반응정보 데이터베이스(151, 152...)의 구성은 예시적으로, 도 4a 및 4b에 도시된 바와 같은 형태로 저장될 수 있다.
도 5은 본 발명의 후보물질 위험도 및 부작용을 예측하는 과정을 나타낸 순서도이며, 도 6은 상기 순서도에서 단계 S2 및 S3의 구체화된 구조도이다. 이하에서는 도 5 및 도 6을 통하여 본 발명의 시스템이 후보물질에 대하여 약물 위험도 및 부작용을 예측하여 예측정보를 생성하고 이를 제공하는 방법에 대하여 설명한다.
먼저, 상기 후보물질 데이터베이스(100)에 포함되어 저장되어 있는, 하나 이상의 후보물질을 선택하여 평가의 요청을 하는 후보물질 평가요청단계(S1)가 실시된다.
상기 단계(S1)에서, 상기 후보물질 데이터베이스(100)에 포함되어 있는 하나 이상의 후보물질을 선택하는 것은 상기 관리자(P)가 선택하거나, 또는 별도의 구성을 통하여 진행할 수 있다.
또한 상기 단계(S1)에서 선택된 후보물질에 대하여, 대상이 되는 질환은 상기 질환정보 데이터베이스(130)에 포함되어 저장되어 있는 질환정보 전체를 대상으로 하거나, 또는 상기 질환정보 데이터베이스(130)에 포함되어 저장되어 있는 어느 하나 이상의 선택된 질환일 수 있다. 이러한 질환의 선택 또한 상기 관리자(P)가 선택하거나, 또는 별도의 구성을 통하여 진행할 수 있다.
상기 단계(S1)에 따라 하나 이상의 후보물질에 대하여 평가요청이 이루어지면, 상기 예측/학습부(170)를 통해 해당 후보물질에 대하여 대상 질환에 대한 유효정도 및 부작용을 예측하는 후보물질 위험도 및 부작용 예측단계(S2)가 실시된다.
그리고 상기 단계(S2)를 통해 생성된 해당 후보물질에 대한 약물의 위험도 및 부작용에 대하여 점수화하여 후보물질 약물 점수를 산출하는 개인별 약물 점수 산출단계(S3)가 실시된다.
상기 단계(S3)가 완료된 후, 해당 후보물질의 후보물질 예측정보(1014)를 갱신하는 후보물질 예측정보 갱신단계(S4)가 실시된다.
상기 후보물질 예측정보 갱신단계(S4)에서의 갱신 후, 관리자(P) 자신의 단말기(20) 등을 통하여 상기 단계(S4)가 수행되어 해당 후보물질에 대한 예측정보가 갱신되었음을 알리는 알림 신호 등을 송신받을 수 있다.
그리고 상기 단계(S4) 이후, 상기 갱신된 후보물질 예측정보(1014)의 저장된 내용 정보가 얼마나 정확하였는지 평가할 수 있고, 이러한 평가에 따라 상기 스크리닝 모델(171)이 얼마나 정확하게 실제에 가깝게 예측하였는지를 비교할 수 있다. 그리고 이를 토대로 정확도를 보다 높이기 위하여 상기 스크리닝 모델(171)의 변수를 조정함으로서 보다 정확도를 높일 수 있도록 최적화시킬 수 있다.
따라서, 상기 단계(S5) 이후, 상기 스크리닝 모델(171)의 변수를 조정화여 최적화시키는 모델 평가 및 최적화 단계(S5)가 실시될 수 있다.
상기 단계(S2~S3)에 대하여 도 6을 통해 더 상세히 설명하자면, 상술한 바와 같이, 상기 단계(S2, S3)는 상기 예측/학습부(170)를 통해 수행된다. 이때 상술한 바와 같이, 상기 예측/학습부(170)는 상기한 해당 후보물질이 인체 및 질환에 대한 유효수준 및 부작용의 위험성, 약물로서의 사용 적합성에 대한 위험을 예측할 수 있으며, 기계학습을 통하여 반복적으로 변수를 최적화할 수 있는 스크리닝 모델(171)이 포함되어 상기의 단계(171)를 수행한다.
이때 상기 스크리닝 모델(171)은, 상기 단계(S2)를 수행할 수 있는 기능, 즉 해당 후보물질이 인체 및 질환에 대한 유효수준, 부작용 위험성, 약물로서의 사용 적합성에 대하여 예측할 수 있는 부작용 예측 기능과 더불어, 상기 단계(S3)를 수행할 수 있는, 상기 예측된 내용을 등급 및 점수화할 수 있는 기능을 포함해야 한다.
따라서 상기 스크리닝 모델(171)은 상기한 둘 이상의 기능을 포함하거나, 아니면 추가적으로 후자의 기능을 수행할 점수화 모델(172)이 상기 예측/학습부(170)에 더 포함되어, 상기 단계(S3)를 수행할 수 있다. 이하에서는 도 6을 통하여, 상기 스크리닝 모델(171)과 점수화 모델(172)이 구분되어 있는 것을 일예시로 하여 설명하기로 한다.
상술한 바와 같이, 상기 스크리닝 모델(171) 및 점수화 모델(172)은 상기 단계(S2, S3)를 수행하기 위한 데이터셋으로서 해당 후보물질의 개별 데이터베이스(101) 중 물질 구성정보(1012) 및 물질 특성정보(1013)와, 약물정보 데이터베이스(110) 전체 내용, 유전정보 데이터베이스(120) 전체 내용, 질환정보 데이터베이스(130) 전체 내용, 유전정보-약물반응 데이터베이스(140) 전체 내용, 그리고 약물-약물반응 데이터베이스(150) 전체 내용을 사용하는 것이 바람직하다.
상기 데이터셋을 바탕으로, 해당 사용자에 대하여 상기 스크리닝 모델(171)을 통하여 해당되는 하나 이상의 후보물질에 대하여 선택된 하나 이상의 질환에 대하여 질환에 대한 유효정보, 부작용의 위험성, 약물로서의 사용 적합성에 대하여 평가하는 상기 단계(S2)가 수행된다.
상기 단계(S2)가 수행됨으로서 후보물질 예측 데이터(D1)가 생성되는데, 상기 후보물질 예측 데이터(D1)는 해당 후보물질에 대한 정보를 포함하는 후보물질 정보(D11), 상기 스크리닝 모델(171)에 의해 평가된, 해당 질환에 대한 유효정도, 인체에 대한 위험성 및 부작용 정도를 포함하는 질환대비 평가정보(D12), 그리고 해당 질환에 대하여 같이 사용될 수 있는 다른 약물과의 반응정도 및 위험성 여부 등의 정보를 포함하는 약물대비 평가정보(D13)를 포함한다.
상기 후보물질 예측 데이터(D1)가 만들어진 상태에서, 상기 데이터(D1)를 이용하여 상기 점수화 모델(172)은 상기 후보물질 예측 데이터(D1)에 후보물질 점수정보(D14)를 추가한다.
여기서 상기 후보물질 점수정보(D14)는, 상기 질환대비 평가정보(D12) 및 약물대비 평가정보(D13)에 대하여 각각 점수화한 것이다.
따라서, 상기 예측정보 데이터(1015)에 저장되는 상기 후보물질 예측 데이터(D1)는, 상기 후보물질 정보(D11), 질환대비 평가정보(D12), 약물대비 평가정보(D13) 및 후보물질 점수정보(D14)를 포함한다.
도 7a 및 7b는 상기 후보물질 예측 데이터(D1)의 구체적인 구성요소에 대한 구조도이다. 이하에서는 도 7a 및 도 7b를 통해 상기 후보물질 예측 데이터(D1)의 구성에 대하여 구체적으로 설명한다.
도 7a는 상기 단계(S2)의 수행에 따라 후보물질 예측 데이터(D1)가 생성된 형태이다. 상기한 바와 같이, 상기 후보물질 예측 데이터(D1)는 해당 후보물질에 대한 정보인 후보물질 정보(D11)를 포함하는데, 이는 해당 후보물질의 개별 데이터베이스(101)에 포함된 ID(1011), 구성정보(1012) 및 특성정보(1013)를 포함하는 것이 바람직하다.
그리고 상기 질환대비 평가정보(D12)는 해당 후보물질이 상기 단계(S1)에서 선택된 하나 이상의 질환에 대한 정성평가 데이터를 하나 이상 포함한다.
이때 상기 정성평가 데이터는, 해당 질환에 대한 유효정도, 해당 질환 관련 인체에 대한 부작용 위험정도를 포함하는 것이 바람직하며, 이를 통하여 적합성 여부를 판별할 수 있다.
그리고 상기 약물대비 평가정보(D13)는 해당 질환에 대하여 동시투여될 수 있는 하나 이상의 약물에 대하여, 해당 후보물질과 약물간 상관관계에 대한 정성평가 데이터와, 해당 약물에서 해당 후보물질과 관련이 있는 유효성분에 다현 유효성분 데이터를 포함하는 것이 바람직하다.
여기서 상기 약물대비 평가정보(D13)는, 해당 후보물질이 해당 질환에 대하여 동시투여되는 약물이 없을 경우 생략될 수 있다.
도 7b는, 상기 단계(S3)의 실행에 따라 상기 후보물질 점수정보(D14)가 추가된 형태이다.
도 7b에 도시된 바와 같이, 상기 후보물질 점수정보(D14)는 질환대비 점수정보(D141)와, 약물대비 점수정보(D142)를 포함할 수 있다.
상기 질환대비 점수정보(D141)는 해당 후보물질이 해당 질환에 대하여 생성된 정성평가 데이터에 대하여 반응등급 및 반응수준, 반응점수를 측정하여 평가한 것으로서, 상기 반응등급은 최소 2단계로 나눌 수 있는데 예를 들어 도 7b에 도시된 바와 같이 긍정적(POS; 유효, 약효가 있는 반응) 내지는 부정적(NEG; 무효, 약효가 없는 반응)을 포함할 수 있다.
그리고 상기 반응수준은, 상기 반응등급에 따른 효과 방향의 강도를 나타낸 것으로서, 최소 2단계(높음(H)/낮음(L))로 나뉘는 등급을 포함할 수 있다.
그리고 상기 반응점수는, 상기 반응등급에 따른 효과 방향의 강도를 100점을 기준 점수로 하여 평가한 것으로, 상기 반응수준과 연동될 수 있다. 물론 상기 기준 점수는 사용자가 변경할 수 있으며, 점수의 계산 방식 또한 사용자가 정할 수 있다.
예를 들어, 도 7b에 도시된 바와 같이, 100점을 만점으로 하여, 점수가 높으면 해당 후보물질이 판정된 등급에 대하여 강한 수준의 효과를 보인다는 것이고, 점수가 낮으면 해당 후보물질이 판정된 등급에 대하여 적은 수준의 효과를 보인다는 것을 표시할 수 있다.
그리고 상기 약물대비 점수정보(D142)는 해당 후보물질과 질환에 대하여 동시투여되거나, 또는 같이 사용될 수 있는 가능성이 있는 약물에 대하여 상호간의 반응등급 및 반응수준, 상호작용점수를 측정한 것으로서, 상기 반응등급은 최소 3개 등급으로 나뉠 수 있다. 예를 들어, 상기와 같이 둘 이상의 약물 내지는 약물군이 인체내에 동시 내지는 일정 시차를 두고 투여되었을 때 상호간에 효과를 증가시키는 'Synergic(SYN)', 반응을 서로 경감시키는 'Antagonist(ANT)', 그리고 서로간에 반응하여 인체 내에서 독성이 나타나게 되는 'Toxicity(TOX)' 의 세 가지 분류를 사용할 수 있다. 따라서 약물대비 점수정보(D142)의 반응등급은 상기 세 효과 중 어느 하나가 발현될 지 예상되는 효과 정보가 포함될 수 있다.
그리고 상기 약물대비 점수정보(D142)에서 반응수준은 상기 반응등급 정보에 표시된 효과가 어느 정도의 강도로 나타나는지를 구분하여 표시한 효과 정보가 포함된다.
상기와 같은 강도는 적어도 2단계 이상으로 구분할 수 있는데, 예를 들어 3단계로 구분하여, 높은 수준인 'High(H)', 중간 수준인 'Moderate(M)' 및 약한 수준인 'Low(L)' 의 세 단계로 구분하여, 상기 세 단계 중 예상되는 어느 하나가 상기 반응수준에 포함될 수 있다.
그리고 상기 상호작용점수는 상기 약물간 반응등급에 표시된 효과가 어느 정도의 강도로 나타내는지 수치화한 정보로서, 상기 반응수준과 연동될 수도 있다.
예를 들어, 도 7b에 도시된 바와 같이, 100점을 만점으로 하여, 점수가 높으면 해당 유효성분이 해당 사용자에게 적합하게 유효한 작용을 할 수 있고, 점수가 낮으면 해당 사용자에게 적합하지 않는다는 것을 표시할 수 있다.
도 8은 본 발명의 예측/학습부(170)에서, 모델(171, 172)의 최적화 과정(단계 S5)을 도시한 구조도이다. 이하에서는, 도 7을 통하여 상기 모델(171, 172)의 최적화 과정에 대하여 설명한다.
상술한 바와 같이, 본 발명의 예측/학습부(170)는 기계학습에 의하여 반복 최적화되는 하나 이상의 모델(171, 172)을 포함한다. 상기 하나 이상의 모델(171, 172)은 상술한 바와 같이 상기 단계(S2~S3)를 수행할 수 있는 기능을 포함하며, 또한 다양한 종래의 알려진 기계학습적 방법, 예를 들어 지도학습, 비지도 학습, 반지도 학습, 강화학습 등의 방식을 사용하거나 또는 전혀 새로운 학습방식을 사용한 모델일 수도 있다.
또한 사용되는 알고리즘 역시 종래의 알려진 경사하강법, 단층 인공신경망 기법, 다층 인공신경망(딥러닝 네트워크) 기법 등 여러 기법을 사용할 수 있다. 이러한 상기 모델(171, 172)의 구체적인 동작 방식 및 구성은 그 자세한 설명을 생략하기로 하며, 여기서는 상기 모델(171, 172)이 서버 내 데이터베이스를 이용하여 변수를 수정하여 최적화하는 단계(S5)에 대하여 설명한다.
상술한 바와 같이, 본 발명의 예측/학습부(170)는 상기 모델(171, 172)을 이용하여 해당 후보물질에 대하여 질환에 대한 유효성 및 부작용 여부 등을 예측할 수 있는 단계(S2)와, 상기 유효성 및 부작용을 맞춰진 등급 및 점수화할 수 있는 단계(S3)를 수행한다.
이에 따라 상기 후보물질 예측 데이터(D1)가 만들어지고, 이는 해당 후보물질의 예측정보 데이터(1014)에 구분되어 저장된다.
한편, 해당 후보물질의 예측정보 데이터(1014)와는 별개로, 후보물질이 실제로 임상실험 및 시판 후 실제 인체에 대한 투여가 진행된 후의 실제적인 약효수준 및 부작용 유무, 부작용 정도에 대한 데이터가 도출될 수 있다. 이러한 실제적 데이터는 관리자의 단말기(P)를 통해 관리자가 입력되거나, 아니면 상기 봇 프로그램(161) 등에 의하여 공중의 전기통신망(I)에서 해당 후보물질의 실제적 데이터를 가져와 저장할 수도 있다.
그렇게 되면, 상기 데이터(D1)가 해당 후보물질에 대하여 객관적으로 약효수준 및 부작용 정도와 비교하여 볼 때 얼마나 정확한 지 그 정확도를 알아볼 수 있다. 따라서, 상기 데이터(D1)가 생성되어 상기 후보물질 예측정보(1014)에 구분 저장되고, 상기 약물정보 데이터베이스(110)에 해당 후보물질이 포함된 개별 약물정보 데이터베이스가 생성된다면, 상기 예측/학습부(170)는 상기 데이터(D1)와 해당 후보물질이 포함된 개별 약물정보 데이터베이스 내 가장 최신의 데이터를 비교하는 데이터간 비교단계(S51)를 실시한다.
상기 단계(S51)가 실시된 후, 상기 해당 후보물질이 포함된 개별 약물정보 데이터베이스의 가장 최신의 데이터 대비 상기 데이터(D1)가 얼마나 정확하였는지 계산하는 정확도 계산 단계(S52)가 실시된다.
그리고 상기 단계(S52) 결과에 따라, 상기 하나 이상의 모델(171, 172)의 변수를 조정하는 상관관계 모델 변수조정 단계(S53)를 실시한다.
여기서 상기 모델(171, 172)은 변수 조정시의 강도 및 임계값(threshold) 등은 모두 서비스 제공자가 미리 입력한 상기 모델(171, 172)의 규칙 및 정책에 따르면 된다.
상기 단계(S53)를 실시함으로서 상기 모델(171, 172)이 보다 실제 사용자 약물 또는 약물군 섭취 시 발생하는 위험성 및 부작용 정도에 근접하게 변화할 수 있고, 이러한 절차가 다수 진행됨으로서 상기 모델(171, 172)이 실제 사용자가 약물 또는 약물군을 섭취하였을 때의 위험성 및 부작용 정도를 정밀하게 예측할 수 있게 최적화될 수 있다.
10 : 서버. 100 : 후보물질 데이터베이스.
1011 : 물질 ID. 1012 : 물질 구성정보.
1013 : 물질 특성정보. 1014 : 물질 예측정보.
110 : 약물정보 데이터베이스. 1011 : 약물 ID.
1112 : 약물 일반정보. 1113 : 유효성분 정보.
1114 : 성분 특성정보. 120 : 유전정보 데이터베이스.
1211 : 유전정보 ID. 1212 : 일반 유전정보.
1213 : 변이형태 정보. 1214 : 변이영향 정보.
130 : 질환정보 데이터베이스. 1311 : 질환정보 ID.
1312 : 질환내용 정보. 1313 : 관여유전자 목록.
1314 : 질환 식별정보. 1315 : 치료약물 정보.
140 : 유전-약물반응 데이터베이스. 1411 : 관여 유전정보 ID목록.
1412 : 관여 약물정보 ID목록. 1413 : 연관 질환정보 ID목록.
1414 : 유전정보-약물 상관관계정보. 150 : 약물-약물반응 데이터베이스.
1511 : 관여 약물정보 ID목록. 1512 : 연관 질환정보 ID목록.
1513 : 약물간 상관관계정보. 160 : 관리부.
161 : 봇 프로그램. 170 : 예측/학습부.
171 : 스크리닝 모델. 172 : 점수화 모델.

Claims (17)

  1. 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템으로서,
    서비스 제공자의 서버를 포함하고, 상기 서버는
    하나 이상의 후보물질의 데이터를 포함하는 사용자 데이터베이스;
    알려져 있는 약물의 정보가 하나 이상 포함되어 저장되어 있는 약물정보 데이터베이스;
    알려져 있는 유전정보가 하나 이상 포함되어 저장되어 있는 유전정보 데이터베이스;
    알려져 있는 질환정보가 하나 이상 포함되어 저장되어 있는 질환정보 데이터베이스;
    알려져 있는 약물과 유전정보에 대한 유전정보-약물간 상관관계정보가 하나 이상 포함되어 있는 유전-약물반응 데이터베이스;
    알려져 있는 둘 이상의 약물간 상관관계정보가 하나 이상 포함되어 있는 약물-약물반응 데이터베이스;
    하나 이상의 운영 프로그램을 포함하는 관리부;
    그리고 기계학습 알고리즘 내지는 모델이 적용되어 있는 스크리닝 모델을 포함하며, 상기 한명 이상의 사용자 각각에 대한 약물 위험도 및 부작용을 예측하고 개인별 약물 점수를 산출하는 예측/학습부를 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  2. 제 1항에 있어서,
    상기 시스템은 상기 서버로부터 제공받은 정보를 전송받아 가시적으로 확인할 수 있는 하나 이상의 단말기를 더 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  3. 제 1항에 있어서,
    상기 후보물질 데이터베이스는 하나 이상의 개별 후보물질 데이터베이스를 포함하고, 상기 하나 이상의 개별 후보물질 데이터베이스는 각각
    해당 후보물질에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 물질 ID;
    해당 후보물질의 구성정보가 하나 이상 포함되어 저장되는 물질 구성정보;
    해당 후보물질의 특성정보가 하나 이상 포함되어 저장되는 물질 특성정보;
    그리고 상기 예측/학습부에 의하여 예측된 데이터가 하나 이상 포함되어 저장되는 물질 예측정보를 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  4. 제 1항에 있어서,
    상기 약물정보 데이터베이스는 하나 이상의 개별 약물정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 약물정보 데이터베이스는 각각
    해당 약물에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 약물 ID;
    해당 약물의 일반적인 정보 데이터가 하나 이상 포함되어 저장되는 약물 일반정보;
    해당 약물의 유효성분이 하나 이상 포함되어 저장되는 약물 유효성분정보;
    그리고 상기 약물 유효성분정보 내 각각의 유효성분에 대한 특성정보를 하나 이상 포함하고 있는 성분 특성정보를 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  5. 제 1항에 있어서,
    상기 유전정보 데이터베이스는 하나 이상의 개별 유전정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 유전정보 데이터베이스는 각각
    해당 유전정보에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 유전정보 ID;
    해당 유전정보와 관련된 유전정보가 하나 이상 포함되어 저장되는 일반 유전정보;
    상기 일반 유전정보 내 유전정보 각각에 대한 변이정보가 하나 이상 포함되어 저장되는 변이형태 정보;
    그리고 상기 변이형태 정보 내 저장된 각각의 변이정보에 대하여 알려진 인체에 대한 신체적 또는 정신적 변화 특징, 발생할 수 있는 질환이 하나 이상 포함되는 변이영향 정보를 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  6. 제 1항에 있어서,
    상기 질환정보 데이터베이스는 하나 이상의 개별 질환정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 질환정보 데이터베이스는 각각
    해당 질환정보에 대하여 고유하게 부여된 ID 또는 고유번호를 포함하는 질환정보 ID;
    해당 질환에 대하여 잘 알려진 정보가 하나 이상 포함되어 저장되는 질환내용 정보;
    해당 질환에 대하여 관여하는 유전자 또는 유전체, 유전자 변이내용 중 어느 하나 이상 포함되어 있는 관여유전자 목록;
    해당 질환을 외부에서 식별할 수 있는 식별자 정보가 하나 이상 포함되어 있는 질환 식별정보;
    그리고 하나 이상의 약물정보가 포함되어 있는 치료약물 정보를 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  7. 제 1항에 있어서,
    상기 유전-약물반응 데이터베이스는 하나 이상의 개별 유전정보-약물반응 데이터베이스를 포함하고, 상기 하나 이상의 개별 유전정보-약물반응 데이터베이스는 각각
    해당 유전정보에 따른 약물반응에 있어서 관여하는 유전정보의 ID 또는 고유번호가 하나 이상 포함되어 저장되는 관여 유전정보 ID목록;
    해당 유전정보에 따른 약물반응에 있어서 관여하는 약물의 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되어 저장되는 관여 약물정보 ID목록;
    해당 유전정보에 따른 약물반응에 있어서 연관되어 있는 질환의 고유하게 부여된 ID 또는 고유번호가 하나 이상 포함되어 저장되는 연관 질환정보 ID목록;
    그리고 해당 유전정보에 따른 약물반응의 기전, 임상반응, 투여결과 중 어느 하나 이상 포함되어 저장되는 유전정보-약물간 상관관계정보를 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  8. 제 1항에 있어서,
    상기 약물-약물반응 데이터베이스는 하나 이상의 개별 약물간 반응정보 데이터베이스를 포함하고, 상기 하나 이상의 개별 약물간 반응정보 데이터베이스는 각각
    해당 약물 상호간 반응에 있어서 관여하는 약물의 ID 또는 고유번호를 둘 이상 포함하고 있는 관여 약물정보 ID 목록;
    해당 약물 상호간 반응에 있어서 관여하는 질환의 ID 또는 고유번호를 하나 이상 포함하고 있는 연관 질환정보 ID목록;
    그리고 해당 약물 상호간 반응의 기전, 임상반응, 투여 결과가 하나 이상 포함되어 있는 약물간 상관 데이터를 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  9. 제 1항에 있어서,
    상기 관리부는 외부 공중의 전기통신망에서 상기 데이터베이스 내 포함될 수 있는 정보 및 데이터 중 어느 하나 이상을 참조하여 저장시킬 수 있는 봇 프로그램을 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  10. 제 1항에 있어서,
    상기 예측/학습부는 기계학습 알고리즘 내지는 모델이 적용되어 있는 점수화 모델을 더 포함하는 것을 특징으로 하는, 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템.
  11. 제 1항 내지 10항의 개인 유전체정보 기반 후보물질 약물효능 및 부작용 예측 시스템을 통한 후보물질의 효능예측 및 적합성 판단방법으로서,
    하나 이상의 후보물질과 하나 이상의 대상 질환을 선택하여 평가의 요청을 하는 후보물질 평가요청단계(S1);
    상기 예측/학습부가 상기 단계(S1)를 통해 선택된 하나 이상의 후보물질에 대하여 선택된 하나 이상의 대상 질환에 대해 유효정도 및 부작용을 예측하는 후보물질 위험도 및 부작용 예측단계(S2);
    상기 단계(S2)를 통해 생성된 해당 후보물질에 대한 약물의 위험도 및 부작용에 대하여 점수화하여 후보물질 약물 점수를 산출하는 개인별 약물 점수 산출단계(S3);
    상기 단계(S3) 후, 해당 후보물질의 후보물질 예측정보를 갱신하는 후보물질 예측정보 갱신단계(S4);
    상기 단계(S4) 후, 상기 후보물질 예측정보 내 데이터에 대하여 평가하는 모델 평가 및 최적화 단계(S5)를 포함하는 것을 특징으로 하는, 후보물질의 효능예측 및 적합성 판단방법.
  12. 제 11항에 있어서,
    상기 단계(S2, S3)을 실시하기 위하여, 상기 스크리닝 모델은 해당 후보물질의 개별 데이터베이스 중 물질 구성정보 및 물질 특성정보와, 약물정보 데이터베이스, 유전정보 데이터베이스, 질환정보 데이터베이스, 유전정보-약물반응 데이터베이스, 그리고 약물-약물반응 데이터베이스를 사용 데이터셋에 포함시켜 사용하는 것을 특징으로 하는, 후보물질의 효능예측 및 적합성 판단방법.
  13. 제 11항에 있어서,
    상기 단계(S2)를 통해 후보물질 예측 데이터(D1)가 생성되고, 상기 후보물질 예측 데이터(D1)는 후보물질 정보(D11), 질환대비 평가정보(D12), 그리고 약물대비 평가정보(D13)를 포함하는 것을 특징으로 하는, 후보물질의 효능예측 및 적합성 판단방법.
  14. 제 13항에 있어서,
    상기 후보물질 예측 데이터(D1)는, 상기 단계(S3)가 실행되면서 생성되는 후보물질 점수정보(D14)가 더 포함되는 것을 특징으로 하는, 후보물질의 효능예측 및 적합성 판단방법.
  15. 제 14항에 있어서,
    상기 후보물질 점수정보(D14)는 질환대비 점수정보(D141), 그리고 약물대비 점수정보(D142)를 포함하는 것을 특징으로 하는, 후보물질의 효능예측 및 적합성 판단방법.
  16. 제 15항에 있어서,
    상기 약물대비 점수정보(D142)는 약물 상호간 반응등급, 반응수준 및 상호작용점수를 포함하고, 상기 반응등급은 상호간에 효과를 증가시키는 'Synergic', 반응을 서로 경감시키는 'Antagonist', 그리고 서로간에 반응하여 인체 내에서 독성이 나타나게 되는 'Toxicity' 의 세 가지 분류를 포함하는 것을 특징으로 하는, 후보물질의 효능예측 및 적합성 판단방법.
  17. 제 11항에 있어서,
    상기 단계(S6)는 상기 데이터(D1)와 해당 후보물질이 포함된 개별 약물정보 데이터베이스 내 가장 최신의 데이터를 비교하는 데이터간 비교단계(S61);
    상기 단계(S61) 후, 정확도를 계산하는 정확도 계산 단계(S62);
    그리고 상기 단계(S62) 상기 예측/학습부 내 하나 이상의 모델의 변수를 조정하는 상관관계 모델 변수조정 단계(S63)를 포함하는 것을 특징으로 하는, 후보물질의 효능예측 및 적합성 판단방법.
KR1020220026805A 2022-03-02 2022-03-02 개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법 KR20230129775A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220026805A KR20230129775A (ko) 2022-03-02 2022-03-02 개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220026805A KR20230129775A (ko) 2022-03-02 2022-03-02 개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법

Publications (1)

Publication Number Publication Date
KR20230129775A true KR20230129775A (ko) 2023-09-11

Family

ID=88020318

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220026805A KR20230129775A (ko) 2022-03-02 2022-03-02 개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법

Country Status (1)

Country Link
KR (1) KR20230129775A (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150018354A (ko) 2013-08-08 2015-02-23 주식회사 토리기술 석유아스팔트와 천연아스팔트 합성 바인더를 이용한 카페트 포장 보수공법
KR20180076717A (ko) 2016-12-28 2018-07-06 (주) 에스이엔텍 원전 구조물 표면 제염 장치
KR20200070504A (ko) 2018-12-07 2020-06-18 엘지전자 주식회사 냉장고 및 냉장고의 제어 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150018354A (ko) 2013-08-08 2015-02-23 주식회사 토리기술 석유아스팔트와 천연아스팔트 합성 바인더를 이용한 카페트 포장 보수공법
KR20180076717A (ko) 2016-12-28 2018-07-06 (주) 에스이엔텍 원전 구조물 표면 제염 장치
KR20200070504A (ko) 2018-12-07 2020-06-18 엘지전자 주식회사 냉장고 및 냉장고의 제어 방법

Similar Documents

Publication Publication Date Title
Uffelmann et al. Genome-wide association studies
Choobdar et al. Assessment of network module identification across complex diseases
Abdellaoui et al. Dissecting polygenic signals from genome-wide association studies on human behaviour
Weiner et al. Polygenic architecture of rare coding variation across 394,783 exomes
Uhl et al. The burden of complex genetics in brain disorders
Zickenrott et al. Prediction of disease–gene–drug relationships following a differential network analysis
Kumar et al. Computational SNP analysis: current approaches and future prospects
US11798651B2 (en) Molecular evidence platform for auditable, continuous optimization of variant interpretation in genetic and genomic testing and analysis
Charney The “Golden Age” of behavior genetics?
Wu et al. A powerful fine-mapping method for transcriptome-wide association studies
Zhou et al. Multi-ancestry study of the genetics of problematic alcohol use in over 1 million individuals
Sun et al. Translating polygenic risk scores for clinical use by estimating the confidence bounds of risk prediction
Derks et al. Ten challenges for clinical translation in psychiatric genetics
US20170357751A1 (en) Computer-implemented evaluaton of drug safety for a population
Zheutlin et al. Multivariate pattern analysis of genotype–phenotype relationships in schizophrenia
Aberg et al. Convergence of evidence from a methylome-wide CpG-SNP association study and GWAS of major depressive disorder
Wu et al. Retrospective association analysis of longitudinal binary traits identifies important loci and pathways in cocaine use
Hindley et al. The shared genetic basis of mood instability and psychiatric disorders: A cross‐trait genome‐wide association analysis
Hasseris et al. Polygenic risk and episode polarity among individuals with bipolar disorder
Alyousfi et al. Gene-specific metrics to facilitate identification of disease genes for molecular diagnosis in patient genomes: a systematic review
Busby et al. Ancestry-specific polygenic risk scores are risk enhancers for clinical cardiovascular disease assessments
Luo et al. Comprehensive allele genotyping in critical pharmacogenes reduces residual clinical risk in diverse populations
Haglund et al. Single-cell Mendelian randomisation identifies cell-type specific genetic effects on human brain disease and behaviour
KR20230129775A (ko) 개인 유전체정보 기반 후보물질의 약물효능 및 부작용 예측 시스템, 그리고 이를 통한 후보물질의 효능예측 및 적합성 판단방법
Zilocchi et al. A panoramic view of proteomics and multiomics in precision health