KR102473861B1 - 약물 효과 예측 snp 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법 - Google Patents

약물 효과 예측 snp 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법 Download PDF

Info

Publication number
KR102473861B1
KR102473861B1 KR1020220066854A KR20220066854A KR102473861B1 KR 102473861 B1 KR102473861 B1 KR 102473861B1 KR 1020220066854 A KR1020220066854 A KR 1020220066854A KR 20220066854 A KR20220066854 A KR 20220066854A KR 102473861 B1 KR102473861 B1 KR 102473861B1
Authority
KR
South Korea
Prior art keywords
gene
drug
target
snp
disease
Prior art date
Application number
KR1020220066854A
Other languages
English (en)
Inventor
김호
김정은
이솔
윤상혁
김두환
김정오
김은교
김나영
이지혜
고신영
이은별
이세규
Original Assignee
주식회사 바스젠바이오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 바스젠바이오 filed Critical 주식회사 바스젠바이오
Priority to KR1020220066854A priority Critical patent/KR102473861B1/ko
Application granted granted Critical
Publication of KR102473861B1 publication Critical patent/KR102473861B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Primary Health Care (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Computing Systems (AREA)
  • Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Zoology (AREA)
  • Databases & Information Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)

Abstract

본 발명은 실제 약물 임상을 수행하지 않고서 미리 인간에 대한 약물의 효과를 예측할 수 있는 약물 임상 시뮬레이션 기술에 대한 것으로 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 기반으로 생성된 개발 타겟 유전자 정보를 이용하여 약물 효과 예측 SNP를 선정하고, 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 딥러닝 기반 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 약물 효과 예측 SNP를 선정하여 복수의 약물 효과 예측 SNP를 대상으로 각각 각 유전자 별로 유전자 점수를 산출함으로써 질병 원인 현상(disease exposure)의 예상 추정 값을 예측하고, 상기 예상 추정 값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성하는 약물 임상 시뮬레이션 시스템에 대한 기술을 제공하고자 한다.

Description

약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법{Drug clinical trial simulation system using drug effect prediction SNP -based gene score and method therefor}
본 발명은 실제 약물 임상을 수행하지 않고서 미리 인간에 대한 약물의 효과를 예측할 수 있는 약물 임상 시뮬레이션 기술에 대한 것으로, 더욱 자세하게는 임상 실험의 대상이 될 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 기반으로 타겟 약물에 반응하는 질병 원인과 연관된 SNP를 약물 효과 예측 SNP로 선정하며, 각 복수의 약물 효과 예측 SNP의 유전자 점수를 산출함으로써 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법을 제공하는데 그 목적이 있다.
임상시험(Clincal Trial/Study) 이라 함은 임상시험용의약품의 안전성과 유효성을 증명할 목적으로 해당약물의 약동, 약력, 약리, 임상적 효과를 확인하고 이상반응을 조사하기 위하여 사람을 대상으로 실시하는 시험 또는 연구를 의미한다.
임상시험의 종류에는 임상시험 목적에 따른 분류로 임상 약리시험, 치료적 탐색 임상시험, 치료적 확정 임상시험, 치료적 사용 임상시험이 있고 임상시험 실시시간에 따른 부류로 제1상 임상시험, 제2상 임상시험, 제3상 임상시험, 제4상 임상시험이 있으며, 이렇게 단계적으로 임상시험을 수행하는 이유는 시험 대상 약물의 효과가 명료하지 아니한 상황에서 직접 사람에게 투약하여 시험을 수행하여야 하므로 그 안정성을 위해 많은 단계와 긴 시간을 소요하며 수행되어 오고 있다.
그러나 이러한 임상 시험은 많은 단계를 거치며 긴 시간을 소요되므로 실제 임상 시험에 들어가기 전 시험 대상 약물의 효과를 예측하는 부분이 매우 중요하며, 예측 결과의 정확도가 높지 않은 경우 임상 시험을 다시 처음부터 수행해야하는 어려움이 존재하는 바, 다양한 방법을 통한 시험 대상 약물의 효과의 예측에 대한 기술적 관심도가 점차 증가하고 있다.
본 발명을 통해 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 기반으로 생성된 개발 타겟 유전자 정보를 이용하여 약물 효과 예측 SNP를 선정하고, 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 딥러닝 기반 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 약물 효과 예측 SNP를 선정하여 복수의 약물 효과 예측 SNP를 대상으로 각각 각 유전자 별로 유전자 점수를 산출함으로써 질병 원인 현상(disease exposure)의 예상 추정 값을 예측하고, 상기 예상 추정 값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성하는 약물 임상 시뮬레이션 시스템에 대한 기술을 제공하고자 한다.
본 발명의 실시예에 따르면 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템은 사용자로부터 임상 실험의 대상이 될 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 입력 받는 임상 설계 정보 입력부; 적어도 하나의 데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자 정보를 수신하고, 상기 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득하며, 상기 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자 정보 생성부; 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 딥러닝 기반 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 분석을 수행하고, 분석 결과에 따라 상기 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정하는 약물 효과 예측 SNP 선정부; 상기 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, 상기 SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출하는 유전자 점수 산출부; 및 상기 유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 상기 질병 원인 현상(disease exposure)의 예상 추정값을 예측하고, 상기 예상 추정값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성하는 약물 효과 시뮬레이션 수행부를 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 개발 타겟 유전자 정보 생성부는, 데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 각 유전자 별 기능 정보 및 관련 기전 정보를 수신하는 연관 유전자 정보 수신부; 상기 유전자 정보에 포함된 각 유전자 별로 적어도 하나의 데이터 베이스로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 유전자-질환 연관 점수를 산출하거나 상기 데이터 베이스로부터 유전자-질환 연관 점수를 수신하는 유전자-질환 연관 점수 획득부; 및 상기 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정하고, 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자로 선정하는 개발 타겟 유전자 선정부를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수 획득부는, 유전자 검색을 복수의 이종 데이터 베이스를 대상으로 수행하고 상기 복수의 이종 데이터 베이스를 미리 설정한 기준에 따라 그룹핑하여 복수의 이종 데이터 베이스 그룹으로 생성하며, 상기 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 산출된 값을 합산하여 유전자-질환 연관 점수를 산출하는 유전자-질환 연관 점수 산출부를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수 산출부는, 복수의 데이터 베이스를 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹으로 그룹핑하여 4개의 이종 데이터 베이스 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수 산출부는, 상기 유전자 정보에 포함된 각 유전자 별로 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹을 대상으로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고, 상기 검색 횟수 결과에 미리 설정된 각 데이터 베이스 별 가중치를 적용하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수 산출부는, 상기 유전자 정보에 포함된 각 유전자 별로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고, 선별 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건이면 0.3, 두 건이면 0.5, 두 건 초과이면 0.6으로 선별 가중치 점수를 산정하고, 추론 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.1로 추론 가중치 점수를 산정하고, 동물 모델 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.2로 동물 모델 가중치 점수를 산정하고, 문헌 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 9건 미만이면 0.01, 9건 초과면 0.1로 문헌 가중치 점수를 산정하고, 상기 유전자-질환 연관 점수는 선별 가중치 점수, 추론 가중치 점수, 동물 모델 가중치 점수, 문헌 가중치 점수를 합산하여 산출할 수 있으며, 상기 유전자-질환 연관 점수는 0과 1사이의 범위에 포함될 수 있다.
본 발명의 일 실시예에 따르면 상기 개발 타겟 유전자 정보 생성부는, 데이터 베이스로부터 상기 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자를 개발 타겟 유전자로 더 포함시켜 선정하는 것을 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 예측 SNP 선정부는, 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0 내지 500,000base 사이에 존재하는 SNP를 대상으로 타겟 질병에 원인이 되는 적어도 하나의 항목을 종속변수로 하는 GWAS 분석을 수행하여 SNP 별 P 값과 베타 값을 산출하고, 상기 GWAS 분석을 통해 도출된 P값을 기준으로 미리 설정된 기준 값을 만족하는 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 GWAS 분석 선정부를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 예측 SNP 선정부는, 데이터 베이스로 부터 상기 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 질병 원인 연관 데이터(disease exposure association data), 유전자 점수를 이용하여 딥러닝 기반의 약물 효과 예측 SNP 선정 모델을 강화 학습하고, 상기 약물 효과 예측 SNP 선정 모델에 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 복수의 SNP를 입력하여 약물 효과 예측 SNP를 선정하는 강화 학습 분석 선정부를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 예측 SNP 선정부는, 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 SNP를 대상으로 SNP를 독립변수, 질병 원인 현상(disease exposure)을 종속변수로 하여 학습된 머신러닝 기반의 예측 모델을 적용하여 각 SNP 별 중요도 점수를 산출하고, 산출된 SNP 별 중요도 점수가 미리 설정된 기준 값 이상인 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 머신러닝 분석 선정부를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자 점수 산출부는, 상기 약물 효과 예측 SNP에 포함된 각 SNP 별로 베타 값(β n )과 원인 대립 유전자(exposure allele)의 수(Xn )를 곱하여 SNP 별 점수를 산출하고(β nXn ), 상기 약물 효과 예측 SNP에 포함된 각 SNP의 SNP 별 점수를 합하여 각 유전자 별로 유전자 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 시뮬레이션 수행부는, 개발 타겟 유전자 정보에 포함된 관련 기전 정보 기반으로 타겟 약물로 임상 실험을 진행하였을 때 발생이 예상되는 질병 원인 현상을 선정할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 시뮬레이션 수행부는, 상기 유전자 별 유전자 점수를 기준으로 상기 질병 원인 현상의 예상 추정 값을 산출하고, 상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 통해 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것으로 시뮬레이션을 수행할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 시뮬레이션 수행부는, 상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 수행하여 회귀선에서의 베타 값을 산출하고, 상기 베타 값에 지수 함수를 적용하여 타겟 질병 발생에 대한 교차비 값을 산출하여 상기 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 기준으로 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 시뮬레이션 수행부는, 타겟 질병에 대한 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 복합 약물 시뮬레이션부를 더 포함하고, 상기 복합 약물 시뮬레이션부는, 적어도 하나 이상의 타겟 약물의 타겟 질병에 대한 효과를 확인하기 위해 상기 적어도 하나 이상의 타겟 약물에 대하여 약물 별로 상기 복수의 유전자 별 유전자 점수의 중앙값을 기준으로 샘플을 분류하고, 상기 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 그룹핑하여 복수의 그룹을 생성하며, 각 그룹의 교차비를 산출하여 상기 적어도 하나 이상의 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 이용하여 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 시뮬레이션 수행부는, 상기 타겟 약물의 임상 효과를 시뮬레이션을 설계하기 위해 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 임상 재설계 그룹으로 선정하고, 상기 임상 재설계 그룹을 대상으로 시뮬레이션을 수행하는 임상 시뮬레이션 재설계부를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 시뮬레이션 수행부는, 상기 질병 원인 현상의 예상 추정 값에 회귀 분석을 수행하여 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성하는 임상 부가 정보 생성부를 더 포함할 수 있다.
본 발명의 실시예에 따르면 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법은 사용자로부터 임상 실험의 대상이 될 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 입력 받는 단계; 적어도 하나의 데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자 정보를 수신하고, 상기 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득하며, 상기 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 단계; 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 딥러닝 기반 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 분석을 수행하고, 분석 결과에 따라 상기 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정하는 단계; 상기 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, 상기 SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출하는 단계; 및 상기 유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 상기 질병 원인 현상(disease exposure)의 예상 추정값을 예측하고, 상기 예상 추정값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 개발 타겟 유전자 정보를 생성하는 단계는, 데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 각 유전자 별 기능 정보 및 관련 기전 정보를 수신하는 단계; 상기 유전자 정보에 포함된 각 유전자 별로 적어도 하나의 데이터 베이스로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 유전자-질환 연관 점수를 산출하거나 상기 데이터 베이스로부터 유전자-질환 연관 점수를 수신하여 유전자-질환 연관 점수를 획득하는 단계; 및 상기 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정하고, 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자로 선정하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수를 획득하는 단계는, 유전자 검색을 복수의 이종 데이터 베이스를 대상으로 수행하고 상기 복수의 이종 데이터 베이스를 미리 설정한 기준에 따라 그룹핑하여 복수의 이종 데이터 베이스 그룹으로 생성하며, 상기 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 산출된 값을 합산하여 유전자-질환 연관 점수를 산출하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수를 산출하는 단계는, 복수의 데이터 베이스를 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹으로 그룹핑하여 4개의 이종 데이터 베이스 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수를 산출하는 단계는, 상기 유전자 정보에 포함된 각 유전자 별로 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹을 대상으로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고, 상기 검색 횟수 결과에 미리 설정된 각 데이터 베이스 별 가중치를 적용하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자-질환 연관 점수를 산출하는 단계는, 상기 유전자 정보에 포함된 각 유전자 별로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고, 선별 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건이면 0.3, 두 건이면 0.5, 두 건 초과이면 0.6으로 선별 가중치 점수를 산정하고, 추론 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.1로 추론 가중치 점수를 산정하고, 동물 모델 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.2로 동물 모델 가중치 점수를 산정하고, 문헌 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 9건 미만이면 0.01, 9건 초과면 0.1로 문헌 가중치 점수를 산정하고, 상기 유전자-질환 연관 점수는 선별 가중치 점수, 추론 가중치 점수, 동물 모델 가중치 점수, 문헌 가중치 점수를 합산하여 산출할 수 있으며, 상기 유전자-질환 연관 점수는 0과 1사이의 범위에 포함될 수 있다.
본 발명의 일 실시예에 따르면 상기 개발 타겟 유전자 정보를 생성하는 단계는, 데이터 베이스로부터 상기 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자를 개발 타겟 유전자로 더 포함시켜 선정할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 예측 SNP로 선정하는 단계는,
상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0 내지 500,000base 사이에 존재하는 SNP를 대상으로 타겟 질병에 원인이 되는 적어도 하나의 항목을 종속변수로 하는 GWAS 분석을 수행하여 SNP 별 P 값과 베타 값을 산출하고, 상기 GWAS 분석을 통해 도출된 P값을 기준으로 미리 설정된 기준 값을 만족하는 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 예측 SNP로 선정하는 단계는, 데이터 베이스로 부터 상기 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 질병 원인 연관 데이터(disease exposure association data), 유전자 점수를 이용하여 딥러닝 기반의 약물 효과 예측 SNP 선정 모델을 강화 학습하고, 상기 약물 효과 예측 SNP 선정 모델에 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 복수의 SNP를 입력하여 약물 효과 예측 SNP를 선정하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 약물 효과 예측 SNP로 선정하는 단계는,
상기 개발 타겟 유전자 정보에 포함된 각 유전자의 SNP를 대상으로 SNP를 독립변수, 질병 원인 현상(disease exposure)을 종속변수로 하여 학습된 머신러닝 기반의 예측 모델을 적용하여 각 SNP 별 중요도 점수를 산출하고, 산출된 SNP 별 중요도 점수가 미리 설정된 기준 값 이상인 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 상기 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 단계는, 상기 약물 효과 예측 SNP에 포함된 각 SNP 별로 베타 값(β n )과 원인 대립 유전자(exposure allele)의 수(Xn )를 곱하여 SNP 별 점수를 산출하고(β nXn ), 상기 약물 효과 예측 SNP에 포함된 각 SNP의 SNP 별 점수를 합하여 각 유전자 별로 유전자 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 임상 실험 결과 정보를 생성하는 단계는,개발 타겟 유전자 정보에 포함된 관련 기전 정보 기반으로 타겟 약물로 임상 실험을 진행하였을 때 발생이 예상되는 질병 원인 현상을 선정할 수 있다.
본 발명의 일 실시예에 따르면 상기 임상 실험 결과 정보를 생성하는 단계는, 상기 유전자 별 유전자 점수를 기준으로 상기 질병 원인 현상의 예상 추정 값을 산출하고, 상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 통해 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것으로 시뮬레이션을 수행할 수 있다.
본 발명의 일 실시예에 따르면 상기 임상 실험 결과 정보를 생성하는 단계는, 상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 수행하여 회귀선에서의 베타 값을 산출하고, 상기 베타 값에 지수 함수를 적용하여 타겟 질병 발생에 대한 교차비 값을 산출하여 상기 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 기준으로 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 임상 실험 결과 정보를 생성하는 단계는,타겟 질병에 대한 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계를 더 포함하고, 상기 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계는, 적어도 하나 이상의 타겟 약물의 타겟 질병에 대한 효과를 확인하기 위해 상기 적어도 하나 이상의 타겟 약물에 대하여 약물 별로 상기 복수의 유전자 별 유전자 점수의 중앙값을 기준으로 샘플을 분류하고, 상기 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 그룹핑하여 복수의 그룹을 생성하며, 각 그룹의 교차비를 산출하여 상기 적어도 하나 이상의 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 이용하여 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계는, 상기 타겟 약물의 임상 효과를 시뮬레이션을 설계하기 위해 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 임상 재설계 그룹으로 선정하고, 상기 임상 재설계 그룹을 대상으로 시뮬레이션을 수행하는 임상 시뮬레이션 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계는, 상기 질병 원인 현상의 예상 추정 값에 회귀 분석을 수행하여 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성하는 임상 부가 정보 생성부를 더 포함할 수 있다.
본 발명의 실시예에 따라 구현된 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템을 통해 실제로 많은 단계의 임상 시험을 긴 시간 및 많은 비용들 들여 수행하지 아니하고도 타겟 질병에 작용하는 타겟 약물의 효과를 예측할 수 있으며, 이를 기반으로 더욱 실패 확률이 적은 임상 시험을 설계할 수 있는 효과가 존재한다.
도 1은 본 발명의 제1 실시예에 따라 구현된 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템의 구성도이다.
도 2는 도 1에 도시된 개발 타겟 유전자 정보 생성부의 세부 구성도이다.
도 3은 도 2에 도시된 유전자-질환 연관 점수 획득부의 세부 구성도이다.
도 4는 도 1에 도시된 약물 효과 예측 SNP 선정부의 세부 구성도이다.
도 5는 도 1에 도시된 약물 효과 시뮬레이션 수행부의 세부 구성도이다.
도 6은 본 발명의 일 실시예에 따라 생성된 개발 타겟 유전자 정보를 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 약물 임상 시뮬레이션 시스템이 약물 효과 예측 SNP를 선정한 이후 임상 실험 정보를 생성까지의 프로세스를 나타낸 도면이다.
도 8은 본 발명의 일 실시예에 따른 약물 효과 시뮬레이션 수행부가 타겟 질병에 대한 복수의 타겟 약물의 영향도를 산출하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션하는 것을 나타낸 도면이다.
도 9는 본 발명의 일 실시예에 따른 복합 약물 시뮬레이션부가 타겟 질병에 대한 복수의 타겟 약물의 영향도를 산출하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션하는 것을 나타낸 도면이다.
도 10은 본 발명의 일 실시예에 따라 산출된 타겟 질병에 대한 타겟 약물의 영향도를 나타낸 도면이다.
도 11은 본 발명의 일 실시예에 따른 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법의 흐름도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.
본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 발명에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한 도면들의 각 블록과 흐름도 도면들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있음을 이해할 수 있을 것이며, 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 흐름도 블록(들)에서 설명된 기능들을 수행하는 수단을 생성하게 된다.
이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 흐름도 블록(들)에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다.
컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 흐름도 블록(들)에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록은 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다.
그리고 몇 가지 대체 실시예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이 때, 본 실시예에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA(field-Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)과 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다.
그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다.
따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.
본 발명의 실시예들을 구체적으로 설명함에 있어서, 특정 시스템의 예를 주된 대상으로 할 것이지만, 본 명세서에서 청구하고자 하는 주요한 요지는 유사한 기술적 배경을 가지는 여타의 통신 시스템 및 서비스에도 본 명세서에 개시된 범위를 크게 벗어나지 아니하는 범위에서 적용 가능하며, 이는 당해 기술분야에서 숙련된 기술적 지식을 가진 자의 판단으로 가능할 것이다.
이하, 도면을 참조하여 본 발명의 실시 예에 따른 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법에 대하여 설명한다.
도 1은 본 발명의 제1 실시예에 따라 구현된 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템의 구성도이다.
도 1을 참조하면 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템(1000)은 임상 설계 정보 입력부(100), 개발 타겟 유전자 정보 생성부(200), 약물 효과 예측 SNP 선정부(300), 유전자 점수 산출부(400), 약물 효과 시뮬레이션 수행부(500)를 포함할 수 있다.
임상 설계 정보 입력부(100)는 사용자로부터 임상 실험의 대상이 될 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 입력 받을 수 있다.
본 발명의 일 실시예에 따르면 임상 설계 정보 입력부(100)는 임상 시험의 시뮬레이션 대상이 될 타겟 질병에 관한 식별 정보, 질병 코드 정보, 기타 관련 정보 중 적어도 하나를 포함한 타겟 질병 정보 및 타겟 질병에 영향을 미칠 것으로 예상이 되는 타겟 약물에 대한 식별 정보, 약물 코드 정보, 유사 또는 대조 약물정보, 기타 관련 정보 중 적어도 하나를 포함하는 타겟 약물 정보를 입력 받을 수 있다.
본 발명의 일 실시예에 따르면 임상 설계 정보 입력부(100)는 타겟 질병 정보 및 타겟 약물 정보를 이용하여 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 생성할 수 있다.
개발 타겟 유전자 정보 생성부(200)는 적어도 하나의 데이터 베이스로부터 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자 정보를 수신하고 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득하며, 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200)는 적어도 하나의 데이터 베이스에 타겟 질병 정보를 송신하여 타겟 질병과 연관된 복수의 유전자에 대한 유전자 정보를 검색하게 할 수 있으며, 검색된 유전자 정보를 데이터 베이스로부터 수신할 수 있다.
여기서 유전자 정보는 유전자 식별 정보, 유전자 이름, 단백질 클래스, 관련 질병 코드 중 적어도 하나의 이상의 정보를 포함한 것일 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200)는 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득할 수 있으며, 본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200)에서 유전자 정보를 이용하여 각 유전자 별 유전자-질환 연관 점수를 산출할 수 있으나, 또 다른 실시예에 따르면 데이터 베이스로부터 검색된 각 유전자 별 유전자-질환 연관 점수를 수신 받아 획득할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200) 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 명칭, 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성할 수 있다.
여기서 개발 타겟 유전자 정보란 임상 시험을 수행하였을 경우 타겟 약물이 타겟 질병에 대한 약품으로서 향후 개발 가능성이 존재한다고 판단될 수 있을 정도로 유의미하게 타겟 약물에 대하여 반응하는 특정 유전자에 대한 정보를 의미할 수 있다.
본 발명의 일 실시예에 따르면 유전자-질환 연관 점수가 미리 설정된 기준 값 이상이거나 상대적으로 특정 순위 안에 드는 높은 유전자-질환 연관 점수를 가진 유전자를 개발 타겟 유전자로 선정할 수 있다.
본 발명의 일 실시예에 따르면 선정된 개발 타겟 유전자의 기능 및 관련 기전에 대한 정보를 추가로 포함하여 개발 타겟 유전자 정보를 생성할 수 있다.
개발 타겟 유전자 정보에 대해서는 도 6을 참조하며 더 자세하게 이야기하도록 한다.
약물 효과 예측 SNP 선정부(300)는 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 분석을 수행하고, 분석 결과에 따라 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정할 수 있다.
여기서 약물 효과 예측 SNP란 타겟 질병의 유발 또는 억제에 영향을 미치는 타겟 약물의 기전과 동일 또는 유사한 기능을 수행할 수 있는 SNP를 의미할 수 있다.
또한 질병 원인 현상은 타겟 질병을 유발 또는 억제할 수 있는 현상을 의미할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 예측 SNP는 타겟 약물을 통해 통제 가능한 질병 원인 현상에 영향을 미칠 수 있는 SNP를 의미할 수 있다.
예를 들어 타겟 질병이 심혈관계 질환(CVD)인 경우 타겟 약물 A를 통해 통제할 수 있는 심혈관계 질환을 유발 또는 억제할 수 있는 질병 원인 현상으로는 LDL 콜레스테롤이 존재할 수 있으며, 이런 LDL 콜레스테롤의 수치에 영향을 미칠 수 있는 SNP들을 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 예측 SNP 선정부(300)는 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 GWAS 분석, 강화학습 분석, 머신러닝 분석 중 하나를 이용하여 분석을 수행하고 분석 결과에 따라 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정할 수 있으며, 더욱 자세한 내용은 도 4를 참조하며 설명하도록 한다.
유전자 점수 산출부(400)는 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 유전자 점수 산출부(400)는 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출할 수 있다.
본 발명의 일 실시예에 따르면 GWAS 분석은 각 약물 효과 예측 SNP를 대상으로 GWAS 분석 타겟 질병에서 원인이 되는 사항을 종속변수로 하여 유전체 데이터와의 선형회귀모형이나 로지스틱 회귀모형, mixed model 중 적어도 하나를 이용한 연관성 분석으로 수행될 수 있다.
본 발명의 일 실시예에 따르면 유전자 점수 산출부(400)는 각 약물 효과 예측 SNP에 대한 GWAS 분석을 통해 도출된p 값(p-value)의 기울기 값을 약물 효과 예측 SNP의 베타 값으로 설정할 수 있다.
본 발명의 일 실시예에 따르면 유전자 점수 산출부(400)는 약물 효과 예측 SNP에 포함된 SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 유전자 점수 산출부(400)는 아래 수학식 1과 같이 약물 효과 예측 SNP에 포함된 SNP 별 베타 값과 원인 대립 유전자의 수를 곱하여 산출된, SNP 별 값들의 합을 유전자 별 유전자 점수로 산출할 수 있다.
Figure 112022057557513-pat00001
n=약물 효과 예측 SNP에 포함된 SNP 수
β=SNP 별 베타 값
X= 원인 대립 유전자의 수
약물 효과 시뮬레이션 수행부(500)는 유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 질병 원인 현상(disease exposure)의 예상 추정값을 예측하고, 예상 추정값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 시뮬레이션 수행부(500)는 질병 원인 현상(disease exposure)의 예상 추정 값은 타겟 약물을 복용했을 경우 타겟 질병을 유발 또는 억제할 수 있는 질병 원인 현상에 대한 추정값을 의미할 수 있다.
예를 들어 타겟 질병이 심혈관계 질환(CVD), 타겟 약물이 A, 질병 원인 현상이 LDL 콜레스테롤인 경우 타겟 약물 A를 투약했을 경우 질병 원인 현상인 LDL 콜레스테롤의 예상 수치를 예상 추정값으로 볼 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 시뮬레이션 수행부(500)는 아래 수학식 2를 이용하여 유전자 점수를 이용해 질병 원인 현상의 예상 추정값을 산출할 수 있다.
Figure 112022057557513-pat00002
Y= 질병 원인 현상의 예상 추정값
α = 기울기 X1=유전자 점수, X2= 나이,
X3= 성별, X4= 5PCA(인종간의 주성분 분석의 5개의 주성분 값)
본 발명의 일 실시예에 따르면 약물 효과 시뮬레이션 수행부(500)는 아래 수학식 3과 같이 질병 원인 현상의 예상 추정값을 대상으로 한 회귀 분석을 통해 회귀선 상의 질병 원인 현상의 예상 추정값의 기울기 값을 베타 값으로 선정하고, 베타 값을 지수함수에 적용하여 산출한 타겟 질병 발생에 대한 오즈비(odds ratio) 값을 타겟 약물의 영향도로 산출할 수 있으며, 타겟 약물의 영향도를 통해 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성할 수 있다.
Figure 112022057557513-pat00003
Y= 타겟 약물의 영향도
α = 기울기 X1= 질병 원인 현상의 예상 추정값, X2= 나이,
X3= 성별, X4= 5PCA(인종간의 주성분 분석의 5개의 주성분 값)
예를 들어 ACLY라는 약물 효과 예측 SNP의 유전자 점수를 이용한 LDL 콜레스테롤의 예상 추정값이 타겟 약물 투약 전보다 10mg감소 하는 것으로 산출된 경우, LDL 콜레스테롤을 대상으로 회귀 분석을 수행하여 회귀선 상의 LDL 콜레스테롤 예상 추정값의 기울기 값을 베타 값으로 선정하고, 베타 값을 지수함수에 적용하여 오즈비(odds ratio) 값을 타겟 약물의 영향도로 산출할 수 있으며, 만약 오즈비 값이 0.82 인 경우 심혈관 질환은 18% 발생 확률이 감소되는 것으로 타겟 약물 효과 시뮬레이션 대한 임상 실험 결과 정보를 생성할 수 있다.
도 2는 도 1에 도시된 개발 타겟 유전자 정보 생성부의 세부 구성도이다.
도 2를 참조하면 개발 타겟 유전자 정보 생성부(200)는 연관 유전자 정보 수신부(210), 유전자-질환 연관 점수 획득부(220), 개발 타겟 유전자 선정부(230)를 더 포함할 수 있다.
연관 유전자 정보 수신부(210)는 데이터 베이스로부터 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 각 유전자 별 기능 정보 및 관련 기전 정보를 수신할 수 있다.
본 발명의 일 실시예에 따르면 연관 유전자 정보 수신부(210)는 적어도 하나의 데이터 베이스로부터 타겟 질병 정보를 기준으로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 유전자 별 기능 정보 및 관련 기전 정보를 수신할 수 있으며, 여기서 연관된 복수의 유전자를 선정하는 기준은 질병과 유전자의 관계는 21,671개의 유전자와 30,170종류의 질병(장애, 임상적 특징, 비정상적인 형질) 등의 정보를 토대로 산출된 관계값을 이용할 수 있다.
본 발명의 일 실시예에 따르면 관계값은 데이터 베이스가 제공하는 관계값을 이용할 수 있으며, 연관 유전자 정보 수신부(210)는 자체로 산출할 수도 있다.
유전자-질환 연관 점수 획득부(220)는 유전자 정보에 포함된 각 유전자 별로 적어도 하나의 데이터 베이스로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 별 검색 결과 따라 유전자-질환 연관 점수를 산출하거나 데이터 베이스로부터 유전자-질환 연관 점수를 수신할 수 있다.
본 발명의 일 실시예에 따르면 적어도 하나의 데이터 베이스로부터 유전자 정보에 포함된 각 유전자가 검색된 검색 횟수 결과를 기준으로 하여 데이터 베이스 별로 유전자-질환 연관 점수를 산출할 수 있으며, 또 다른 실시예에 따르면 복수의 데이터 베이스 중 일부를 데이터 베이스 그룹으로 그룹핑하여 데이터 베이스 그룹 별 유전자-질환 연관 점수를 산출할 수 있다.
복수의 데이터 베이스를 그룹핑 하는 것 및 유전자-질환 연관 점수를 산출하는 것에 대해서는 도 3를 참조하며 더 자세하게 설명하도록 한다.
개발 타겟 유전자 선정부(230)는 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정하고, 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자로 선정할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 선정부(230)는 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정할 수 있다.
여기서 개발 타겟 유전자는 타겟 질병에 대하여 관련성이 있어 타겟 약물의 임상 시험을 시뮬레이션 함에 있어서 타겟 질병의 발병에 또는 억제에 영향을 주는 주요 유전자로 선정될 수 있는 유전자를 의미한다.
본 발명의 일 실시예에 따르면 유전자-질환 연관 점수는 유전자와 타겟 질병이 함께 기재된 자료에 대한 검색 결과 개수가 많을수록 높게, 기재된 자료의 신뢰도가 높을수록 높게 산출될 수 있다.
본 발명의 일 실시예에 따르면 데이터 베이스로부터 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자를 개발 타겟 유전자로 더 포함시켜 선정할 수 있다.
본 발병의 일 실시예에 따르면 개발 타겟 유전자 선정부(230)는 데이터 베이스로부터 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자에 대한 정보를 수신 받을 수 있으며, 수신한 유전자에 대한 정보를 개발 타겟 유전자에 포함시킬 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 선정부(230)는 데이터 베이스로부터 개발 타겟 유전자의 기능 정보 및 관련 기전 정보를 포함한 정보를 수신 받을 수 있으며, 수신한 유전자에 대한 정보를 개발 타겟 유전자에 포함할 수 있다.
도 3은 도 2에 도시된 유전자-질환 연관 점수 획득부의 세부 구성도이다.
도 3을 참조하면 유전자-질환 연관 점수 획득부(220)는 유전자-질환 연관 점수 산출부(221)를 더 포함할 수 있다.
유전자-질환 연관 점수 산출부(221)는 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 산출된 값을 합산하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 유전자 검색을 복수의 이종 데이터 베이스를 대상으로 수행하고 복수의 이종 데이터 베이스를 미리 설정한 기준에 따라 그룹핑하여 복수의 이종 데이터 베이스 그룹으로 생성할 수 있다.
본 발명의 일 실시예에 따르면 유전자-질환 연관 점수 산출부(221)는 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수에 각 데이터 베이스 그룹 별 가중치를 적용하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 복수의 데이터 베이스를 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹으로 그룹핑하여 4개의 이종 데이터 베이스 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면 데이터 베이스 그룹은 데이터의 선별도 및 목적 부합도가 높은 데이터들로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 추론 데이터 베이스 그룹 논문 게재 또는 데이터 베이스를 토대로 2차 소스를 만들어 관련성을 추론하여 수집된 데이터들로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 동물 모델 데이터 베이스 그룹은 동물을 대상으로 한 힘상 시험 모델의 결과 데이터들로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 문헌 데이터 베이스 그룹은 논문 자료를 텍스트 마이닝(text mining)하여 얻은 데이터들을 로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 유전자 정보에 포함된 각 유전자 별로 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹을 대상으로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출할 수 있다.
본 발명의 일 실시예에 따르면 검색 횟수 결과에 미리 설정된 각 데이터 베이스 그룹 별 가중치를 적용하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자 정보에 포함된 각 유전자 별로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출할 수 있다.
본 발명의 일 실시예에 따르면 선별 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건이면 0.3, 두 건이면 0.5, 두 건 초과이면 0.6으로 선별 가중치 점수를 산정할 수 있다.
본 발명의 일 실시예에 따르면 추론 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.1로 추론 가중치 점수를 산정할 수 있다.
본 발명의 일 실시예에 따르면 동물 모델 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.2로 동물 모델 가중치 점수를 산정할 수 있다.,
본 발명의 일 실시예에 따르면 문헌 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 9건 미만이면 0.01, 9건 초과면 0.1로 문헌 가중치 점수를 산정할 수 있다.
본 발명의 일 실시예에 따르면 유전자-질환 연관 점수는 선별 가중치 점수, 추론 가중치 점수, 동물 모델 가중치 점수, 문헌 가중치 점수를 합산하여 산출할 수 있으며, 유전자-질환 연관 점수는 0과 1사이의 범위에 포함될 수 있다.
도 4는 도 1에 도시된 약물 효과 예측 SNP 선정부의 세부 구성도이다.
도 4를 참조하면 약물 효과 예측 SNP 선정부(300)는 GWAS 분석 선정부(310), 강화 학습 분석 선정부(320), 머신러닝 분석 선정부(330) 중 적어도 하나를 더 포함할 수 있다.
GWAS 분석 선정부(310)는 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0~500,000base 사이에 존재하는 SNP를 대상으로 타겟 질병에 원인이 되는 적어도 하나의 항목을 종속변수로 하는 GWAS 분석을 수행하여 SNP 별 P 값과 베타 값을 산출할 수 있다.
본 발명의 일 실시예에 따르면 GWAS 분석 선정부(310)는 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 존재하는 포지션의 양 사이드 0~500,000base 사이에 존재하는 SNP를 모두 추출할 수 있다.
본 발명의 일 실시예에 따르면 GWAS 분석 선정부(310)는 GWAS 분석을 통해 도출된 P값을 기준으로 미리 설정된 기준 값을 만족하는 SNP를 유전자 별 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 GWAS 분석 선정부(310)는 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0~500,000base 사이에 존재하는 SNP를 대상으로 타겟 질환에서 원인이 되는 사항을 종속변수로 하여 선형회귀모형이나 로지스틱 회귀모형, mixed model 중 적어도 하나의 방법으로 GWAS 분석을 수행하고, 수행결과 SNP 별 도출된 P값의 기준값을 p<5.0x10-6로 설정하여 해당 역치 값을 만족하는 SNP를 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 GWAS 분석 선정부(310)는 약물 효과 예측 SNP에 포함된 각 SNP 별로 베타 값(βn)과 원인 대립 유전자(exposure allele)의 수(Xn)를 곱하여 SNP 별 점수를 산출하고(βnXn), 상기 약물 효과 예측 SNP에 포함된 각 SNP의 SNP 별 점수를 합하여 각 유전자 별로 유전자 점수를 산출할 수 있다.
강화 학습 분석 선정부(320)는 데이터 베이스로 부터 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 질병 원인 연관 데이터(disease exposure association data), 유전자 점수를 이용하여 딥러닝 기반의 약물 효과 예측 SNP 선정 모델을 강화 학습할 수 있다.
본 발명의 일 실시예에 따르면 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 유전자 정보, 질병 원인 연관 데이터, 유전자 점수를 이용하여 생성된 학습 데이터 세트로 강화 학습을 통해 학습될 수 있다.
본 발명의 일 실시예에 따르면 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 Multi-Layer Perceptron, Convolutional Neural Network, Recurrent Neural Network, Transformer 중 적어도 하나가 사용될 수 있다.
본 발명의 일 실시예에 따르면 강화 학습 분석 선정부(320)는 약물 효과 예측 SNP 선정 모델에 개발 타겟 유전자 정보에 포함된 각 유전자의 복수의 SNP를 입력하여 약물 효과 예측 SNP를 선정할 수 있다.
본 발명의 일 실시예에 따르면 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 Monte-Carlo, SARSA, Q-learning, Actor-Critic 중 적어도 하나를 사용하여 갱신을 수행함으로써 강화 학습을 수행할 수 있으며, 강화 학습된 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 상대적으로 높은 정확도로 약물 효과 예측 SNP를 선정할 수 있다.
머신러닝 분석 선정부(330)는 개발 타겟 유전자 정보에 포함된 각 유전자의 SNP를 대상으로 SNP를 독립변수, 질병 원인 현상이 종속변수로 하여 학습된 머신러닝 기반의 예측 모델을 적용하여 각 SNP 별 중요도 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 머신러닝 기반의 예측 모델은 SNP를 독립변수, 질병 원인 현상이 종속변수로 한 XGboost 예측 알고리즘을 포함하여 구현될 수 있다.
본 발명의 일 실시예에 따르면 머신러닝 기반의 예측 모델은 SNP를 이용하여 SNP 별 질병 원인 현상의 수치를 예측할 수 있는 XAI 알고리즘을 포함하여 구현될 수 있으며, XAI 알고리즘에 의해 질병 원인 현상의 수치는 연속형 값으로 출력될 수 있다.
본 발명의 일 실시예에 따르면 머신러닝 분석 선정부(330)는 산출된 SNP 별 질병 원인 현상의 수치에 따라 중요도 점수를 산출할 수 있으며, 중요도 점수가 미리 설정된 기준 값 이상인 SNP를 유전자 별 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 머신러닝 분석 선정부(330)는 SNP 별 질병 원인 현상의 수치가 질병 원인 현상의 종류에 따라 미리 설정된 일정 기준 범위를 만족하는지 여부에 따라 중요도 점수를 0에서 1사이로 산출할 수 있다.
본 발명의 일 실시예에 따르면 머신러닝 분석 선정부(330)는 산출된 SNP에 대한 중요도 점수가 높을수록 시뮬레이션에 영향을 미치는 중요한 SNP로 정의하고, 중요도 점수가 미리 설정된 특정 임계값 이상의 SNP를 약물 효과 예측 SNP로 선정할 수 있다.
도 5는 도 1에 도시된 약물 효과 시뮬레이션 수행부의 세부 구성도이다.
본 발명의 일 실시예에 따르면 약물 효과 시뮬레이션 수행부(500)는 복합 약물 시뮬레이션부(510), 임상 시뮬레이션 재설계부(520), 임상 부가 정보 생성부(530) 중 적어도 하나를 포함할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 시뮬레이션 수행부(500)는 개발 타겟 유전자 정보에 포함된 관련 기전 정보 기반으로 타겟 약물로 임상 실험을 진행하였을 때 발생이 예상되는 질병 원인 현상(disease exposure)을 선정할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 시뮬레이션 수행부(500)는 유전자 별 유전자 점수를 기준으로 질병 원인 현상의 예상 추정값을 산출하고, 질병 원인 현상의 예상 추정값을 이용하여 회귀 분석을 통해 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것으로 시뮬레이션을 수행할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 시뮬레이션 수행부(500)는 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 수행하여 회귀선에서의 베타 값을 산출하고, 베타 값에 지수 함수를 적용하여 타겟 질병 발생에 대한 교차비 값을 산출하여 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 기준으로 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
복합 약물 시뮬레이션부(510)는 타겟 질병에 대한 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 할 수 있다.
본 발명의 일 실시예에 따르면 복합 약물 시뮬레이션부(510)는 적어도 하나 이상의 타겟 약물의 타겟 질병에 대한 효과를 확인하기 위해 적어도 하나 이상의 타겟 약물에 대하여 약물 별로 복수의 유전자 별 유전자 점수의 중앙값을 기준으로 샘플을 분류하고, 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 그룹핑하여 복수의 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면 복합 약물 시뮬레이션부(510)는 각 그룹의 교차비를 산출하여 상기 적어도 하나 이상의 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 이용하여 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 두가지의 타겟 약물에 대한 영향도를 산출하기 위하여 각 유전자의 유전자 점수의 중앙값 기준으로 샘플을 분류하고 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 분류할 수 있다.
본 발명의 일 실시예에 따르면 각 유전자 중 두개의 유전자(예를 들어 유전자 1, 유전자 2)를 선정하여 두 유전자 점수를 이용하여 다음과 같은 4개의 대비 그룹으로 분류할 수 있다.
대비 그룹 1(유전자 1 : 로우 그룹, 유전자 2: 로우 그룹)
대비 그룹 2(유전자 1 : 하이 그룹, 유전자 2: 로우 그룹)
대비 그룹 3(유전자 1 : 로우 그룹, 유전자 2: 하이 그룹)
대비 그룹 4(유전자 1 : 하이 그룹, 유전자 2: 하이 그룹)
본 발명의 일 실시예에 따르면 4개의 대비 그룹을 4단계로 층화된 2x2 factorial analysis을 이용하여 타겟 질병에 대한 오즈비(odds ratio)를 산출할 수 있다.
본 발명의 일 실시예에 따르면 산출된 오즈비를 이용하여 질병 발현 현상의 예상 추정값을 산출할 수 있으며, 질병 발현 현상의 예상 추정값을 대상으로 회귀 분석 수행하여 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
임상 시뮬레이션 재설계부(520)는 타겟 약물의 임상 효과를 시뮬레이션을 설계하기 위해 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 임상 재설계 그룹으로 선정하고, 임상 재설계 그룹을 대상으로 시뮬레이션을 수행할 수 있다.
본 발명의 일 실시예에 따르면 임상 시뮬레이션 재설계부(520)는 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 이미 약물에 노출된 것과 같은 효과를 가진 것으로 판단하여 타겟 약물을 처리하는 임상 재설계 그룹으로 선정하여 임상시험의 설계를 설정할 수 있다.
임상 부가 정보 생성부(530)는 질병 원인 현상의 예상 추정 값에 회귀 분석을 수행하여 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성할 수 있다.
본 발명의 일 실시예에 따르면 임상 부가 정보 생성부(530)는 질병 원인 현상의 예상 추정 값에 다양한 표현형(phenotype)을 종속변수로 입력한 회귀 분석을 수행하여 산출된 오즈비 값을 통해 특정 질병 발생의 영향 정도인 특정 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 회기 분석에 있어 회귀식에 beta값의 지수함수를 적용하여 오즈비 값이 1.0 이하이면, 타겟 약물의 효과가 특정 질병의 발생을 억제하므로 타겟 약물의 재창출 해당하며, 특정 질병에 대한 오즈비가 1.0이상이면 타겟 약물의 효과가 특정 질병의 발생의 원인이므로 부작용에 해당되어, 이를 기반으로 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성할 수 있다.
도 6은 본 발명의 일 실시예에 따라 생성된 개발 타겟 유전자 정보를 나타낸 도면이다.
도 6을 참조하면 본 발명의 일 실시예에 따라 데이터 테이블 형태로 구현된 개발 타겟 유전자 정보가 나타나 있으며, 개발 타겟 유전자 정보는 유전자 명칭 또는 유전자 식별 기호, 유전자의 기능, 유전자 관련 기전에 대한 데이터를 포함할 수 있다.
예를 들어 도 6을 참조하면 TERT라는 유전자 식별 기호를 가진 Telomerase reverse transcriptase는 유전자를 의미하며 염색체의 말단에 존재하는 반복염기서열 구조인 텔로미어(telomere)를 길이를 조절하는 효소의 핵심요소로서 기능하며, 관련 기전으로는 앞서 언급한 것과 같이 텔로미어의 길이를 조절하는 것일 수 있다.
본 발명의 일 실시예에 따르면 유전자 명칭 또는 유전자 식별 기호, 유전자의 기능, 유전자 관련 기전에 대한 데이터는 적어도 하나의 데이터 베이스로부터 타겟 질병과 연관된 각 유전자로 검색하여 획득한 정보일 수 있다.
도 7은 본 발명의 일 실시예에 따른 약물 임상 시뮬레이션 시스템이 약물 효과 예측 SNP를 선정한 이후 임상 실험 정보를 생성까지의 프로세스를 나타낸 도면이다.
도 7을 참조하면 본 발명의 일 실시예에 따른 약물 임상 시뮬레이션 시스템이 약물 효과 예측 SNP를 선정한 이후 임상 실험 정보를 생성까지의 프로세스가 나타나 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 분석하여 복수의 약물 효과 예측 SNP를 선정하고, ① 선정된 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출할 수 있다.
이어서 ②산출된 유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 질병 원인 현상(disease exposure)의 예상 추정값을 예측하고, ③ 예상 추정값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성할 수 있다.
도 8은 본 발명의 일 실시예에 따른 약물 효과 시뮬레이션 수행부가 타겟 질병에 대한 복수의 타겟 약물의 영향도를 산출하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하는 것을 나타낸 도면이다.
도 8을 참조하면 본 발명의 일 실시예에 따라 복수의 타겟 약물의 영향도를 산출하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하는 것이 나타나 있으며, 예를 들어 ACLY라는 유전자 식별기호를 가진 약물 효과 예측 SNP의 유전자 점수를 이용한 LDL 콜레스테롤의 예상 추정값이 타겟 약물 투약 전보다 10mg감소 하는 것으로 산출된 경우, LDL 콜레스테롤을 대상으로 회귀 분석을 수행하여 회귀선 상의 LDL 콜레스테롤 예상 추정값의 기울기 값을 베타 값으로 선정하고, 베타 값을 지수함수에 적용하여 오즈비(odds ratio) 값을 타겟 약물의 영향도로 산출할 수 있으며, 만약 오즈비 값이 0.82 인 경우 심혈관 질환은 18% 발생 확률이 감소되는 것으로 타겟 약물 효과 시뮬레이션 대한 임상 실험 결과 정보를 생성할 수 있다.
도 9는 본 발명의 일 실시예에 따른 복합 약물 시뮬레이션부가 타겟 질병에 대한 복수의 타겟 약물의 영향도를 산출하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하는 것을 나타낸 도면이다.
도 9를 참조하면 본 발명의 일 실시예에 따라 두가지의 타겟 약물에 대한 영향도를 산출하기 위하여 각 유전자의 유전자 점수의 중앙값 기준으로 샘플을 분류하고 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 대비 그룹을 분류하고 4개의 대비 그룹을 4단계로 층화된 2x2 factorial analysis을 이용하여 타겟 질병에 대한 오즈비(odds ratio)를 산출하는 경우 ACLY, HMGCR의 약물 모방이 없는 그룹 1에 비해 두 약물을 복합하면 오즈비는 0.91이며 오즈비 값이 0.91 인 경우 심혈관 질환은 9% 발생 확률이 감소되는 것으로 타겟 약물 효과 시뮬레이션 대한 임상 실험 결과 정보를 생성할 수 있다.
도 10은 본 발명의 일 실시예에 따라 산출된 타겟 질병에 대한 타겟 약물의 영향도를 나타낸 도면이다.
도 10을 참조하면 질병 원인 현상의 예상 추정 값에 다양한 표현형(phenotype)을 종속변수로 입력한 회귀 분석을 수행하여 산출된 오즈비 값을 통해 특정 질병 발생의 영향 정도인 특정 질병에 대한 타겟 약물의 영향도를 산출하는 것이 나타나 있으며, 도 10에서의 값의 p value가 0.01 이하이면 타겟 약물과 타겟 질병이 인과관계가 있다고 볼 수 있으며, 오즈비 값이 1.0 이하이면, 약물의 효과가 질병의 발생을 억제하므로 약물의 재창출에 해당되고 오즈비 값이 1.0이상이면, 약물의 효과가 질병의 발생의 원인이므로 부작용에 해당된다고 볼 수 있다.
도 11은 본 발명의 일 실시예에 따른 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법의 흐름도이다.
타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 입력 받는다(S10).
본 발명의 일 실시예에 따르면 사용자로부터 임상 실험의 대상이 될 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 입력 받을 수 있다.
본 발명의 일 실시예에 따르면 임상 시험의 시뮬레이션 대상이 될 타겟 질병에 관한 식별 정보, 질병 코드 정보, 기타 관련 정보 중 적어도 하나를 포함한 타겟 질병 정보 및 타겟 질병에 영향을 미칠 것으로 예상이 되는 타겟 약물에 대한 식별 정보, 약물 코드 정보, 유사 또는 대조 약물정보, 기타 관련 정보 중 적어도 하나를 포함하는 타겟 약물 정보를 입력 받을 수 있다.
본 발명의 일 실시예에 따르면 타겟 질병 정보 및 타겟 약물 정보를 이용하여 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 생성할 수 있다.
수신한 복수의 유전자 정보에 포함된 각 유전자 별로 유전-질환 연관 점수를 획득하여 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성한다(S20).
개발 타겟 유전자 정보 생성부(200)는 적어도 하나의 데이터 베이스로부터 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자 정보를 수신하고 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득하며, 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200)는 적어도 하나의 데이터 베이스에 타겟 질병 정보를 송신하여 타겟 질병과 연관된 복수의 유전자에 대한 유전자 정보를 검색하게 할 수 있으며, 검색된 유전자 정보를 데이터 베이스로부터 수신할 수 있다.
여기서 유전자 정보는 유전자 식별 정보, 유전자 이름, 단백질 클래스, 관련 질병 코드 중 적어도 하나의 이상의 정보를 포함한 것일 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200)는 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득할 수 있으며, 본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200)에서 유전자 정보를 이용하여 각 유전자 별 유전자-질환 연관 점수를 산출할 수 있으나, 또 다른 실시예에 따르면 데이터 베이스로부터 검색된 각 유전자 별 유전자-질환 연관 점수를 수신 받아 획득할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보 생성부(200) 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 명칭, 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성할 수 있다.
여기서 개발 타겟 유전자 정보란 임상 시험을 수행하였을 경우 타겟 약물이 타겟 질병에 대한 약품으로서 향후 개발 가능성이 존재한다고 판단될 수 있을 정도로 유의미하게 타겟 약물에 대하여 반응하는 특정 유전자에 대한 정보를 의미할 수 있다.
본 발명의 일 실시예에 따르면 유전자-질환 연관 점수가 미리 설정된 기준 값 이상이거나 상대적으로 특정 순위 안에 드는 높은 유전자-질환 연관 점수를 가진 유전자를 개발 타겟 유전자로 선정할 수 있다.
본 발명의 일 실시예에 따르면 선정된 개발 타겟 유전자의 기능 및 관련 기전에 대한 정보를 추가로 포함하여 개발 타겟 유전자 정보를 생성할 수 있다.
본 발명의 일 실시예에 따르면 데이터 베이스로부터 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 각 유전자 별 기능 정보 및 관련 기전 정보를 수신할 수 있다.
본 발명의 일 실시예에 따르면 적어도 하나의 데이터 베이스로부터 타겟 질병 정보를 기준으로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 유전자 별 기능 정보 및 관련 기전 정보를 수신할 수 있으며, 여기서 연관된 복수의 유전자를 선정하는 기준은 질병과 유전자의 관계는 21,671개의 유전자와 30,170종류의 질병(장애, 임상적 특징, 비정상적인 형질) 등의 정보를 토대로 산출된 관계값을 이용할 수 있다.
본 발명의 일 실시예에 따르면 관계값은 데이터 베이스가 제공하는 관계값을 이용할 수 있으며, 자체로 산출할 수도 있다.
본 발명의 일 실시예에 따르면 유전자 정보에 포함된 각 유전자 별로 적어도 하나의 데이터 베이스로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 별 검색 결과 따라 유전자-질환 연관 점수를 산출하거나 데이터 베이스로부터 유전자-질환 연관 점수를 수신할 수 있다.
본 발명의 일 실시예에 따르면 적어도 하나의 데이터 베이스로부터 유전자 정보에 포함된 각 유전자가 검색된 검색 횟수 결과를 기준으로 하여 데이터 베이스 별로 유전자-질환 연관 점수를 산출할 수 있으며, 또 다른 실시예에 따르면 복수의 데이터 베이스 중 일부를 데이터 베이스 그룹으로 그룹핑하여 데이터 베이스 그룹 별 유전자-질환 연관 점수를 산출할 수 있다.
복수의 데이터 베이스를 그룹핑 하는 것 및 유전자-질환 연관 점수를 산출하는 것에 대해서는 도 3를 참조하며 더 자세하게 설명하도록 한다.
본 발명의 일 실시예에 따르면 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정하고, 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자로 선정할 수 있다.
본 발명의 일 실시예에 따르면 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정할 수 있다.
본 발명의 일 실시예에 따르면 유전자-질환 연관 점수는 유전자와 타겟 질병이 함께 기재된 자료에 대한 검색 결과 개수가 많을수록 높게, 기재된 자료의 신뢰도가 높을수록 높게 산출될 수 있다.
본 발명의 일 실시예에 따르면 데이터 베이스로부터 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자를 개발 타겟 유전자로 더 포함시켜 선정할 수 있다.
본 발병의 일 실시예에 따르면 데이터 베이스로부터 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자에 대한 정보를 수신 받을 수 있으며, 수신한 유전자에 대한 정보를 개발 타겟 유전자에 포함시킬 수 있다.
본 발명의 일 실시예에 따르면 데이터 베이스로부터 개발 타겟 유전자의 기능 정보 및 관련 기전 정보를 포함한 정보를 수신 받을 수 있으며, 수신한 유전자에 대한 정보를 개발 타겟 유전자에 포함할 수 있다.
본 발명의 일 실시예에 따르면 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 산출된 값을 합산하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 유전자 검색을 복수의 이종 데이터 베이스를 대상으로 수행하고 복수의 이종 데이터 베이스를 미리 설정한 기준에 따라 그룹핑하여 복수의 이종 데이터 베이스 그룹으로 생성할 수 있다.
본 발명의 일 실시예에 따르면 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수에 각 데이터 베이스 그룹 별 가중치를 적용하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 복수의 데이터 베이스를 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹으로 그룹핑하여 4개의 이종 데이터 베이스 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면 데이터 베이스 그룹은 데이터의 선별도 및 목적 부합도가 높은 데이터들로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 추론 데이터 베이스 그룹 논문 게재 또는 데이터 베이스를 토대로 2차 소스를 만들어 관련성을 추론하여 수집된 데이터들로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 동물 모델 데이터 베이스 그룹은 동물을 대상으로 한 힘상 시험 모델의 결과 데이터들로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 문헌 데이터 베이스 그룹은 논문 자료를 텍스트 마이닝(text mining)하여 얻은 데이터들을 로 구성된 데이터 베이스들로 분류될 수 있다.
본 발명의 일 실시예에 따르면 유전자 정보에 포함된 각 유전자 별로 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹을 대상으로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출할 수 있다.
본 발명의 일 실시예에 따르면 검색 횟수 결과에 미리 설정된 각 데이터 베이스 그룹 별 가중치를 적용하여 유전자-질환 연관 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 상기 유전자 정보에 포함된 각 유전자 별로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출할 수 있다.
본 발명의 일 실시예에 따르면 선별 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건이면 0.3, 두 건이면 0.5, 두 건 초과이면 0.6으로 선별 가중치 점수를 산정할 수 있다.
본 발명의 일 실시예에 따르면 추론 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.1로 추론 가중치 점수를 산정할 수 있다.
본 발명의 일 실시예에 따르면 동물 모델 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.2로 동물 모델 가중치 점수를 산정할 수 있다.
본 발명의 일 실시예에 따르면 문헌 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 9건 미만이면 0.01, 9건 초과면 0.1로 문헌 가중치 점수를 산정할 수 있다.
본 발명의 일 실시예에 따르면 유전자-질환 연관 점수는 선별 가중치 점수, 추론 가중치 점수, 동물 모델 가중치 점수, 문헌 가중치 점수를 합산하여 산출할 수 있으며, 유전자-질환 연관 점수는 0과 1사이의 범위에 포함될 수 있다.
개발 타겟 유전자 정보에 포함된 각 유전자의 복수의 SNP를 대상으로 분석을 수행하고, 분석 결과에 따라 상기 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정한다(S30).
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 분석을 수행하고, 분석 결과에 따라 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 예측 SNP는 타겟 약물을 통해 통제 가능한 질병 원인 현상에 영향을 미칠 수 있는 SNP를 의미할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 GWAS 분석, 강화학습 분석, 머신러닝 분석 중 하나를 이용하여 분석을 수행하고 분석 결과에 따라 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정할 수 있으며, 더욱 자세한 내용은 도 4를 참조하며 설명하도록 한다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0~500,000base 사이에 존재하는 SNP를 대상으로 타겟 질병에 원인이 되는 적어도 하나의 항목을 종속변수로 하는 GWAS 분석을 수행하여 SNP 별 P 값과 베타 값을 산출할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 존재하는 포지션의 양 사이드 0~500,000base 사이에 존재하는 SNP를 모두 추출할 수 있다.
본 발명의 일 실시예에 따르면 GWAS 분석을 통해 도출된 P값을 기준으로 미리 설정된 기준 값을 만족하는 SNP를 유전자 별 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0~500,000base 사이에 존재하는 SNP를 대상으로 타겟 질환에서 원인이 되는 사항을 종속변수로 하여 선형회귀모형이나 로지스틱 회귀모형, mixed model 중 적어도 하나의 방법으로 GWAS 분석을 수행하고, 수행결과 SNP 별 도출된 P값의 기준값을 p<5.0x10-6로 설정하여 해당 역치 값을 만족하는 SNP를 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 예측 SNP에 포함된 각 SNP 별로 베타 값(βn)과 원인 대립 유전자(exposure allele)의 수(Xn)를 곱하여 SNP 별 점수를 산출하고(βnXn), 상기 약물 효과 예측 SNP에 포함된 각 SNP의 SNP 별 점수를 합하여 각 유전자 별로 유전자 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 데이터 베이스로 부터 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 질병 원인 연관 데이터(disease exposure association data), 유전자 점수를 이용하여 딥러닝 기반의 약물 효과 예측 SNP 선정 모델을 강화 학습할 수 있다.
본 발명의 일 실시예에 따르면 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 유전자 정보, 질병 원인 연관 데이터, 유전자 점수를 이용하여 생성된 학습 데이터 세트로 강화 학습을 통해 학습될 수 있다.
본 발명의 일 실시예에 따르면 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 Multi-Layer Perceptron, Convolutional Neural Network, Recurrent Neural Network, Transformer 중 적어도 하나가 사용될 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 예측 SNP 선정 모델에 개발 타겟 유전자 정보에 포함된 각 유전자의 복수의 SNP를 입력하여 약물 효과 예측 SNP를 선정할 수 있다.
본 발명의 일 실시예에 따르면 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 Monte-Carlo, SARSA, Q-learning, Actor-Critic 중 적어도 하나를 사용하여 갱신을 수행함으로써 강화 학습을 수행할 수 있으며, 강화 학습된 딥러닝 기반의 약물 효과 예측 SNP 선정 모델은 상대적으로 높은 정확도로 약물 효과 예측 SNP를 선정할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 각 유전자의 SNP를 대상으로 SNP를 독립변수, 질병 원인 현상이 종속변수로 하여 학습된 머신러닝 기반의 예측 모델을 적용하여 각 SNP 별 중요도 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 머신러닝 기반의 예측 모델은 SNP를 독립변수, 질병 원인 현상이 종속변수로 한 XGboost 예측 알고리즘을 포함하여 구현될 수 있다.
본 발명의 일 실시예에 따르면 머신러닝 기반의 예측 모델은 SNP를 이용하여 SNP 별 질병 원인 현상의 수치를 예측할 수 있는 XAI 알고리즘을 포함하여 구현될 수 있으며, XAI 알고리즘에 의해 질병 원인 현상의 수치는 연속형 값으로 출력될 수 있다.
본 발명의 일 실시예에 따르면 산출된 SNP 별 질병 원인 현상의 수치에 따라 중요도 점수를 산출할 수 있으며, 중요도 점수가 미리 설정된 기준 값 이상인 SNP를 유전자 별 약물 효과 예측 SNP로 선정할 수 있다.
본 발명의 일 실시예에 따르면 SNP 별 질병 원인 현상의 수치가 질병 원인 현상의 종류에 따라 미리 설정된 일정 기준 범위를 만족하는지 여부에 따라 중요도 점수를 0에서 1사이로 산출할 수 있다.
본 발명의 일 실시예에 따르면 산출된 SNP에 대한 중요도 점수가 높을수록 시뮬레이션에 영향을 미치는 중요한 SNP로 정의하고, 중요도 점수가 미리 설정된 특정 임계값 이상의 SNP를 약물 효과 예측 SNP로 선정할 수 있다.
복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, SNP 별 베타 값과 발현 대립 유전자의 수를 기반으로 각 유전자 별로 유전자 점수 산출한다(S40).
본 발명의 일 실시예에 따르면 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출할 수 있다.
본 발명의 일 실시예에 따르면 GWAS 분석은 각 약물 효과 예측 SNP를 대상으로 GWAS 분석 타겟 질병에서 원인이 되는 사항을 종속변수로 하여 유전체 데이터와의 선형회귀모형이나 로지스틱 회귀모형, mixed model 중 적어도 하나를 이용한 연관성 분석으로 수행될 수 있다.
본 발명의 일 실시예에 따르면 각 약물 효과 예측 SNP에 대한 GWAS 분석을 통해 도출된p 값(p-value)의 기울기 값을 약물 효과 예측 SNP의 베타 값으로 설정할 수 있다.
본 발명의 일 실시예에 따르면 약물 효과 예측 SNP에 포함된 SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출할 수 있다.
본 발명의 일 실시예에 따르면 수학식 1과 같이 약물 효과 예측 SNP에 포함된 SNP 별 베타 값과 원인 대립 유전자의 수를 곱하여 산출된, SNP 별 값들의 합을 유전자 별 유전자 점수로 산출할 수 있다.
유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 질병 원인 현상의 예상 추정값을 예측하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보 생성한다(S50).
본 발명의 일 실시예에 따르면 유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 질병 원인 현상(disease exposure)의 예상 추정값을 예측하고, 예상 추정값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성할 수 있다.
본 발명의 일 실시예에 따르면 질병 원인 현상(disease exposure)의 예상 추정 값은 타겟 약물을 복용했을 경우 타겟 질병을 유발 또는 억제할 수 있는 질병 원인 현상에 대한 추정값을 의미할 수 있다.
본 발명의 일 실시예에 따르면 수학식 2를 이용하여 유전자 점수를 이용해 질병 원인 현상의 예상 추정값을 산출할 수 있다.
본 발명의 일 실시예에 따르면 수학식 3과 같이 질병 원인 현상의 예상 추정값을 대상으로 한 회귀 분석을 통해 회귀선 상의 질병 원인 현상의 예상 추정값의 기울기 값을 베타 값으로 선정하고, 베타 값을 지수함수에 적용하여 산출한 타겟 질병 발생에 대한 오즈비(odds ratio) 값을 타겟 약물의 영향도로 산출할 수 있으며, 타겟 약물의 영향도를 통해 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성할 수 있다.
본 발명의 일 실시예에 따르면 개발 타겟 유전자 정보에 포함된 관련 기전 정보 기반으로 타겟 약물로 임상 실험을 진행하였을 때 발생이 예상되는 질병 원인 현상(disease exposure)을 선정할 수 있다.
본 발명의 일 실시예에 따르면 유전자 별 유전자 점수를 기준으로 질병 원인 현상의 예상 추정값을 산출하고, 질병 원인 현상의 예상 추정값을 이용하여 회귀 분석을 통해 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것으로 시뮬레이션을 수행할 수 있다.
본 발명의 일 실시예에 따르면 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 수행하여 회귀선에서의 베타 값을 산출하고, 베타 값에 지수 함수를 적용하여 타겟 질병 발생에 대한 교차비 값을 산출하여 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 기준으로 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 타겟 질병에 대한 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 할 수 있다.
본 발명의 일 실시예에 따르면 적어도 하나 이상의 타겟 약물의 타겟 질병에 대한 효과를 확인하기 위해 적어도 하나 이상의 타겟 약물에 대하여 약물 별로 복수의 유전자 별 유전자 점수의 중앙값을 기준으로 샘플을 분류하고, 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 그룹핑하여 복수의 그룹을 생성할 수 있다.
본 발명의 일 실시예에 따르면 각 그룹의 교차비를 산출하여 상기 적어도 하나 이상의 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 이용하여 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 두가지의 타겟 약물에 대한 영향도를 산출하기 위하여 각 유전자의 유전자 점수의 중앙값 기준으로 샘플을 분류하고 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 분류할 수 있다.
본 발명의 일 실시예에 따르면 각 유전자 중 두개의 유전자(예를 들어 유전자 1, 유전자 2)를 선정하여 두 유전자 점수를 이용하여 다음과 같은 4개의 대비 그룹으로 분류할 수 있다.
대비 그룹 1(유전자 1 : 로우 그룹, 유전자 2: 로우 그룹)
대비 그룹 2(유전자 1 : 하이 그룹, 유전자 2: 로우 그룹)
대비 그룹 3(유전자 1 : 로우 그룹, 유전자 2: 하이 그룹)
대비 그룹 4(유전자 1 : 하이 그룹, 유전자 2: 하이 그룹)
본 발명의 일 실시예에 따르면 4개의 대비 그룹을 4단계로 층화된 2x2 factorial analysis을 이용하여 타겟 질병에 대한 오즈비(odds ratio)를 산출할 수 있다.
본 발명의 일 실시예에 따르면 산출된 오즈비를 이용하여 질병 발현 현상의 예상 추정값을 산출할 수 있으며, 질병 발현 현상의 예상 추정값을 대상으로 회귀 분석 수행하여 타겟 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 타겟 약물의 임상 효과를 시뮬레이션을 설계하기 위해 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 임상 재설계 그룹으로 선정하고, 임상 재설계 그룹을 대상으로 시뮬레이션을 수행할 수 있다.
본 발명의 일 실시예에 따르면 임상 시뮬레이션 재설계부(520)는 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 이미 약물에 노출된 것과 같은 효과를 가진 것으로 판단하여 타겟 약물을 처리하는 임상 재설계 그룹으로 선정하여 임상시험의 설계를 설정할 수 있다.
본 발명의 일 실시예에 따르면 질병 원인 현상의 예상 추정 값에 회귀 분석을 수행하여 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성할 수 있다.
본 발명의 일 실시예에 따르면 질병 원인 현상의 예상 추정 값에 다양한 표현형(phenotype)을 종속변수로 입력한 회귀 분석을 수행하여 산출된 오즈비 값을 통해 특정 질병 발생의 영향 정도인 특정 질병에 대한 타겟 약물의 영향도를 산출할 수 있다.
본 발명의 일 실시예에 따르면 회기 분석에 있어 회귀식에 beta값의 지수함수를 적용하여 오즈비 값이 1.0 이하이면, 타겟 약물의 효과가 특정 질병의 발생을 억제하므로 타겟 약물의 재창출 해당하며, 특정 질병에 대한 오즈비가 1.0이상이면 타겟 약물의 효과가 특정 질병의 발생의 원인이므로 부작용에 해당되어, 이를 기반으로 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성할 수 있다.
본 발명의 실시 예는 이상에서 설명한 장치 및/또는 방법을 통해서만 구현이 되는 것은 아니며, 이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (34)

  1. 사용자로부터 임상 실험의 대상이 될 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 입력 받는 임상 설계 정보 입력부;
    적어도 하나의 데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자 정보를 수신하고, 상기 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득하며, 상기 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자 정보 생성부;
    상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 딥러닝 기반 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 분석을 수행하고, 분석 결과에 따라 상기 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정하는 약물 효과 예측 SNP 선정부;
    상기 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, 상기 SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출하는 유전자 점수 산출부; 및
    상기 유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 상기 질병 원인 현상(disease exposure)의 예상 추정값을 예측하고, 상기 예상 추정값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성하는 약물 효과 시뮬레이션 수행부를 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  2. 제 1 항에 있어서 상기 개발 타겟 유전자 정보 생성부는,
    데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 각 유전자 별 기능 정보 및 관련 기전 정보를 수신하는 연관 유전자 정보 수신부;
    상기 유전자 정보에 포함된 각 유전자 별로 적어도 하나의 데이터 베이스로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 유전자-질환 연관 점수를 산출하거나 상기 데이터 베이스로부터 유전자-질환 연관 점수를 수신하는 유전자-질환 연관 점수 획득부; 및
    상기 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정하고, 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자로 선정하는 개발 타겟 유전자 선정부를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  3. 제 2 항에 있어서 상기 유전자-질환 연관 점수 획득부는,
    유전자 검색을 복수의 이종 데이터 베이스를 대상으로 수행하고 상기 복수의 이종 데이터 베이스를 미리 설정한 기준에 따라 그룹핑하여 복수의 이종 데이터 베이스 그룹으로 생성하며,
    상기 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 산출된 값을 합산하여 유전자-질환 연관 점수를 산출하는 유전자-질환 연관 점수 산출부를 더 포함하는 것을 특징으로 하는 방 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  4. 제 3 항에 있어서 상기 유전자-질환 연관 점수 산출부는,
    복수의 데이터 베이스를 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹으로 그룹핑하여 4개의 이종 데이터 베이스 그룹을 생성하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  5. 제 4 항에 있어서 상기 유전자-질환 연관 점수 산출부는,
    상기 유전자 정보에 포함된 각 유전자 별로 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹을 대상으로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고,
    상기 검색 횟수 결과에 미리 설정된 각 데이터 베이스 별 가중치를 적용하여 유전자-질환 연관 점수를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  6. 제 5 항에 있어서 상기 유전자-질환 연관 점수 산출부는,
    상기 유전자 정보에 포함된 각 유전자 별로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고,
    선별 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건이면 0.3, 두 건이면 0.5, 두 건 초과이면 0.6으로 선별 가중치 점수를 산정하고,
    추론 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.1로 추론 가중치 점수를 산정하고,
    동물 모델 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.2로 동물 모델 가중치 점수를 산정하고,
    문헌 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 9건 미만이면 0.01, 9건 초과면 0.1로 문헌 가중치 점수를 산정하고,
    상기 유전자-질환 연관 점수는 선별 가중치 점수, 추론 가중치 점수, 동물 모델 가중치 점수, 문헌 가중치 점수를 합산하여 산출할 수 있으며,
    상기 유전자-질환 연관 점수는 0과 1사이의 범위에 포함되는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  7. 제 2 항에 있어서 상기 개발 타겟 유전자 정보 생성부는,
    데이터 베이스로부터 상기 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자를 개발 타겟 유전자로 더 포함시켜 선정하는 것을 더 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  8. 제 1 항에 있어서 상기 약물 효과 예측 SNP 선정부는,
    상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0 내지 500,000base 사이에 존재하는 SNP를 대상으로 타겟 질병에 원인이 되는 적어도 하나의 항목을 종속변수로 하는 GWAS 분석을 수행하여 SNP 별 P 값과 베타 값을 산출하고,
    상기 GWAS 분석을 통해 도출된 P값을 기준으로 미리 설정된 기준 값을 만족하는 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 GWAS 분석 선정부를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  9. 제 1 항에 있어서 상기 약물 효과 예측 SNP 선정부는,
    데이터 베이스로 부터 상기 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 질병 원인 연관 데이터(disease exposure association data), 유전자 점수를 이용하여 딥러닝 기반의 약물 효과 예측 SNP 선정 모델을 강화 학습하고,
    상기 약물 효과 예측 SNP 선정 모델에 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 복수의 SNP를 입력하여 약물 효과 예측 SNP를 선정하는 강화 학습 분석 선정부를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  10. 제 1 항에 있어서 상기 약물 효과 예측 SNP 선정부는,
    기 개발 타겟 유전자 정보에 포함된 각 유전자의 SNP를 대상으로 SNP를 독립변수, 질병 원인 현상(disease exposure)을 종속변수로 하여 학습된 머신러닝 기반의 예측 모델을 적용하여 각 SNP 별 중요도 점수를 산출하고,
    산출된 SNP 별 중요도 점수가 미리 설정된 기준 값 이상인 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 머신러닝 분석 선정부를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  11. 제 8 항에 있어서 상기 유전자 점수 산출부는,
    상기 약물 효과 예측 SNP에 포함된 각 SNP 별로 베타 값(β n )과 원인 대립 유전자(exposure allele)의 수(Xn )를 곱하여 SNP 별 점수를 산출하고(β nXn ), 상기 약물 효과 예측 SNP에 포함된 각 SNP의 SNP 별 점수를 합하여 각 유전자 별로 유전자 점수를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  12. 제 1 항에 있어서 상기 약물 효과 시뮬레이션 수행부는,
    개발 타겟 유전자 정보에 포함된 관련 기전 정보 기반으로 타겟 약물로 임상 실험을 진행하였을 때 발생이 예상되는 질병 원인 현상을 선정하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  13. 제 12 항에 있어서 상기 약물 효과 시뮬레이션 수행부는,
    상기 유전자 별 유전자 점수를 기준으로 상기 질병 원인 현상의 예상 추정 값을 산출하고, 상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 통해 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것으로 시뮬레이션을 수행하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  14. 제 13 항에 있어서 상기 약물 효과 시뮬레이션 수행부는,
    상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 수행하여 회귀선에서의 베타 값을 산출하고,
    상기 베타 값에 지수 함수를 적용하여 타겟 질병 발생에 대한 교차비 값을 산출하여 상기 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 기준으로 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  15. 제 14 항에 있어서 상기 약물 효과 시뮬레이션 수행부는,
    타겟 질병에 대한 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 복합 약물 시뮬레이션부를 더 포함하고,
    상기 복합 약물 시뮬레이션부는,
    적어도 하나 이상의 타겟 약물의 타겟 질병에 대한 효과를 확인하기 위해
    상기 적어도 하나 이상의 타겟 약물에 대하여 약물 별로 상기 복수의 유전자 별 유전자 점수의 중앙값을 기준으로 샘플을 분류하고, 상기 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 그룹핑하여 복수의 그룹을 생성하며,
    각 그룹의 교차비를 산출하여 상기 적어도 하나 이상의 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 이용하여 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  16. 제 13 항에 있어서 상기 약물 효과 시뮬레이션 수행부는,
    상기 타겟 약물의 임상 효과를 시뮬레이션을 설계하기 위해 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 임상 재설계 그룹으로 선정하고,
    상기 임상 재설계 그룹을 대상으로 시뮬레이션을 수행하는 임상 시뮬레이션 재설계부를 더 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  17. 제 13 항에 있어서 상기 약물 효과 시뮬레이션 수행부는,
    상기 질병 원인 현상의 예상 추정 값에 회귀 분석을 수행하여 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성하는 임상 부가 정보 생성부를 더 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템.
  18. 사용자로부터 임상 실험의 대상이 될 타겟 질병 정보 및 타겟 약물 정보를 포함한 임상 설계 정보를 입력 받는 단계;
    적어도 하나의 데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자 정보를 수신하고, 상기 유전자 정보에 포함된 각 유전자 별로 유전자-질환 연관 점수를 획득하며, 상기 유전자-질환 연관 점수를 기반으로 개발 타겟 유전자로 선정하여 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 단계;
    상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체에 포함된 복수의 SNP를 대상으로 GWAS 분석, 딥러닝 기반 강화학습 분석, 머신러닝 분석 중 적어도 하나를 이용하여 분석을 수행하고, 분석 결과에 따라 상기 복수의 SNP 중 일부를 약물 효과 예측 SNP로 선정하는 단계;
    상기 복수의 약물 효과 예측 SNP 각각을 대상으로 GWAS 분석을 수행하여 각 SNP 별 베타 값을 산출하며, 상기 SNP 별 베타 값과 원인 대립 유전자(exposure allele)의 수를 기반으로 각 유전자 별로 유전자 점수를 산출하는 단계; 및
    상기 유전자 별 유전자 점수에 따라 타겟 약물로 임상 실험을 진행할 경우 상기 질병 원인 현상(disease exposure)의 예상 추정값을 예측하고, 상기 예상 추정값을 이용하여 타겟 질병에 작용하는 타겟 약물의 효과를 시뮬레이션 하여 임상 실험 결과 정보를 생성하는 단계를 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  19. 제 18 항에 있어서 상기 개발 타겟 유전자 정보를 생성하는 단계는,
    데이터 베이스로부터 상기 타겟 질병 정보로 검색된 타겟 질병과 연관된 복수의 유전자에 대한 리스트 및 각 유전자 별 기능 정보 및 관련 기전 정보를 수신하는 단계;
    상기 유전자 정보에 포함된 각 유전자 별로 적어도 하나의 데이터 베이스로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 유전자-질환 연관 점수를 산출하거나 상기 데이터 베이스로부터 유전자-질환 연관 점수를 수신하여 유전자-질환 연관 점수를 획득하는 단계; 및
    상기 산출된 유전자 별 유전자-질환 연관 점수 중 미리 설정된 임계치 이상의 유전자-질환 연관 점수를 가지는 유전자를 개발 타겟 유전자로 선정하고, 선정된 유전자의 기능 정보 및 관련 기전 정보를 포함한 개발 타겟 유전자 정보를 생성하는 개발 타겟 유전자로 선정하는 단계를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  20. 제 19 항에 있어서 상기 유전자-질환 연관 점수를 획득하는 단계는,
    유전자 검색을 복수의 이종 데이터 베이스를 대상으로 수행하고 상기 복수의 이종 데이터 베이스를 미리 설정한 기준에 따라 그룹핑하여 복수의 이종 데이터 베이스 그룹으로 생성하며,
    상기 유전자 변이 정보에 포함된 각 유전자 변이 별로 복수의 이종 데이터 베이스 그룹으로부터 검색된 검색 횟수 결과를 기반으로 각 데이터 베이스 그룹 별 검색 결과 따라 산출된 값을 합산하여 유전자-질환 연관 점수를 산출하는 단계를 더 포함하는 것을 특징으로 하는 방 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  21. 제 20 항에 있어서 상기 유전자-질환 연관 점수를 산출하는 단계는,
    복수의 데이터 베이스를 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹으로 그룹핑하여 4개의 이종 데이터 베이스 그룹을 생성하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  22. 제 21 항에 있어서 상기 유전자-질환 연관 점수를 산출하는 단계는,
    상기 유전자 정보에 포함된 각 유전자 별로 선별 데이터 베이스 그룹, 추론 데이터 베이스 그룹, 동물 모델 데이터 베이스 그룹, 문헌 데이터 베이스 그룹을 대상으로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고,
    상기 검색 횟수 결과에 미리 설정된 각 데이터 베이스 별 가중치를 적용하여 유전자-질환 연관 점수를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  23. 제 22 항에 있어서 상기 유전자-질환 연관 점수를 산출하는 단계는,
    상기 유전자 정보에 포함된 각 유전자 별로 각 데이터 베이스 그룹 별로 검색하여 타겟 질환과 관련 있는 것으로 검색된 검색 횟수 결과를 산출하고,
    선별 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건이면 0.3, 두 건이면 0.5, 두 건 초과이면 0.6으로 선별 가중치 점수를 산정하고,
    추론 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.1로 추론 가중치 점수를 산정하고,
    동물 모델 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 없으면 0, 한 건 이상이면 0.2로 동물 모델 가중치 점수를 산정하고,
    문헌 데이터 베이스 그룹에서 검색된 검색 횟수 결과가 9건 미만이면 0.01, 9건 초과면 0.1로 문헌 가중치 점수를 산정하고,
    상기 유전자-질환 연관 점수는 선별 가중치 점수, 추론 가중치 점수, 동물 모델 가중치 점수, 문헌 가중치 점수를 합산하여 산출할 수 있으며,
    상기 유전자-질환 연관 점수는 0과 1사이의 범위에 포함되는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  24. 제 19 항에 있어서 상기 개발 타겟 유전자 정보를 생성하는 단계는,
    데이터 베이스로부터 상기 타겟 약물 정보에 대한 관련 유전자로 검색된 유전자를 개발 타겟 유전자로 더 포함시켜 선정하는 것을 더 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  25. 제 18 항에 있어서 상기 약물 효과 예측 SNP로 선정하는 단계는,
    상기 개발 타겟 유전자 정보에 포함된 각 유전자의 염색체 내 존재하는 포지션의 양 사이드 0 내지 500,000base 사이에 존재하는 SNP를 대상으로 타겟 질병에 원인이 되는 적어도 하나의 항목을 종속변수로 하는 GWAS 분석을 수행하여 SNP 별 P 값과 베타 값을 산출하고,
    상기 GWAS 분석을 통해 도출된 P값을 기준으로 미리 설정된 기준 값을 만족하는 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 단계를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  26. 제 18 항에 있어서 상기 약물 효과 예측 SNP로 선정하는 단계는,
    데이터 베이스로 부터 상기 개발 타겟 유전자 정보에 포함된 각 유전자에 대한 질병 원인 연관 데이터(disease exposure association data), 유전자 점수를 이용하여 딥러닝 기반의 약물 효과 예측 SNP 선정 모델을 강화 학습하고,
    상기 약물 효과 예측 SNP 선정 모델에 상기 개발 타겟 유전자 정보에 포함된 각 유전자의 복수의 SNP를 입력하여 약물 효과 예측 SNP를 선정하는 단계를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  27. 제 18 항에 있어서 상기 약물 효과 예측 SNP로 선정하는 단계는,
    기 개발 타겟 유전자 정보에 포함된 각 유전자의 SNP를 대상으로 SNP를 독립변수, 질병 원인 현상(disease exposure)을 종속변수로 하여 학습된 머신러닝 기반의 예측 모델을 적용하여 각 SNP 별 중요도 점수를 산출하고,
    산출된 SNP 별 중요도 점수가 미리 설정된 기준 값 이상인 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 단계를 더 포함하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  28. 제 25 항에 있어서 상기 SNP를 유전자 별 약물 효과 예측 SNP로 선정하는 단계는,
    상기 약물 효과 예측 SNP에 포함된 각 SNP 별로 베타 값(β n )과 원인 대립 유전자(exposure allele)의 수(Xn )를 곱하여 SNP 별 점수를 산출하고(β nXn ), 상기 약물 효과 예측 SNP에 포함된 각 SNP의 SNP 별 점수를 합하여 각 유전자 별로 유전자 점수를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  29. 제 18 항에 있어서 상기 임상 실험 결과 정보를 생성하는 단계는,
    개발 타겟 유전자 정보에 포함된 관련 기전 정보 기반으로 타겟 약물로 임상 실험을 진행하였을 때 발생이 예상되는 질병 원인 현상을 선정하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  30. 제 29 항에 있어서 상기 임상 실험 결과 정보를 생성하는 단계는,
    상기 유전자 별 유전자 점수를 기준으로 상기 질병 원인 현상의 예상 추정 값을 산출하고, 상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 통해 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것으로 시뮬레이션을 수행하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  31. 제 30 항에 있어서 상기 임상 실험 결과 정보를 생성하는 단계는,
    상기 질병 원인 현상의 예상 추정 값을 이용하여 회귀 분석을 수행하여 회귀선에서의 베타 값을 산출하고,
    상기 베타 값에 지수 함수를 적용하여 타겟 질병 발생에 대한 교차비 값을 산출하여 상기 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 기준으로 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  32. 제 31 항에 있어서 상기 임상 실험 결과 정보를 생성하는 단계는,
    타겟 질병에 대한 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계를 더 포함하고,
    상기 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계는,
    적어도 하나 이상의 타겟 약물의 타겟 질병에 대한 효과를 확인하기 위해
    상기 적어도 하나 이상의 타겟 약물에 대하여 약물 별로 상기 복수의 유전자 별 유전자 점수의 중앙값을 기준으로 샘플을 분류하고, 상기 중앙값 기준보다 낮은 그룹을 로우 그룹, 중앙값 기준보다 높은 그룹을 하이 그룹으로 그룹핑하여 복수의 그룹을 생성하며,
    각 그룹의 교차비를 산출하여 상기 적어도 하나 이상의 타겟 약물을 사용하지 않을 경우 대비 타겟 질병의 발생 확률의 감소치를 이용하여 타겟 질병에 대한 타겟 약물의 영향도를 산출하는 것을 특징으로 하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  33. 제 30 항에 있어서 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계는,
    상기 타겟 약물의 임상 효과를 시뮬레이션을 설계하기 위해 복수의 약물 효과 예측 SNP의 유전자 점수들의 평균 값보다 낮은 유전자 점수를 가진 약물 효과 예측 SNP를 임상 재설계 그룹으로 선정하고,
    상기 임상 재설계 그룹을 대상으로 시뮬레이션을 수행하는 임상 시뮬레이션 단계를 더 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
  34. 제 30 항에 있어서 적어도 하나 이상의 타겟 약물의 효과를 시뮬레이션 하는 단계는,
    상기 질병 원인 현상의 예상 추정 값에 회귀 분석을 수행하여 복수의 특정 질병에 대한 타겟 약물의 영향도를 통해 타겟 약물의 부작용과 재창출 정보를 임상 부가 정보로 생성하는 임상 부가 정보 생성부를 더 포함하는 약물 효과 예측 SNP 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 방법.
KR1020220066854A 2022-05-31 2022-05-31 약물 효과 예측 snp 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법 KR102473861B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220066854A KR102473861B1 (ko) 2022-05-31 2022-05-31 약물 효과 예측 snp 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220066854A KR102473861B1 (ko) 2022-05-31 2022-05-31 약물 효과 예측 snp 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR102473861B1 true KR102473861B1 (ko) 2022-12-06

Family

ID=84407658

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220066854A KR102473861B1 (ko) 2022-05-31 2022-05-31 약물 효과 예측 snp 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR102473861B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170134203A (ko) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치
KR101953762B1 (ko) * 2017-09-25 2019-03-04 (주)신테카바이오 이종 특성정보 병합 데이터 기반 인공지능 딥러닝 모델을 이용한 약물 적응증 및 반응 예측 시스템 및 방법
KR102351306B1 (ko) * 2021-09-06 2022-01-14 주식회사 바스젠바이오 질환 연관 유전자 변이 분석을 통한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법
KR102382707B1 (ko) * 2021-11-02 2022-04-08 주식회사 바스젠바이오 다유전자 위험점수를 이용한 시간 의존 연관성 기반의 질환 발병 정보 생성 장치 및 그 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170134203A (ko) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치
KR101953762B1 (ko) * 2017-09-25 2019-03-04 (주)신테카바이오 이종 특성정보 병합 데이터 기반 인공지능 딥러닝 모델을 이용한 약물 적응증 및 반응 예측 시스템 및 방법
KR102351306B1 (ko) * 2021-09-06 2022-01-14 주식회사 바스젠바이오 질환 연관 유전자 변이 분석을 통한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법
KR102382707B1 (ko) * 2021-11-02 2022-04-08 주식회사 바스젠바이오 다유전자 위험점수를 이용한 시간 의존 연관성 기반의 질환 발병 정보 생성 장치 및 그 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
H. Leonard 외, "Genetic variability and potential effects on clinical trial outcomes: perspectives in Parkinson’s disease", Journal of Medical Genetics, 57:331-338. (2019.11.29.) *

Similar Documents

Publication Publication Date Title
Ma et al. Genetic prediction of complex traits with polygenic scores: a statistical review
US10936626B1 (en) Database and data processing system for use with a network-based personal genetics services platform
Li et al. General principles for the validation of proarrhythmia risk prediction models: an extension of the CiPA in silico strategy
Yu et al. Pathway analysis by adaptive combination of P‐values
Sun et al. The role and basics of computer simulation in support of critical decisions in plant breeding
Sibieude et al. Fast screening of covariates in population models empowered by machine learning
KR102351306B1 (ko) 질환 연관 유전자 변이 분석을 통한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법
Sun et al. Introducing heuristic information into ant colony optimization algorithm for identifying epistasis
US20230068937A1 (en) Application of pathogenicity model and training thereof
CN110249344A (zh) 最佳解判定方法、最佳解判定程序及最佳解判定装置
Lepers et al. Inference with selection, varying population size, and evolving population structure: application of ABC to a forward–backward coalescent process with interactions
Gonzalez-Alvarez et al. Comparing multiobjective swarm intelligence metaheuristics for DNA motif discovery
Botta et al. Enhanced computational methods for quantifying the effect of geographic and environmental isolation on genetic differentiation
KR102473861B1 (ko) 약물 효과 예측 snp 기반의 유전자 점수를 이용한 약물 임상 시뮬레이션 시스템 및 그 방법
Li et al. Fast diffusion of domesticated maize to temperate zones
Hem et al. Robust modeling of additive and nonadditive variation with intuitive inclusion of expert knowledge
Israeli et al. Combined imputation of HLA genotype and self-identified race leads to better donor-recipient matching
Newaz et al. Inference of a dynamic aging-related biological subnetwork via network propagation
Uppu et al. Rule-based analysis for detecting epistasis using associative classification mining
Liu et al. Boosting alternating decision trees modeling of disease trait information
Huang et al. Interpreting SNP heritability in admixed populations
Vojgani et al. Phenotype prediction under epistasis
Witteveen et al. Publicly available privacy-preserving benchmarks for polygenic prediction
Mendolia et al. Comparison of statistics in association tests of genetic markers for survival outcomes
KR102535267B1 (ko) 심층 강화학습 기반 최적 snp 세트 정보 생성 장치 및 그 방법

Legal Events

Date Code Title Description
GRNT Written decision to grant