KR20210008273A - 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 - Google Patents
임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 Download PDFInfo
- Publication number
- KR20210008273A KR20210008273A KR1020190084709A KR20190084709A KR20210008273A KR 20210008273 A KR20210008273 A KR 20210008273A KR 1020190084709 A KR1020190084709 A KR 1020190084709A KR 20190084709 A KR20190084709 A KR 20190084709A KR 20210008273 A KR20210008273 A KR 20210008273A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- clinical
- group
- prognosis
- genetic polymorphism
- Prior art date
Links
- 238000004393 prognosis Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 68
- 206010058467 Lung neoplasm malignant Diseases 0.000 title claims abstract description 44
- 201000005202 lung cancer Diseases 0.000 title claims abstract description 44
- 208000020816 lung neoplasm Diseases 0.000 title claims abstract description 44
- 108090000623 proteins and genes Proteins 0.000 title abstract description 18
- 206010071602 Genetic polymorphism Diseases 0.000 claims abstract description 54
- 230000002980 postoperative effect Effects 0.000 claims abstract description 3
- 206010028980 Neoplasm Diseases 0.000 claims description 10
- 230000001575 pathological effect Effects 0.000 claims description 9
- 101000650564 Homo sapiens DNA-directed RNA polymerase I subunit RPA34 Proteins 0.000 claims description 8
- 101001048464 Homo sapiens Homer protein homolog 2 Proteins 0.000 claims description 8
- 108010044157 Receptors for Activated C Kinase Proteins 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 7
- 230000000391 smoking effect Effects 0.000 claims description 7
- 102100027479 DNA-directed RNA polymerase I subunit RPA34 Human genes 0.000 claims description 5
- 102100023605 Homer protein homolog 2 Human genes 0.000 claims description 5
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 claims description 5
- 101000610604 Homo sapiens Tumor necrosis factor receptor superfamily member 10B Proteins 0.000 claims description 5
- 102100025234 Receptor of activated protein C kinase 1 Human genes 0.000 claims description 5
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 claims description 5
- 102100040112 Tumor necrosis factor receptor superfamily member 10B Human genes 0.000 claims description 5
- 238000011497 Univariate linear regression Methods 0.000 claims description 5
- 101150109106 ADAMTSL3 gene Proteins 0.000 claims description 4
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 claims description 3
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 239000000090 biomarker Substances 0.000 description 42
- 230000004083 survival effect Effects 0.000 description 19
- 238000007637 random forest analysis Methods 0.000 description 18
- 238000012549 training Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 14
- 238000012795 verification Methods 0.000 description 14
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 101001015038 Albizia kalkora Kunitz-type trypsin inhibitor alpha chain Proteins 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 101150044182 8 gene Proteins 0.000 description 4
- 101000701175 Homo sapiens ADAMTS-like protein 3 Proteins 0.000 description 4
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 206010041823 squamous cell carcinoma Diseases 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 101150071258 C3 gene Proteins 0.000 description 3
- 101150060950 CD3D gene Proteins 0.000 description 3
- 101150026330 TNFRSF10B gene Proteins 0.000 description 3
- 208000009956 adenocarcinoma Diseases 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000002542 deteriorative effect Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 102100029377 ADAMTS-like protein 3 Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000968 medical method and process Methods 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 208000000649 small cell carcinoma Diseases 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
도 2는 본 발명의 일 실시 예에 따른 예후 예측 방법을 설명하기 위한 흐름도,
도 3은 종래의 랜덤포레스트 방식으로 학습 데이터를 선별한 예를 도시한 도면,
도 4는 본 발명의 일 실시 예에 따라 학습 데이터를 선별한 예를 도시한 도면,
도 5는 본 발명의 일 실시 예에 따른 예후 예측 방법의 성능을 검증하는데 사용된 환자 데이터의 통계값을 도시한 도면, 그리고,
도 6은 예측 방법 성능 비교를 위한 Kaplan-Meier 생존분석 결과 값을 도시한 도면이다.
예측 모델 (예측인자) |
data | 예측 성능 AUC(표준편차) |
종래 랜덤포레스트 (임상정보) |
트레이닝 코호트 | 0.709(0.016) |
검증 코호트 | 0.743(0.003) | |
종래 랜덤포레스트 (임상정보 및 유전자 정보) |
트레이닝 코호트 | 0.711(0.014) |
검증 코호트 | 0.749(0.005) | |
본 발명의 예측 모델 (임상정보 및 유전자 정보) |
트레이닝 코호트 | 0.718(0.012) |
검증 코호트 | 0.758(0.005) |
120: 통신부 130: 메모리
140: 출력부 150: 프로세서
Claims (13)
- 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법에 있어서,
복수의 폐암 환자의 유전자 다형성 정보 및 임상 정보를 수신하는 단계;
상기 수신된 유전자 다형성 정보 및 임상 정보를 제1 정보 그룹과 제2 정보 그룹으로 분류하는 단계;
상기 복수의 폐암 환자 중 일부 환자를 선택하고, 상기 선택된 일부 환자 각각에 대해 유전자 다형성 정보 및 임상 정보 중 일부를 선택하는 단계;
상기 선택하는 단계를 반복하여 복수의 선택 정보 세트를 구성하는 단계; 및
상기 구성된 복수의 선택 정보 세트를 기초로 예후 예측 모델을 생성하는 단계;를 포함하는 예후 예측 방법. - 제1항에 있어서,
상기 분류하는 단계는,
상기 유전자 다형성 정보 및 임상 정보 각각이 상기 예후 예측 모델의 정확도에 기여하는 정도를 나타내는 중요도 값을 기초로, 제1 정보 그룹과 제2 정보 그룹으로 분류하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
상기 분류하는 단계는,
상기 유전자 다형성 정보 및 임상 정보 각각에 대한 사건 발생률 차이 값을 기초로, 제1 정보 그룹과 제2 정보 그룹으로 분류하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
상기 분류하는 단계는,
상기 유전자 다형성 정보 및 임상 정보 각각에 대한 단변량 선형 회귀 모델을 생성하고, 상기 생성된 단변량 선형 회귀 모델의 AUC(Area Under Curve) 값을 도출하며, 상기 도출된 AUC 값을 기초로 제1 정보 그룹과 제2 정보 그룹으로 분류하는 것을 특징으로 하는 예후 예측 방법. - 제2항 내지 제4항 중 어느 한 항에 있어서,
상기 수신된 복수의 폐암 환자 중 일부 환자를 랜덤하게 선택하여 복수의 서브 세트를 구성하는 단계;를 더 포함하고,
상기 분류하는 단계는,
상기 복수의 서브 세트 각각에 속한 일부 환자의 유전자 다형성 정보 및 임상 정보를 기초로, 상기 복수의 서브 세트 별로 중요도 값, 사건 발생률 차이 값 및 AUC 값 중 하나를 도출하여 합산하고, 상기 복수의 서브 세트의 수로 상기 합산된 값을 나누어 평균 값을 도출하며, 상기 도출된 평균 값을 기초로 제1 정보 그룹과 제2 정보 그룹으로 분류하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
상기 분류하는 단계는,
상기 임상 정보 중 병리학적 종양 병기, 조직학적 유형, 나이, 성별 및 흡연량 정보 중 적어도 하나를 상기 제1 정보 그룹으로 분류하고, 유전자 다형성 정보 및 상기 제1 정보 그룹으로 분류되지 않은 임상 정보를 상기 제2 정보 그룹으로 분류하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
상기 선택하는 단계는,
상기 제1 정보 그룹으로 분류된 정보에 가중치를 부여하고, 상기 부여된 가중치를 반영하여 유전자 다형성 정보 및 임상 정보 중 일부를 선택하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
상기 선택하는 단계는,
상기 제1 정보 그룹으로 분류된 정보는 모두 선택하고, 상기 제2 정보 그룹으로 분류된 정보 중 일부를 랜덤하게 선택하여, 유전자 다형성 정보 및 임상 정보 중 일부를 선택하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
상기 유전자 다형성 정보는,
CD3EAP, TNFRSF10B, AKT1, C3, HOMER2, GNB2L1, CD3D 및 ADAMTSL3 유전자의 다형성 정보 중 적어도 하나 이상의 다형성 정보인 예후 예측 방법. - 제1항에 있어서,
상기 임상정보는,
폐암 환자의 병리학적 종양 병기, 조직학적 유형, 나이, 성별 및 흡연량 정보 중 적어도 하나인 예후 예측 방법. - 제1항에 있어서,
상기 생성하는 단계는,
상기 복수의 선택 정보 세트 각각을 기초로 의사결정나무에 기반한 복수의 개별 모델을 생성하고, 상기 생성된 복수의 개별 모델을 종합하여 앙상블 예후 예측 모델을 생성하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
상기 생성하는 단계는,
상기 복수의 선택 정보 세트 각각을 기초로 의사결정나무에 기반한 복수의 개별 모델을 생성하고, 상기 복수의 선택 정보 세트 각각을 구성하는 정보 중 상기 제1 정보 그룹에 속하는 정보의 수에 비례하게 상기 생성된 복수의 개별 모델 각각에 가중치를 부여하며, 상기 부여된 가중치를 반영하여 앙상블 예후 예측 모델을 생성하는 것을 특징으로 하는 예후 예측 방법. - 제1항에 있어서,
예후를 예측할 폐암 환자의 유전자 다형성 정보 및 임상 정보를 입력하는 단계; 및
상기 입력된 유전자 다형성 정보 및 임상 정보를 기초로, 상기 생성된 예후 예측 모델을 이용하여 예측된 예후 결과를 출력하는 단계;를 더 포함하는 예후 예측 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190084709A KR102305806B1 (ko) | 2019-07-12 | 2019-07-12 | 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190084709A KR102305806B1 (ko) | 2019-07-12 | 2019-07-12 | 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210008273A true KR20210008273A (ko) | 2021-01-21 |
KR102305806B1 KR102305806B1 (ko) | 2021-10-01 |
Family
ID=74237600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190084709A KR102305806B1 (ko) | 2019-07-12 | 2019-07-12 | 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102305806B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023090929A1 (ko) * | 2021-11-19 | 2023-05-25 | 주식회사 지씨지놈 | 스타틴 혈중농도-시간 곡선하면적 예측 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101676089B1 (ko) * | 2013-10-29 | 2016-11-14 | 경북대학교 산학협력단 | 폐암환자의 예후진단용 다형성 마커 및 이를 이용한 폐암 예후 예측방법 |
-
2019
- 2019-07-12 KR KR1020190084709A patent/KR102305806B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101676089B1 (ko) * | 2013-10-29 | 2016-11-14 | 경북대학교 산학협력단 | 폐암환자의 예후진단용 다형성 마커 및 이를 이용한 폐암 예후 예측방법 |
Non-Patent Citations (2)
Title |
---|
Yiyi Liu 외, Variable importance-weighted Random Forests, Quantitative Biology, 2017.11.06., Vol.5, No.4, pp338-351.* * |
Young Ae Cho 외, Genetic Risk Score, Combined Lifestyle Factors and Risk of Colorectal Cancer, Cancer Res Treat., 2018.10.18., Vol.51, No.3, pp1033-1040.* * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023090929A1 (ko) * | 2021-11-19 | 2023-05-25 | 주식회사 지씨지놈 | 스타틴 혈중농도-시간 곡선하면적 예측 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102305806B1 (ko) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DeGroat et al. | Discovering biomarkers associated and predicting cardiovascular disease with high accuracy using a novel nexus of machine learning techniques for precision medicine | |
US20220223233A1 (en) | Display of estimated parental contribution to ancestry | |
Boulesteix et al. | IPF‐LASSO: integrative L1‐penalized regression with penalty factors for prediction based on multi‐omics data | |
Ross et al. | Tissue-based genomics augments post-prostatectomy risk stratification in a natural history cohort of intermediate-and high-risk men | |
Hothorn et al. | Survival ensembles | |
KR102190299B1 (ko) | 인공신경망을 이용한 위암의 예후 예측 방법, 장치 및 프로그램 | |
Schmid et al. | A comparison of estimators to evaluate the discriminatory power of time‐to‐event models | |
CN109493969B (zh) | 评估Paget’s病伴浸润性导管癌患者预后的模型及其应用 | |
CN112735592B (zh) | 肺癌预后模型的构建方法及应用方法、电子设备 | |
EP3797423A1 (en) | System and method for integrating genotypic information and phenotypic measurements for precision health assessments | |
CN113517073B (zh) | 肺癌手术后生存率预测模型构建方法和预测模型系统 | |
Wang et al. | TMBcat: a multi-endpoint p-value criterion on different discrepancy metrics for superiorly inferring tumor mutation burden thresholds | |
Nowak et al. | Complementary hierarchical clustering | |
KR102305806B1 (ko) | 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 | |
Arteaga-Arteaga et al. | Machine learning applications on intratumoral heterogeneity in glioblastoma using single-cell RNA sequencing data | |
Augugliaro et al. | dglars: an R package to estimate sparse generalized linear models | |
Parast et al. | Landmark risk prediction of residual life for breast cancer survival | |
Beyene et al. | On the validity of time‐dependent AUC estimation in the presence of cure fraction | |
Moon et al. | Subgroup analysis based on prognostic and predictive gene signatures for adjuvant chemotherapy in early-stage non-small-cell lung cancer patients | |
Chen et al. | Predicting time to first treatment in chronic lymphocytic leukemia using machine learning survival and classification methods | |
Bae et al. | Risk prediction of type 2 diabetes using common and rare variants | |
CN115029442A (zh) | 基于m6A相关lncRNA的浆液性卵巢癌预后模型的构建及其临床应用 | |
CN110197701B (zh) | 一种新型多发性骨髓瘤诺模图构建方法 | |
Xu et al. | A Bayes factor approach with informative prior for rare genetic variant analysis from next generation sequencing data | |
Qi et al. | A comparative study of algorithms for grouping cancer data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190712 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210208 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210826 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210917 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210923 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240912 Start annual number: 4 End annual number: 4 |