CN116497116A - 一种预测急性移植物抗宿主病的基因标志物及其应用 - Google Patents
一种预测急性移植物抗宿主病的基因标志物及其应用 Download PDFInfo
- Publication number
- CN116497116A CN116497116A CN202310592189.7A CN202310592189A CN116497116A CN 116497116 A CN116497116 A CN 116497116A CN 202310592189 A CN202310592189 A CN 202310592189A CN 116497116 A CN116497116 A CN 116497116A
- Authority
- CN
- China
- Prior art keywords
- host disease
- versus
- acute graft
- genes
- predicting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 83
- 208000024340 acute graft versus host disease Diseases 0.000 title claims abstract description 62
- 239000003550 marker Substances 0.000 title claims abstract description 18
- -1 SLC16a11 Proteins 0.000 claims abstract description 12
- 102100033088 Calcium/calmodulin-dependent protein kinase type 1D Human genes 0.000 claims abstract description 6
- 102100024364 Disintegrin and metalloproteinase domain-containing protein 8 Human genes 0.000 claims abstract description 6
- 101000944258 Homo sapiens Calcium/calmodulin-dependent protein kinase type 1D Proteins 0.000 claims abstract description 6
- 101000832767 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 8 Proteins 0.000 claims abstract description 6
- 101000643024 Homo sapiens Stimulator of interferon genes protein Proteins 0.000 claims abstract description 6
- 102000000588 Interleukin-2 Human genes 0.000 claims abstract description 6
- 108010002350 Interleukin-2 Proteins 0.000 claims abstract description 6
- 102100035533 Stimulator of interferon genes protein Human genes 0.000 claims abstract description 6
- 102100035619 DNA-(apurinic or apyrimidinic site) lyase Human genes 0.000 claims abstract description 4
- 101001137256 Homo sapiens DNA-(apurinic or apyrimidinic site) lyase Proteins 0.000 claims abstract description 4
- 102100028187 ATP-binding cassette sub-family C member 6 Human genes 0.000 claims abstract description 3
- 102100035634 B-cell linker protein Human genes 0.000 claims abstract description 3
- 102100037150 BMP and activin membrane-bound inhibitor homolog Human genes 0.000 claims abstract description 3
- 102100026686 Chromobox protein homolog 6 Human genes 0.000 claims abstract description 3
- 102100022812 DNA-binding protein RFX2 Human genes 0.000 claims abstract description 3
- 101100054330 Dictyostelium discoideum abhd gene Proteins 0.000 claims abstract description 3
- 101000986621 Homo sapiens ATP-binding cassette sub-family C member 6 Proteins 0.000 claims abstract description 3
- 101000803266 Homo sapiens B-cell linker protein Proteins 0.000 claims abstract description 3
- 101000740070 Homo sapiens BMP and activin membrane-bound inhibitor homolog Proteins 0.000 claims abstract description 3
- 101000910833 Homo sapiens Chromobox protein homolog 6 Proteins 0.000 claims abstract description 3
- 101000756799 Homo sapiens DNA-binding protein RFX2 Proteins 0.000 claims abstract description 3
- 101000583057 Homo sapiens NGFI-A-binding protein 2 Proteins 0.000 claims abstract description 3
- 101000952113 Homo sapiens Probable ATP-dependent RNA helicase DDX5 Proteins 0.000 claims abstract description 3
- 101000630267 Homo sapiens Probable glutamate-tRNA ligase, mitochondrial Proteins 0.000 claims abstract description 3
- 101000831005 Homo sapiens Tigger transposable element-derived protein 6 Proteins 0.000 claims abstract description 3
- 101000788548 Homo sapiens Tubulin alpha-4A chain Proteins 0.000 claims abstract description 3
- 101000841331 Homo sapiens Urotensin-2B Proteins 0.000 claims abstract description 3
- CZSLEMCYYGEGKP-UHFFFAOYSA-N N-(2-chlorobenzyl)-1-(2,5-dimethylphenyl)benzimidazole-5-carboxamide Chemical compound CC1=CC=C(C)C(N2C3=CC=C(C=C3N=C2)C(=O)NCC=2C(=CC=CC=2)Cl)=C1 CZSLEMCYYGEGKP-UHFFFAOYSA-N 0.000 claims abstract description 3
- 102100030391 NGFI-A-binding protein 2 Human genes 0.000 claims abstract description 3
- 102100037434 Probable ATP-dependent RNA helicase DDX5 Human genes 0.000 claims abstract description 3
- 102100026125 Probable glutamate-tRNA ligase, mitochondrial Human genes 0.000 claims abstract description 3
- 108091006699 SLC24A3 Proteins 0.000 claims abstract description 3
- 102100032070 Sodium/potassium/calcium exchanger 3 Human genes 0.000 claims abstract description 3
- 102100024833 Tigger transposable element-derived protein 6 Human genes 0.000 claims abstract description 3
- 102100025239 Tubulin alpha-4A chain Human genes 0.000 claims abstract description 3
- 102100029096 Urotensin-2B Human genes 0.000 claims abstract description 3
- 108091007494 Nucleic acid- binding domains Proteins 0.000 claims abstract 2
- 208000024908 graft versus host disease Diseases 0.000 claims description 50
- 230000014509 gene expression Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000010801 machine learning Methods 0.000 claims description 14
- 239000003153 chemical reaction reagent Substances 0.000 claims description 13
- 238000004393 prognosis Methods 0.000 claims description 12
- 238000012706 support-vector machine Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000003066 decision tree Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 210000004027 cell Anatomy 0.000 claims description 6
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 4
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000010219 correlation analysis Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000007799 mixed lymphocyte reaction assay Methods 0.000 claims description 2
- 238000001821 nucleic acid purification Methods 0.000 claims description 2
- 108020004707 nucleic acids Proteins 0.000 claims description 2
- 150000007523 nucleic acids Chemical class 0.000 claims description 2
- 102000039446 nucleic acids Human genes 0.000 claims description 2
- 101150061090 ogg gene Proteins 0.000 claims 1
- 208000024891 symptom Diseases 0.000 claims 1
- 208000009329 Graft vs Host Disease Diseases 0.000 description 43
- 238000011134 hematopoietic stem cell transplantation Methods 0.000 description 13
- 108090000695 Cytokines Proteins 0.000 description 6
- 102000004127 Cytokines Human genes 0.000 description 6
- 210000004698 lymphocyte Anatomy 0.000 description 4
- 238000002054 transplantation Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 208000037410 Complications after hematopoietic stem cell transplantation Diseases 0.000 description 2
- 108010015972 Elafin Proteins 0.000 description 2
- 102000002149 Elafin Human genes 0.000 description 2
- 101000852968 Homo sapiens Interleukin-1 receptor-like 1 Proteins 0.000 description 2
- 101000585365 Homo sapiens Sulfotransferase 2A1 Proteins 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- 108090001007 Interleukin-8 Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- MDCUNMLZLNGCQA-HWOAGHQOSA-N elafin Chemical compound N([C@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H]1C(=O)N2CCC[C@H]2C(=O)N[C@H](C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H]2CSSC[C@H]3C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CSSC[C@H]4C(=O)N5CCC[C@H]5C(=O)NCC(=O)N[C@H](C(N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H]5N(CCC5)C(=O)[C@H]5N(CCC5)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)NC2=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N4)C(=O)N[C@@H](CSSC1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N3)=O)[C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)C(C)C)C(C)C)C(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N MDCUNMLZLNGCQA-HWOAGHQOSA-N 0.000 description 2
- 108040006849 interleukin-2 receptor activity proteins Proteins 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- XJOTXKZIRSHZQV-RXHOOSIZSA-N (3S)-3-amino-4-[[(2S,3R)-1-[[(2S)-1-[[(2S)-1-[(2S)-2-[[(2S,3S)-1-[[(1R,6R,12R,17R,20S,23S,26R,31R,34R,39R,42S,45S,48S,51S,59S)-51-(4-aminobutyl)-31-[[(2S)-6-amino-1-[[(1S,2R)-1-carboxy-2-hydroxypropyl]amino]-1-oxohexan-2-yl]carbamoyl]-20-benzyl-23-[(2S)-butan-2-yl]-45-(3-carbamimidamidopropyl)-48-(hydroxymethyl)-42-(1H-imidazol-4-ylmethyl)-59-(2-methylsulfanylethyl)-7,10,19,22,25,33,40,43,46,49,52,54,57,60,63,64-hexadecaoxo-3,4,14,15,28,29,36,37-octathia-8,11,18,21,24,32,41,44,47,50,53,55,58,61,62,65-hexadecazatetracyclo[32.19.8.26,17.212,39]pentahexacontan-26-yl]amino]-3-methyl-1-oxopentan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-4-oxobutanoic acid Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](Cc1cnc[nH]1)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)[C@@H](C)O)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@@H]2CSSC[C@@H]3NC(=O)[C@@H]4CSSC[C@H](NC(=O)[C@H](Cc5ccccc5)NC(=O)[C@@H](NC1=O)[C@@H](C)CC)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](Cc1cnc[nH]1)NC3=O)C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N2)C(=O)NCC(=O)N4)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XJOTXKZIRSHZQV-RXHOOSIZSA-N 0.000 description 1
- VKUYLANQOAKALN-UHFFFAOYSA-N 2-[benzyl-(4-methoxyphenyl)sulfonylamino]-n-hydroxy-4-methylpentanamide Chemical compound C1=CC(OC)=CC=C1S(=O)(=O)N(C(CC(C)C)C(=O)NO)CC1=CC=CC=C1 VKUYLANQOAKALN-UHFFFAOYSA-N 0.000 description 1
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 description 1
- 101710085500 C-X-C motif chemokine 9 Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102000001398 Granzyme Human genes 0.000 description 1
- 108060005986 Granzyme Proteins 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 101710083479 Hepatitis A virus cellular receptor 2 homolog Proteins 0.000 description 1
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 1
- 102100030416 Stromelysin-1 Human genes 0.000 description 1
- 101710108790 Stromelysin-1 Proteins 0.000 description 1
- 229940126547 T-cell immunoglobulin mucin-3 Drugs 0.000 description 1
- 102100033732 Tumor necrosis factor receptor superfamily member 1A Human genes 0.000 description 1
- 101710187743 Tumor necrosis factor receptor superfamily member 1A Proteins 0.000 description 1
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 102000018511 hepcidin Human genes 0.000 description 1
- 108060003558 hepcidin Proteins 0.000 description 1
- 229940066919 hepcidin Drugs 0.000 description 1
- 230000005931 immune cell recruitment Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 210000005105 peripheral blood lymphocyte Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Organic Chemistry (AREA)
- Evolutionary Computation (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Zoology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Bioethics (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
Abstract
本发明公开了一种预测急性移植物抗宿主病的基因标志物及其应用。所述基因标志物包括:(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合,或,(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。本发明首次发现所述基因标志物能够预测急性移植物抗宿主病,基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物,还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测,能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。
Description
技术领域
本发明属于分子生物化学技术领域,涉及一种预测急性移植物抗宿主病的基因标志物及其应用。
背景技术
同种异基因造血干细胞移植(allo-HSCT)目前在临床上应用广泛,主要依据供、受者HLA抗原基因的匹配程度来选择供者。急性移植物抗宿主病(aGVHD)是其常见的并发症、发病率约40%。临床上缺乏有效的aGVHD预测手段,aGVHD的预防及治疗方法亦有限,部分患者起病急、病情进展快、严重影响移植预后。
目前,对GVHD发生机制的研究有很多,GVHD在细胞层面和组织器官层面的发生机制较为复杂,尤其是无法反映出供者来源免疫细胞对受者细胞上的“抗原”的反应能力。混合淋巴细胞培养(MLC)是指将供、受者的外周血PBMC按照一定比例混合后,经过培养,观察PBMC的活化和增殖情况。虽然经典的供/受者混合淋巴细胞培养在一定程度上反映出供者免疫细胞对受者抗原的反应能力,但是,已有多个独立的临床研究发现,MLC后观察增殖不能精准预测allo-HSCT后aGVHD发生风险,不能反映免疫排斥,MLC后免疫排斥导致的免疫细胞活化比增殖更为敏感。
目前也有采用检测细胞因子表达水平来预测GVHD,例如CN111549126A公开了一种用于预测或诊断GVHD的试剂盒、GVHD的风险计算方法和应用,所述细胞因子包括:TIM-3、MMP-3、IL-2R、IL-6、IL-8、CD30、ST2、TNFRI、HGF、REG3a、MIG、Elafin、骨调素和颗粒酶A。通过该细胞因子组合可高通量、快速有效地测定GVHD,通过动态监测细胞因子组合的变化,可直接或间接地分析和判断GVHD的程度。CN110988364A公开了一种应用流式细胞术检测移植后GVHD相关细胞因子的方法及检测试剂盒,能够同时快速均相检测GVHD诊断与预后相关细胞因子IL-6、IL-8、ST2、Reg3α、Elafin、TNFR1、可溶性IL-2R、HGF中的一项或多项不同组合的指标,实现单样本多重检测,节省时间和资源,软件自动分析结果,更加客观准确,检测安全,样本用量少,检测细胞因子表达水平为诊断治疗GVHD提供一种新的途径。
综上所述,目前仍缺乏有效精确预测GVHD的方法。如何提供一种预测急性移植物抗宿主病的基因标志物,实现稳定、经济、准确且更早期地预测急性移植物抗宿主病,已成为目前生物技术领域亟待解决的问题之一。
发明内容
针对现有技术的不足和实际需求,本发明提供一种预测急性移植物抗宿主病的基因标志物及其应用,解决了现有预测急性移植物抗宿主病的方法不能准确且更早期预测急性移植物抗宿主病的问题,实现了精准预测aGVHD,结合造血干细胞移植前供受者的HLA基因配型,可以选择更安全、有效的供者,此外,对造血干细胞移植后其他严重并发症的发生也具有非常高的预测准确性,有助于临床预防方案的实施。
为达到此发明目的,本发明采用以下技术方案:
第一方面,本发明提供了一种预测急性移植物抗宿主病的基因标志物,所述基因标志物包括:
(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合,或,
(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。
本发明首次发现所述基因标志物能够预测急性移植物抗宿主病,基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物,还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测,能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。
第二方面,本发明提供了第一方面所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在制备急性移植物抗宿主病检测产品中的应用。
第三方面,本发明提供了一种检测急性移植物抗宿主病的试剂盒,所述试剂盒包括用于检测第一方面所述的预测急性移植物抗宿主病的基因标志物的试剂。
优选地,所述试剂包括核酸提取试剂和/或核酸纯化试剂。
第四方面,本发明提供了第一方面所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在构建预测急性移植物抗宿主病的模型或制备预测急性移植物抗宿主病的装置中的应用。
第五方面,本发明提供了一种构建预测急性移植物抗宿主病的模型的方法,其特征在于,所述方法包括以下步骤:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测。
优选地,步骤(1)中所述预后信息包括GVHD的发生时间、发生部位、严重程度和主要症状。
优选地,步骤(3)中所述筛选的标准为:(a)首先选取0-II度aGVHD和Ⅲ-IV度aGVHD组之间差异表达的单基因的AUC值最高的前20个基因和AUC值最低的前20个基因;(b)其次对(a)中的40个基因进行相关性分析,若相关性分数高于0.4,则保留其中AUC值最高的基因,排除其中其他基因,最后剩余的基因作为候选预测特征基因。
优选地,所述待测样本包括不同供者和受者的外周血单个核细胞。
优选地,所述外周血单个核细胞进行了混合淋巴细胞反应。
优选地,所述机器学习算法包括经典决策树模型、随机森林模型或支持向量机模型中任意一种。
第六方面,本发明提供了一种预测急性移植物抗宿主病的模型,所述预测急性移植物抗宿主病的模型由第五方面所述的构建预测急性移植物抗宿主病的模型的方法构建得到。
第七方面,本发明提供了一种预测急性移植物抗宿主病的装置,所述装置包括:
模型构建模块和预测模块;
所述模型构建模块用于执行包括:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测;
所述预测模块用于执行包括:
利用模型构建模块构建的预测急性移植物抗宿主病的模型预测待测样本急性移植物抗宿主病。
与现有技术相比,本发明具有如下有益效果:
(1)本发明使用全基因转录组表达水平来代表免疫细胞的活化,收集患者移植前各项常规指标外,加入混合淋巴细胞培养后的全基因转录组数据,并作为主要参考自变量,能显著提高机器学习算法预测GVHD的准确率,能够更精准预测aGVHD;
(2)本发明结合造血干细胞移植前供受者的HLA基因配型,可以选择更安全、有效的供者;
(3)本发明对造血干细胞移植后重度GVHD和其他严重并发症的发生具有非常高的预测准确性,有助于临床预防方案的实施。
附图说明
图1为本发明中造血干细胞移植后重度GVHD预测模型的构建过程图;
图2为在外部验证样本中,经典决策树模型对造血干细胞移植后各级GVHD的分类预测能力图;
图3为机器学习模型筛选的预测GVHD相关的特征基因集图;
图4为在外部验证样本中,随机森林模型对造血干细胞移植后各级GVHD的分类预测能力图;
图5为在外部验证样本中,支持向量机模型对造血干细胞移植后各级GVHD的分类预测能力图。
具体实施方式
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
实施例1
本实施例构建造血干细胞移植后重度移植物抗宿主病(GVHD)预测模型。
收集145对供受者外周血淋巴细胞混合培养后bulk RNA测序结果,对测序结果进行分析,获得每对供受者的淋巴细胞基因转录组表达水平,同时收集145例患者的预后信息,包括移植物抗宿主病的发生时间、发生部位、严重程度、患者移植后有无复发,有无死亡的情况。将145例患者数据随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者移植物抗宿主病的发病程度(0-I为轻度,II-IV为中重度)作为输出信息,使用ROC(受试者工作特征曲线)算法计算每个基因对GVHD的预测,计算每个基因预测GVHD的AUC数值,选取AUC>0.65和AUC<-0.35的基因作为候选基因。再根据每个候选基因在不同个体中的表达水平,筛选相关系数最低的50个基因,使用经典决策树算法、随机森林算法和支持向量机(SVM)算法构建多基因对GVHD的预测。最后使用测试组的基因表达数据和GVHD发病情况对三种机器学习模型进行测试,获得预测性能。
实施例2
经典决策树模型对造血干细胞移植后各级GVHD的分类预测能力评估。
在经典决策树模型中,我们计算并获得候选基因集的相对表达水平,患者的GVHD发病情况分为0-I、I-II、II-III和III-IV度,获得主要基因和GVHD严重程度的预测路线。如图2所示,通过关键基因的水平决策,经典决策树模型对GVHD分类的决策准确率超过90%。
实施例3
机器学习模型筛选的预测GVHD相关的特征基因集。
我们获取候选基因(50个基因)的表达水平与GVHD发生程度的对应关系后,使用随机森林算法和SVM算法筛选关键特征基因,根据递减基尼系数进行排序,如图3所示,获得最高的20个基因,作为机器学习预测模型特征基因,其中经典决策树的决策基因与机器学习预测模型特征基因存在大比例重合。
实施例4
随机森林模型对造血干细胞移植后各级GVHD的分类预测能力评估。
我们通过机器学习预测模型特征基因集与随机森林算法结合,构建预测造血干细胞移植后重度GVHD的随机森林预测模型,在训练集中,我们使用5次交叉验证的方法,将随机森林模型的参数进行优化,再使用验证集对训练好的随机森林模型进行验证,获得的预测性能如图4所示,预测准确率高达90%。
实施例5
支持向量机模型对造血干细胞移植后各级GVHD的分类预测能力评估。
我们通过机器学习预测模型特征基因集与SVM算法结合,构建预测造血干细胞移植后重度GVHD的SVM预测模型,我们使用SVM基本参数为:线性核心、cost=0.1。在训练集中,我们使用5次交叉验证的方法,将SVM模型的参数进行优化,再使用验证集对训练好的SVM模型进行验证,获得的预测性能如图4所示,预测准确率高达92%。
综上所述,本发明首次发现所述基因标志物能够预测急性移植物抗宿主病,基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物,还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测,能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
Claims (10)
1.一种预测急性移植物抗宿主病的基因标志物,其特征在于,所述基因标志物包括:
(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合,或,
(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。
2.权利要求1所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在制备急性移植物抗宿主病检测产品中的应用。
3.一种检测急性移植物抗宿主病的试剂盒,其特征在于,所述试剂盒包括用于检测权利要求1所述的预测急性移植物抗宿主病的基因标志物的试剂;
优选地,所述试剂包括核酸提取试剂和/或核酸纯化试剂。
4.权利要求1所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在构建预测急性移植物抗宿主病的模型或制备预测急性移植物抗宿主病的装置中的应用。
5.一种构建预测急性移植物抗宿主病的模型的方法,其特征在于,所述方法包括以下步骤:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测。
6.根据权利要求5所述的构建预测急性移植物抗宿主病的方法,其特征在于,步骤(1)中所述预后信息包括GVHD的发生时间、发生部位、严重程度和主要症状。
7.根据权利要求5所述的构建预测急性移植物抗宿主病的模型的方法,其特征在于,步骤(3)中所述筛选的标准为:(a)首先选取0-II度aGVHD和Ⅲ-IV度aGVHD组之间差异表达的单基因的AUC值最高的前20个基因和AUC值最低的前20个基因;(b)其次对(a)中的40个基因进行相关性分析,若相关性分数高于0.4,则保留其中AUC值最高的基因,排除其中其他基因,最后剩余的基因作为候选预测特征基因。
8.根据权利要求5-7任一项所述的构建预测急性移植物抗宿主病的模型的方法,其特征在于,所述待测样本包括:不同供者和受者的外周血单个核细胞;
优选地,所述外周血单个核细胞进行了混合淋巴细胞反应;
优选地,所述机器学习算法包括经典决策树模型、随机森林模型或支持向量机模型中任意一种。
9.一种预测急性移植物抗宿主病的模型,其特征在于,所述预测急性移植物抗宿主病的模型由权利要求5-8任一项所述的构建预测急性移植物抗宿主病的模型的方法构建得到。
10.一种预测急性移植物抗宿主病的装置,其特征在于,所述装置包括:
模型构建模块和预测模块;
所述模型构建模块用于执行包括:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测;
所述预测模块用于执行包括:
利用模型构建模块构建的预测急性移植物抗宿主病的模型预测待测样本急性移植物抗宿主病。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310592189.7A CN116497116A (zh) | 2023-05-23 | 2023-05-23 | 一种预测急性移植物抗宿主病的基因标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310592189.7A CN116497116A (zh) | 2023-05-23 | 2023-05-23 | 一种预测急性移植物抗宿主病的基因标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116497116A true CN116497116A (zh) | 2023-07-28 |
Family
ID=87316567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310592189.7A Pending CN116497116A (zh) | 2023-05-23 | 2023-05-23 | 一种预测急性移植物抗宿主病的基因标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116497116A (zh) |
-
2023
- 2023-05-23 CN CN202310592189.7A patent/CN116497116A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Der et al. | Single cell RNA sequencing to dissect the molecular heterogeneity in lupus nephritis | |
Chaussabel et al. | A modular analysis framework for blood genomics studies: application to systemic lupus erythematosus | |
US9752191B2 (en) | Gene expression profiles associated with chronic allograft nephropathy | |
CN110577998A (zh) | 预测肝癌术后早期复发风险分子模型的构建及其应用评估 | |
CN107532214A (zh) | 用于败血症诊断的方法 | |
CN110246539B (zh) | 一种免疫力水平评估的方法及装置 | |
CN111394456B (zh) | 早期肺腺癌患者预后评估系统及其应用 | |
CN101208602A (zh) | 脓毒症的诊断 | |
CN105219844A (zh) | 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 | |
CN112063699B (zh) | 一种用于研究hiv感染者免疫衰老机制的系统 | |
CN112313497A (zh) | 使用微流式细胞术诊断疾病的方法 | |
CN112831562A (zh) | 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒 | |
CN107208131A (zh) | 用于肺癌分型的方法 | |
WO2021219829A1 (en) | Cell-type identification | |
CN113234829A (zh) | 结肠癌预后评估基因集及其构建方法 | |
Beadle et al. | Application of the Banff Human Organ Transplant Panel to kidney transplant biopsies with features suspicious for antibody-mediated rejection | |
CN116497116A (zh) | 一种预测急性移植物抗宿主病的基因标志物及其应用 | |
CN114822827B (zh) | 一种慢性阻塞性肺疾病急性加重预测系统和预测方法 | |
CN111088360A (zh) | Pd1-ctla4和/或pdl2-ctla4在制备预测aml预后试剂盒中的应用 | |
CN116287204A (zh) | 检测特征基因的突变情况在制备静脉血栓栓塞症风险检测产品中的应用 | |
RU2715633C2 (ru) | Способ идентификации в иммунном репертуаре cdr3 участков, ассоциированных с заболеваниями | |
US20230028910A1 (en) | Method for diagnosing cutaneous t-cell lymphoma diseases | |
CN113584175A (zh) | 一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用 | |
CN113564246A (zh) | 单细胞测序作为标志物在制备诊断原发性干燥综合征中的应用 | |
WO2020236745A1 (en) | Immunorepertoire wellness assessment systems and methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |