CN116219007A - 检测结直肠癌的生物标志物组及其应用 - Google Patents
检测结直肠癌的生物标志物组及其应用 Download PDFInfo
- Publication number
- CN116219007A CN116219007A CN202211123798.XA CN202211123798A CN116219007A CN 116219007 A CN116219007 A CN 116219007A CN 202211123798 A CN202211123798 A CN 202211123798A CN 116219007 A CN116219007 A CN 116219007A
- Authority
- CN
- China
- Prior art keywords
- gene
- colorectal cancer
- areg
- zkscan3
- crc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 199
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 177
- 239000000090 biomarker Substances 0.000 title claims abstract description 39
- 101150036244 AREG gene Proteins 0.000 claims abstract description 70
- 101100489425 Homo sapiens ZKSCAN3 gene Proteins 0.000 claims abstract description 70
- 230000014509 gene expression Effects 0.000 claims abstract description 69
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 34
- 108090000623 proteins and genes Proteins 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 45
- 210000000265 leukocyte Anatomy 0.000 claims description 29
- 101150003028 Hprt1 gene Proteins 0.000 claims description 22
- 101000809450 Homo sapiens Amphiregulin Proteins 0.000 claims description 19
- 101000785655 Homo sapiens Zinc finger protein with KRAB and SCAN domains 3 Proteins 0.000 claims description 19
- 102100038778 Amphiregulin Human genes 0.000 claims description 17
- 102100026520 Zinc finger protein with KRAB and SCAN domains 3 Human genes 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 14
- 238000002360 preparation method Methods 0.000 claims description 12
- 239000003795 chemical substances by application Substances 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 238000011529 RT qPCR Methods 0.000 claims description 3
- 229940079593 drug Drugs 0.000 claims description 3
- 238000003762 quantitative reverse transcription PCR Methods 0.000 claims 2
- 230000035945 sensitivity Effects 0.000 abstract description 26
- 230000008901 benefit Effects 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 33
- 238000001514 detection method Methods 0.000 description 30
- 102000012406 Carcinoembryonic Antigen Human genes 0.000 description 29
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 29
- INZOTETZQBPBCE-NYLDSJSYSA-N 3-sialyl lewis Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]([C@H](O)CO)[C@@H]([C@@H](NC(C)=O)C=O)O[C@H]1[C@H](O)[C@@H](O[C@]2(O[C@H]([C@H](NC(C)=O)[C@@H](O)C2)[C@H](O)[C@H](O)CO)C(O)=O)[C@@H](O)[C@@H](CO)O1 INZOTETZQBPBCE-NYLDSJSYSA-N 0.000 description 27
- 206010028980 Neoplasm Diseases 0.000 description 25
- 210000004369 blood Anatomy 0.000 description 24
- 239000008280 blood Substances 0.000 description 24
- 201000002313 intestinal cancer Diseases 0.000 description 22
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 21
- 238000012216 screening Methods 0.000 description 21
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 15
- 201000011510 cancer Diseases 0.000 description 15
- 210000002865 immune cell Anatomy 0.000 description 15
- 101000896557 Homo sapiens Eukaryotic translation initiation factor 3 subunit B Proteins 0.000 description 13
- 101000988834 Homo sapiens Hypoxanthine-guanine phosphoribosyltransferase Proteins 0.000 description 13
- 238000003745 diagnosis Methods 0.000 description 13
- 239000000047 product Substances 0.000 description 11
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- 210000002966 serum Anatomy 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 101150028074 2 gene Proteins 0.000 description 8
- 238000003559 RNA-seq method Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000010839 reverse transcription Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 7
- 238000003753 real-time PCR Methods 0.000 description 7
- 238000010200 validation analysis Methods 0.000 description 7
- 238000007477 logistic regression Methods 0.000 description 6
- 239000013641 positive control Substances 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000004083 survival effect Effects 0.000 description 5
- 238000002123 RNA extraction Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 101001034838 Homo sapiens Interferon-induced transmembrane protein 10 Proteins 0.000 description 3
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 3
- 238000000540 analysis of variance Methods 0.000 description 3
- 239000000091 biomarker candidate Substances 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000002550 fecal effect Effects 0.000 description 3
- 230000004547 gene signature Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- NMWKYTGJWUAZPZ-WWHBDHEGSA-N (4S)-4-[[(4R,7S,10S,16S,19S,25S,28S,31R)-31-[[(2S)-2-[[(1R,6R,9S,12S,18S,21S,24S,27S,30S,33S,36S,39S,42R,47R,53S,56S,59S,62S,65S,68S,71S,76S,79S,85S)-47-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-phenylpropanoyl]amino]-4-oxobutanoyl]amino]-3-carboxypropanoyl]amino]-18-(4-aminobutyl)-27,68-bis(3-amino-3-oxopropyl)-36,71,76-tribenzyl-39-(3-carbamimidamidopropyl)-24-(2-carboxyethyl)-21,56-bis(carboxymethyl)-65,85-bis[(1R)-1-hydroxyethyl]-59-(hydroxymethyl)-62,79-bis(1H-imidazol-4-ylmethyl)-9-methyl-33-(2-methylpropyl)-8,11,17,20,23,26,29,32,35,38,41,48,54,57,60,63,66,69,72,74,77,80,83,86-tetracosaoxo-30-propan-2-yl-3,4,44,45-tetrathia-7,10,16,19,22,25,28,31,34,37,40,49,55,58,61,64,67,70,73,75,78,81,84,87-tetracosazatetracyclo[40.31.14.012,16.049,53]heptaoctacontane-6-carbonyl]amino]-3-methylbutanoyl]amino]-7-(3-carbamimidamidopropyl)-25-(hydroxymethyl)-19-[(4-hydroxyphenyl)methyl]-28-(1H-imidazol-4-ylmethyl)-10-methyl-6,9,12,15,18,21,24,27,30-nonaoxo-16-propan-2-yl-1,2-dithia-5,8,11,14,17,20,23,26,29-nonazacyclodotriacontane-4-carbonyl]amino]-5-[[(2S)-1-[[(2S)-1-[[(2S)-3-carboxy-1-[[(2S)-1-[[(2S)-1-[[(1S)-1-carboxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-5-oxopentanoic acid Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CSSC[C@H](NC(=O)[C@@H](NC(=O)[C@@H]2CSSC[C@@H]3NC(=O)[C@H](Cc4ccccc4)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](Cc4c[nH]cn4)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]4CCCN4C(=O)[C@H](CSSC[C@H](NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](Cc4c[nH]cn4)NC(=O)[C@H](Cc4ccccc4)NC3=O)[C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](Cc3ccccc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N3CCC[C@H]3C(=O)N[C@@H](C)C(=O)N2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](Cc2ccccc2)NC(=O)[C@H](Cc2c[nH]cn2)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)C(C)C)C(=O)N[C@@H](Cc2c[nH]cn2)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1)C(=O)N[C@@H](C)C(O)=O NMWKYTGJWUAZPZ-WWHBDHEGSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 101150093802 CXCL1 gene Proteins 0.000 description 2
- 101150059044 CXCL8 gene Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 102000006747 Transforming Growth Factor alpha Human genes 0.000 description 2
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000000601 blood cell Anatomy 0.000 description 2
- 230000017531 blood circulation Effects 0.000 description 2
- 238000007664 blowing Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002052 colonoscopy Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001839 endoscopy Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 230000008073 immune recognition Effects 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 102100034221 Growth-regulated alpha protein Human genes 0.000 description 1
- 101100163161 Homo sapiens AREG gene Proteins 0.000 description 1
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 1
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 description 1
- 102100040025 Interferon-induced transmembrane protein 10 Human genes 0.000 description 1
- 102100026236 Interleukin-8 Human genes 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 206010064390 Tumour invasion Diseases 0.000 description 1
- 238000011868 Wald Chi square test Methods 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013103 analytical ultracentrifugation Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 230000003305 autocrine Effects 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 230000009400 cancer invasion Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 210000001731 descending colon Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000035861 hematochezia Diseases 0.000 description 1
- 102000043494 human AREG Human genes 0.000 description 1
- 102000054436 human ZKSCAN3 Human genes 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 208000028774 intestinal disease Diseases 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000003226 mitogen Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 201000010879 mucinous adenocarcinoma Diseases 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000015581 negative regulation of autophagy Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000000101 novel biomarker Substances 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 230000009758 senescence Effects 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种检测结直肠癌的生物标志物组,包括AREG基因和ZKSCAN3基因。本发明还提供了检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。本发明还提供了一种检测结直肠癌的产品,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂。本发明的生物标志物组具有灵敏性高、特异性高和准确性高的优点,尤其适合用于早期结直肠癌的检测。
Description
技术领域
本发明涉及分子诊断技术领域,具体涉及一种检测结直肠癌的生物标志物组及其应用。
背景技术
结直肠癌(CRC)是全球最常见和最致命的癌症之一[1,2],其发病率在许多亚洲国家迅速上升[3]。CRC患者的存活率在很大程度上取决于诊断时的癌症分期。诊断为I期和II期肿瘤的CRC患者的5年生存率通常比较高,分别为91%和82%,但诊断为IV期肿瘤的患者的5年生存率通常急剧下降,仅为12%[4,5]。大多数CRC的发展本质上是缓慢和渐进的,因此如果能够及早发现并切除癌前息肉和早期肿瘤,则CRC是有可能治愈的[6]。不幸的是,大多数CRC是在晚期发现的,每年导致近100万人死亡[7]。因此,早期发现CRC对于降低高CRC死亡率至关重要。
目前,内镜检查结合活检病理检查仍然是临床CRC诊断的金标准[6,8]。结肠镜检查虽然可以有效检测CRC[9],但由于其侵入性、复杂的肠道准备和早筛需要重复检测[10],患者依从性较差。其他非侵入性筛查方法包括粪便免疫化学试验(FIT)、粪便潜血试验(FOBT)和血清生物标志物(如癌胚抗原(CEA)和碳水化合物抗原19-9(CA19-9))。然而,这些测试要么特异性较低,要么无法及时可靠地检测出早期CRC[11-13]。此外,基于特定突变和甲基化特征的粪便DNA检测也主要作为家庭检测提供,但由于其相对较高的成本和复杂的程序而尚未在临床中广泛使用[14,15]。
因此,临床急需一种准确、简单、安全和低成本的新型方法来检测早期CRC。
发明内容
本发明的发明目的是针对现有技术的缺陷,提供了一种检测结直肠癌的生物标志物组及其应用。
一方面,本发明提供了一种检测结直肠癌的生物标志物组,包括AREG基因和ZKSCAN3基因。
另一方面,本发明提供了检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。
可选地,所述结直肠癌是I期结直肠癌、II期结直肠癌、III期结直肠癌或IV期结直肠癌;优选地,所述结直肠癌是I期结直肠癌或II期结直肠癌;更优选地,所述结直肠癌是I期结直肠癌。
可选地,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
可选地,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物。
可选地,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQ ID NO:5和SEQ ID NO:6的序列。
可选地,检测结直肠癌的方法包括:
获得受试者的血液白细胞;
测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,根据公式HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量;
将HIR-CRC得分与截止值进行比较以确定受试者是否患有结直肠癌;其中,所述截止值是0.5;当HIR-CRC得分大于0.5时,确定受试者患有结直肠癌。
另一方面,本发明提供了一种检测结直肠癌的产品,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂。
可选地,所述产品是试剂盒、药物、基因芯片或检测试纸。
可选地,所述产品是试剂盒。
可选地,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
可选地,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物。
可选地,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQ ID NO:5和SEQ ID NO:6的序列。
有上述技术方案可知,本发明的检测结直肠癌的生物标志物组及其应用,至少具有如下优点:
本发明的生物标志物组的检测性能不依赖于受试者的疾病状态,也不依赖于受试者的CEA或CA19-9的水平,具有灵敏性高、特异性高和准确性高的优点。
本发明的检测方法改善了目前结直肠癌筛查主要依靠影像学检查技术和CEA或CA19-9检测存在的不足,降低了结直肠癌的漏检率,尤其适合用于早期结直肠癌的检测。
使用本发明的生物标志物组对受试者进行的检测是非侵入性的方法,操作方法简单、成本低廉,并且不会对受试者造成任何危害。
附图说明
图1是实施例1的研究工作流程图。实施例1的研究共招募了514名受试者。进行RNA-seq以比较10个CRC和12个HC样本之间白细胞的整个转录组,以发现与CRC相关的白细胞基因。在最初的95个样本队列中,确定了一个最小的2基因特征,以有力地区分CRC和HC。开发了基于2基因特征的RT-qPCR测定。临床敏感性和特异性首先在314个样本的扩展训练队列中进行评估,其中包括来自初始识别队列的95个样本。随后在一个包含178个样本的独立队列中进行了验证。
图2显示了白细胞中与CRC相关的基因特征及对比。其中,(A)火山图显示10个CRC与12个HC样本中显着差异表达的基因,使用RNA-seq检查。141个显着差异表达的基因在两个上侧象限中显示,绝对倍数变化>2,FDR p值<0.05。(B)使用基于CRC相关基因中表达最高的十个基因的无监督Pearson层次聚类显示不同CRC簇的热图。(C)至(G)点图显示了当使用RT-qPCR进行测量并在95个样本的识别队列中针对HPRT1进行标准化时,与HC个体相比,CRC患者的白细胞中的AREG(C)、CXCL1(D)、CXCL8(E)和IFITM10(F)的转录物表达显着增加,并且ZKSCAN3(G)的转录物表达显着降低。***p<0.001。
图3显示了2基因特征的识别、训练和测试以检测HC中的CRC。(A)ROC曲线,采用RT-qPCR测量并且相对于HPRT1使用ΔCt相对定量进行标准化,该曲线显示了在由47个CRC和48个HC组成的95个样本的识别队列中用于区分CRC和HC的5个候选生物标志物和2-基因特征(AREG和ZKSCAN3组合)。(C)2-基因特征稳定性的自举验证,如校准曲线所示。理想线代表完美校准。明显的线本发明的数据,误差校正代表2-基因特征的自举校正校准,显示非常小的平均绝对误差0.01。(D)ROC曲线显示AREG、ZKSCAN3和AREG&ZKSCAN3组合使用RT-qPCR测定法在178个样本的独立验证队列中区分CRC和HC。为每个分析提供曲线下面积(AUC)、95%置信区间(CI)和p值。
图4显示了3种RNA特征在检测早期、CEA阴性和CA19-9阴性CRC方面具有稳定性。(A)和(B)使用RT-qPCR测量的显示206个CRC和286个HC组成的492个样本的总体队列中AREG(A)和ZKSCAN3(B)表达的点图。(C)显示HIR-CRC得分的点图,其是使用从同一总体队列中AREG和ZKSCAN3表达得出的逻辑回归方程计算的。(D)至(F)显示根据不同肿瘤阶段(D)、CEA状态(E)和CA19-9状态(F)分类的HC和CRC中的HIR-CRC得分的点图。
具体实施方式
为了充分了解本发明的目的、特征及功效,通过下述具体实施方式,对本发明作详细说明。本发明的方法除下述内容外,其余均采用本领域的常规方法或装置。
除非另有说明,否则本发明中涉及的技术和科学术语均具有本领域技术人员通常理解的含义。以下参考文献将向本领域技术人员提供本发明所用许多术语的一般定义:吴乃虎,黄美娟.分子遗传学原理.化学工业出版社,2015;朱圣庚,徐长法.生物化学(第4版).高等教育出版社,2016;丁明孝等.细胞生物学(第5版).高等教育出版社,2020;J.E.克雷布斯著,江松敏译.Lewin基因XII.科学出版社,2021;Robert F.Weaver著,郑用琏等译.分子生物学(原著第五版).科学出版社,2021;B.艾伯茨等著,丁小燕等译.细胞生物学精要(原书第三版).科学出版社,2021。本领域的技术人员将认识到可用于本发明实践的与本文所述的那些方法和材料相似或等效的许多方法和材料。实际上,本发明决不限于所述的方法和材料。
在本发明中,“结直肠癌”或者“结肠直肠癌”(Colorectal Cancer,CRC),是胃肠道中常见的恶性肿瘤,可以发生在结肠或直肠的任何部位,通常以直肠、乙状结肠最为多见,其余依次是盲肠、升结肠、降结肠和横结肠。癌瘤大多数为腺癌,少数为鳞状上皮癌及粘液癌。CRC可以通过淋巴、血液循环及直接蔓延等途径扩散到其他组织和脏器。根据肿瘤侵犯肠壁的深度、是否有淋巴转移以及是否有远处转移,可将CRC分为四期,即I期、II期、III期和IV期,其中,I期、II期是早期,治疗效果较好,III期和IV期晚期,治疗效果差。
生物标志物组
早期CRC有可能治愈,因此CRC监测对于改善CRC患者的预后和生存至关重要。CRC筛查方法通常有两大类。一种策略是通过影像学检查,结肠镜检查是CRC诊断的金标准。然而,结肠镜检查不是一种有效的高侵入性筛查方法。其他常规成像方法,如CT、MRI和PET-CT也正在评估中,但由于其高成本和辐射风险,尚未在临床上推荐。另一种策略是通过筛查CRC相关症状或肿瘤衍生的生物标志物。FIT和FOBT筛查粪便中是否存在血液,但这些方法对CRC(25-38%)和晚期腺瘤(16-31%)的敏感性较差。CEA和CA19-9是用于CRC筛查的血液生物标志物的代表性例子。但是,经过发明人的研究,CEA和CA19-9对检测CRC的敏感性分别为39%和21%。CEA和CA19-9在检测早期CRC方面尤其差,灵敏度分别为33%和9%(如表3所示)。这与之前的报道一致,即I期和II期CRC的CEA阳性率为6.3%-33%,CA19-9阳性率为7.4%-11%。其他新的生物标志物,如DNA突变、DNA甲基化、非编码RNA以及粪便和血液中的外泌体蛋白还有待在临床环境中进行大规模评估。基于肿瘤衍生生物标志物的筛查方法的主要问题是这些生物标志物在早期CRC中的丰度低,导致对CEA和CA19-9等常规检测的敏感性低,或者,诸如粪便样本准备与测序的复杂检测过程的成本高昂。因此,值得探索新的筛查策略,以便在可能的治疗选择的早期阶段实现安全、简单和稳健的CRC检测。
人体免疫细胞执行免疫识别和监视功能,它们代表了新的潜在生物标志物,用于监测人类健康。最近的研究表明,诸如外周血单核细胞或组织巨噬细胞的免疫细胞内的特异性表达变化与诸如癌症和传染病的疾病有关。在本发明中,发明人进行了全转录组RNA-seq以鉴定血液白细胞中与CRC相关的差异基因表达。经过研究,发明人最终确定了一个最小的两基因特征,以将CRC与健康对照区分开来。
第一方面,本发明提供了一种检测结直肠癌的生物标志物组,包括AREG基因和ZKSCAN3基因。
在本发明中,AREG基因是表皮生长因子(EGF)家族的成员,它是一种重要的自分泌生长因子,也是星形胶质细胞、雪旺细胞和成纤维细胞的有丝分裂原。它是表皮生长因子(EGF)的配体,与转化生长因子α(TGF-α)有关。这种蛋白质与表皮生长因子受体(EGFR)相互作用以促进正常上皮细胞的生长。人源AREG的基因代码是314,mRNA编码是NM_001657.4,序列为SEQ ID NO:7,如下:
>NM_001657.4 Homo sapiens amphiregulin(AREG),mRNA
AGACGTTCGCACACCTGGGTGCCAGCGCCCCAGAGGTCCCGGGACAGCCCGAGGCGCCGCGCCCGCCGCCCCGAGCTCCCCAAGCCTTCGAGAGCGGCGCACACTCCCGGTCTCCACTCGCTCTTCCAACACCCGCTCGTTTTGGCGGCAGCTCGTGTCCCAGAGACCGAGTTGCCCCAGAGACCGAGACGCCGCCGCTGCGAAGGACCAATGAGAGCCCCGCTGCTACCGCCGGCGCCGGTGGTGCTGTCGCTCTTGATACTCGGCTCAGGCCATTATGCTGCTGGATTGGACCTCAATGACACCTACTCTGGGAAGCGTGAACCATTTTCTGGGGACCACAGTGCTGATGGATTTGAGGTTACCTCAAGAAGTGAGATGTCTTCAGGGAGTGAGATTTCCCCTGTGAGTGAAATGCCTTCTAGTAGTGAACCGTCCTCGGGAGCCGACTATGACTACTCAGAAGAGTATGATAACGAACCACAAATACCTGGCTATATTGTCGATGATTCAGTCAGAGTTGAACAGGTAGTTAAGCCCCCCCAAAACAAGACGGAAAGTGAAAATACTTCAGATAAACCCAAAAGAAAGAAAAAGGGAGGCAAAAATGGAAAAAATAGAAGAAACAGAAAGAAGAAAAATCCATGTAATGCAGAATTTCAAAATTTCTGCATTCACGGAGAATGCAAATATATAGAGCACCTGGAAGCAGTAACATGCAAATGTCAGCAAGAATATTTCGGTGAACGGTGTGGGGAAAAGTCCATGAAAACTCACAGCATGATTGACAGTAGTTTATCAAAAATTGCATTAGCAGCCATAGCTGCCTTTATGTCTGCTGTGATCCTCACAGCTGTTGCTGTTATTACAGTCCAGCTTAGAAGACAATACGTCAGGAAATATGAAGGAGAAGCTGAGGAACGAAAGAAACTTCGACAAGAGAATGGAAATGTACATGCTATAGCATAACTGAAGATAAAATTACAGGATATCACATTGGAGTCACTGCCAAGTCATAGCCATAAATGATGAGTCGGTCCTCTTTCCAGTGGATCATAAGACAATGGACCCTTTTTGTTATGATGGTTTTAAACTTTCAATTGTCACTTTTTATGCTATTTCTGTATATAAAGGTGCACGAAGGTAAAAAGTATTTTTTCAAGTTGTAAATAATTTATTTAATATTTAATGGAAGTGTATTTATTTTACAGCTCATTAAACTTTTTTAACCAAA
应当说明的是,在本发明中,“AREG基因”包括AREG基因以及AREG基因的任何功能等同物的多核苷酸,例如,包括:(1)如SEQ ID NO:7所示的核苷酸序列,(2)在严格条件下与SEQ ID NO:7所示的核苷酸序列杂交且编码相同功能蛋白质的核苷酸序列,(3)与(1)或(2)中限定的核苷酸序列具有至少70%、优选至少80%、更优选至少90%且最优选至少95%以上同源性并且编码相同功能蛋白质的核苷酸序列。
在本发明中,ZKSCAN3基因是具有KRAB和SCAN域的锌指3基因,具有启用DNA结合转录抑制活性,RNA聚合酶II特异性;RNA聚合酶II顺式调节区序列特异性DNA结合活性;和染色质结合活性。参与多个过程,包括自噬的负调控;细胞衰老的负调控;和转录调控,以DNA为模板。位于细胞质和核质中。人源ZKSCAN3的基因代码是80317,mRNA编码是NM_001242894.2,序列为SEQ ID NO:8,如下:
>NM_001242894.2 Homo sapiens zinc finger with KRAB and SCAN domains 3(ZKSCAN3),transcript variant 1,mRNA
GCTAGTTTCAAGCACTTTGTGAGTATGGGGTGAATCGGCGTCGGCCTTCCACTGTGGGGTTAAATCTCATCCCGCGGCTCTCCTCCTGTCGGTCCTGCAGTTCTTTTGTCCCCGGGTAGAGGGCCGTTACCGAGTGTCCGGGTCGGTTCTTGAGGGTATTTGGAGACGGGATGCATGGGTCACATAGACAAGCCTCGAGAATGGGAGCCGTTACATTTTTGCACTGCCTGGTAACAAGGGATCTTCTGCAGAAATAGCGCTGGAAGCTAGAGTGAGGCCTGAGTACTGCCTTGGCCTAGGATGGCTAGAGAATTAAGTGAAAGCACAGCCCTGGATGCCCAGTCTACAGAAGACCAGATGGAGCTTCTGGTCATAAAGGTGGAGGAAGAAGAAGCCGGTTTTCCCAGTAGCCCAGATCTGGGTTCTGAGGGCTCCCGCGAGCGCTTCCGAGGCTTCCGCTACCCGGAGGCTGCAGGCCCCCGCGAGGCGCTGAGTCGGCTCCGAGAGCTCTGCCGACAGTGGCTGCAGCCTGAGATGCACAGCAAGGAGCAGATCCTGGAGCTGCTGGTGCTGGAGCAGTTCCTGACCATCCTGCCGGGGAATCTGCAGAGCTGGGTGCGGGAGCAGCATCCAGAGAGCGGGGAGGAGGTGGTGGTGCTATTGGAGTATTTGGAGAGGCAGCTGGATGAGCCGGCGCCGCAGGTTTCAGGTGTTGACCAGGGGCAAGAACTGCTCTGTTGCAAGATGGCACTATTGACACCAGCCCCAGGGTCACAAAGTAGCCAATTTCAGCTAATGAAGGCTCTGCTCAAGCATGAATCTGTGGGATCCCAGCCTTTACAAGATAGAGTTCTCCAGGTCCCCGTGCTTGCCCATGGAGGATGCTGCAGAGAAGATAAAGTGGTAGCTTCTAGGCTTACTCCAGAGTCCCAGGGGTTGTTGAAAGTGGAAGATGTGGCCCTGACCCTCACCCCTGAATGGACACAGCAGGATTCATCTCAGGGGAATCTCTGTAGAGATGAAAAGCAGGAGAACCATGGCAGCCTGGTCTCCCTGGGTGATGAAAAACAGACTAAGAGCAGGGACTTGCCTCCAGCTGAGGAGCTTCCAGAAAAGGAGCATGGGAAGATATCGTGCCACCTGAGAGAAGACATTGCCCAGATTCCTACATGTGCAGAAGCTGGTGAACAGGAGGGCAGGCTACAAAGAAAGCAGAAAAATGCCACAGGAGGGAGGCGGCACATCTGCCATGAATGTGGAAAGAGTTTTGCTCAAAGCTCAGGCCTGAGTAAACACAGGAGAATCCACACTGGTGAGAAACCCTACGAATGTGAAGAGTGTGGCAAAGCCTTCATTGGGAGCTCTGCCCTTGTCATTCATCAGAGAGTCCACACTGGTGAGAAGCCATATGAGTGTGAAGAATGTGGTAAGGCCTTCAGTCATAGCTCAGACCTTATCAAGCATCAGAGAACCCACACTGGGGAGAAGCCCTATGAGTGTGATGACTGTGGGAAGACCTTCAGCCAGAGCTGCAGCCTCCTTGAACATCACAGAATCCACACTGGGGAGAAGCCGTATCAGTGCAGTATGTGTGGCAAAGCCTTTAGGCGAAGTTCACATCTCCTGAGACATCAGAGGATCCATACTGGGGATAAAAATGTTCAGGAACCTGAGCAGGGAGAGGCCTGGAAAAGTAGGATGGAAAGCCAGTTGGAAAATGTTGAAACTCCCATGTCTTATAAATGTAATGAGTGTGAAAGAAGTTTCACTCAGAATACAGGCCTCATTGAACATCAAAAAATCCACACTGGTGAGAAACCCTATCAGTGTAATGCGTGTGGAAAAGGCTTCACCCGAATTTCATACCTTGTTCAACATCAGAGAAGCCATGTAGGGAAAAACATCCTATCACAGTGACCCATGCCATACATGCCAGAGTTGGTGCTCATTTGTCACTGATCTGAAGCCACTCCCCCTGGAGTCTCAACTATAGAAATTGTGGGCTGGGCTTTATTTACCACTACACATTATCAGGTGTTAGAAAATGTAGACTGGGTTAGACAAATTATCTTCTAAGTTCTAGAAGGGGTTTGTAATCAAAACATATTTGATAGGAGGCTACGGGAGAGTTGTCTAGAAGAGGTAAGACCTGAAACTGTTTGTTCTCTCCCACTAGAATTAAATGGATGTTTAGACTGGCTACTTGCCCTAAACCAGCACTTGGTGATGTCTACTGGGTGGATGGTTGTGATTTGGGGGCTGCTTCTCTGACCATTCTTTTTGACTGTAATGAATCCTCCACAGTTGGTCAGATTCATAAAGTCTTATATCCCCCTCTGTGCCTTTTCTGCAGGTGCTAATAAATGTTTATTGAATGTACCAGTGAGATTACCTTCATAGATCTGAAAATCTGATGTTATCCAGGTTTCTGAAGAACTTCTCGCCAAGGCCATTTGTGCTTGTGTCCAATTCTCTGACCTAGATTGTGACTCAATCTAGTGTGTTTCTTACCAAGTACATAGGCAGAGCAGGGTTACTGTGATTGAAAGAATCCATTTTTTTTTTGGAGACGTAGTCTTGCTCTGTCGCCCAGGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGATTACAGGTGTGTGCCACCATGCCCGGCTAATTTTTTATGTTTTTAGTAGAGACGGGATTTTACCGTGTTAGCCAGGATGGTCTCGATCTCCTAACCTCATGATCCTCCTGCCTCAGCCTACCAAAGTGCTGGGATTACAGGCATGAGCCACCATGCCCGGCCAAGAATCCATATTTCTTTACCAGACTAGGAATTCTATTCTAGTGCAAATGCCTTAAAAAGCTTATCACTAAATCATTACGAATGTGTGCCATCCGTGGAATTGCTTTTTTTTTTTTTTTTTTGTAAATATGAGGTCTCACTATGTTGCCCAGGCTGGTCTCGAAATCCTGGGCAATCCTCCTGCCTCACCCTCTCAAGTACTGGAATTACAGGCGTGAGCCACCATACCCAGCCCAAATTTCACTCTTTAATGTTTTCCTGTTGCTATTCTTTAAGGAAAAAACTTTCCTATTCAGACAGTGTGAAAATCAGTCATCAAGTCAGAATAAAATGATGAATATTCTAATGCTCAGTATCTTAGTTCTCTCGGGCCTAACCAATGCCTCCTAAAACAATAGATACTATCCTGCCCCACCCTACCACCCAACACACACTGTATAGTAAACTGCATCAAAACTTATTCCTGCTAAGTTCATACTTTCTCCAGCTCAATGGATTCACACCAAATTTTTTTTTTTTTTTTTAGACGGAGTCTTCTCTGTCACCCAGGCTGGAGTGCAGTGGCGCGATCTCGGCTCACTGCAAGCTCCGCCTCCCAGGTTCCTGCCATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTATAGGCGTCCGCCTCCACGCCGGGCTATTTTTTTTTTTTATTTTATACTTTAAGTTCTAGGGTACATGTGCACAACGTGCAGGTTTGTTACATATGTATACATGTGCCATGTTGGTGTGCTGCACCCATTAACTCGTCATTTACATTGGGTGTATCTCCTAATGCTTTCCCTCCCCCCACCCCACAACAGGCCCCAGTGTGTGATGTTCCCCTTCCTGTGTCCAAGTGTTCTCCTTATTCAATTCCCACCTATGAGTGAGAATATGCCGTGTTTGATTTTTTGTTCTTGGCGATAGTTTGCTGAGAATGATGAGACGAGGTTTCACTGTGTTAGCCAGGATGCTCTCGATCTCCTGACCTCGTGATCCACCTGTCTCGGCCTCCCAAAATGCTGGGATTACAGGCGTGAGCCACCGCGCCCGGCCCAAGTATCACTTATGGTTTCAGAACGCCATTATTAGTGTCTGACTGTCTTGGTCTTCTTATACATTGATTCCCAAATCACGTGTGGTAACAGCATCTCAATTTTTCATGATGACGGTTTGAACCATTAATTTAATTCCTCAGGCTATCTACTTTTTTGTTAAACATACTGTGTAGACCATCTTTTTTTTTTCCCATCATGATAGTCAAAATTTTAGTCTGTGTATTCAAGTGAGAAAATTTTTAGTCAGCATTATACAAGTAGTATTTATTATGTATACATTCAGTGGAGTTGTTTCTACAAAAGTATTTCGGAATGACTATTCTGCTGCAAACTTTTGTGTAAGCGCTTCACCTTATTCCTACAATAAGGAGAAGTGCACTAACAAAATGAACAATGCAGCAAGGGCTTCAGTCGCAGCTCAGGTCTTATCAAACACCAGAGAACCCTCAATGGGAGAAGCCTTATGAGTGTGACAACTGTGGAAAGACAGTTCCTTTTTTGTTAGTATCACTTCTACTTATTGTAGAAATATGCTTTCATTATTGCATCTACTCACATTTCTCACTCGGTTTCTGGCACCAGCAATCTCTTCCATATTTATAATATCAGTCAAAAACTCTGGAATTCAAATATAACAAGACTTTTCTGGTCACCTTTGATAGTTAATGACTTGGGCATTGTGATATATTATCTCCTGCTGTATGTATTTTGTTTAGTAGAAATTGAATCATTATCCACAATCCTTTATAGAACTATCCAAGTCCCTGTTTTTATGCTAGTTTCCAAGGCTTGGTCCTTCAAGGTTTTCAGGGATCTAGGGGACACAAATCTAACAAATCCTAATGTATATTATTTGTATTATAGTAATAAACCATATGGTTACTTTG
应当说明的是,在本发明中,“ZKSCAN3基因”包括ZKSCAN3基因以及ZKSCAN3基因的任何功能等同物的多核苷酸,例如,包括:(1)如SEQ ID NO:8所示的核苷酸序列,(2)在严格条件下与SEQ ID NO:8所示的核苷酸序列杂交且编码相同功能蛋白质的核苷酸序列,(3)与(1)或(2)中限定的核苷酸序列具有至少70%、优选至少80%、更优选至少90%且最优选至少95%以上同源性并且编码相同功能蛋白质的核苷酸序列。
本发明的生物标志物组可以用于检测各个阶段的结直肠癌,包括I期结直肠癌、II期结直肠癌、III期结直肠癌和IV期结直肠癌。由于本发明的生物标志物组具有灵敏性高、特异性高和准确性高的特点,因此本发明的生物标志物组优选适合于I期结直肠癌和II期结直肠癌的筛查,并且尤其优选适合于I期结直肠癌的筛查。
在本发明中,发明人没有寻找直接源自肿瘤的生物标志物,而是专注于循环血液白细胞,这是人体免疫系统的重要细胞成分。以前的研究表明,各种免疫细胞内基因表达的特定变化可以为疾病提供新的诊断潜力。在本发明中,发明人假设CRC的发生会触发血液白细胞内特定基因的表达变化,而这种基因特征又可以用于检测CRC。为此,发明人比较了CRC与HC样本中血液白细胞的转录组,并确实确定了血细胞内与CRC相关的基因表达特征(如图2所示)。经过深入研究,发明人最终确定,血液白细胞中AREG基因和ZKSCAN3基因的基因特征的改变发生在肿瘤发生的早期阶段,并在肿瘤进展过程中持续存在。
进一步,发明人经过研究之后推测,来自早期恶性肿瘤块的少量CRC细胞可以触发持续的免疫识别并通过血液循环放大。发明人的这一假说与AREG和ZKSCAN3都是在血细胞中起重要作用的免疫相关基因的观察结果一致。AREG过度表达经常在人类癌症的血清和组织中发现,而组织ZKSCAN3则作为自噬的主要转录抑制因子发挥作用。在本发明中,发明人发现血液白细胞中AREG基因和ZKSCAN3基因的差异表达与CRC的发生有关(如图4的(A)和(B)所示)。发明人的研究提供了早期证据,表明血液白细胞中AREG基因和ZKSCAN3基因的基因表达变化是检测CRC且尤其是早期CRC的有用策略。
生物标志物组的应用
第二方面,本发明提供了检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。
优选地,检测AREG基因和ZKSCAN3基因的表达水平的试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
更优选地,通过RT-qPCR技术检测上述生物标志物组的试剂包括扩增AREG基因和ZKSCAN3基因的特异性引物。更优选地,通过RT-qPCR技术检测上述生物标志物组的试剂还包括扩增HPRT1基因的特异性引物。
更优选地,检测生物标志物组的试剂是AREG基因和ZKSCAN3基因以及内参基因HPRT1的特异性引物SEQ ID NO:1至SEQ ID NO:6。具体如下:
发明人基于AREG基因和ZKSCAN3基因的应用进一步开发了一种简单而可靠的RT-qPCR检测方法,用于检测血液白细胞中AREG基因和ZKSCAN3基因的表达水平,并且,基于血液白细胞中AREG基因和ZKSCAN3基因的表达水平还可以进一步检测结直肠癌。
第三方面,本发明提供了一种检测AREG基因和ZKSCAN3基因的表达水平的方法,包括:
步骤S101:获得受试者的血液白细胞。
具体地,从受试者获得全血样本,例如,静脉外周血全血样本。对全血样本进行处理以获得白细胞,对全血样本进行处理的具体方法可以参考现有技术中的方案实施,例如,可以使用市售的样品制备试剂盒对全血样本进行裂解、离心、沉淀等处理以获得血液白细胞。
步骤S102:测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,计算HIR-CRC得分。
具体地,提取血液白细胞的总RNA,以总RNA合成cDNA,总RNA的提取和cDNA的合成都可以参考现有技术中的方案实施,例如,可以使用市售的试剂盒来完成。
合成cDNA之后,以cDNA为模板进行PCR以获得AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量。具体是,使用比较循环阈值(Ct)方法,将AREG基因和ZKSCAN3基因与细胞内参照基因HPRT1做标准化对比,候选基因的标准化表达-dCt=HPRT1基因的Ct值-候选基因的Ct值。
利用AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量计算HIR-CRC得分,采用的公式为HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量。其中,“^”后面的表达式位于e的平方处,例如,“e^A”表示“eA”,即e的A次方。
借助于HIR-CRC得分,能够显示出AREG基因和ZKSCAN3基因的表达水平。
第四方面,本发明提供了一种检测结直肠癌的方法,包括:
步骤S201:获得受试者的血液白细胞。
具体地,从受试者获得全血样本,例如,静脉外周血全血样本。对全血样本进行处理以获得白细胞,对全血样本进行处理的具体方法可以参考现有技术中的方案实施,例如,可以使用市售的样品制备试剂盒对全血样本进行裂解、离心、沉淀等处理以获得血液白细胞。
步骤S202:测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,计算HIR-CRC得分。
具体地,提取血液白细胞的总RNA,以总RNA合成cDNA,总RNA的提取和cDNA的合成都可以参考现有技术中的方案实施,例如,可以使用市售的试剂盒来完成。
合成cDNA之后,以cDNA为模板进行PCR以获得AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量。具体是,使用比较循环阈值(Ct)方法,将AREG基因和ZKSCAN3基因与细胞内参照基因HPRT1做标准化对比,候选基因的标准化表达-dCt=HPRT1基因的Ct值-候选基因的Ct值。
利用AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量计算HIR-CRC得分,采用的公式为HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量。其中,“^”后面的表达式位于e的平方处,例如,“e^A”表示“eA”,即e的A次方。
步骤203:将HIR-CRC得分与截止值进行比较以确定受试者是否患有结直肠癌。
具体地,截止值是0.5。当HIR-CRC得分大于0.5时,表示受试者患有结直肠癌,否则,表示受试者未患有结直肠癌。
按照约登指数(Youden index)方法的建议,选择0.5作为截止值,从而能够最大限度地提高敏感性和特异性的临床表现。
用于检测结直肠癌的产品
第五方面,本发明提供了一种检测结直肠癌的产品,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂。检测结直肠癌的产品可以是试剂盒、药物、基因芯片或检测试纸。
其中,试剂盒是基因检测试剂盒,包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
其中,药物可以是具有如下特点的制剂:该制剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂,并且,该制剂能够用于检测AREG基因和ZKSCAN3基因的表达水平。
其中,基因芯片包括:i)固相载体,ii)探针,该探针固定于固相载体并能够与AREG基因和ZKSCAN3基因的核酸序列杂交。
其中,检测试纸包括:i)试纸载体,ii)固定在试纸载体上的核酸,该核酸能够检测AREG基因和ZKSCAN3基因的表达水平。
在一种优选的具体实施方式中,检测结直肠癌的产品是试剂盒,包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
优选地,采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂包括扩增AREG基因和ZKSCAN3基因的特异性引物。更优选地,采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂还包括扩增HPRT1基因的特异性引物。
更优选地,检测AREG基因和ZKSCAN3基因的试剂是AREG基因和ZKSCAN3基因以及内参基因HPRT1的特异性引物SEQ ID NO:1至SEQ ID NO:6。具体如下:
可选地,本发明的试剂盒还可以包括阴性对照和阳性对照。其中,阴性对照可以是无核酸酶水,阳性对照可以是人工配制的截止值大于0.5的人造样本。
应当说明的是,本发明的试剂盒还可以包括其它适用组分,例如,测量工具、稀释剂、缓冲剂、酶、药学上可接受的载体、注射器或将易于由本领域技术人员认识到的其它适用附件,本领域技术人员能够根据预定目的进行合理选择和配制。可选地,本发明的试剂盒还包括使用说明书。“使用说明书”通常包括描述在使用试剂盒的组分来实现所需结果时采用的技术的明确表述,所需结果例如是检测AREG基因和ZKSCAN3基因的表达水平。
实施例
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例1:用于检测结直肠癌的生物标志物的筛选
1.样本来源
研究对象分为健康对照(HC)组和原发性结直肠癌(CRC患者)组,从这些研究对象的全血样本中通过红血细胞裂解法得到有核的白血细胞。
健康对照组的全血样本收集自绍兴市上虞人民医院体检中心进行例行年度体检的志愿者,检验结果无严重疾病并没有肠病史。
原发性结直肠癌患者(治疗前)的血液样本分别收集自青岛大学附属医院、杭州师范大学附属医院和湖南省肿瘤医院。所有CRC病例均通过术后或活检组织样本的病理学检测证实。
所有样本均按照相关机构审查委员会批准的方案采集,采集样本前需征得所有受试者的知情同意。
2.方法
按照图1所示的流程进行如下操作:
2.1在最初的发现阶段,有22个(10个CRC,12个HC)样本用来筛选区别HC和CRC患者的生物标志物。
血样收集和循环免疫细胞的纯化
在医院由专业护士抽取2ml静脉血,装在EDTA-K2采血管中(三力EDTAK2,湘械注准20152220045),并马上颠倒混匀,在4℃保存。全血采血后需在4小时内使用样本预处理试剂盒(积准生物,浙绍械备20210096)进行预处理。取1ml EDTA-K2处理过的全血与10毫升试剂A充分混匀,室温静置10分钟。室温离心300g,5分钟,沉淀循环免疫细胞。加10毫升冷藏试剂B,移液枪反复吹打5次,使沉淀充分混匀。再次室温离心300g,5分钟,沉淀循环免疫细胞。弃上清,把循环免疫细胞沉淀用700微升的试剂C充分溶解,负80度冰箱保存至RNA提取。
RNA提取,制库和RNA-seq二代测序
循环免疫细胞的总RNA通过肠癌早筛试剂盒进行提取。提取后的RNA通过ND1000 nanodrop分光分度仪(Thermo Scientific,USA)定量,并通过AgilentBioanalyzer 2100(Agilent,USA)对RNA的完整度(RIN)进行评估。浓度大于100纳克/微升和RIN评估大于8的RNA样本通过Single Cell/Low Input RNA Library PrepKit for Illumina制备转录组文库,在illumina Novaseq测序仪上得到每个样本大于12Gb的转录组测序(RNA-Seq)数据。原始fastq数据通过Partek Flow(Partek,USA)的STAR分析流程,得到全转录组内的基因RNA表达的量化数据。通过ANOVA对CRC和HC的外周血内白血细胞RNA表达的分析,得到针对CRC的特异的RNA水平的生物标志物。候选基因(即候选生物标志物)要满足以下条件:CRC与HC样本的对比中,上调基因的倍数要大于2,下调基因的倍数要小于-2,p值小于0.01。最终有10个基因被选择进行RT-qPCR验证。
2.2在95个(47个CRC,48个HC)样本中识别2-基因特征
为了评估这5个基因的诊断价值,发明人对一组95个(47个CRC和48个HC)的识别组样本做了RT-qPCR,并以HPRT1作为内参计算-dCt的标准化表达值。并进行单因素ROC分析和多因素二元逻辑回归分析。
2.3在314例(134例CRC和180例HC)样本的训练组中建立了一种基于RT-qPCR技术的检测方法,建立HIR-肠癌诊断方法(HIR即人类免疫应答(Human Immune Response));
通过RT-qPCR方法对于RNA-Seq所发现的候选生物标志物进行验证。
用于RT-qPCR验证的引物序列如下:
200纳克的总RNA通过肠癌早筛试剂盒逆转录成cDNA,并对1/50的逆转录cDNA产物进行检测。使用比较循环阈值(Ct)方法,将候选基因的表达与细胞内参照基因(HPRT1)做标准化对比,在后续分析中应用-dCt作为候选基因的标准化表达量。候选基因的标准化表达,-dCt=HPRT1基因的Ct值-候选基因的Ct值。
从134例CRC和180例HC样本中得到的每个候选基因对比参照基因的相对于内参HPRT1的标准化表达量的RT-qPCR数据,通过SPSS软件生成受试者工作特征(ROC)曲线。ROC曲线的线下面积(AUC)作为评价单一候选基因作为分别CRC的生物标志物。通过倒退逐步法逻辑回归构建模型,计算多个候选基因的联合区别CRC的ROC曲线,从而得到一个最小集的HIR-肠癌诊断的概率值(0-1)。模型中包括AREG基因和ZKSCAN3基因。HIR-肠癌诊断的概率算法为1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3))),其中AREG和ZKSCAN3分别代表基因HPRT1标准化表达的-dCt值。
根据约登指数(Youden index)方法的建议,选择0.5为截止值来最优化应用于临床检测时的敏感性和特异性。HIR-肠癌诊断可能概率大于0.5表明该样本可以认为是CRC。
2.4在178例(72例CRC和106例HC)样本的独立验证组中用该RT-qPCR方法进行了回顾性检测。
通过2.3所述方法,获得AREG基因和ZKSCAN3基因在循环免疫细胞中的标准化表达量,并通过1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))算出HIR-肠癌检测的概率值。以0.5为截止值,计算灵敏度和特异性。
2.5 CEA和CA19-9检测
作为对比,对上述训练组和验证组的CRC患者进行了CEA和CA19-9检测,分别使用癌胚抗原定量测定试剂盒和糖类抗原19-9定量测定试剂盒(上海透景生命科技股份有限公司)检测受检血清中的CEA和CA19-9浓度。血清CEA浓度大于5ng/ml被定义为CEA阳性样本,血清CEA浓度低于5ng/ml被定义为CEA阴性样本。血清CA19-9浓度大于35U/ml被定义为CA19-9阳性样本,血清CA19-9浓度低于35U/ml被定义为CA19-9阴性样本。
3.统计分析
采用事后检验(post hoc)配对Bonferroni校正t检验的方差分析(ANOVA)分析,分析HC组和CRC组之间样本均值差异的显著性。
使用单变量二元逻辑回归分析确定单个生物标志物的预测准确性。各独立生物标志物的p值由Wald卡方检验确定,截止值为p<0.05。ROC分析还显示了每个生物标志物的区分能力。采用逐步正演的多因素二元逻辑回归方法,确定生物标志物联合使用时的预测精度。
表1实施例1采用的样本的具体信息
发现组 | 识别组 | 训练组 | 验证组 | |
健康对照 | ||||
n | 12 | 48 | 180 | 106 |
年龄,中间值(范围) | 50(40-69) | 59(42-69) | 58(40-79) | 59(40-71) |
性别,n(%) | ||||
女 | 6(50%) | 20(42%) | 73(41%) | 44(42%) |
男 | 6(50%) | 28(58%) | 107(59%) | 62(58%) |
结直肠癌患者 | ||||
n | 10 | 47 | 134 | 72 |
年龄,中间值(范围) | 63(56-70) | 63(54-79) | 64(48-80) | 63(52-76) |
性别,n(%) | ||||
女 | 2(20%) | 19(40%) | 48(36%) | 28(39%) |
男 | 8(80%) | 28(60%) | 86(64%) | 44(61%) |
肿瘤分期,n(%) | ||||
I | 3(30%) | 7(15%) | 40(30%) | 24(33%) |
II | 5(50%) | 21(45%) | 46(34%) | 25(45%) |
III | 2(20%) | 17(36%) | 41(31%) | 20(28%) |
IV | 0(0%) | 2(4%) | 7(5%) | 3(4%) |
淋巴结转移,n(%) | ||||
是 | 5(50%) | 27(57%) | 69(51%) | 32(44%) |
否 | 5(50%) | 20(43%) | 65(49%) | 40(56%) |
远端转移,n(%) | ||||
是 | 1(10%) | 8(17%) | 19(14%) | 11(15%) |
否 | 9(90%) | 39(83%) | 115(86%) | 61(85%) |
CEA,n(%) | ||||
<5ng/ml | 6(60%) | 24(51%) | 82(61%) | 43(60%) |
≥5ng/ml | 4(40%) | 23(49%) | 52(39%) | 29(40%) |
CA19-9,n(%) | ||||
<35U/ml | 7(70%) | 38(81%) | 106(79%) | 57(79%) |
≥35U/ml | 3(30%) | 9(19%) | 28(21%) | 15(21%) |
采用Fisher精确检验,p<0.05,针对CRC和HC之间的样本分布或者不同组之间的样本分布,未发现统计学意义上的显著性差异
4.结果
4.1循环免疫细胞识别结直肠癌的HIR-肠癌诊断分子标志物的鉴定
为了筛选出循环免疫细胞来源的生物标志物,发明人对22人循环免疫细胞样本(其中10名CRC患者、12名HC)进行了全转录组RNA测序(RNA-Seq),比较他们的转录组差异以期找出能区分HC和CRC的RNA标志物。
图2显示了主成分分析表明循环免疫细胞内具有识别结直肠癌的特异性RNA表达。由图2可以看出,主成份分析显示HC和CRC两组循环免疫细胞样本转录产物差别很大。使用逆转录定量PCR(RT-qPCR)对这些转录产物进行定量,5个转录产物,即AREG基因、CXCL1基因、CXCL8基因,IFITM10基因,和ZKSCAN3基因,被证明在CRC和HC循环免疫细胞样本之间具有差异表达(p<0.05)。
4.2 HIR-结直肠癌诊断分子标志物在识别组准确分别CRC样本
为了评估这5个基因的诊断价值,发明人对一组95例(47例CRC和48例HC)的识别组样本做了RT-qPCR,并以HPRT1作为内参计算-dCt的标准化表达值。
如图3的(A)所示,单因素ROC分析显示,对于每个单独的生物标志物在ROC曲线中的AUC分别是:AREG基因(AUC=0.79)、CXCL1基因(AUC=0.84)、CXCL8基因(AUC=0.89),IFITM10基因(AUC=0.87)和ZKSCAN3基因(AUC=0.22)。
然后,对上述检测样本进行多因素二元逻辑回归分析,分析这5个基因随机组合对区分HC和CRC的诊断准确性。结合图3的(A),结果发现,在这组95人的识别组中,AREG基因和ZKSCAN3基因所组成的HIR-肠癌诊断标志物,具有更高的AUC为0.93(CI:0.89-0.98),明显优于单独的5个基因中的任何一个。
在此基础上本发明人在一组314例样本(134例CRC和180例HC)的训练组中,建立HIR-肠癌的定量RT-qPCR检测方法。HIR-肠癌诊断的概率算法为1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3))),其中AREG和ZKSCAN3分别代表基因HPRT1标准化表达的-dCt值。根据约登指数(Youden index)方法的建议,选择0.5为截止值来最优化应用于临床检测时的敏感性和特异性。CRC可能概率大于0.5表明该样本可以认为有结直肠癌。
如图3的(B)所示,在0.5的截止点处,基于HIR-肝癌检测方法在该训练组中区分CRC的敏感性为80%、特异性为81%。
在178例独立验证组中验证了该HIR-肠癌检测方法和逻辑方程的有效性,其中包括106例HC和72例CRC。如图3的(D)所示,基于HIR-肠癌检测获得的AUC为0.93(CI:0.89-0.97)。如表2所示,以0.5为截止值,HIR-肠癌诊断方法检测在该组的灵敏度为82%,特异性为78%。
表2单个或联合生物标志物检测CRC的诊断性能
CRC,结直肠癌;HC,健康对照;HIR-CRC是基于包括AREG和ZKSCAN3的2-基因特征计算的风险分;早期CRC,I期和II期CRC;晚期CRC,III期和IV期CRC;CEA阴性,血清癌胚抗原<5ng/ml;CEA阳性,血清CEA>5ng/ml;CA19-9阴性,血清碳水化合物抗原19-9<35U/ml;CA19-9阳性,CA19-9>35U/ml;SE,灵敏性;SP,特异性NPV,阴性预测值;PPV,阳性预测值。
4.3评估HIR-肠癌诊断标志物对不同亚组CRC患者的检测性能
随后对来自训练组和验证组的492例样本进行汇总为206 CRC和286 HC组成的病例组,通过HIR-肠癌诊断1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))所得到的肠癌概率,对HIR-肠癌诊断标志物在其中不同亚组CRC患者的检测性能进行评估。结果如图4和表3所示。
如表3所示,HIR-肠癌诊断标志物在该组合组中达到灵敏性为80%,CEA的灵敏度为39%,CA19-9的灵敏度为21%。在早期CRC中,HIR-肠癌的灵敏度为82%,CEA的灵敏度为33%,CA19-9的灵敏度为9%。HIR-肠癌在CEA阴性样本中的灵敏度为76%,CA19-9的灵敏度为15%。HIR-肠癌在CA19-9阴性样本中的灵敏度为80%,CEA的灵敏度为31%。
表3:CEA、CA19-9和HIR-CRC识别不同CRC亚组的临床灵敏性
实施例2:用于检测结直肠癌的试剂盒
用于检测结直肠癌的早筛试剂盒包括如下预混液
编号 | 成分 | 22个测试/试剂盒 |
1 | BAN提取试剂 | 110微升 |
2 | 逆转录缓冲预混液 | 132微升 |
3 | 逆转录酶 | 22微升 |
4 | 荧光定量PCR预混液 | 110微升 |
5 | AREG引物 | 11微升 |
6 | ZKSCAN3引物 | 11微升 |
7 | HPRT1引物 | 11微升 |
8 | 无酶水 | 1200微升 |
9 | 阳性对照 | 10微升 |
上述阳性对照为HIR-肠癌检测阈值为大于0.5的人造样本,其制作方法为通过把检测基因PCR的扩增子克隆在T-easy vector,然后根据结直肠癌病人样本检测基因分布的90%percentile(百分位)的拷贝值,在阳性对照样本中用扩增子的克隆制备出相对应的拷贝数。阳性对照样本得到的HIR-肠癌检测阈值是通过本文中所描述的RT-qPCR方法来确定的。
待测基因的定量PCR预混液的组成成分/22个测试的试剂盒为
2x定量PCR主预混液 | 110ul |
待测基因的正向引物10uM | 11ul |
待测基因的反向引物10uM | 11ul |
无核酸酶水 | 880ul |
总量 | 220ul |
上述各引物由IDT公司(Integrated DNA Technologies,Inc.)合成,PCR主预混液购买自KAPA Biosystems公司。
实施例3:结直肠癌的检测
1.血样收集和循环免疫细胞的纯化
在医院由专业护士抽取2ml静脉血,装在EDTA-K2采血管中(三力EDTAK2,湘械注准20152220045),并马上颠倒混匀,在4℃保存。全血采血后需在4小时内使用样本预处理试剂盒(积准生物,浙绍械备20210096)进行预处理。取1ml EDTA-K2处理过的全血与10毫升试剂A充分混匀,室温静置10分钟。室温离心300g,5分钟,沉淀循环免疫细胞。加10毫升冷藏试剂B,移液枪反复吹打5次,使沉淀充分混匀。再次室温离心300g,5分钟,沉淀循环免疫细胞。弃上清,把循环免疫细胞沉淀用700微升的试剂C充分溶解,负80度冰箱保存至RNA提取。
2.RNA提取
3.逆转录
200ng总RNA通过实施例2的早筛试剂盒逆转录成cDNA。
逆转录反应体系:
组分 | 体积 |
200ng总RNA | 2.0ul |
逆转录预混液 | 5.0μL |
MultiScribeTM逆转录酶 | 1.0μL |
无核酸酶水 | 12.0μL |
反应总体积 | 20.0μL |
逆转录反应条件:
设置 | 步骤1 | 步骤2 | 步骤3 | 步骤4 |
温度 | 25℃ | 37℃ | 85℃ | 4℃ |
时间 | 10分钟 | 120分钟 | 5分钟 | ∞ |
4.检测
采用实施例2的肠癌早筛试剂盒进行检测,5倍稀释的逆转录反应产物作为试剂盒的待测输入样本。
每个基因的定量PCR反应设置是:
基因特异性定量PCR预混液 | 8ul |
5x稀释的逆转录产物 | 2ul |
每个基因的定量PCR反应条件是:
通过ABI Q6实时定量PCR仪,在荧光量达到0.05时的时候确定Ct值。通过-dCt的方法获得每个基因的标准化表达。并通过1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))算出肠癌风险的概率值。以0.5为截止值,计算灵敏度和特异性。结果与实施例1中的结果一致。
上述实施例为本发明较佳的实施方式,但本方面的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的替代、修饰、组合、改变、简化等,均应为等效的置换方式,都包含在本发明的保护范围之内。
参考文献:
1.Jemal,A.等人,癌症统计,2009。CA Cancer J Clin,2009。59(4):p.225-49。
2.Torre,LA等人,全球癌症统计,2012年。CA Cancer J Clin,2015年。65(2):p.87-108。
3.Sung,JJ等人,亚洲结直肠癌发病率增加:筛查的意义。Lancet Oncol,2005.6(11):p.871-6。
4.Miller,KD等人,癌症治疗和生存统计,2019年。CA Cancer J Clin,2019年。69(5):p。363-385。
5.Siegel、RL、KD Miller和A.Jemal,癌症统计,2016年。CA Cancer J Clin,2016年。66(1):p。7-30。
6.ASoP等委员会,内窥镜检查在结直肠癌分期和管理中的作用。GastrointestEndosc,2013.78(1):p.8-12。
7.Sung,H.等人,2020年全球癌症统计:全球185个国家36种癌症的全球发病率和死亡率估计值。CA Cancer J Clin,2021.71(3):p.209-249。
8.Loeve,F.等人,内窥镜结直肠癌筛查:成本节约分析。J Natl Cancer Inst,2000.92(7):p.557-63。
9.Knudsen,AB等人,结直肠癌筛查策略的收益、负担和危害估计:美国预防服务工作组的建模研究。美国医学会杂志,2016.315(23):p.2595-609。
10.Carroll、MR、HE Seaman和SP Halloran,结直肠癌筛查的测试和调查。临床生化,2014.47(10-11):p.921-39。
11.Garborg,K.等人,结直肠癌筛查的现状。Ann Oncol,2013.24(8):p.1963-72年。
12.Duffy,MJ等人,生化标志物在结直肠癌中的临床应用:欧洲肿瘤标志物组织(EGTM)指南。Eur J Cancer,2003.39(6):p.718-27。
13.Gao,Y.等人,血清CEA、CA19-9、CA72-4、CA125和铁蛋白作为结直肠癌诊断标志物和临床参数因素的评估。科学代表,2018。8(1):p。2732.
14.Imperiale、TF、DF Ransohoff和SH Itzkowitz,用于结肠直肠癌筛查的多靶点粪便DNA检测。N Engl J Med,2014.371(2):p.187-8。
15.Han,YD,et al.,基于粪便DNA中甲基化syndecan-2(SDC2)存在的结直肠癌早期检测。临床表观遗传学,2019.11(1):p.51。
Claims (10)
1.一种检测结直肠癌的生物标志物组,其特征在于,包括AREG基因和ZKSCAN3基因。
2.检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。
3.根据权利要求2所述的应用,其特征在于,所述结直肠癌是I期结直肠癌、II期结直肠癌、III期结直肠癌或IV期结直肠癌;优选地,所述结直肠癌是I期结直肠癌或II期结直肠癌;更优选地,所述结直肠癌是I期结直肠癌。
4.根据权利要求2所述的应用,其特征在于,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
5.根据权利要求4所述的应用,其特征在于,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物。
6.根据权利要求5所述的应用,其特征在于,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQ ID NO:5和SEQ ID NO:6的序列。
7.根据权利要求2至6任一项所述的应用,其特征在于,检测结直肠癌的方法包括:
获得受试者的血液白细胞;
测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,根据公式HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量;
将HIR-CRC得分与截止值进行比较以确定受试者是否患有结直肠癌;其中,所述截止值是0.5;当HIR-CRC得分大于0.5时,确定受试者患有结直肠癌。
8.一种检测结直肠癌的产品,其特征在于,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂;
优选地,所述产品是试剂盒、药物、基因芯片或检测试纸;更优选地,所述产品是试剂盒。
9.根据权利要求8所述的检测结直肠癌的产品,其特征在于,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
10.根据权利要求9所述的检测结直肠癌的产品,其特征在于,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物;
优选地,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQID NO:5和SEQ ID NO:6的序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211123798.XA CN116219007A (zh) | 2022-09-15 | 2022-09-15 | 检测结直肠癌的生物标志物组及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211123798.XA CN116219007A (zh) | 2022-09-15 | 2022-09-15 | 检测结直肠癌的生物标志物组及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116219007A true CN116219007A (zh) | 2023-06-06 |
Family
ID=86571894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211123798.XA Pending CN116219007A (zh) | 2022-09-15 | 2022-09-15 | 检测结直肠癌的生物标志物组及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116219007A (zh) |
-
2022
- 2022-09-15 CN CN202211123798.XA patent/CN116219007A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200370127A1 (en) | Biomarkers in Peripheral Blood Mononuclear Cells for Diagnosing or Detecting Lung Cancers | |
US20230366034A1 (en) | Compositions and methods for diagnosing lung cancers using gene expression profiles | |
WO2016115354A1 (en) | Methods for cancer diagnosis and prognosis | |
CN111139300B (zh) | 一组结肠癌预后相关基因的应用 | |
JP7182317B2 (ja) | 婦人科新生物の診断方法 | |
WO2011014697A1 (en) | Methods of assessing a risk of cancer progression | |
CN110229899B (zh) | 用于结直肠癌早期诊断或预后预测的血浆标记物组合 | |
WO2020178315A1 (en) | Methylation status of gasdermin e gene as cancer biomarker | |
KR102492149B1 (ko) | 난소암 진단 또는 감별진단을 위한 마이크로rna-1246 및 이의 용도 | |
AU2015246009B2 (en) | Methods and kits for identifying pre-cancerous colorectal polyps and colorectal cancer | |
KR102096499B1 (ko) | 대장암 진단 또는 재발 예측을 위한 마이크로rna-3960 및 이의 용도 | |
US20210079479A1 (en) | Compostions and methods for diagnosing lung cancers using gene expression profiles | |
US20240093306A1 (en) | Micro rna liver cancer markers and uses thereof | |
CN111763736B (zh) | 用于诊断甲状腺乳头状癌淋巴结转移的液体活检试剂盒 | |
CN116219007A (zh) | 检测结直肠癌的生物标志物组及其应用 | |
KR20220131083A (ko) | 갑상선암 진단을 위한 microRNA 바이오마커 및 이의 용도 | |
WO2019095541A1 (zh) | 一种诊断预示乳腺癌骨转移的组合物及诊断预示方法 | |
US20240327927A1 (en) | Active surveillance and risk stratification for prostate cancer | |
CN116287252B (zh) | 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用 | |
CN112176060B (zh) | 一组血浆非编码rna及检测其表达水平的引物组与结直肠癌检测试剂盒 | |
Chen et al. | Fecal miRNAs as potential biomarkers for early detection of colorectal cancer: An updated review | |
CN116083583A (zh) | miRNA-483-5p在制备胰腺癌肝转移诊断试剂盒中的应用 | |
KR20210125442A (ko) | GLRB 유전자의 CpG 메틸화 변화를 이용한 대장암, 직장암 또는 대장 선종 진단용 조성물 및 이의 용도 | |
CN117947161A (zh) | 一种诊断、检测、监测、预测肝癌预后的计算机系统和试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |