CN117321223A - 用于基于扩增的核酸定量的方法和手段 - Google Patents
用于基于扩增的核酸定量的方法和手段 Download PDFInfo
- Publication number
- CN117321223A CN117321223A CN202180082204.2A CN202180082204A CN117321223A CN 117321223 A CN117321223 A CN 117321223A CN 202180082204 A CN202180082204 A CN 202180082204A CN 117321223 A CN117321223 A CN 117321223A
- Authority
- CN
- China
- Prior art keywords
- target
- polynucleotide
- regulatory
- product
- competitor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 440
- 230000003321 amplification Effects 0.000 title claims description 311
- 238000003199 nucleic acid amplification method Methods 0.000 title claims description 311
- 238000001921 nucleic acid quantification Methods 0.000 title description 3
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 184
- 230000014509 gene expression Effects 0.000 claims abstract description 131
- 102000040430 polynucleotide Human genes 0.000 claims description 602
- 108091033319 polynucleotide Proteins 0.000 claims description 602
- 239000002157 polynucleotide Substances 0.000 claims description 602
- 239000000523 sample Substances 0.000 claims description 445
- 230000001105 regulatory effect Effects 0.000 claims description 292
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 131
- 201000010099 disease Diseases 0.000 claims description 101
- 238000003752 polymerase chain reaction Methods 0.000 claims description 96
- 238000006243 chemical reaction Methods 0.000 claims description 83
- 108091034117 Oligonucleotide Proteins 0.000 claims description 67
- 201000008827 tuberculosis Diseases 0.000 claims description 59
- 238000004519 manufacturing process Methods 0.000 claims description 49
- 230000002860 competitive effect Effects 0.000 claims description 47
- 239000002773 nucleotide Substances 0.000 claims description 43
- 125000003729 nucleotide group Chemical group 0.000 claims description 43
- 230000035772 mutation Effects 0.000 claims description 41
- 206010028980 Neoplasm Diseases 0.000 claims description 39
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 33
- 208000035475 disorder Diseases 0.000 claims description 30
- 238000003745 diagnosis Methods 0.000 claims description 28
- 239000000203 mixture Substances 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 24
- 201000011510 cancer Diseases 0.000 claims description 23
- 230000033228 biological regulation Effects 0.000 claims description 22
- 206010060862 Prostate cancer Diseases 0.000 claims description 19
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 19
- 102100021723 Arginase-1 Human genes 0.000 claims description 15
- 102100028537 Guanylate-binding protein 6 Human genes 0.000 claims description 15
- 101000752037 Homo sapiens Arginase-1 Proteins 0.000 claims description 15
- 101001058849 Homo sapiens Guanylate-binding protein 6 Proteins 0.000 claims description 15
- 101000800287 Homo sapiens Tubulointerstitial nephritis antigen-like Proteins 0.000 claims description 15
- 101000663031 Homo sapiens Transmembrane and coiled-coil domains protein 1 Proteins 0.000 claims description 14
- 102100037718 Transmembrane and coiled-coil domains protein 1 Human genes 0.000 claims description 14
- 238000009396 hybridization Methods 0.000 claims description 14
- 206010006187 Breast cancer Diseases 0.000 claims description 11
- 208000026310 Breast neoplasm Diseases 0.000 claims description 11
- 230000000977 initiatory effect Effects 0.000 claims description 9
- 208000031462 Bovine Mastitis Diseases 0.000 claims description 8
- 206010040047 Sepsis Diseases 0.000 claims description 8
- 210000000265 leukocyte Anatomy 0.000 claims description 8
- 206010006049 Bovine Tuberculosis Diseases 0.000 claims description 7
- 210000004369 blood Anatomy 0.000 claims description 7
- 239000008280 blood Substances 0.000 claims description 7
- 102000018120 Recombinases Human genes 0.000 claims description 6
- 108010091086 Recombinases Proteins 0.000 claims description 6
- 241000222122 Candida albicans Species 0.000 claims description 4
- 206010007134 Candida infections Diseases 0.000 claims description 4
- 201000003984 candidiasis Diseases 0.000 claims description 4
- 230000003828 downregulation Effects 0.000 claims description 4
- 210000002307 prostate Anatomy 0.000 claims description 4
- 230000002103 transcriptional effect Effects 0.000 claims description 4
- 230000003827 upregulation Effects 0.000 claims description 4
- 208000015181 infectious disease Diseases 0.000 claims description 3
- 208000013223 septicemia Diseases 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 48
- 210000004027 cell Anatomy 0.000 description 41
- 230000006399 behavior Effects 0.000 description 35
- 238000013461 design Methods 0.000 description 29
- 150000007523 nucleic acids Chemical class 0.000 description 23
- 108020004414 DNA Proteins 0.000 description 22
- 230000004044 response Effects 0.000 description 22
- 238000007477 logistic regression Methods 0.000 description 19
- 238000001514 detection method Methods 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 108091093088 Amplicon Proteins 0.000 description 11
- 230000000903 blocking effect Effects 0.000 description 11
- 230000003247 decreasing effect Effects 0.000 description 11
- 238000004393 prognosis Methods 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 238000004088 simulation Methods 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000012010 growth Effects 0.000 description 8
- 238000012772 sequence design Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 210000005253 yeast cell Anatomy 0.000 description 7
- 238000003559 RNA-seq method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000004547 gene signature Effects 0.000 description 5
- 108091027963 non-coding RNA Proteins 0.000 description 5
- 102000042567 non-coding RNA Human genes 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000001717 pathogenic effect Effects 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- 108700039887 Essential Genes Proteins 0.000 description 4
- 101000852214 Homo sapiens THO complex subunit 4 Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 4
- 235000020958 biotin Nutrition 0.000 description 4
- 239000011616 biotin Substances 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 4
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000002493 microarray Methods 0.000 description 4
- 230000003278 mimic effect Effects 0.000 description 4
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical group FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000013179 statistical model Methods 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 230000031018 biological processes and functions Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- LTMHDMANZUZIPE-UHFFFAOYSA-N digoxine Natural products C1C(O)C(O)C(C)OC1OC1C(C)OC(OC2C(OC(OC3CC4C(C5C(C6(CCC(C6(C)C(O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)CC2O)C)CC1O LTMHDMANZUZIPE-UHFFFAOYSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 230000002980 postoperative effect Effects 0.000 description 3
- 230000001012 protector Effects 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 210000000130 stem cell Anatomy 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 208000031886 HIV Infections Diseases 0.000 description 2
- 208000037357 HIV infectious disease Diseases 0.000 description 2
- 108020005198 Long Noncoding RNA Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000000779 depleting effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 210000003743 erythrocyte Anatomy 0.000 description 2
- 210000001808 exosome Anatomy 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011090 industrial biotechnology method and process Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- NLYAJNPCOHFWQQ-UHFFFAOYSA-N kaolin Chemical compound O.O.O=[Al]O[Si](=O)O[Si](=O)O[Al]=O NLYAJNPCOHFWQQ-UHFFFAOYSA-N 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000007403 mPCR Methods 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 238000007857 nested PCR Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000012409 standard PCR amplification Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- RLLPVAHGXHCWKJ-IEBWSBKVSA-N (3-phenoxyphenyl)methyl (1s,3s)-3-(2,2-dichloroethenyl)-2,2-dimethylcyclopropane-1-carboxylate Chemical compound CC1(C)[C@H](C=C(Cl)Cl)[C@@H]1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 RLLPVAHGXHCWKJ-IEBWSBKVSA-N 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- LTMHDMANZUZIPE-AMTYYWEZSA-N Digoxin Natural products O([C@H]1[C@H](C)O[C@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@](C)([C@H](O)C4)[C@H](C4=CC(=O)OC4)CC5)CC3)CC2)C[C@@H]1O)[C@H]1O[C@H](C)[C@@H](O[C@H]2O[C@@H](C)[C@H](O)[C@@H](O)C2)[C@@H](O)C1 LTMHDMANZUZIPE-AMTYYWEZSA-N 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 108010009975 Positive Regulatory Domain I-Binding Factor 1 Proteins 0.000 description 1
- 241000239226 Scorpiones Species 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- LTMHDMANZUZIPE-PUGKRICDSA-N digoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)[C@H](O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O LTMHDMANZUZIPE-PUGKRICDSA-N 0.000 description 1
- 229960005156 digoxin Drugs 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000007823 electrophoretic assay Methods 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000004708 ribosome subunit Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- STZCRXQWRGQSJD-UHFFFAOYSA-N sodium;4-[[4-(dimethylamino)phenyl]diazenyl]benzenesulfonic acid Chemical compound [Na+].C1=CC(N(C)C)=CC=C1N=NC1=CC=C(S(O)(=O)=O)C=C1 STZCRXQWRGQSJD-UHFFFAOYSA-N 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6848—Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/143—Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/107—Reactions characterised by their quantitative nature the purpose being quantitative analysis with a competitive internal standard/control
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Abstract
本发明涉及使用生物预测关系的简化方法,在某些情况下,将复杂基因网络和相关表达模式的确定减少到单一读数。
Description
背景
生物系统极其复杂,并且主要受大量基因的表达水平波动支配。这种差异表达反映了这些细胞与其他细胞相互作用以及对我们的世界做出反应的方式。所有基因在特定时间点或特定环境情况下的表达水平,都可以代表一种特定的“状态”。基因表达水平可以非常迅速地变化,并且因此特定生物系统(例如细胞或组织或器官)的“状态”也会如此。确定“状态”(即多个基因在特定点的相对表达)在诊断、预后和例如工业生物技术中具有明显的用途,因为了解特定生物系统是否如预期/期望地那样表现非常重要。
基因不是孤立地发挥作用,而是作为复杂网络的一部分发挥作用。因为存在如此多的相互作用的基因和独立的基因网络,所以完全确定生物系统(例如细胞)的状态本身就非常复杂。尽管现在可以相对常规地分析生物系统内所有基因的表达水平,例如通过RNA-seq,但这在测序和后续生物信息学方面既不经济也不省时,特别是因为只有一个基因子集可能与预测或分类生物系统是否处于特定状态或处于不同的特定状态,或是否表现出特定活动(例如高蛋白质生产状态)有关。确定这种复杂的关系需要模式识别,而不是简单的代数阈值。
特定基因网络可以近似为相对离散的单元这一前提是许多现代诊断学的基础,并且一旦利用来自总转录组的一个小(或相对小)子集的信息确定了预测关系或差异基因调控特征,就没有必要对每个测试样品的整个转录组进行评估,以诊断该样品是否处于特定状态。例如,在许多情况下,基因表达数据(例如转录组数据)已从两种或多种不同类型的样本中获得,并已使用包括机器学习在内的生物信息学进行分析,以确定在两种样本类型之间表达不足或过度表达,以及以致不同水平的基因/mRNA的特定子集。此类诊断或预测表达模式的鉴定已用于例如癌症诊断、癌症预后、肺结核和败血症的诊断,以及兽医用途(例如诊断牛肺结核和乳腺炎),以及预测对治疗的反应。
基于给定一组基因的相对基因表达的相同类型的诊断和预测关系、决策面或差异基因调控特征可用于细胞和组织工程。例如,“再生医学”的目标通常是引导干细胞分化为特定的终末细胞类型,或将分化细胞的活性转向一项或另一项任务。通过基因表达谱分析,特别是“分子时间”的概念,有可能确定“细胞分化程度如何?细胞的极化程度如何?”。此外,合成生物学领域提出了一个独特的挑战。在具有高度工程化基因通路的细胞群中,或几个这样的细胞群合作完成给定任务时,生物过程工程师需要一种方法来确定系统是否按照其设计的方式表现。
在最简单的情况下,这种预测关系、决策面或差异基因调控特征可能涉及对单个基因表达存在或缺失的评估。例如,样本中基因A的mRNA的存在预测样本处于状态A(例如“患有疾病A”),而基因A的mRNA的缺失预测样本处于状态B(例如“没有疾病A”,即患有不同的疾病或没有疾病)。
然而,大多数疾病状态或其他状态,例如可能与各种化合物的生物生产相关的特定调节状态(例如其中在工程师为质量控制定义的耐受窗口内发生基因调节的状态),只能使用来自大量基因的表达数据进行准确预测或诊断。评估来自大量基因的表达数据的要求意味着,即使预测关系或差异基因调控特征已经确定(例如,通过分析更大的表达数据集来识别那些可以用于预测特定状态的“标记”),仍需要专门的设备和熟练的生物信息学家来分析诊断/预测表达数据并形成预测/诊断。例如,使用诸如微阵列、RNA-seq、Nanostring等技术来确定许多基因的表达水平,需要使用一系列探针(例如带有一系列标记),每个探针都需要单独确定。因此,当前确定特定状态的诊断/预测的方法需要样本准备后以及获得实际表达数据后大量的数据处理和统计,并且不适用于例如护理点诊断情况。
简化预测关系或差异基因调控特征的使用和输出将是有益的,这样最终用户可以执行简单的测定,其给出一个或少量输出,该输出通常直接预测两个或多个特定状态中的一个,例如“患病”或“没患病”,且不需要来自统计人员或复杂设备的输入。
本发明至少解决了使用从生物数据产生的预测关系或差异基因调控特征的现有技术方法所存在的上述问题。
发明内容
本发明的发明人已经开发了一些方法和组件,可以用于显著降低将预先确定的预测关系、决策面或差异靶标寡核苷酸模式(例如基因表达模式与特定状态之间的基因调控特征)转换为有用的诊断或预测结果的复杂性。
本文描述的方法使用分析的分子本身来反映复杂数学和人工智能(当前用于分析在例如医学诊断中常规获得的标准靶寡核苷酸模式,例如表达数据)。
所公开的方法易于使用,不需要特别专业的仪器,并且样品制备标准。一旦通过常规程序优化了必要的组件,实际上将这些方法付诸实践(例如在诊断/预测中)就非常简单,并且在一些实施例中需要简单的多重PCR扩增反应和两个荧光团的读数。这与目前的方法相反,其需要例如使用多个荧光团扩增一些RNA物种,确定每个荧光团的数量,然后将这些数据输入到一个复杂的生物信息学系统,该系统比较每个RNA物种的相对水平以确定“状态”。例如,如果预测关系、决策面或差异靶标寡核苷酸模式(如差异基因调控特征)是基于10个基因的相对表达,目前要么需要分别确定每个基因的表达水平,以便可以使用相同的荧光团;要么需要使用10种不同的荧光团,以便可以对扩增方法进行多重使用。因此,在任何一种情况下,至少需要10个不同的读数。本发明的一个关键优势是减少了读数的次数,在某些情况下,减少到单个管中两种不同荧光团(或所有使用的荧光团)的单一读数。
本发明方法产生的结果容易获得、清晰并且可以由实验室研究人员、发酵专家和床边临床医生来解释。
这些方法通常以核酸扩增为中心,本领域技术人员会理解这是高度常规的并且可以用最少的设备进行。
此外,许多现有技术方法将复杂的网络和预测关系、决策面或靶标寡核苷酸模式(如差异基因调控特征)简化为简单的线性关系,即例如来自一个基因的更多表达预测某种状态,不同基因的更多表达预测着不同的状态。这种还原论方法不能准确反映生物系统,也不能充分捕捉和反映(例如通过使用AI)能够被识别和生成的预测关系或差异基因调控特征。
例如,AI系统可以确定,如果基因A的表达高于任意表达阈值10,基因B的表达低于阈值5,基因C的表达高于阈值7,则样品处于特定状态,例如状态A;而如果基因A的表达高于阈值10,基因B的表达高于阈值10,而基因C的表达低于阈值7,则样品处于不同的特定状态,即状态B。
很明显,可以简单地基于三个基因的表达水平来确定和预测大量不同的“状态”。这些不同的状态是否代表临床上有用或生物技术上有用的状态,将由对其训练AI系统的样品决定。无论如何,可以看出基因A的表达高于阈值10(即基因A的“更多”表达)并不简单地反映单一状态。重要的是特定网络中每个基因或已被识别为预测网络一部分的基因的相对表达水平。
本发明的方法能够捕获这种复杂的相互依存关系,并将其浓缩为单一的输出,告诉用户样品是否处于或可能处于状态A或状态B;例如,处于状态A而不处于状态B或状态C。
本发明的方法可以被称为竞争扩增网络(CAN)。这些方法使RNA/DNA扩增技术(如PCR)适应复杂基因表达模式的识别。顾名思义,该反应被设计成具有竞争性的相互作用,该竞争性的相互作用将给定基因转录物或一组转录物提供的信息转化为状态A与状态B的相对概率。在一些使用荧光团标记探针的实施例中,这些概率组合起来提供由两种颜色表示的整体诊断:解译就如同检查哪种颜色更亮一样简单。这些网络可以扩展,以包含大量基因,而不会显著增加成本或操作复杂性。最后,这些网络可以被设计为同时对多个靶标执行复杂的非线性操作。该技术为用于疾病诊断、治疗学监测、再生医学研究和生物工艺制造质量控制的工程应用专用套件提供了一个平台。
具体实施方式
因此,本发明提供了一种方法,将至少两个寡核苷酸的相对丰度(或存在或缺失),例如至少两个基因的相对表达,或至少两个突变的存在或缺失,转化为特定状态的相对概率,例如状态A与状态B的相对概率。
本发明还提供了一种将至少两个寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失,组合成单一值的方法。
本发明还提供了:
将样品中至少两种寡核苷酸的相对丰度(例如至少两个基因的相对表达,或至少两个突变的存在或缺失)转化为特定状态的相对概率的方法。
仅使用两个荧光团标记的探针检测样品中至少三个寡核苷酸的相对丰度,例如至少三个基因的相对表达,或至少三个突变的存在或缺失的方法。
将样品中至少两个寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失,组合成单一值的方法。
将样品中由至少两个寡核苷酸的相对丰度或至少两个突变的存在或缺失提供的预测关系、决策面或差异靶标寡核苷酸模式(例如差异基因调控特征)转换为单一值的方法。
一种用竞争扩增网络模拟统计信息的方法。
达到“特定状态的概率”和“预测关系”、“决策面”或“差异靶标寡核苷酸模式”或“差异基因调控特征”和“统计信息”在本领域技术人员的能力范围内。此类信息通常是从微阵列数据或RNAseq数据中获得的,例如,随后通过生物信息学以产生两个或多个标记之间的关系,该关系可用于预测例如状态A与状态B的概率。存在许多此类预测面板的示例,例如参见:(1)Warsinske,H.;Vashisht,R.;Khatri,P.Host-Response-Based Gene Signaturesfor Tuberculosis Diagnosis:A Systematic Comparison of 16 Signatures.PLOSMedicine 2019,16(4),e1002786.https://doi.org/10.1371/journal.pmed.1002786。
(2)Sweeney,T.E.;Wong,H.R.;Khatri,P.Robust Classification of Bacterialand Viral Infections via Integrated Host Gene Expression Diagnostics.ScienceTranslational Medicine2016,8(346),346ra91-346ra91.https://doi.org/10.1126/ scitranslmed.aaf7165。(3)Cardoso,F.;van’t Veer,L.J.;Bogaerts,J.;Slaets,L.;Viale,G.;Delaloge,S.;Pierga,J.-Y.;Brain,E.;Causeret,S.;DeLorenzi,M.;Glas,A.M.;Golfinopoulos,V.;Goulioti,T.;Knox,S.;Matos,E.;Meulemans,B.;Neijenhuis,P.A.;Nitz,U.;Passalacqua,R.;Ravdin,P.;Rubio,I.T.;Saghatchian,M.;Smilde,T.J.;Sotiriou,C.;Stork,L.;Straehle,C.;Thomas,G.;Thompson,A.M.;van der Hoeven,J.M.;Vuylsteke,P.;Bernards,R.;Tryfonidis,K.;Rutgers,E.;Piccart,M.70-Gene Signatureas an Aid to Treatment Decisions in Early-Stage Breast Cancer.New EnglandJournal of Medicine 2016,375(8),717-729.https://doi.org/10.1056/NEJMoa1602253。(4)Zaas,A.K.;Aziz,H.;Lucas,J.;Perfect,J.R.;Ginsburg,G.S.BloodGene Expression Signatures Predict Invasive Candidiasis.Science TranslationalMedicine 2010,2(21),21ra17-21ra17.https://doi.org/10.1126/scitranslmed.3000715。
通过预测关系,我们包括任何可以被可视化为“决策面”的统计分类技术的含义,其中每个输入维度代表特定靶标序列的浓度,以及每个输出维度代表不同的类别。例如,输入域可以包含两个基因,并且输出域可以包含两个类别,健康的和生病的。然后,“决策面”是一个二维表面,其中给定点代表两个基因转录本的浓度,并且如果患者的两个基因在各自的水平上表达,则该点的表面高度对应于患病的概率。在另一个示例中,输入域可能包含在手术后前列腺癌患者的循环肿瘤DNA(ctDNA)中观察到的10个不同突变,并且输出域可能包含三个类别:无复发、轻度复发和侵袭性复发,其中每个类别都向医生推荐不同的行动方案。在这种情况下,决策面(或多或少)是一个10维立方体,其中每个点将突变浓度的特定组合转换为三个类别的相对概率,可能用颜色可视化为图像中红色、绿色和蓝色成分的相对强度。
虽然10维的三色立方体很难可视化,但对于生物统计学家、生物信息学家、数学家、统计学家或数据科学家来说,得出这样的表示是常规的。专家将从一个数据集开始,该数据集包含许多潜在靶标的测量浓度,例如来自许多个体的各种基因的表达或术后ctDNA的突变频谱,其中每个个体都已知属于不同的类别(例如,健康/生病或没有/轻度/侵袭性复发)。然后,专家将应用几种分类算法中的任何一种来得出决策面,包括但不限于逻辑回归、高斯过程分类、人工神经网络分类、决策树、随机森林、朴素贝叶斯、支持向量机或最近邻法。
或者,可以以更手动、更有原则的方式构建决策面。例如,生物生产工程师可能知道由其工程生物或生物种群表达的几个基因中的每一个的最佳表达水平和各自的耐受性。出于质量控制和过程监控的目的,工程师可能希望知道这些基因中的任何一个是否在该耐受窗口之外。在这种情况下,决策面可以表示为在输出域中从-1扩展到+1的多维高斯分布。如上所述,每个维度将代表特定基因转录本的浓度,并且沿该维度的边缘高斯分布将使在该基因的理想浓度处的其平均值(峰值),以及其标准偏差(宽度)对应于各自的耐受窗口。如果所有转录本都处于或接近其理想状态,则此类决策面的竞争扩增网络实施将显示一种荧光颜色,并且如果任何转录本远远超出其耐受窗口,则显示另一种荧光颜色。
另一种此类原则性决策面可能来自于对循环肿瘤DNA的个性化监测,目的是监测术后前列腺癌患者的早期复发迹象(Coombes等人Clinical Cancer Research 201925:DOI:10.1158/1078-0432.CCR-18-3663)。感兴趣的靶标突变将在手术时通过比较肿瘤的基因组与患者健康组织的基因组来确定。然后专家将选择一个阈值浓度,这样如果在ctDNA中观察到任何突变超过这个阈值,那么专家就会得出癌症已经复发的结论。在这种情况下,给定突变的边际决策面将包括从没有突变的情况下的0到该阈值浓度下的+1的过渡。
在获得决策面或感兴趣的靶标与分类之间的概率关系后,专家将会设计一个近似这种关系的竞争扩增网络。给定信号(荧光团颜色,如FAM,或侧流试纸条上的条带强度)被任意指定为对应于输出的正方向,并且第二信号(如HEX)被指定为负方向。因此,这两种颜色的强度之间的差异对应于决策面的“高度”。或者,如果输出域包含两个以上的类别,则可以选择适当数量的信号,以便它们之间的某些成对差异对应于不同输出类别的概率。
在将决策面的输出域转换为各种信号的相对强度后,专家将选择网络架构。该架构包含确定要包括多少合成竞争物、要包括多少引物、哪些寡核苷酸链共享哪些引物以及哪些链被哪些探针靶向。那么,对于每个架构来说,系统中的每个寡核苷酸都有多种扩增参数组合。在架构和参数值之间进行选择将通过模拟由许多不同的架构各自在许多不同的参数值下产生的面来完成,(参见“模拟竞争扩增”部分)以确定类似于预定决策面的架构和参数值的组合。本领域已知有许多执行此优化任务的方法,包括用于在架构之间进行选择的进化算法和模拟退火法,以及用于确定理想参数组合的梯度下降法、随机梯度下降法或拟牛顿法。最后,专家将设计靶标寡核苷酸和合成竞争寡核苷酸,这些寡核苷酸显示此处确定的参数并根据所选的架构共享引物(参见“测试和预测试和预测竞争物扩增行为在下面的实施例中提供了进一步的解释。
这些方法中的每一种都涉及以这样的方式扩增一个或多个靶标多核苷酸,使得指示第一状态的每种产物的量可以被累积量化,以及指示第二状态的每种产物的量可以被累积量化。将这两个读数组合起来会产生一个单一的整体读数,指示样品更可能处于第一状态还是第二状态,即无论被调查的基因数量如何,总绿色强度和总橙色强度之间的差异(例如),整合来自整个系统的信息。例如,在一个实施例中,与第一状态相关的所有产物都用第一荧光团标记,而与第二状态相关的所有产物都用第二荧光团标记。如果考虑到每个产物对整体预测关系或差异基因调控特征的相对贡献,那么对每个状态的累积量化求和就会产生准确的预测值。本发明的竞争多核苷酸和用于本文所述方法的竞争多核苷酸被改造、设计或调整,以反映这种预测关系或差异基因调控特征。
因此,本发明提供:
将样品中至少两种寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失,转化为特定状态的相对概率的方法;
仅使用两个荧光团标记的探针检测样品中至少三种寡核苷酸的相对丰度的方法,例如至少三个基因的相对表达,或至少三个突变的存在或缺失;
将样品中至少两种寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失,组合成单一值的方法;
将样品中由至少两种寡核苷酸的相对丰度或至少两个突变的存在或缺失提供的预测关系、决策面或差异靶标寡核苷酸模式(例如差异基因调控特征)转换为单一值的方法;
一种采用竞争扩增网络模拟统计信息的方法;
以及
一种将样品中复杂的基因表达模式简化为单一值的方法,其中该方法包括扩增样品中的一种或多种靶标多核苷酸的步骤。
本发明提供如本文所述的扩增样品中一种或多种靶标多核苷酸的方法本身。
从理论上讲,溶液中的每个靶标分子都应该在每个循环中复制,直到这些引物用完,但是,对于CAN设计原则(即本文公开的方法)关键的是,完美的加倍实际上很难实现。正是调整竞争多核苷酸包含适当的特征,该特征允许单一输出以反映复杂的表达水平网络。
靶标序列特征如GC含量影响每个循环被复制的分子的比例,并且这些特征被故意构建到本文使用的竞争多核苷酸中,以便靶标多核苷酸以适当的效率扩增,其中效率被定制以模拟该特定靶标在整体预测关系或差异基因调控特征中的贡献。
例如,在其中两个基因的表达增加预示着疾病的假设场景中:
如果特定的基因(G1)在大于12的任意水平表达,则其与“疾病”相关,以及在小于12的表达水平则与“非疾病”相关,并且G1具有弱预测性;和
如果表达水平大于6,则第二基因(G2)与“疾病”相关,以及当表达水平小于6时与“非疾病”相关,并且G2具有很强的预测性。
如果只是简单地获得G1和G2的表达水平并将其加在一起,而不考虑任何单独的预测能力,那么G1表达水平为10(预测“非疾病”)和G2表达水平为7(预测“疾病”)的样品将具有为17的“疾病预测基因”总表达水平;而G1表达水平为1(预测“非疾病”)和G2表达水平为10的样品将仅具有为11的“疾病预测基因”总表达水平。从表面上看,如果不考虑单独预测能力,那么第一样品似乎比第二样品更有可能患病。然而,当我们考虑到G1仅具有弱预测性而G2具有强预测性时,第二样品的实际疾病预测可能会有更大的可能性。
因此,简单地扩增所有“疾病相关基因”并累加产物量是不够的。然而,累加产物量是根据一些表达水平输入来获得累积和准确的预测的简单方法。本发明人已经设法将单独预测能力并入竞争多核苷酸中,使得靶标相对于相应竞争多核苷酸的相对量指示预测能力。
例如,以上面假设的例子为例,在一个示例中:
G1与相应的竞争多核苷酸一起被扩增,该竞争多核苷酸与天然G1靶标强烈竞争,即竞争多核苷酸具有比天然靶标G1更高的扩增效率。这样,第一样品(具有10个靶标分子的当量)中G1的高表达转化为较低的实际G1靶标产物(例如3),这反映了G1较低的预测能力。然后可以用绿色标记的探针探测G1靶标产物,并且可以用橙色标记的探针探测G1竞争产物。扩增和检测后,绿色标记的量可能少于橙色标记的量(例如绿色读数为3,以及橙色读数为7)。另一方面,由于高预测能力,在存在非常难以扩增的相应竞争多核苷酸的情况下,G2可以被扩增,因此G2天然靶标比G2竞争多核苷酸扩增的更多。在具有7个G2靶标的当量的第一样品的情况下,生成的G2靶标的数量可能为6,而生成的G2竞争物的数量可能为1。G2靶标可以用绿色标记的探针(即6个绿色)进行探测,而G2竞争物可以用橙色标记的探针(即1个橙色)进行探测。将G1和G2的结果加在一起,这个示例将提供为9的绿色读数(即疾病)和为8的橙色读数。
对于实际上具有1个G1靶标分子和10个G2靶标分子的样品2,G1可能产生为0.5的绿色读数和为1的橙色读数;以及G2可能产生为9的绿色读数和为2的橙色读数,其中累积读数为绿色9.5相对于橙色3。
技术人员将会理解,在一些情况下,一个基因表达的增加和不同基因表达的抑制可能指示特定状态,例如疾病状态。
来源于原始数据集(例如微阵列数据、RNAseq数据)的预测关系或差异基因调控特征将提供一个阈值,即总体累积荧光需要多“绿”才能导致诊断“状态A”(即“疾病”)。
如果靶标以1:1的方式扩增,则样品1将具有为17的总体绿色读数,且样品2将具有为11的读数,这并不能准确反映样品处于该特定状态,例如疾病状态的可能性。
尽管上文是在相关基因表达的背景下讨论的,但本领域技术人员将理解和领会相同的前提适用于以下情况:各种突变的存在或缺失指示特定疾病状态,例如癌症,或非编码RNA的相对丰度(因此,严格来说,不是在蛋白质编码基因的背景下的“基因表达”,而是一般的转录)。因此,如上所述,在提及相对基因表达的情况下,这应理解为也适用于突变的组合,或例如非编码RNA的相对转录和产生。
通过在引物结合位点之间包含特定于靶标产物或竞争产物区域的荧光标记探针寡核苷酸,可以实时监测扩增进程(参见图1B的示例)。对于一种类型的探针,当适当的引物被延伸时,聚合酶将探针降解为(或多或少)单个核苷酸,从淬灭剂中释放荧光团并产生荧光信号。生成的曲线可以被建模为密度限制的指数增长过程:
[等式(1)]
其中F是荧光强度,r是指数增长率(基数e),K是信号平台,并且m是该平台的漂移。这里的关键组成部分是r,当以基数2表示时,它表示复制每个循环的(探针结合的)靶标链的分数。如图2所示,可以通过改变引物区域之间的靶标的序列来改变r。
请注意,在大多数情况下,具有给定靶标的所有反应在结束时都具有相同的荧光强度,而与靶标的起始数量无关。反应终点为您提供了关于样品的最少信息,这是通过根据本发明将竞争工程改造到PCR中所弥补的一个缺点。
该扩增是一种“竞争性”扩增,涉及使用已被“调整”为具有本文所述的特定特征的竞争多核苷酸。技术人员将理解,竞争性PCR的现有技术方法通常用于靶标核酸定量,并且所使用的竞争性多核苷酸被设计成在序列上与靶标尽可能接近,以避免扩增效率的任何差异。通常使用凝胶电泳,将靶标产物的量与竞争产物的量进行比较,由此可以量化起始靶标材料的量。
相比之下,本发明特别要求将竞争多核苷酸设计成具有以下序列:其故意导致靶标扩增与竞争扩增之间在扩增效率上的特定差异。
那么在一个实施例中,本发明提供了一种扩增样品中一个或多个靶标多核苷酸的方法,其中该方法包括:
提供:
a)包含多核苷酸的样品
b)第一调整竞争多核苷酸
c)至少第一引物,其中至少第一引物能够杂交至:
第一靶标多核苷酸;和
所述第一调整竞争多核苷酸;和
启动引物延伸反应,使得靶标多核苷酸(如果存在于样品中)和第一调整竞争多核苷酸被扩增,
其中扩增产生第一靶标产物和第一调整竞争产物。
为避免疑义,本发明的方法不同于“toe-hold”方法,在“toe-hold”方法中,“toe-hold”引物最初与较短的“保护子”链相结合,因此该保护子和靶标竞争性地与靶标结合。在这种情况下,“保护子”不会被扩增(它比引物短)。
此外,需要明确的是,第一调整竞争多核苷酸是已经经过专门设计或“调整”以具有特定特性,并己被有意引入扩增反应的多核苷酸。如本文所述的竞争多核苷酸被认为不同于(例如恰好也存在于样品中的)其他多核苷酸。例如,根据本发明的竞争多核苷酸不仅仅是可以竞争与引物杂交从而导致不需要的背景扩增的另一段基因组DNA。那么在一个实施例中,本文所述的竞争多核苷酸被有意扩增。在一个实施例中,本文所述的竞争多核苷酸并非天然存在于样品中。
同样重要的是,要注意本方法不同于现有技术的竞争性扩增方法(其中竞争寡核苷酸被有意地设计成具有与靶标多核苷酸相似的扩增动力学特性)。此类方法使用现有技术来估计靶标多核苷酸的浓度,例如在扩增反应中包括已知数量的竞争多核苷酸的情况下。在此类方法中,竞争物的扩增速率必须反映靶标的扩增速率。本领域技术人员将清楚这不是本发明的情况。本发明要求调整的竞争寡核苷酸对各自的靶标多核苷酸具有不同的扩增动力学,以便靶标和竞争物的相对扩增速率导致匹配预测关系、决策面或差异靶标寡核苷酸模式的产物,例如指示至少两种状态之一的差异基因调控特征。
因此,在一个实施例中,竞争多核苷酸不具有与相应的靶标多核苷酸相同或不具有与其基本相似的扩增动力学。
本方法也不同于16s巢式PCR等方法,后者首先扩增大多数细菌共有的遗传序列(核糖体亚基),然后再扩增或测序物种特异性亚区域(Yu等人PLoS One 201510:e0132253)。一种类似的方法用于探测人类B细胞中的VDJ重组(Koning等人BritishJournal of Haematology 2016178:983-968。在这两种情况下,竞争都会发生,尽管只是在天然序列之间。因此,在一个实施例中,该方法不是16s巢式PCR方法,和/或不是用于探测人B细胞中VDJ重组的方法。
技术人员将理解,有可能仅使用一个引物来扩增给定的靶标序列和/或调整的竞争序列,例如不对称扩增或EXPAR,一种指数扩增反应(参见Reid等人AngewandteChemie201857:11856-11866),或使用两个引物,例如在标准PCR中。我们认为没有必要使用两个引物来扩增给定的靶标序列或给定的竞争序列,尽管通常会使用、排列两个引物,使得第一和第二引物在双链靶标序列或竞争序列的相反链上杂交,以导致产生靶标产物或竞争产物。两个引物可用于扩增靶标序列,和/或可用于扩增部分或全部调整竞争多核苷酸。技术人员将理解合适的引物需要什么,例如长度、与靶标/竞争序列的一部分的序列一致性。
因此,在一些实施例中,该方法包括提供第二引物。
在一些实施例中,第二引物能够与第一靶标多核苷酸杂交,其中第一和第二引物在靶标的相反链上杂交,以导致产生第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物。
技术人员还将理解,对于能够与第一靶标多核苷酸和第一调整竞争多核苷酸杂交的第一引物,第一靶标多核苷酸的一部分和第一调整竞争物的一部分将具有相同的或基本上相同的序列,以便允许单个引物与两个不同的多核苷酸杂交。靶标和竞争物的剩余序列可以完全不同。
在一些情况下,当该方法包括使用能够与第一靶标多核苷酸杂交的第二引物时,相同的第二引物也能够与第一调整竞争多核苷酸杂交,其中第一和第二引物在第一调整竞争多核苷酸的相反链上杂交,以导致产生第一调整竞争产物,任选地第一调整竞争PCR产物。在这种情况下,第一靶标多核苷酸和第一调整竞争多核苷酸将共享两个相同或基本相同的区域,以允许第一和第二引物与每个多核苷酸杂交。技术人员将理解两个序列需要多相似才能允许相同引物的杂交。
图3中描述了这种安排,其中第一靶标和第一竞争多核苷酸使用相同的第一和第二引物进行扩增,并且可以称为“直接”方法或直接CAN。第一还显示了一个使用两个标记探针的特定实施例。然而,如本文所述,可以使用不同的探针系统和不同的检测方法。通常,该方法将需要可以与靶标多核苷酸产物杂交的标记探针,以及用可以与第一竞争多核苷酸产物结合的不同标记所标记的探针。
当靶标和竞争物在同一个扩增反应中被扩增时,它们会竞争引物。由于靶标链的每次复制都会消耗引物,因此一旦引物池耗尽,两个序列的扩增都会停止。反应结束时每种扩增产物的量取决于两个靶标的相对起始量。这反映在产生的荧光信号中(参见例如图4)。对于以相同浓度开始的具有相同扩增率的两个靶标(例如图3中的WT和ISO),在反应结束时从每个靶标获得的荧光信号将相同。如果在反应开始时“靶标”多于竞争物,那么在反应结束时与靶标产物相关的荧光会更强烈,反之亦然。可以通过调整竞争物的扩增率来调整从纯靶标信号到纯竞争物信号过渡的锐度或梯度。本文描述了设计竞争多核苷酸序列和长度以调整扩增率的方法。
测试和预测竞争物扩增行为
为了估计控制扩增行为的参数,可以在包含适当引物、相关荧光团标记探针和标准qPCR预混液(来自ThermoFisher Scientific的TaqMan Fast Advanced Master Mix)的反应中扩增每个竞争物。所得到的荧光数据应该与技术人员能够选择的许多算法中的一种相匹配,例如(本文称为实施例中使用的机械模型)使用标准非线性最小二乘法估计,
其中f定义为
其中r为扩增率,F0为反应开始时的初始荧光,m表示稳态荧光的漂移程度,并且K给出无漂移时的稳态荧光。上面的等式仅仅是示例性的,也可以使用描述扩增行为的其他模型。如下所述,估计该机械模型的参数的一种方法是通过广义线性模型,具体如下。为了进行有效估计,首先应用以下对F0和r的变量替换:
该模型的输入参数是引物之间序列的区域的长度,以碱基对(BP)为单位,该区域的GC含量,以百分比(GC)为单位,以及序列的浓度,以拷贝数(Q)为单位。输入和输出(ρ、τ、K和m)参数首先被转换成“标准化”形式(用^表示),如下所示:
然后回归模型由下式给出:
其中α表示跨所有序列和浓度的给定参数的“典型”值,β分别表示对给定序列的长度或GC含量的依赖性,γ表示跨所有序列对浓度的“典型”依赖性,以及ζ定义为对浓度的依赖性如何随长度和GC含量而变化。在试图从观测数据中估计参数值的回归模型中,ε表示给定序列的行为与由
其余参数所表示的总体趋势的偏差;为新的、未测试的序列提供参数值的预测模型与回归模型相同,但没有ε分量。
如实施例所示,在一个实施例中,扩增了16个长度为30至240个碱基对且GC含量为15%至85%的不同竞争物。七种不同浓度下的每个竞争物(即反应包含竞争物的102、103、104、105、106、107、或108个拷贝),一式两份。技术人员将能够根据具体情况选择合适数量的竞争物、合适的长度、合适的GC含量和浓度。可以使用贝叶斯方法估算上述模型的参数值;然而,也可以使用其他线性回归技术,包括但不限于最大似然估计、最小二乘估计、岭回归和套索回归。
实施例中描述的16个竞争物的回归结果如图16所示,以及估计的参数值如下表所示。图中,“Intercept”是指α和β分量之和,而“Slope”是指γ和ζ分量之和。点代表特定序列的估计值,而线和阴影区域分别给出总体趋势和伴随的不确定性。
除了广义线性模型外,还可以使用其他回归技术,包括但不限于非线性回归和非参数回归,例如多项式回归、高斯过程、人工神经网络、支持向量机、最近邻、决策树、随机森林和朴素贝叶斯。
模拟竞争扩增
上述等式单独描述了给定序列的扩增。为了模拟多个寡核苷酸相互竞争时的扩增行为,使用了一种更细粒度的模型。竞争扩增被建模为Monod增长的一个例子(Monod,Jacques(1949).″The growth of bacterial cultures″.Annual ReviewofMicrobiology.3:371-394.doi:10.1146/annurev.mi.03.100149.002103)。通常用于模拟微生物的生长,这种方法描述了以某种最大速率进行的复制,该复制随着限制性底物的消耗而减弱。给定寡核苷酸的两条链中的每一条都被视为一个单独的“生物体”,它们以上述最大速率(即序列的扩增率)产生其补体。这样做时,它会消耗相应的引物;该引物浓度的下降会降低新链的产生率。这种抑制的大小由给定引物浓度与相同浓度和结合引物的所有链的浓度之和的比率给出。对于简单的非竞争PCR(一个靶标,两个引物),该模型由以下常微分方程组组成:
其中A+和A-是序列A的正链和负链的浓度,p1和p2是两个引物的浓度,r是序列的扩增率(注意这里的μ与前面等式中的μ无关。
直接竞争PCR模型(两个靶标WT和REF,两个引物)如下:
因此技术人员可以以类似方式描述本文所包含的所有竞争扩增系统。这些微分方程组可以使用本领域己知的许多分析或数值技术中的任何一种来求解,以产生描述反应中每种物质随时间变化的浓度的曲线。为了获得来自给定探针或一组探针的信号随时间变化的曲线,从业者将结合与这些探针同源的链的浓度。例如,在上述直接竞争PCR的实例中,考虑这样一种情况:FAM标记的探针被设计为与WT-链结合(即它与WT+链共享序列同一性),而HEX标记的探针被设计为与REF-链结合。因此,FAM信号由WT+链的浓度给出,HEX信号由REF+链的浓度给出。如果将额外的FAM标记探针设计为与REF+链结合,则FAM信号将由WT+和REF-链浓度之和给出。
到目前为止描述的情况,即一个靶标多核苷酸和一个相应的竞争多核苷酸,代表了本发明最简单的应用之一。然而,评定一个基因的表达水平并不能真正代表基因网络。可以使用扩增多于一种靶标多核苷酸和/或提供多于一种竞争多核苷酸的组合来评定基因网络中多个基因的表达水平。本发明提供了不同的组合,其中一些将被更详细地描述,但是技术人员将理解不同靶标多肽、不同竞争物和不同引物排列的大量组合,例如引物在靶标与竞争物之间共享、在竞争物与竞争物之间共享,和/或在靶标与靶标之间共享。
其中一些方法被称为“间接”方法,或间接CAN。
当要分析更大的基因特征时,本文描述的间接CAN方法被认为更便宜,因为在“直接”方法中,至少需要为每个靶标转录本设计至少一个(如果不是两个)探针。对于具有20至50个靶标的基因特征(例如基因表达水平、特定突变的存在或缺失、非编码RNA的丰度),在序列设计上进行迭代变得非常昂贵。为了解决这个问题,间接CAN以或多或少的固定成本提供类似的功能,而不管正在研究的基因数量如何。间接竞争还开启了能够同时对多个靶标进行复杂、非线性分析的高阶网络的可能性。最后,冗余靶标为所有CAN架构提供了额外的灵活性。
本文所述的直接竞争方法使用探测的靶标多核苷酸产物和探测的竞争多核苷酸产物之间的竞争。间接方法使用未探测的靶标多核苷酸来简单地调节竞争多核苷酸之间的竞争。因为两个引物对于给定靶标的指数扩增都是必需的,所以仅需耗尽一个引物就可以停止复制。在本发明的这个实施例中,图5中显示为REFH的竞争多核苷酸被设计为与靶标多核苷酸WT共享一个引物,并且与第二竞争多核苷酸REFF共享第二引物(图5)。如果所有组分都具有相同的扩增率,并且两个竞争物(REF)以相同的浓度开始,在没有任何WT存在的情况下,那么HEX和FAM信号(核酸探针上的标记)将同样扩增。然而,增加的WT开始胜过REFH,同时抑制HEX信号。这反过来又为REFF的生长创造了更多空间,导致在反应结束时产生更大的FAM信号。结果是对各种WT浓度的S形响应曲线,类似于从直接竞争中观察到的曲线(图5A)。可以通过调整任何靶标的扩增率、竞争多核苷酸的起始浓度、任何引物的浓度或网络本身的拓扑来调整此响应曲线(图5B、C)。该系统的关键优势在于,由于竞争多核苷酸的序列不受限制(只有与引物杂交的区域具有任何序列限制),因此可以重复使用相同的两个探针序列来探测多个竞争多核苷酸产物,无论使用了多少天然靶标或网络有多复杂,都能最大限度地降低开发成本。
因此,在一些实施例中,所述方法包括提供第二调整竞争多核苷酸。
在一些实施例中,第二引物:
a)能够与所述第一调整竞争多核苷酸杂交,其中第一引物和第二引物在第一调整竞争多核苷酸的相反链上杂交,以导致产生所述第一调整竞争产物,任选地第一调整竞争PCR产物;和
b)能够与所述第二调整竞争多核苷酸杂交并启动引物延伸反应,使得所述第二调整竞争多核苷酸被扩增,以导致产生所述第二调整竞争产物,任选地与另外的引物组合,其中第二引物和另外的引物在所述第二调整竞争多核苷酸的相反链上杂交,以导致产生所述第二调整竞争产物,任选地第一靶标聚合酶链式反应(PCR)产物,
任选地,其中所述第二引物不能与所述第一靶标多核苷酸杂交。
在间接方法的其他不太优选的实施例中,第二引物:
a)能够与所述第一靶标多核苷酸杂交,其中所述第一引物和第二引物在所述靶标的相反链上杂交以导致产生所述第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;和
b)能够与所述第二调整竞争多核苷酸杂交,
并且任选地不能与所述第一竞争多核苷酸杂交。
在一些实施例中,所述第二引物能够与所述第二靶标多核苷酸杂交,并且任选地不能与所述第一靶标多核苷酸杂交。
应当理解,如上所述,该方法可用于一个以上靶标多核苷酸的情况。在一些情况下,该方法用于确定多于一种基因的表达、多于一种特定突变的存在或缺失、和/或多于一种非编码RNA的丰度。在其他实施例中,技术人员将理解相关引物可以被设计成使得多于一个靶标多核苷酸是同一实际RNA分子的一部分。例如,可以设计几个引物对来扩增来自单个mRNA的几个不同区域。结合适当的竞争多核苷酸,本发明的方法的该实施例被称为“冗余”方法。
因此,在一个实施例中,所述第二靶标多核苷酸是与所述第一靶标多核苷酸相同的多核苷酸分子的一部分。
在其他实施例中,所述第二靶标多核苷酸位于与所述第一靶标多核苷酸不同的多核苷酸分子上。
应当理解,通常使用两个引物来扩增每个靶标。因此,本发明的方法可包含多于两个引物,例如至少3、4、5、6或更多个引物。
例如,在一个实施例中,第二引物:
a)能够与所述第一靶标多核苷酸杂交,其中所述第一引物和第二引物在所述靶标的相反链上杂交以导致产生所述第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;和
b)不能与所述第一调整竞争多核苷酸或第二调整竞争多核苷酸杂交
并且其中所述方法包括第三引物,所述第三引物能够与所述第一和第二调整竞争多核苷酸杂交。
在其他实施例中,所述方法包括提供第四引物,其中所述第四引物能够与所述第一靶标多核苷酸杂交,其中所述第一引物和第四引物在所述靶标的相反链上杂交以便允许形成所述第一靶标产物,任选地第一靶标PCR产物。
可以看出,本发明的方法提供了任何合适的引物排列,从而扩增了每个相关靶标或竞争物,并且使得每个靶标和竞争物适当地竞争相关引物。
为了进一步举例说明本发明提供的靶标、竞争物和引物排列的不同组合,在一些实施例中,所述方法包括提供:
a)第二引物能够
i)与所述第一靶标多核苷酸杂交,其中所述第一引物和第二引物在所述靶标的相反链上杂交以导致产生所述第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;并且
ii)能够与所述第一调整竞争多核苷酸杂交;以及
b)第三引物能够
i)与所述第一调整竞争多核苷酸杂交,其中第三引物和第二引物在所述第一调整竞争多核苷酸的相反链上杂交,以导致产生所述第一调整竞争多核苷酸产物,任选地第一调整竞争多核苷酸聚合酶链式反应(PCR)产物;并且
ii)能够与所述第二调整竞争多核苷酸杂交;
以及
c)第四引物能够与所述第二调整竞争多核苷酸杂交,其中第三引物和第四引物与所述第二调整竞争多核苷酸的相反链杂交,以导致产生所述第二调整竞争多核苷酸产物,任选地第二调整竞争多核苷酸聚合酶链式反应(PCR)产物。
很明显,第四引物和第五引物可以与其他靶标多核苷酸和/或其他竞争多核苷酸结合,从而扩大了所评估网络的复杂性。
如上所述,本发明的一个关键特征是使用一个或多个调整竞争多核苷酸,其扩增速率相对于相应靶标多核苷酸或相对于网络内其他靶标或竞争多核苷酸的扩增速率进行了专门调整。这种调整提供了扩增的区分,将预测关系、决策面或差异靶标寡核苷酸模式(例如差异基因调控特征或特定突变的存在或缺失)转化为可以进行简单询问的每个扩增产物的相对丰度,例如通过使用标记的核酸探针。
因此,在一个实施例中,所述第一靶标多核苷酸的扩增率不同于所述第一调整竞争多核苷酸的扩增率。在其他实施例中,所述靶标多核苷酸的扩增率不同于其对应调整竞争多核苷酸的扩增率。
通常,在现有技术的扩增方法中,当试图扩增产物时,扩增速率被优化,使得扩增尽可能有效。技术人员知道提高扩增效率的技术,例如改变产物的长度、改变G/C含量和改变引物的浓度。由于本领域技术人员知道如何改进扩增,所以本领域技术人员知道如何使扩增效率降低,即降低扩增速率。
技术人员将理解重要的是所述靶标与所述竞争物之间(或在一些情况下所述靶标与多个竞争物之间,或所述多个靶标与所述竞争物之间,或所述多个靶标与所述多个竞争物之间)的相对扩增率,不一定是绝对扩增率。因此,重要的是选择最合适的靶标区域进行扩增,例如特定靶标mRNA最合适的200bp区域,以便靶标和竞争物之间的相对扩增率是合适的。
因此,在一个实施例中,所述任何靶标多核苷酸或竞争多核苷酸的扩增率可以通过以下中的一者或多者改变:
a)根据长度和/或GC含量百分比选择所述靶标核酸序列;
b)设计所述竞争物核酸序列以改变长度和/或GC含量百分比;
c)增加或减少所述竞争物核酸序列的起始浓度;和/或
d)增加或减少任何核酸引物的起始浓度。
因此,在一个实施例中,可以通过增加或减少所述竞争多核苷酸产物的碱基对数量来改变所述竞争多核苷酸产物的扩增率。
在一些实施例中,所述竞争多核苷酸的扩增率为:
通过减少碱基对的数量而增加;
通过增加碱基对的数量来减少;
通过增加或减少竞争多核苷酸的GC含量百分比而改变;
随着GC含量百分比的增加而降低;和/或
通过增加GC含量百分比来降低。
作为实例,下文提供了靶标产物和相应竞争产物的配对序列,其被调整以提供各种相对扩增率并在实例中举例说明。
扩增率可以定义为“r”,在没有任何其他多核苷酸的情况下,通过将以下等式拟合到在只有能够与其杂交的引物的多核苷酸上运行的标准定量PCR的荧光迹线来估算:
这个和其他合适的等式是本领域已知的,参见例如Spiess等人BMCBioinformatics 9文章编号221(2008);Rutledge NAR 200432:e178;和Liu等人CellCulture and Tissue Engineering 200127:1407-1414。
其中t是测量每个荧光值的周期。典型的反应包括市售的qPCR预混液、两种引物各125nM、各自的探针250nM,在60℃下运行60个循环。曲线拟合通常会通过非线性最小二乘(NLLS)算法来执行。此过程中的变化,包括用荧光染料(例如Sybr Green、EvaGreen)代替探针,改变持续时间、温度或所涉及的浓度,或其他统计方法(如贝叶斯估计),都是允许的,只要对所有被评估的多核苷酸使用相同的方法。同样,可以使用不同的等式来估计“r”,包括但不限于:
/>
其中f定义为上述任一等式中的F
由于竞争多核苷酸被调整为对靶标多核苷酸具有不同的扩增率,在扩增反应包含相同或基本相同数量的初始靶标和竞争模板分子的情况下,产生的靶标产物多核苷酸的数量不同于产生的调整竞争产物多核苷酸的数量。因此,在该方法的一个实施例中,当靶标多核苷酸的初始数量与引物延伸之前的调整竞争多核苷酸的数量相同或基本相同时,所产生的靶标产物多核苷酸的数量不同于所产生的调整竞争产物多核苷酸的数量。
调整竞争多核苷酸以使靶标和竞争物具有特定的相对扩增率的前提最终是模拟预测关系、决策面或差异基因调控特征或作为该方法目的基础的特定突变的存在/缺失,例如在诊断学、预测学或简单地拍摄系统或基因网络当前状态的快照。因此,在一个实施例中,待扩增的所述第一靶标多核苷酸的序列和至少第一调整竞争多核苷酸的序列,被选择以导致最终可检测信号,所述最终可检测信号随着所述第一靶标多核苷酸的初始浓度以这样的方式变化,以致于近似、再现或匹配所述靶标与一个或多个状态的预测关系或差异基因调控特征。
这样,如果特定样品具有低水平的基因表达,但该低表达为例如高度预测疾病状态(或具有特定突变,但该突变比第二突变更能预测疾病状态),那么靶标产物的最终检测水平可能很高(相应的竞争多核苷酸被设计为具有较差竞争物的序列);而具有高表达水平但对疾病预测性差的基因,可能具有较低的最终可检测水平的靶标产物(即相应的竞争多核苷酸被设计为具有高度竞争性的序列,将高基因表达转化为较低数量的靶标产物),因为竞争物的序列被选择以将正确的权重应用于每个靶标的扩增。
同样的前提适用于直接方法,其中每个靶标多核苷酸由两个引物扩增,这两个引物也扩增相应的调整竞争多核苷酸(请记住,在每个反应中可能有许多不同的靶标和不同的相应竞争多核苷酸被扩增,如下所述);并且也适用于间接方法,例如靶标由两个引物扩增,其中一个也用于扩增第一竞争物和第二竞争物引物,后者本身用于扩增第二竞争多核苷酸,例如-靶标-竞争物1-竞争物2-,其中每个“-”是一个引物。技术人员能够生成这样的扩增网络,其有效地编码预测关系或差异基因调控特征,使得输出,即靶标和竞争物的产物量,是诊断性的、预测性的或以其他方式预测状态A与状态B的概率。
因此,在一个实施例中,第一靶标多核苷酸的扩增速率和所述第二靶标多核苷酸的扩增速率接近、再现或匹配预先定义的权重。技术人员将理解,权重源自测定信号近似、再现或匹配预测信号所必需的任何东西,这通常将通过模拟来识别。
涉及竞争扩增的现有技术方法要求竞争物在序列上尽可能接近靶标序列,因为这些方法被用于量化起始靶标模板的数量,所以扩增率的任何差异都会使结果发生偏差。从本文公开的内容中,可以明确的是,本发明所述的竞争多核苷酸被有意设计为具有与靶标不同的扩增率。这可以通过具有与靶标不同的序列来实现。在一个实施例中,待扩增的所述第一调整竞争多核苷酸的序列与待扩增的所述第一靶标多核苷酸的序列共享少于95%、90%、88%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%的序列同一性。技术人员将清楚,待扩增的靶标序列通常是较大多核苷酸内的子序列,例如500个核苷酸的多核苷酸的一个200个核苷酸区域。技术人员将理解,对特定序列同一性或扩增速率的要求仅适用于待扩增的多核苷酸的这一部分,而侧翼区域的序列在很大程度上是不相关的。
如上所述,可以通过改变待扩增序列的GC含量来实现不同的扩增率。因此,在一个实施例中,待扩增第一调整竞争多核苷酸的序列(即第一调整竞争产物的序列)包含至少15%GC,或至少25%,至少35%,至少55%,至少65%,至少75%,至少85%,或至少85%GC。
在相同或不同的实施例中,待扩增的第一靶标多核苷酸部分和待扩增的第一竞争多核苷酸的GC含量的差异为至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%或至少90%或95%。例如,待扩增的第一靶标多核苷酸部分可包含20%GC的序列,而待扩增的第一竞争多核苷酸可包含25%GC的序列,导致GC含量相差5%。
改变要生成的产物的长度,即在任何给定扩增中使用的两个引物的杂交位点之间的距离,也可以用于(单独或与此处描述的其他方法组合,例如改变GC含量)调整扩增率。因此,在相同或不同的实施例中,第一调整竞争产物比第一靶标产物长至少5个核苷酸,任选地比第一靶标产物长至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100,、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸。
在一些实施例中,第一调整竞争产物比第一靶标产物短至少5个核苷酸,任选地比第一靶标产物短至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸。
在一些实施例中,第一调整竞争产物比第一靶标产物长至少5个核苷酸,任选地比第一靶标产物长至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸。
技术人员将理解,可以使用上述参数中的一个或所有的任何组合,即GC含量、序列同一性和扩增子的长度来产生适当的调整竞争多核苷酸。
扩增后,检测扩增产物对本领域技术人员来说是显而易见的。在某些情况下,检测特定产物的存在或缺失就足够了。在其他情况下,需要确定产物的实际或相对丰度。技术人员可使用各种方法来确定扩增产物的存在或数量,包括基于凝胶的电泳测定、基于亲和力的扩增产物捕获(例如在侧向流动条上)和基于荧光标记探针的测定。
当用于确定至少两个靶标多核苷酸的相对丰度时,本发明特别有效。因此,在一些实施例中,检测出一种或多种靶标产物,任选地一个或多个靶标PCR产物;和一个或多个调整竞争产物,任选地一个或多个竞争多核苷酸PCR产物。
在优选的实施例中,检测出每个靶标产物和每个对应的竞争产物。在特别优选的实施例中,检测涉及使用荧光标记的探针,其中无论检测到多少靶标和竞争物,检测仅使用两种不同的荧光团。将每个探针的荧光相加(即仅从两个荧光团读取一次荧光)产生一个单一的总值,即哪个荧光标记更高。反过来,这对应于诊断或预测。
因此,在一些实施例中,方法包括提供一个或多个探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸,并且其中第一标签和第二标签不同。
在一些情况下,至少一个标记有第一标签的探针能够与第一靶标产物杂交;并且至少一个标记有第二标签的探针能够与第一调整竞争产物杂交。在一些实施例中,两个探针都不能与第一靶标产物杂交。
在其他情况下,至少一个标记有第一标签的探针能够与第一调整竞争产物杂交;并且至少一个标记有第二标签的探针能够与第二调整竞争产物杂交。在一些实施例中,两个探针都不能与第一靶标产物杂交。
以上反映了这样一个事实,即当与对照(例如未患病)样品相比表达水平增加时,一些基因可能具有预测或诊断作用;并且当与对照样品相比表达水平降低时,一些基因可能具有预测或诊断作用。技术人员将能够确保将正确的标签分配给正确的探针,以便结合总荧光考虑基因表达的方向。本发明的一个关键特征是提供信息的是标签之间的差异;技术人员决定哪个标签提供“正”信号,哪个标签提供“负”信号。
一个特定的探针组代表一组探针,每个探针仅用两个不同标签中的一种进行标记。很明显,如上所述,这些方法可用于检测多个不同的靶标产物和竞争产物。因此,在一些实施例中,在单个探针组中存在至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第一标签。在相同或其他实施例中,在单个探针组中至少存在2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第二标签。如上所述的直接方法通常需要一个具有一个可以与靶标产物杂交的标签的探针,并且相应的标记有第二标签的探针可以与相应竞争产物杂交,即探针的比例为1:1(尽管根据预测关系或差异基因调控特征,可以如上所述交换标签)。间接方法不一定需要这个1:1的比例,因为例如单个靶标产物可能与两个或更多个竞争产物相关联。
因此,在一些实施例中,在单个探针组中存在:
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第一标签;以及
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第二标签。
在一些实施例中,合适的探针如下:
如上所述,这些方法的力量至少来自于将许多不同靶标和竞争物的检测合并为两个单一读数(即第一标签的读数和第二标签的读数,两者都可以在一个单一读数中完成),它们本身被合并为一个单一读数,即第一标签多少相对于第二标签多少。
然而,如果需要分析大量基因的表达,或分析更复杂的网络,则可以使用更多的探针组,例如用第三引物和第四引物标记(或用第五标签和第六标签标记的第三探针组等)。以这种方式,可以使用第一探针组(读取第一标签和第二标签,然后是第一标签多少相对于第二标签多少)和第二探针组(读取第三标签和第四标签,然后是第三标签多少相对于第四标签多少)分析一组基因。如有必要,可以读取第一:第二:第三:第四标签的整体读数。这将完全取决于所采用的预测关系或差异基因调控特征。
因此,在一些实施例中,方法包括提供至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针组,其中每个特定标签被用于多于一个探针组中。
在一些实施例中,方法包括提供许多标记的探针多核苷酸,使得每个靶标产物具有对应标签靶标探针多核苷酸并且每个调整竞争产物具有对应标签竞争探针,并且其中,与靶标产物和调整竞争产物对应的标记的探针标记有不同的标签。
在一些实施例中,存在于探针上的唯一标签是第一标签和第二标签。
在一些实施例中,每个探针都标记有单一类型的标签。例如,每个探针只使用HEX标记,或者只使用FAM标记,而不使用HEX和FAM两者标记。然而,本领域技术人员将清楚,每个探针可以用多于一个相同标签的分子进行标记,例如可以使用1、2、3、4、5或更多个HEX分子进行标记。
探针可以用任何类型的可检测标签进行标记,例如导致颜色变化的基于酶的标签。优选地,标签是荧光团。因此,在一些实施例中,第一标签和第二标签是荧光团。荧光团标记探针的实例是“TaqMan”探针(需要降解以从接近淬灭剂的位置释放荧光团)、Hybeacons(仅当与靶标结合时才会发光)和Molecular Beacons(当与扩增子结合时,使两个荧光团在物理上保持距离,尽管荧光团仍然通过探针束缚)和Scorpion探针。
从上文可以清楚地看出,提及荧光团并不意味着淬灭剂也可能不存在。例如,在一些实施例中,探针标记有第一荧光团和第二荧光团。然而,正如本领域技术人员所理解的,每个探针也可以使用合适的淬灭剂标记。
或者,探针可以以用于基于亲和力分离的方式标记(参见例如用于核酸侧流免疫测定的Abingdon探针https://www.abingdonhealth.com/other-products/nucleic-acid-detection-pcrd/和Twistdx提供的探针https://www.twistdx.co.uk/docs/default-source/Application-notes/app-note-001---pcrd-rpa-use-v1-7.pdf?sfvrsn=615403fc_46)。作为一个这种实施例的实例,一个探针标记有FAM,而另一个标记有半抗原地高辛(DIG)。每个靶标和竞争物的引物都标记有生物素;因此,扩增产生一些一端标记有生物素而另一端标记有FAM的扩增子,以及一端标记有生物素而另一端标记有DIG的其他扩增子。扩增子与链霉抗生物素蛋白包被的金纳米粒子溶液混合,金纳米粒子与生物素结合形成纳米粒子-扩增子复合物,然后允许其向上流动到侧流条上。在该条上以不同的行印刷的抗FAM和抗DIG抗体充当亲和纯化剂,与各自的扩增子结合。这导致金纳米粒子被困在印刷线上,产生肉眼可见的暗红色带。这两个条带的相对强度以与上述两个荧光团的相对强度相同的方式提供“信号”。
技术人员理解通过与核酸靶标杂交发挥作用的探针需要什么。例如,探针可能具有与靶标相关区域100%相同的序列。然而,本领域技术人员还理解序列不必100%相同。设计这样的杂交探针对于技术人员来说完全是常规的。
技术人员将理解荧光团的含义并且能够识别合适的荧光团或荧光团对。优选地,选择第一荧光团和第二荧光团使得它们具有不同的发射光谱。示例性荧光团是TAM、SUN、VIC、TET、JOE、花青染料(Cy3、Cy3.5、Cy5、Cy5.5)、Atto染料和Alexa Fluors(参见例如https://eu.idtdna.com/site/Catalog/modifications/dyes和https://www.trilinkbiotech.com/omi-图7)。
特别有用的组合被认为是FAM和HEX;CY3和CY5;以及FAM、HEX、TET和Cy5的任意组合。
一对特别有用的荧光团是FAM和HEX。
因此,在一个实施例中,第一标签是FAM并且第二标签是HEX。
在另一个实施例中,第一标签是HEX并且第二标签是FAM。
重要的是,与靶标产物结合的探针和与相应竞争产物结合的探针用不同的标签进行标记,因此可以确定每种产物的相对量,或者将其纳入不同靶标产物和不同竞争产物的总体测定中。
因此,在一个实施例中,至少一个能够与第一靶标产物杂交的探针;和至少一个能够与第一调整竞争产物杂交的探针被标记有不同的标签。
在相同或不同的实施例中,至少一个能够与第一调整竞争产物杂交的探针;和至少一个能够与第二调整竞争产物杂交的探针被标记有不同的标签。
在一些实施例中,当基因的表达相对于对照样品或对照水平增加时,一组基因都可以预测特定状态(例如疾病、预测),那么适当的是,能够与靶标产物杂交的每个探针都标记有相同的第一标签;并且能够与调整竞争产物杂交的每个探针都标记有相同的第二标签。
然而,在如上所述的一些实施例中,一些基因预测当基因表达被抑制时的特定状态。由于许多预测关系或差异基因调控特征和网络涉及一些基因的表达增加和其他基因的伴随抑制,因此重要的是这可以反映在该方法的简单输出中。因此,在一些实施例中,至少一个能够与靶标产物杂交的探针标记有第一标签,并且至少一个能够与调整竞争产物杂交的探针标记有相同的第一标签。
在一些情况下,在给定的扩增反应中,将存在能够与标记有第一标签的靶标产物杂交的探针、能够与标记有第二标签的靶标产物杂交的探针、能够与标记有第一标签的竞争产物杂交的探针,以及能够与标记有第二标签的竞争产物杂交的探针。
在一些实施例中,能够与特定状态的正预测关系或差异基因调控特征相关的靶标多核苷酸产物杂交的每个探针都标记有所述第一标签,并且能够与调整竞争多核苷酸产物杂交的相应探针标记有所述第二标签;和/或
其中每个能够与特定状态的负预测关系或差异基因调控特征相关的靶标多核苷酸产物杂交的探针标记有第二标签,并且能够与调整竞争多核苷酸产物杂交的相应探针标记有第一标签。
在一些情况下,其中在扩增之后,确定由第一探针检测到的每种产物的实际量和由第二探针检测到的产物的量。
在其他实施例中,确定的是每种探针的相对量。例如,在一些实施例中,将每种探针的相对量与标准曲线进行比较,以确定一种或多种状态的相对概率。
生成适当的标准曲线对于技术人员来说是常规的,并且需要由个人用户或制造商进行校准,以将原始信号(或在此情况下,信号之间的差异)与预测/诊断相关联。
本发明的一个优点是它允许同时询问许多不同的表达模式,例如通过多重PCR,并且由于仅使用2个,或者可能是少量的,例如3、4、5、6个不同的荧光团,允许丰度或相对丰度,或每个产物被浓缩成单一读数,例如多个波长(通道)上的单一读数以检测来自每个探针标签的荧光量,或者在同一个样品上快速连续进行的多个读数。
那么很明显,本发明所述的方法将给定基因转录本或转录本组提供的信息转化为特定状态的相对概率。
本文描述的方法捕获基因表达网络的一部分的状态,任选地作为单一值。
技术人员将清楚,靶标多核苷酸可以是任何来源的任何核酸,只要它能够被扩增。在一个实施例中,靶标多核苷酸是RNA,任选地是RNA转录本,任选地是mRNA。在一些实施例中,靶标多核苷酸是miRNA、lncRNA或siRNA。
靶标多核苷酸也可以是DNA。DNA可以是DNA的修饰形式。
样品可以是任何样品,只要它包含或预期包含核酸。
本发明所述的方法具有医学用途和生物技术/生物产物用途。样品可选自包括或由以下项组成的组:组织、活组织检查、血液、血浆、血清、病原体、微生物细胞、细胞培养物和细胞裂解物。
样品可包含任何来源的核酸。在一些示例中,样品包含以下任何一项或多项:细胞,任选地白细胞和/或红细胞;外泌体;循环肿瘤DNA(ctDNA);游离DNA(cfDNA);RNA;或病原体核酸。
细胞可以是任何细胞类型。例如,细胞可以是哺乳动物细胞、细菌细胞、酵母细胞或植物细胞。哺乳动物细胞可以是人类细胞或源自人类细胞。
细胞可以是培养细胞,任选地原代患者来源的细胞或永生化细胞系。
细胞可以是哺乳动物干细胞。
在一些实施例中,细胞是工程细胞,任选地用于代谢物和化合物的生物生产的工程细胞。
细胞可以是酵母细胞,任选地其中酵母细胞用于酿造。
从上文清楚的是,在一些优选的实施例中,本发明所述的方法用于扩增至少第一靶标多核苷酸和第二靶标多核苷酸。
在一些实施例中,所述方法用于扩增至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或至少100个靶标多核苷酸。
如上所述,本发明方法还包括所谓的“冗余”模型,由此扩增相同物理靶标多核苷酸分子的至少两个或更多部分。
因此,在一些实施例中,第一靶标多核苷酸和第二靶标多核苷酸是相同的单个多核苷酸内的靶标序列。
在一些特定实施例中,方法包括用至少一个引物扩增调整竞争多核苷酸,该引物能够与第一靶标多核苷酸和第二靶标多核苷酸杂交并产生第一靶标产物和第二靶标产物。
在一些实施例中,方法包括扩增两个调整竞争多核苷酸,其中该方法包括:
用至少一个能够与第一靶标多核苷酸杂交的引物扩增第一调整竞争多核苷酸;和
用至少一个能够与第二靶标多核苷酸杂交的引物扩增第二调整竞争多核苷酸。
很明显,在扩增之后,产物的检测,例如荧光团标记的探针产生的信号的检测,指示以下中的任何一者或多者:
i)存在或缺失;
ii)特定的预定起始浓度;
iii)高于或低于预定水平的起始浓度;和/或
iv)起始浓度落在预定范围内,
一种或多种靶标多核苷酸。
在一些实施例中,以上(i)、(ii)、(iii)和/或(iv)指示以下中的一者或多者:
a)特定基因的相对表达;
b)两种或更多种特定基因的相对表达;
c)一种或多种管家基因的表达
d)特定基因表达特征的表达;
e)一种或多种基因的特定等位变体的表达;
f)基因突变版本的表达;
g)无细胞肿瘤DNA的表达,
其中靶标多核苷酸选自(a)-(g)的已知序列的一个或多个部分。
如本文所述,本发明的方法可用于确定特定样品是否更可能处于特定状态A而不是特定状态B。该状态是预测关系或差异基因调控特征所依据的状态。在某些情况下,该状态可能是“特定疾病”相对于“无疾病”或相对于“其他疾病”或相对于“非特定疾病”。
本发明提供的任何方法都可以用于受试者的疾病或病症的诊断和/或预测。
因此,本发明还提供了一种用于受试者的疾病或病症的诊断和/或预测方法。
在一些情况下,诊断疾病或病症需要评估至少两个基因的相对表达水平,任选地需要评估至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个基因的相对表达水平。
在一些实施例中,该疾病或病症选自:人结核病、合并感染HIV的人结核病、未合并感染HIV的人结核病、癌症,任选地前列腺癌、败血症、血流念珠菌病、牛结核病、牛乳腺炎。在特定的实施例中,该疾病是结核病。
在非常具体的实施例中,该疾病是结核病,并且从所述受试者的白细胞中鉴定出所述差异基因调控特征和/或预测关系或差异基因调控特征。
在一些实施例中,当该疾病是结核病时,GBP6、ARG1和TMCC1的差异调节程度,有助于患结核病的总体概率(相比较于患有某种“其他疾病”)。与未患有结核病的患者的这些基因水平相比,基因表达特征是GBP6的上调和ARG1和TMCC1的下调。
在该疾病是结核病且GBP6、ARG1和TMCC1的差异调节程度,有助于与患有某种“其他疾病”相比而患有结核病的总体概率的实施例中,可以使用的引物和竞争序列的示例如图17所示。
在图17中,每种情况下的WT序列都是靶标序列。所述F引物和R引物序列是用于扩增靶标和相应竞争序列的序列。“Core”序列是两个引物退火位点之间的竞争序列,而“Fullseq”是由两个引物扩增的完整靶标或竞争寡核苷酸的序列。
在一个实施例中,靶标是TMCC1并且靶标序列是SEQ ID NO:4,用于确定最佳竞争物的适当竞争序列被认为是SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36。用于扩增靶标和竞争物的合适引物示于SEQ ID NO:1和3。用于检测该靶标贡献的适当探针示于SEQ ID NO:77和78。
在一个实施例中,靶标是ARG1并且靶标序列是SEQ ID NO:40,用于确定最佳竞争物的适当竞争序列被认为是SEQ ID NO:42、44、46和48。用于扩增靶标和竞争物的合适引物示于SEQ ID NO:37和39。用于检测该靶标贡献的适当探针示于SEQ ID NO:79和78。
在一个实施例中,靶标是GBP6并且靶标序列是SEQ ID NO:52,用于确定最佳竞争物的适当竞争序列被认为是SEQ ID NO:54、56和58。用于扩增靶标和竞争物的合适引物示于SEQ ID NO:49和51。用于检测该靶标贡献的适当探针示于SEQ ID NO:80和77。
在其他实施例中,该疾病是癌症,例如前列腺癌或乳腺癌,任选地前列腺癌。
如果该疾病是前列腺癌,可以使用的引物和探针如下:
在一些实施例中,该疾病是癌症,并且检测基因突变形式,特别是等位变体和/或无细胞肿瘤DNA的相对表达。
在本文所述的任何方法和实施例中,该靶标多核苷酸可包含与疾病状态相关的SNP、SNV(单核苷酸变体)插入缺失或拷贝数变体(CNV),任选地与肿瘤和/或癌症的存在相关,例如可包含无细胞肿瘤DNA中的snp、snv或插入缺失。
在一些实施例中,靶标是EGFR,特别是EGFR中的SNP。在一些实施例中,靶标序列是SEQ ID NO:62,并且合适的竞争序列是SEQ ID NO:64、67和71。合适的引物序列是SEQ IDNO:68和70。
在一些方法中,使用阻断寡核苷酸,其中阻断寡核苷酸不能进行其3′末端的延伸,并且其中阻断寡核苷酸不与至少一个靶标多核苷酸中含有单核苷酸多态性的序列部分互补,任选地,其中snp是snv,但其中阻断寡核苷酸与相应的野生型序列互补,并且其中靶标多核苷酸中包含与阻断寡核苷酸互补的序列与和引物之一互补的序列的至少一部分重叠。
在一些情况下,合适的阻断剂序列是SEQ ID NO:75和76。
在一些情况下,样品是从已经被怀疑患有特定疾病或病症的受试者获得的。在其他情况下,该方法可用作常规筛查程序的一部分,在这种情况下,靶标多核苷酸可来源于从未怀疑患有特定疾病或病症的受试者获得的样品。例如由于年龄或生活方式,受试者可能被认为处于特定疾病或病症的风险中。
如上所述,除了医疗用途之外,本发明在生物工程和工业生物技术领域也很有用。在一些实施例中,检测一个或多个特定基因的相对表达指示特定天然和/或工程基因在培养细胞中的表达,并且可以例如允许技术人员确定细胞或系统是否表现良好,或者例如如果需要优化培养参数。
如上所述,任何扩增方式都适用于本发明。然而,优选的扩增方法包括聚合酶链式反应(PCR)或重组酶聚合酶反应(RPA)。
如上所述,本发明提供了多种用于扩增一种或多种靶标多核苷酸的方法。如开头所述,本发明提供:
将样品中至少两种寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失,转化为特定状态的相对概率的方法;
仅使用两个荧光团标记的探针检测样品中至少三种寡核苷酸的相对丰度的方法,例如至少三个基因的相对表达,或至少三个突变的存在或缺失;
将样品中至少两种寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失,组合成单一值的方法;
将样品中由至少两种寡核苷酸的相对丰度或至少两个突变的存在或缺失提供的预测关系、决策面或差异靶标寡核苷酸模式(例如差异基因调控特征)转换为单一值的方法;
一种采用竞争扩增网络模拟统计信息的方法;
;以及
将复杂基因表达模式简化为单一值的方法;
其中该方法包括扩增样品中的一种或多种靶标多核苷酸的步骤。扩增一个或多个靶标多核苷酸的步骤可根据本文所述的任何一种扩增方法来进行。
本发明进一步提供了一种诊断或预测受试者的疾病或病症的方法,其中该方法包括本发明的任何扩增方法。在一些实施例中,当第一标签和第二标签的相对量指示疾病或病症的预测时,受试者被诊断为患有疾病或病症或疾病或病症的预测。
如上所述,疾病或病症可选自:人结核病、合并感染HIV的人结核病、未合并感染HIv的人结核病、癌症、任选地前列腺癌或乳腺癌、败血症、血流念珠菌病、牛结核病、牛乳腺炎。对疾病或病症的优选如本文别处所述。
本发明还提供了可用于实施本发明方法的各种组合物和试剂盒。例如,本发明提供了一种组合物,该组合物包含以下的一种或多种:
a)至少一个如本文所述的靶标多核苷酸;
b)至少一个如本文所述调整竞争多核苷酸;
c)至少一个如本文所述的引物,优选至少两个引物;
d)至少一个或多个如本文所述的探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸。
技术人员将理解,用于核酸扩增的组合物可包含一个或多个标准扩增组分,例如聚合酶;适量四种核苷酸A、C、T和G中的每一种;重组酶;单链结合蛋白;和/或核苷酸A、C、T、G和U中每一种的适量。
本发明还提供了一种如本文所述的调整竞争多核苷酸。对调整竞争多核苷酸特征的优选在本文别处描述。
本发明还提供了一种用于实施本发明任何一种方法的试剂盒,例如,其中所述试剂盒包括以下中的一者或多者:
a)如本文所述的一个或多个调整竞争多核苷酸;
b)如本文所述的一个或多个引物;
c)标标记有如本文所述的第一标签的第一探针多核苷酸和标记有如本文所述的第二标签的第二探针多核苷酸;
d)合适的缓冲液;
e)使用说明。
在特定实施例中,该试剂盒包括:
a)如本文所述的一个或多个调整竞争多核苷酸;
b)如本文所述的一个或多个引物;
c)标记有如本文所述的第一标签的第一探针多核苷酸和标记有如本文所述的第二标签的第二探针多核苷酸。
本发明还提供了一种组合物,其包含以下中的任何一者或多者:
a)如本文所述的一个或多个调整竞争多核苷酸;
b)如本文所述的一个或多个引物;
c)标记有如本文所述的第一标签的第一探针多核苷酸和标记有如本文所述的第二标签的第二探针多核苷酸。
在一个实施例中,该组合物包含:
a)如本文所述的一个或多个调整竞争多核苷酸;和
b)如本文所述的一个或多个引物。
在一个实施例中,该组合物包含:
a)如本文所述的一个或多个调整竞争多核苷酸;和
c)标记有如本文所述的第一标签的第一探针多核苷酸和标记有如本文所述的第二标签的第二探针多核苷酸。
在一个实施例中,该组合物包含:
b)如本文所述的一个或多个引物;和
c)标记有如本文所述的第一标签的第一探针多核苷酸和标记有如本文所述的第二标签的第二探针多核苷酸。
在一个实施例中,该组合物包含:
a)如本文所述的一个或多个调整竞争多核苷酸;
b)如本文所述的一个或多个引物;和
c)标记有如本文所述的第一标签的第一探针多核苷酸和标记有如本文所述的第二标签的第二探针多核苷酸。
在一个实施例中,该试剂盒或组合物包含图17中所示的序列中的任何一者或多者。
在一个实施例中,该试剂盒或组合物用于扩增TMCC1 mRNA的一部分并且包含以下的竞争序列中的任一者或多者:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36。在一些实施例中,该试剂盒或组合物还包含用于扩增靶标和竞争物的适当引物,例如SEQ ID NO:1和3。
在相同或不同的实施例中,该试剂盒或组合物用于,或也用于,扩增ARG1 mRNA的一部分并且包含以下的竞争序列中的任一者或多者:SEQ ID NO:42、44、46和48。在一些实施例中,该试剂盒或组合物还包含用于扩增靶标和竞争物的适当引物,例如SEQ ID NO:39和39。
在相同或不同的实施例中,该试剂盒或组合物用于,或也用于,扩增GBP6 mRNA的一部分并且包含以下的竞争序列中的任一者或多者:SEQ ID NO:54、56和58。在一些实施例中,该试剂盒或组合物还包含用于扩增靶标和竞争物的适当引物,例如SEQ IDNO:49和51。
在其他实施例中,该试剂盒或组合物用于扩增EGFR基因组DNA的一部分,例如ctDNA样品中的基因组DNA,例如为了区分野生型等位基因与特定突变(例如L858R SNP),并且包含以下的竞争序列中的任一者或多者:SEQ ID NO:64、67和71。在一些实施例中,该试剂盒或组合物还包含用于扩增靶标和竞争物的适当引物,例如SEQ ID NO:68和70。
本发明还提供了一种集合或试剂盒,其包含至少两个如本文所述的调整竞争多核苷酸,其中该集合包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、24、25、26、28、30、32、34、35、36、38、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190或至少200个调整竞争多核苷酸。
本发明还提供了一种集合或试剂盒,其包含至少两个调整竞争多核苷酸和至少两个相应标记探针。
本发明还提供了一种集合或试剂盒,其包括:
至少两个调整竞争多核苷酸;
至少两个相应标记探针;和
至少两个引物。
进一步地,本发明提供了一种集合或试剂盒,其包括:
至少两个如前述权利要求中任一项所述的调整竞争多核苷酸;
至少两个如前述权利要求中任一项所述的相应标记探针;和
至少两个如前述权利要求中任一项所述的引物。
本发明还提供了调整第一竞争多核苷酸的方法,该第一竞争多核苷酸竞争至少第一引物与第一靶标多核苷酸的杂交,并且导致第一靶标产物和第一调整竞争产物的扩增,并且其中:
a)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
b)该第一靶标多核苷酸的扩增近似、再现或匹配靶标多核苷酸对特定状态的预测关系或差异基因调控特征;和/或
c)该第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率接近、再现或匹配预定义的权重,
该方法包括:
相对于所述第一靶标产物的序列和/或所述第一靶标产物的长度,优化调整竞争多核苷酸的序列和/或调整竞争扩增产物的长度。上面给出了关于技术人员如何根据特定情况调整竞争多核苷酸的详细讨论,以及还可以参见例如下面的“模拟逻辑回归”部分。
调节本发明的竞争多核苷酸的方法还可以包括:
在扩增中使用能够与第一靶标多核苷酸杂交的第二引物,使得第一靶标产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
在扩增中使用能够与第一调整竞争多核苷酸杂交的第三引物,使得第一调整竞争产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
任选地,其中第二引物和第三引物具有相同的序列。
在一些情况下,所述优化包括产生两个或更多的测试调整竞争多核苷酸,其在扩增后导致:
a)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
b)第一靶标多核苷酸的扩增近似、再现或匹配靶标对特定状态的预测关系或差异基因调控特征;和/或
c)该第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率接近、再现或匹配预定义的权重,
并且选择导致所述第一靶标多核苷酸的最优选扩增的调整竞争物。
在一些情况下,所述优化包括产生至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个不同的测试调整竞争多核苷酸。
在一些实施例中,所述优化包括用每个测试调整竞争多核苷酸进行至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20次测试扩增反应,
任选地,其中使用至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个不同浓度的靶标多核苷酸和/或靶标多核苷酸分子的数量进行至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20次扩增反应。
在一个优选实施例中,进行五个扩增反应的至少两个重复,其中该五个扩增反应中的每个都使用不同的调整竞争多核苷酸。
在一些情况下,使用特定测试调整竞争多核苷酸的每次测试扩增都是使用不同浓度和/或数量的靶标多核苷酸模板进行。
在一些实施例中,该测试扩增反应是使用范围为100拷贝/μL至108拷贝/μL的浓度和/或数量范围的靶标多核苷酸模板进行。
如本文所述,在一些情况下,该测试调整竞争多核苷酸被设计成具有不同的GC含量。
本发明还提供了一种根据前述权利要求中任一项所述的优化竞争扩增反应的方法,其中所述优化包括:
a)增加或减少合成核酸序列的起始浓度;和/或
b)增加或减少任何一个核酸引物的起始浓度。
本发明还提供了一种对至少两个靶标多核苷酸进行多重竞争扩增的方法,其中该方法包括至少一个竞争多核苷酸,并且其中使用标记有相同标签的探针检测靶标扩增产物,任选地标记有相同的荧光团,任选地其中该竞争多核苷酸是根据前述权利要求中任一项所述的调整竞争多核苷酸。
本发明还提供了一种确定系统转录状态的方法,其中该方法包括根据本发明的任何方法的竞争扩增。
本发明还提供了一种确定系统是处于状态A还是处于状态B的方法,其中该方法包括根据本发明的任何一种方法的竞争扩增。
所述方法还提供了一种样品中至少两个靶标多核苷酸的同时竞争扩增的方法,其中所述方法包括提供
a)包含多核苷酸的样品;
b)第一和第二调整竞争多核苷酸;
c)第一引物组,其中该引物组包含两个能够在第一靶标多核苷酸和第一竞争多核苷酸的相反链上杂交的引物,以允许产生第一靶标扩增产物和第一竞争扩增产物;
d)第二引物组,其中所述引物组包含两个能够在第二靶标多核苷酸和第二竞争多核苷酸的相反链上杂交的引物,以允许产生第二靶标产物和第二竞争产物;
e)第一探针组,其中第一探针组包含能够与第一靶标扩增产物杂交的第一标签靶标探针和能够与第一竞争扩增产物杂交的第一标签竞争探针;
d)第二探针组,其中第二探针组包含能够与第二靶标扩增产物杂交的第二标签靶标探针和能够与第二竞争扩增产物杂交的第二标签竞争探针;
并且其中:
i)第一标签靶标探针和第二靶标标签探针标记有相同的第一标签;并且其中第一标签竞争探针和第二标签竞争探针标记有相同的第二标签;或者
ii)第一标签靶标探针和第二标签竞争探针标记有相同的第一标签;并且其中第一标签竞争探针和第二标签靶标探针标记有相同的第二标签并允许所述第一和第二引物组与所述靶标和竞争多核苷酸杂交。
在同时竞争扩增至少两个靶标多核苷酸的方法的一些实施例中,该方法包括提供
e)另外1、2、3、4、5、6、7、8、9、10个引物组和相应的探针组。
在同时竞争扩增至少两个靶标多核苷酸的方法的一些实施例中,一个标签靶标探针标记有第二标签,并且相应标签竞争探针标记有第一标签。
在同时竞争扩增至少两个靶标多核苷酸的方法的一些实施例中,该方法进一步包括在多重扩增后同时检测第一标签和第二标签的量。
在本说明书中对明显先前公开的文件的列举或讨论,不一定被认为是承认该文件是现有技术或公知常识的一部分。
除非上下文另有说明,否则对于本发明的给定方面、特征或参数的优选和选择,应被视为已经结合对于本发明的所有其他方面、特征和参数的任何优选和选择进行了公开。例如,本发明提供的示例性特征组合包括:
1)将样品中至少两个基因的相对表达合并为单一值的方法,其中该方法包括扩增六个靶标多核苷酸和六个调整竞争多核苷酸的步骤,其中该六个靶标扩增产物都用标记有HEX的不同杂交探针进行探测,并且该六个调整竞争扩增产物中的每一个都用标记有FAM的不同杂交探针进行探测;
2)一种诊断癌症的方法,其中该方法包括扩增样品中的一种或多种靶标多核苷酸的步骤,其中该方法包括:
提供:
a)包含多核苷酸的样品
b)第一调整竞争多核苷酸
c)至少第一引物,其中至少第一引物能够杂交至:
该样品中的第一靶标多核苷酸;和
所述第一调整竞争多核苷酸;和
启动引物延伸反应,使得靶标多核苷酸(如果存在于样品中)和第一调整竞争多核苷酸被扩增,
其中扩增产生第一靶标产物和第一调整竞争产物。
技术人员可以采取的将本发明付诸实践以用于特定应用的总体方法的总结如下:
a)从业者首先根据患者数据进行回归,例如逻辑回归,以确定靶标基因转录本以及每个转录本的表达水平和诊断概率之间的适当关系。技术人员可以获得可以对其进行逻辑回归的预先存在的数据。
b)接下来,从业者为每个靶标转录本选择CAN架构,即竞争序列的数量和共享引物的排列。选择CAN架构的示例性方法在本文别处描述。
c)然后从业者通过计算确定每个CAN模块的理想组件,这些组件将最佳地概括患者数据回归结果,例如每个寡核苷酸的浓度和所需的扩增行为。使用先前获得的数据,从业者为每个竞争寡核苷酸提出设计参数(长度和GC含量),选择最有可能产生所需扩增行为的参数。这些参数设计随后可用于生成序列设计,这些设计可通过标准PCR扩增获得、进行实验测试,并进行分析以描述其行为。这些新观察结果与多任务回归框架中的先前观察相结合,其中统计模型共同学习设计参数与每个扩增参数之间的经验关系。
d)如果需要进一步优化,该统计模型可用于提出新的序列设计,根据新获得的数据,这些设计现在最有可能产生所需的扩增行为。允许通过CAN反应重述逻辑回归结果的这个过程一直持续到找到合适的竞争序列。
调整竞争多核苷酸的示例性方法总结如下:
进行了模拟以确定描述最佳行为的理想参数值。设计一个显示由一个或多个这些参数值反映的行为的竞争序列,是调整的目标。首先,使用相同的引物序列和引物之间可变的“核心”序列来设计和获得大量扩增子序列。这些序列经过实验测试,并分析它们的行为以获得描述性参数的值。假设这些序列都没有表现出理想的扩增行为,则使用这些数据合理地设计一个最有可能匹配靶标行为的新序列。为此,执行回归以确定各种序列设计参数如何预测描述扩增行为感兴趣的参数。具体来说,可以训练高斯过程回归器将“核心”序列的长度和GC含量与“扩增率”参数相关联。然后可以使用此回归器或任何其他此类回归器来预测给定设计的扩增子的行为,并提供最有可能实现预期目标的序列描述符(长度和GC含量)。这个模拟、设计、实验、分析和回归的过程针对竞争扩增网络中的每个序列进行迭代,直到找到合适的序列。这种方法的修改包括将引物序列本身的信息合并到回归中。这允许确定设计参数和扩增参数之间的全局关系以及特定于给定引物对的该关系的特性。
在以下编号的实施例段落中进一步描述本发明:
1.一种将样品中至少两个靶标寡核苷酸的相对丰度转化为特定状态的相对概率的方法。
2.一种仅使用两个荧光团标记的探针来检测样品中至少三个靶标寡核苷酸的相对丰度的方法。
3.一种将样品中至少两个靶标寡核苷酸的相对丰度组合成单一值的方法。
4.一种将样品中至少两个寡核苷酸的相对丰度所提供的预测关系或决策面转化为单一值的方法。
5.一种用竞争扩增网络模拟统计信息的方法。
6.根据实施例1至5中任一项所述的方法,其中该方法包括扩增样品中的一个或多个靶标多核苷酸的步骤,任选地,其中该扩增步骤是根据实施例7至82中任一项所述的扩增步骤。
7.一种扩增样品中一个或多个靶标多核苷酸的方法,其中该方法包括:
提供:
a)可能包含一个或多个靶标多核苷酸的样品
b)第一调整竞争多核苷酸
c)至少第一引物,其中至少第一引物能够杂交至:
该样品中的第一靶标多核苷酸;和
所述第一调整竞争多核苷酸;和
启动引物延伸反应,使得该靶标多核苷酸(如果存在于样品中)和该第一调整竞争多核苷酸被扩增,
其中扩增产生第一靶标产物和第一调整竞争产物。
8.根据实施例7所述的方法,其中该方法包括提供:
第二引物;
第二竞争多核苷酸;和/或
第二靶标多核苷酸。
9.根据实施例8所述的方法,其中第二引物能够与第一靶标多核苷酸杂交,其中第一引物和第二引物在靶标的相反链上杂交以导致产生所述第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物。
10.根据实施例7或8中任一项所述的方法,其中第二引物也能够与第一调整竞争多核苷酸杂交,其中第一引物和第二引物在第一调整竞争多核苷酸的相反链上杂交,以导致产生第一调整竞争产物,任选地第一调整竞争PCR产物。
11.根据实施例7至10中任一项所述的方法,其中该方法包括提供第二调整竞争多核苷酸。
12.根据实施例8或11中任一项所述的方法,其中第二引物:
a)能够与所述第一调整竞争多核苷酸杂交,其中所述第一引物和所述第二引物在所述第一调整竞争多核苷酸的相反链上杂交,以导致产生所述第一调整竞争产物,任选地第一调整竞争PCR产物;和
b)能够与所述第二调整竞争多核苷酸杂交并启动引物延伸反应,使得所述第二调整竞争多核苷酸被扩增,以导致产生所述第二调整竞争产物,任选地与另外的引物组合,其中第二引物和另外的引物在所述第二调整竞争多核苷酸的相反链上杂交,以导致产生所述第二调整竞争产物,任选地第一靶标聚合酶链式反应(PCR)产物,
任选地,其中第二引物不能与第一靶标多核苷酸杂交。
13.根据实施例7至12中任一项所述的方法,其中第二靶标多核苷酸是与第一靶标多核苷酸相同的多核苷酸分子的一部分。
14.根据7至12所述的方法,其中第二靶标多核苷酸位于与第一靶标多核苷酸不同的多核苷酸分子上。
16.根据实施例7至14中任一项所述的方法,其中第二引物:
a)能够与第一靶标多核苷酸杂交,其中第一引物和第二引物在靶标的相反链上杂交以导致产生第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;和
b)不能与第一调整竞争多核苷酸或第二调整竞争多核苷酸杂交
并且其中该方法包括第三引物,第三引物能够与第一和第二调整竞争多核苷酸杂交。
17.根据实施例7至16中任一项所述的方法,其中该方法包括提供第四引物,其中第四引物能够与第一靶标多核苷酸杂交,其中第一引物和第四引物在靶标的相反链上杂交,从而以允许形成第一靶标产物,任选地第一靶标PCR产物。
18.根据实施例7至175中任一项所述的方法,其中该方法包括提供:
a)第二引物能够
i)与第一靶标多核苷酸杂交,其中第一引物和第二引物在所述靶标的相反链上杂交以导致产生第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;并且
ii)能够与第一调整竞争多核苷酸杂交;以及
b)第三引物能够
i)与所述第一调整竞争多核苷酸杂交,其中第三引物和第二引物在所述第一调整竞争多核苷酸的相反链上杂交,以导致产生所述第一调整竞争多核苷酸产物,任选地第一调整竞争多核苷酸聚合酶链式反应(PCR)产物;并且
ii)能够与所述第二调整竞争多核苷酸杂交;
以及
c)第四引物能够与所述第二调整竞争多核苷酸杂交,其中第三引物和第四引物与所述第二调整竞争多核苷酸的相反链杂交,以导致产生所述第二调整竞争多核苷酸产物,任选地第二调整竞争多核苷酸聚合酶链式反应(PCR)产物。
19.根据实施例7至18中任一项所述的方法,其中第一靶标多核苷酸的扩增速率不同于第一调整竞争多核苷酸的扩增速率。
20.根据实施例7或19中任一项所述的方法,其中当靶标多核苷酸的初始数量与引物延伸之前的调整竞争多核苷酸的数量相同或基本相同时,所产生的靶标产物多核苷酸的数量不同于所产生的调整竞争产物多核苷酸的数量。
21.根据实施例7至20中任一项所述的方法,其中待扩增的所述第一靶标多核苷酸的序列和至少第一调整竞争多核苷酸的序列,被选择以导致最终可检测信号,所述最终可检测信号随着所述第一靶标多核苷酸的初始浓度以这样的方式变化,以致于近似或再现或匹配靶标与一个或多个状态的预测关系。
22.根据实施例7至21中任一项所述的方法,其中第一靶标多核苷酸的扩增速率和第二靶标多核苷酸的扩增速率匹配预定义的权重。
23.根据实施例7至22中任一项所述的方法,其中待扩增的第一调整竞争多核苷酸的序列与待扩增的第一靶标多核苷酸的序列共享少于95%、90%、88%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%的序列同一性。
24.根据实施例7至23中任一项所述的方法,其中待扩增的第一调整竞争多核苷酸的序列包含至少15%GC,或至少25%,至少35%,至少55%,至少65%,至少75%,至少85%,或至少85%GC。
25.根据实施例7至24中任一项所述的方法,其中第一调整竞争产物比第一靶标产物长至少5个核苷酸,任选地比第一靶标产物长至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸。
26.根据实施例7至25中任一项所述的方法,其中第一调整竞争产物:
比第一靶标产物短至少5个核苷酸,任选地比第一靶标产物短至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸;或者
比第一靶标产物长至少5个核苷酸,任选地比第一靶标产物长至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸。
27.根据实施例7至26中任一项所述的方法,其中检测出一个或多个靶标产物,任选地一个或多个靶标PCR产物;和一个或多个调整竞争产物,任选地一个或多个竞争多核苷酸PCR产物。
28.根据实施例7至27中任一项所述的方法,其中该方法包括提供一个或多个探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸,
并且其中第一标签和第二标签不同。
29.根据实施例28所述的方法,其中标记有第一标签的至少一个探针能够与第一靶标产物杂交;并且标记有第二标签的至少一个探针能够与第一调整竞争产物杂交。
30.根据实施例28或29中任一项所述的方法,其中标记有第一标签的至少一个探针能够与第一调整竞争产物杂交;和
至少一个标记有第二标签的探针能够与第二调整竞争产物杂交;和
任选地,其中两个探针都不能与第一靶标产物杂交。
31.根据实施例28至30中任一项所述的方法,其中在单个探针组中存在至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第一标签。
32.根据实施例28至31中任一项所述的方法,其中在单个探针组中存在至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第二标签。
33.根据实施例28至32中任一项所述的方法,其中在单个探针组中存在:
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第一标签;以及
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第二标签。
34.根据实施例28至33中任一项所述的方法,其中该方法包括提供至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针组,任选地,其中没有特定的标签,任选地荧光团,被用于多于一个探针组中。
35.根据实施例28至34中任一项所述的方法,其中存在于探针上的唯一标签是第一标签和第二标签。
36.根据实施例28至35中任一项所述的方法,其中每个探针标记有单一类型的标签。
37.根据实施例28至36中任一项所述的方法,其中第一标签和第二标签是荧光团,任选地其中每个探针包含淬灭剂。
38.根据实施例28至37中任一项所述的方法,其中第一标签是FAM并且第二标签是HEX;或者其中第一标签是HEX并且第二标签是FAM。
39.根据实施例28至38中任一项所述的方法,其中
i)至少一个能够与第一靶标产物杂交的探针;和至少一个能够与第一调整竞争产物杂交的探针被标记有不同的标签;和/或
ii)至少一个能够与第一调整竞争产物杂交的探针;和至少一个能够与第二调整竞争产物杂交的探针被标记有不同的标签。
40.根据实施例28至39中任一项所述的方法,其中能够与靶标产物杂交的每个探针都标记有相同的第一标签;并且每个能够与调整竞争产物杂交的探针都标记有相同的第二标签。
41.根据实施例28至40中任一项所述的方法,其中
至少一个能够与靶标产物杂交的探针都标记有第一标签,并且至少一个能够与调整竞争产物杂交的探针都标记有相同的第一标签;或者
至少一个能够与靶标产物杂交的探针标记有第一标签,至少一个能够与靶标产物杂交的探针标记有第二标签,至少一个能够与竞争产物杂交的探针标记有第一标签,并且至少一个能够与竞争产物杂交的探针标记有第二标签。
42.根据实施例28至41中任一项所述的方法,其中能够与和特定状态的正预测关系相关的靶标多核苷酸产物杂交的每个探针都标记有第一标签,并且能够与调整竞争多核苷酸产物杂交的相应探针标记有第二标签;
和/或
其中能够与和特定状态的负预测关系相关的靶标多核苷酸产物杂交的每个探针都标记有所述第二标签,并且能够与调整竞争多核苷酸产物杂交的相应探针标记有所述第一标签。
43.根据实施例28至42中任一项所述的方法,其中在扩增之后确定由第一探针检测到的产物的量和由第二探针检测到的产物的量。
44.根据实施例43所述的方法,其中将每个探针的相对量与标准曲线进行比较以确定一种或多种状态的所述相对概率。
45.根据实施例7至44中任一项所述的方法,其中所述方法包括对所有使用的荧光团的单一读数。
46.根据实施例7至45中任一项所述的方法,其中该方法捕获基因表达网络的一部分的状态,任选地作为单一值。
47.根据实施例7至46中任一项所述的方法,其中靶标多核苷酸是RNA,任选地是RNA转录本,任选地是mRNA。
48.根据实施例7至47中任一项所述的方法,其中靶标多核苷酸是非编码RNA,任选地是miRNA、lncRNA或siRNA。
49.根据实施例7至46中任一项所述的方法,其中靶标多核苷酸是DNA。
50.根据实施例7至49中任一项所述的方法,其中样品选自包括或由以下项组成的组:组织、活组织检查、血液、血浆、血清、病原体、微生物细胞、细胞培养物和细胞裂解物。
51.根据实施例7至50中任一项所述的方法,其中样品包含以下中的任一者或多者:细胞,任选地白细胞和/或红细胞;外泌体;循环肿瘤DNA(ctDNA);游离DNA(cfDNA);RNA;或病原体核酸。
52.根据50或51中任一项所述的方法,其中细胞是:
哺乳动物细胞、细菌细胞、酵母细胞或植物细胞;
培养细胞,任选地原代患者来源的细胞或永生化细胞系;
哺乳动物干细胞;
工程化细胞,任选地用于代谢物和化合物的生物生产的工程化细胞;和/或
酵母细胞,任选地其中酵母细胞用于酿造。
53.根据实施例7至52中任一项所述的方法,其中该方法用于扩增至少第一靶标多核苷酸和第二靶标多核苷酸,任选地其中该方法用于扩增至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个靶标多核苷酸。
54.根据实施例53所述的方法,其中至少第一靶标多核苷酸和第二靶标多核苷酸是同一单个多核苷酸内的靶标序列。
55.根据实施例7至54所述的方法,其中该方法包括用至少一个引物扩增调整竞争多核苷酸,该引物能够与第一靶标多核苷酸和第二靶标多核苷酸杂交并产生第一靶标产物和第二靶标产物。
56.根据实施例7至55所述的方法,其中该方法包括两个调整竞争多核苷酸的扩增,其中该方法包括:
用至少一个能够与第一靶标多核苷酸杂交的引物扩增第一调整竞争多核苷酸;和
用至少一个能够与第二靶标多核苷酸杂交的引物扩增第二调整竞争多核苷酸。
57.根据实施例7至56中任一项所述的方法,其中扩增产物的检测指示:
i)存在或缺失;
ii)特定的预定起始浓度;
iii)高于或低于预定水平的起始浓度;和/或
iv)起始浓度落在预定范围内,
一种或多种靶标多核苷酸。
58.根据实施例57所述的方法,其中(i)、(ii)、(iii)和/或(iv)指示以下中的一者或多者:
a)特定基因的相对表达;
b)两种或更多种特定基因的相对表达;
c)一种或多种管家基因的相对表达;
d)特定基因表达特征的相对表达;
e)一种或多种基因的特定等位变体的相对表达;
f)基因突变版本的相对表达;
g)无细胞肿瘤DNA的相对表达量,
其中靶标多核苷酸选自(a)-(g)的已知序列的一个或多个部分。
59.根据实施例7至58中任一项所述的方法,其中差异基因调控的程度与处于一些其他特定状态2相比有助于处于特定状态1的样品的总体概率。
60.根据实施例1-中任一项所述的方法,其中所述特定状态1是“特定疾病”且特定状态2是“无疾病”或“其他疾病”或“不是特定疾病”。
61.根据实施例1至60中任一项所述的方法,其中该方法用于诊断和/或预测受试者的疾病或病症。
62.根据实施例61所述的方法,其中疾病或病症的诊断需要评估至少两个基因的相对表达水平,任选地需要评估至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个基因的相对表达水平。
63.根据实施例61或62所述的方法,其中疾病或病症选自:人结核病、合并感染HIV的人结核病、未合并感染HIV的人结核病、癌症、任选地前列腺癌、败血症、血流念珠菌病、牛结核病、牛乳腺炎。
64.根据实施例61至63所述的方法,其中疾病是肺结核。
65.根据实施例64所述的方法,其中所述疾病是结核病,并且从所述受试者的白细胞中鉴定出所述差异基因调控特征或预测关系。
66.根据实施例63至65中任一项所述的方法,其中GBP6、ARG1和TMCC1的差异调控程度,有助于与患有某种“其他疾病”相比而患有结核病的总体概率,并且与未患有结核病的患者中这些基因的水平相比,基因表达特征是GBP6的上调和ARG1和TMCC1的下调。
67.根据实施例61至63所述的方法,其中疾病是癌症,任选地前列腺癌或乳腺癌,任选地前列腺癌。
68.根据实施例61至67中任一项所述的方法,其中检测出基因突变形式、特定地等位变体和/或无细胞肿瘤DNA的相对表达。
69.根据实施例61至68中任一项所述的方法,其中疾病是癌症。
70.根据实施例7至69中任一项所述的方法,其中靶标多核苷酸包含与疾病状态相关、任选地与肿瘤和/或癌症的存在相关的snp、snv(单核苷酸变体)插入缺失或拷贝数变异(CNV)。
71.根据实施例70所述的方法,其中靶标多核苷酸包含无细胞肿瘤DNA中的snp、snv或插入缺失。
72.根据实施例7至71中任一项所述的方法,其中该方法进一步包括加入阻断寡核苷酸,其中阻断寡核苷酸不能进行其3′末端的延伸,并且其中阻断寡核苷酸不与至少一种含有单核苷酸多态性的靶标多核苷酸序列中的部分互补,任选地其中snp是snv,但其中阻断寡核苷酸与相应的野生型序列互补并且其中包含与阻断寡核苷酸互补的序列的靶标多核苷酸中的序列和与引物之一互补的序列的至少一部分重叠。
73.根据实施例7至72中任一项所述的方法,其中靶标多核苷酸来源于从疑似患有特定疾病或病症的受试者获得的样品。
74.根据实施例7至72中任一项所述的方法,其中靶标多核苷酸来源于从未怀疑患有特定疾病或病症的受试者获得的样品。
75.根据实施例7至74中任一项所述的方法,其中一个或多个特定基因表达的检测指示特定天然和/或工程化基因在培养细胞中的表达。
76.根据实施例7至75中任一项所述的方法,其中细胞是基因工程细菌、植物或酵母细胞。
77.根据实施例7至76中任一项所述的方法,其中使用聚合酶链式反应(PCR)或重组酶聚合酶反应(RPA)扩增核酸。
78.一种诊断或预测受试者的疾病或病症的方法,其中所述方法包括根据实施例1至77中任一项所述的方法。
79.根据实施例78所述的方法,其中当第一标签和第二标签的相对量指示疾病或病症的预测时,受试者被诊断为患有疾病或病症或疾病或病症的预测。
80.根据实施例78或79中任一项所述的方法,其中疾病或病症选自:人结核病、合并感染HIV的人结核病、未合并感染HIV的人结核病、癌症、任选地前列腺癌或乳腺癌、败血症、血流念珠菌病、牛结核病、牛乳腺炎。
81.根据实施例78至80x所述的方法,其中疾病是结核病,任选地其中:
从受试者的白细胞中鉴定出差异基因调控特征和/或预测关系;和/或
与患有某种“其他疾病”相比,所述GBP6、ARG1和TMCC1的差异调节程度有助于提高患结核病的总体概率。
82.根据实施例78至80中任一项所述的方法,其中疾病是癌症,任选地前列腺癌或乳腺癌,任选地前列腺癌。
83.包含以下一种或几种的组合物:
a)至少一个如实施例7至82中任一项所定义的靶标核酸序列;
b)至少一个如实施例7至82中任一项所定义调整竞争多核苷酸;
c)至少一个如实施例7至82中任一项所定义的引物,任选地至少两个如实施例7至82中任一项所定义的引物;
d)至少一个或多个探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸,任选地如实施例28至82中任一项所定义。
84.根据实施例83所述的组合物,进一步包含:
d)聚合酶;
e)适量A、C、T、G四种核苷酸中的每一种。
85.根据实施例83或84所述的组合物,进一步包含:
f)重组酶;
g)单链结合蛋白;
h)聚合酶;
i)适量核苷酸A、C、T、G和U核苷酸中的每一种。
86.一种根据实施例7至85中任一项所定义的调整竞争多核苷酸。
87.一种用于实施根据实施例1至82中任一项所述的方法的试剂盒,其中所述试剂盒包括以下中的一者或多者:
a)如实施例7至82所定义的一个或多个调整竞争多核苷酸;
b)一个或多个引物;
c)如实施例28至82中任一项所定义的第一探针组;
d)合适的缓冲液;
e)使用说明,
任选地,其中所述试剂盒包含至少2、3、4、5、6、7、8、9个或至少10个不同的调整竞争多核苷酸和/或至少2、3、4、5、6、7、8、9个或至少10个不同的探针组。
88.基本上如本文所述的方法、核酸序列或试剂盒。
89.至少两个调整竞争多核苷酸的集合或试剂盒,其中所述集合包含至少2、3、4、5、6、7、8、9、10、11、12、1 3、14、1 5、16、1 7、1 8、19、20、22、24、25、26、28、30、32、34、35、36、38、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190个或至少200个调整竞争多核苷酸,任选地,其中调整竞争多核苷酸如实施例7至88中的任一项所定义。
90.一种集合/试剂盒,其包括至少两个调整竞争多核苷酸和至少两个相应的标记探针。
91.一种集合/试剂盒,其包括:
至少两个调整竞争多核苷酸;
至少两个相应标记探针;和
至少两个引物。
92.一种集合/试剂盒,其包括:
至少两个如前述实施例中任一项所定义的调整竞争多核苷酸;
至少两个如前述实施例中任一项所定义的相应的标记的探针;和
至少两个如前述实施例中任一项所定义的引物。
93.一种调整第一竞争多核苷酸的方法,第一竞争多核苷酸竞争至少第一引物与第一靶标多核苷酸的杂交并且导致第一靶标产物和第一调整竞争产物的扩增,并且其中:
a)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
b)第一靶标多核苷酸的扩增匹配靶标多核苷酸与特定状态的预测关系;和/或
c)第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率匹配预定义的权重,
该方法包括:
相对于所述第一靶标产物的序列和/或所述第一靶标产物的长度,优化调整竞争多核苷酸的序列和/或调整竞争扩增产物的长度。
94.根据实施例93所述的方法,其中:
在扩增中使用能够与第一靶标多核苷酸杂交的第二引物,使得第一靶标产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
在扩增中使用能够与第一调整竞争多核苷酸杂交的第三引物,使得第一调整竞争产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
任选地,其中第二引物和第三引物具有相同的序列。
95.根据实施例93或94所述的方法,其中所述优化包括产生两个或更多个测试调整竞争多核苷酸,其随后的扩增导致:
a)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
b)第一靶标多核苷酸的扩增匹配靶标与特定状态的预测关系;和/或
c)第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率匹配预定义的权重,
并且选择导致所述第一靶标多核苷酸的最优选扩增的调整竞争物。
96.根据实施例93至95中任一项所述的方法,其中所述优化包括产生至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个不同的测试调整竞争多核苷酸。
97.根据实施例93至96中任一项所述的方法,其中所述优化包括执行至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个测试扩增反应与每个测试调整竞争多核苷酸,
任选地,其中使用至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个不同浓度的靶标多核苷酸和/或靶标多核苷酸分子的数量进行至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20次扩增反应。
98.根据实施例97所述的方法,其中使用不同浓度和/或数量的靶标多核苷酸模板进行使用特定测试调整竞争多核苷酸的每次测试扩增。
99.根据实施例97或98中任一项所述的方法,其中使用范围100拷贝/μL至108拷贝/μL的浓度和/或数量范围的靶标多核苷酸模板进行测试扩增反应。
100.根据实施例93至99中任一项所述的方法,其中测试调整竞争多核苷酸被设计成具有不同的GC含量。
100.根据前述实施例中任一项所述的优化竞争扩增反应的方法,其中所述优化包括:
a)增加或减少合成核酸序列的起始浓度;和/或
b)增加或减少任何一个核酸引物的起始浓度。
101.一种对至少两个靶标多核苷酸进行多重竞争扩增的方法,其中该方法包括至少一个竞争多核苷酸,并且其中使用标有相同标签的探针检测靶标扩增产物,任选地标记有相同的荧光团,任选地其中竞争多核苷酸是根据前述实施例中任一项所述的调整竞争多核苷酸。
102.一种确定系统转录状态的方法,其中该方法包括根据前述实施例中任一项所述的竞争扩增。
103.一种确定系统是处于状态A还是处于状态B的方法,其中该方法包括根据前述实施例中任一项所述的竞争扩增。
104.一种样品中至少两个靶标多核苷酸的同时竞争扩增的方法,其中所述方法包括
提供
a)包含多核苷酸的样品;
b)第一和第二调整竞争多核苷酸;
c)第一引物组,其中该引物组包含两个能够在第一靶标多核苷酸和第一竞争多核苷酸的相反链上杂交的引物,以允许产生第一靶标扩增产物和第一竞争扩增产物;
d)第二引物组,其中所述引物组包含两个能够在第二靶标多核苷酸和第二竞争多核苷酸的相反链上杂交的引物,以允许产生第二靶标产物和第二竞争产物;
e)第一探针组,其中第一探针组包含能够与第一靶标扩增产物杂交的第一标签靶标探针和能够与第一竞争扩增产物杂交的第一标签竞争探针;
d)第二探针组,其中第二探针组包含能够与第二靶标扩增产物杂交的第二标签靶标探针和能够与第二竞争扩增产物杂交的第二标签竞争探针;
并且其中:
i)第一标签靶标探针和第二靶标标签探针标记有相同的第一标签;并且其中第一标签竞争探针和所述第二标签竞争探针标记有相同的第二标签;或者
ii)第一标签靶标探针和第二标签竞争探针标记有相同的第一标签;并且其中第一标签竞争探针和第二标签靶标探针标记有相同的第二标签
并允许所述第一和第二引物组与所述靶标和竞争多核苷酸杂交。
105.根据104所述的方法,其中该方法包括提供
e)另外1、2、3、4、5、6、7、8、9、10个引物组和相应的探针组。
106.根据实施例105的方法,其中该方法进一步包括在多重扩增后同时检测第一标签和第二标签的量。
107.根据前述实施例中的任一项,其中:
其中靶标是TMCC1,靶标序列是SEQ ID NO:4,用于确定最佳竞争物的竞争序列为SEQ ID NO:6、8、10、12、14、16、1 8、20、22、24、26、28、30、32、34和36,任选地,其中用于扩增靶标和竞争物的引物示于SEQ ID NO:1和3;和/或
其中靶标是ARG1,靶标序列是SEQ ID NO:40,用于确定最佳竞争物的竞争序列为SEQ ID NO:42、44、46和48,任选地,其中用于扩增靶标和竞争物的引物示于SEQ ID NO:37和39;和/或
其中靶标是GBP6,靶标序列是SEQ ID NO:52,用于确定最佳竞争物的竞争序列为SEQ ID NO:54、56和58,任选地,其中用于扩增靶标和竞争物的引物示于SEQ ID NO:49和51;和/或
其中靶标是EGFR,靶标序列是SEQ ID NO:62、竞争序列为SEQ ID NO:64、67和71,任选地,其中引物序列是SEQ ID NO:68和70。
本发明还通过以下编号的实施例进-步定义:
1.一种扩增样品中一个或多个靶标多核苷酸的方法,其中该方法包括:
提供:
a)可能包含一个或多个靶标多核苷酸的样品
b)第一调整竞争多核苷酸
c)至少第一引物,其中至少第一引物能够杂交至:
该样品中的第一靶标多核苷酸;和
所述第一调整竞争多核苷酸;和
启动引物延伸反应,使得该靶标多核苷酸(如果存在于样品中)和该第一调整竞争多核苷酸被扩增,
其中扩增产生第一靶标产物和第一调整竞争产物。
2.根据实施例1所述的方法,其中该方法包括提供:
第二引物;
第二竞争多核苷酸;和/或
第二靶标多核苷酸。
3.根据实施例2所述的方法,其中第二引物能够与第一靶标多核苷酸杂交,其中第一引物和第二引物在靶标的相反链上杂交以导致产生所述第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物。
4.根据实施例2或3中任一项所述的方法,其中第二引物也能够与第一调整竞争多核苷酸杂交,其中第一引物和第二引物在第一调整竞争多核苷酸的相反链上杂交,以导致产生第一调整竞争产物,任选地第一调整竞争PCR产物。
5.根据实施例1至4中任一项所述的方法,其中该方法包括提供第二调整竞争多核苷酸。6.根据实施例2或5中任一项所述的方法,其中第二引物:
a)能够与所述第一调整竞争多核苷酸杂交,其中第一引物和第二引物在第一调整竞争多核苷酸的相反链上杂交,以导致产生所述第一调整竞争产物,任选地第一调整竞争PCR产物;和
b)能够与所述第二调整竞争多核苷酸杂交并启动引物延伸反应,使得所述第二调整竞争多核苷酸被扩增,以导致产生所述第二调整竞争产物,任选地与另外的引物组合,其中第二引物和另外的引物在所述第二调整竞争多核苷酸的相反链上杂交,以导致产生所述第二调整竞争产物,任选地第一靶标聚合酶链式反应(PCR)产物,任选地,其中第二引物不能与第一靶标多核苷酸杂交。
7.根据实施例1至6中任一项所述的方法,其中第二靶标多核苷酸是与第一靶标多核苷酸相同的多核苷酸分子的一部分。
8.根据1至7所述的方法,其中第二靶标多核苷酸位于与第一靶标多核苷酸不同的多核苷酸分子上。
9.根据实施例1至8中任一项所述的方法,其中第二引物:
a)能够与第一靶标多核苷酸杂交,其中第一引物和第二引物在靶标的相反链上杂交以导致产生第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;和
b)不能与第一调整竞争多核苷酸或第二调整竞争多核苷酸杂交
并且其中该方法包括第三引物,第三引物能够与第一和第二调整竞争多核苷酸杂交。
10.根据实施例1至9中任一项所述的方法,其中第一靶标多核苷酸的扩增速率不同于第一调整竞争多核苷酸的扩增速率。
11.根据实施例1或10中任一项所述的方法,其中当靶标多核苷酸的初始数量与引物延伸之前的调整竞争多核苷酸的数量相同或基本相同时,所产生的靶标产物多核苷酸的数量不同于所产生的调整竞争产物多核苷酸的数量。
12.根据实施例1至11中任一项所述的方法,其中待扩增的所述第一靶标多核苷酸的序列和至少第一调整竞争多核苷酸的序列,被选择以导致最终可检测信号,所述最终可检测信号随着所述第一靶标多核苷酸的初始浓度以这样的方式变化,以致于近似或再现或匹配靶标与一个或多个状态的预测关系。
12.根据实施例1至11中任一项所述的方法,其中第一靶标多核苷酸的扩增速率和第二靶标多核苷酸的扩增速率匹配预定义的权重。
13.根据实施例1至12中任一项所述的方法,其中待扩增的第一调整竞争多核苷酸的序列与待扩增的第一靶标多核苷酸的序列共享少于95%、90%、88%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%的序列同一性。
14.根据实施例1至13中任一项所述的方法,其中第一调整竞争产物:
比第一靶标产物短至少5个核苷酸,任选地比第一靶标产物短至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸;或者
比第一靶标产物长至少5个核苷酸,任选地比第一靶标产物长至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸。
15.根据实施例1至14中任一项所述的方法,其中检测出一个或多个靶标产物,任选地一个或多个靶标PCR产物;和一个或多个调整竞争产物,任选地一个或多个竞争多核苷酸PCR产物。
16.根据实施例1至15中任一项所述的方法,其中该方法包括提供一个或多个探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸,并且其中第一标签和第二标签不同。
17.根据实施例16所述的方法,其中标记有第一标签的至少一个探针能够与第一靶标产物杂交;并且标记有第二标签的至少一个探针能够与第一调整竞争产物杂交。
18.根据实施例16或17中任一项所述的方法,其中标记有第一标签的至少一个探针能够与第一调整竞争产物杂交;和
至少一个标记有第二标签的探针能够与第二调整竞争产物杂交;和
任选地,其中两个探针都不能与第一靶标产物杂交。
19.根据实施例16至18中任一项所述的方法,其中在单个探针组中存在:
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有第一标签;和/或
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有所述第二标签。
20.根据实施例16至19中任一项所述的方法,其中该方法包括提供至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针组,任选地,其中没有特定的标签,任选地荧光团,被用于多于一个探针组中。
20.根据实施例16至19中任一项所述的方法,其中存在于探针上的唯一标签是第一标签和第二标签。
21.根据实施例16至20中任一项所述的方法,其中第一标签和第二标签是荧光团,任选地
其中每个探针包含淬灭剂;和/或
其中第一标签是FAM并且第二标签是HEX;或者其中第一标签是HEX并且第二标签是FAM。
22.根据方面16至21中任一项所述的方法,其中
i)至少一个能够与第一靶标产物杂交的探针;和至少一个能够与第一调整竞争产物杂交的探针被标记有不同的标签;和/或
ii)至少一个能够与第一调整竞争产物杂交的探针;和至少一个能够与第二调整竞争产物杂交的探针被标记有不同的标签。
23.根据实施例16至22中任一项所述的方法,其中能够与和特定状态的正预测关系相关的靶标多核苷酸产物杂交的每个探针都标记有第一标签,并且能够与调整竞争多核苷酸产物杂交的相应探针标记有第二标签;
和/或
其中能够与和特定状态的负预测关系相关的靶标多核苷酸产物杂交的每个探针都标记有所述第二标签,并且能够与调整竞争多核苷酸产物杂交的相应探针标记有所述第一标签。
24.根据实施例16至23中任一项所述的方法,其中在扩增之后,确定由第一探针检测到的产物的量和由第二探针检测到的产物的量。
25.根据实施例24所述的方法,其中将每个探针的相对量与标准曲线进行比较以确定一种或多种状态的所述相对概率。
26.根据实施例1至25中任一项所述的方法,其中所述方法包括对所有使用的荧光团的单一读数。
27.根据实施例1至26中任一项所述的方法,其中该方法用于扩增至少第一靶标多核苷酸和第二靶标多核苷酸,任选地其中该方法用于扩增至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个靶标多核苷酸。
28.根据实施例1至27所述的方法,其中该方法包括两个调整竞争多核苷酸的扩增,其中该方法包括:
用至少一个能够与第一靶标多核苷酸杂交的引物扩增第一调整竞争多核苷酸;和
用至少一个能够与第二靶标多核苷酸杂交的引物扩增第二调整竞争多核苷酸。
29.根据实施例1至28中任一项所述的方法,其中该方法用于诊断和/或预测受试者的疾病或病症。
30.根据实施例1至29中任一项所述的方法,其中使用聚合酶链式反应(PCR)或重组酶聚合酶反应(RPA)扩增核酸。
31.一种诊断或预测受试者的疾病或病症的方法,其中所述方法包括根据实施例1至30中任一项所述的方法。
32.根据实施例31所述的方法,其中当第一标签和第二标签的相对量指示疾病或病症的预测时,受试者被诊断为患有疾病或病症或疾病或病症的预测。
33.根据实施例31或32中任一项所述的方法,其中疾病或病症选自:人结核病、合并感染HIV的人结核病、未合并感染HIV的人结核病、癌症、任选地前列腺癌或乳腺癌、败血症、血流念珠菌病、牛结核病、牛乳腺炎。
34.根据实施例31至33中任一项所述的方法,疾病是结核病,任选地其中:
从受试者的白细胞中鉴定出差异基因调控特征和/或预测关系;和/或
GBP6、ARG1和TMCC1的差异调节程度有助于与患有某种“其他疾病”相比而患有结核病的总体概率,任选地其中,与未患有结核病的患者中这些基因的水平相比,基因表达特征是GBP6的上调和ARG1和TMCC1的下调。
35.根据实施例31至34中任一项所述的方法,其中疾病是癌症,任选地前列腺癌或乳腺癌,任选地前列腺癌。
36.根据实施例31至35中任一项所述的方法,其中疾病或病症的诊断需要评估至少两个基因的相对表达水平,任选地需要评估至少3、4、5、6、7、8、9、1 0、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个基因的相对表达水平。
37.包含以下一种或几种的组合物:
a)至少一个如实施例1至30中任一项所定义的靶标核酸序列;
b)至少一个如实施例1至30中任一项所定义调整竞争多核苷酸;
c)至少一个如实施例1至30中任一项所定义的引物,任选地至少两个如实施例1至30中任一项所定义的引物;
d)至少一个或多个探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸,任选地如实施例16至30中任一项所定义。
38.一种根据实施例1至30中任一项所定义的调整竞争多核苷酸。
39.一种用于实施根据实施例1至36中任一项所述的方法的试剂盒,其中所述试剂盒包括以下中的一者或多者:
a)如实施例1至30所定义的一个或多个调整竞争多核苷酸;
b)一个或多个引物,任选地如实施例1至30中任一项所定义;
c)如实施例16至30中任一项所定义的第一探针组;
d)合适的缓冲液;
e)使用说明,
任选地,其中所述试剂盒包含至少2、3、4、5、6、7、8、9个或至少10个不同的调整竞争多核苷酸和/或至少2、3、4、5、6、7、8、9个或至少10个不同的探针组。
40.一种调整第一竞争多核苷酸的方法,第一竞争多核苷酸竞争至少第一引物与第一靶标多核苷酸的杂交并且导致第一靶标产物和第一调整竞争产物的扩增,并且其中:
a)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
b)第一靶标多核苷酸的扩增匹配靶标多核苷酸与特定状态的预测关系;和/或
c)第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率匹配预定义的权重,
该方法包括:
相对于所述第一靶标产物的序列和/或所述第一靶标产物的长度,优化调整竞争多核苷酸的序列和/或调整竞争扩增产物的长度。
41.根据实施例40所述的方法,其中:
在扩增中使用能够与第一靶标多核苷酸杂交的第二引物,使得第一靶标产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
在扩增中使用能够与第一调整竞争多核苷酸杂交的第三引物,使得第一调整竞争产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
任选地,其中第二引物和第三引物具有相同的序列。
42.根据实施例40或41所述的方法,其中所述优化包括产生两个或更多个测试调整竞争多核苷酸,其随后的扩增导致:
a)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
b)第一靶标多核苷酸的扩增匹配靶标与特定状态的预测关系;和/或
c)第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率匹配预定义的权重,
并且选择导致所述第一靶标多核苷酸的最优选扩增的调整竞争物。
43.一种确定系统转录状态的方法,其中该方法包括根据前述实施例中任一项所述的竞争扩增。
44.一种确定系统是处于状态A还是处于状态B的方法,其中该方法包括根据前述实施例中任一项所述的竞争扩增。
45.一种样品中至少两个靶标多核苷酸的同时竞争扩增的方法,其中所述方法包括提供
a)包含多核苷酸的样品;
b)第一和第二调整竞争多核苷酸;
c)第一引物组,其中该引物组包含两个能够在第一靶标多核苷酸和第一竞争多核苷酸的相反链上杂交的引物,以允许产生第一靶标扩增产物和第一竞争扩增产物;
d)第二引物组,其中所述引物组包含两个能够在第二靶标多核苷酸和第二竞争多核苷酸的相反链上杂交的引物,以允许产生第二靶标产物和第二竞争产物;
e)第一探针组,其中第一探针组包含能够与第一靶标扩增产物杂交的第一标签靶标探针和能够与第一竞争扩增产物杂交的第一标签竞争探针;
d)第二探针组,其中第二探针组包含能够与第二靶标扩增产物杂交的第二标签靶标探针和能够与第二竞争扩增产物杂交的第二标签竞争探针;
并且其中:
i)第一标签靶标探针和第二靶标标签探针标记有相同的第一标签;并且其中第一标签竞争探针和所述第二标签竞争探针标记有相同的第二标签;或者
ii)第一标签靶标探针和第二标签竞争探针标记有相同的第一标签;并且其中第一标签竞争探针和第二标签靶标探针标记有相同的第二标签并允许所述第一和第二引物组与所述靶标和竞争多核苷酸杂交。
46.根据45所述的方法,其中该方法包括提供
e)另外1、2、3、4、5、6、7、8、9、10个引物组和相应的探针组。
47.根据实施例46的方法,其中该方法进一步包括在多重扩增后同时检测第一标签和第二标签的量。
附图说明
图1-传统PCR的机制。A)在PCR中,通过不同的温度阶段的循环,靶标序列多次复制或“扩增”。这种加倍是由特定于感兴趣的靶标的短合成“引物”寡核苷酸来促进的。一旦引物用完,反应就会停止。B)在定量PCR中,还包括一个合成的“探针”序列,以在靶标的每次重复中生成荧光信号。探针设计为一端带有荧光团并且另一端带有淬灭剂。当探针保持完整时,淬灭剂会吸收荧光团发出的光,从而防止其被检测到。然而,随着反应的进行,聚合酶会降解探针,将其分解成小块。这将荧光团与淬灭剂分开,从而产生可检测的荧光信号。
图2改变靶标序列的组成会改变扩增行为。天然PCR靶标序列(WT)的变化被设计为利用相同的引物序列,但在引物区域之间的碱基对(BP)数量和鸟嘌呤或胞嘧啶(GC)核苷酸百分比方面不同。ISO靶标与WT具有相同的长度(88bp)和GC含量(43%),但序列不同。A)这些靶标的PCR反应符合等式(1),灰线显示参考的ISO拟合。B)这些靶标显示出广泛的指数增长率(*表示ISO靶标)。这种扩增行为的多样性被用于调整CAN的特性以适应特定应用。
图3直接竞争PCR的靶标设计。合成的REF序列与WT序列竞争相同的引物,但两者被具有不同标签的不同探针所靶向。
图4直接竞争扩增终点。来自图3的WT序列在与指示的REF序列相同的反应中被扩增。45个PCR循环后WT(FAM)和REF(HEX)荧光之间的差异显示为WT起始量的函数。相应REF序列的初始浓度在每个图中由垂直灰线指示。剂量反应关系符合S形曲线(黑色曲线,灰色曲线反映ISO拟合)。插图数字表示sigmoid指数;数字越大表示曲线越陡。具有快速竞争序列(较短序列和GC含量低的序列)的反应显示出急剧的转变,而慢速竞争序列导致渐变曲线。
图5间接CAN原理。A)在间接竞争中,天然靶标不直接与荧光探针相互作用。相反,使用了多个合成靶标,每个靶标可能只与另一个序列共享一个引物。B)抽象网络图。天然靶标显示为正方形,合成靶标显示为圆圈,引物显示为点。图中通常省略了多个靶标(此处为p0和p3)不共享的“无争议”引物。
图6各种间接CAN架构的模拟输出。可以通过调整单个组件的参数(扩增率、浓度)或通过修改组件之间的连接来调整间接CAN。如此处所示,间接CAN可以实现广泛的动态范围(DR),定义为10%和90%最大信号差异之间的WT浓度范围。
图8用于诊断结核病的三对直接CAN。A)CAN由三个直接竞争对组成,每个对应基因表达特征中的一个转录本。每对都设计为对各种浓度的天然靶标表现出信号响应,模拟逻辑回归的各自的边际对数值(图6)。此处显示了模拟反应结果。B)当所有三对在同一反应中被扩增时,产生的荧光聚集了它们各自的贡献。蓝绿色和橙色信号之间的整体荧光差异提供了最终诊断,它与逻辑回归提供的对数发生比没有实质性区别。
图9:间接CAN原理。A)在间接竞争中,天然靶标不直接与荧光探针相互作用。相反,使用了多个合成靶标,每个靶标可能只与另一个序列共享一个引物。B)抽象网络图。天然靶标显示为正方形,合成靶标显示为圆圈,引物显示为点。图中通常省略了多个靶标(此处为p0和p3)不共享的“无争议”引物。
图10:可以将高阶CAN设计为近似布尔逻辑。间接竞争可以识别由多个靶标模式组成的组合。在这里,CAN基序充当布尔门,当指定条件为真时发出蓝绿色/高信号,当条件为假时发出橙色/低信号。“半数”XOR是一个例外,当错误时产生信号奇偶校验。此处显示的完整XOR是不完美的,需要进一步调整,但展示了高阶CAN可能产生的丰富行为。调整网络参数可以确定过渡机制的突然性和位置。请注意,反向门、NAND、NOR和XNOR都可以通过简单地交换探针标签来获得。模拟结果,假设所有靶标都有0.9的扩增率。
图11:数字PCR数据的逻辑回归。A)灰点表示在患有结核病(TB)或某些其他疾病(OD)的个体患者中发现的基因浓度,而虚线是逻辑回归的结果。对数发生比(左)和概率(右)可以通过简单的非线性变换来互换。从这些结果中,我们可以看出第四个基因PRDM1对诊断没有任何意义。B)每个基因对整体诊断的个体贡献由相应的颜色显示,整体对数发生比由虚线表示。箭头指向统计诊断与金标准诊断、微生物培养不一致的患者。
图12:各种间接CAN架构的模拟输出。可以通过调整单个组件的参数(扩增率、浓度)或通过修改组件之间的连接来调整间接CAN。如此处所示,间接CAN可以实现广泛的动态范围(DR),定义为10%和90%最大信号差异之间的WT浓度范围。
图13:用于检测ctDNA中痕量癌性SNP的CAN系统。A)一种额外的竞争机制抑制WT扩增以产生仅反映SNP浓度的信号。不能被聚合酶延伸的阻断剂寡核苷酸(深紫色)抑制相应WT链的复制,因为它对WT等位基因的亲和力高于SNP变体。最终颜色强度的比率对应于SNP的量,即使在高WT浓度下也是如此。B)单独模拟的HEX和FAM荧光痕迹。C)在存在105个WT拷贝的情况下,不同浓度的SNP在反应终点的荧光强度(FAM-HEX)之间的差异。这种系统可以同时靶向多个不同的突变,因此可以根据端点信号差异来估计cfDNA中的总SNP负荷。
图14:可以将高阶CAN设计为近似布尔逻辑。间接竞争可以识别由多个靶标模式组成的组合。在这里,CAN基序充当布尔门,当指定条件为真时发出蓝绿色/高信号,当条件为假时发出橙色/低信号。“半数”XOR是一个例外,当错误时产生信号奇偶校验。此处显示的完整XOR是不完美的,需要进一步调整,但展示了高阶CAN可能产生的丰富行为。调整网络参数可以确定过渡机制的突然性和位置。请注意,反向门、NAND、NOR和XNOR都可以通过简单地交换探针标签来获得。模拟结果,假设所有靶标都有0.9的扩增率。
图15:冗余靶标允许设计一个CAN,该CAN报告两个靶标的相对浓度,而不是它们的纸对浓度。A)基因转录本通常有数千个核苷酸长,而PCR靶标的长度约为一百个核苷酸,这意味着多个PCR靶标可以从单个转录本中获得。这允许设计独立的CAN基序,每个基序针对同一序列的不同区域,例如将感兴趣的基因(TMCC1)与经典的“管家”基因(GAPDH)的浓度进行比较。B)此处显示的CAN基序大致用作比较器,报告一个靶标是否大于另一个靶标,但仅在狭窄的浓度范围内。C)在单个反应中结合来自B的基序导致它们的荧光输出叠加,产生与两个转录本的(log)相对浓度成正比的信号,无论样品如何稀释。D)可以通过调整竞争物的浓度来改变信号奇偶性机制,因此现在反应决定了α的浓度是大于还是小于β的100倍。
图16:A)按引物对测量的扩增率和对不同长度和GC含量的探针靶向反应的估计趋势。顶行的标题表示使用的正向和反向引物,圆圈表示在10^8拷贝/反应时特定靶标的测量值。B)按引物对测量的扩增率和对不同长度和GC含量的染料靶向反应的估计趋势。顶行的标题表示使用的正向和反向引物,圆圈表示在10^8拷贝/反应时特定靶标的测量值。
图17:序列信息。
图18:组合CAN导致累加行为。在这里,每个反应中都包含10^3个拷贝的S056.2.2和10^3个拷贝的合成竞争物S056.4.2,并且两个靶标S056.2.10和S056.4.10以指定的浓度包含在内。S056.2.10与S056.2.2共享引物,并且S056.4.10与S056.4.2共享引物;S056.2.10和S056.4.10是FAM探测器的靶标,而S056.2.2和S056.4.2是HEX探测器的靶标。因此,该系统由两个CAN组成,它们对不同的靶标浓度具有独立的端点响应。鉴于两个CAN共享探针荧光团,它们各自的荧光行为相加地结合在一起:任一靶标的浓度越高,FAM信号越强,并且HEX信号越弱。所有反应结束时FAM和HEX强度之间的差异总结在右下方的图中:当两个靶标都处于最高浓度时,该信号差异达到最大值。
图19:CAN的端点响应曲线可通过调整各种组件进行调整。这里显示的是单一竞争物CAN的响应曲线。可以通过选择竞争物和野生型序列来改变响应的清晰度。调整竞争物的浓度会改变响应曲线的中心点。最后,可以通过降低引物的浓度来限制信号响应的最小和最大程度。
图20:为特定应用设计CAN的过程。从业者首先根据患者数据进行回归,例如逻辑回归,以确定哪些基因转录本为靶标,以及每个转录本的表达水平和诊断概率之间的适当关系。接下来,从业者为每个靶标转录本选择一个CAN架构,即竞争序列的数量和共享引物的排列。然后,从业者通过计算确定每个CAN模块的理想组件,这些组件将最佳地概括患者数据回归结果,特别是每个寡核苷酸的浓度和所需的扩增行为。使用先前获得的数据,从业者为每个竞争寡核苷酸提出设计参数(长度和GC含量),选择最有可能产生所需扩增行为的参数。这些参数设计随后可用于生成序列设计,这些设计可通过标准PCR扩增获得、进行实验测试,并进行分析以描述其行为。这些新观察结果与多任务回归框架中的先前观察相结合,其中统计模型共同学习设计参数与每个扩增参数之间的经验关系。如果需要进一步优化,该统计模型可用于提出新的序列设计,根据新获得的数据,这些序列设计现在最有可能产生所需的扩增行为。允许通过CAN反应重述逻辑回归结果的这个过程一直持续到找到合适的竞争序列。
图21:
说明回归如何能够调整竞争物以实现给定的靶标扩增率r。A)例如通过高斯过程回归,生成回归表面(最左边),将长度(BP,以核苷酸为单位)和GC含量(以百分比为单位)的两个竞争物设计参数与观察到的扩增率联系起来,以及这种关系的不确定性。在这里,观察点(即已设计和实验测试的竞争序列)由以扩增率为阴影的圆圈表示。填充等值线表示由回归算法确定的每个点的预期扩增率,虚线表示等不确定性等值线(由回归量返回的方差的平方根),表示为迄今为止所有观察到的r值的标准偏差的倍数。从这个回归曲面,可以计算出一个指标,如预期改进,表明一个可能显示所需的靶标扩增率的新的设计。这里显示的是不同靶标的预期改进表面,较浅的阴影表示实现目标的可能性较高。B)此处显示的靶标扩增率为1.0的回归曲面和预期改进曲面随着新序列的测试和增加到模型中而变化。通过这种方式,从业者可以反复调整竞争序列以达到所需的扩增率:i)对迄今为止获得的数据进行回归,ii)提出了一种很可能达到所需扩增率的新设计,iii)获得基于此设计的新序列并进行实验测试,iv)如果观察到的行为不是最理想的,则可以更新回归曲面以合并此数据,以及v)可以提出另一种设计。
图22:
此处显示的是图2中所示的每个合成扩增子与该图中所示的“WT”之间的竞争扩增反应的实时荧光迹线。对于每个反应,竞争物保持固定浓度,并且WT在每个反应10^2和10^8拷贝的浓度范围内进行测试。WT被带有FAM荧光团的探针靶向;该信号的强度在每个面板的上半部分显示为倒置。竞争扩增子被带有HEX荧光团的探针靶向;该信号的强度在每个面板的下半部分显示为倒置。反应由竞争物和WT的相对浓度的对数进行颜色编码。“log10比率”为3表示反应中的WT比相应的竞争物多1 000倍,而“log10比率”为-5表示反应中的竞争物比WT多100000倍。请注意,BP15竞争物太短而无法允许有探测区域,因此未观察到HEX信号,但仍观察到端点荧光信号的剂量依赖性变化。图4总结了此处显示的每个反应的FAM和HEX信号强度差异。
图23:
本工作中使用的检查序列、设计特征和观察到的扩增参数的列表,其中任何一个都可以用作任何CAN的组件。此处列出的每个序列均使用传统PCR技术进行了扩增,并按照工作中的描述分析了所得荧光曲线。实测参数F0_1g、K、r和m是出现在等式2和3中的参数,并且tau和rho出现在等式4和5中。图16总结了此表中由高斯过程回归确定的r参数的发现,将每个序列的长度(BP)和GC含量(GC)与每个引物对(该图上表示为“FPname-RPname”)和报告基因(染料或探针)的观察率r相关联。(FP=正向引物;RP=反向引物;CO=竞争寡核苷酸)。
序列信息:
SEQ ID NO:1-80如图1 7所示。SEQ ID NO:81-287列于下表1中,并且涉及图23中描述的寡核苷酸。
表1
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
现在将通过以下非限制性实例进一步描述本发明。
实例
核心技术是至少三个天然靶标或竞争多核苷酸的系统,用于核酸扩增反应以评估一个或多个感兴趣序列的特定组合。当序列被复制时,它们会竞争这些共享引物,从而赋予结果读数独特的特征。例如,以一组天然基因转录本为例,每个转录本都与一个工程合成竞争物配对(图8)。使用固定量的每种竞争物和不同量的每种天然靶标进行扩增反应。随着每个竞争对中的天然序列复制,它会产生绿色荧光信号;每个相应的合成序列都会产生一个橙色信号。由于所有绿色信号和所有橙色信号相互叠加,在反应结束时查看橙色和绿色的相对强度可以告诉您,总的来说,所有转录本的浓度与它们各自竞争物的浓度有多接近。可以设计每个竞争序列以反映每个天然靶标的感兴趣浓度范围;也许有些转录本在狭窄的窗口内会产生有趣的效果,而其他转录本会随着浓度的变化而产生更渐进的影响。这一原理有很多应用,从人类诊断到生物过程制造和生物医学研究。
上述“直接”竞争扩增网络,包括多对天然靶标和合成靶标,每对都竞争两种引物,构成了本发明最简单的实施例。然而,同样的竞争原则适用于更复杂的网络。例如,一个天然靶标可以与一个合成靶标共享其引物之一,后者又与第二合成靶标共享其他引物,从而形成“间接”CAN(图9)。引物可以在多个合成靶标之间共享,完全连接的网络可以设计为包含多个天然靶标,从而创造执行非线性操作的可能性(图10)。单个天然序列可以独立地靶向同一寡核苷酸的多个位置,从而创建具有强大特性的“冗余”系统(图11)。
直接竞争PCR
在竞争PCR中,竞争多核苷酸(REF)被包括在靶标旁边作为参考(在图中表示为WT)(图3)。该竞争序列被设计为与WT共享相同的引物序列,但包含不同的探针序列。可以设计具有一种荧光团(例如,产生绿色的荧光素或FAM)的探针以靶向WT,而具有不同荧光团(例如,产生橙色的六氯荧光素或HEX)的单独探针靶向REF(竞争物)。
当靶标和竞争物在同一个PCR反应中被扩增时,它们会竞争引物。由于引物被靶标链或竞争链的每次复制消耗,因此一旦引物库耗尽,两个序列的扩增就会停止。反应结束时每种扩增产物的量取决于两个靶标的相对起始量。这反映在产生的荧光信号中(图4)。对于以相同浓度开始的具有相同扩增率的靶标和竞争物(例如图2中的WT和ISO),在反应结束时从每个中获得的荧光信号将相同。如果在反应开始时WT多于REF,则WT荧光团在结束时会更强烈,反之亦然。这种从纯WT信号转变到纯REF信号的锐度可以通过调整竞争物的扩增率来调整。
图4显示了WT序列与各种竞争物(REF)的竞争扩增,展示了可访问行为的广度,从非常广泛的转变(BP240、GC85)到非常尖锐的转变(BP30)。通过调整REF的初始浓度,可以将响应曲线的中点移动到更高或更低的WT浓度。使用凝胶电泳,我们可以直接测量每个反应中扩增子的最终浓度,确认在荧光信号中观察到的动态。本质上,该系统报告感兴趣基因的表达与预定浓度的接近程度。我们可以通过选择适当的REF设计及其初始浓度来定义此浓度以及我们感兴趣的范围。
直接竞争扩增网络
现在,一对相互竞争的靶点算不上一个“网络”,单个基因靶点也不能反映基因表达特征的复杂性。然而,我们可以在同一个反应中组合多个竞争对,每个都产生反映不同RNA转录本的HEX和FAM信号。每个竞争对报告给定基因与其各自设定点的接近程度,然后这些信号将全部简单地叠加在一起。结果是所有基因整体相似性的综合测量。无论被调查的基因数量有多少,总HEX强度和总FAM强度之间的差异整合了整个系统的信息。为了说明为什么这是有用的,让我们看看我们如何通过模仿逻辑回归的统计技术使用这样的网络来诊断结核病。
案例分析:使用直接CAN诊断结核病
每年死于肺结核的人数超过死于任何其他传染病的人数。2018年新增病例1000万,死亡150万。结核病在同时感染了HIV的人群中尤为普遍(并且致命),这一人群特别难以通过当前的结核病检测进行诊断。在可用于诊断结核病的人类白细胞中发现了基因表达特征。((1)
Kaforou,M.;Wright,V.J.;Oni,T.;French,N.;Anderson,S.T.;Bangani,N.;Banwell,C.M.;Brent,A.J.;Crampin,A.C.;Dockrell,H.M.;Eley,B.;Heyderman,R.S.;Hibberd,M.L.;Kern,F.;Langford,P.R.;Ling,L.;Mendelson,M.;Ottenhoff,T.H.;Zgambo,F.;Wilkinson,R.J.;Coin,L.J.;Levin,M.Detection of Tuberculosis in HIV-Infected and-Uninfected African Adults Using Whole Blood RNA ExpressionSignatures:A Case-Control Study.PLOS Medicine 2013,10(10),e1001538.https://doi.org/10.1371/journal.pmed.1001538.(2)Gliddon,H.D.;Kaforou,M.;Alikian,M.;Habgood-Coote,D.;Zhou,C.;Oni,T.;Anderson,S.T.;Brent,A.J.;Crampin,A.C.;Eley,B.;Kern,F.;Langford,P.R.;Ottenhoff,T.H.M.;Hibberd,M.L.;French,N.;Wright,V.J.;Dockrell,H.M.;Coin,L.J.;Wilkinson,R.J.;Levin,M.;Consortium,代表I.Identification of Reduced Host Transcriptomic Signatures for Tuberculosisand Digital PCR-Based Validation and Quantification.bioRxiv 2019,583674.https://doi.org/10.1101/583674.)
至关重要的是,该测试在感染和未感染HIV的患者中表现同样出色。然而,用于识别这种特征的技术-微阵列.-对于在世界上最需要这种测试的农村、贫困地区的使用来说过于繁琐和昂贵。直接竞争扩增网络可以评估基因表达特征并将测试转化为快速、廉价且易于使用的格式。
统计诊断:逻辑回归
要了解我们如何使用CAN来诊断结核病,我们首先需要了解我们试图模仿的统计技术:逻辑回归。逻辑回归通过查看各种决定因素(各种基因的表达水平)的个体贡献,对属于一组(感染结核病)与另一组(患有其他疾病,OD)的概率进行建模。它假设对数发生比或相对慨率由这些因素的(线性)加权和给出:
我们可以通过找到每个基因的边际对数发生比来查看单个基因对整体分类器的贡献(图11A);也就是说,如果所有其他三个基因都处于它们的平均值(不提供信息),那么这个基因的不同数量提供了多少信息?因为对数发生比代表相对概率,负分意味着“更有可能是OD”(编码为-1),而正分意味着“更有可能是TB”(编码为+1)。显示了两个标度:左侧的边际对数发生比和右侧的边际概率。灰点是个体患者的基因拷贝数,而虚线是由给定基因拷贝数指示的TB的回归对数发生比(或概率)。
要基于逻辑回归诊断患者,我们只需将每个单独基因的贡献相加。例如,一名患者可能有103个GBP6拷贝,贡献了+0.25的边际对数发生比。同一位患者可能分别有104个ARG1拷贝和104个TMCC1拷贝,贡献-0.5和-0.2。该患者患有结核病的总体对数发生比为0.25-0.5-0.2=-0.45,因此我们可以得出结论,该患者不太可能患有结核病。对每位患者重复此操作(图11B),我们可以看到我们的回归结果具有很高的准确性,正确分类了40名患者中的36名。
使用直接CAN模拟统计数据
我们可以通过为我们的三个基因转录本中的每一个设计一个竞争物来使用直接CAN以在分子水平上概括这种统计推断(图8A)。由于GBP6与TB呈正相关,因此我们为转录本使用HEX标记的探针,并使用FAM标记的探针作为竞争物;由于ARG1和TMCC1与TB呈负相关,因此交换探针标签。然后,我们从转录本中选择一个合适的区域作为我们的天然靶标,并选择一个合适的序列作为我们的合成靶标(下文进一步描述),以显示产生响应曲线的扩增行为,该响应曲线与逻辑回归的边际对数发生比关系相匹配。通过将所有组分包含在相同的扩增反应中,总的HEX和FAM荧光强度汇总了各个对的独立贡献。这两种颜色的强度之间的差异充当从逻辑回归(图8B)得出的对数发生比的替代,提供匹配统计结果预测的概率诊断。
为了选择合适的靶标区域并设计合成靶标序列,我们使用逻辑回归的结果作为“靶标函数”:我们的目标是找到一对序列,当它们一起扩增时,该对序列给出我们一个输入输出接近这个目标的响应曲线。因此,对于每个靶标,我们尝试用从上面的等式(相应的β项)导出的斜率来近似一条线,并且在我们的数据集中观察到的靶标的平均浓度处截取0。使用模拟,我们可以预测一起扩增的任何两个序列的行为,因此我们可以使用本领域已知的标准曲线拟合算法来找到最佳参数。在这种情况下,正是生成响应曲线的参数在我们的数据集中观察到的靶标浓度范围内尽可能与上面指定的线相匹配,然后在该范围外尽快变平(参见图7)。
一旦找到合适的参数,然后我们就需要选择展示它们的序列。使用上面“测试和预测竞争物扩增行为”部分中描述的等式,我们可以预测提供这些参数的长度和GC含量的组合。请注意,我们的模拟不包括我们的回归等式中的漂移项(m)或平台项(K)。这是因为模拟代表理想行为,而这两个参数描述了与该理想的偏差。因此,在选择最佳长度和GC含量时,我们会寻求最小化漂移和最大化平台,以便我们选择尽可能接近理想的序列。
很有可能,多组参数可能会给出近乎最佳的曲线。最好先确定合适的靶标序列(由于外部限制),测量其扩增参数,然后使用曲线拟合算法仅选择竞争物扩增参数,这些参数在与测量参数一起模拟时,产生近乎最佳的响应。扩增行为的模拟如上所述;提供了合适的模拟等式,技术人员将能够执行多种优化技术和算法(包括梯度下降、随机梯度下降和拟牛顿优化等)中的任何一种。
直接CAN的局限性
上面介绍的直接网络有两个主要缺点。首先,对于更大的基因特征,它们将很快变得昂贵,因为至少需要为每个靶标转录本设计至少一个(如果不是两个)探针。DNA序列的规模经济非常有利于扩大规模,但在开发规模上,每个荧光标记探针的成本约为200英镑(就上下文而言,每个引物成本约为2英镑,而每个合成靶标成本约为20英镑)。对于具有20-50个靶标的基因特征,迭代序列设计变得非常昂贵。其次,直接CAN在可达到的响应曲线方面有些受限。为了解决这些问题,间接CAN以或多或少的固定成本提供类似的功能,而不管正在研究的基因数量有多少。间接竞争还开启了能够同时对多个靶标进行复杂、非线性分析的高阶网络的可能性。最后,冗余靶标为所有CAN架构提供了额外的灵活性。
间接竞争PCR
未探测靶标可以简单地调节竞争多核苷酸之间的竞争,而不是探测靶标和探测竞争物之间的直接竞争。因为两个引物对于给定靶标的指数扩增都是必需的,所以仅需耗尽一个引物就可以停止复制。因此,我们可以设计一个合成靶标REFH,该合成靶标与天然序列WT共享一个引物,并且其第二引物与第二合成靶标REFF共享(图12)。如果所有组件具有相同的扩增率并且两个REF以相同的浓度开始,则在没有任何WT存在的情况下,HEX和FAM信号将同样扩增。然而,增加的WT开始胜过REFH,同时抑制HEX信号。这反过来又为REFF的生长创造了更多空间,导致在反应结束时产生更大的FAM信号。结果是对各种WT浓度的S形响应曲线,类似于从直接竞争中观察到的曲线(图9A)。可以通过调整任何靶标的扩增率、合成靶标的起始浓度、任何引物的浓度或网络本身的拓扑来调整此响应曲线(图9B,C)。该系统的主要优势在于,由于我们对合成靶标的“内部”序列拥有完全自由,因此可以在多个REF中重复使用相同的两个探针序列,从而最大限度地降低开发成本,无论使用了多少天然靶标或网络如何复杂。
案例分析:使用间接CAN诊断癌症
早期癌症诊断或癌症治疗监测的一个有希望的途径是通过检测血液中的肿瘤衍生DNA(循环肿瘤DNA,ctDNA),即细胞死亡时脱落的染色体片段。这通过特定突变(例如单核苷酸多态性(SNP)或插入-缺失(indel))与普通的无细胞DNA(cfDNA)环境区分开来。通过检测已知的致病突变,我们或许能够在肿瘤出现在扫描结果之前诊断出某人。我们还可以在治疗后或治疗期间寻找ctDNA,以查看患者是否有反应或癌症是否复发。困难在于,这些变体的浓度远低于相应的天然序列。此外,使用普通PCR很难区分单个碱基变化(插入缺失更容易,因此我们将重点关注SNP,并理解任何对SNP有效的方法对插入缺失的效果会更好)。虽然在某些情况下,特定的突变可以为治疗决策提供信息(即靶向治疗的易感性/耐药性),但总的来说,即使众多突变中的任何一个都可以作为总负荷的代理,总的ctDNA负荷就足够了,这使得它成为一个很好的CAN应用。
要使用CAN进行ctDNA检测,我们将采用阻断剂置换扩增(Wu等人,2017年),这是一种已发表的方法,用于优先扩增变异等位基因而不是相应的野生型(图13)。在BDA中,短寡核苷酸被设计为与SNP位点重叠,但与WT序列的结合更牢固。这种“阻断剂”经过化学修饰以防止被聚合酶延伸。通过选择与SNP相邻并与阻断区域重叠的引物位点,阻断剂和引物竞争结合WT和SNP靶标。这抑制了WT的扩增率,因为阻断剂比引物结合更强,但允许SNP以最小的扰动扩增,因为引物胜过阻断剂。该系统可以耦合到一个已调整的间接CAN中,这样一个信号会随着SNP浓度的增加而迅速占主导地位,即使在高可变等位基因频率(VAF)下也是如此。为几个不同的靶标设计一个这样的CAN允许进行多重监视,其中总信号反映了ctDNA中的总突变负荷。
高阶竞争网络
间接CAN的灵活性允许将多个天然靶标合并到一个封闭的网络中,从而实现靶标组合的非线性分析。例如,图14显示了从布尔逻辑近似AND、OR和XOR逻辑的CAN基序。冗余竞争网络
上面显示的CAN对给定靶标的响应有限;关于靶标浓度,输出始终是单调的或至少是单峰的。然而,我们可以通过冗余地靶向单个序列来进一步利用荧光信号的加性性质。基因转录本通常有几千个核苷酸长,而PCR靶标只需要50-300个核苷酸。因此,我们可以设计独立的CAN,每个CAN都靶向同一序列的不同区域。他们的输出将叠加,从而产生强大的紧急行为。从数学的角度来看,各个网络成为一个“基函数”库,理论上可以从中建立任何响应关系,仅受给定序列中可用靶标区域的数量限制。
案例分析:具有冗余CAN的稀释不可知比较器
生物传感面临着一个悖论:生物分子浓度的变化被用来推断疾病状态,但由于许多非生物学原因,样品的靶标浓度可能会发生变化。患者的水分可能多于或少于预期,样品量可能不准确,或者简单的统计数据可能导致获得的细胞数量发生变化。适应这些不确定性的经典方法是使用内部标准,这是样品固有的东西,不应随疾病状况而变化。对于RNA分析,这种内标通常是一个“管家”基因,一种对细胞生长至关重要的转录本(例如,控制细胞骨架或细胞膜代谢),其浓度仅反映所分析细胞的数量,而不是它们的状态。可以将真正有趣的基因转录本的浓度与管家基因进行比较,以产生更可靠的衡量它们与正常情况的偏差的方法。通常,这些要么是平行进行的单独PCR反应,要么是单个反应中的多个探针;在任何一种情况下,如果需要16个感兴趣的基因和5个管家基因,并且需要大量的后处理,这将变得非常耗费时间、资源和样品。间接CAN的冗余靶向提供了一种在分子水平上明确执行此计算的方法,因此报告的信号反映了两个基因的相对浓度,而不考虑它们的绝对浓度(图15)。
更多应用
两年半的基因表达分析已经确定了数十个甚至数百个具有潜在诊断意义的表达特征。RT-PCR、Nanostring和RNA-seq分析同样产生了有用的见解。除了上述特征外,以下报告还提出了有希望适应CAN平台的候选者:
·脓毒症抗生素决策模型,11个基因
·乳腺癌化疗决定,70个基因
·乳腺癌诊断,21个基因
·血流念珠菌病,40个基因
·牛结核病,15个基因
·牛乳腺炎,15个基因
CAN平台还可以解决生物加工中的问题,合成细胞在工业上用于生产药物等产物或分解石化产物或温室气体等材料。这涉及多个合成和天然基因系统的协调,并且可能涉及多个同时生长的工程细胞群。目前,系统性能是通过RNA-seq或微阵列来验证的,这些方法既昂贵又耗时。或者,工程师将产生“报告基因”的基因与所需产物结合起来。然而,这样做会消耗原本可用于生产所需化合物的原材料,同时给工程细胞带来更大的压力和不确定性。CAN架构将提供一种方法来同时获取所有相关基因转录活动的快照。如果所有基因都在预先指定的窗口内运行,则CAN可以设计为产生一种颜色,但如果任何基因高于或低于该窗口,则会产生不同的颜色。
结论
竞争扩增网络提供了在分子水平上执行强大计算的潜力,在生物传感器架构内明确执行分析物模式识别。通过利用无处不在的DNA扩增技术PCR,CAN平台快速、廉价,最重要的是,易于使用。该技术的数据驱动特性既是它的优点也是它的缺点:足够的数据集是设计和测试CAN所必需的,但获得足够强大的数据集可能是一个长期的挑战。幸运的是,有大量关于该主题的文献,其中大部分是开放获取数据。这里的结果只是开始描述该技术的潜力;需要做更多的工作来建立网络设计、靶标序列选择和实验验证的规则和算法。由于尚处于早期阶段,创建CAN是一个非常手动的过程,但整个过程可以通过建模和自动化仪器的集成来简化,以迭代i)为应用程序设计网络,ii)选择竞争物和引物序列,iii)从结构单元寡核苷酸中自动组装竞争物,iv)运行适当数量的反应,v)将结果与预测响应进行比较,vi)调整网络或序列设计。这种闭环开发系统将允许为广泛的生物传感应用快速部署CAN平台。
Claims (43)
1.一种扩增样品中至少第一和至少第二靶标多核苷酸的方法,其中所述方法包括:提供:
a)可能包含至少第一和至少第二靶标多核苷酸的样品
b)第一调整竞争多核苷酸和第二调整竞争多核苷酸;
c)至少第一引物,其中所述至少第一引物能够杂交至:
样品中的第一靶标多核苷酸;和
所述第一调整竞争多核苷酸;和
启动引物延伸反应,使得所述第一和第二靶标多核苷酸(如果存在于样品中)和所述第一调整竞争多核苷酸和所述第二调整竞争多核苷酸被扩增,
其中扩增产生第一靶标产物、第二靶标产物、第一调整竞争产物和第二调整竞争产物。
2.根据权利要求1所述的方法,其中所述方法包括提供第二引物,任选地其中;
a)所述第二引物能够与所述第一靶标多核苷酸杂交,其中所述第一和第二引物在靶标的相反链上杂交以导致产生所述第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;
b)所述第二引物能够与所述第一调整竞争多核苷酸杂交,其中所述第一和第二引物在所述第一调整竞争多核苷酸的相反链上杂交,以导致产生所述第一调整竞争产物,任选地第一调整竞争PCR产物;
c)所述第二引物:
i)能够与所述第一调整竞争多核苷酸杂交,其中所述第一和第二引物在所述第一调整竞争多核苷酸的相反链上杂交,以导致产生所述第一调整竞争产物,任选地第一调整竞争PCR产物;和
ii)能够与所述第二调整竞争多核苷酸杂交并启动引物延伸反应,使得所述第二调整竞争多核苷酸被扩增,以导致产生所述第二调整竞争产物,任选地与另外的引物组合,其中所述第二和另外的引物在所述第二调整竞争多核苷酸的相反链上杂交,以导致产生所述第二调整竞争产物,任选地第一靶标聚合酶链式反应(PCR)产物,
任选地,其中所述第二引物不能与所述第一靶标多核苷酸杂交;和/或
d)所述第二引物:
i)能够与所述第一靶标多核苷酸杂交,其中所述第一和第二引物在所述靶标的相反链上杂交以导致产生所述第一靶标产物,任选地第一靶标聚合酶链式反应(PCR)产物;和
ii)不能与所述第一或第二调整竞争多核苷酸杂交
并且其中所述方法包括第三引物,所述第三引物能够与所述第一和第二调整竞争多核苷酸杂交。
3.根据权利要求1或2中任一项所述的方法,其中所述第一靶标多核苷酸的扩增动力学与所述第一调整竞争多核苷酸的扩增动力学不同,或与所述第一调整竞争多核苷酸的扩增动力学基本不相似。
4.根据权利要求1至3中任一项所述的方法,其中当靶标多核苷酸的初始数量与引物延伸之前的调整竞争多核苷酸的数量相同或基本相同时,所产生的靶标产物多核苷酸的数量不同于所产生的调整竞争产物多核苷酸的数量。
5.根据权利要求1至4中任一项所述的方法,其中:
待扩增的所述第一靶标多核苷酸的序列和至少第一调整竞争多核苷酸的序列,和
待扩增的所述第二靶标多核苷酸的序列和至少第二调整竞争多核苷酸的序列,
被选择以导致第一靶标扩增产物和第二靶标扩增产物的最终量,所述最终量随着所述第一靶标多核苷酸和所述第二靶标多核苷酸的初始浓度以这样的方式变化,以致于近似或再现或匹配所述靶标与一个或多个状态的预测关系。
6.根据权利要求1至5中任一项所述的方法,其中所述第一靶标多核苷酸的扩增速率和所述第二靶标多核苷酸的扩增速率匹配预定义的权重。
7.根据权利要求1至6中任一项所述的方法,其中待扩增的所述第一调整竞争多核苷酸的序列与待扩增的所述第一靶标多核苷酸的序列共享少于95%、90%、88%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%的序列同一性;并且任选地其中
待扩增的所述第二调整竞争多核苷酸的序列与待扩增的所述第二靶标多核苷酸的序列共享少于95%、90%、88%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%的序列同一性;
8.根据权利要求1至7中任一项所述的方法,其中:
所述第一调整竞争产物:
i)比所述第一靶标产物短至少5个核苷酸,任选地比所述第一靶标产物短至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、230、260、270、280、290个或至少330个核苷酸;或者
ii)比所述第一靶标产物长至少5个核苷酸,任选地比所述第一靶标产物长至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290或至少330个核苷酸;和/或
所述第二调整竞争产物:
i)比所述第二靶标产物短至少5个核苷酸,任选地比所述第二靶标产物短至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸;或者
ii)比所述第二靶标产物长至少5个核苷酸,任选地比所述第二靶标产物长至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290个或至少330个核苷酸;
9.根据权利要求1至8中任一项所述的方法,其中检测出一个或多个靶标产物,任选地一个或多个靶标PCR产物;和一个或多个调整竞争产物,任选地一个或多个竞争多核苷酸PCR产物,任选地其中
检测出所述第一靶标扩增产物、所述第二靶标扩增产物、所述第一调整竞争扩增产物和所述第二调整竞争扩增产物。
10.根据权利要求1至9中任一项所述的方法,其中所述方法包括提供一个或多个探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸,
并且其中所述第一标签和所述第二标签不同。
11.根据权利要求10所述的方法,其中所述至少一个标记有所述第一标签的探针能够与所述第一靶标产物杂交;并且所述至少一个标记有第二标签的探针能够与所述第一调整竞争产物杂交。
12.根据权利要求10或11中任一项所述的方法,其中所述至少一个标记有所述第一标签的探针能够与所述第一调整竞争产物杂交;和
所述至少一个标记有所述第二标签的探针能够与所述第二调整竞争产物杂交;和
任选地,其中所述两个探针都不能与所述第一靶标产物杂交。
13.根据权利要求10至12中任一项所述的方法,其中在单个探针组中存在:
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有所述第一标签;和/或
至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针,每个都标记有所述第二标签。
14.根据权利要求10至13中任一项所述的方法,其中所述方法包括提供至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个不同的探针组,
任选地,其中没有特定的标签,任选地荧光团,被用于多于一个探针组中。
15.根据权利要求10至14中任一项所述的方法,其中存在于所述探针上的唯一标签是所述第一标签和所述第二标签。
16.根据权利要求10至15中任一项所述的方法,其中所述第一和第二标签是荧光团,
任选地
其中每个探针包含淬灭剂;和/或
其中所述第一标签是FAM并且所述第二标签是HEX;或者其中所述第一标签是HEX并且所述第二标签是FAM。
17.根据权利要求10至16中任一项所述的方法,其中
i)所述至少一个能够与所述第一靶标产物杂交的探针;和所述至少一个能够与所述第一调整竞争产物杂交的探针被标记有不同的标签;和/或
ii)所述至少一个能够与所述第一调整竞争产物杂交的探针;和所述至少一个能够与所述第二调整竞争产物杂交的探针被标记有不同的标签。
18.根据权利要求10至17中任一项所述的方法,其中所述
能够与和特定状态的正预测关系相关的靶标多核苷酸产物杂交的每个探针都标记有所述第一标签,并且能够与调整竞争多核苷酸产物杂交的相应探针标记有所述第二标签;
和/或
能够与和所述特定状态的负预测关系相关的靶标多核苷酸产物杂交的每个探针用所述第二标签标记,并且能够与所述调整竞争多核苷酸产物杂交的相应探针标记有所述第一标签。
19.根据权利要求10至18中任一项所述的方法,其中在扩增之后确定由所述第一探针检测到的所述产物的量和由所述第二探针检测到的所述产物的量。
20.根据权利要求19所述的方法,其中将每个探针的相对量与标准曲线进行比较以确定一种或多种状态的相对概率。
21.根据权利要求1至20中任一项所述的方法,其中所述方法包括通过获取所使用的所有荧光团的单一读数来检测所有扩增产物的相对丰度。
22.根据权利要求1至21中任一项所述的方法,其中所述方法用于扩增至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个靶标多核苷酸。
23.根据权利要求1至22所述的方法,其中所述方法包括扩增两个调整竞争多核苷酸,其中所述方法包括:
用至少一个能够与所述第一靶标多核苷酸杂交的引物扩增第一调整竞争多核苷酸;和
用至少一个能够与所述第二靶标多核苷酸杂交的引物扩增第二调整竞争多核苷酸。
24.根据权利要求1至23中任一项所述的方法,其中使用聚合酶链式反应(PCR)或重组酶聚合酶反应(RPA)扩增所述多核苷酸。
25.一种方法:
将样品中由至少两个寡核苷酸的相对丰度或至少两个突变的存在或缺失提供的预测关系、决策面或差异靶标寡核苷酸模式,任选地差异基因调控特征转化为单一值;
将样品中至少两个寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失转化为特定状态的相对概率;
仅使用两个荧光团标记的探针检测样品中至少三个寡核苷酸的相对丰度,例如至少三个基因的相对表达,或至少三个突变的存在或缺失;
将样品中至少两个寡核苷酸的相对丰度,例如至少两个基因的相对表达,或至少两个突变的存在或缺失组合成单一值
其中所述方法包括根据权利要求1至24中任一项所述的扩增样品中的至少第一和至少第二靶标多核苷酸的方法。
26.根据权利要求1至25中任一项所述的方法,其中所述方法用于诊断和/或预测受试者的疾病或病症。
27.一种诊断或预测受试者的疾病或病症的方法,其中所述方法包括权利要求1至25中任一项所述的方法。
28.根据权利要求27所述的方法,其中当所述第一标签和所述第二标签的相对量指示疾病或病症的诊断或预测时,所述受试者被诊断为患有疾病或病症或预测发生所述疾病或病症。
29.根据权利要求26至28中任一项所述的方法,其中:
a)所述疾病或病症选自:人结核病、合并感染HIV的人结核病、未合并感染HIV的人结核病、癌症任选地前列腺癌或乳腺癌、败血症、血流念珠菌病、牛结核病、牛乳腺炎,任选地
其中所述疾病是结核病,任选地其中:
从所述受试者的白细胞中鉴定出所述预测关系、决策面或差异靶标寡核苷酸模式,任选地差异基因调控特征;和/或
GBP6、ARG1和TMCC1的差异调节程度有助于与患有某种“其他疾病”相比而患有结核病的总体概率,任选地其中,与未患有结核病的患者中这些基因的水平相比,基因表达特征是GBP6的上调和ARG1和TMCC1的下调。
30.根据权利要求26至29中任一项所述的方法,其中所述疾病是癌症,任选地前列腺癌或乳腺癌,任选地前列腺癌。
31.根据权利要求26至30中任一项所述的方法,其中所述疾病或病症的诊断需要评估至少两个基因的相对表达水平,任选地需要评估至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至少100个基因的相对表达水平。
32.一种组合物,其包含以下中的一者、至少两者、或全部:
a)至少一个如权利要求1至26中任一项所定义的调整竞争多核苷酸;
b)至少一个如权利要求1至26中任一项所定义的引物,任选地至少两个如权利要求1至26中任一项所定义的引物;
c)至少一个或多个探针组,其中每个探针组包含至少一个标记有第一标签的探针多核苷酸和至少一个标记有第二标签的探针多核苷酸,任选地如权利要求10至26中任一项所定义。
33.一种如权利要求1至26中任一项所定义的调整竞争多核苷酸。
34.一种用于实施根据权利要求1至31中任一项所述的方法的试剂盒,其中所述试剂盒包括以下中的一者或多者:
a)如权利要求1至26所定义的一个或多个调整竞争多核苷酸;
b)一个或多个引物,任选地如权利要求1至26中任一项所定义;
c)如权利要求10至26中任一项所定义的第一探针组;
d)合适的缓冲液;
e)使用说明,
任选地,其中所述试剂盒包含至少2、3、4、5、6、7、8、9个或至少10个不同的调整竞争多核苷酸和/或至少2、3、4、5、6、7、8、9个或至少10个不同的探针组。
35.根据权利要求34所述的试剂盒,其中所述试剂盒包含:
a)
i)一个或多个如权利要求1至26所定义的调整竞争多核苷酸,任选地至少两个如权利要求1至26所定义的调整竞争多核苷酸;和
ii)一个或多个引物,任选地如权利要求1至26中任一项所定义;或者
b)
i)一个或多个如权利要求1至26所定义的调整竞争多核苷酸,任选地至少两个如权利要求1至26所定义的调整竞争多核苷酸;和
ii)如权利要求10至26中任一项所定义的第一探针组;或者
c)
i)一个或多个引物,任选地如权利要求1至26中任一项所定义;和
ii)如权利要求10至26中任一项所定义的第一探针组;或者
d)
i)一个或多个如权利要求1至26所定义的调整竞争多核苷酸,任选地至少两个如权利要求1至26所定义的调整竞争多核苷酸;
ii)一个或多个引物,任选地如权利要求1至26中任一项所定义;和
iii)如权利要求10至26中任一项所定义的第一探针组。
36.一种调整第一竞争多核苷酸的方法,所述第一竞争多核苷酸竞争至少第一引物与第一靶标多核苷酸的杂交并且导致第一靶标产物和第一调整竞争产物的扩增的区别,所述区别将预测关系、决策面或差异靶标寡核苷酸模式转化为第一靶标多核苷酸扩增产物的相对丰度,并且其中:
a)所述第一竞争多核苷酸被设计成与所述靶标多核苷酸具有不同的扩增动力学;
b)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
c)所述第一靶标多核苷酸的扩增匹配所述靶标多核苷酸与特定状态的预测关系;
和/或
d)所述第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率匹配预定义的权重,
所述方法包括
相对于所述第一靶标产物的序列和/或所述第一靶标产物的长度,优化所述调整竞争多核苷酸的序列和/或调整竞争扩增产物的长度。
37.根据权利要求36所述的方法,其中:
在所述扩增中使用能够与所述第一靶标多核苷酸杂交的第二引物,使得所述第一靶标产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
在所述扩增中使用能够与所述第一调整竞争多核苷酸杂交的第三引物,使得所述第一调整竞争产物通过来自两个引物的引物延伸产生,任选地通过PCR产生;
任选地,其中所述第二引物和所述第三引物具有相同的序列。
38.根据权利要求36或37所述的方法,其中所述方法是调整至少两个或更多个测试调整竞争多核苷酸的方法,其导致第一靶标产物和第一调整竞争产物的扩增的区别,以及导致第二靶标产物和第二调整竞争产物的扩增的区别,所述区别将预测关系、决策面或差异靶标寡核苷酸模式转化为第一靶标多核苷酸扩增产物和第二靶标多核苷酸扩增产物的相对丰度,并且任选地其中:
a)所述第一竞争多核苷酸被设计成与所述靶标多核苷酸具有不同的扩增动力学;
b)与被扩增的调整竞争多核苷酸的比例相比,不同比例的靶标多核苷酸被扩增;
c)所述第一靶标多核苷酸的扩增匹配靶标与特定状态的预测关系;和/或
d)所述第一靶标多核苷酸的扩增速率和任选地第二靶标多核苷酸的扩增速率匹配预定义的权重,
并且选择导致所述第一靶标多核苷酸的最优选扩增的调整竞争物。
39.一种确定系统转录状态的方法,其中所述方法包括根据前述权利要求中任一项所述的扩增方法。
40.一种确定系统是处于状态A还是处于状态B的方法,其中所述方法包括根据前述权利要求中任一项所述的扩增方法。
41.一种样品中至少两个靶标多核苷酸的同时竞争扩增的方法,其中所述方法包括
提供
a)包含多核苷酸的样品;
b)第一和第二调整竞争多核苷酸;
c)第一引物组,其中所述引物组包含两个能够在第一靶标多核苷酸和第一竞争多核苷酸的相反链上杂交的引物,以允许产生第一靶标扩增产物和第一竞争扩增产物;
d)第二引物组,其中所述引物组包含两个能够在第二靶标多核苷酸和第二竞争多核苷酸的相反链上杂交的引物,以允许产生第二靶标产物和第二竞争产物;
e)第一探针组,其中所述第一探针组包含能够与第一靶标扩增产物杂交的第一标签靶标探针和能够与第一竞争扩增产物杂交的第一标签竞争探针;
d)第二探针组,其中所述第二探针组包含能够与第二靶标扩增产物杂交的第二标签靶标探针和能够与第二竞争扩增产物杂交的第二标签竞争探针;
并且其中:
i)所述第一标签靶标探针和第二靶标标签探针标记有相同的第一标签;并且其中所述第一标签竞争探针和所述第二标签竞争探针标记有相同的第二标签;或者
ii)所述第一标签靶标探针和所述第二标签竞争探针标记有相同的第一标签;并且其中所述第一标签竞争探针和所述第二标签靶标探针标记有相同的第二标签
并允许所述第一和第二引物组与所述靶标和竞争多核苷酸杂交。
42.根据41所述的方法,其中所述方法包括提供
e)另外1、2、3、4、5、6、7、8、9、10个引物组和相应的探针组。
43.根据权利要求42所述的方法,其中所述方法还包括在多重扩增后同时检测所述第一标签和所述第二标签的量。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2015943.0 | 2020-10-08 | ||
GBGB2015943.0A GB202015943D0 (en) | 2020-10-08 | 2020-10-08 | Methods |
PCT/GB2021/052594 WO2022074392A1 (en) | 2020-10-08 | 2021-10-07 | Methods and means for amplification-based quantification of nucleic acids |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117321223A true CN117321223A (zh) | 2023-12-29 |
Family
ID=73460647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180082204.2A Pending CN117321223A (zh) | 2020-10-08 | 2021-10-07 | 用于基于扩增的核酸定量的方法和手段 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230366016A1 (zh) |
EP (1) | EP4225938A1 (zh) |
JP (1) | JP2023545097A (zh) |
CN (1) | CN117321223A (zh) |
AU (1) | AU2021356233A1 (zh) |
CA (1) | CA3195034A1 (zh) |
GB (1) | GB202015943D0 (zh) |
IL (1) | IL302008A (zh) |
WO (1) | WO2022074392A1 (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140193819A1 (en) * | 2012-10-31 | 2014-07-10 | Becton, Dickinson And Company | Methods and compositions for modulation of amplification efficiency |
CA2949622C (en) * | 2012-11-26 | 2019-07-02 | The University Of Toledo | Methods for standardized sequencing of nucleic acids and uses thereof |
-
2020
- 2020-10-08 GB GBGB2015943.0A patent/GB202015943D0/en not_active Ceased
-
2021
- 2021-10-07 WO PCT/GB2021/052594 patent/WO2022074392A1/en active Application Filing
- 2021-10-07 IL IL302008A patent/IL302008A/en unknown
- 2021-10-07 CN CN202180082204.2A patent/CN117321223A/zh active Pending
- 2021-10-07 EP EP21794924.7A patent/EP4225938A1/en active Pending
- 2021-10-07 US US18/248,285 patent/US20230366016A1/en active Pending
- 2021-10-07 JP JP2023521681A patent/JP2023545097A/ja active Pending
- 2021-10-07 CA CA3195034A patent/CA3195034A1/en active Pending
- 2021-10-07 AU AU2021356233A patent/AU2021356233A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230366016A1 (en) | 2023-11-16 |
GB202015943D0 (en) | 2020-11-25 |
CA3195034A1 (en) | 2022-04-14 |
JP2023545097A (ja) | 2023-10-26 |
EP4225938A1 (en) | 2023-08-16 |
AU2021356233A1 (en) | 2023-05-25 |
IL302008A (en) | 2023-06-01 |
WO2022074392A1 (en) | 2022-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lopez et al. | A molecular multi-gene classifier for disease diagnostics | |
KR102628141B1 (ko) | 서열-특정 오류(sse)를 유발시키는 서열 패턴을 식별하기 위한 심층 학습-기반 프레임워크 | |
CA2978843A1 (en) | Dna-methylation based method for classifying tumor species | |
JP6695899B2 (ja) | 標準物質として外部生体分子を用いた生体分子分析方法およびそのキット | |
JP2011517401A (ja) | 病態生理学的症状の体外検出及び識別方法 | |
JP2016165286A (ja) | 転写物測定値数が減少した、遺伝子発現プロファイリング | |
CN109642252A (zh) | 核酸反应及相关方法和组合物 | |
Dougherty et al. | Genomic signal processing: Diagnosis and therapy | |
Asnicar et al. | Machine learning for microbiologists | |
WO2011036091A1 (de) | Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen | |
Dehghannasiri et al. | Unsupervised reference-free inference reveals unrecognized regulated transcriptomic complexity in human single cells | |
Melov et al. | Microarrays as a tool to investigate the biology of aging: a retrospective and a look to the future | |
EP2491509B1 (en) | Analyzing tool for amplification reactions | |
CN117321223A (zh) | 用于基于扩增的核酸定量的方法和手段 | |
CN103620608A (zh) | 生物医学标记物之间多模态关联的鉴定 | |
CN114566224A (zh) | 一种用于鉴别或区分不同海拔人群的模型及其应用 | |
US11834714B2 (en) | Detection and digital quantitation of multiple targets | |
US20230078454A1 (en) | Using machine learning to optimize assays for single cell targeted sequencing | |
JP7485653B2 (ja) | 移植片拒絶を検出する方法およびシステム | |
Waller et al. | SPECTRA: Agnostic expression variables for flexible transcriptome modelling in complex disease | |
Fang | Rational Design and Optimization of Nucleic Acid Hybridization | |
WO2023122041A1 (en) | Detection and digital quantitation of multiple targets | |
Haar | DNA microarray experimental design and software based data normalization and analysis | |
WO2024095262A1 (en) | Systems and methods for primer selection and multiplex pcr | |
WO2023084486A1 (en) | Generation of epigenetic age information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |