CN109136364A - 通过大规模平行rna测序分析母亲血浆转录组 - Google Patents
通过大规模平行rna测序分析母亲血浆转录组 Download PDFInfo
- Publication number
- CN109136364A CN109136364A CN201811106855.7A CN201811106855A CN109136364A CN 109136364 A CN109136364 A CN 109136364A CN 201811106855 A CN201811106855 A CN 201811106855A CN 109136364 A CN109136364 A CN 109136364A
- Authority
- CN
- China
- Prior art keywords
- mother
- gene
- fetus
- rna
- gestation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 35
- 210000002381 plasma Anatomy 0.000 title abstract description 143
- 238000003559 RNA-seq method Methods 0.000 title abstract description 28
- 210000003754 fetus Anatomy 0.000 claims abstract description 161
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 153
- 230000035935 pregnancy Effects 0.000 claims abstract description 119
- 230000014509 gene expression Effects 0.000 claims description 99
- 230000035606 childbirth Effects 0.000 claims description 28
- 238000005259 measurement Methods 0.000 claims description 19
- 201000011461 pre-eclampsia Diseases 0.000 claims description 16
- 238000003745 diagnosis Methods 0.000 claims description 11
- 208000006399 Premature Obstetric Labor Diseases 0.000 claims description 8
- 206010036600 Premature labour Diseases 0.000 claims description 8
- 208000026440 premature labor Diseases 0.000 claims description 8
- 238000009395 breeding Methods 0.000 claims description 5
- 230000001488 breeding effect Effects 0.000 claims description 5
- 101000610206 Homo sapiens Pappalysin-1 Proteins 0.000 claims description 4
- 102100040156 Pappalysin-1 Human genes 0.000 claims description 4
- RITKWYDZSSQNJI-INXYWQKQSA-N (2s)-n-[(2s)-1-[[(2s)-4-amino-1-[[(2s)-1-[[(2s)-1-[[2-[[(2s)-1-[[(2s)-1-[[(2s)-1-amino-1-oxo-3-phenylpropan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-2-oxoethyl]amino]-1-oxo-3-phenylpropan-2-yl]amino] Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 RITKWYDZSSQNJI-INXYWQKQSA-N 0.000 claims 2
- 108091007507 ADAM12 Proteins 0.000 claims 2
- 102100030499 Chorion-specific transcription factor GCMa Human genes 0.000 claims 2
- 102100021809 Chorionic somatomammotropin hormone 1 Human genes 0.000 claims 2
- 102100031633 Chorionic somatomammotropin hormone-like 1 Human genes 0.000 claims 2
- 102100021752 Corticoliberin Human genes 0.000 claims 2
- 102100031112 Disintegrin and metalloproteinase domain-containing protein 12 Human genes 0.000 claims 2
- 102100036717 Growth hormone variant Human genes 0.000 claims 2
- 101000862639 Homo sapiens Chorion-specific transcription factor GCMa Proteins 0.000 claims 2
- 101000895818 Homo sapiens Chorionic somatomammotropin hormone 1 Proteins 0.000 claims 2
- 101000940558 Homo sapiens Chorionic somatomammotropin hormone-like 1 Proteins 0.000 claims 2
- 101000895481 Homo sapiens Corticoliberin Proteins 0.000 claims 2
- 101000642577 Homo sapiens Growth hormone variant Proteins 0.000 claims 2
- 101001091223 Homo sapiens Metastasis-suppressor KiSS-1 Proteins 0.000 claims 2
- 101000691463 Homo sapiens Placenta-specific protein 1 Proteins 0.000 claims 2
- 101000691478 Homo sapiens Placenta-specific protein 4 Proteins 0.000 claims 2
- 101000609261 Homo sapiens Plasminogen activator inhibitor 2 Proteins 0.000 claims 2
- 101000617728 Homo sapiens Pregnancy-specific beta-1-glycoprotein 9 Proteins 0.000 claims 2
- 101000835083 Homo sapiens Tissue factor pathway inhibitor 2 Proteins 0.000 claims 2
- 102100027004 Inhibin beta A chain Human genes 0.000 claims 2
- 229910020769 KISS1 Inorganic materials 0.000 claims 2
- 102100034841 Metastasis-suppressor KiSS-1 Human genes 0.000 claims 2
- 102100026181 Placenta-specific protein 1 Human genes 0.000 claims 2
- 102100026184 Placenta-specific protein 4 Human genes 0.000 claims 2
- 108010022233 Plasminogen Activator Inhibitor 1 Proteins 0.000 claims 2
- 102100039418 Plasminogen activator inhibitor 1 Human genes 0.000 claims 2
- 102100039419 Plasminogen activator inhibitor 2 Human genes 0.000 claims 2
- 102100021983 Pregnancy-specific beta-1-glycoprotein 9 Human genes 0.000 claims 2
- 102100026134 Tissue factor pathway inhibitor 2 Human genes 0.000 claims 2
- 108010019691 inhibin beta A subunit Proteins 0.000 claims 2
- 108700028369 Alleles Proteins 0.000 abstract description 185
- 238000013518 transcription Methods 0.000 abstract description 116
- 230000035897 transcription Effects 0.000 abstract description 116
- 238000000034 method Methods 0.000 abstract description 85
- 239000003550 marker Substances 0.000 abstract description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 101
- 239000000523 sample Substances 0.000 description 96
- 210000002826 placenta Anatomy 0.000 description 51
- 238000001914 filtration Methods 0.000 description 49
- 238000012163 sequencing technique Methods 0.000 description 37
- 230000000875 corresponding effect Effects 0.000 description 28
- 230000001605 fetal effect Effects 0.000 description 21
- 210000001519 tissue Anatomy 0.000 description 21
- 230000008774 maternal effect Effects 0.000 description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 19
- 201000010099 disease Diseases 0.000 description 16
- 210000004369 blood Anatomy 0.000 description 15
- 239000008280 blood Substances 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 15
- 108020004414 DNA Proteins 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 230000037058 blood plasma level Effects 0.000 description 8
- 230000036541 health Effects 0.000 description 8
- 230000001575 pathological effect Effects 0.000 description 8
- 239000002299 complementary DNA Substances 0.000 description 7
- 238000003205 genotyping method Methods 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 210000005059 placental tissue Anatomy 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000007689 inspection Methods 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 206010068051 Chimerism Diseases 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000009602 intrauterine growth Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 3
- 108091007413 Extracellular RNA Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 238000010240 RT-PCR analysis Methods 0.000 description 3
- 210000004381 amniotic fluid Anatomy 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000007170 pathology Effects 0.000 description 3
- 230000036470 plasma concentration Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 230000009885 systemic effect Effects 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 208000032170 Congenital Abnormalities Diseases 0.000 description 2
- 102000012289 Corticotropin-Releasing Hormone Human genes 0.000 description 2
- 108010022152 Corticotropin-Releasing Hormone Proteins 0.000 description 2
- 239000000055 Corticotropin-Releasing Hormone Substances 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 206010055690 Foetal death Diseases 0.000 description 2
- 208000018478 Foetal disease Diseases 0.000 description 2
- 102100032611 Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Human genes 0.000 description 2
- 206010018910 Haemolysis Diseases 0.000 description 2
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 2
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 2
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 2
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 101001024425 Mus musculus Ig gamma-2A chain C region secreted form Proteins 0.000 description 2
- 206010030113 Oedema Diseases 0.000 description 2
- 101150078967 PAPPA gene Proteins 0.000 description 2
- 206010062936 Placenta Accreta Diseases 0.000 description 2
- 239000013614 RNA sample Substances 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 208000036878 aneuploidy Diseases 0.000 description 2
- 231100001075 aneuploidy Toxicity 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 210000004252 chorionic villi Anatomy 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 229940041967 corticotropin-releasing hormone Drugs 0.000 description 2
- KLVRDXBAMSPYKH-RKYZNNDCSA-N corticotropin-releasing hormone (human) Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(N)=O)[C@@H](C)CC)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO)[C@@H](C)CC)C(C)C)C(C)C)C1=CNC=N1 KLVRDXBAMSPYKH-RKYZNNDCSA-N 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000009274 differential gene expression Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000008588 hemolysis Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000010208 microarray analysis Methods 0.000 description 2
- 230000002969 morbid Effects 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 230000003169 placental effect Effects 0.000 description 2
- 238000003793 prenatal diagnosis Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 102100037426 17-beta-hydroxysteroid dehydrogenase type 1 Human genes 0.000 description 1
- KZMAWJRXKGLWGS-UHFFFAOYSA-N 2-chloro-n-[4-(4-methoxyphenyl)-1,3-thiazol-2-yl]-n-(3-methoxypropyl)acetamide Chemical compound S1C(N(C(=O)CCl)CCCOC)=NC(C=2C=CC(OC)=CC=2)=C1 KZMAWJRXKGLWGS-UHFFFAOYSA-N 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010067477 Cytogenetic abnormality Diseases 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010015150 Erythema Diseases 0.000 description 1
- 208000001362 Fetal Growth Retardation Diseases 0.000 description 1
- 206010070531 Foetal growth restriction Diseases 0.000 description 1
- 102000054184 GADD45 Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 102100035688 Guanylate-binding protein 1 Human genes 0.000 description 1
- 201000005624 HELLP Syndrome Diseases 0.000 description 1
- 101000806242 Homo sapiens 17-beta-hydroxysteroid dehydrogenase type 1 Proteins 0.000 description 1
- 101001066163 Homo sapiens Growth arrest and DNA damage-inducible protein GADD45 gamma Proteins 0.000 description 1
- 101001001336 Homo sapiens Guanylate-binding protein 1 Proteins 0.000 description 1
- 101000998020 Homo sapiens Keratin, type I cytoskeletal 18 Proteins 0.000 description 1
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 1
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 1
- 102100033421 Keratin, type I cytoskeletal 18 Human genes 0.000 description 1
- 208000005107 Premature Birth Diseases 0.000 description 1
- 108010044012 STAT1 Transcription Factor Proteins 0.000 description 1
- 102100029904 Signal transducer and activator of transcription 1-alpha/beta Human genes 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical class OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 206010052779 Transplant rejections Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 239000003181 biological factor Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000091 biomarker candidate Substances 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 241000902900 cellular organisms Species 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000001136 chorion Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical group OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- 208000002296 eclampsia Diseases 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 231100000321 erythema Toxicity 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000004578 fetal growth Effects 0.000 description 1
- 208000030941 fetal growth restriction Diseases 0.000 description 1
- -1 for example Proteins 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000012188 high-throughput screening assay Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 206010025135 lupus erythematosus Diseases 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 208000025934 placenta disease Diseases 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本发明为通过大规模平行RNA测序分析母亲血浆转录组,本发明提供了使用来自妊娠女性对象的样品用于诊断妊娠相关的病症、确定等位基因比、确定母亲或胎儿对于循环转录体的贡献,和/或鉴定母亲或胎儿标记物的方法。也提供了在妊娠女性对象中用于诊断妊娠相关的病症的基因的用途。
Description
相关申请的交叉引用
本申请要求2013年2月28日提交的题目为“通过大规模平行RNA测序分析母亲血浆转录组”的美国临时专利申请号61/770,985的优先权,为了所有的目的将其通过引用并入本文。
背景技术
已经报道了母亲血浆中妊娠特异性的细胞外RNA分子1。它们已经提供了通过简单地使用来自母亲的外周血液样品用于胎儿评估和妊娠监测的无创测试工具。迄今为止,已经使用母亲血浆RNA开发了许多有希望的产前诊断应用2-8。研究人员已经积极搜索另外的RNA标记物,以便在将应用延伸在不同的胎儿病症和妊娠病理学背景下。
理论上,最直接的RNA标记物鉴定方法是直接描述母亲血浆中的细胞外RNA分子。但是,该方法是不容易的,因为常规的高通量筛选技术,比如微阵列分析和基因表达的系列分析(SAGE),具有有限的能力检测通常低浓度的母亲血浆中部分降解的细胞外RNA9。而是,大部分报告的RNA标记物筛选策略通过比较胎盘和母亲血细胞的表达概况而间接操作10。仅仅表达在胎盘中比在母亲血细胞中表达更高的转录体进一步在母亲血浆样品中通过高灵敏度但是低通量技术,比如实时逆转录酶聚合酶链式反应(RT-PCR)研究。迄今,通过该间接方法鉴定的血浆RNA标记物相对有限。该可能因为基于组织的挖掘策略未充分考虑影响母亲血浆中胎盘RNA水平的所有的生物因素。另外,由非胎盘组织响应妊娠表达和释放的转录体可能不被该方法鉴定。所以非常期望允许直接概述母亲血浆转录组的灵敏和高通量方法。
类似地,直接血浆RNA概述可用于有来自两个个体的RNA分子的混合物的其他情形,比如用于器官移植。移植接受者的循环包含来自供体和接受者的核酸分子。由供体或接受者提供的RNA分子相关图谱的改变可揭示移植器官或接受者的病理学,比如移植排斥。
发明概述
提供方法、系统和装置用于诊断妊娠相关的病症,确定等位基因比,确定母亲或胎儿对循环转录体的贡献,和/或使用来自妊娠女性对象的样品鉴定母亲或胎儿标记物。在一些实施方式中,样品是包含源自母亲和胎儿的RNA分子的混合物的血液血浆。
分析(例如,测序)RNA分子,以获得多个读数,和鉴定参考序列中这些读数的位置(例如,通过序列比对)。信息型基因座鉴定为对于母亲或胎儿中的第一等位基因是纯合子,和对于母亲和胎儿中另一个的第一等位基因和第二等位基因是杂合子。然后过滤信息型基因座并且进一步分析位于(例如,对齐)过滤信息型基因座的读数。在一些实施方式中,计算对应第一等位基因和第二等位基因的读数的比例并且与截取值比较,以诊断妊娠相关的病症。在一些实施方式中,使用位于信息型母亲基因座的读数测定胎儿起源的样品中的一部分RNA。在一些实施方式中,计算个体过滤信息型基因座的对应第一等位基因和第二等位基因的读数的比例,并且比例与截取值比较,以指定基因座为母亲或胎儿标记物。
本发明不限于产前诊断并且可施用至包含源自两个个体的RNA分子混合物的任何生物样品。例如,可使用获得自器官移植接受者的血液血浆样品。移植器官中表达的转录体反映供体的基因型并且在接收者的血液中以可检测的水平出现。通过读取这些转录体,可鉴定在供体和接受者二者的基因中表达的信息型基因座,并且可测量来自每个个体的等位基因的相对表达水平。仅仅由于供体或接受者等位基因的异常表达水平可用于诊断移植相关的病症。
可用于本发明的生物样品包括血液、血浆、血清、尿、唾液和组织样品。例如,已经在妊娠女性的尿中检测到胎儿核酸。肾移植接受者的尿已经显示包含无细胞核酸和来自移植器官的细胞。在许多情况下已经观察到微嵌合。微嵌合指身体中存在来自另一人的细胞或核酸来源,包括具体个体的器官和组织。在甲状腺、肝、脾、皮肤、骨髓和其他组织的活组织检查中已经观察到微嵌合。微嵌合可由于之前的妊娠或输血而出现。
也提供了基因用于诊断妊娠女性对象中妊娠相关的病症的用途。基因的表达水平与从每个孕育健康胎儿的一个或多个其他女性对象确定的对照值比较。本文解决的妊娠相关的病症包括先兆子痫、宫内生长限制、侵入性胎盘形成和早产。其他妊娠相关的病症可以是使胎儿处在胎儿死亡风险的病况,比如新生儿的溶血病、胎盘功能不足、胎儿水肿、胎儿畸形。仍其他妊娠相关的疾病可以是妊娠期间导致并发症的病况,比如母亲的HELLP综合症、系统性红斑狼疮和其他免疫疾病。
附图说明
图1显示血浆中的等位基因比B/A与各自基因的相对表达水平之间的。
图2显示总基因表达水平与基因的相对表达水平之间的关系。
图3是诊断妊娠相关病症的方法的流程图。
图4和5显示RNA-seq读取比对结果的总结。
图6显示来自测序两个个体的血液血浆RNA的数据。图6A显示从M9356P的RNA-seq文库(用Ribo-Zero Gold预处理)和M9415P(不用Ribo-Zero Gold预处理)测序读数的GC%分布。图6B显示M9356P和M9415P之间基因表达概况的相关性。
图7显示母亲血浆中不同RNA转录体的RNA-SNP等位基因比和总血浆浓度,针对相对组织表达水平(胎盘/血细胞)绘图。
图8显示包含信息型SNP的不同基因的RNA-SNP等位基因比和总血浆水平,针对相对组织表达水平(血细胞/胎盘)绘图。
图9显示母亲血浆中胎儿特异性SNP等位基因的RNA-SNP等位基因比和包含这些等位基因的RNA转录体的表达水平。
图10显示母亲血浆中母亲特异性SNP等位基因的RNA-SNP等位基因比和包含这些等位基因的RNA转录体的表达水平。
图11显示先兆子痫和对照对象中母亲特异性SNP等位基因的数据。图11A显示病例5641(第三个三个月晚发型先兆子痫)和病例7171(对照)对包括母亲特异性SNP等位基因的信息型SNP的RNA-SNP等位基因比。图11B显示病例5641相对于7171(对照)的那些就包括母亲特异性SNP等位基因的信息型SNP的RNA-SNP等位基因比和血浆水平的倍数差异。
图12显示先兆子痫和对照对象中母亲特异性SNP等位基因的数据。图12A显示病例5641(第三个三个月晚发型先兆子痫)和病例9356(对照)的包括母亲特异性SNP等位基因的信息型SNP的RNA-SNP等位基因比。图12B显示RNA-SNP等位基因比和病例5641血浆水平相对于9356的那些,包括母亲特异性SNP等位基因的信息型SNP的倍数差异。
图13显示图11表格形式的数据。
图14显示图12表格形式的数据。
图15是在来自女性对象孕育胎儿的样品中确定胎儿起源的一部分RNA的方法的流程图。
图16显示母亲血浆转录组的信息型SNP分析的结果。
图17显示晚期妊娠的母亲血浆样品中没有过滤等位基因特异性表达的相对胎儿和母亲贡献。
图18显示母亲血浆转录组中的胎儿和母亲贡献。图18A显示早期妊娠和晚期妊娠的母亲血浆中源自胎儿和母亲的转录体的比例。图18B显示分娩之前和之后等位基因计数和胎儿等位基因比。
图19比较在一个RNA-SNP对于先兆子痫病例和对照妊娠病例的部分胎儿和母亲贡献。
图20是将基因组基因座指定为母亲或胎儿标记物的方法的流程图。
图21是妊娠相关的基因的列表。
图22显示与分娩前相比,分娩后对象中更低表达水平的妊娠相关的基因。
图23显示使用131个妊娠相关的基因,血浆样品的分级聚类。
图24显示胎盘、母亲血细胞和母亲血浆中131个妊娠相关的基因的表达水平。图24A是两个晚期妊娠病例的胎盘和母亲血细胞以及分娩前和分娩后母亲血浆的基因表达的热图(log2(转录体水平))。131个妊娠相关的基因优选在胎盘中表达。图24B显示胎盘和血浆中131个基因的表达水平正相关(P<0.05,Spearman相关性)。
图25比较胎儿和母亲对于用基于血浆和基于组织的方法鉴定的基因在血浆中RNA的贡献。
图26列举了母亲血浆中98个先兆子痫相关的RNA,如通过RNA-Seq鉴定。显示了从无并发症妊娠女性和已经发展先兆子痫的女人收集的血浆中的表达水平。
图27显示对于病例9415,PAPPARNA中单核苷酸多态性(SNP)位点的RNA-测序读数计数。等位基因-A是共享等位基因和等位基因-G是胎儿特异性等位基因。
图28显示对于病例9415,H19RNA中单核苷酸多态性(SNP)位点的RNA-测序读数计数。
图29显示通过甲基化敏感的限制酶酶切检测母亲H19甲基化状态。
图30显示用于根据本发明的实施方式的系统和方法的示例性计算机系统3000的方块图。
发明详述
I.介绍
十年前已经报道了母亲血浆中存在无细胞胎儿RNA11。该发现之后,开始进行许多研究,以检测母亲血浆中胎儿和胎盘起源的循环RNA1,10,12。有趣地,发现血浆中胎盘特异性转录体的表达水平与胎盘组织中的那些正相关10,强调了血浆RNA分析作为无创工具的临床用途,以监测胎盘或胎儿健康和发育。的确,母亲循环RNA的检查已经发现临床用于妊娠相关的或胎盘相关的病症,比如先兆子痫2,13-15,宫内生长迟缓4和早产8,以及用于无创测试胎儿染色体非整倍性5,7,16。这样的开发突出了RNA生物标记用于分子评估产前病症的潜在用途。
尽管血浆RNA分析在产前测试中有希望的展望,迄今母亲血浆中充分验证的妊娠相关的或胎盘相关的转录体的数量仍有限。在这点上,使用逆转录酶(RT)-PCR进行血浆中RNA生物标记的检查1,4,8,10,12,13,其是每次分析通常靶向相对少量RNA种类的灵敏方法。重要地,这些研究主要关注在妊娠相关的基因主要源自胎盘的前提下,与母亲血细胞相比,胎盘中具有相对高表达水平的基因。这样的方法已经鉴定了胎盘中高表达的妊娠相关的RNA靶,但是可能错过其他重要的靶。此外,考虑血浆RNA的低浓度和差的完整性9,15,常规的高通量方法比如基因表达的系列分析和微阵列分析可能对于直接检查血浆转录组不够刚健。
通过RNA分析的大规模平行测序(MPS),即RNA-测序(RNA-seq),可潜在解决血浆RNA分析的前述技术局限17,18。考虑改善的灵敏度和宽的动态范围,RNA-seq已经用于检查许多人组织,包括胎盘中的基因表达19。通过其在直接概述健康的个体20和妊娠女性21,22中血浆miRNA的可行性进一步表明了MPS的优势。然而,血浆转录组的完整图谱仍不清楚,其可能由于血浆中与短miRNA相比长RNA种类更低的稳定性23。
在该研究中,我们已经显示可在母亲血浆中检测源自胎儿和母亲的转录体并且可使用RNA-seq,通过检查胎儿特异性和母亲特异性单核苷酸多态性(SNP)评估它们的相对贡献。另外,可监测母亲血浆中胎盘的等位基因特异性表达模式。我们也已经表明可通过直接检查分娩之前和之后母亲血浆鉴定妊娠相关的转录体。
II.使用SNP等位基因比诊断妊娠相关的病症的方法
基因表达概况的分析用于检测个体的疾病状态。本发明的实施方式包括通过分析来自两个不同个体的RNA分子的混合物分析个体表达概况的方法。方法使用一个个体特异的等位基因和两个个体之间共享的等位基因的相对丰度。基于共享的和个体特异性等位基因的相对丰度,可测定两个个体的基因表达概况。本发明一种可能的应用是通过分析包含来自胎儿和妊娠女性二者的RNA的母亲血浆样品中的RNA,分析胎儿基因表达概况。另一应用是从移植接受者收集的包含来自供体和接受者二者的RNA的血浆样品中源自供体的RNA的基因表达概况的分析。
在包含来自两个个体的RNA的混合物中,每个个体的表达概况不能基于混合物中不同RNA转录体的总量分析而确定,因为难以确定每个个体对总RNA的相对贡献。不同RNA转录体的相对丰度可用于监测个体的健康或检测疾病状态。
在该方法中,可首先通过个体的直接基因分型或通过家族分析来确定两个个体的基因型。例如,如果父母具有基因型AA和TT,那么胎儿的基因型应是AT。
下述假设的例子图解了该方法的原理。对于每个感兴趣的的基因,编码区域中存在SNP,从而在不同基因的RNA转录体中可观察多态性。假设胎儿和妊娠女性的基因型分别是AB和AA。因此,B等位基因对于胎儿是特异性的和A等位基因是胎儿和母亲之间共享的。胎盘和母亲血细胞中不同基因的相对表达水平如表1中所显示。
在该例子中,我们假设胎盘和母亲血细胞为母亲血浆贡献相对相等比例的每个它们RNA转录体的2%。换句话说,如果基因的胎盘表达水平是10000,其将为母亲血浆贡献200个该基因的RNA转录体。如图1中所显示,等位基因比B/A显示与胎盘和母亲血细胞中各自基因的相对表达水平的良好正关系。相反,总基因表达水平受母亲血细胞的表达波动的影响,并且因此与胎盘的表达较不相关(图2)。
表1
使用等位基因比分析的另一优势是胎盘中具体基因的表达水平与母亲血细胞的表达水平归一化。因为遍及不同的基因和不同的样品表达水平可能非常不同,该归一化使得更稳健比较不同的基因并且避免必须与参考基因,例如,管家基因比较。换句话说,在常规的基因表达分析中,参考管家基因测量样品中基因的表达水平或作为样品的总RNA的量。常规上,为了鉴定异常基因表达,人们接着比较测试样品与对照样品的那些相对值。
这里我们提出了新的方法,由此我们使用归一化至母亲相同基因的贡献的胎儿贡献的相对量作为一种方式,以确定基因表达概况。在病理学状态下,例如先兆子痫、早产、母亲疾病比如系统性红斑狼疮,由此胎盘或母亲器官中基因的表达的被改变,该基因的胎儿与母亲比例当与没有这样的病理学病况的妊娠比较时而改变。该方法可使用母亲血浆中胎儿特异性SNP等位基因相对于RNA转录体中共享的等位基因而实施。
方法可也使用母亲血浆中母亲特异性SNP等位基因相对于RNA转录体中的共享等位基因而实施。当与对于非病理学状态预期的比较,对于一个或多个RNA基因转录体的一个或多个这样的等位基因比改变时,可鉴定病理学病况。遍及基因基因座或多个基因基因座的这样的等位基因比的模式可用于鉴定病理学状态。非病理学状态可由正常妊娠的等位基因比表示,在当妊娠不受病理学状态影响测试之前或之后获得的样品的等位基因比表示或来自先前获得自正常妊娠的现有数据,即源自先前参考范围的等位基因比。
可使用本方法诊断的妊娠相关的病症包括特征在于母亲和胎儿组织中基因异常相对表达水平的任何病症。这些病症包括但不限于先兆子痫、宫内生长限制、侵入性胎盘形成、早产、新生儿的溶血病、胎盘功能不足、胎儿水肿、胎儿畸形、HELLP综合症、系统性红斑狼疮,和母亲的其他免疫学疾病。方法区分包含这样分子混合物的样品中母亲和胎儿贡献的RNA分子。方法可因此鉴定在具体的基因座或对于具体基因,来自一个个体(即,母亲或胎儿)对混合物贡献的改变,即使来自另一个体的贡献不改变或超相反的方向改变。当测量总体基因的表达水平而不考虑起源的组织或个体,这样的改变不能容易检测。妊娠相关的病症,如本文所讨论,不是特征在于胎儿的染色体异常,例如非整倍性。
可也进行本发明而不需要胎盘之前的基因分型信息。例如,可通过对妊娠女性的血细胞直接基因分型而测定她的基因型。然后,可分析血浆样品的RNA转录体,例如但不限于大规模平行测序。可鉴定显示两个不同等位基因的RNA转录体。在该组转录体中,如果母亲是纯合子,其指示对于胎儿特异性等位基因和母亲等位基因,胎儿是杂合子。在该情况下,可进行RNA等位基因比分析,而不需要胎儿(或胎盘)之前的基因型信息。另外,可通过偏离1:1比例,而鉴定母亲是杂合子但是胎儿是纯合子的情况。这种技术的进一步的细节描述在美国专利8,467,976中。
A.诊断方法
根据一些实施方式用于诊断妊娠相关的病症的方法300显示在图3中。方法使用来自孕育胎儿的女性对象的样品。样品可以是母亲血液血浆的并且包含源自母亲和胎儿的RNA分子的混合物。如期望,样品可获得自处在妊娠任何阶段的女性对象。例如,具有单胎妊娠的第一个、第二个和第三个三个月妊娠女性可用作对象。第一个和第二个三个月妊娠女性可归类为“早期妊娠病例”和第三个三个月妊娠女性可归类为“晚期妊娠病例”。在一些实施方式中,可也在胎儿分娩之后收集样品,或从相同对象分娩之前和之后收集,并且来自非妊娠女性的样品可用作对照。可在分娩之后的任何时间获得样品(例如,24小时)。
样品可获得自外周血液。可根据期望,处理母亲血液样品,例如通过离心从血浆分离血细胞。可添加稳定剂血液样品或其部分,并且可在使用之前储存样品。在一些实施方式中,也获得胎儿组织的样品,例如绒膜绒毛、羊水或胎盘组织。胎儿组织可用于确定胎儿基因型,如下所讨论。可在分娩之前或之后获得胎儿组织。
一旦获得样品,可然后从母亲血细胞和血浆,以及从任何胎儿组织,比如胎盘的样品提取RNA或DNA。可预处理胎盘和血细胞RNA样品,比如用Ribo-Zero Gold试剂盒(Epicentre),以去除核糖体RNA(rRNA)然后对文库制品测序。
在方法的步骤301中,接收多个读数。读数获得自样品的RNA分子的分析。在各种实施方式中,可通过测序、数字PCR、RT-PCR和质谱获得读数。尽管讨论集中在测序,但是说明书的方面也适用于获得读数的其他技术。例如,数字PCR(包括微流体和液滴PCR)可提供使用引导至每个等位基因的探针(包括引物)在具体基因座的不同等位基因的情况。探针可携带标签,以使得它们彼此区分开,例如通过展示不同的颜色。在相同的实验或不同的实验中(例如,在分开的载玻片或芯片上),具有不同标签的探针可引导至不同的基因座。标签的检测反映扩增的RNA或cDNA分子的存在和/或数量标签相当于RNA或cDNA分子的读数,其中这样的读数提供关于RNA或cDNA分子在对应探针基因座的序列的信息。关于“序列读数”的描述同样适用于经任何适当的技术,包括非测序技术获得的读数。
可根据需要使用任何可用的技术进行测序。核酸测序技术和方法的例子包括大规模平行测序、下一代测序、全基因组测序、外显子组测序、有或没有靶标富集的测序、通过合成的测序(例如,通过扩增的测序,克隆扩增、桥扩增、用可逆终止子的测序)、通过连接的测序、通过杂交的测序(例如,微阵列测序)、单分子测序、实时测序、纳米探针测序、焦磷酸测序、半导体测序、根据质谱法的测序、鸟枪测序和Sanger测序。在一些实施方式中,使用大规模平行技术对来自样品中RNA的cDNA文库制剂上进行测序。可根据需要合成cDNA文库,例如使用mRNA-Seq样品制备试剂盒(Illumina),根据制造商的指导或稍微改良。在一些实施方式中,5倍稀释Klenow DNA聚合酶用于血浆cDNA的末端修补步骤。QIAquickPCR纯化试剂盒和QIAquickMinElute试剂盒(Qiagen)可分别用于纯化末端修补的和腺甘酸化的产物。在一些实施方式中,10倍稀释配对末端适配体用于血浆cDNA样品,或对适配连接的产物使用AMPure XP beads(Agencourt)进行两轮纯化。可对于75bp以配对末端格式在HiSeq 2000工具(Illumina)上,或使用其他格式或工具,对cDNA文库测序。
在步骤302中,确定参考序列中读数的位置。对于基于PCR的技术,可例如通过匹配序列的探针或引物上对探针或引物特异的检测标签的颜色测定位置。对于测序技术,通过比对序列读数与参考序列,可测定位置。可通过计算机系统进行序列比对。任何生物信息学流程可用于原始数据预处理(比如去除高度重复的读数和低质量的读数)、数据比对和/或数据归一化。可将母亲血细胞、胎盘组织和母亲血浆中的RNA转录体水平计算为每千碱基每百万分之一外显子读数(FPKM)的片段数。为了确定等位基因比,可进行数据预处理和比对但是不需要数据归一化。任何参考序列(例如,hg19参考人基因组)和任何算法可用于比对。
在进行步骤301和302的一个例子中,去除重复的读数和rRNA读数之后,为每个非妊娠女性血浆样品获得平均3百万可分析的读数;为妊娠女性的每个血浆样品获得平均1200万可分析的读数。为了组织RNA-seq,对于胎盘和血细胞分别获得每个样品平均17300万和4100万可分析的读数。RNA-seq比对统计总结在图4和5中。也在所有样品中检查了测序读数的GC含量(图6A和表2)。
表2 RNA-seq文库中富GC测序读数的比例。
a.通过BLAST(NCBI)将原始读数与从头组装的富GC序列
比对
在步骤303中,鉴定了一个或多个信息型基因座。该步骤可确定或推断女性对象和胎儿基因组中基因座的基因型,并且比较这些基因型。如果基因座在相应第一等位基因的第一实体中是纯合子(例如,AA),并且在相应的第一等位基因和相应的第二等位基因的第二实体中是杂合子(例如,AB),认为基因座是信息型的。第一实体可以是妊娠女性对象或胎儿,和第二实体是妊娠女性对象和胎儿中另一个。换句话说,对于每个信息型基因座,一个个体(母亲或胎儿)是纯合子,和另一个个体是杂合子。
可根据哪个个体是杂合子和一个等位基因的唯一贡献者进一步分类信息型基因座。如果胎儿是纯合子并且妊娠女性对象是杂合子,则认为基因座是信息型母亲基因座,或相当于母亲特异性基因座。如果妊娠女性对象是纯合子并且胎儿是杂合子,则认为基因座是信息型胎儿基因座,或相当于胎儿特异性基因座。在步骤303中,鉴定的信息型基因座都是母亲特异性或胎儿特异性的,因为相同个体用作所有这些基因组的第二实体。
信息型基因座可表示单核苷酸多态性或“SNP”,其中第一等位基因和第二等位基因的单个核苷酸的身份同一性不同。信息型基因座可也表示短插入或缺失,其中与另一等位基因比较,一个等位基因中插入或缺失一个或多个核苷。
在一些实施方式中,通过对获得自母亲组织的基因组DNA测序,测定妊娠女性对象在一个或多个信息型基因座,或在每个信息型基因座的基因型。母亲组织可以是母亲血细胞或任何其他类型的组织。在一些实施方式中,通过对获得自胎儿组织,比如胎盘,绒膜绒毛,羊水的基因组DNA测序,测定胎儿在一个或多个信息型基因座,或在每个信息型基因座的基因型。如果较不侵入性方法是优选的,可也从母亲血液样品获得胎儿DNA用于测序。用于获得用于测序的RNA分子的相同的样品可以是这样的胎儿DNA的来源,或可使用不同的样品。认识到可鉴定信息型胎儿基因座而不必对胎儿直接基因分型。例如,如果测定妊娠女性对象对于在一个基因座的第一等位基因是纯合子,并且RNA测序指示在母亲和胎儿RNA的混合物中存在第二等位基因,那么可认为胎儿在该基因座是杂合子。
在一些实施方式中,母亲和胎儿都使用大规模平行方法基因分型,以鉴定信息型基因座。可对富含外显子组的母亲血细胞和胎盘基因组DNA样品进行测序。可分别使用QIAamp DN试剂盒和QIAamp血液试剂盒(都来自Qiagen)按照制造商的指导,从胎盘组织和母亲血细胞提取基因组DNA。外显子组富集和测序文库制备可使用TruSeqExome富集试剂盒(Illumina)按照制造商的方案进行。可在HiSeq 2000工具(Illumina)上,以PE格式对文库75bp测序。
在步骤304,过滤一个或多个信息型基因座。如本文所使用,“过滤”意思是从步骤303中鉴定的那些选择某些信息型基因座,用于进一步分析。“过滤的”信息型基因座是这样选择的基因座。可基于一个或多个标准进行选择。一种这样的标准是信息型基因座位于基因组或参考序列上的什么位置。在一些实施方式中,仅仅进一步分析位于参考序列的外显子或表达区域中的基因组。
过滤的另一标准是步骤301中所有接收的并且与步骤302中参考序列对齐的那些序列读数的数量,其与基因座比对并且包含每个等位基因。在一些实施方式中,过滤的信息型基因座必须与其相关,至少第一预定数量的序列读数包含第一等位基因,和/或第二预定数量的序列读数包含第二等位基因。预定的数量可以1、2或更多,并且可对应期望的读取质量或测序深度。作为结果,鉴定了一个或多个过滤的信息型基因座。
在一些实施方式中,仅仅为表示SNP的信息型基因座考虑过滤。在方法的一个例子中,检查了NCBIdbSNP Build 135数据库中都位于外显子中的约一百万SNP,并且使用母亲和胎儿基因型从这些百万位点中鉴定出了信息型SNP。为了图解信息型SNP,“A”指定为共享等位基因和“B”指定为母亲特异性或胎儿特异性等位基因。信息型SNP包括具有母亲特异性SNP等位基因的那些,即给定基因座上胎儿中的“AA”和母亲中的“AB”,和具有胎儿特异性SNP等位基因的那些,即给定基因座上母亲中的“AA”和胎儿中的“AB”。使用内部生物信息学流程访问基因型。为了进行过滤,仅仅包括其中“A”等位基因和“B”等位基因分别显示至少一个读取数量的信息型SNP用于分析。
在步骤305和306中,计数与每个过滤的信息型基因座对齐的序列读数并且保存,这取决于它们包含哪个等位基因。对于每个过滤的信息型基因座,测定两个数量:第一数量,其与基因座对齐并且包含相应的第一等位基因(即,共享等位基因)的序列读数的数量;和第二数量,其是与基因座对齐并且包含相应的第二等位基因(即,母亲特异性或胎儿特异性等位基因)的序列读数的数量。可根据需要计算第一数量和第二数量。每个基因座的第一数量加第二数量提供与基因座对齐的序列读数的总数。对于过滤信息型基因座的第一数量和第二数量的比例可称为“等位基因比”。
在步骤307和308中,第一等位基因和第二等位基因的数量是全部过滤的信息型基因座的加和。在步骤307中,计算第一数量的第一和。第一和表示对于过滤信息型基因座,包含相应的第一等位基因(即,共享等位基因)的序列读数的总数。在步骤308中,计算第二数量的第二和。第二和表示对于过滤的信息型基因座,包含相应的第二等位基因(即,母亲特异性或胎儿特异性等位基因)的序列读数的总数。可根据需要,使用步骤304中鉴定的所有过滤的信息型基因座或其子集计算和。在一些实施方式中,和被加权。例如,对来自某一染色体的位点的总和的贡献可通过用标量乘以那些基因组的第一数量和第二数量放大或缩小。
在步骤309中,计算第一和与第二和的比例。该比例表示遍及过滤的信息型基因座汇总的对于第一等位基因和第二等位基因的序列读数的相对数量。在一些实施方式中,比例简单地计算为第一和除以第二和。这样的计算产生共享等位基因的序列读数的数量作为母亲特异性或胎儿特异性等位基因的多个序列读数。可选地,比例可计算为第二和除以第一和及第二和之和。这里,该比例提供对于母亲特异性或胎儿特异性等位基因作为所有序列读数的一部分的序列读数的数量。计算该比例的其他方法对于技术人员是显而易见的。滤信从第一和和第二和计算比例可用作样品中存在的起源于共享和特异性等位基因的RNA(即,转录体)量的代表。
在步骤310中,步骤309中计算的比例与截取值比较,以确定胎儿、母亲或妊娠是否具有妊娠相关的病症。在各种实施方式中,截取值可从获得自没有妊娠相关的病症的妊娠女性对象(即,对照对象)的一个或多个样品测定和/或从获得自具有妊娠相关病症的妊娠女性对象的一个或多个样品测定。在一些实施方式中,通过对来自对照对象的样品进行如上述相同方法,并且检查过滤信息型基因座的相同或重叠集合测定截取值。截取值可设置在没有病症的妊娠的预期值和具有病症的妊娠的预期值之间的值。截取值可基于来自正常值的统计差异。
在一些实施方式中,为妊娠女性对象计算的比例(如在步骤309中)使用某些组基因中的过滤信息型基因座,并且为对照对象使用过滤信息型基因座在一些或所有相同的基因中计算比例(即截取值)。如果为妊娠女性对象计算的比例是基于母亲特异性等位基因,那么为对照对象计算的截取值可也基于母亲特异性等位基因。类似地,比例和截取值可都基于胎儿特异性等位基因。
可根据需要进行比例和截取值之间的比较。例如,如果比例超过截取值或落在截取值之下任何数量或某些量,可诊断病症。比较可涉及计算差异或计算妊娠女性对象的比例和截取值的另一比例。在一些实施方式中,比较涉及评估某些基因的共享和非共享等位基因的相对表达水平在妊娠女性对象和对照对象之间是否差异明显。
如果期望,方法可也用于评估是母亲或胎儿起源的样品中的一部分RNA。通过标量乘以步骤309中计算的比例进行评估。标量表示在过滤信息型基因座相对于杂合子个体中第二等位基因的表达的总表达水平。
下述例子阐释标量的应用。如果在方法中计数的第二等位基因是胎儿特异性的,那么步骤309中计算的比例可提供胎儿特异性等位基因的序列读数的数量作为过滤信息型基因座的所有序列读数的一部分。包含共享等位基因的序列读数中,一些由母亲贡献并且一些由胎儿贡献。如果胎儿中胎儿特异性和共享等位基因的相对表达水平是已知的,或可评估,那么可测量比例,以获得评估对过滤信息型基因座的所有序列读数的部分胎儿贡献。
在一些实施方式中,在大部分基因组,胎儿和共享等位基因对称表达并且标量认为是约二。在其他实施方式中,标量偏离二并且考虑非对称基因表达24。序列读数的部分母亲贡献接着一减去部分胎儿贡献。当在过滤信息型基因座的第二等位基因是母亲特异性时,可进行类似的计算。
B.实施例:
1.等位基因比和血浆浓度的相关性
分析母亲血浆样品(孕龄37 2/7)的表达谱并且与妊娠女性相应的胎盘和母亲血细胞比较。为这些样品的每个,使用IlluminaHiSeq2000工具进行RNA的大规模平行测序。使用外显子组测序通过大规模平行测序对胎盘和母亲血细胞基因分型。我们检查了NCBIdbSNP Build 135数据库中的约一百万个位于外显子中的SNP,并且对其中母亲是纯合子(基因型AA)和胎儿是杂合子(基因型AB)的信息型SNP分类。因此,A等位基因是母亲和胎儿之间共享的等位基因并且B等位基因是胎儿特异性的。
针对相关组织表达水平对母亲血浆中RNA-SNP等位基因比和不同RNA转录体的总血浆浓度绘图(胎盘/血细胞)(图7)。我们可观察到血浆中的RNA-SNP等位基因比与相关组织表达水平正相关(Spearman R=0.9731679,P=1.126e-09)。但是,总血浆水平与组织表达不相关(Spearman R=-0.7285714,P=0.002927)。
除了分析胎儿表达,该方法可也用于概述母亲表达。在该情况下,可使用母亲是杂合子(基因型AB)和胎儿是纯合子(基因型AA)的信息型SNP。RNA-SNP等位基因比可然后计算为母亲特异性等位基因计数除以共享等位基因的计数。在图8中,针对相关组织表达水平(血细胞/胎盘),对RNA-SNP等位基因比和包含信息型SNP的不同基因的总血浆水平绘图。我们可观察到母亲血浆中组织表达水平与RNA-SNP等位基因比的良好正关系(Spearman R=0.9386,P<2.2e-16),而不是总血浆转录体水平(Spearman R=0.0574,P=0.7431)。
RNA转录体,它们的RNA-SNP等位基因比和它们的血浆水平列表在图9和图10中。
2.先兆子痫和对照妊娠病例的母亲血浆RNA-SNP等位基因比的比较
对于两个妊娠女性对象的情况,获得平均117,901,334个原始片段(表3A)。在第三个三个月晚发型先兆子痫(PET)比例,5641,和其孕龄匹配的对照病例,7171之间比较携带母亲特异性SNP等位基因的循环转录体子集的RNA-SNP等位基因比。如图11A中所显示,这些转录体的RNA-SNP等位基因比在PET和对照病例中描绘了不同的概况。重要地,RNA-SNP等位基因比概况与血浆转录体水平的概况不同,如图11B中所显示。这提示母亲血浆RNA-SNP等位基因比分析可用作另一度量标准,以更好区分PET病例与正常妊娠病例。随着信息型SNP的数量增加信息转录体的数量可进一步增加,例如PET病例,5641,和另一正常妊娠对照病例,9356之间的比较(图12A和12B)。图11和图12显示的RNA-SNP等位基因比和血浆的水平RNA转录体分别列表在图13和图14中。
表3A:RNA-seq读数比对结果的总结。
a.去除高度重复的读数之后保留的读数。
b.原始读数的%。
c.对于详细分类见补充数据表2B。
d.预处理的读数的%。
表3B:RNA-seq读数比对结果的总结
a.过滤的读数主要是细胞核和线粒体rRNAs和tRNAs。
b.可分析的读数=总的可定位读数–过滤的读数。
c.与参考基因的外显子和内含子外部区域对齐的读数的%。
III.确定胎儿或母亲RNA贡献的方法
A.方法
显示在图15中的方法1500用于确定来自孕育胎儿的女性对象的样品中是胎儿起源的一部分RNA。可如上为方法300所讨论获得和制备样品。
在步骤1501中,接收多个序列读数。在步骤1502中,序列读数与参考序列对齐。可如上为步骤301和302所描述进行这些步骤。
在步骤1503中,鉴定一个或多个信息型母亲基因座。每个信息型母亲基因座在胎儿中对于第一等位基因是纯合子和在妊娠女性对象中对于相应的第一等位基因和相应的第二等位基因是杂合子。第一等位基因因此在母亲和胎儿之间是共享的,并且第二等位基因是母亲特异性的。可如上面为步骤303所描述鉴定信息型母亲基因座。
在步骤1504中,如步骤304中过滤的信息型母亲基因座,并且坚定一个或多个过滤的信息型母亲基因座。然后,在步骤1505-1511中,在个体过滤的信息型母亲基因座的水平上操作序列读数。在步骤1505和1506中,为每个过滤的信息型母亲基因座确定第一数量和第二数量。在步骤1505中测定第一数量,其作为与基因座对齐并且包含相应的第一等位基因的序列读数的数量。在步骤1506中测定第二数量,其作为与基因座对齐并且包含相应的第二等位基因的序列读数的数量。可与上面讨论的步骤305和306类似地进行步骤1505和1506。
在步骤1507中,为每个信息型母亲基因座计算第一数量和第二数量的和。和可等于与基因座对齐的序列读数的总数。在步骤1508中,用和除以第二数量计算母亲比例。母亲比例提供与具体的包含第二(母亲特异性)等位基因的基因座对齐的所有序列读数的分数。
在步骤1509中,测定标量。标量表示妊娠女性对象中在过滤的信息型母亲基因座相对于相应的第二等位基因表达的总表达水平。在一些实施方式中,妊娠女性对象中两个等位基因的表达已知或假设是对称的情况下,标量是约二。在其他实施方式中,标量可偏离二并且考虑不对称的基因表达。因为大部分基因座对称表达,对称性的假设是有效的。
在步骤1510中,母亲比例乘以标量,以获得母亲贡献。母亲贡献表示,在过滤的信息型母亲基因座处,母亲贡献的序列读数部分(或,通延伸,样品中RNA部分)。一减去母亲贡献是胎儿贡献,或胎儿贡献的序列读数部分。在步骤1511中,为过滤的信息型母亲基因座计算胎儿贡献。
在步骤1512中,测定胎儿起源的样品中RNA部分。该部分是对于过滤的信息型母亲基因座的胎儿贡献的平均数。在一些实施方式中,该平均数加权,例如通过为过滤的信息型母亲基因座计算的和。通过计算加权的平均数,在步骤1512中测定部分可反映样品中不同基因座或基因的相对表达水平。
可为获得测序数据的一个过滤的信息型母亲基因座,许多这样的基因座,或所有这样的基因座计算胎儿起源的样品中RNA部分。认识到该部分反映具体的妊娠女性对象中在获取样品时的循环转录组。如果样品在妊娠过程的不同时间获得自对象,方法1500中鉴定的过滤的信息型母亲基因座的一个样品与下一个样品不同,因为在这些基因座胎儿起源的RNA的部分可能不同。样品中胎儿起源的RNA部分可也与接下来的一个对象不同,即使当控制妊娠阶段或其他因素时,并且可在具有妊娠相关的病症的对象和健康的对象之间不同。因此,可比较该部分与截取值,以诊断这样的病症。
在一些实施方式中,通过使用来自一个或多个健康对象的样品进行方法1500测定截取值。在一些实施方式中,如果该部分超过截取值或落在截取值之下任何量或某些量,则作出诊断。比较可涉及计算差异或计算妊娠女性对象中胎儿起源的RNA部分和截取值之间的比例。在一些实施方式中,比较涉及评估妊娠女性对象中胎儿起源的RNA部分与健康的妊娠女性中在类似的妊娠时间看到的是否显著不同。
可也通过检查信息型胎儿基因座测定胎儿起源的样品中RNA部分。在每个信息型胎儿基因座处,可通过首先计算胎儿比例评估该部分,所述胎儿比例是包含第二(胎儿特异性)等位基因的序列读数的数量除以序列读数的总数。胎儿贡献接着是胎儿比例乘以表示胎儿中两个等位基因相对表达水平的标量。因此,可通过鉴定信息型胎儿基因座、过滤这些基因组、计算每个过滤基因座的胎儿贡献,和使过滤基因座的胎儿贡献平均,进行方法1500的变型。如果期望,通过方法1500测定胎儿起源的RNA部分可通过用为过滤的信息型胎儿基因座计算的胎儿贡献平均为过滤的信息型母亲基因座计算的胎儿贡献而增加。这里计算的平均数可被加权,以反映在不同基因座的序列读数的数量的变化,以给予母亲特异性或胎儿特异性基因组,或以其他方式根据需要更多的权重。
B.实施例
1.鉴定和评估母亲血浆中源自胎儿和母亲的转录体
首先基于基因分型数据鉴定定义为具有至少一个信息型SNP的基因的信息基因。在两个早期妊娠病例中,6,714和6,753个信息基因的总数可分别用于检查胎儿和母亲贡献的相对比例(图16和17)。在两个晚期妊娠病例中,7,788和7,761个信息基因的总数可分别用于检查胎儿和母亲贡献的相对比例。为了测量母亲血浆中胎儿贡献的相对比例,我们为RNA转录体分类,其中通过母亲血浆样品中的至少一种RNA-seq读数覆盖胎儿特异性等位基因。这样胎儿起源的转录体的相对比例早期妊娠和晚期妊娠期间分别是3.70%和11.28%。使用类似的方法,使用母亲特异性SNP等位基因检查的循环中母亲贡献的相对比例评估为在早期妊娠和晚期妊娠期间分别是76.90%和78.32%(图18A)。
2.为PET和对照妊娠病例比较RNA-SNP部分胎儿和母亲贡献
我们已经检查了对于GNAS转录体,部分胎儿和母亲贡献,其是在PET比例,5641,和其孕龄匹配的对照病例,7171中检测。在GNAS转录体中,在病例5641中有在基因座rs7121包括胎儿特异性SNP等位基因的信息型SNP位点;在病例7171中相同SNP位点,有母亲特异性SNP等位基因。病例5641中该SNP位点的部分胎儿和母亲贡献分别计算为0.09和0.91。另一方面,对于病例7171中相同SNP位点部分胎儿和母亲贡献分别是0.08和0.92(图19)。与对照病例7171比较,部分胎儿贡献有12.5%增加和该转录体中部分母亲贡献有1.09%的下降。有趣地,与7171比较,在病例5641中,为该转录体检测到FPKM的21%增加。
IV.指定基因组基因座为母亲或胎儿标记物的方法
A.方法
指定基因组基因座为母亲或胎儿标记物的方法2000显示在图20中。方法涉及分析来自孕育胎儿的女性对象的样品。样品可以是母亲血液血浆的并且包含源自母亲和胎儿的RNA分子的混合物。可如上面为方法300所讨论获得和制备样品。
在步骤2001中,接收多个序列读数。在步骤2002中,序列读数与参考序列比对。这些步骤可如上为步骤301和302所描述进行。
在步骤2003中,鉴定一个或多个信息型基因座。每个基因座在第一实体中对于相应的第一等位基因是纯合子和在第二实体中对于相应的第一等位基因和相应的第二等位基因是杂合子。第一实体是妊娠女性对象或胎儿,和第二实体是妊娠女性对象和胎儿中另一个。信息型基因座可如上面为步骤303所描述鉴定。
在步骤2004中,如在步骤304中过滤信息型基因座,并且鉴定一个或多个过滤的信息型基因座。在一些实施方式中,仅仅考虑过滤表示SNP的信息型基因座。在方法的一个例子中,过滤的信息型基因座包括母亲血浆中具有“A”等位基因的至少一个序列读数和“B”等位基因的一个序列读数的信息型SNP。
然后在步骤2005-2008中,在个体过滤信息型基因座的水平上操作序列读数。在步骤2005和2006中,对于每个过滤的信息型基因座测定第一数量和第二数量。第一数量在步骤2005中测定为与基因座对齐并且包含相应的第一等位基因的序列读数的数量。第二数量在步骤2006中测定为与基因座对齐并且包含相应的第二等位基因的序列读数的数量。步骤2005和2006可与上面讨论的步骤305和306类似地进行。
在步骤2007中,为每个过滤的信息型基因座计算第一数量和第二数量的比例。该比例表示序列读数的相对丰度(和引申表示样品中的转录体)包含第一等位基因和第二等位基因。在一些实施方式中,比例简单地计算为第一数量除以第二数量。这样的计算产生共享等位基因的序列读数的数量作为母亲特异性或胎儿特异性等位基因的多个序列读数。该比例,或其倒数,可视为等位基因比,和对于SNP基因组,可视为RNA-SNP等位基因比。
在一些实施方式中,对于包括母亲特异性SNP等位基因的信息型SNP,对于每个SNP,RNA-SNP等位基因比计算为母亲特异性等位基因:共享等位基因。另一方面,对于包括胎儿特异性SNP等位基因的信息型SNP,RNA-SNP等位基因比可计算为胎儿特异性等位基因:共享等位基因。不像基因表达分析,其中数据归一化是必须的,RNA-SNP等位基因比分析不需要数据归一化并且引入较少的偏差。对于包含大于一个信息型SNP的转录体,可为每个信息型SNP位点计算RNA-SNP等位基因比并且可计算每个转录体的平均RNA-SNP等位基因比。
在步骤2007中,比例可以可选地计算为第二数量除以第一数量和第二数量的和。这里,比例提供母亲特异性或胎儿特异性等位基因的序列读数的数量为基因座的一部分所有序列读数。根据“A”和“B”等位基因,比例可表达为
B-等位基因比=B-等位基因计数/(A-等位基因计数+B-等位基因计数)
理论上,对于仅仅由胎儿或母亲贡献的血浆转录体,B-等位基因比应是0.5,假设没有等位基因特异性表达。计算比例的其他方法对技术人员是显而易见的。
在步骤2008中,当比例超过截取值时,过滤的信息型基因座命名为标记物。在一些实施方式中,截取值是约0.2至约0.5。在一些实施方式中,截取值是0.4。在方法的一个例子中,对于具有高胎儿或母亲贡献的RNA转录体,B-等位基因比截取值定义为≥0.4。该截取值考虑RNA-seq读数的泊松分布和随机取样。在一些实施方式中,当比例超过截取值时,认为“B”等位基因的贡献是高的。
在具体信息型基因座的高等位基因比可指示(i)第二或“B”等位基因在杂合子个体中比“A”等位基因更高表达(即,等位基因表达不对称),(ii)母亲血浆中所有与基因座对齐的RNA的更大共享由杂合子个体贡献,或(i)和(ii)。如果与信息型基因座相关的基因是病理上过表达的,那么高等位基因比可也指示妊娠相关的病症。因此,一些方法的实施方式也包括基于过滤信息型基因座是否命名为第二实体(即,杂合子个体)的标记物,诊断妊娠相关的病症。在进行这样的诊断时,用于和等位基因比比较的截取值可基于获得自健康的妊娠对象的血浆样品中的转录体水平。
在一些实施方式中,方法2000可也用于评估样品中在母亲或胎儿起源的具体过滤信息型基因座处的RNA部分。通过在步骤2007中计算的比例乘以标量进行评估。标量表示在基因座处相对于杂合子个体中第二等位基因的表达的总表达水平。
为可阐释,如果方法中计数的第二(“B”)等位基因是胎儿特异性,那么如上计算的B-等位基因比表示该等位基因的序列读数的数量,作为过滤的信息型基因座的一部分或所有序列读数。包含共享(“A”)等位基因的序列读数中,一些由母亲贡献和一些由胎儿贡献。如果胎儿中相关表达的水平胎儿特异性和共享等位基因是已知的,或可以评估,那么可测量B-等位基因比例,以获得对基因座的所有序列读数的部分胎儿贡献评估。如果“A”和“B”等位基因在胎儿中同样表达,那么标量是约二。对基因座处序列读数的部分母亲贡献是一减去部分胎儿贡献。当在过滤的信息型基因座的“B”等位基因是母亲特异性的时,可进行类似的计算。
B.实施例:高胎儿和母亲贡献
使用如上述0.4的B-等位基因截取值,发现0.91%的循环转录体显示早期妊娠(即第一和第二三个月)期间,胎儿的高贡献。在晚期妊娠(即第三三个月)期间,该百分数增加至2.52%。另一方面,42.58%和50.98%分别显示母亲在早期妊娠和晚期妊娠期间的高贡献(图16、17和18A)。
V.基因用于诊断妊娠相关的病症的用途
A.妊娠相关的基因
也提供了鉴定妊娠相关的基因的方法。方法包括接收多个第一序列读数和多个第二序列读数。第一序列读数源自对获得自妊娠女性的血液血浆样品的RNA分子的测序。第二序列读数源自对获得自非妊娠女性的血液血浆样品的RNA分子的测序。第一序列读数和第二序列读数与参考序列比对,并且指定一组候选物基因。
根据方法,然后,序列读数用于确定来自妊娠女性和非妊娠女性的样品中每个候选物基因的表达水平。具体而言,对于每个候选物基因,使用第一序列读数测定对应候选物基因的转录体的第一数量;和使用第二序列读数测定对应候选物基因的转录体的第二数量。转录体的第一数量和转录体的第二数量可被归一化。然后计算候选物基因的转录体比例,其中转录体比例包括转录体的第一数量除以转录体的第二数量。然后比较转录体比例与截取值。如果转录体比例超过截取值,则鉴定候选物基因鉴定为妊娠相关的基因。
在方法的一些实施方式中,归一化转录体的第一数量对应通过第一序列读数的总数测量转录体的第一数量。类似地,归一化转录体的第二数量可对应通过第二序列读数的总数测量转录体的第二数量。在其他实施方式中,归一化每个候选物基因的转录体的第一数量对应通过所有候选物基因的第一转录体的总数测量候选物基因的转录体的第一数量。归一化每个候选物基因的转录体的第二数量可对应通过所有候选物基因的第二转录体的总数测量候选物基因的转录体的第二数量。
与非妊娠女性相比,如果基因以更高的水平在妊娠女性中表达,而所有其他的相等,那么方法一般将基因鉴定为妊娠相关的。妊娠和非妊娠女性可以是相同的个体;即,获得自生孩子之前和之后的个体的样品可以分别是第一序列读数和第二序列读数的来源。
我们已经显示携带胎儿特异性等位基因的循环RNA转录体的子集在分娩之后从母亲血浆完全消失(图18B)。这些转录体认为是母亲血浆中胎儿特异性的。另一方面,一部分母亲特异性等位基因在分娩之后也检测不到。因此,通过直接比较它们在分娩前和分娩后母亲血浆中的存在,我们开发了妊娠期间显示上调的基因,称为妊娠相关的基因。我们定义妊娠相关的基因为在分娩前第三个个月妊娠女性的血浆中检测到,它们的产后血浆水平在两中情况下都下降≥2倍的那些。通过使用用于数据归一化和微分基因表达分析的生物信息学算法,我们编辑了一系列131个妊娠相关的基因(图21)。这些基因中,15个先前报道为母亲血浆中妊娠特异性的1,2,4,5,9,10,12。使用一步实时RT-PCR,我们已经进一步验证了五个新鉴定转录体的妊娠相关性,其在分娩前母亲血浆中丰富,即来自第三个三个月妊娠女性的10个另外血浆样品中的STAT1、GBP1和HSD17B1,以及来自另一群第三个三个月妊娠女性10个血浆样品中的KRT18和GADD45G(图22)。
为了评估这些131个基因与妊娠的相关性,为所有的血浆样品进行分级聚类。在来自妊娠女性(即早期妊娠和晚期妊娠)的血浆样品和与正在进行的妊娠不相关的(即非妊娠对照和分娩后)那些之间观察到清晰的分离(图23)。
有趣地,当在两个晚期妊娠病例的血浆样品和它们对应的胎盘和母亲血细胞之间比较这些131个基因的表达模式时,胎盘和分娩前血浆样品之间,和母亲血细胞和产后血浆样品之间观察到更加的相似之处(图24A)。该观察支持了大部分妊娠相关的基因优选在胎盘而不在母亲血细胞中表达的观点。此外,这些妊娠相关的转录体在胎盘和母亲血浆中的表达水平是正相关的(P<0.05,Spearman相关性)(图24B)。
B.胎盘和母亲血液中的差别基因表达
尽管我们能够通过直接检查分娩前和分娩后母亲血浆样品登记一组妊娠相关的基因,但是我们也开发了胎盘和血细胞RNA-seq数据,用于比较目的。假设妊娠相关的基因应是以高水平在胎盘中表达和以低水平在母亲血细胞中表达的那些,如之前所报道10,15,我们随意设置20倍差异作为基于组织的分析的最小截取值。该基于组织的分析产生总共798个潜在的候选物基因,其中计算母亲血浆中胎儿和母亲贡献的比例。当与全转录组的相当时(图18A),鉴定具有主要的胎儿贡献的相对高比例的基因(图25)。但是,基于血浆的策略胜过基于组织的策略,在于能够鉴定更高的比例具有主要胎儿贡献的基因(图25)。
C.与疾病或病症相关的基因
本文也提供了鉴定与妊娠相关的病症相关的基因的方法。方法包括接收多个第一序列读数和多个第二序列读数。第一序列读数源自对获得自健康的妊娠女性的血液血浆样品RNA分子的测序。第二序列读数源自对获得自遭受妊娠相关的病症,或携带遭受妊娠相关的病症的胎儿的妊娠女性的血液血浆样品的RNA分子的测序。第一序列读数和第二序列读数与参考序列对比,并且指定一组候选物基因。
根据方法,序列读数然后用于确定每个候选物基因在两个妊娠女性的样品中的表达水平。具体而言,对于每个候选物基因,使用第一序列读数测定对应候选物基因的转录体的第一数量,和使用第二序列读数测定对应候选物基因的转录体的第二数量。转录体的第一数量和转录体的第二数量可被归一化。然后计算候选物基因的转录体比例,其中转录体比例包括转录体的第一数量除以转录体的第二数量。转录体比例然后与参考值比较。如果转录体比例与参考值偏离,候选物基因鉴定为与病症相关。
在方法的一些实施方式中,归一化转录体的第一数量对应通过第一序列读数的总数测量转录体的第一数量。类似地,归一化转录体的第二数量可对应通过第二序列读数的总数测量转录体的第二数量。在其他实施方式中,归一化每个候选物基因的转录体的第一数量对应通过所有候选物基因的第一转录体的总数测量候选物基因的转录体的第一数量。归一化每个候选物基因的转录体的第二数量可对应通过所有候选物基因的第二转录体的总数测量候选物基因的转录体的第二数量。
根据鉴定与妊娠相关的病症相关的基因的方法,在一些实施方式中,参考值是1。在一些实施方式中,当转录体比例和参考值的比例超过或落在截取值之下时,转录体比例与参考值偏离。在一些实施方式中,当转录体比例和参考值的差异超过截取值时,转录体比例与参考值偏离。
如果基因的表达水平在表现和不表现病症的明显不同,而所有其他的相等,那么方法一般将基因鉴定为与妊娠相关的病症相关的。
通过使用与疾病相关的母亲血浆RNA,先前已经实现了胎儿病症和妊娠病理学的诊断和监测。例如,促肾上腺皮质素释放激素(CRH)mRNA的母亲血浆水平已经显示用于无创检测和预测先兆子痫2,3。母亲血浆中白介素1受体样1(IL1RL1)mRNA的检测已经表明用于鉴定具有自发早产的女人8。一组生长相关的母亲血浆RNA标记物也已经被研究用于无创评估胎儿生长和宫内生长限制4。在该研究中,我们认为可通过直接比较正常妊娠女性和具有并发症妊娠,比如先兆子痫、宫内生长限制、早产和胎儿非整倍性女人的母亲血浆转录组,鉴定新的疾病相关的循环RNA标记物。为了表明该方法的可行性,我们对获得自发展了先兆子痫三个妊娠女性和七名匹配妊娠的无并发症妊娠女性的的母亲血浆样品进行RNA-Seq。我们鉴定了在先兆子痫妊娠女性的血浆中显示明显上升的98个转录体(图26)。新鉴定的先兆子痫相关的转录体潜在地用于预测、预言和监测疾病。
该技术可也用于预测和监测早产。技术可也用于预测临近的胎儿死亡。技术可也用于检测基因突变造成的疾病,只要考虑的基因在胎儿或胎盘组织中转录并且转录体在母亲血浆中可检测。
血浆RNA-Seq可用于其他临床情形。例如,该研究中开发的血浆RNA-Seq方法可潜在地用于研究其中已经报道异常血浆RNA浓度的其他病理学病况,比如癌症13,14。例如,通过比较癌症患者疗法之前和之后的血浆转录组,肿瘤相关的循环RNA标记物可鉴定用于无创诊断应用。
VI.具体基因的等位基因表达模式
RNA-测序已经用于检查等位基因表达模式25。我们假设当RNA转录体从组织释放进入循环时,保持给定基因的等位基因表达模式,已经可在血浆中检测到。在该研究中,我们已经检查了两个RNA转录体,即PAPPA,妊娠特异性基因,和H19,印记的母亲表达基因的等位基因计数26,27。
对于PAPPA基因,我们分析了SNP,rs386088,其包含胎儿特异性SNP等位基因(图27)。在分娩后血浆样品中缺少PAPPARNA-seq读数,指示其的确是妊娠特异性的4。重要地,分娩前母亲血浆和胎盘RNA样品中胎儿等位基因读数计数的比例没有统计学上显著差异(P=0.320,X2检验),指示母亲血浆数据反映胎盘中PAPPA的双等位基因的表达模式。
我们最近报道了印记母亲表达的H19基因在胎盘和母亲血细胞中的DNA甲基化模式可通过母亲血浆DNA的亚硫酸氢盐DNA测序检测28。这里,我们进一步检查了H19基因的基因组印记状态是否可在RNA水平开发。我们首先关注H19基因,rs2839698的外显子1的SNP位点,其包含母亲特异性等位基因,即胎儿中是AA和母亲中是AG。如图28中所显示,在分娩后母亲血浆中检测到仅仅G-等位基因(图28)。这样的单等位基因模式是根据其与印记对照区域中rs4930098SNP位点上未甲基化的G-等位基因的连接(图29)。在分娩前母亲血浆中,尽管存在G-等位基因,但是也检测到胎盘贡献的A-等位基因(图28)。在三个其他SNP位点中,即rs2839701、rs2839702和rs3741219,其携带母亲特异性等位基因,发现了类似的等位基因模式,即分娩前母亲血浆中双等位基因和分娩后母亲血浆中单等位基因(图28)。这些SNP位点上的母亲特异性等位基因可能为相同的母亲单体型,其未甲基化并且所以被转录。注意,H19RNA在母亲血细胞中不表达(图28),提示血浆中的H19RNA分子源自母亲组织/器官,而不是血细胞。报道为显示H19表达的非胎盘和非胎儿组织包括肾上腺腺体、骨骼肌、子宫、脂细胞、肝和胰腺29。
VII.讨论
在该工作中,我们目的是开发使用RNA-seq提供母亲血浆中转录活性的整体观点的技术。我们先前已经显示母亲血浆中的部分胎儿DNA可通过靶向一个或数个胎儿特异性基因座计算,因为整个胎儿基因组在母亲血浆中均匀出现30。不像循环DNA,母亲血浆中胎儿起源的RNA转录体的比例的测量是较不直接的,因为其被胎儿和母亲组织中的差别基因表达复杂化并且或许它们释放进入循环。通过对母亲血浆进行RNA-seq并且检查胎儿和母亲之间的多态差异,我们能够评估胎儿贡献的血浆转录体的比例。尽管如人们所预期,母亲起源的转录体占血浆转录组的大多数,但是母亲血浆中在早期妊娠和晚期妊娠期间,分别3.70%和11.28%的循环转录体源自胎儿。这些胎儿起源的转录体包括胎儿和母亲共同贡献的RNA分子,以及胎儿单独贡献的那些。我们发现后者在早期妊娠和晚期妊娠期间分别占母亲循环转录体的0.90%和2.52%。这样的胎儿特异性基因在晚期妊娠期间更高的出现可能与伴随妊娠过程胎儿和胎盘尺寸的增加相关。
在该研究中,我们已经表明可观察到胎盘中妊娠特异性PAPPA基因的平衡的RNA等位基因表达和在母亲血浆中印记母亲表达的H19基因的单等位基因表达。这些数据提示母亲血浆可用作无创样品来源,用于研究等位基因表达模式。
通过定量的比较分娩前和分娩后母亲血浆样品中的RNA转录体,我们已经编辑了妊娠期间上调的一系列131个基因,如通过它们在产后血浆样品中减少的出现所显示。如期望的,这些基因的描述可用于妊娠女性的血浆样品与非妊娠女性的那些区分开。分娩前和分娩后母亲血浆样品的这样的直接比较已经使得我们以高通量方式分拣出妊娠相关的基因,其可能不一定如之前的工作所显示以比母亲血细胞中相当更高的水平在胎盘中10,15。实际上,该直接血浆检查方法提供了另一途径,用于发现循环妊娠相关的RNA转录体,而不需要胎盘组织和血细胞转录概况的先验知识。
尽管我们已经显示RNA-seq是概述血浆转录组的可行方法,但是可进一步改善数个技术问题。第一,对于血浆RNA-seq通过进一步优化测序方案,尤其排除血浆中高度转录的rRNA和珠蛋白基因可增加信息产生。第二,我们仅仅集中关注参考转录体并且还未开发个人亚型。未来的研究可包括通过增加测序读数深度检测新的转录体和差别分析剪接变体和它们的亚型31-33。第三,对于早期妊娠样品,我们已经省略了源自胎儿和母亲的转录体比例分析的ASE-过滤,因为绒膜绒毛和羊水已经耗尽用于基因分型分析。然而,我们已经在晚期妊娠中显示ASE-过滤对于母亲血浆中具有主要胎儿和母亲贡献的基因的鉴定没有明显影响(图16和17)。
结论,我们已经表明RNA-seq技术可用于测量母亲血浆中胎儿起源的转录体的比例和鉴定循环妊娠相关的基因。该研究已经为更好理解母亲血浆的转录体前景铺平了道路,因此利于鉴定涉及妊娠相关疾病的生物标记候选物。我们设想该技术可为用于妊娠相关的或胎盘相关的疾病的分子诊断,和也为其他疾病比如癌症的分子诊断产生新的路径34。
VIII.移植
如上述,本文所述的方法可也用于移植。用于移植的方法可如用于胎儿分析类似的方式进行。例如,可获得移植组织的基因型。实施方式可鉴定移植组织是杂合子,和宿主生物体(例如,男性或女性)是纯合子的基因座。并且,实施方式可鉴定其中移植组织是纯合子,和其中宿主生物体(例如,男性或女性)是杂合子的基因座。可计算相同的比例,并且与截取值比较,以确定是否存在病症。
IX.计算机系统
本文提到的任何计算机系统可使用任何适当数量的子系统。这样的子系统的例子显示在计算机装置3000的图30中。在一些实施方式中,计算机系统包括单个计算机装置,其中子系统可以是计算机装置的组件。在其他实施方式中,计算机系统可包括多个计算机装置,每个是具有内部组件的子系统。
图30中显示的子系统经系统总线3075相互连接。显示了另外的子系统比如打印机3074、键盘3078、储存设备(一个或多个)3079、监视器3076,其与显示适配器3082连接,和其他的子系统。与I/O控制器3071连接的外周设备和输入/输出(I/O)设备可通过任何数量的本领域已知的方式连接至计算机系统,比如串行端口3077。例如,串行端口3077或外部接口3081(例如Ethernet,Wi-Fi等)可用于将计算机系统3000连接至广域网比如因特网、小鼠输入设备,或扫描仪。经系统总线3075的互联使得中央处理器3073与每个子系统通讯并且控制来自系统储存器3072或储存设备(一个或多个)3079(例如,硬盘,比如硬盘存储器或光盘)的指令执行,以及子系统之间交换信息。系统储存器3072和/或储存设备(一个或多个)3079可嵌入计算机可读的介质。本文提到的任何数据可从一个组件输出至另一组件并且可输出至使用者。
计算机系统可包括多个相同组件或子系统,例如,通过外部接口3081或通过内部接口连接在一起。在一些实施方式中,计算机系统、子系统或装置可经网络通讯。在这样的情况下,一个计算机可认为是客户端和另一计算机是服务器,其中每个可以是同一计算机系统的一部分。客户端和服务器可每个包括多个系统、子系统或组件。
应理解,本发明的任何实施方式可以控制逻辑使用硬件(例如专用集成电路或场可编程门矩阵)和/或使用以模块化或集成方式具有一般可编程处理器的计算机软件实施。作为本文的使用者,处理器包括相同集成芯片上的多核心处理器,或单个电路版或网络上的多个处理单元。基于本文提供的内容教导,本领域普通技术人员知道和认识到使用硬件和硬件和软件的组合其他方式和/或方法实施本发明的实施方式。
该申请中描述的任何软件组件或功能可实施为软件代码,以被处理器使用任何适当的计算机语言比如例如Java、C++或Perl,使用例如,常规的或面向对象的技术实施。软件代码可在计算机可读的介质上储存为一系列指令或命令以储存和/或传递,适当的介质包括随机存取存储器(RAM),只读存储器(ROM),磁介质,比如硬盘或软盘,或光介质,比如光盘(CD)或DVD(数字通用盘)、闪存等。计算机可读的介质可以是这样的储存或传递设备的任何组合。
这样的程序也可被编码并且使用适于经符合各种协议的线路、光和/或无线网络,包括因特网传递的载体信号传递。这样,根据本发明的实施方式的计算机可读的介质可使用具有这样的程序的数据信号编码产生。用程序代码编码的计算机可读的介质可用兼容的设备封装或分别从其他设备提供(例如,经因特网下载)。任何这样的计算机可读介质可位于单个计算机产品(例如硬盘存储器、CD或整个计算机系统)上或其中,并且可存在于系统或网络的不同计算机产品上或其中。计算机系统可包括监视器、打印机或其他适当的显示器,用于为使用者提供本文提到的任何结果。
本文所述的任何方法可全部或部分用包括可配置为实施步骤的一个或多个处理器的计算机系统进行。因此,实施方式可涉及配置为进行本文所述的任何方法步骤的计算机系统,潜在地具有进行各自步骤或各自步骤组的不同组件。尽管作为编号的步骤出现,但是本文方法的步骤可同时或以不同的顺序进行。另外,这些步骤的一部分可与来自其他方法的其他步骤的部分一起使用。而且,所有或部分步骤可以是任选的。另外,任何方法的任何步骤可用模块、电路或用于进行这些步骤的其他方式进行。
具体实施方式的具体细节可以任何适当的方式组合,而不背离本发明的实施方式的精神和范围。但是,本发明的其他实施方式可涉及与每个单个方面相关的具体实施方式,或这些单个方面的具体组合。
上面已经提供了本发明的示例性实施方式的描述,为了阐释和描述的目的。其不旨在是穷尽的或将本发明限于描述的精确形式,并且许多修饰和变型就上面的教导是可行的。选择和描述实施方式以便最佳阐释本发明的原理和其实际应用从而确保本领域技术人员以各种实施方式最佳使用本发明并且各种修饰适于考虑的具体应用。
“一个(a)”、“一个(an)”和所述的叙述旨在意思是“一个或多个”除非明确相反指出。
本文提到的所有的专利、专利申请、出版物和说明书通过参考为了所有的目的以它们的整体并入。都不承认是现有技术。
X.参考文献
1.Ng EKO、TsuiNBY、Lau TK、Leung TN、Chiu RWK、Panesar NS、Lit LC、Chan KW、Lo YMD.mRNA of placental origin is readily detectable in maternalplasma.ProcNatlAcadSci U S A 2003;100:4748-53.
2.Ng EKO、Leung TN、TsuiNBY、Lau TK、Panesar NS、Chiu RWK、Lo YMD.Theconcentration of circulating corticotropin-releasing hormone mRNAin maternalplasma is increased in preeclampsia.ClinChem 2003;49:727-31.
3.Farina A、Sekizawa A、Sugito Y、Iwasaki M、Jimbo M、Saito H、Okai T.FetalDNAin maternal plasma as a screening variable for preeclampsia.Apreliminarynonparametric analysis of detection rate in low-risk nonsymptomaticpatients.PrenatDiagn 2004;24:83-6.
4.Pang WW、Tsui MH、Sahota D、Leung TY、Lau TK、Lo YM、Chiu RW.Astrategyfor identifying circulating placental RNAmarkers for fetal growthassessment.PrenatDiagn 2009;29:495-504.
5.Lo YMD、TsuiNBY、Chiu RWK、Lau TK、Leung TN、Heung MM、Gerovassili A、JinY、NicolaidesKH、Cantor CR、Ding C.Plasma placental RNAallelic ratio permitsnoninvasive prenatal chromosomal aneuploidy detection.Nat Med 2007;13:218-23.
6.TsuiNBY、Akolekar R、Chiu RWK、Chow KCK、Leung TY、Lau TK、NicolaidesKH、Lo YMD.Synergy of total PLAC4 RNA concentration and measurement of theRNAsingle-nucleotide polymorphism allelic ratio for the noninvasive prenataldetection of trisomy21.ClinChem 2010;56:73-81.
7.TsuiNBY、Wong BCK、Leung TY、Lau TK、Chiu RWK、Lo YMD.Non-invasiveprenatal detection of fetal trisomy 18 by RNA-SNP allelic ratio analysisusing maternal plasma SERPINB2 mRNA:a feasibility study.PrenatDiagn 2009;29:1031-7.
8.Chim SS、Lee WS、Ting YH、Chan OK、Lee SW、Leung TY.Systematicidentification of spontaneous preterm birth-associated RNA transcripts inmaternal plasma.PLoS One 2012;7:e34328.
9.Wong BCK、Chiu RWK、TsuiNBY、Chan KCA、Chan LW、Lau TK、Leung TN、LoYMD.Circulating placental RNAin maternal plasma is associated with apreponderance of 5'mRNAfragments:implications for noninvasive prenataldiagnosis and monitoring.ClinChem 2005;51:1786-95.
10.TsuiNBY、ChimSSC、Chiu RWK、Lau TK、Ng EKO、Leung TN、Tong YK、Chan KCA、Lo YMD.Systematic micro-array based identification of placental mRNAinmaternal plasma:towards non-invasive prenatal gene expression profiling.J MedGenet 2004;41:461-7.
11.Poon LL、Leung TN、Lau TK、Lo YMD.Presence of fetal RNA in maternalplasma.Clin Chem 2000;46:1832-4.
12.Go AT、Visser A、Mulders MA、Blankenstein MA、Van Vugt JM、OudejansCB.Detection of placental transcription factor mRNA in maternal plasma.ClinChem 2004;50:1413-4.
13.Smets EM、Visser A、Go AT、van Vugt JM、Oudejans CB.Novel biomarkersin preeclampsia.Clin Chim Acta 2006;364:22-32.
14.Purwosunu Y、Sekizawa A、Koide K、Farina A、Wibowo N、Wiknjosastro GH、et al.Cell-free mRNA concentrations of plasminogen activator inhibitor-1 andtissue-type plasminogen activator are increased in the plasma of pregnantwomen with preeclampsia.Clin Chem2007;53:399-404.
15.Miura K、Miura S、Yamasaki K、Shimada T、Kinoshita A、Niikawa N、etal.The possibility of microarray-based analysis using cell-free placentalmRNA in maternal plasma.Prenat Diagn2010;30:849-61.
16.Ng EKO、El-Sheikhah A、Chiu RWK、Chan KC、Hogg M、Bindra R、etal.Evaluation of human chorionic gonadotropin beta-subunit mRNAconcentrations in maternal serum in aneuploid pregnancies:a feasibilitystudy.Clin Chem 2004;50:1055-7.
17.Mortazavi A、Williams BA、McCue K、Schaeffer L、Wold B.Mapping andquantifying mammalian transcriptomes by RNA-Seq.Nat Methods 2008;5:621-8.
18.Sultan M、Schulz MH、Richard H、Magen A、Klingenhoff A、Scherf M、etal.A global view of gene activity and alternative splicing by deep sequencingof the human transcriptome.Science 2008;321:956-60.
19.Kim J、Zhao K、Jiang P、Lu ZX、Wang J、Murray JC、XingY.Transcriptomelandscape of the human placenta.BMC Genomics2012;13:115.
20.Wang K、Li H、Yuan Y、Etheridge A、Zhou Y、Huang D、et al.The complexexogenous RNA spectra in human plasma:an interface with human gut biota?PLoSOne 2012;7:e51009.
21.Li H、Guo L、Wu Q、Lu J、Ge Q、Lu Z.A comprehensive survey of maternalplasma miRNAs expression profiles using high-throughput sequencing.Clin ChimActa 2012;413:568-76.
22.Williams Z、Ben-Dov IZ、Elias R、Mihailovic A、Brown M、Rosenwaks Z、Tuschl T.Comprehensive profiling of circulating microRNA via small RNAsequencing of cDNA libraries reveals biomarker potential and limitations.ProcNatl Acad Sci U S A 2013;110:4255-60.
23.Chim SSC、Shing TK、Hung EC、Leung TY、Lau TK、Chiu RWK、LoYMD.Detection and characterization of placental microRNAs in maternalplasma.Clin Chem 2008;54:482-90.
24.Pickrell JK et al.Understanding mechanisms underlying human geneexpression variation with RNA sequencing.Nature2010;464:768-772.
25.Smith RM、Webb A、Papp AC、Newman LC、Handelman SK、Suhy A、et al.Wholetranscriptome RNA-Seq allelic expression in human brain.BMC Genomics 2013;14:571.
26.Frost JM、Monk D、Stojilkovic-Mikic T、Woodfine K、Chitty LS、MurrellA、et al.Evaluation of allelic expression of imprinted genes in adult humanblood.PLoS One 2010;5:e13556.
27.Daelemans C、Ritchie ME、Smits G、Abu-Amero S、Sudbery IM、Forrest MS、et al.High-throughput analysis of candidate imprinted genes and allele-specific gene expression in the human term placenta.BMC Genet 2010;11:25.
28.Lun FMF、Chiu RWK、Sun K、Leung TY、Jiang P、Chan KCA、et al.Noninvasiveprenatal methylomic analysis by genomewide bisulfite sequencing of maternalplasma DNA.Clin Chem 2013;59:1583-94.
29.Wu C、Orozco C、Boyer J、Leglise M、Goodale J、Batalov S、et al.BioGPS:an extensible and customizable portal for querying and organizing geneannotation resources.Genome Biol 2009;10:R130.
30.Lo YMD、Chan KCA、Sun H、Chen EZ、Jiang P、Lun FMF、et al.Maternalplasma DNA sequencing reveals the genome-wide genetic and mutational profileof the fetus.Sci Transl Med 2010;2:61ra91.
31.Cabili MN、Trapnell C、Goff L、Koziol M、Tazon-Vega B、Regev A、RinnJL.Integrative annotation of human large intergenic noncoding RNAs revealsglobal properties and specific subclasses.Genes Dev 2011;25:1915-27.
32.St Laurent G、Shtokalo D、Tackett MR、Yang Z、Eremina T、Wahlestedt C、et al.Intronic RNAs constitute the major fraction of the non-coding RNA inmammalian cells.BMC Genomics 2012;13:504.
33.Anders S、Reyes A、Huber W.Detecting differential usage of exonsfrom RNA-seq data.Genome Res 2012;22:2008-17.
34.Fleischhacker M、Schmidt B.Circulating nucleic acids(CNAs)andcancer--a survey.Biochim Biophys Acta 2007;1775:181-232.
Claims (18)
1.用于在孕育胎儿的女性对象中诊断妊娠相关的病症的系统,所述系统包括用于将图21或图26中所示基因的表达水平与从一个或多个其他女性对象测定的对照值比较的装置,其中每一个所述其他女性对象孕育健康胎儿,其中所述基因不是CSH1、KISS1、TFPI2、PLAC4、CSHL1、SERPINE1、PAPPA、ADAM12、GH2、INHBA、PSG9、PLAC1、SERPINB2、CRH或GCM1。
2.权利要求1所述的系统,其中所述妊娠相关的病症与所述女性对象相关。
3.权利要求1所述的系统,其中所述妊娠相关的病症与所述胎儿相关。
4.权利要求3所述的系统,其中所述诊断妊娠相关的病症是先兆子痫或早产。
5.权利要求1所述的系统,其中如果所述表达水平超过所述对照值,则诊断所述妊娠相关的病症。
6.权利要求1所述的系统,其中如果所述表达水平低于所述对照值,则诊断所述妊娠相关的病症。
7.权利要求1所述的系统,其中与分娩之后比较,所述女性对象当妊娠时展示升高的基因表达水平。
8.权利要求1所述的系统,其中所述女性对象的所述基因的表达水平通过如下测量:
获得来自所述女性对象的血浆样品,
接收多个序列读数,其中所述序列读数获自从所述血浆样品获得的RNA分子的分析;
通过计算机系统鉴定参考序列中序列读数的位置;和
计数位于所述基因处的序列读数。
9.计算机可读介质,其储存多种指令,其中所述指令当被处理器执行时诊断孕育胎儿的女性对象中妊娠相关的病症,所述多种指令包括:
比较基因的表达水平与从一个或多个其他女性对象测定的对照值,
其中所述基因列于图21或图26,并且
所述基因不是CSH1、KISS1、TFPI2、PLAC4、CSHL1、SERPINE1、PAPPA、ADAM12、GH2、INHBA、PSG9、PLAC1、SERPINB2、CRH或GCM1。
10.权利要求9所述的计算机可读介质,其中所述妊娠相关的病症与所述女性对象相关。
11.权利要求9所述的计算机可读介质,其中所述妊娠相关的病症与所述胎儿相关。
12.权利要求11所述的计算机可读介质,其中所述诊断妊娠相关的病症是先兆子痫或早产。
13.权利要求9所述的计算机可读介质,其中所述多种指令还包括:如果所述表达水平超过所述对照值,则诊断所述妊娠相关的病症。
14.权利要求9所述的计算机可读介质,其中所述多种指令还包括:如果所述表达水平低于所述对照值,则诊断所述妊娠相关的病症。
15.权利要求9所述的计算机可读介质,其中与分娩之后比较,所述女性对象当妊娠时展示升高的基因表达水平。
16.权利要求9所述的计算机可读介质,其中所述多种指令还包括:测量所述女性对象的所述基因的表达水平。
17.权利要求16所述的计算机可读介质,其中所述女性对象的所述基因的表达水平通过如下测量:
接收多个序列读数,其中所述序列读数获自从所述女性对象的血浆样品获得的RNA分子的分析;
鉴定参考序列中序列读数的位置;和
计数位于所述基因处的序列读数。
18.计算机系统,包括:
权利要求9-17中任一项所述的计算机可读介质;和
用于执行存储在所述计算机可读介质上的指令的一个或多个处理器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361770985P | 2013-02-28 | 2013-02-28 | |
US61/770,985 | 2013-02-28 | ||
CN201480015402.7A CN105143466B (zh) | 2013-02-28 | 2014-02-28 | 通过大规模平行rna测序分析母亲血浆转录组 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480015402.7A Division CN105143466B (zh) | 2013-02-28 | 2014-02-28 | 通过大规模平行rna测序分析母亲血浆转录组 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109136364A true CN109136364A (zh) | 2019-01-04 |
Family
ID=51388739
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811106855.7A Pending CN109136364A (zh) | 2013-02-28 | 2014-02-28 | 通过大规模平行rna测序分析母亲血浆转录组 |
CN201480015402.7A Active CN105143466B (zh) | 2013-02-28 | 2014-02-28 | 通过大规模平行rna测序分析母亲血浆转录组 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480015402.7A Active CN105143466B (zh) | 2013-02-28 | 2014-02-28 | 通过大规模平行rna测序分析母亲血浆转录组 |
Country Status (15)
Country | Link |
---|---|
US (3) | US10240199B2 (zh) |
EP (4) | EP2961851B1 (zh) |
JP (4) | JP6525894B2 (zh) |
KR (2) | KR102082025B1 (zh) |
CN (2) | CN109136364A (zh) |
AU (4) | AU2014222312B2 (zh) |
CA (2) | CA3117788A1 (zh) |
EA (2) | EA202190075A3 (zh) |
ES (1) | ES2670544T3 (zh) |
HK (1) | HK1253097A1 (zh) |
IL (4) | IL289547B2 (zh) |
MX (3) | MX368004B (zh) |
SG (2) | SG10201609080WA (zh) |
TW (3) | TWI641834B (zh) |
WO (1) | WO2014132244A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2961851B1 (en) * | 2013-02-28 | 2018-04-25 | The Chinese University Of Hong Kong | Maternal plasma transcriptome analysis by massively parallel rna sequencing |
CN105441432B (zh) * | 2014-09-05 | 2019-05-28 | 天津华大基因科技有限公司 | 组合物及其在序列测定和变异检测中的用途 |
CN104232778B (zh) * | 2014-09-19 | 2016-08-17 | 天津华大基因科技有限公司 | 同时确定胎儿单体型及染色体非整倍性的方法及装置 |
CN104232777B (zh) * | 2014-09-19 | 2016-08-24 | 天津华大基因科技有限公司 | 同时确定胎儿核酸含量和染色体非整倍性的方法及装置 |
WO2016205753A1 (en) * | 2015-06-17 | 2016-12-22 | The Translational Genomics Research Institute | Systems and methods for obtaining biological molecules from a sample |
NL2016967B1 (en) | 2016-06-15 | 2017-12-21 | Iq Products B V | Markers and their ratio to determine the risk for early-onset preeclampsia. |
CA3062985A1 (en) * | 2017-05-16 | 2018-11-22 | The Chinese University Of Hong Kong | Integrative single-cell and cell-free plasma rna analysis |
CN109280697B (zh) * | 2017-07-20 | 2022-04-26 | 天昊生物医药科技(苏州)有限公司 | 利用孕妇血浆游离dna进行胎儿基因型鉴定的方法 |
KR20200007035A (ko) | 2018-05-25 | 2020-01-21 | 일루미나, 인코포레이티드 | 자간전증에 특이적인 순환 rna 시그니처 |
CA3131748A1 (en) | 2019-11-22 | 2021-05-27 | Sarah E. SHULTZABERGER | Circulating rna signatures specific to preeclampsia |
KR102326813B1 (ko) * | 2020-04-20 | 2021-11-16 | 강원대학교산학협력단 | 임신중독증의 예측 또는 진단을 위한 바이오마커로서의 miRNA-214-3p 및 miRNA-1290-3p |
EP4165416A1 (en) | 2020-06-10 | 2023-04-19 | Board of Regents, The University of Texas System | Method for determining risk of pre-term birth |
KR102497167B1 (ko) * | 2020-11-04 | 2023-02-08 | 강원대학교산학협력단 | miR-155-5p 및 miR-1290-3p의 발현수준 비율을 이용한 임신중독증 진단 방법 |
KR102494583B1 (ko) * | 2020-11-04 | 2023-02-07 | 강원대학교산학협력단 | miR-31-5p 및 miR-1290-3p의 발현수준 비율을 이용한 임신중독증 진단 방법 |
US20230392207A1 (en) | 2022-06-03 | 2023-12-07 | Illumina, Inc. | Circulating rna biomarkers for preeclampsia |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004065629A1 (en) * | 2003-01-17 | 2004-08-05 | The Chinese University Of Hong Kong | Circulating mrna as diagnostic markers for pregnancy-related disorders |
US20070178605A1 (en) * | 2006-02-02 | 2007-08-02 | Yale University | Pregnancy biomarker profiles, methods and compositions related thereto |
US20080233583A1 (en) * | 2007-02-20 | 2008-09-25 | Regents Of The University Of California | Biomarkers for preeclampsia |
CN101871002A (zh) * | 2009-04-22 | 2010-10-27 | 中山大学达安基因股份有限公司 | 一种无创性产前筛查21-三体综合征的试剂盒 |
US20110171650A1 (en) * | 2008-09-16 | 2011-07-14 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | Gene expression related to preeclampsia |
CN102286462A (zh) * | 2011-06-27 | 2011-12-21 | 深圳市易瑞生物技术有限公司 | 一种游离rna提取方法及试剂盒 |
CN102933723A (zh) * | 2010-06-07 | 2013-02-13 | 奥斯娜特·阿舒尔-费边 | 用于诊断与缺氧有关的病状的方法和试剂盒 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6664056B2 (en) | 2000-10-17 | 2003-12-16 | The Chinese University Of Hong Kong | Non-invasive prenatal monitoring |
AU2003263660A1 (en) | 2003-08-29 | 2005-03-16 | Pantarhei Bioscience B.V. | Prenatal diagnosis of down syndrome by detection of fetal rna markers in maternal blood |
DK1804836T3 (da) * | 2004-09-24 | 2011-01-24 | Beth Israel Hospital | Fremgangsmåder til diagnosticering og behandling af graviditetskomplikationer |
JP5219516B2 (ja) * | 2005-03-18 | 2013-06-26 | ザ チャイニーズ ユニバーシティー オブ ホンコン | 染色体異数性の検出方法 |
EP2612928A3 (en) * | 2005-03-18 | 2013-09-11 | The Chinese University Of Hong Kong | Markers for prenatal diagnosis and monitoring |
DE102005013949A1 (de) | 2005-03-26 | 2006-09-28 | Carl Zeiss Meditec Ag | Scanvorrichtung |
US7901884B2 (en) * | 2006-05-03 | 2011-03-08 | The Chinese University Of Hong Kong | Markers for prenatal diagnosis and monitoring |
EA035451B9 (ru) | 2007-07-23 | 2020-09-09 | Те Чайниз Юниверсити Ов Гонконг | Способ диагностики рака с использованием геномного секвенирования |
US20100016173A1 (en) | 2008-01-30 | 2010-01-21 | Proteogenix, Inc. | Maternal serum biomarkers for detection of pre-eclampsia |
KR101970908B1 (ko) | 2008-02-01 | 2019-04-19 | 더 제너럴 하스피탈 코포레이션 | 의학적 질환 및 병태의 진단, 예후, 및 치료에 있어서 미세소포체의 용도 |
CA2779695C (en) | 2009-11-05 | 2016-05-24 | The Chinese University Of Hong Kong | Fetal genomic analysis from a maternal biological sample |
US9260745B2 (en) * | 2010-01-19 | 2016-02-16 | Verinata Health, Inc. | Detecting and classifying copy number variation |
EP2848704B1 (en) * | 2010-01-19 | 2018-08-29 | Verinata Health, Inc | Sequencing methods for prenatal diagnoses |
US20120077185A1 (en) | 2010-08-06 | 2012-03-29 | Tandem Diagnostics, Inc. | Detection of genetic abnormalities and infectious disease |
EP2426217A1 (en) | 2010-09-03 | 2012-03-07 | Centre National de la Recherche Scientifique (CNRS) | Analytical methods for cell free nucleic acids and applications |
WO2012058316A1 (en) * | 2010-10-26 | 2012-05-03 | Stanford University | Non-invasive fetal genetic screening by sequencing analysis |
AU2011348267A1 (en) * | 2010-12-23 | 2013-08-01 | Sequenom, Inc. | Fetal genetic variation detection |
US8530228B2 (en) | 2010-12-28 | 2013-09-10 | Bexmart | Integrated versatile and systems preparation of specimens |
WO2012093331A1 (en) * | 2011-01-05 | 2012-07-12 | The Chinese University Of Hong Kong | Noninvasive prenatal genotyping of fetal sex chromosomes |
EP2490027A1 (en) * | 2011-02-15 | 2012-08-22 | Roche Diagnostics GmbH | Means and methods for diagnosing pregnancy complications based on GDF-15 and PlGF/sFlt1 |
EP3489368B1 (en) | 2011-02-24 | 2020-09-09 | The Chinese University Of Hong Kong | Molecular testing of multiple pregnancies |
EP2961851B1 (en) | 2013-02-28 | 2018-04-25 | The Chinese University Of Hong Kong | Maternal plasma transcriptome analysis by massively parallel rna sequencing |
-
2014
- 2014-02-28 EP EP14757525.2A patent/EP2961851B1/en active Active
- 2014-02-28 ES ES14757525.2T patent/ES2670544T3/es active Active
- 2014-02-28 MX MX2015010784A patent/MX368004B/es active IP Right Grant
- 2014-02-28 CA CA3117788A patent/CA3117788A1/en active Pending
- 2014-02-28 EA EA202190075A patent/EA202190075A3/ru unknown
- 2014-02-28 SG SG10201609080WA patent/SG10201609080WA/en unknown
- 2014-02-28 IL IL289547A patent/IL289547B2/en unknown
- 2014-02-28 KR KR1020157022741A patent/KR102082025B1/ko active IP Right Grant
- 2014-02-28 EP EP19190836.7A patent/EP3587588B1/en active Active
- 2014-02-28 KR KR1020207004904A patent/KR102241051B1/ko active IP Right Grant
- 2014-02-28 CA CA2897684A patent/CA2897684C/en active Active
- 2014-02-28 EP EP21175354.6A patent/EP3910072A3/en active Pending
- 2014-02-28 CN CN201811106855.7A patent/CN109136364A/zh active Pending
- 2014-02-28 AU AU2014222312A patent/AU2014222312B2/en active Active
- 2014-02-28 EP EP18160528.8A patent/EP3351643B1/en active Active
- 2014-02-28 JP JP2015559600A patent/JP6525894B2/ja active Active
- 2014-02-28 US US14/194,294 patent/US10240199B2/en active Active
- 2014-02-28 WO PCT/IB2014/059351 patent/WO2014132244A1/en active Application Filing
- 2014-02-28 CN CN201480015402.7A patent/CN105143466B/zh active Active
- 2014-02-28 SG SG11201506516TA patent/SG11201506516TA/en unknown
- 2014-02-28 EA EA201591582A patent/EA037326B1/ru unknown
- 2014-03-03 TW TW103107127A patent/TWI641834B/zh active
- 2014-03-03 TW TW107135118A patent/TWI762728B/zh active
- 2014-03-03 TW TW111112400A patent/TWI801188B/zh active
-
2015
- 2015-07-14 IL IL239939A patent/IL239939B/en active IP Right Grant
- 2015-08-20 MX MX2021015876A patent/MX2021015876A/es unknown
- 2015-08-20 MX MX2019010844A patent/MX2019010844A/es unknown
-
2018
- 2018-09-28 HK HK18112484.8A patent/HK1253097A1/zh unknown
-
2019
- 2019-01-23 US US16/255,745 patent/US11970742B2/en active Active
- 2019-05-07 JP JP2019087705A patent/JP2019162121A/ja active Pending
- 2019-07-04 IL IL267845A patent/IL267845B/en active IP Right Grant
- 2019-10-10 AU AU2019246833A patent/AU2019246833B2/en active Active
-
2021
- 2021-03-11 IL IL281429A patent/IL281429B/en unknown
- 2021-07-02 JP JP2021110946A patent/JP7397498B2/ja active Active
-
2022
- 2022-01-06 AU AU2022200046A patent/AU2022200046B2/en active Active
-
2023
- 2023-02-13 AU AU2023200786A patent/AU2023200786A1/en active Pending
- 2023-11-24 JP JP2023198942A patent/JP2024023390A/ja active Pending
-
2024
- 2024-04-24 US US18/644,907 patent/US20240271218A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004065629A1 (en) * | 2003-01-17 | 2004-08-05 | The Chinese University Of Hong Kong | Circulating mrna as diagnostic markers for pregnancy-related disorders |
US20070178605A1 (en) * | 2006-02-02 | 2007-08-02 | Yale University | Pregnancy biomarker profiles, methods and compositions related thereto |
US20080233583A1 (en) * | 2007-02-20 | 2008-09-25 | Regents Of The University Of California | Biomarkers for preeclampsia |
US20110171650A1 (en) * | 2008-09-16 | 2011-07-14 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | Gene expression related to preeclampsia |
CN101871002A (zh) * | 2009-04-22 | 2010-10-27 | 中山大学达安基因股份有限公司 | 一种无创性产前筛查21-三体综合征的试剂盒 |
CN102933723A (zh) * | 2010-06-07 | 2013-02-13 | 奥斯娜特·阿舒尔-费边 | 用于诊断与缺氧有关的病状的方法和试剂盒 |
CN102286462A (zh) * | 2011-06-27 | 2011-12-21 | 深圳市易瑞生物技术有限公司 | 一种游离rna提取方法及试剂盒 |
Non-Patent Citations (1)
Title |
---|
A. RAJAKUMAR 等: "Maternal gene expression profiling during pregnancy and preeclampsia in human peripheral blood mononuclear cells", 《PLACENTA》 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105143466B (zh) | 通过大规模平行rna测序分析母亲血浆转录组 | |
TWI782020B (zh) | 整合單細胞及血漿游離rna分析 | |
EP3298166B1 (en) | Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing | |
EA046998B1 (ru) | Анализ транскриптома материнской плазмы с применением массивного параллельного секвенирования рнк |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1261390 Country of ref document: HK |