CN107406873B - 基因组结构绘图 - Google Patents
基因组结构绘图 Download PDFInfo
- Publication number
- CN107406873B CN107406873B CN201580067332.4A CN201580067332A CN107406873B CN 107406873 B CN107406873 B CN 107406873B CN 201580067332 A CN201580067332 A CN 201580067332A CN 107406873 B CN107406873 B CN 107406873B
- Authority
- CN
- China
- Prior art keywords
- loci
- compartment
- cell
- genomic
- genome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 143
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 89
- 238000005204 segregation Methods 0.000 claims abstract description 55
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 50
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 49
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 49
- 210000004940 nucleus Anatomy 0.000 claims abstract description 47
- 230000014509 gene expression Effects 0.000 claims abstract description 14
- 230000001105 regulatory effect Effects 0.000 claims abstract description 14
- 238000007619 statistical method Methods 0.000 claims abstract description 12
- 230000003993 interaction Effects 0.000 claims description 153
- 210000004027 cell Anatomy 0.000 claims description 121
- 108010077544 Chromatin Proteins 0.000 claims description 85
- 210000003483 chromatin Anatomy 0.000 claims description 85
- 210000000349 chromosome Anatomy 0.000 claims description 72
- 239000003623 enhancer Substances 0.000 claims description 57
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 claims description 52
- 238000001514 detection method Methods 0.000 claims description 42
- 238000012163 sequencing technique Methods 0.000 claims description 25
- 210000001519 tissue Anatomy 0.000 claims description 21
- 238000013518 transcription Methods 0.000 claims description 15
- 230000035897 transcription Effects 0.000 claims description 15
- 238000005056 compaction Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 10
- 230000008707 rearrangement Effects 0.000 claims description 8
- 230000027455 binding Effects 0.000 claims description 7
- 238000007481 next generation sequencing Methods 0.000 claims description 7
- 238000000926 separation method Methods 0.000 claims description 7
- 238000004132 cross linking Methods 0.000 claims description 5
- 239000003431 cross linking reagent Substances 0.000 claims description 5
- 230000002093 peripheral effect Effects 0.000 claims description 4
- 230000029087 digestion Effects 0.000 claims description 3
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 238000004017 vitrification Methods 0.000 claims description 3
- 210000003470 mitochondria Anatomy 0.000 claims description 2
- 241000206602 Eukaryota Species 0.000 claims 1
- 210000001236 prokaryotic cell Anatomy 0.000 claims 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 23
- 201000010099 disease Diseases 0.000 abstract description 21
- 210000003855 cell nucleus Anatomy 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 42
- 239000000523 sample Substances 0.000 description 36
- 239000011159 matrix material Substances 0.000 description 34
- 238000004458 analytical method Methods 0.000 description 31
- 241000699666 Mus <mouse, genus> Species 0.000 description 27
- 238000009826 distribution Methods 0.000 description 17
- 230000008520 organization Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 12
- 230000004807 localization Effects 0.000 description 11
- ZNJHFNUEQDVFCJ-UHFFFAOYSA-M sodium;2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid;hydroxide Chemical compound [OH-].[Na+].OCCN1CCN(CCS(O)(=O)=O)CC1 ZNJHFNUEQDVFCJ-UHFFFAOYSA-M 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- 230000002759 chromosomal effect Effects 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 102000009572 RNA Polymerase II Human genes 0.000 description 8
- 108010009460 RNA Polymerase II Proteins 0.000 description 8
- 108091023040 Transcription factor Proteins 0.000 description 8
- 102000040945 Transcription factor Human genes 0.000 description 8
- 238000011161 development Methods 0.000 description 8
- 230000018109 developmental process Effects 0.000 description 8
- 238000013412 genome amplification Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 201000011510 cancer Diseases 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 230000002103 transcriptional effect Effects 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 6
- 238000002509 fluorescent in situ hybridization Methods 0.000 description 6
- 210000005260 human cell Anatomy 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 239000008188 pellet Substances 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000005945 translocation Effects 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 5
- 206010006187 Breast cancer Diseases 0.000 description 5
- 208000026310 Breast neoplasm Diseases 0.000 description 5
- 101150025421 ETS gene Proteins 0.000 description 5
- 229930006000 Sucrose Natural products 0.000 description 5
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 5
- 230000004069 differentiation Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 238000003708 edge detection Methods 0.000 description 5
- 238000001493 electron microscopy Methods 0.000 description 5
- 210000001671 embryonic stem cell Anatomy 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000007901 in situ hybridization Methods 0.000 description 5
- 238000001001 laser micro-dissection Methods 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 239000005720 sucrose Substances 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 241000446313 Lamella Species 0.000 description 4
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 4
- 206010060862 Prostate cancer Diseases 0.000 description 4
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 4
- 239000011230 binding agent Substances 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 239000011248 coating agent Substances 0.000 description 4
- 238000000576 coating method Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000000834 fixative Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 210000005053 lamin Anatomy 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 201000005202 lung cancer Diseases 0.000 description 4
- 208000020816 lung neoplasm Diseases 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 238000012070 whole genome sequencing analysis Methods 0.000 description 4
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 3
- 208000027205 Congenital disease Diseases 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 241000283074 Equus asinus Species 0.000 description 3
- 108091029865 Exogenous DNA Proteins 0.000 description 3
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 description 3
- 102000006835 Lamins Human genes 0.000 description 3
- 108010047294 Lamins Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 3
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 3
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 3
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 description 3
- 108091000117 Tyrosine 3-Monooxygenase Proteins 0.000 description 3
- 102000048218 Tyrosine 3-monooxygenases Human genes 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000022131 cell cycle Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000003291 dopaminomimetic effect Effects 0.000 description 3
- 210000002304 esc Anatomy 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000000370 laser capture micro-dissection Methods 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000000386 microscopy Methods 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- RGCLLPNLLBQHPF-HJWRWDBZSA-N phosphamidon Chemical compound CCN(CC)C(=O)C(\Cl)=C(/C)OP(=O)(OC)OC RGCLLPNLLBQHPF-HJWRWDBZSA-N 0.000 description 3
- 101150093695 pitx3 gene Proteins 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000013442 quality metrics Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 231100000617 superantigen Toxicity 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- IGAZHQIYONOHQN-UHFFFAOYSA-N Alexa Fluor 555 Chemical compound C=12C=CC(=N)C(S(O)(=O)=O)=C2OC2=C(S(O)(=O)=O)C(N)=CC=C2C=1C1=CC=C(C(O)=O)C=C1C(O)=O IGAZHQIYONOHQN-UHFFFAOYSA-N 0.000 description 2
- 241001156002 Anthonomus pomorum Species 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000030939 Bubalus bubalis Species 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 208000012239 Developmental disease Diseases 0.000 description 2
- 108091071901 ETS family Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 101150099612 Esrrb gene Proteins 0.000 description 2
- 208000031448 Genomic Instability Diseases 0.000 description 2
- 101001053430 Homo sapiens Iroquois-class homeodomain protein IRX-3 Proteins 0.000 description 2
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 2
- 101001059220 Homo sapiens Zinc finger protein Gfi-1 Proteins 0.000 description 2
- 102100024374 Iroquois-class homeodomain protein IRX-3 Human genes 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000000172 Medulloblastoma Diseases 0.000 description 2
- 241001599018 Melanogaster Species 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 2
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 102100029004 Zinc finger protein Gfi-1 Human genes 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000010382 chemical cross-linking Methods 0.000 description 2
- 230000011855 chromosome organization Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000002559 cytogenic effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000002224 dissection Methods 0.000 description 2
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010201 enrichment analysis Methods 0.000 description 2
- 230000003628 erosive effect Effects 0.000 description 2
- 210000003743 erythrocyte Anatomy 0.000 description 2
- 210000000267 erythroid cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 238000012482 interaction analysis Methods 0.000 description 2
- 230000016507 interphase Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000001531 micro-dissection Methods 0.000 description 2
- 230000000394 mitotic effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000004001 molecular interaction Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000004766 neurogenesis Effects 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 230000034512 ubiquitination Effects 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- -1 68510 Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 239000012103 Alexa Fluor 488 Substances 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 206010065163 Clonal evolution Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 102100039563 ETS translocation variant 1 Human genes 0.000 description 1
- 102100039578 ETS translocation variant 4 Human genes 0.000 description 1
- 102100039577 ETS translocation variant 5 Human genes 0.000 description 1
- 102100027100 Echinoderm microtubule-associated protein-like 4 Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101001077417 Gallus gallus Potassium voltage-gated channel subfamily H member 6 Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 230000010558 Gene Alterations Effects 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 101000813729 Homo sapiens ETS translocation variant 1 Proteins 0.000 description 1
- 101000813747 Homo sapiens ETS translocation variant 4 Proteins 0.000 description 1
- 101000813745 Homo sapiens ETS translocation variant 5 Proteins 0.000 description 1
- 101001057929 Homo sapiens Echinoderm microtubule-associated protein-like 4 Proteins 0.000 description 1
- 101000605528 Homo sapiens Kallikrein-2 Proteins 0.000 description 1
- 101000605496 Homo sapiens Kinesin light chain 1 Proteins 0.000 description 1
- 101001050559 Homo sapiens Kinesin-1 heavy chain Proteins 0.000 description 1
- 101000800847 Homo sapiens Protein TFG Proteins 0.000 description 1
- 101000648196 Homo sapiens Striatin Proteins 0.000 description 1
- 101001010792 Homo sapiens Transcriptional regulator ERG Proteins 0.000 description 1
- 101001135565 Homo sapiens Tyrosine-protein phosphatase non-receptor type 3 Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100038356 Kallikrein-2 Human genes 0.000 description 1
- 102100038306 Kinesin light chain 1 Human genes 0.000 description 1
- 102100023422 Kinesin-1 heavy chain Human genes 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 102000012547 Olfactory receptors Human genes 0.000 description 1
- 108050002069 Olfactory receptors Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700005081 Overlapping Genes Proteins 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical compound CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 102100022807 Potassium voltage-gated channel subfamily H member 2 Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100033661 Protein TFG Human genes 0.000 description 1
- 101150007742 RING1 gene Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 208000035217 Ring chromosome 1 syndrome Diseases 0.000 description 1
- 108091007568 SLC45A3 Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 102100037253 Solute carrier family 45 member 3 Human genes 0.000 description 1
- 102100028898 Striatin Human genes 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 108050000630 Transcription factor SOX-2 Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 102100033131 Tyrosine-protein phosphatase non-receptor type 3 Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000005282 brightening Methods 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 230000000981 bystander Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 210000001726 chromosome structure Anatomy 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 229960003638 dopamine Drugs 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 239000008098 formaldehyde solution Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000011365 genetic imprinting Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 208000030776 invasive breast carcinoma Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000010859 live-cell imaging Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000031864 metaphase Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 1
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000031267 regulation of DNA replication Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000007873 sieving Methods 0.000 description 1
- 210000001626 skin fibroblast Anatomy 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 210000004895 subcellular structure Anatomy 0.000 description 1
- 210000003523 substantia nigra Anatomy 0.000 description 1
- 230000000475 sunscreen effect Effects 0.000 description 1
- 239000000516 sunscreening agent Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000005029 transcription elongation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1003—Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Ecology (AREA)
- Physiology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及分析基因组的三维结构领域,即,用于基因组结构绘图(GAM)。本发明提供一种确定在隔室(诸如细胞核)中多个核酸基因座的空间接近性的方法,其通过利用隔室的各级分中它们的共分离,所述级分在根据隔室中它们的定位(例如,通过低温切片或低温研磨隔室)将核酸基因座彼此分离以得到级分群时鉴定;确定在所述级分中存在或不存在多个基因座;和确定所述多个基因座的共分离。可随后使用统计方法来分析共分离,以确定空间接近性。所述方法可例如用于确定多个基因座之间的物理距离;和例如在核中绘图基因座和/或基因组结构;鉴定通过空间接触指导特定基因表达的可调节区域;鉴定在核中外源核酸的核位置和/或诊断与基因座的被干扰的共分离相关的疾病。
Description
本发明涉及分析基因组的三维结构领域,即,用于基因组结构绘图(GAM)。本发明提供一种确定在隔室(诸如细胞核)中多个核酸基因座的空间接近性的方法,在该隔室的各级分中,其通过利用隔室的各级分中它们的共分离,所述级分在根据隔室中它们的定位(例如,通过低温切片或低温研磨隔室)将核酸基因座彼此分离以得到级分群时鉴定;确定在所述级分中存在或不存在多个基因座;和确定所述多个基因座的共分离。可随后使用统计方法来分析共分离,以确定空间接近性。所述方法可例如用于确定多个基因座之间的物理距离;和例如在核中绘图基因座和/或基因组结构;鉴定通过空间接触指导特定基因表达的可调节区域;鉴定在核中外源核酸的核位置;鉴定染色质压实和/或诊断与基因座的被干扰的共分离相关的疾病。
已采用若干方法来分析基因组的结构和染色质相互作用。线性基因组距离通常通过测序(例如鸟枪法测序)来分析。在基因组(特别是,在重复序列的情况下)中,可例如通过HAPPY绘图1来解决定位序列的问题,其基于在基因组DNA的随机碎裂和稀释后基因座共分离的频率,测量基因座之间的线性基因组距离,并且可用于高达约200kb线性距离。
关于染色质的三维结构的信息也是高度受关注的,特别是,以发现可调节区域和基因启动子之间的接触。染色体相互作用影响基因表达的一个实例为可折叠的染色体区域,以便在基因的密切接近性内,带来增强剂和关联的转录因子。研究染色体的结构性质和空间组织对于基因表达的调节、DNA复制和修复以及重组的理解和评价是重要的。例如,在癌症或先天性疾病中,染色体的折叠和它们的接触对于疾病机理和阐明治疗方法的目标具有重要的暗示。
染色质以相互作用和非相互作用状态存在。相互作用状态具有不同的性质,其取决于在相互作用中涉及的结合位点的特性,即,(a)它们的数量、距离和分配,(b)它们对粘合剂的特异性和亲和力,和(c)粘合剂的浓度和特异性。染色质相互作用还可涉及同时关联的不同数量的基因座(相互作用的多样性)。
荧光性原位杂化(FISH)利用显微术来直接测量基因组基因座之间的空间距离,但是其可仅适用于在同一核中一次研究少量的基因组区域(例如,Pombo A.2003.Cellulargenomics:which genes are transcribed when and where?Trends Biochem.Sci.28,6)。理论上有可能使用不同组的探头来再次探测相同的细胞或组织切片,但是得注意重复的再次探测引起结构假象,例如,由于分离随后的探头组所需的DNA变性,例如,诱导基因座的人工聚集(接触)(即,相对于彼此和相对于核界标(例如,核薄层),亚基因组区域的再次定位)。在中期染色体的情况下,其代表更加浓缩的(并且预期更加稳定的)染色质,再次探测可重复最多六次(Pauciullo A等人,2014,Development of a sequential multicolor-FISH approach with 13chromosome-specific painting probes for the rapididentification of river buffalo(使用13种染色体-特异性涂漆探头,开发连续多色-FISH方法,用于快速鉴定river buffalo)(Bubalus bubalis,2n=50)chromosomes.J ApplGenet.55(3):397-401),但是在第二次探测后,关于染色体形态的降解的关注可能已经显而易见,这可导致损失染色体或核(Heslop-Harrison JS,Harrison GE,Leitch IJ(1992)Reprobing of DNA:DNA in situ hybridization preparations(DNA的再探测:DNA原位杂化制备)。Trends Genet 8:372-373)。RNA-FISH为较温和的FISH方法,其不涉及DNA变性,但是可能仅用于确定主动转录的基因(非沉默基因)的核位置。来自在细胞周期的相间阶段(其中最通常绘图官能的染色质接触)中细胞的样品可被再次探测用于RNA-FISH仅约三次,但是已经不能详细测量结构的保护。可同时施用于DNA-或RNA-FISH的探头数量受到可识别荧光标记物的限制,例如,通过组合五种颜色、四种颜色比率和两种不同水平的强度,原则上可得到181种条形码(Pombo A.2003.Cellular genomics:which genes aretranscribed when and where?Trends Biochem.Sci.28,6)。然而,当分析的基因座在空间上如此接近,以至于在一个探头中荧色物的组合不能与组合中的另一个区别时,该方法(多路复用荧色物)失败,因此并不顺从在空间上接近的基因座的鉴定。此外,由于每一个特定的基因座需要标记的探头,FISH可仅适用于分析关注的已知基因座的相互作用,并且例如在检测内源或外源DNA序列中失败,除非它们已知为先验,例如,外源DNA的精确序列和病毒亚型整体位置(viral subtype integration position)。线性基因组组织的先验假定也使FISH混乱,其不可接受用于研究染色质定位特性,例如,染色质接触,当例如关注在有机体群体中基因组序列的天然变体的影响时,例如,在研究人样品中,由于FISH不会内在地检测序列变化(诸如拷贝数量变化或基因组重排)的事实,而没有样品的先验探头设计或先验整个基因组测序接着探头设计。
在不同的方法,指定的INGRID(相互作用DNA碎片的IN-Gel复制;Gavrilov,A.A等人,2014,Quantitative analysis of genomic element interactions by molecularcolony technique(通过分子克隆技术,基因组要素相互作用的定量分析)。Nucl.AcidsRes.42(5):e36),交联的染色质碎片在大面积的聚丙烯酰胺凝胶层上铺展,接着使分别以在所选的DNA碎片的凝胶内扩增期间产生的单组分和多组分分子群体形式的单独的和关联的要素可视化,其通过分子标志技术显现(Chetverin AB,Chetverina HV.Molecularcolony technique:a new tool for biomedical research and clinical practice(分子群体技术:用于生物化学研究和临床实践的新的工具)。Prog.Nucleic AcidRes.Mol.Biol.2008;82:219-255)。该技术还依赖于基因组组织的先验知识,并且不能内在地发现DNA序列变化、其空间组织以及其如何影响整个基因组的空间组织。
分析基因组的三维结构的备选的当前的方法主要基于染色体构型捕获(3C)技术,其中存在许多当前的版本和改编(图4)。基于3C的方法通常由介导基因组接触的蛋白质的弱化学交联开始。在染色质提取后,DNA的交联的块使用用于DNA碎裂的限制酶处理。加入连接酶,随后连接(连接)两块DNA。3C的不同的变化使用检测这样的连接事件的不同的方法:流行的一种方法是测序(Hi-C,4C-seq)。
对这些技术的限制在图4中描述,并且已经在文献中讨论过(例如,在BelmontA.S.,2014中。Large scale chromatin organization:the good,the surprising,andthe still perplexing(大规模染色质组织:良好的、意外的以及仍困惑的)。Curr Op CellBiol 26,69;O’Sullivan J.M.等人,2013。The statistical-mechanics of chromosomeconformation capture(染色体构型捕获的统计-力学)。Nucleus 4,390;Williamson,l.等人,2014。Spatial genome organization:contrasting views from chromosomeconformation capture and fluorescence in situ hybridization(空间基因组组织:染色体构型捕获和荧光性原位杂化的对比图)。Genes Dev.28,2778-2791)。
目前,不可能以没有偏倚的方式在基因组范围内鉴定结合位点,因此,我们不能理解哪一种核组分建立染色体结构的不同方面,以及多长范围的染色质接触帮助维持基因组稳定性和影响基因组功能(例如,基因表达)。因此,鉴定结合位点和测量结合位点彼此相互作用的频率是主要的当前的挑战。
本发明人解决提供用于确定核酸的空间接近性的改进的方法的问题,所述方法避免基于用于检测核酸相互作用的碎片化的核酸的连接的偏倚,并且允许同时分析若干高多样性相互作用(各自涉及多于两种基因座),特别是,多于两种相互作用,并且在一种实施方案中,用于同时分析基因组中的基本上所有的核酸相互作用和它们的相互依赖性。通过在以下和在权利要求中描述的本发明的方法解决该问题。该方法为指定的基因组结构绘图(GAM)。
本发明提供一种确定在隔室中多个核酸基因座的空间接近性的方法,所述方法包括:
(a)根据在隔室中它们的定位使核酸彼此分离以得到级分群;
(b)确定在所述级分中存在或不存在多个基因座;和
(c)确定所述多个基因座的共分离。
基因座(多个基因座)为基因、DNA序列或在染色体上的位置的特定的位置(Wikipedia)。每一个染色体携带许多基因;在23种不同的染色体上,在单倍体人基因组中蛋白质编码基因的数量估计是20,000-25,000。位于给定基因座的类似DNA序列的变体称为等位基因。在本发明的情景下,核酸可为DNA或RNA或二者的组合,例如,如果基因之间的相互作用被主动转录,并且待分析其它基因组区域。通常,使用本发明的方法分析DNA的共分离。可在包含核酸(诸如真核细胞、线粒体或前核细胞的核)的任何细胞或器官隔室中分析基因座的共分离。通常,将分析核酸(特别是,DNA、真核细胞的核中的基因座)的共分离。因此,本发明的方法组成分析核中的基因座接近性的方案,通过测量它们分级的核的共分离的频率。
衍生隔室的细胞可为细菌、原生动物、植物细胞、真菌细胞或动物细胞,例如,哺乳动物细胞,诸如来自具有某一疾病或病症或正诊断病症的患者(优选,人患者)或健康受试者的细胞。细胞可为例如肿瘤细胞或干细胞,诸如产生的诱导的多能干细胞,例如,通过人组织的重新编程。这样的细胞可有利地用于将GAM施用于研究人发育病症或先天性疾病。如果细胞为胚胎干细胞,优选其不在与破坏人胚胎有关的方法中产生。
哺乳动物优选为人,但是也可关注研究,并且任选比较其它有机体的基因组结构,诸如大肠杆菌、酵母、拟南芥、线虫、X.laevis、斑马鱼、D.melanogaster、小鼠、大鼠或灵长目动物。
细胞可衍生自细胞培养物或由来自活的有机体或死的有机体的特定组织先体外离体分析,即,死后,或由整个实验有机体(例如,整个D.melanogaster胚胎或C.elegans)。优选选择用于分析的细胞,例如,用于在细胞周期中共享共同的阶段,或用于分析仅属于特定发育谱系或细胞类型的细胞(例如,在人器官的活检内)。例如,在胰腺中,仅可分析产生β-细胞的胰岛素。该方法优选用于在细胞周期的特定的阶段中使细胞同步,或使细胞分类,例如通过荧光性活性细胞分类以捕获特定细胞类型,因为(a)这些方法可在其测量前改变在关注的隔室中核酸的排布,和(b)它们产生仅少量的细胞(例如,由尺寸受限的活检),这可导致下游分析的问题。同步的细胞或例如通过荧光性活性细胞分选而分选的细胞也可用于本发明。标记物可用于使用细胞类型选择来帮助,例如,对在关注的细胞类型或细胞阶段中独特表达的蛋白质特异性的抗体,或通过原位杂化检测,例如,使用检测在关注的细胞类型中特别表达的特定物质(例如,mRNA或其它RNA)的核酸探头,或荧光标记物,诸如显示特定基因表达或特定阶段特性的GFP。例如,在Pitx3转录因子的启动子的控制下的GFP转基因可用于标记多巴胺-表达神经元(Maxwell等人,2005,Pitx3regulates tyrosinehydroxylase expression in the substantia nigra and identifies a subgroup ofmesencephalic dopaminergic progenitor neurons during mouse development(Pitx3在黑质中调节酪氨酸羟化酶表达并且在小鼠发育期间鉴定中脑多巴胺能先祖神经元的亚组),Dev.Biol.,282(2):467-479)。细胞可用试剂预处理,例如,以测试药物对基因座的共分离或定位的效果。
在进行步骤(a)之前,优选核、细胞、组织或整个有机体用交联剂处理。优选交联剂可包含甲醛或与DNA提取相容的另一种稳定剂。优选甲醛将以0.5-8%,优选1-8%,2-8%,或最优选4-8%的浓度(均为w/w)使用,例如,在250mM HEPES-NaOH(pH 7.0-8.0)的缓冲溶液中,优选在pH 7.6-7.8下用于哺乳动物细胞达10分钟至24小时,优选在4%下10分钟,接着在8%下2小时。例如,在实验有机体的情况下,整个组织可通过以下交联:灌注HEPES-缓冲的甲醛溶液(例如,4%)优选达至少30分钟,接着在冰冷的4%甲醛/250mM HEPES-NaOH(pH7.6)中组织解剖30分钟至1小时,接着冰冷的8%甲醛/250mM HEPES-NaOH(pH 7.6)达1-3小时(等人,2012,Proteomic analysis of mitotic RNA polymerase IIcomplexes reveals novel interactors and association with proteinsdysfunctional in disease(有丝分裂RNA聚合酶II复合物的蛋白质组分析揭示新型相互作用剂和在疾病中与蛋白质功能障碍的关联)。Mol.Cell.Proteomics 11(6):M111.011767)。
在悬浮细胞(例如,人白血细胞、Drosophila S2细胞或其它分离的悬浮细胞)的情况下,通过离心(例如,对于哺乳动物细胞,150-300xg)使细胞沉积,随后细胞沉积物(沉淀颗粒)在例如4%甲醛/250mM HEPES-NaOH(pH 7.6)中再悬浮。通过离心(例如,对于哺乳动物细胞,150-300xg)使细胞沉积,将上清液倾析,随后加入8%甲醛/250mM HEPES-NaOH(pH7.6),此后不扰乱细胞沉淀颗粒。允许使细胞沉淀颗粒交联例如1小时。以提高的离心力(例如,500xg,1000xg,2000xg,4000xg,8000xg的步骤,并且在一些细胞类型中,高达10000xg;每一次2分钟,最后一步5-10分钟),通过离心逐步压实细胞沉淀颗粒。在如上所述8%浓缩的固定剂中,总时间高达24小时,优选约2小时。对于输送(例如,在临床和诊断实验室之间),或对于短期储存(1小时至1周),在最后的离心中除去8%甲醛上清液,用1%甲醛/250mM HEPES-NaOH(pH 7.6)替代,不扰乱细胞沉淀颗粒。不推荐更长的储存时间,虽然通过补充新的甲醛(例如,1%甲醛/250mM HEPES-NaOH(pH7.6))是可能的。对于与表面(例如,人皮肤纤维组织母细胞、人肌肉细胞)附着生长的细胞的固定,将细胞培养物培养基倾析,随后用例如4%甲醛/250mM HEPES-NaOH(pH 7.6)漂洗,接着新加入例如4%甲醛/250mMHEPES-NaOH(pH 7.6),孵育例如10分钟。将固定剂倾析,用例如8%甲醛/250mM HEPES-NaOH(pH 7.6)替代。优选1小时后,轻刮细胞并且在管中收集。在150-300xg下离心后,如对于悬浮细胞以上所述,以提高的力,通过离心压实细胞沉淀颗粒。对于输送或短期储存,可例如在1%甲醛/250mM HEPES-NaOH(pH 7.6)中储存固定的细胞或组织,理想地频繁用新的溶液替代,例如,每天或每隔一天。在不存在固定剂,或者没有新的固定剂补充的情况下储存,由于甲醛交联的逆转,可导致核酸位置或品质的结构恶化。
交联剂诱导蛋白质彼此之间以及核酸和蛋白质之间连接。本发明的方法允许使用比与当前的基于3C的方法相容的更强的交联条件,因此更好的保护核结构。本发明人意外的是,在核酸经受与亚细胞结构的优化结构保护相容的交联步骤之后,核酸的测序仍是可能的。没有交联步骤,该方法理论上也是可能的,因为通过玻璃化细胞的切片(例如,如在Dubochet等人,1988。Cryo-electron microscopy of vitrified specimens(玻璃化样品的低温电子显微术)Q.Rev.Biophys.21:129中讨论的)或通过玻璃化细胞的低温研磨(Oeffinger M,Wei KE,Rogers R,DeGrasse JA,Chait BT,Aitchison JD,Rout MP,2007Comprehensive analysis of diverse ribonucleoprotein complexes(多种多样的核糖核蛋白复合物的综合分析),核的分级分离是可能的。Nat Methods。4,951-6;Hakhverdyan等人,2015。Rapid,optimized interactomic screening(快速、优化的蛋白质相互作用组筛分)。Nature Methods 12,553)。在任一种情况下,利用玻璃化(即快速冷冻)来保护细胞超微结构将避免通过施用化学交联剂(例如,甲醛)可能潜在地被引入的任何假象。例如,使用化学交联剂(例如,甲醛)处理可导致相对于彼此和/或相对于核界标(例如,核薄层)亚基因组区域的再定位,但是在玻璃化样品中将不会发生该潜在的再定位。利用玻璃化在结构上保护的这样的细胞或组织样品不能通过基于3C的方法或FISH方法测定。
根据它们在隔室中的定位,将核酸彼此分离,以在步骤(a)中得到多个级分,通过使隔室切片,优选通过使隔室超低温切片而实现。涉及切片的本发明的方法也指定为GAM。或者,可通过低温研磨进行分离(Oeffinger M,Wei KE,Rogers R,DeGrasse JA,Chait BT,Aitchison JD,Rout MP,2007Comprehensive analysis of diverse ribonucleoproteincomplexes(多种多样的核糖核蛋白复合物的综合分析)。Nat Methods。4,951-6;Hakhverdyan等人,2015。Rapid,optimized interactomic screening(快速、优化的蛋白质相互作用组筛分)。Nature Methods 12,553)。
在不存在树脂-包被下,产生核低温切片,例如,通过Tokuyasu方法(Tokuyasu,K.T.,1973,J.Cell Biol.57,551-65,一种用于悬浮细胞和组织的超薄冷冻切片的技术),其涉及低温保护固定的组织,利用在0℃-25℃温度下,优选在室温(20-25℃)下或在约4℃下,在饱和蔗糖溶液中包被至少约30分钟或至少约2小时或至少约1天或高达1周,例如,在室温下2小时或在室温下2小时,接着在约4℃下短期储存1天至高达一周。包被之后接着放置包被蔗糖的细胞沉淀颗粒或组织或有机体,例如,在用作样品夹具的金属短柱上,随后在液氮中冷冻,并优选在-80至-110℃下切片,取决于组织,例如,约-100℃。已显示稍微改变的方法(Guillot PV,Xie SQ,Hollinshead M,Pombo A(2004)Fixation-inducedredistribution of hyperphosphorylated RNA polymerase ll in the nucleus ofhuman cells(在人细胞的核中超磷酸化的RNA聚合酶II的固定-诱导的再分配)。Exp.CellRes.295,460-468;Pombo A,Hollinshead M,Cook PR(1999)Bridging the resolutiongap:lmaging the same transcription factories in cryosections by light andelectron microscopy(桥接分辨间隙:通过光和电子显微术使低温切片中的相同的转录工厂成像)。J.Histochem.Cytochem.47,471-480)提供良好的结果。这些方法保护与在非固定的低温切片中观察到的可比的细胞结构,并且提供对活性RNA聚合酶和核结构的最优保护。可交替使用Chen等人,2014,Small 10:3267的方法。例如,根据V.等人,2013。J.CellBiol.202(3),407描述的方法,可制备非固定的级分。
例如,对于直径5-15微米的核,核的切片可具有约70nm至约1000nm,优选150-220nm或180-200nm的厚度。根据建立的方案3(图5a,b),本发明人例如以220nm的厚度低温切片小鼠胚胎干(ES)细胞(mESCs;其具有9μm直径的核)。用于在固定的细胞的蔗糖培养基中低温切片的商业设备是可用的(例如,Leica UltraCut UCT 52超低温切片机)。
切片导致级分群,即,多个级分。各切片的最佳厚取决于隔室的尺寸,其在步骤(a)中,优选分离成5-300个级分,10-100个级分,更优选40-60个级分或约45-50个级分,如在以下详细解释的,其已发现对于小鼠或人细胞核(或具有类似尺寸的核)是适合的。对于整个分析,级分的厚度应为均质的。
在本发明的一种实施方案中,在本发明的方法中分析隔室(特别是,一个核)的所有级分,使得单一细胞的基因组结构的分析是有可能的。然而,这不是需要的,并且在关注的细胞群体中,可从多个隔室(例如,多个核)取样分析的级分。使用本发明的方法,优选分析多于180个级分,例如,可分析约180至约10000个级分,优选约200-5000,约220-4000,约230-3500,约250-3000,300-2000或500-1000个级分,其中可由多个细胞(或含有细胞隔室的核酸)得到这些级分。
由各级分分离单一核分布图(NPs),例如,通过激光微解剖4(图5c)。
在步骤(b)中,通过非显微镜方法,例如,通过测序,优选通过下一代测序,可确定存在或不存在多个基因座。例如,可使用单一细胞整个基因组扩增(WGA)。优选级分中的基因座的核酸实质或完全测序。特别感兴趣的是,如果进行该方法来检测在研究装置中不同基因座之间的可能的相互作用,并且在使用的生理条件下,还未建立对于关注的细胞类型的“正常的”共分离模式。本发明的方法可因此用于分析未知和/或未指定的基因座的空间接近性(并因此,相互作用)。
例如,可由级分(例如,由单一核分布图)提取核酸(诸如DNA),使成碎片,并使用单一-细胞整个基因组扩增(WGA)5扩增(图5d)。例如,使用Illumina HiSeq技术,可使WGA-扩增的DNA测序。由单一NP目视检查行踪显示各自含有亚染色体区域的不同的补充(图2a),如由薄的核切片进出通过的染色质预期的。此外,每一个NP含有仅一个受限子集的染色体。
然而,可存在其中先前已研究存在或不存在特定相互作用(共分离)的情况,因此关注的相互作用基因座已经已知。特别是在诊断装置中,在不同的患者组(例如,健康受试者和具有疾病诸如肿瘤或先天性疾病的受试者)之间已发现相互作用基因座的显著差异。在这样的情况下,通过特定的PCR或通过另外特别检查它们的存在,例如,通过DNA印记或通过Illumina HiSeq技术,也可确定存在或不存在两个(或更多个)关注的基因座,在选择覆盖关注的基因座的核酸之后,例如,经由用于下一代测序的IDT目标捕获(IDT,Coralville,lowa,USA),。
sGAM因此优选将超低温切片与DNA检测组合(例如,通过整个基因组扩增和下一代测序)。当通过单个核切割薄的低温切片时,比起远离的基因座(即,它们共分离更频繁,图1b),发现在核空间中彼此更接近的基因座(但是,对于线性基因组不必然)在相同的切片中更频繁地在一起。通过单个核的多个级分中,通过评分存在或不存在基因座,可随后推断基因组基因座之间的核距离(图1c)。所得到的表可用于计算每一个基因座针对每另一个基因座的共分离频率(图1d),以产生基因座之间的推断的相对距离的矩阵。因此,GAM允许染色质接触基因组的计算宽泛。
共分离可使用统计方法分析,以确定空间接近性(例如,Weibel,E.R..1979Stereological Methods:Practical Methods for Biological Morphometry(立体方法:用于生物实践测定法的实践方法)。第1卷,AcademicPress,英国伦敦;Weibel,E.R.,1980。Stereological Methods:Theoretical Foundations(立体方法:理论基础)。第2卷,Academic Press,英国伦敦)。密切空间接近性可为基因座的特定的相互作用的符号。基因座的特定的相互作用可因此也通过使用统计方法分析共分离来确定。用于本发明方法的统计方法可例如推理统计方法。用于实施例的统计方法也可用于本发明的方法来分析不同起源的样品和/或用于关注的不同的基因座,例如,如本文提及的。
当以高于由在染色体上它们的线性基因组距离预期的频率共分离时,优选确定基因座彼此接近或特别相互作用。在特定相互作用和染色质的通常的浓缩和/或核体积降低之间,例如,在诊断装置中,统计方法也可不同。GAM可用于确定相对距离。通过使相对距离与核的尺寸关联,可计算绝对距离。GAM可用于评定在关注的隔室中(例如,在球形隔室中)关注的基因座的径向位置,切片得到具有较大多样性的DNA基因座的赤道级分和具有较低多样性的DNA基因座的顶端级分,因此,由在检测的级分中DNA基因座的复杂性,可推断在球形隔室中基因座的径向位置。DNA基因座的径向定位的改变与例如人疾病关联(例如,Maeburn K.J等人,2009,Disease-specific gene repositioning in breast cancer(在乳腺癌中疾病-特异性基因再定位)。J.Cell Biol.187(6):801-12;Kubben N.等人,2012。Mapping of lamin A-and progerin-interacting genome regions(核纤层蛋白A-和progerin-相互作用基因组区域的绘图)。Chromosoma 121(5):447-64)。如果考虑在给定的基因组(线性)距离下在基因组中所有可能成对的基因座以及测量的它们的核(3D)距离,将发现不相互作用的成对的基因座在平均3D距离周围分布,这取决于两个基因座之间的基因组距离和染色质压实的程度。与此相反,比起在该特定细胞类型的核中的该基因组距离平均的,将发现相互作用组更紧密地在一起。还可考虑更复杂的争论(参见以下),但是相互作用可最简单地定义为偏离考虑对非随机行为的任何另外的贡献因子的染色质纤维的随机排布。
GAM测量在相同的核分布图中两个基因座共分离的频率,比起可同时测量所有基因组基因座的共分离,产生顺从以下的定量信息:(a)鉴定与其它基因组区域更频繁相互作用的基因组配位,以及(b)计算超过一些随机(预期)行为的基因座相互作用概率的宽泛的数学处理。
基因座的共分离的全基因组图源自特定的物理相互作用以及随机接触,其严重地取决于基因座之间的线性基因组距离,并且也影响共分离频率。GAM具有鉴定显著超过随机水平的相互作用的基因座的潜能,通过施用区分在给定的基因组距离下基因座的非随机接触与预期的随机行为的统计模式。例如,通过SLICE计算平台(基因座共分离的统计推理;参见图11)可实现这一点。使用在统计上显著的直接相互作用,SLICE返回矩阵,考虑随机接近性效果以及其它效果,诸如在不同的染色质区域和染色体领地位置中发现的不同的压实水平。SLICE也解剖同时的三路相互作用(一式三份)并且更通常若干基因座之间的多价接触的概率。也可开发在GAM管道内的SLICE分析,以估计在关注的特定的应用下,精细调节实验程序以最优化成本和效率所需的对照参数的最优化值,诸如理想切片厚度和每个管中最小数量的核分布图,超过给定的阈值,为了实现稳健检测染色质相互作用所需的管的数量,考虑窗口分辨和检测性的效果。
在数学上,最简单的方法是考虑其中在给定的基因组距离下基因座在3D空间中随机分布的随机情况,最高至由染色质在核内均质分布的假定计算的最大距离。然而,更高级的数学计算与GAM和SLICE完全相容,这可考虑例如其它空间参数,其中的一些可通过实验来测量或甚至由GAM数据本身推断。例如,染色体、亚染色体区域或单一基因座在关注的核中占据的体积与在核分布图(NPs)中实测的每一个其基因座的频率成比例。
多个基因座意味着两个或更多个基因座,任选,至少3,至少4,至少5,至少6,至少7,至少8,至少9,至少10,至少11,至少12,至少13,至少15,至少20,至少30,至少40,至少50,至少75,至少100,至少200,至少500或至少1000个基因座并高达几百万或十亿个基因座,它们被同时分析。例如,在5kb分辨下,人细胞的等位基因特异性分析需要同时分析1,300,000个基因座。在一个选项中,使用本发明的方法分析在隔室中实质上所有基因座或所有基因座,例如,通过测序在隔室中实质上所有核酸,优选所有DNA。可采用偏离的方式(例如,通过选择来分析在人细胞中所有23000个蛋白质编码基因)或采用没有偏倚的方式(例如,通过将基因组分成某些尺寸的窗口,例如,100bp至10Mb的窗口,优选1kb至1Mb,5kb-50kb或10kb-30kb窗口)来测定待分析的基因座。此外,本发明的方法可采用在不同的等位基因之间不区分的方式(例如,在正常的人细胞中存在的基因的两个同源拷贝)来施用,或者,其可用于区分在相同的细胞中基因座的两个(或在例如,多倍体两栖动物细胞的情况下,更多个)等位基因。
本发明的方法允许检测多个共分离基因座,特别是,多于两个共分离基因座,优选多于3,多于4,多于8或多于20个共分离基因座。与此相反,已尝试使用基于3C的方法鉴定多个相互作用,并且显示无效并且高度偏离(Sexton等人,2012,Cell 148:458-72)。存在显示基于3C的方法的这些实验限制将保持不能克服的数学证据,与增量改进无关(O’SullivanJ.M.等人,2013,Nucleus 4:390-8)。特别是,在基于3C的方法中,作为用于鉴定相互作用的基础,碎片DNA分子(仅具有两个末端)的彼此连接导致当同时相互作用基因座的数量提高超过3个相互作用基因座时,检测较高多样性相互作用变得更困难的现象。然而,已知活性基因通常与3个或甚至更多增强剂相互作用(Markenscoff-Papadimitriou E等人,2014。Enhancer lnteraction Networks as a Means for Singular Olfactory ReceptorExpression(作为单数嗅觉系数受体表达手段的增强剂相互作用网)。Cell 159:543-557),并且活性基因彼此相互作用(Schoenfelder等人,2010。Preferential associationsbetween co-regulated genes reveal a transcriptional interactome in erythroidcells(在共调节的基因之间的优先关联揭示在红细胞中的转录相互作用组)。Nat.Genet.42:53-61)。此外,在基因组中限制位点不随机分布,导致检测的偏离。连接的效率受DNA碎片的不同长度的影响,这增加与基于3C的结果的进一步偏离。本发明的方法优选不受或实质上不受这些偏离的影响(图10)。
与基于3C的方法的现有技术相反,在GAM方法中需要核酸的无限制消化,其涉及隔室的切片。对于本发明的所有步骤或方法在初始存在于隔室中的核酸之间不发生连接,特别是,在步骤(b)之前必须没有实施连接。然而,例如,在检测存在或不存在核酸基因座的情境下,例如,用于扩增或测序,使用外部连接剂,连接是可能的。避免衍生自隔室的核酸彼此的限制消化和连接克服基于3C的方法的结构偏离。
在这个意义上,与竞争技术相比,GAM是独特的,因为其可同时鉴定存在于给定的切片中的所有基因座(通过FISH,在技术上是不可能的),并且当它们相互作用和它们不相互作用两种情况下,其可鉴定基因座的接近性,共同地,当一次存在多于3基因座相互作用时,同时检测基因座相互作用的多样性(基于3C的方法是不可能的)。本发明方法的优点之一还有其可用于鉴定在进行该方法之前不知道的基因座的空间接近性,即,可在新发现的或非定义的基因座之间鉴定相互作用。例如,本发明的方法可用于鉴定与特定关注的基因座相互作用的所有基因座,其中在进行分析之前不需要这些基因座中的任一个是已知的。
FISH的最重要的限制在于你必须事先知道基因组的哪个区域是你关注的,而GAM允许绘图所有序列,而无需事先知道关注哪一个。在研究和诊断情境二者中,这一点是重要的,因为重要的基因重排通常具有许多变体。例如,在ETS基因家族的所有前列腺癌成员的约一半至四分之三通过基因组重排加入到各种基因启动子;这具有诊断重要性(Mehra等人,2007。“Comprehensive Assessment of TMPRSS2 and ETS Family Gene Aberrationsin Clinically Localized Prostate Cancer(在临床定位的前列腺癌中TMPRSS2和ETS家族基因畸变的综合评定)”。Modern Pathology 20(5):538-44)。在任一种情况下,ETS基因可为ERG、ETV1、ETV4、ETV5以及可能其它的(Brenner等人,2009,Translocations inEpithelial Cancers(在上皮癌中的易位)。Biochimica Et Biophysica Acta1796(2):201-15);和ETS基因可与TMPRSS2、SLC45A3、KLK2和其它基因结合(Brenner等人,2009);和通过各种重排可实现这一点(Clark等人,2008,Complex Patterns of ETS GeneAlteration Arise During Cancer Development in the Human Prostate(在人前列腺中在癌症发展期间ETS基因变化的复杂模式上升)。Oncogene 27(14):1993-2003)。结果是,虽然FISH可检测具体所选的重排(Clark等人,2008),通过FISH来测试所有已知的组合将不现实,而GAM将不仅能发现所有已知的实例,其也将发现新的患者-特异性变体。类似实例是为治疗目标的在肺癌中激酶基因融合:在肺癌中EML4和ALK基因融合,这是治疗目标,可通常通过FISH检测但不总是能通过FISH检测(Maus等人,2012,ldentification of NovelVariant of EML4-ALK Fusion Gene in NSCLC:Potential Benefits of the RT-PCRMethod(在NSCLC中EML4-ALK融合基因的新型变体的鉴定:RT-PCR方法的潜在的益处)。International Journal of Biomedical Science 8:1-6),但是ALK可融合为许多其它基因,包括KIF5B、TFG、KLC1、PTPN3和STRN(Hallberg&Palmer,2013,Mechanistic InsightInto ALK Receptor Tyrosine Kinase in Human Cancer Biology(在人癌症生物学中,ALK受体酪氨酸激酶的机械洞察)。Nature Reviews Cancer 13(10):685-700),并且存在融合的其它激酶,包括ROS1,其融合为至少5个配对(Takeuchi等人,2012。RET,ROS1 and ALKFusions in Lung Cance r(在肺癌中,RET、ROS1和ALK融合)。Nature Medicine 18(3):378-81)。
本发明还提供本发明的方法的用途,用于
(a)确定多个基因座之间的物理距离。由于在步骤(a)中分级分离取决于在隔室中基因座的物理距离,可计算距离。需要知道已产生级分的隔室的平均尺寸以及在隔室中已分开的级分的数量。
(b)绘图在隔室中的基因座和/或基因组结构。基于测定的物理距离,可绘图,用于特定的基因座或染色体结构。
(c)确定多个基因座之间的相互作用的可能性。如所描述的,本发明的方法可用于确定特定的相互作用,并且能够区分主导相互作用与旁观相互作用。
(d)确定在隔室中基因座或染色体的外周或中心位置。通过询问来自给定染色体的序列使用来自不同染色体的较少的其它窗口是否更通常被发现,可推断染色体和单一基因座的径向位置,出于该原因,更可能在核分布图的顶端(外周),而不是赤道(中心)被发现,反之亦然。
(e)分析选自以下的不同的官能要素的相互作用:启动子,增强剂,酶,例如,在转录中涉及的,可换位的要素,转录因子结合位点,阻遏物,基因主体,拼接信号或RNA。
(f)鉴定调节特定基因表达的可调节区域。
(g)鉴定能够影响基因座的共分离的药物的目标和/或效果。
(h)分析基因疗法对基因座的共分离的效果。由于基因疗法或其它基因工程方法、染色体插入或简单地存在核酸可影响基因组结构,例如,其可增强或预防可调节区域与特定的启动子的相互作用,因此影响“不相关的”基因的转录。本发明的方法允许评定基因疗法或基因工程对不同基因座之间的相互作用水平的影响。
(i)绘图染色体重排(诸如易位、删除、级联复制、倒转),例如,在癌症中,包括在特定的亚组织细胞群体中,例如,用于研究重排的克隆进化;
(j)分析在疾病中基因座的被干扰的共分离;
(k)诊断与基因座的被干扰的共分离关联的疾病;
(I)将患有特定疾病的患者分成对特定的药物治疗较多或较少可能响应的亚组,取决于某些基因座或染色体的接近性或位置;
(m)确定染色质压实,其定义为每单位体积基础配对的数量。特别是,通过使用本发明的方法测量由相应的基因座占据的体积,可测定在检查的基因座下染色质压实的等级;和/或
(n)鉴定外源核酸上的基因座(例如,来自病毒或细菌),例如,在外源DNA或RNA上,其与内源基因座相互作用,或鉴定在外源核酸上与基因座相互作用的内源基因座。
因此,本发明还提供一种诊断患者与基因座的被干扰的共分离相关的疾病的方法,所述方法包括,在取自所述患者的样品中,分析在患者中多个基因座的共分离,和将所述共分离与在已经诊断患有所述疾病的受试者中所述基因座的共分离相比较,其中还优选将所述共分离与健康受试者的共分离相比较。或者,基因座的共分离可在细胞的特定的亚组之间比较,其可衍生自相同的患者,例如,肿瘤细胞和正常组织。在本发明的情境下,如果没有特别另外体积,“一个”意味着指“至少一个”。
由于本发明可用于研究在患者中基因座的被干扰的共分离,即,染色质错折叠,其也可有助于具有染色质错折叠关联的疾病的患者的治疗,由于在使用本发明的方法诊断之后,这样的患者可被治疗,以矫正染色质错折叠(Deng等人,2014,Curr Op Genet Dev.25:1-7)。
例如,通过“增强剂采用”可引起人疾病:它们不能正常调节与基因密切空间接近性的增强剂的不适当的定位(Lettice等人,2011,Hum Mutat。32:1492-1499)。本发明的方法可用于研究在患者-衍生的组织中增强剂的空间接近性,以便诊断患有例如癌症的特定亚类型的患者(Nortcott等人。2014,Nature 511:428-434)。或者,如果患者呈现通常由特异性基因的过表达引起的症状,本发明的方法可用于鉴定已变得与关注的基因定位接近的增强剂,因此可呈现用于治疗介入的潜在的目标。在其它情况下,给定的基因的编码区域中,疾病-关联的基因变体可导致该基因的改变的基因表达,其混淆直接解释疾病显型的错调节的染色质接触的发现,但是仅由染色质接触的没有偏倚的绘图揭露(Smemo等人。2014Obesity-associated variants within FTO form long-range functionalconnections with IRX3(在与IRX3的FTO形式长范围官能连接内,肥胖-关联的变体)。Nature 507,371)。本发明的方法可因此用于诊断,例如,癌症或基因偏向的肥胖。
许多临床遗传学是诊断基因疾病,诸如发育延迟的儿童(Cooper,G.M.等人,2011。A copy number variation morbidity map of develop-mental delay(发育-精神延迟的拷贝数量变体发病率图)。Nat.Genet,43,838-846)或精神分裂症(Cook,E.H.,Jr.,和Scherer,S.W.2008。Copy-number variations associated with neuropsychiatricconditions(与神经剂条件关联的拷贝数量变化)。Nature 455,919-923),这通常由基因组中的结构突变(诸如删除和染色体易位)引起。大多数超过细胞遗传学的能力,甚至其中细胞遗传学可检测一部分重排(Gribble等人,2005。Complex Nature of Constitutional DeNovo Apparently Balanced Translocations in Patients Presenting with AbnormalPhenotypes(在呈现异常显型的患者中,构造De Novo显然平衡易位的复杂性质)。Journalof Medical Genetics 42(1):8-16;De Gregori,M.等人,2007。Cryptic Deletions Are aCommon Finding in‘Balanced’ReciprocaI and Complex Chromosome Rearrangements:aStudy of 59Patients(隐蔽删除是在‘平衡的’交互和复杂的染色体重排中共同的发现:59名患者的研究)。Journal of Medical Genetics 44(12):750-62),并且在大多数情况下,不存在候选基因,几乎基因组的任何部分都可被改变,因此FISH没有价值。整个基因组测序可发现候选重排连接,但不是所有的将被检测,一些重排连接将是假象,并且解释关于删除、插入或易位发现的连接不稳健并且难以证实。GAM提供关于基因组的大伸展的异常接近性的信息:至少这补充整个基因组测序并且可能是用于发现实质结构变化的更好的第一方法。
在一种单一实施方案中,本发明提供关于径向位置、染色质接触和染色质压实的整体全基因组信息,其具有提供疾病状态的更精炼的预言的标记物的潜在性。当前,使用单独的方法,独立地研究3个参数。例如,已鉴定特异性基因组基因座的基因座-特异性径向再定位与前列腺癌和/或增生关联,其指示在疾病进展期间基因座-特异性再组织和使患者分层的潜在性(Leshner M等人。2015。Locus-specific gene repositioning in prostatecancer(在前列腺癌中基因座-特异性基因再定位)。Mol Biol Cell.2015.pii:mbc.E15-05-0280.[Epub ahead of print])。与正常乳腺组织相比,在人侵袭性乳腺癌中也已经鉴定特异性基因组基因座的改变的径向位置,其独立于基因组不稳定性(Meaburn KJ等人。2009Disease-specific gene repositioning in breast cancer(在乳腺癌中疾病-特异性基因再定位)。J Cell Biol.;187(6):801-12。doi:10.1083/jcb.200909127)。还已经发现改变的染色质接触与乳腺癌进展的不同阶段关联,诸如在两种不同的染色体之间和在亚染色体区域之间降低的接触(Barutcu AR等人2015。Chromatin interaction analysisreveals changes in small chromosome and telomere clustering betweenepithelial and breast cancer cells(染色质相互作用分析揭示在上皮和乳腺癌细胞之间小的染色体和端粒成簇的变化)。Genome Biol.16(1):214.doi:10.1186/s13059-015-0768-0)。
包括以下实施例来说明本发明,不是要限制其范围。用于实施例的样品制备方法和分析和/或统计方法也可用于本发明的方法,以分析不同起源的样品和/或用于关注的不同的基因座,例如,如本文提及的。因此引用的文献全部结合到本文中用于所有的目的。
图例:
图1:通过测量在核切片中它们的共分离,基因组结构绘图可测量基因座的核接近性。
a,沿着线性基因组密切的基因座在核中可能不具有密切接近性,因此需要该方法来测量在核空间中基因座之间的距离。b,当通过核取薄的切片(核分布图或NP)时,在核空间中更密切在一起的基因座在相同的NP中被更频繁地发现。c,原则上,DNA检测的任何方法(PCR、下一代测序等)可用于记分在每一个NP中存在或不存在基因座。d,当在大的足够数量的NPs中记分基因座时,基因座的共分离可用于产生共分离矩阵,其指示在成对的基因座之间的核距离。
图2:GAM独立地复制在Hi-C研究中先前发现的基因组结构的特征。
a,来自单个NPs的测序行踪显示与进出薄的切片染色质纤维成环一致的模式。b,通过在单一HiSeq车道上多路复用48NPs得到的测序深度足以饱和在每一个样品中30kb窗口的检测。此外,在几乎所有的NPs中鉴定的基因组30kb窗口的百分数在由9μm直径球体的220nm切片预期的核体积百分数范围内。c,GAM和FISH显示在HoxB基因座中3~40kb区域的类似的检测效率。d,以1Mb分辨,通过PCa,GAM和Hi-C鉴定类似的A和B隔室(65%隔室重叠)。e,GAM拓扑鉴定与通过Hi-C鉴定的那些类似的缔合结构域。
图3:通过简单的模式化方法提取的相互作用概率矩阵富集增强剂和活性基因之间的接触。
a,通过随机染色质折叠,在核空间中比预期更密切的基因座可模式化作为基因座遵循随机情况分布的细胞的大群体以及证明密切得多的相互作用的细胞的小的亚群体。因此该模式假定核距离的双峰分配。b,作为强相互作用或随机折叠状态的混合物,基因座的模式化配对鉴定在Pou5f1基因座中离散的相互作用焦点。c,在重叠两个特定特征的所有30kb窗口之间,通过计算使用SLICE估计的平均相互作用概率,鉴定在重叠增强剂或活性基因的30kb窗口之内和之间,相互作用的统计富集(例如,在重叠活性基因的所有窗口和那些重叠增强剂之间)并且与在矩阵对角线随机后得到的相同的值相比较。
图4:用于测量染色质接触的当前的全基因组方法的限制。
a,表格列举用于测量染色质相互作用的当前的全基因组方法并且比较它们的各种限制。b,GAM遭受影响用于绘图基因组结构的当前的全基因组方法的少量限制。
图5:GAM方法概要。
a,在本发明的呈现的实施方案中,在各步骤的新型序列中,GAM组合低温切片、激光捕获显微解剖、整个基因组扩增和下一代测序的现有技术。b,通过核领域,低温切片产生切片,具有极薄的切片厚度。c,鉴定单个NPs,并且使用激光捕获显微解剖与低温切片分离。d,通过显微解剖hgDNA、人基因组DNa,整个基因组扩增用于从分离的NPs提取和扩增DNA。e,下一代测序鉴定在每一个初始NP中存在小鼠基因组的哪一个基因座。如由随机切片预期的,每一个NP含有其中的染色体和亚染色体基因座的不同的补充,并且不是所有的染色体在每一个NP中都能被鉴定。
图6:GAM数据组的品质控制。
a,发现绘图至小鼠基因组的读数百分数和鉴定的窗口的总数是负对照的最好的鉴别器。在同一天收集的NPs的各组之间,在这些参数中鉴定无批次效果,并且共同处理。在进一步处理之前,丢弃绘图至小鼠基因组的<15%读数的NPs。b,在至少一个NP(灰色条)中检测从30kb至1Mb分辨的几乎所有的基因组窗口。一些窗口在9mm组件(例如,在着丝点)中不具有限定的序列,因此不被检测(黑线)。在至少一个NP中检测的窗口的比例随着基因组分辨的降低(即,提高的窗口尺寸)而提高。c,在单一NPs中发现每一个染色体6%的平均值,横过染色体,该比例恒定。
图7:共分离矩阵的归一化,以说明基因座检测频率的差异。
a,对于单个30kb窗口检测频率的分配稍微偏离二项式(binomial)分配,如果独立检测所有基因座,将预期这一点。b,30kb窗口的检测频率大部分独立于它们的GC含量或独立于作为基因组重复注解的窗口的级分。检测频率与可作图性不关联。c,基因座之间的检测频率的差异可巧妙地影响共分离矩阵,但是可通过计算归一化连接不平衡来校正。
图8:408个NPs足以提取在30kb分辨下关于成对基因座的共分离的大多数信息。
a,通过品质控制的408NP数据组的初始批次被侵蚀6次,每一次随机除去68NPs。随后,使用提高数量的NPs绘制在鼠科动物染色体12上用于Esrrb基因座的共分离矩阵。当包括至少约200NPs时,矩阵的结构接近稳定。b,对于较大的区域(30Mb,来自面板a的较小的Esrrb基因座相应于底部底部右手拐角),观察到共分离矩阵的相同的稳定。c,在每一个被侵蚀的数据组和408NP完整数据组之间绘制皮尔森相关系数(PCA)证实,在收集约200NPs后,共分离矩阵开始饱和。
图9:GAM复制围绕先前鉴定的TAD边界非对角线接触显著的耗尽。
a,非对角线接触定量为在从矩阵对角线2的抵销移动的3×3箱子中的平均归一化连接。这意味着围绕通过Hi-C鉴定的TAD边界,归一化连接较低(Dixon J.R.等人,2012。Topological domains in mammalian genomes identified by analysis of chromatininteractions(在通过染色质相互作用的分析鉴定的哺乳动物基因组中的拓扑结构域)。Nature485,376-380)。b,在小鼠ES细胞(mESC)中,在TAD边界的先前公布的列举中,对于每一个TAD边界计算非对角线耗尽,发现这些边界的中值耗尽大于在TAD边界的5000个随机拖曳列举的任一个中观察到的。c,对于所有的TAD边界平均的非对角线相互作用的分布图显示在边界处大的耗尽。显示对于拖曳边界的5000个列举观察到的最大耗尽,用于比较。
图10:在归一化之前和之后,在Hi-C和GAM数据中,染色质接触强度测量的偏离。
比起原始GAM数据,关于a,限制位点密度,b,GC含量,c,可作图性,d,复制时间和e,重复覆盖,原始Hi-C数据显示较大水平的偏离。Hi-C数据(ICE)的归一化仅部分除去偏离,而GAM数据的偏离在归一化后被有效除去。对于偏离的每一个潜在的来源,基于讨论的潜在的偏离,我们将在小鼠基因组中的所有的50kb窗口分成10个相同的组(或者在Hindlll位点密度的情况下,9个组)。对于每一组的平均值±上和下四分点在顶部左柱形图中显示。我们随后计算在10组的每一组中在窗口之间观察到的染色质接触(原始Hi-C:连接频率,归一化Hi-C:ICE归一化连接频率,原始GAM:共分离频率,归一化GAM:归一化连接不平衡),并且将每一个观察到的值除以通过该基因组距离分隔的所有窗口的平均值(预期的值)。热图显示在每一对组之间平均观察到的/预期值。顶行(%正偏离)显示具有高于给定它们的基因组距离预期染色质接触的组的组合,底行(%负偏离)显示具有低于预期接触的组的组合。底部右箱形图在各组的所有可能的组合之上汇总绝对偏离(即,正和负偏离二者)。
图11:由GAM数据,用于检测显著相互作用基因座配对的SLICE统计方法
a)本发明人的基因座配对共分离的统计模式化称为SLICE(共分离的统计推理)。横过基因组,基因座配对(每一个同源拷贝)以相互作用或非相互作用状态存在。通过核的切片可含有两个基因座(M2)、仅一个基因座(M1)或没有基因座(M0)。横过核的群体,相互作用或非相互作用基因座配对具有不同的切片共分离频率。在初始群体中,由观察到的共分离频率估计任意两个基因座的相互作用(Pj)的概率。b)在不同的情况中,SLICE衍生基因座配对的预期的共分离频率;即,当它们处于相互作用(t0,t1,t2)或非相互作用状态(u0,u1,u2)时,在配对共分离中0、1或2个基因座的概率。作为一个实例,对于在距离d处并且在核中具有分配ρ布置的一对基因座,我们在此处在切片V切片(z)中显示u2的公式。c)因此,一旦已限定核状态P2、P1和P0的概率,可衍生NPs的预期的数量作为Pi的变量,并且与观察到的数据相比较。
图12:通过SLICE统计模式鉴定的染色质相互作用包括许多不同的基因组特征并且在大的基因组距离之上延伸。
a,涉及重叠或非重叠基因的30kb窗口的显著相互作用的数量。b,通过存在于每一个窗口的重叠特征,显著相互作用的数量。c,通过重叠特征,在具有显著相互作用的成对窗口之间的基因组距离。d,由归一化连接不平衡矩阵,在每一个基因组距离,通过鉴定最高的5%相互作用配对的基因座,不使用SLICE分析,复制在30kb窗口重叠增强剂或活性基因内和之间,用于相互作用的统计富集,随后计数涉及重叠两个特定特征的窗口的这些相互作用的数量(例如,在重叠活性基因的窗口和那些重叠增强剂之间鉴定的最高的5%相互作用的数量)。通过与在相互作用位置随机化之后得到的相同的值相比较,随后计算富集。
图13:横过所有基因组距离,比起非相互作用基因座配对,通过SLICE共分离鉴定的显著相互作用基因座配更频繁。
横过宽泛的基因组距离,通过SLICE鉴定的成对显著相互作用窗口的平均共分离频率(实线)一致地高于非相互作用窗口的平均共分离频率(虚线)±标准偏差(阴影区域)。
图14:在通过GAM鉴定的最高度相互作用TAD一式三份中,高度富集超级增强剂。
a,2D相互作用矩阵可显示在3个区域之间的重叠接触,这可不正确地解释为单一同时一式三份相互作用。单独使用成对的接触数据,同时的情况是与单独的成对事件(或两个的复杂混合物)不可识别。b,用于鉴定TADs的策略最可能涉及真正地同时、3通路相互作用。底部图显示根据它们的一式三份相互作用记分,TAD一式三份的最终分级,并且取超过TAD一式三份的阈值位置真正同时相互作用。c,在染色体1上,在TAD之间,三路相互作用的实例。矩阵显示经整个区域,显著的成对相互作用,插图显示在3个TAD之间显著的相互作用的图像扩增。TAD的分类在以下显示。d,显示重叠基因组区域的非相邻最高的5%TAD一式三份。每一个垂直线连接可能同时相互作用的3个TAD(基于横过NPs群体,它们频繁的共分离)。e,TADs的分类。重叠超级增强剂的TADs指定为SE。当它们的后面的GRO覆盖在底部25%四分点时,非SE TADs指定为低转录,或者当其在顶部25%时,指定为高转录。f,通过TAD类别,最高的5%一式三份相互作用的基因组跨度。g,最高的5%一式三份高度富集含有SE区域的TADs和高度转录的TADs,其中3个SE TADs之间的相互作用为单一最富集的组合。相对于在随机拖曳一式三份位置后得到的值,以红色或蓝色显示的条分别富集或耗尽。h,在重叠来自Peric-Hupkes等人(2010)50的切片关联的结构域(LADs)的每一类中,TADs的百分数。i,与形成大多数一式三份接触的TADs相比,形成最小一式三份接触的高度转录的和SETADs更频繁重叠或更接近LADs。
图15:一式三份TADs相互作用的分析。
a,在图14g中的富集分析另外显示不落入任何其它类别的TADs(中间TADs)。b,在每一个30kb窗口内,以5kb分辨,通过鉴定平均连接,用于精炼发现特定的结合位点的策略。在活性或增强剂类别中,对于通过连接30kb窗口的SLICE鉴定的每一个显著的相互作用,我们询问在较大的30kb窗口内的特定的亚窗口是否显示与搭档30kb窗口最高连接。特别是,我们感兴趣询问例如,重叠活性基因启动子(或TSS,转录开始位点)或活性基因TES(转录结束位点)或增强剂的5kb窗口是否可被搭档30kb窗口最频繁共分离。c,与位于这些特征的15kb上游或下游的所有5kb窗口相比,与显著相互作用活性30kb窗口(实线)或增强剂30kb窗口(虚线)的平均连接富集重叠活性基因TSSs(左)、活性基因TESs(中)或增强剂(右)的5kb窗口。对于也重叠活性基因TSSs、TESs或增强剂但是与相同的活性30kb窗口(对照窗口;虚线)不显著相互作用的所有其它5kb窗口,看不到该富集。d,用于鉴定在40kb分辨下平均三路连接的策略。对于连接3个超级-增强剂(SE)TADs的每一个顶部一式三份相互作用,我们询问在整个TAD内,直接重叠超级增强剂的40kb窗口是否显示与其它两个相互作用超级增强剂TADs的最高三路连接。e,与超级增强剂的40kb窗口120kb上游或下游相比,与形成顶部一式三份(实线)的其它两个超级增强剂TADs的平均三路连接富集直接重叠超级增强剂的40kb窗口。在形成顶部一式三份(虚线)的超级增强剂(SE)和两个高度表达的高)TADs之间看不到该富集,在超级增强剂和在顶部一式三份(虚线)中不涉及的其它两个超级增强剂TADs之间也观察不到该富集。
图16:GAM还提供关于基因座径向定位和压实的信息。
a,在核内在中心布置的基因座在具有较大体积的赤道NPs中更频繁地被发现。与此相反,与核外周密切布置的基因座在具有较小体积的顶端级分中更频繁地被发现。b,在径向位置数据可用的5种小鼠常染色体中,每个NP覆盖的基因组的平均百分数(作为NP体积的代理)与径向定位负相关。c,比起具有较大体积的相应地压实的基因座,具有较大体积的更多去压实的基因座更频繁地交叉(即,在更多的NPs中检测到)。d,在较高四分点的检测频率的30kb窗口显示更大的平均DNase信号(局部染色质可接近性的度量),如预期是否检测-频率是染色质压实的度量,由于更加压实的染色质可能更少可接近。e,通过后面的GRO,在较高四分点的检测频率的30kb窗口还显示较高的覆盖,指示更大水平的活性转录。这与活性转录的染色质区域的通常的去压实一致,导致检测频率体积-诱导的提高。
实施例
在不存在树脂-包被下,生产薄的核低温切片,通过修改的Tokuyasu方法(Tokuyasu,K.T.,1973,J.CELL Biol.57,551-65,一种用于超薄冷冻切片悬浮细胞和组织的技术;Guillot PV,Xie SQ,Hollinshead M,Pombo A(2004)Fixation-inducedredistribution of hyperphosphorylated RNA polymerase II in the nucleus ofhuman cells(在人细胞的核中超磷酸化的RNA聚合酶II的固定-诱导的再分配)。Exp.CellRes.295,460-468;Pombo A,Hollinshead M,Cook PR(1999)Bridging the resolutiongap:lmaging the same transcription factories in cryosections by light andelectron microscopy(桥接分辨间隙:通过光和电子显微术使低温切片中的相同的转录工厂成像)。J.Histochem.Cytochem.47,471-480),其涉及利用在饱和蔗糖溶液中包被接着在液氮中冷冻,并且在-100℃下切片,低温保护固定的组织。测试由低温切片的材料提取和检测DNA的可行性。根据建立的方案3(图5a,b),以220nm的厚度将mESCs低温切片。通过激光显微解剖4(图5c),将单一核分布图(NPs)与切片分离。随后提取DNA,使成为碎片,使用单细胞全基因组扩增(WGA)5扩增(图5d)。
使用Illumina HiSeq技术,使来自单一NPs的WGA-扩增的DNA测序。来自单一NPs的行踪的目视检查显示各自含有亚染色体区域的不同补充(图5a),如由进出薄的核薄层的染色质预期的。此外,每一个NP含有仅受限的亚组的染色体(平均,7个染色体/NP;图5e)。
已证实通过全基因组测序方法提取和检测DNA的可行性,将小鼠基因组分成相同尺寸的窗口,以便测量它们的共分离。为了确定适当的基因组分辨(窗口尺寸),限定从10kb至1Mb的一定范围的尺寸的规则的基因组窗口,并且先前描述的负-二项式方法的改变用于检测在单个NPs中这些窗口的存在。测序读数的连续腐蚀用于确定在每一个样品中饱和检测正窗口所需的测序的深度(图2b)。对于>95%的测试样品,600k独特的读数足以饱和检测30kb窗口,其允许在单一HiSeq车道上多路复用48NPs。
使用GAM,绘图染色质接触
为了使用GAM绘图染色质接触全基因组,将490个单个NPs测序。基于包括绘图的读数的百分数的标准的组合,评定每一个数据集的品质。在15批次的高达48NPs中收集样品,在独立收集的批次之间可重现品质控制计量学(图6a)。在基于对小鼠基因组低百分数(<15%)的绘图的读数的品质控制之后,由进一步处理丢弃少量的单一NP数据集(82个样品)。
为了探查在我们的408NPs的数据集中获得的基因组覆盖的程度,计算横过整个数据集和在每一个NP中检测不同的基因组区域的程度。在至少一个NP中检测所有基因组30kb窗口的96%(图6b)。单一NPs含有平均6±4%的30kb窗口。这符合预期在单一NPs中含有的核体积的范围,由于mESC核具有9μm的平均直径,并且切片为0.22μm厚。在不同的染色体之间,横过NPs的富集的窗口的平均分数恒定(图6c)。通过将WGA与Illumina测序组合,一起考虑,这些结果显示由单一NPs稳健的DNA提取和检测。
为了进一步测试检测的稳健性,通过GAM和在~40kb分辨下荧光性原位杂化(FISH),比较单一基因座的检测频率。测试横过HoxB基因座的3个基因组窗口,在两种方法中,对于3个40kb窗口,使用7-12%的检测频率,在FISH和GAM之间,发现显著的一致(图2c)。接下来,横过NPs的整个数据集测量基因座检测的全基因组频率。如预期的,基因座检测频率的分配良好近似于二项式分配(图7a)。与该分配的轻微偏离仅与GC含量或通过基因组重复覆盖的窗口的分数弱相关,最强烈地与可绘图性相关(图7b)。这样的偏离可能起源于在给定的NP中彼此相互作用的小比例的基因座,导致不完全独立于基因座之间的检测概率。总之,在检测不同的基因组窗口中,GAM数据集受到系统偏离的最小影响,与基于3C的方法相反(图10)。这可能是由于基于3C的方法依赖于与特定的限制酶位点密切的少量读数的精确绘图,而GAM可检测在大得多的基因组区域内的任何核酸碎片。
为了绘图通过GAM测量的染色质接触,对于每一个单个染色体,横过整个NP群绘图基因座共分离的矩阵。虽然检测到影响检测单个基因座的小的系统偏离,然而一些基因座比其它更频繁地被检测,简单地由于在随机取向中切割NPs的概率统计性质。矫正不同的基因座的检测频率的这些差异,用于使用归一化版本的连接不平衡,如先前描述的6(图7c,图10)。408NPs足以开始探查基因组结构,由于通过使用较少NPs得到的共分离矩阵不显示与围绕280NPs的显著差异(图8a)。通过计算在408NPs的完全数据集和被侵蚀的数据集之间的关联,证实该观察,发现皮尔森关联系数在约300NPs下饱和(图8b)。
基于408 NP数据集,在相同的核分布图中,较密切基因组距离的基因座通常更频繁地被发现,反映在3D空间中它们更密切的距离。对于染色质接触,GAM鉴定的局部优先与先前描述的拓扑结构域类似7。在非常大的基因组距离之前,也观察到指示基因座之间的密切物理接近性的高共分离频率,高达整个染色体的长度(图2d,e)。在Hi-C数据集中这些相互作用不太明显,其可说明在两种方法之间的任何方法差异(图4)。
将GAM数据集与由mESCs7先前公布的Hi-C数据集相比较。目视比较揭示在两种数据集中的类似图案,特别是在较小的长度规格(图2d,e)。在1Mb分辨下,Hi-C和GAM数据集与0.63的总关联系数相关,并且在0.43-0.71范围的单个染色体之间成对关联(Spearman分级关联系数)。
基于它们的接触,先前的Hi-C研究已使用主要组分分析(PCA)将所有基因组基因座分成两个隔室8。在GAM数据集中,相同的方法适用于鉴定隔室A和B(图2d)。发现隔室良好重叠,因为在GAM和Hi-C二者中,66%的1Mb窗口被指定到相同的隔室。
在GAM数据集中可在视觉上鉴定高度自身-相互作用区域,其看起来与在Hi-C中鉴定的拓扑结构域类似。使用“移动箱”方法(图9a),在小鼠mESCs7中,在先前鉴定的TAD边界处,观察到高度显著耗尽非对角线接触,证实在我们的数据集中存在TADs(图9b,c)。
使用SLICE,由GAM数据提取相互作用概率(频率)
DNA FISH研究已显示横过细胞,染色质折叠不均质:当在显微镜下直接检查在两个限定的基因座之间的相互作用时,它们通常仅在细胞的小的亚群体中被发现(SimonisM.等人,2006。Nuclear organisation of active and inactive chromatin domainsuncovered by chromosome conformation capture-on-chip(通过染色体构型捕获-在碎片上揭露的活性和非活性染色质结构域的核组织)(4C)。Nat.Genet.38(11):1348-54)。测量共定位因此代表群体平均值。相互作用强度的大多数在生物学上相关的测量保持为在其中发生的细胞群体的分数。当施用于细胞群体时,基于构象-捕获的方法可鉴定比预期的更频繁彼此接触的基因座,但是它们不能接近关于在单细胞中这些接触的频率的定量信息。
为了估计在单个细胞中发生的相互作用的概率,本发明人开发了简单的统计模式(SLICE计算平台,共分离的统计推理)。其考虑具有非常密切(<100nm)相互作用或随机折叠的基因座配对的细胞的混合群体。在少量简化假定下,最佳描述数据的相互作用(Pi)的概率经由数学方法衍生:核体积近似为球体,在不同的染色体上等位基因之间的相互作用考虑微不足道9,并且两个基因座的物理距离与它们的基因组距离成比例。通过还假定大多数基因座非相互作用(在给定的基因组距离下,基因座之间的平均相互作用概率小),该缩放可经由在给定的基因组距离下所有基因座配对的平均共分离来近似。这种类型的模式化方法非常难以施用于Hi-C数据,由于测量的参数(连接频率)不是距离的直接应变量。使用该基本模式化方法的进一步精心制作,“主导”染色质相互作用可由“跟随的”相互作用解剖,其由于相邻或附近基因座的“主导”相互作用而发生。
施用该模式以估计在成对基因座之间的相互作用矩阵。在统计上测定的阈值随后施用于数据集,以保护具有足够高频率以赋予统计置信度的仅那些相互作用。
相比对于它们的基因组距离所预期的,SLICE模式用于鉴定在核空间中在短物理距离(<100nm)下更频繁布置的所有基因座配对,并且用于估计横过细胞群体基因座相互作用的频率。选择100nm作为用于特定接触的紧迫距离,如通过FISH最近测量的(Williamson等人。201458)。首先,对于在相同的染色体上所有可能配对的基因座,估计Pi。本发明人随后选择仅具有显著相互作用的那些基因座,意味着具有比偶然预期的更大Pi的那些。
通过SLICE鉴定的最显著的相互作用相应于在相同的切片中最频繁共分离的基因座配对(图13)。例如,通过10Mb共分离分隔的基因座平均为5.3/408NPs(1.29%)。与此相反,通过10Mb共分离分隔的显著相互作用基因座为10.1/408NPs(2.47%)。该方法得到比任一种Hi-C或GAM共分离矩阵小得多的均质模式的相互作用矩阵(图3b)。图含有许多更加离散的点,这可表示通过超过给定阈值的相互作用形成的染色质回路的特定的基础(基因座)。
已建立该模式,SLICE用于估计在不同分辨下的检测效率。该方法建议在30kb分辨下检测效率为80%,证实30kb为用于该数据集的最优化分辨并且与由比较GAM与低温FISH的效率估计良好一致。该模式也用于考虑在每一个管中切割多于一个NP的可能性和在一定范围的不同的厚度下的切割切片。220nm的厚度的一个NP/管最优化用于本发明的目的,但是对于研究具有更大或更小核的有机体可能不是最好的选择,其中在单一管中可能同时分析多于一个(优选2个、3个或更多个)NP。
为了探查在Pi矩阵中相互作用的性质,探查含有独特基因组要素的30kb窗口的相互作用概率。本发明人使用SLICE来鉴定(189,000,000可能的内-染色体配对的)10,000,000高置信度常染色体相互作用,其中7,200,000涉及基因区域(图12a)。对于每一个30kb窗口,平均鉴定254个显著的相互作用(±183标准偏差;图12b)。鉴定的相互作用的数量随着基因组距离而降低,如预期的,但是跨度几十Mb。例如,4,500,000显著的相互作用涉及活性基因,3,000,000跨度小于60Mb,而1,500,000跨度大于60Mb(图12c)。
在mESCs中先前公布的mRNA-seq和碎片-seq11用于将基因分成3类:活性(FPKM>1)、Polycomb抑制的(FPKM<1,H3K27me3+和/或H3Aub1+)或非活性(FPKM<1,没有H3K27me3或H3Aub1)。由先前的研究12也包括预测的增强剂的列举。将与基因或增强剂重叠的所有30kb窗口记分,并且将不同的基因/增强剂种类之间的显著相互作用的数量与随机预期相比较。发现在活性基因和增强剂种类内核之间,相互作用矩阵含有特别高数量的显著的相互作用(图3c)。例如,比起随机对照,含有活性基因的窗口使得与含有其它活性基因的窗口显著更多接触。与此相反,非活性基因之间的接触与如偶然预期的一样频繁地发生。在连接数据中,在每一个距离处,没有SLICE分析,通过将富集分析施用于最高的5%的相互作用,也得到类似的结果(图12d),显示它们为GAM数据集的固有特征。这样强调GAM方法用于鉴定可调节要素和它们的同源基因之间的相互作用的效率。GAM检测官能基因组区域之间的接触的特异性显示GAM为用于解剖特定的SNPs和其它基因组变体在基因组折叠和错误调节的基因表达中的作用的强有力的方法。
检测相互作用三联体
GAM具有捕获染色质空间组织全基因组的许多另外的方面的潜在性,诸如多价染色质相互作用(相互作用涉及2个、3个或更多个基因组区域)、染色体的径向分配和亚染色体区域和染色质压实。本发明人显示mESC-400数据集已经容纳足够的信息来揭示在3个或更多个基因座之间的多价相互作用。GAM统计的详细分析指示当前的mESC-400数据集允许在数百千碱基的分辨下检测三联体接触,其相应于TADs的染色质组织水平。
成对接触矩阵不能区分同时的三联体相互作用与在相同的细胞中不发生的独立的成对事件(图14a)。为了鉴定真实的三联体相互作用,本发明人延伸SLICE至考虑三联体,并且在<100nm的相同的紧迫空间距离下,计算同时、三路相互作用(Pi3)的概率,用于在3个TADs内所有可能的组合窗口(图14b)。它们考虑仅通过显著的成对相互作用连接的TADs的三联体并且使用40kb窗口,以使分辨与公布的TAD定义匹配(Dixon等人,2012)(Methods)。随后,候选TAD三联体通过它们的组成40kb窗口的平均Pi3而分级(图14c,图15a),并且保护具有最高相互作用记分的最高的5%TAD三联体。这些最高的5%代表横过小鼠常染色体,170,000高度相互作用三联体(图14d)。
通过单分子跟踪实验,给定在活的mESC核中增强剂-约束的Sox2转录因子的显著成簇的最近的观察(Liu等人,2014),其测试含有高密度的富集多能性转录因子结合的可调节要素的TADs是否可存在于顶部相互作用TAD三联体内。因此,根据存在具有高-占位性的转录因子Oct4、Sox2和Nanog的成簇的增强剂,将所有TADs分类,所述增强剂已被称为强的、伸展或超级增强剂(SEs)(Whyte等人,2013)。使用公布的基因组Run-On(GRO-seq)数据集,根据它们的转录水平,将不含SEs的TADs细分(Min等人,2011),作为转录活性的度量(图14e)。显著地,本发明人发现在大范围的基因组距离之上,SEs(低转录的和高度转录的TADs)存在于大多数高度相互作用三联体组中(例如,41982三联体涉及SEs,19%跨度基因组距离小于30Mb,81%跨度在30-116Mb(图14f)。
接着,本发明人测试在特定的种类之间的相互作用是否在统计上富集在顶部相互作用TAD三联体中。显著地,他们发现最高度相互作用TAD三联体显著富集连接3个含有SE的TADs的三联体(图14g,图15a)。这样指示在线性染色体中成簇的增强剂的这些阵列在mESCs中以高的多样性在3D空间中也变得在一起,这是在通过活的mESCs的单分子成像,染色质-约束的Sox2的核成簇(Liu等人,2014)以及通过Hi-C检测的超级增强剂之间的成对接触(Ing-Simmons等人,2015)的最近的观察之上发展的结果。显著地,本发明人还发现富集在高度转录的TADs或SE和高度-转录的TADs的组合之间形成的三联体,与活性基因共定位的先前的观察(Pombo等人,1999;Osborne等人,2004)一致。与此相反,比起偶然预期的,由最小转录的TADs组成的三联体较少频繁地发生,这可能是它们与核薄层优先缔合的结果(Peric-Hupkes等人,2010)(图14h)。感兴趣的是,观察到重叠或与薄层-关联的结构域(LADs)密切的SE和高-转录TADs也在较少的三路相互作用中涉及,指示相邻TADs的切片缔合保持活性区域,并且限制它们接近更中心的增强剂簇(图14i)。
这些分析鉴定重叠增强剂和活性基因的窗口作为染色体折叠的主要决定因素。为了检查在相互作用窗口内,通过活性基因和/或增强剂,相互作用是否可成核,本发明人计算在5kb分辨下的归一化连接(图15b)。比起这些特征的15kb上游或下游的5kb窗口,他们发现重叠增强剂、启动子(TSS)或活性基因的转录末端位点(TES)的5kb窗口具有与显著相互作用活性30kb窗口较高的平均连接。与增强剂30kb窗口相互作用也看到该富集,但是对于在30kb分辨下不相互作用的活性窗口,看不到该富集(图15c)。类似地,与120kb上游或下游的40kb窗口相比,发现在形成顶部三联体的SE TADs之间的平均三路连接富集直接重叠超级增强剂的40kb窗口(图15d,e)。
使用GAM来探查径向定位和压实
GAM保持动力来探查在3D核空间中染色质组织的另外的空间特征。本发明人开发使用mESC-400数据集,GAM方法的两种立体学应用。关于核,作为切片的随机取向的结果,源自不同维度的核的NPs的DNA含量可用于估计基因组区域的径向分配。例如,通过定义,比起赤道NPs,通过与它们的外周密切的核切割的NPs含有较小体积的核体积(或DNA含量;Branco等人,2008)(图16a)。因此,被每一个NP覆盖的基因组的百分数可用作相对于大多数赤道NPs其纬度的代理。实际上,本发明人发现在较小NPs中检测染色体的频率与它们的径向位置相关(如先前在mESCs中对于五种染色体测量的(Mayer等人,2005)),其中较低的平均DNA含量相应于更多的外周位置(图16b)。
本发明人进一步探查染色质折叠的更加局部的特征,其原则上也可通过GAM来评定。本发明人推论,比起更加浓缩的基因座,去浓缩的基因组基因座将占据更大的体积(或者采用更加伸长的构象)。因此,比起较小的或更加球形的基因座,更加去浓缩的基因座应交叉更加频繁(并且在随机-取向的核分布图中更加频繁地被检测)(图16c)。去浓缩的染色质应该更加可接近酶分裂,例如,使用DNAse I,并且本发明人发现在公布的DNase-seq数据集中30kb窗口的覆盖与在GAM mESC-400数据集中它们的检测频率相关(Spearman’s r=0.47,p≤10-6;图16d)。在结构蛋白质的过表达之后,对于单个基因座或全球,已显示转录活性与染色质去浓缩相关。本发明人进一步发现通过GRO-seq覆盖测量的转录活性30kb基因组窗口(Min等人,2011)与它们在单一NPs中的检测频率正相关(Spearman’s r=0.27,p≤10-6;图16d)。这些结果允许它们第一次报道,在小鼠ESCs中,在30kb分辨下,转录水平和染色质体积(浓缩)之间的全基因组缔合。这些分析已经说明GAM研究核组织的特征的潜在性,核组织迄今为止保持不可接近和以全基因组规格不能探查。
讨论
GAM为采用没有偏倚的方式用于捕获染色质接触的新型、无连接方法,独立于用于测量3D基因组拓扑学和定位的所有其它当前的技术。GAM揭露在mESCs中染色质的3D结构的复杂的组织,其中官能基因组区域位于特定的染色质接触的下面。尤其显著的是在增强剂要素和转录的区域内和之间富集成对染色质相互作用。鉴定在TADs之间丰富的三路相互作用,其中多个强增强剂和高度转录的区域在相同的核中同时缔合,揭示横过大的基因组区域,可调节要素形成较高顺序接触。与此相反,通过限制接近更加中心的增强剂簇或通过限制可用于形成多个接触的表面,与核薄层的接近性看起来抑制形成涉及高度转录的TADs的较高复杂性接触。
重要的是,通过GAM得到的结果独立地证实使用其它方法得到的发现,包括通过5C/Hi-C鉴定优先自身-缔合基因组区域(TADs)和在活细胞成像中通过转录因子Sox2(增强剂标记物)约束的染色质的观察到的成簇。同时,GAM的全基因组规格和位置信息的不同方面的整体收集(接触,径向定位和压实)增加先前的技术不能提供的新的分析机会。
开发SLICE提供一种用于GAM的通常的统计模式,其可由GAM数据集提取关于染色质相互作用的定量信息。考虑基因组距离,这允许鉴定显著成对和三路接触。使用较大的GAM数据集,SLICE可延伸至整合不同的核或染色体形状或体积,与核外周和核结构的其它特征缔合,以在高分辨下增强检测特定的相互作用染色质区域。
含有几千NPs的较大的GAM数据集应允许探究由GAM提供的另外的分析可能性,包括成对的较高分辨定量、三联体和较高多样性接触、体积和径向定位全基因组以及不同接触的相互依赖性(图4)。重要的是,GAM可将这些分析引导至通过显微解剖由宝贵的组织样品特定选择的稀有细胞类型,例如由单个患者的活检得到的那些。此外,GAM应与在单细胞中同时检测特定的染色质接触和活性转录相容(Dey等人,2015。Integrated genome andtranscriptome sequencing of the same cell(相同细胞的整体基因组和转录组测序)。Nature Biotechnology,33(3):285-289),这对于解剖起因的关系将至关重要。
总之,GAM为基因组生物学家的清单增加了强有力的新的工具,并且将我们的能力显著扩张至精细解剖三维染色质结构,使得许多通过实验先前无法回答的问题在宽泛的模式系统、细胞类型和有价值的人样品中变得易处理。GAM对于在稀有细胞类型中研究染色体折叠的独特的适应性在解剖在人疾病中天然序列变体的作用中将没有价值。
方法
细胞培养物
用于该实例的小鼠ES细胞(mESCs)为46C line13、E14tg2a的Sox1-GFP衍生物和Domingos Henrique的礼物(lnstitute of Molecular Medicine,Lisbon,Portugal)。如先前描述的14进行mESC培养。简要地,在0.1%涂布明胶的盘子上,在补充10%胎牛血清、2ng/ml LIF和1mM 2-巯基乙醇的Glasgow Modified Eagles培养基中,在5%CO2孵育器中,使细胞在37℃下生长。每隔一天使细胞传代。在收获前,在最后的传代24小时之后,在不含血清的ESGRO完全克隆级别培养基(Millipore lnc.)中将mESCs再铺板。可改为使用其它细胞。
制备低温切片
如先前描述的2,准备细胞用于低温切片。简要地,将细胞在4%和8%多聚甲醛/250mM HEPES-NaOH(pH 7.6;分别10分钟和2小时)中固定,成粒,在2.1M蔗糖/PBS中包被(2小时),在液氮中冷冻。冷冻的细胞可无限期地在液氮中储存。以约220nm厚度,使用UltraCut UCT 52超低温切片机(Leica,Milton Keynes,UK)切割超薄低温切片。在蔗糖溶液液滴中捕获切片,转移至1mm厚的PEN膜覆盖的载玻片,用于激光显微解剖(Leica,MiltonKeynes,UK)。为了除去包被培养基的蔗糖,载玻片用0.2μm过滤的分子-生物学级别PBS(每次5分钟)洗涤(3次),随后用过滤的超纯H2O(每次5分钟)洗涤(3次),让其干燥15分钟。在少数情况下,第三次PBS洗涤用分子-生物学级别碘化丙啶(1μg/ml,在PBS中)5分钟染色来替代。
核分布图的分离
使用PALM微光束激光显微解剖显微镜(Carl Zeiss,Jena,德国),通过激光显微解剖,由低温切片分离单个NPs。在亮场成像下鉴定核,激光用于围绕每一个核切割载玻片膜。使用激光压力快速移动,将切割的NPs随后快速移动至填充不透明的粘合剂材料的PCR CapStrip中。让八个中的每一个条中的一个孔空着,通过WGA过程取其作为负对照。这五个负对照也用于制备测序库,用于品质控制目的(图6a)。
全基因组扩增
进行使用WGA4试剂盒(Sigma)的全基因组扩增,对先前描述的方案5具有较少的修改。将水(13μl)加入到每一个含有分离的NP的朝上的PCR盖中(在该步骤和以下的步骤中,相对于供应商的方案,缓冲液的体积已提高,以便覆盖PCR帽盖的整个内表面)。将PK主混合物(含有8μl蛋白酶K溶液,128μl 10x单细胞裂解和碎裂缓冲液)加入到每一个盖(1.4μl/盖),将1μl人基因组DNA加入到单一的盖中,没有核分布图用作正对照。在96-孔PCR板中压制盖,在50℃下上下翻转孵育4小时。
孵育后,让PCR板在室温下冷却5分钟,随后倒转,在800xg下离心3分钟。在PCR机器中,将板在99℃下热失活4分钟,在冰上冷却2分钟。将2.9μl 1x单细胞库制备缓冲液和1.4μl库稳定溶液加入到每一个孔中,将板在95℃下孵育4分钟,随后在冰上冷却2分钟。将1.4μl库制备酶加入到每一个反应,随后将板在PCR机器上在16℃下孵育20分钟,24℃下孵育20分钟,37℃下孵育20分钟,最后75℃下孵育5分钟。
在WGA库制备后,将PCR板在800xg下离心3分钟。将10x扩增主混合物(10.8μl)、水(69.8μl)和WGA DNA聚合酶(7.2μl)加入到每一个孔中,使用供应商提供的程序将样品PCR扩增。
全基因组扩增在一天中通常进行,但是在一些情况下,中途通过方案,将样品在-20℃下储存过夜,在该变量的对照测试中,在DNA检测中,没有可检测的差异。
制备用于高-生产量测序的库
使用Qiagen MinElute PCR Purification Kit纯化WGA扩增的DNA,在50μl提供的洗脱缓冲液中洗脱。通过PicoGreen定量测量每一个样品的浓度。随后使用IlluminaTruSeq DNA HT Sample Prep Kit或TruSeq Nano DNA HT试剂盒制备测序库。在两种情况下,用再悬浮缓冲液使样品高达55μl。对于DNA HT试剂盒,将最大1.1μg DNA加入到每一个反应,而对于Nano试剂盒,使用最大200ng。根据制造商的用法说明制备库。对于DNA HT试剂盒,样品尺寸选择为300-500核苷酸使用Pippin Prep机器(Sage Science,Beverly,MA,USA),具有不含EtBr的1.5%琼脂糖暗盒。使用基于珠粒的选择方案,选择使用Nano试剂盒制备的样品为350核苷酸尺寸。
在库制备后,使用Qubit 2.0荧光剂(Thermo Fisher Scientific,Waltham,MA,USA)估计库浓度,在96批次中,将库合并在一起。每一个库池在单一末端中测序,以快速运行模式,100bp在Illumina HiSeq机器的两个车道上运行。由于在每一个读数的两个末端都存在30bp WGA接合器,使用由Illumina提供的惯常运行处方,实施每一个运行的第一个30bp,而没有使流动细胞成像(这些称为暗周期)。
高-生产量测序数据分析
使用Bowtie215,将读数绘图至M.musculus基因组的mm9组件。除去不能独特绘图、具有小于20的品质记分或为PCR复制品的读数。
在GAM样品中呼叫正窗口
使用bedtools16,将小鼠基因组分成相同尺寸的窗口,bedtools multibamcov用于计算在重叠每一个基因组窗口的每一个核分布图中读数的数量。Pandas和NumPy蟒蛇包装17用于由重叠每一个窗口的读数的数量计算柱状图,来自SciPy的fmin函数用于将负二项式分配(代表测序噪声)和log正常分配(代表真实的信号)与深度柱状图拟合。使用用于二项式分配拟合的参数,测定读数x的阈值数量,其中观察多于x读数绘图到单一基因组窗口的概率小于0.001。因此,对于每一个样品,独立地测定这样的阈值,如果测序读数的数量大于预定的阈值,将窗口记分为正。
样品品质控制
为了由分析排除低品质数据集,对于每一个样品,测量品质计量学的数量。通过惯常python script测量绘图的读数的百分数和非PCR复制品读数的百分数。对于每一个样品,使用FastQC(bioinformatics.babraham.ac.uk/projects/fastqc)测定测序品质计量学,惯常script用于提取每个基础的平均测序品质记分、二核苷酸重复的数量和来自FastQC输出文件的单一核苷酸重复的数量。使用Fastq-筛分(bioinformatics.babraham.ac.uk/projects/fastq_screen)检查可能的样品污染。预期通过核的薄的切片含有特性比例的全基因组,在簇中组织,并且不含所有常染色体。因此,对于每一个样品,开发惯常python script来测量记分为正的窗口的总数,与另一个正窗口紧邻的正窗口的数量以及正染色体的数量。将所有这些品质计量学加入到主要组分分析,并且寻找最佳区别五种负对照的组分。该分析确定绘图的读数的百分数为大多数预言的公制。负对照具有最大2%绘图的读数,因此,排除具有<15%绘图的读数的所有样品作为保守阈值。
计算测序深度饱和点
NumPy用于侵蚀来自每个样品每个窗口的读数深度的矩阵的读数。以10%-95%的腐蚀率,产生13个新的矩阵,对于每一个被侵蚀的数据集,呼叫正窗口。横过被侵蚀的数据集,比较每一个样品,以得到饱和曲线,其中针对在腐蚀后保留的读数的百分数,绘制鉴定的正窗口的数量。通过将饱和曲线分成两部分,并且比较这两部分的线性回归与在整个曲线上的线性回归,将样品分类为饱和或不饱和的。推定饱和点定义为其中来自两部分拟合的R-平方值的平均最高的点。如果两部分的第二部分的梯度小于第一部分的梯度(即,如果鉴定的另外的正窗口的数量在较高读数深度下更加缓慢地提高),并且如果两部分拟合的平均R-平方大于0.25,大于针对整个曲线的线性拟合的R-平方(即,如果曲线显著区别于直线),则将样品分类为饱和的。
荧光性原位杂化
如先前描述的18实施DNA FISH。小鼠ES-OS25细胞(由W.Bickmore友好提供)如先前描述的36生长。使用F粘粒探头(分别G135P6799B3、G135P67637D6和G135P60674A4)检测HoxB13、HoxB1-3和Skap1基因座。由BACPAC Resources(California,USA)得到F粘粒探头。使用特定的引物(未显示),通过PCR证实F粘粒探头的特异性。通过刻痕翻译(Roche),探头用异羟基洋地黄毒甙元-11-dUTP、荧光素-12-dUTP或四甲基-若丹明-5-dUTP标记,使用MicroBioSpin P-30层析住(BioRad,Hertfordshire,UK),与未结合的核苷酸分离。若丹明-标记的探头的信号用兔子抗若丹明抗体(2小时;1∶500;lnvitrogen)和针对兔子IgG的花青3-共轭的驴抗体(1小时;1∶1000;Jackson ImmunoResearch Laboratories)扩增。用异羟基洋地黄毒甙元标记的探头用绵羊抗异羟基洋地黄毒甙元Fab碎片(2小时;1∶200;Roche)和针对绵羊IgG的AlexaFluor555驴抗体(1小时;1∶1000;Invitrogen)检测。使用FITC标记的探头用针对FITC的小鼠抗体(1小时,1∶500;Jackson Immuno Research Laboratories)和针对小鼠IgG的AlexaFluor488驴抗体(1小时,1∶1000;Invitrogen)检测。核用DAPI染色,在成像前,使用VectaShield(Vector Laboratories)安装coverslips。使用相当于1Airy圆盘的针孔,在配备405nm二极管和氩气(488nm)、HeNe(543nm)和HeNe(633nm)激光的共焦激光-扫描显微镜(Leica TCS SP5;63x油物镜,NA1.4)上获得图像。连续收集不同通道的图像,以预防荧光性泄漏。在lmageJ中合并原始图像(TIFF文件),对比伸展,在Adobe Photoshop中没有阈值。
计算连接矩阵
对于限定的基因组区域,为了计算连接矩阵,首先提取重叠关注的区域的来自每一个样品的基因组窗口。对于重叠窗口的窗口的所有可能的配对,共分离为其中两个窗口记分为正的核分布图除以核分布图的总数的数量。
如先前多定义的6计算连接不平衡(D)和归一化连接不平衡(D’)。简言之,在基因组窗口A和B之间的连接定义为A和B的共分离(参见以上)减去它们的边缘检测频率的乘积。A的边缘检测频率简单地为其中检测A的核分布图的数量除以核分布图的总数。两个基因组窗口A和B之间的归一化连接定义为A和B的连接除以A和B之间最大可能的连接(Dmax)。如果连接>0,则Dmax计算为min((marg(A)*(1-marg(B))),(marg(B)*(1-marg(A)))),其中marg(A)为A的边缘检测频率。如果连接<0,则Dmax计算为min((marg(A)*marg(B)),((1-marg(A))*(1-marg(B))))。
此处,marg(A)为A的边缘检测频率。由连接矩阵L(i,j)计算在相同染色体上的所有区域之间的连接的热图,其中每一条为i和j的归一化连接。这些计算可琐碎地延伸至考虑任何数量的基因座。例如,3个基因座之间的连接计算为A、B和C的共分离减去A、B和C的边缘检测频率的乘积。
由相互作用数据集限定隔室A和B
根据先前公布的方法8,23,计算隔室A和B用于GAM和Hi-C。每一个染色体用矩阵O(i,j)表示,其中每一条记录基因座i和基因座j之间观察到的相互作用。产生新的矩阵E(i,j),其中每一条是在i和j之间,在具有相同距离的矩阵O中,对于所有位置,相互作用的平均数。O除以E,得到K(i,j),为在预期值之上观察到的矩阵。随后计算最终的矩阵C(i,j),其中每一个位置是矩阵K的柱i和柱j之间的关联。对关联矩阵C进行主要组分分析,随后提取解释大多数变量的3种组分。在这些3种组分中,与GC含量具有最好关联的一个用于限定A和B隔室。
在GAM/Hi-C矩阵中偏离的估计
为了比较GAM和Hi-C之间的偏离,基于它们的平均GC含量,将50kb基因组窗口指定为10个相同组中的一个。以50kb分辨,由GAM和Hi-C数据二者,对于每一个染色体,随后计算经预期的(OE)矩阵观察到的(参见“由GAM和Hi-C数据集限定A和B隔室”)。对于两种GC含量组的每一个组合,采用在两组中窗口之间的接触的平均OE值,通过GC含量导致平均OE值的热图。随后重复相同的方法,通过平均可绘图性、它们含有的Hindlll位点的数量、它们的平均复制时间或重叠注释的基因组重复的每一个50kb窗口的百分数,使50kb窗口成层。
鉴定拓扑缔合结构域
在mESCs中,由先前的研究7得到拓扑缔合结构域边界的列举。在3×3箱子中测量平均归一化连接不平衡,该箱子从连接矩阵的对角线以两个窗口的抵销移动,作为非对角线相互作用的度量。通过比较在先前描述的拓扑结构域边界处的非对角线相互作用与在上游和下游结构域边界150kb的非对角线相互作用,对于在数据集中这些先前限定的边界,测量非对角线相互作用的耗尽。通过比较观察到的非对角线耗尽与由TADs的5000个随机拖曳组测量的耗尽,评定该耗尽的统计显著性。
使用SLICE方法,由GAM数据提取相互作用概率
在小鼠基因组中,对于30kb窗口的所有配对,测量含有两个轨迹的管的数量与含有至少一个轨迹配对成员的管的数量之间的比率。随后在相同的基因组距离下,经轨迹的所有配对,对该比率取平均,对于每一个染色体,单独计算。通过比较该基因组平均值与每一个单个轨迹配对观察到的比率,可鉴定在相同的染色体上,在相同的距离下,比起轨迹的平均配对,更加频繁共分聚的轨迹的配对。数学模式用于估计需要具有密切(<100nm)相互作用以便得到观察到的比率值的细胞的分数。随后丢弃其中在该基因组距离下,观察到的比率在对于非相互作用轨迹预期的比率的95%内的任何轨迹配对。
在三联体中TADs相互作用的分析
为了同时鉴定TADs相互作用的三联体,首先鉴定3个TADs的组,其中所有3个TADs显示通过SLICE鉴定的显著的成对相互作用。对于所有这样的三联体,使用SLICE计算组成TADs的所有40kb窗口的Pi3。此处使用40kb窗口作为在40kb分辨下给出的在Dixon等人(2012)中的TAD位置。最后,通过它们的平均Pi3以及用于富集分析选择的最高的5%,对所有的三联体评级。如果它们重叠任何先前鉴定的超级增强剂,则TADs指定为SE TADs(SEs;Whyte等人,2013)。如果它们分别具有低于第一个四分点或高于第三个四分点的GRO-seq覆盖,则不重叠SEs的TADs分类为低转录或高转录。在覆盖的中间两个四分点的TADs分类为中转录。富集计算为每一个TAD三联体类别(例如,SE/SE/SE)观察到的数量除以TAD三联体的500个随机变更列举的平均,并且如果观察到的计数大于或小于所有随机变更的值,则称为显著的。
为了分析核薄层缔合对三联体形成的影响,使用在mESC细胞中LAD区域的列举(Peric-Hupkes,D.等人,Molecular Maps of the Reorganization of Genome-NuclearLamina Interactions during Differentiation(在分化期间,基因组-核薄层相互作用的改组的分子图)。Mol.Cell38,603-613(2010))。根据在含有TAD的最高的5%中三联体的数量,将TADs分类为最多(顶部15%)和最少(底部15%)形成的三联体。使用最接近的BED工具(Quinlan等人,2010),计算每一类的TADs与LADs的距离。
在5kb分辨下,平均连接的分析
为了限定30kb窗口的染色质相互作用是否集中于它们包含的特征(TSS、TES和增强剂),将精确重叠一种增强剂或活性基因的TSS/TES(FPKM>1;长度>120kb),但是没有其它基因或增强剂的每一个30kb窗口细分为6个非重叠5kb窗口。随后,对于重叠关注特征的5kb窗口±3个上游/下游5kb窗口,计算与其它相互作用“增强剂”或“活性”30kb窗口(包藏30kb窗口与相互作用30kb窗口,SLICE p-值=0.05)的归一化的连接不平衡。这导致其中每一行代表两个30kb窗口之间的单一相互作用的矩阵,圆柱代表关注的5kb窗口±3个上游/下游5kb窗口的连接。为了归一化距离效果,将每一行除以其自身平均。接着,取每个柱的平均,以得到由在距离关注的5kb窗口的每一个距离下的平均连接。最后,将这些平均值除以第一个和最后一个柱的平均,以得到相对于上游/下游15kb,在TSS的平均富集。作为对照,使用包含相同特征(增强剂、TSS、TES)的非相互作用(SLICE p-值>0.05)30kb窗口配对。为了确保类似的距离分配,通过它们的基因组距离,将真实的相互作用储存在10个箱子中,将对照组随机降低,使得对于每一个基因组距离范围的箱子数相同。
在40kb分辨下,平均三路连接的分析
为了限定在均含有超级增强剂的3个窗口(“SE/SE/SE”)之间的三联体染色质接触是否集中在包含的超级增强剂之上,选择含有长度小于40kb的单一SE的所有TADs。40kb窗口在SE以及±3个上游/下游40kb窗口之上集中。将其中TAD边界落入这些40kb窗口中的任一个之内的TADs丢弃。接着,基于涉及所选的TADs的所有“SE/SE/SE”三联体,计算在含有SE的40kb窗口和在两个搭档SE TADs中的所有40kb窗口之间的平均三路归一化连接不平衡。对于所选的含有SE的40kb窗口的上游/下游40kb窗口,重复这一点。如以上对于成对平均连接所描述的,将每一个所得到的行除以其平均,随后对于每一个柱取平均,最后将结果除以的第一个/最后一个柱的平均。在相应于“SE/高/高”TADs的顶部三联体的列举中,对于相同组的所选的SE-TADs和它们的搭档高度-转录的(高)TADs,以及对于横跨相同的基因组距离的非相互作用“SE/SE/SE”三联体TADs(对照),重复整个过程。
由GAM数据估计染色体径向位置
相对于核的中心,作为每一个NP纬度的近似,计算每一个染色体的覆盖作为对于每一个NP,每一个Mb,读数的平均数。对于每一个染色体,取其中该染色体在覆盖的顶部四分点的每一个NP,并且正计算所有基因组1Mb窗口的百分数。NP的百分数覆盖为其半径的度量(Branco等人,2008),因此,含有给定染色体的NPs的平均百分数覆盖为该染色体出现在具有大半径的NPs中的优先性的度量(如更加在中心布置的染色体所预期的)。本发明人关联含有染色体1、2、9、11和14的NPs的平均百分数覆盖与在Mayer等人(2005)中事先测量的它们的径向位置,发现更加外周的染色体在具有较低基因组覆盖的NPs中被发现的倾向。
由GAM数据估计轨迹体积
将小鼠基因组分成30kb窗口,计算其中检测每一个窗口的NPs的数量(其检测频率)。经每一个30kb窗口,将该值与先前公布的GRO-seq数据集的平均覆盖(Min等人,2011)以及与DNAse-seq的平均覆盖(在核小体水平下,染色质宽阔的度量;Yue,F.等人,2014。Nature515,355-364)关联。
参考文献
1.Dear,P.H.&Cook,P.R.Happy mapping:a proposal for linkage mapping thehuman genome(对于人基因组连接绘图的提议)。Nucleic Acids Res.17,6795-807(1989)。
2.Guillot,P.V,Xie,S.Q.,Hollinshead,M.&Pombo,A.Fixation-inducedredistribution of hyperphosphorylated RNA polymerase II in the nucleus ofhuman cells(在人细胞的核中,超磷酸化的RNA聚合酶II的固定-诱导的再分配).Exp.CellRes.295,460-8(2004)。
3.Branco,M.R.&Pombo,A.Intermingling of chromosome territories ininterphase suggests role in translocations and transcription-dependentassociations(在中间相混合染色体领地提议在易位和转录-依赖性缔合中的作用).PLoSBiol.4,e138(2006)。
4.Emmert-Buck,M.R.等人,Laser capture microdissection(激光捕获显微解剖).Science274,998-1001(1996)。
5.Baslan,T.等人,Genome-wide copy number analysis of single cells(单细胞的全基因组拷贝数量分析).Nat.Protoc.7,1024-41(2012)。
6.Lewontin,R.C.The Interaction of Selection and Linkage.I.GeneralConsiderations;Heterotic Models(选择和连接的相互作用。I.通常的考虑;杂化模式).Genetics49,49-67(1964)。
7.Dixon,J.R.等人,Topological domains in mammalian genomes identifiedby analysis of chromatin interactions(通过分析染色质相互作用鉴定的在哺乳动物基因组中的拓扑结构域).Nature485,376-380(2012)。
8.Lieberman-Aiden,E.等人,Comprehensive mapping of long-rangeinteractions reveals folding principles of the human genome(长范围相互作用的综合绘图揭示人基因组的折叠原理).Science326,289-93(2009)。
9.Khalil,A.等人,Chromosome territories have a highly nonsphericalmorphology and nonrandom positioning(染色体领地具有高度非球形形态和非随机定位).Chromosome Res.15,899-916(2007)。
10.Mateos-Langerak,J.等人,Spatially confined folding of chromatin inthe interphase nucleus(在中间相核中染色质的空间限定的折叠).Proc.Natl.Acad.Sci.U.S.A.106,3812-7(2009)。
11.Brookes,E.等人,Polycomb Associates Genome-wide with a Specific RNAPolymerase II Variant,and Regulates Metabolic Genes in ESCs(Polycomb使全基因组与特定RNA聚合酶II变体缔合,并且在ESCs中调节代谢基因).Cell Stem Cell10,157-70(2012)。
12.Chen,C.,Morris,Q.&Mitchell,J.a.Enhancer identification in mouseembryonic stem cells using integrative modeling of chromatin and genomicfeatures(使用染色质的整体模式化和基因组特征,在小鼠胚胎干细胞中的增强剂鉴定).BMC Genomics13,152(2012)。
13.Ying,Q.-L.,Stavridis,M.,Griffiths,D.,Li,M.&Smith,A.Conversion ofembryonic stem cells into neuroectodermal precursors in adherent monoculture(在粘着的单一培养物中,胚胎干细胞转化为神经外胚层前体).Nat.Biotechnol.21,183-6(2003)。
14.Abranches,E.等人,Neural differentiation of embryonic stem cells invitro:a road map to neurogenesis in the embryo(胚胎干细胞的体外神经分化:在胚胎中向神经发生的地图).PLoS One4,e6286(2009)。
15.Langmead,B.&Salzberg,S.L.Fast gapped-read alignment with Bowtie 2(使用Bowtie 2快速间隙阅读对准).Nat.Methods9,357-9(2012)。
16.Quinlan,A.R.&Hall,I.M.BEDTools:a flexible suite of utilities forcomparing genomic features(用于比较基因组特征的一套灵活的实用性).Bioinformatics26,841-2(2010)。
17.Oliphant,T.E.Python for Scientific Computing(用于科学计算的预言者).Comput.Sci.Eng.9,10-20(2007)。
18.Ferrai,C.等人,Poised transcription factories prime silent uPA geneprior to activation(在活化前,平衡的转录工厂引物沉默uPA基因).PLoS Biol.8,e1000270(2010)。
19.O’Sullivan,J.M.,Hendy,M.D.,Pichugina,T.,Wake,G.C.&Langowski,J.Thestatistical-mechanics of chromosome conformation capture(染色体构型捕获的统计机理).Nucleus4,390-8(2013)。
20.Sexton,T.等人,Three-dimensional folding and functionalorganization principles of the Drosophila genome(果蝇基因组的三维折叠和官能组织原理).Cell148,458-72(2012)。
21.Gavrilov,A.a等人,Disclosure of a structural milieu for theproximity ligation reveals the elusive nature of an active chromatin hub(用于接近性绑扎的结构环境的公开揭示活性染色质套节的难以捉摸的性质).Nucleic AcidsRes.41,3563-75(2013)。
22.Yaffe,E.&Tanay,A.Probabilistic modeling of Hi-C contact mapseliminates systematic biases to characterize global chromosomal architecture(Hi-C接触图的概率统计模式化消除系统偏离,以表征球形染色体结构).Nat.Genet.1-9(2011)。doi:10.1038/ng.947
23.Imakaev,M.等人,lterative correction of Hi-C data reveals hallmarksof chromosome organization(Hi-C数据的反复校正揭示染色体组织的特征).Nat.Methods9,999-1003(2012)。
24.Hu,M.等人,HiCNorm:removing biases in Hi-C data via Poissonregression(经由Poisson回归,在Hi-C数据中除去偏离).Bioinformatics28,3131-3133(2012)。
25.Kruse,K.,Sewitz,S.&Babu,M.M.A complex network framework forunbiased statistical analyses of DNA-DNA contact maps(用于DNA-DNA接触图的没有偏倚的统计分析的复杂的网络框架).Nucleic Acids Res.41,701-710(2012)。
26.Van Berkum,N.L.等人,Hi-C:a method to study the three-dimensionalarchitecture of genomes(一种用于研究基因组的三维结构的方法).J.Vis.Exp.e1869(2010)。doi:10.3791/1869。
27.Barbieri,M.等人,Complexity of chromatin folding is captured by thestrings and binders switch model(通过成串和粘合剂开关模式捕获染色质折叠的复杂性).Proc.Natl.Acad.Sci.U.S.A.109,16173-8(2012)。
28.Pombo A.2003.Cellular genomics:which genes are transcribed whenand where?(细胞基因组:基因何时和在哪转录)Trends Biochem.Sci.28.6。
29.Belmont A.S.,2014.Large scale chromatin organization:the good,thesurprising,and the still perplexing(大规模染色质组织:良好的、意外的以及仍困惑的).Curr Op Cell Biol 26,69。
30.Chen et al.,2014.Nano-Dissection and Sequencing of DNA at SingleSub-Nuclear Structures(在单一亚核结构下,DNA的纳米解剖和排序).Small 10:3267。
31.V.,et al.,2013.Cryo-electron tomography:The challenge ofdoing structural biology in situ(低温电子断层照相术:进行原位结构生物学的挑战).J Cell Biol 202(3),407。
32.Deng et al.,2014.Manipulating nuclear architecture(操纵核结构).Curr Op Genet Dev.25:1-7。
33.Chetverin AB,Chetverina HV,2008.Molecular colony technique:a newtool for biomedical research and clinical practice(分子克隆技术:用于生物医学研究和临床实践的一种新的工具).Prog.Nucleic Acid Res.Mol.Biol 82:219-255。
34.Pombo A,et al.1999.Bridging the resolution gap:Imaging the sametranscription factories in cryosections by light and electron microscopy(桥接分辨间隙:通过光和电子显微术,在低温切片中使相同的转录成像).J.Histochem.Cytochem.47,471-480。
35.Maxwell S,等人,2005.Pitx3regulates tyrosine hydroxylase expressionin the substantia nigra and identifies a subgroup of mesencephalicdopaminergic progenitor neurons during mouse development(Pitx3在黑质中调节酪氨酸羟化酶表达并且在小鼠发育期间鉴定中脑多巴胺能先祖神经元的亚组).Dev.Biol.,282(2):467-479。
36.Stock JK,等人,(2007)Ring1-mediated ubiquitination of H2A restrainspoised RNA polymerase II at bivalent genes in mouse ES cells(在小鼠ES细胞中,在二价基因下,H2A的环1介导的泛素化保持平衡的RNA聚合酶II).Nat.Cell Biol.9:1428-35。
37.GavriIov AA,等人,2014.Quantitative analysis of genomic elementinteractions by molecular colony technique(通过分子克隆技术,基因组要素相互作用的定量分析).Nucl.Acids Res.42(5):e36。
38.Maeburn KJ,等人,2009.Disease-specific gene repositioning in breastcancer(在乳腺癌中,疾病-特异性基因再定位).J.Cell Biol.187(6):801-12;
39.Kubben N,et al.2012.Mapping of lamin A-and progerin-interactinggenome regions(核纤层蛋白A-和早老蛋白-相互作用基因组区域的绘图).Chromosoma121(5):447-64。
40.Simonis M,等人,2006.Nuclear organisation of active and inactivechromatin domains uncovered by chromosome conformation capture-on-chip(4C)(通过染色体构型捕获-在碎片上揭露的活性和非活性染色质结构域的核组织(4C))。Nat.Genet.38(11):1348-54。
41.Dubochet J,et al.1988.Cryo-electron microscopy of vitrifiedspecimens(玻璃化样品的低温电子显微术).Q.Rev.Biophys.21:129
42.Markenscoff-Papadimitriou E,等人,2014.Enhancer InteractionNetworks as a Means for Singular Olfactory Receptor Expression(增强剂相互作用网络作为用于单数嗅觉受体表达的手段).Cell 159:543-557。
43.Schoenfelder S,et al.2010.Preferential associations between co-regulated genes reveal a transcriptional interactome in erythroid cells(共调节的基因之间的优先缔合揭示在红细胞中转录相互作用组).Nat.Genet.42:53-61。
44.Min,I.M.等人,Regulating RNA polymerase pausing and transcriptionelongation in embryonic stem cells(在胚胎干细胞中,调节RNA聚合酶暂停和转录伸长).Genes Dev.25,742-54(2011)。
45.Whyte,W.a等人,Master transcription factors and mediator establishsuper-enhancers at key cell identity genes(在关键的细胞同一性基因,主转录因子和调节剂建立超级增强剂).Cell153,307-19(2013)。
46.Mayer,R.等人,Common themes and cell type specific variations ofhigher order chromatin arrangements in the mouse(在小鼠中较高顺序染色质排布的共同主题和细胞类型特定的变化).BMC Cell Biol.6,44-66(2005)。
47.Liu,Z.等人,3D imaging of Sox2enhancer clusters in embryonic stemcells(在胚胎干细胞中,Sox2增强剂簇的3D成像).Elife3,1-29(2014)。
48.Pombo,a等人,Regional specialization in human nuclei:visualizationof discrete sites of transcription by RNA polymerase III(在人核中区域专门化:通过RNA聚合酶III显现转录的离散的位点).EMBO J.18,2241-53(1999)。
49.Osborne,C.S.等人,Active genes dynamically colocalize to sharedsites of ongoing transcription(活性基因动态共定位至前进的转录的共享位点).Nat.Genet.36,1065-71(2004)。
50.Peric-Hupkes,D.等人,Molecular Maps of the Reorganization ofGenome-Nuclear Lamina Interactions during Differentiation(在分化期间,基因组-核薄层相互作用的重组的分子图).Mol.Cell38,603-613(2010)。
51.Branco,M.R.,Branco,T.,Ramirez,F.&Pombo,A.Changes in chromosomeorganization during PHA-activation of resting human lymphocytes measured bycryo-FISH(在通过低温FISH测量的静止人淋巴细胞的PHA-活化期间,染色体组织的变化).Chromosome Res.16,413-26(2008)。
52.Dey,S.S.,等人,Integrated genome and transcriptome sequencing fromthe same cell(来自相同细胞的整体基因组和转录组排序).Nat.Biotechnol.33,285-289(2015)。
53.Binder,K.Applications of Monte Carlo methods to statisticalphysics(将Monte Carlo方法施用于统计物理).Reports Prog.Phys.60,487-559(1999)。
54.Northcott P A.等人,Enhancer hijacking activates GFI1 familyoncogenes in medulloblastoma(在成神经管细胞瘤中,增强剂劫持活化GFI1家族肿瘤学).Nature 511,428-434(2014)。
55.Lettice LA,等人,Enhancer-adoption as a mechanism of humandevelopmental disease(采用增强剂作为人发育疾病的机理).Hum.Mutat.32,1492-9(2011)。
56.Ing-Simmons等人,Spatial enhancer clustering and regulation ofenhancer-proximal genes by cohesion(通过内聚,空间增强剂成簇和增强剂-接近基因的调整).Genome Res.25:504-513(2015)。
57.Smemo等人,2014Obesity-associated variants within FTO form long-range functional connections with lRX3(在与IRX3的FTO形式长范围官能连接内,肥胖-关联的变体).Nature 507,371。
58.Williamson,I.等人,2014.Spatial genome organization:contrastingviews from chromosome conformation capture and fluorescence in situhybridization(空间基因组组织:来自染色体构型捕获和荧光性原位杂化的对比图).Genes Dev.28,2778-2791。
59.Oeffinger M,et al,2007Comprehensive analysis of diverseribonucleoprotein complexes(多种多样的核糖核蛋白复合物的综合分析).NatMethods.4,951-6;
60.Hakhverdyan等人,2015.Rapid,optimized interactomic screening(快速、经优化的相互作用组筛分).Nature Methods 12,553。
61.Pauciullo A,等人,2014Development of a sequential multicolor-FISHapproach with 13chromosome-specific painting probes for the rapididentification of river buffalo(使用13种染色体-特异性涂抹探头开发连续多色-FISH方法,用于快速鉴定river buffalo)(Bubalus bubalis,2n=50)chromosomes.J ApplGenet.55(3):397-401.doi:10.1007/s13353-014-0207-z。
62.Leshner M,等人,Locus-specific gene repositioning in prostatecancer(在前列腺癌中,轨迹-特异性基因再定位).Mol Biol Cell.2015.pii:mbc.E15-05-0280.[Epub ahead of print]
63.Meaburn KJ,等人,2009Disease-specific gene repositioning in breastcancer(在乳腺癌中,疾病-特异性基因再定位).J Cell Biol.;187(6):801-12.doi:10.1083/jcb.200909127。
64.Barutcu AR,等人,2015.Chromatin interaction analysis revealschanges in small chromosome and telomere clustering between epithelial andbreast cancer cells(染色质相互作用分析揭示小的染色体变化和在上皮和乳腺癌细胞之间端粒成簇).Genome Biol.16(1):214.doi:10.1186/s13059-015-0768-0)。
65.Yue,F.等人,A comparative encyclopedia of DNA elements in the mousegenome(在小鼠基因组中DNA要素的比较百科全书).Nature515,355-364(2014)。
Claims (15)
1.一种确定在包含核酸的细胞隔室中多个核酸基因座的空间接近性的方法,其中所述细胞隔室源自细胞,所述方法包括以下步骤:
(a) 根据在隔室中核酸基因座的定位,通过低温切片每个隔室以得到包含多于180个级分的级分群,使核酸基因座彼此分离,其中所述级分群获自多个相同类型的隔室,并且其中生成的切片具有70 nm至1000 nm的厚度;
(b) 通过测序确定在所述级分中存在或不存在多个基因座;和
(c) 确定所述多个基因座的共分离,其中通过使用推理统计方法分析共分离来确定核酸基因座的空间接近性;
在进行步骤(a)之前,其中通过玻璃化保存细胞超微结构或者其中将核、细胞、组织或整个有机体用交联剂处理,
并且其中所述方法不需要对初始存在于隔室中的核酸的限制消化或核酸之间的连接。
2.根据权利要求1的方法,其中所述隔室是真核生物的核并且从切片分离单一核分布图。
3.根据权利要求1的方法,其中所述核酸为DNA和/或RNA。
4.根据权利要求1的方法,其中所述核酸为DNA。
5.根据权利要求1-4中任一项的方法,其中所述隔室为真核细胞的核、线粒体或原核细胞。
6.根据权利要求1-4中任一项的方法,其中在步骤(a)之前用甲醛进行交联。
7.根据权利要求1-4中任一项的方法,其中在步骤(a)中的所述分离通过超低温切片所述隔室进行。
8.根据权利要求1-4中任一项的方法,其中在步骤(a)中,将一个隔室分隔成为5-300个级分。
9.根据权利要求1-4中任一项的方法,其中在步骤(a)中,将一个隔室分隔成为40-60个级分。
10.根据权利要求1-4中任一项的方法,其中所述多个基因座为在所述隔室中两个基因座至所有核酸基因座。
11.根据权利要求1-4中任一项的方法,其中所述方法允许检测至少三个共分离基因座。
12.根据权利要求1-4中任一项的方法,其中使用测序方法确定存在或不存在所述多个基因座。
13.根据权利要求1-4中任一项的方法,其中通过下一代测序,确定存在或不存在所述多个基因座。
14.根据权利要求1-4中任一项的方法,其中当它们以高于由在染色体上它们的线性基因组距离预期的频率共分离时,确定基因座在空间上接近。
15.前述权利要求中任一项的方法用于以下的用途:
(a) 确定多个基因座之间的物理距离;
(b) 绘图在所述隔室中的基因座和/或基因组结构;
(c) 确定多个基因座之间的相互作用的可能性;
(d) 确定基因座或染色体在所述隔室中的外周或中心位置;
(e) 分析选自以下的不同的功能元件的相互作用:涉及转录的启动子、增强子,RNA、转座因子、转录因子结合位点、基因体、剪接信号;
(f) 鉴定调节特定基因表达的调节区;
(g) 对染色体重排进行绘图;
(h) 确定染色质压实;和/或
(i) 鉴定在与内源基因座相互作用的外源核酸上的基因座。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14197405.5 | 2014-12-11 | ||
EP14197405.5A EP3031929A1 (en) | 2014-12-11 | 2014-12-11 | Genome architecture mapping |
PCT/EP2015/079413 WO2016092070A1 (en) | 2014-12-11 | 2015-12-11 | Genome architecture mapping |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107406873A CN107406873A (zh) | 2017-11-28 |
CN107406873B true CN107406873B (zh) | 2021-07-09 |
Family
ID=52102530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580067332.4A Active CN107406873B (zh) | 2014-12-11 | 2015-12-11 | 基因组结构绘图 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10526639B2 (zh) |
EP (2) | EP3031929A1 (zh) |
JP (1) | JP6837970B2 (zh) |
CN (1) | CN107406873B (zh) |
CA (1) | CA2968629C (zh) |
DK (1) | DK3230465T3 (zh) |
IL (1) | IL252591B (zh) |
WO (1) | WO2016092070A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110691792A (zh) | 2017-01-10 | 2020-01-14 | 朱诺治疗学股份有限公司 | 细胞疗法的表观遗传学分析及相关方法 |
EP3580338B1 (en) * | 2017-02-10 | 2024-09-11 | The Rockefeller University | Methods for cell-type specific profiling to identify markers for nuclei isolation |
CN108647492B (zh) * | 2018-05-02 | 2019-04-16 | 中国人民解放军军事科学院军事医学研究院 | 一种染色质拓扑相关结构域的表征方法及装置 |
CN109448783B (zh) * | 2018-08-07 | 2022-05-13 | 清华大学 | 一种染色质拓扑结构域边界的分析方法 |
EP4107284A1 (en) | 2020-02-17 | 2022-12-28 | 10X Genomics, Inc. | In situ analysis of chromatin interaction |
AU2021258994A1 (en) * | 2020-04-23 | 2022-11-03 | Koninklijke Nederlandse Akademie Van Wetenschappen | Structural variation detection in chromosomal proximity experiments |
EP3988669A1 (en) * | 2020-10-22 | 2022-04-27 | Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft | Method for nucleic acid detection by oligo hybridization and pcr-based amplification |
CN115050417B (zh) * | 2022-06-27 | 2024-07-19 | 华南农业大学 | 一种基于染色质随机折叠过程预测染色质域结构tad的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7625697B2 (en) * | 1994-06-17 | 2009-12-01 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for constructing subarrays and subarrays made thereby |
PL1899488T3 (pl) | 2005-07-04 | 2016-03-31 | Erasmus Univ Medical Center | Test uchwytu konformacji chromosomu na czipie (4C) |
GB0810051D0 (en) * | 2008-06-02 | 2008-07-09 | Oxford Biodynamics Ltd | Method of diagnosis |
WO2010065266A1 (en) * | 2008-12-02 | 2010-06-10 | Bio-Rad Laboratories, Inc. | Chromatin structure detection |
CN104169433A (zh) * | 2011-02-04 | 2014-11-26 | 宾夕法尼亚大学董事会 | 在单细胞中同时检测染色体结构和基因表达的方法 |
US20140073520A1 (en) * | 2011-12-23 | 2014-03-13 | California Institute Of Technology | Imaging chromosome structures by super-resolution fish with single-dye labeled oligonucleotides |
EP4321628A3 (en) * | 2013-05-23 | 2024-04-24 | The Board of Trustees of the Leland Stanford Junior University | Transposition into native chromatin for personal epigenomics |
-
2014
- 2014-12-11 EP EP14197405.5A patent/EP3031929A1/en not_active Withdrawn
-
2015
- 2015-12-11 JP JP2017531604A patent/JP6837970B2/ja active Active
- 2015-12-11 WO PCT/EP2015/079413 patent/WO2016092070A1/en active Application Filing
- 2015-12-11 CN CN201580067332.4A patent/CN107406873B/zh active Active
- 2015-12-11 US US15/533,890 patent/US10526639B2/en active Active
- 2015-12-11 DK DK15808219.8T patent/DK3230465T3/da active
- 2015-12-11 CA CA2968629A patent/CA2968629C/en active Active
- 2015-12-11 EP EP15808219.8A patent/EP3230465B1/en active Active
-
2017
- 2017-05-30 IL IL252591A patent/IL252591B/en unknown
Non-Patent Citations (1)
Title |
---|
Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data;Job Dekker等;《Nature Reviews Genetics》;20130509;第14卷(第6期);第390–403页 * |
Also Published As
Publication number | Publication date |
---|---|
CA2968629C (en) | 2023-01-03 |
CA2968629A1 (en) | 2016-06-16 |
CN107406873A (zh) | 2017-11-28 |
IL252591B (en) | 2022-01-01 |
IL252591A0 (en) | 2017-07-31 |
WO2016092070A1 (en) | 2016-06-16 |
US10526639B2 (en) | 2020-01-07 |
EP3230465B1 (en) | 2019-10-16 |
DK3230465T3 (da) | 2020-01-27 |
EP3230465A1 (en) | 2017-10-18 |
JP2017537640A (ja) | 2017-12-21 |
JP6837970B2 (ja) | 2021-03-03 |
EP3031929A1 (en) | 2016-06-15 |
US20170342462A1 (en) | 2017-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107406873B (zh) | 基因组结构绘图 | |
Hwang et al. | Single-nucleus and spatial transcriptome profiling of pancreatic cancer identifies multicellular dynamics associated with neoadjuvant treatment | |
Lee et al. | Simultaneous profiling of 3D genome structure and DNA methylation in single human cells | |
Díaz et al. | Chromatin conformation analysis of primary patient tissue using a low input Hi-C method | |
Hughes et al. | Cell type-specific epigenomic analysis reveals a uniquely closed chromatin architecture in mouse rod photoreceptors | |
Kanton et al. | Organoid single-cell genomic atlas uncovers human-specific features of brain development | |
Beagrie et al. | Complex multi-enhancer contacts captured by genome architecture mapping | |
Liu et al. | Single-cell analysis of long non-coding RNAs in the developing human neocortex | |
Cabili et al. | Localization and abundance analysis of human lncRNAs at single-cell and single-molecule resolution | |
Quillien et al. | Robust identification of developmentally active endothelial enhancers in zebrafish using FANS-assisted ATAC-Seq | |
Llorens-Bobadilla et al. | Solid-phase capture and profiling of open chromatin by spatial ATAC | |
Chen et al. | Single-cell molecular and cellular architecture of the mouse neurohypophysis | |
Lyu et al. | CRISPR FISHer enables high-sensitivity imaging of nonrepetitive DNA in living cells through phase separation-mediated signal amplification | |
Chung et al. | Simultaneous single cell measurements of intranuclear proteins and gene expression | |
Wheeler et al. | Arabidopsis DNA replication initiates in intergenic, AT-rich open chromatin | |
Monserrat et al. | Disruption of the MSL complex inhibits tumour maintenance by exacerbating chromosomal instability | |
Hai et al. | A connectivity signature for glioblastoma | |
Oliveira et al. | Characterization of immune cell populations in the tumor microenvironment of colorectal cancer using high definition spatial profiling | |
Zion et al. | Old and newly synthesized histones are asymmetrically distributed in Drosophila intestinal stem cell divisions | |
Komosa et al. | Visualization and quantitative analysis of extrachromosomal telomere-repeat DNA in individual human cells by Halo-FISH | |
Ernst et al. | Establishment of a simplified preparation method for single-nucleus RNA-sequencing and its application to long-term frozen tumor tissues | |
Jin et al. | Cell type-specific DNA methylome signatures reveal epigenetic mechanisms for neuronal diversity and neurodevelopmental disorder | |
Marti-Marimon et al. | Major reorganization of chromosome conformation during muscle development in pig | |
Handler et al. | Sphere-sequencing unveils local tissue microenvironments at single cell resolution | |
Puerto et al. | Somatic chromosome pairing has a determinant impact on 3D chromatin organization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180302 Address after: Berlin Applicant after: Marx - Helmholtz - ladbrok Center for Molecular Medicine Association Applicant after: Cambridge Entpr Ltd. Address before: Berlin Applicant before: Marx - Helmholtz - ladbrok Center for Molecular Medicine Association |
|
GR01 | Patent grant | ||
GR01 | Patent grant |