CN113195004A - 用于隔室空间组织的系统和方法 - Google Patents
用于隔室空间组织的系统和方法 Download PDFInfo
- Publication number
- CN113195004A CN113195004A CN201980081914.6A CN201980081914A CN113195004A CN 113195004 A CN113195004 A CN 113195004A CN 201980081914 A CN201980081914 A CN 201980081914A CN 113195004 A CN113195004 A CN 113195004A
- Authority
- CN
- China
- Prior art keywords
- composition
- protein
- compartment
- target polynucleotide
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 329
- 230000008520 organization Effects 0.000 title description 17
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 402
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 401
- 239000002157 polynucleotide Substances 0.000 claims abstract description 400
- 108090000623 proteins and genes Proteins 0.000 claims description 486
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 claims description 400
- 102000004169 proteins and genes Human genes 0.000 claims description 399
- 239000000203 mixture Substances 0.000 claims description 237
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 claims description 200
- 238000006471 dimerization reaction Methods 0.000 claims description 141
- 230000014509 gene expression Effects 0.000 claims description 129
- 108020004414 DNA Proteins 0.000 claims description 124
- 230000008685 targeting Effects 0.000 claims description 101
- 102100032918 Chromobox protein homolog 5 Human genes 0.000 claims description 92
- 101710163270 Nuclease Proteins 0.000 claims description 80
- 108010034791 Heterochromatin Proteins 0.000 claims description 73
- 108700014420 Chromobox Protein Homolog 5 Proteins 0.000 claims description 69
- 210000004458 heterochromatin Anatomy 0.000 claims description 67
- 230000000694 effects Effects 0.000 claims description 65
- 108091033409 CRISPR Proteins 0.000 claims description 53
- 239000003446 ligand Substances 0.000 claims description 53
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 52
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 39
- -1 KRAB Proteins 0.000 claims description 35
- 230000001965 increasing effect Effects 0.000 claims description 35
- 230000001413 cellular effect Effects 0.000 claims description 32
- 108020005004 Guide RNA Proteins 0.000 claims description 31
- 230000001939 inductive effect Effects 0.000 claims description 31
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 31
- 239000000539 dimer Substances 0.000 claims description 29
- 108700020462 BRCA2 Proteins 0.000 claims description 26
- 102000052609 BRCA2 Human genes 0.000 claims description 26
- 101150008921 Brca2 gene Proteins 0.000 claims description 26
- 101000753286 Homo sapiens Transcription intermediary factor 1-beta Proteins 0.000 claims description 26
- 102100022012 Transcription intermediary factor 1-beta Human genes 0.000 claims description 26
- 230000027455 binding Effects 0.000 claims description 25
- 101100300093 Arabidopsis thaliana PYL1 gene Proteins 0.000 claims description 21
- 101100300089 Oryza sativa subsp. japonica PYL10 gene Proteins 0.000 claims description 21
- 210000000349 chromosome Anatomy 0.000 claims description 20
- 230000008439 repair process Effects 0.000 claims description 20
- 230000006780 non-homologous end joining Effects 0.000 claims description 19
- 238000005215 recombination Methods 0.000 claims description 19
- 102000014914 Carrier Proteins Human genes 0.000 claims description 18
- 108091008324 binding proteins Proteins 0.000 claims description 18
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 17
- 108091006047 fluorescent proteins Proteins 0.000 claims description 17
- 102000034287 fluorescent proteins Human genes 0.000 claims description 17
- 102100031144 Coilin Human genes 0.000 claims description 16
- 230000004049 epigenetic modification Effects 0.000 claims description 16
- 108010051876 p80-coilin Proteins 0.000 claims description 16
- 102100032919 Chromobox protein homolog 1 Human genes 0.000 claims description 15
- 101710173115 Chromobox protein homolog 1 Proteins 0.000 claims description 15
- 102100028998 Histone-lysine N-methyltransferase SUV39H1 Human genes 0.000 claims description 15
- 101000696705 Homo sapiens Histone-lysine N-methyltransferase SUV39H1 Proteins 0.000 claims description 15
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 15
- 108020001507 fusion proteins Proteins 0.000 claims description 15
- 102000037865 fusion proteins Human genes 0.000 claims description 15
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 14
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 14
- 230000007018 DNA scission Effects 0.000 claims description 14
- 101710105008 RNA-binding protein Proteins 0.000 claims description 14
- 230000001105 regulatory effect Effects 0.000 claims description 14
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical compound COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 claims description 13
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 claims description 13
- 108060002716 Exonuclease Proteins 0.000 claims description 13
- 108010033040 Histones Proteins 0.000 claims description 13
- 101000669895 Methanothermobacter thermautotrophicus (strain ATCC 29096 / DSM 1053 / JCM 10044 / NBRC 100330 / Delta H) Replication factor A Proteins 0.000 claims description 13
- 102000053062 Rad52 DNA Repair and Recombination Human genes 0.000 claims description 13
- 108700031762 Rad52 DNA Repair and Recombination Proteins 0.000 claims description 13
- 230000001086 cytosolic effect Effects 0.000 claims description 13
- 102000013165 exonuclease Human genes 0.000 claims description 13
- 230000006798 recombination Effects 0.000 claims description 13
- 230000002441 reversible effect Effects 0.000 claims description 13
- 102000008682 Argonaute Proteins Human genes 0.000 claims description 12
- 108010088141 Argonaute Proteins Proteins 0.000 claims description 12
- 201000010099 disease Diseases 0.000 claims description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 12
- 230000033001 locomotion Effects 0.000 claims description 10
- 239000000470 constituent Substances 0.000 claims description 9
- 239000003623 enhancer Substances 0.000 claims description 9
- 108010060424 DEAD Box Protein 20 Proteins 0.000 claims description 8
- 102100026091 Probable ATP-dependent RNA helicase DDX20 Human genes 0.000 claims description 8
- 101150030482 SMD1 gene Proteins 0.000 claims description 8
- 230000002759 chromosomal effect Effects 0.000 claims description 8
- 208000024827 Alzheimer disease Diseases 0.000 claims description 7
- 102100026375 Protein PML Human genes 0.000 claims description 7
- 238000013519 translation Methods 0.000 claims description 7
- 108091029865 Exogenous DNA Proteins 0.000 claims description 6
- 201000011240 Frontotemporal dementia Diseases 0.000 claims description 6
- 208000023105 Huntington disease Diseases 0.000 claims description 6
- 208000018737 Parkinson disease Diseases 0.000 claims description 6
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 claims description 6
- 239000000833 heterodimer Substances 0.000 claims description 6
- 239000000710 homodimer Substances 0.000 claims description 6
- 230000013120 recombinational repair Effects 0.000 claims description 6
- 101150059443 cas12a gene Proteins 0.000 claims description 5
- 108091008053 gene clusters Proteins 0.000 claims description 5
- 230000011987 methylation Effects 0.000 claims description 5
- 238000007069 methylation reaction Methods 0.000 claims description 5
- 238000002703 mutagenesis Methods 0.000 claims description 5
- 231100000350 mutagenesis Toxicity 0.000 claims description 5
- 108091005946 superfolder green fluorescent proteins Proteins 0.000 claims description 5
- 102000000872 ATM Human genes 0.000 claims description 4
- 230000035131 DNA demethylation Effects 0.000 claims description 4
- 230000007067 DNA methylation Effects 0.000 claims description 4
- 102100031107 Disintegrin and metalloproteinase domain-containing protein 11 Human genes 0.000 claims description 4
- 101710121366 Disintegrin and metalloproteinase domain-containing protein 11 Proteins 0.000 claims description 4
- 101000904868 Homo sapiens Transcriptional regulator ATRX Proteins 0.000 claims description 4
- 241000083513 Punctum Species 0.000 claims description 4
- 101100355586 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rhp51 gene Proteins 0.000 claims description 4
- 102100023931 Transcriptional regulator ATRX Human genes 0.000 claims description 4
- 230000021736 acetylation Effects 0.000 claims description 4
- 238000006640 acetylation reaction Methods 0.000 claims description 4
- 230000006329 citrullination Effects 0.000 claims description 4
- 230000006196 deacetylation Effects 0.000 claims description 4
- 238000003381 deacetylation reaction Methods 0.000 claims description 4
- 230000017858 demethylation Effects 0.000 claims description 4
- 238000010520 demethylation reaction Methods 0.000 claims description 4
- 230000030609 dephosphorylation Effects 0.000 claims description 4
- 238000006209 dephosphorylation reaction Methods 0.000 claims description 4
- 238000006317 isomerization reaction Methods 0.000 claims description 4
- 238000006384 oligomerization reaction Methods 0.000 claims description 4
- 230000026731 phosphorylation Effects 0.000 claims description 4
- 238000006366 phosphorylation reaction Methods 0.000 claims description 4
- 208000007153 proteostasis deficiencies Diseases 0.000 claims description 4
- 230000034512 ubiquitination Effects 0.000 claims description 4
- 238000010798 ubiquitination Methods 0.000 claims description 4
- 239000000592 Artificial Cell Substances 0.000 claims description 3
- 208000001089 Multiple system atrophy Diseases 0.000 claims description 3
- 208000024777 Prion disease Diseases 0.000 claims description 3
- 108700004991 Cas12a Proteins 0.000 claims description 2
- 101000831940 Homo sapiens Stathmin Proteins 0.000 claims 2
- 102100021947 Survival motor neuron protein Human genes 0.000 claims 2
- 235000018102 proteins Nutrition 0.000 description 323
- 210000004027 cell Anatomy 0.000 description 245
- 238000011282 treatment Methods 0.000 description 95
- 101100240528 Caenorhabditis elegans nhr-23 gene Proteins 0.000 description 89
- 150000007523 nucleic acids Chemical class 0.000 description 70
- 108091027544 Subgenomic mRNA Proteins 0.000 description 64
- 102000039446 nucleic acids Human genes 0.000 description 63
- 108020004707 nucleic acids Proteins 0.000 description 63
- 230000008045 co-localization Effects 0.000 description 57
- 210000004940 nucleus Anatomy 0.000 description 56
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 54
- 238000003776 cleavage reaction Methods 0.000 description 44
- 230000007017 scission Effects 0.000 description 44
- 208000036762 Acute promyelocytic leukaemia Diseases 0.000 description 43
- 230000015572 biosynthetic process Effects 0.000 description 41
- 108010077544 Chromatin Proteins 0.000 description 40
- 210000003483 chromatin Anatomy 0.000 description 40
- 210000000633 nuclear envelope Anatomy 0.000 description 40
- 230000003252 repetitive effect Effects 0.000 description 33
- 108091035539 telomere Proteins 0.000 description 29
- 102000055501 telomere Human genes 0.000 description 29
- 210000003411 telomere Anatomy 0.000 description 29
- 229920001184 polypeptide Polymers 0.000 description 27
- 102000004196 processed proteins & peptides Human genes 0.000 description 27
- 230000004807 localization Effects 0.000 description 25
- 101710160287 Heterochromatin protein 1 Proteins 0.000 description 24
- 230000001404 mediated effect Effects 0.000 description 24
- 230000035772 mutation Effects 0.000 description 23
- 238000011529 RT qPCR Methods 0.000 description 22
- 238000002073 fluorescence micrograph Methods 0.000 description 22
- 238000003384 imaging method Methods 0.000 description 22
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 22
- 108010047956 Nucleosomes Proteins 0.000 description 20
- 210000001623 nucleosome Anatomy 0.000 description 20
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 19
- 241000193830 Bacillus <bacterium> Species 0.000 description 18
- 230000008859 change Effects 0.000 description 18
- 230000003993 interaction Effects 0.000 description 18
- 239000012071 phase Substances 0.000 description 18
- 239000000126 substance Substances 0.000 description 18
- 102100028225 Arf-GAP with coiled-coil, ANK repeat and PH domain-containing protein 2 Human genes 0.000 description 17
- 238000010453 CRISPR/Cas method Methods 0.000 description 17
- 108700008625 Reporter Genes Proteins 0.000 description 17
- 241000193996 Streptococcus pyogenes Species 0.000 description 17
- 230000006870 function Effects 0.000 description 17
- 210000001519 tissue Anatomy 0.000 description 17
- 241000589516 Pseudomonas Species 0.000 description 16
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 13
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 13
- 102100037976 Protein phosphatase inhibitor 2 Human genes 0.000 description 13
- 238000010459 TALEN Methods 0.000 description 13
- 238000011144 upstream manufacturing Methods 0.000 description 13
- 102100034239 Emerin Human genes 0.000 description 12
- 101000724279 Homo sapiens Arf-GAP with coiled-coil, ANK repeat and PH domain-containing protein 2 Proteins 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- 238000009826 distribution Methods 0.000 description 12
- 108010056197 emerin Proteins 0.000 description 12
- 230000005764 inhibitory process Effects 0.000 description 12
- 230000007115 recruitment Effects 0.000 description 12
- HCHFRAXBELVCGG-JYFOCSDGSA-N (2z,3z)-2,3-bis[(4-methoxyphenyl)methylidene]butanedinitrile Chemical compound C1=CC(OC)=CC=C1\C=C(/C#N)\C(\C#N)=C\C1=CC=C(OC)C=C1 HCHFRAXBELVCGG-JYFOCSDGSA-N 0.000 description 11
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 11
- HCHFRAXBELVCGG-UHFFFAOYSA-N Emerin Natural products C1=CC(OC)=CC=C1C=C(C#N)C(C#N)=CC1=CC=C(OC)C=C1 HCHFRAXBELVCGG-UHFFFAOYSA-N 0.000 description 11
- 101000599464 Homo sapiens Protein phosphatase inhibitor 2 Proteins 0.000 description 11
- 241000194017 Streptococcus Species 0.000 description 11
- 230000004913 activation Effects 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 11
- 230000000052 comparative effect Effects 0.000 description 11
- 238000010362 genome editing Methods 0.000 description 11
- 230000011278 mitosis Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 102100038567 Properdin Human genes 0.000 description 10
- 230000003915 cell function Effects 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 239000000411 inducer Substances 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 101100300807 Drosophila melanogaster spn-A gene Proteins 0.000 description 9
- 241000194020 Streptococcus thermophilus Species 0.000 description 9
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 9
- 108091007416 X-inactive specific transcript Proteins 0.000 description 9
- 108091035715 XIST (gene) Proteins 0.000 description 9
- 230000033228 biological regulation Effects 0.000 description 9
- 230000005782 double-strand break Effects 0.000 description 9
- 238000012744 immunostaining Methods 0.000 description 9
- 238000010186 staining Methods 0.000 description 9
- 230000001629 suppression Effects 0.000 description 9
- 101150080314 ACAP2 gene Proteins 0.000 description 8
- 230000004568 DNA-binding Effects 0.000 description 8
- 241000713666 Lentivirus Species 0.000 description 8
- 239000012636 effector Substances 0.000 description 8
- 238000005734 heterodimerization reaction Methods 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 7
- 235000004279 alanine Nutrition 0.000 description 7
- 230000004075 alteration Effects 0.000 description 7
- 229940024606 amino acid Drugs 0.000 description 7
- 230000022131 cell cycle Effects 0.000 description 7
- 230000003833 cell viability Effects 0.000 description 7
- 230000004186 co-expression Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 7
- 230000003247 decreasing effect Effects 0.000 description 7
- 230000016507 interphase Effects 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 238000005191 phase separation Methods 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 239000011701 zinc Substances 0.000 description 7
- 229910052725 zinc Inorganic materials 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 230000033616 DNA repair Effects 0.000 description 6
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 6
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 6
- 101000835093 Homo sapiens Transferrin receptor protein 1 Proteins 0.000 description 6
- VSNHCAURESNICA-UHFFFAOYSA-N Hydroxyurea Chemical compound NC(=O)NO VSNHCAURESNICA-UHFFFAOYSA-N 0.000 description 6
- 241000204031 Mycoplasma Species 0.000 description 6
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 6
- 101150012060 Ppp1r2 gene Proteins 0.000 description 6
- 230000018199 S phase Effects 0.000 description 6
- 241000191967 Staphylococcus aureus Species 0.000 description 6
- 244000057717 Streptococcus lactis Species 0.000 description 6
- 235000014897 Streptococcus lactis Nutrition 0.000 description 6
- 102100026144 Transferrin receptor protein 1 Human genes 0.000 description 6
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 238000003491 array Methods 0.000 description 6
- 230000003197 catalytic effect Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 229960001330 hydroxycarbamide Drugs 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 5
- 244000063299 Bacillus subtilis Species 0.000 description 5
- 235000014469 Bacillus subtilis Nutrition 0.000 description 5
- 241000193403 Clostridium Species 0.000 description 5
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 241000186869 Lactobacillus salivarius Species 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 5
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 5
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 5
- 102000004389 Ribonucleoproteins Human genes 0.000 description 5
- 108010081734 Ribonucleoproteins Proteins 0.000 description 5
- 101150095461 Tfrc gene Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000007667 floating Methods 0.000 description 5
- 238000000684 flow cytometry Methods 0.000 description 5
- 238000012239 gene modification Methods 0.000 description 5
- 230000005017 genetic modification Effects 0.000 description 5
- 235000013617 genetically modified food Nutrition 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 230000004770 neurodegeneration Effects 0.000 description 5
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 5
- 229950010131 puromycin Drugs 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- 241000589774 Pseudomonas sp. Species 0.000 description 4
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 4
- 102100036497 Telomeric repeat-binding factor 1 Human genes 0.000 description 4
- 101150063416 add gene Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 238000010494 dissociation reaction Methods 0.000 description 4
- 230000005593 dissociations Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 210000003093 intracellular space Anatomy 0.000 description 4
- 239000007791 liquid phase Substances 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000000394 mitotic effect Effects 0.000 description 4
- 210000003463 organelle Anatomy 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 230000035882 stress Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000037426 transcriptional repression Effects 0.000 description 4
- JLIDBLDQVAYHNE-LXGGSRJLSA-N 2-cis-abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\C1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-LXGGSRJLSA-N 0.000 description 3
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 241000283074 Equus asinus Species 0.000 description 3
- 208000031448 Genomic Instability Diseases 0.000 description 3
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 3
- 108010029660 Intrinsically Disordered Proteins Proteins 0.000 description 3
- 108010021101 Lamin Type B Proteins 0.000 description 3
- 101150077352 NUP153 gene Proteins 0.000 description 3
- 102400000977 Nuclear pore complex protein Nup98 Human genes 0.000 description 3
- 101800000051 Nuclear pore complex protein Nup98 Proteins 0.000 description 3
- 101150035378 Nup35 gene Proteins 0.000 description 3
- 101150001569 Nup50 gene Proteins 0.000 description 3
- 229930040373 Paraformaldehyde Natural products 0.000 description 3
- 101001010097 Shigella phage SfV Bactoprenol-linked glucose translocase Proteins 0.000 description 3
- 241000713880 Spleen focus-forming virus Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 238000003349 alamar blue assay Methods 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 108020001096 dihydrofolate reductase Proteins 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 229950003499 fibrin Drugs 0.000 description 3
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 210000004492 nuclear pore Anatomy 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 229920002866 paraformaldehyde Polymers 0.000 description 3
- 230000010399 physical interaction Effects 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 230000008263 repair mechanism Effects 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- HBEDSQVIWPRPAY-UHFFFAOYSA-N 2,3-dihydrobenzofuran Chemical compound C1=CC=C2OCCC2=C1 HBEDSQVIWPRPAY-UHFFFAOYSA-N 0.000 description 2
- 239000012114 Alexa Fluor 647 Substances 0.000 description 2
- 108010090849 Amyloid beta-Peptides Proteins 0.000 description 2
- 102000013455 Amyloid beta-Peptides Human genes 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000589941 Azospirillum Species 0.000 description 2
- 241000186000 Bifidobacterium Species 0.000 description 2
- 241001608472 Bifidobacterium longum Species 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 238000010446 CRISPR interference Methods 0.000 description 2
- 101100285688 Caenorhabditis elegans hrg-7 gene Proteins 0.000 description 2
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 2
- 102100024873 Ceramide-1-phosphate transfer protein Human genes 0.000 description 2
- 101710189399 Ceramide-1-phosphate transfer protein Proteins 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 101150091196 Cptp gene Proteins 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 101710096438 DNA-binding protein Proteins 0.000 description 2
- 101150108602 DVL1 gene Proteins 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 108700039964 Duplicate Genes Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101150111184 Emd gene Proteins 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 108010022894 Euchromatin Proteins 0.000 description 2
- 208000035126 Facies Diseases 0.000 description 2
- 102000009123 Fibrin Human genes 0.000 description 2
- 108010073385 Fibrin Proteins 0.000 description 2
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 2
- 241000605986 Fusobacterium nucleatum Species 0.000 description 2
- 230000010190 G1 phase Effects 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 101001053423 Homo sapiens Integrator complex subunit 11 Proteins 0.000 description 2
- 101000581326 Homo sapiens Mediator of DNA damage checkpoint protein 1 Proteins 0.000 description 2
- 101000919019 Homo sapiens Probable ATP-dependent RNA helicase DDX6 Proteins 0.000 description 2
- 101000867413 Homo sapiens Segment polarity protein dishevelled homolog DVL-1 Proteins 0.000 description 2
- 101150009416 INTS11 gene Proteins 0.000 description 2
- 102100024370 Integrator complex subunit 11 Human genes 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 102100027643 Mediator of DNA damage checkpoint protein 1 Human genes 0.000 description 2
- 241000179980 Microcoleus Species 0.000 description 2
- 102000005431 Molecular Chaperones Human genes 0.000 description 2
- 108010006519 Molecular Chaperones Proteins 0.000 description 2
- 241000204022 Mycoplasma gallisepticum Species 0.000 description 2
- 241000187654 Nocardia Species 0.000 description 2
- 108010025568 Nucleophosmin Proteins 0.000 description 2
- 101150043681 Nup62 gene Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 101150057397 PPP1R2C gene Proteins 0.000 description 2
- 102000002141 Plasma Membrane Calcium-Transporting ATPases Human genes 0.000 description 2
- 108010040945 Plasma Membrane Calcium-Transporting ATPases Proteins 0.000 description 2
- 108091026813 Poly(ADPribose) Proteins 0.000 description 2
- 102100029480 Probable ATP-dependent RNA helicase DDX6 Human genes 0.000 description 2
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 241000192029 Ruminococcus albus Species 0.000 description 2
- 102000008935 SMN Complex Proteins Human genes 0.000 description 2
- 108010049037 SMN Complex Proteins Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 101710204410 Scaffold protein Proteins 0.000 description 2
- 102100032758 Segment polarity protein dishevelled homolog DVL-1 Human genes 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 241000194019 Streptococcus mutans Species 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 241000958215 Streptomyces filamentosus Species 0.000 description 2
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 2
- 102000010823 Telomere-Binding Proteins Human genes 0.000 description 2
- 108010038599 Telomere-Binding Proteins Proteins 0.000 description 2
- 108010033711 Telomeric Repeat Binding Protein 1 Proteins 0.000 description 2
- 241000223257 Thermomyces Species 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241001148134 Veillonella Species 0.000 description 2
- 241000605939 Wolinella succinogenes Species 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 229940009291 bifidobacterium longum Drugs 0.000 description 2
- 230000008436 biogenesis Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 229960003722 doxycycline Drugs 0.000 description 2
- 210000001163 endosome Anatomy 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 210000000632 euchromatin Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000002189 fluorescence spectrum Methods 0.000 description 2
- 239000008187 granular material Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000138 intercalating agent Substances 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000000386 microscopy Methods 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000004845 protein aggregation Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- PRDFBSVERLRRMY-UHFFFAOYSA-N 2'-(4-ethoxyphenyl)-5-(4-methylpiperazin-1-yl)-2,5'-bibenzimidazole Chemical compound C1=CC(OCC)=CC=C1C1=NC2=CC=C(C=3NC4=CC(=CC=C4N=3)N3CCN(C)CC3)C=C2N1 PRDFBSVERLRRMY-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- 102100040973 26S proteasome non-ATPase regulatory subunit 1 Human genes 0.000 description 1
- 102100022644 26S proteasome regulatory subunit 4 Human genes 0.000 description 1
- KQPKMEYBZUPZGK-UHFFFAOYSA-N 4-[(4-azido-2-nitroanilino)methyl]-5-(hydroxymethyl)-2-methylpyridin-3-ol Chemical compound CC1=NC=C(CO)C(CNC=2C(=CC(=CC=2)N=[N+]=[N-])[N+]([O-])=O)=C1O KQPKMEYBZUPZGK-UHFFFAOYSA-N 0.000 description 1
- 102100033400 4F2 cell-surface antigen heavy chain Human genes 0.000 description 1
- 102100028348 60S ribosomal protein L26 Human genes 0.000 description 1
- 102000017920 ADRB1 Human genes 0.000 description 1
- 102100037651 AP-2 complex subunit sigma Human genes 0.000 description 1
- 241001430193 Absiella dolichum Species 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- 101001082110 Acanthamoeba polyphaga mimivirus Eukaryotic translation initiation factor 4E homolog Proteins 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- 241001135190 Acetohalobium Species 0.000 description 1
- 241001468182 Acidobacterium Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 1
- 241000702460 Akkermansia Species 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 102100034452 Alternative prion protein Human genes 0.000 description 1
- 241001046548 Anaerobium Species 0.000 description 1
- 241000243818 Annelida Species 0.000 description 1
- 241000284466 Antarctothoa delta Species 0.000 description 1
- 241000620196 Arthrospira maxima Species 0.000 description 1
- 240000002900 Arthrospira platensis Species 0.000 description 1
- 235000016425 Arthrospira platensis Nutrition 0.000 description 1
- 241001495183 Arthrospira sp. Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 241001464968 Bacillus acidovorans Species 0.000 description 1
- 102100026349 Beta-1,4-galactosyltransferase 1 Human genes 0.000 description 1
- 241000186016 Bifidobacterium bifidum Species 0.000 description 1
- 241000186020 Bifidobacterium dentium Species 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 102000000905 Cadherin Human genes 0.000 description 1
- 108050007957 Cadherin Proteins 0.000 description 1
- 101100496968 Caenorhabditis elegans ctc-1 gene Proteins 0.000 description 1
- 101100297347 Caenorhabditis elegans pgl-3 gene Proteins 0.000 description 1
- 101100254610 Caenorhabditis elegans rps-3 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 102100021868 Calnexin Human genes 0.000 description 1
- 108010056891 Calnexin Proteins 0.000 description 1
- 102100029968 Calreticulin Human genes 0.000 description 1
- 108090000549 Calreticulin Proteins 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 102100037182 Cation-independent mannose-6-phosphate receptor Human genes 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 102000008169 Co-Repressor Proteins Human genes 0.000 description 1
- 108010060434 Co-Repressor Proteins Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241001464948 Coprococcus Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241000270722 Crocodylidae Species 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- 102100032620 Cytotoxic granule associated RNA binding protein TIA1 Human genes 0.000 description 1
- 101710086368 Cytotoxic granule associated RNA binding protein TIA1 Proteins 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 101001082109 Danio rerio Eukaryotic translation initiation factor 4E-1B Proteins 0.000 description 1
- 101100058344 Drosophila melanogaster BicC gene Proteins 0.000 description 1
- 101100467605 Drosophila melanogaster Hrb27C gene Proteins 0.000 description 1
- 101100326341 Drosophila melanogaster brun gene Proteins 0.000 description 1
- 101100083483 Drosophila melanogaster kra gene Proteins 0.000 description 1
- 101100096579 Drosophila melanogaster sqd gene Proteins 0.000 description 1
- 102100023078 Early endosome antigen 1 Human genes 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- 101900009012 Epstein-Barr virus Replication and transcription activator Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 101100382541 Escherichia coli (strain K12) casD gene Proteins 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 108010014863 Eukaryotic Initiation Factors Proteins 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 230000037057 G1 phase arrest Effects 0.000 description 1
- 230000004668 G2/M phase Effects 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 101100264215 Gallus gallus XRCC6 gene Proteins 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- 102100034223 Golgi apparatus protein 1 Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000005548 Hexokinase Human genes 0.000 description 1
- 108700040460 Hexokinases Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000612655 Homo sapiens 26S proteasome non-ATPase regulatory subunit 1 Proteins 0.000 description 1
- 101000619137 Homo sapiens 26S proteasome regulatory subunit 4 Proteins 0.000 description 1
- 101000800023 Homo sapiens 4F2 cell-surface antigen heavy chain Proteins 0.000 description 1
- 101001080179 Homo sapiens 60S ribosomal protein L26 Proteins 0.000 description 1
- 101000806914 Homo sapiens AP-2 complex subunit sigma Proteins 0.000 description 1
- 101000892264 Homo sapiens Beta-1 adrenergic receptor Proteins 0.000 description 1
- 101000766145 Homo sapiens Beta-1,4-galactosyltransferase 1 Proteins 0.000 description 1
- 101000620629 Homo sapiens Cardiac phospholamban Proteins 0.000 description 1
- 101001028831 Homo sapiens Cation-independent mannose-6-phosphate receptor Proteins 0.000 description 1
- 101001050162 Homo sapiens Early endosome antigen 1 Proteins 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 101001069963 Homo sapiens Golgi apparatus protein 1 Proteins 0.000 description 1
- 101001046870 Homo sapiens Hypoxia-inducible factor 1-alpha Proteins 0.000 description 1
- 101001059713 Homo sapiens Inner nuclear membrane protein Man1 Proteins 0.000 description 1
- 101000605020 Homo sapiens Large neutral amino acids transporter small subunit 1 Proteins 0.000 description 1
- 101001111984 Homo sapiens N-acylneuraminate-9-phosphatase Proteins 0.000 description 1
- 101000736929 Homo sapiens Proteasome subunit alpha type-1 Proteins 0.000 description 1
- 101000780643 Homo sapiens Protein argonaute-2 Proteins 0.000 description 1
- 101000619506 Homo sapiens Ragulator complex protein LAMTOR2 Proteins 0.000 description 1
- 101001062222 Homo sapiens Receptor-binding cancer antigen expressed on SiSo cells Proteins 0.000 description 1
- 101000963987 Homo sapiens SH3 domain-binding protein 5 Proteins 0.000 description 1
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 1
- 101000917519 Homo sapiens rRNA 2'-O-methyltransferase fibrillarin Proteins 0.000 description 1
- 102100022875 Hypoxia-inducible factor 1-alpha Human genes 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100028799 Inner nuclear membrane protein Man1 Human genes 0.000 description 1
- 101150059802 KU80 gene Proteins 0.000 description 1
- 102000010638 Kinesin Human genes 0.000 description 1
- 108010063296 Kinesin Proteins 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 235000013956 Lactobacillus acidophilus Nutrition 0.000 description 1
- 244000199866 Lactobacillus casei Species 0.000 description 1
- 235000013958 Lactobacillus casei Nutrition 0.000 description 1
- 241000186673 Lactobacillus delbrueckii Species 0.000 description 1
- 241000218588 Lactobacillus rhamnosus Species 0.000 description 1
- 102100023981 Lamina-associated polypeptide 2, isoform alpha Human genes 0.000 description 1
- 241000029603 Leptotrichia shahii Species 0.000 description 1
- 101710097668 Leucine aminopeptidase 2 Proteins 0.000 description 1
- 241001134453 Lista Species 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 241001134698 Lyngbya Species 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 108091060294 Messenger RNP Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241000192710 Microcystis aeruginosa Species 0.000 description 1
- 241001125875 Micropterus Species 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241001148547 Mycoplasma gallinarum Species 0.000 description 1
- 241000204045 Mycoplasma hyopneumoniae Species 0.000 description 1
- 101100387131 Myxococcus xanthus (strain DK1622) devS gene Proteins 0.000 description 1
- 102100023906 N-acylneuraminate-9-phosphatase Human genes 0.000 description 1
- 101100221647 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cox-1 gene Proteins 0.000 description 1
- 241000605159 Nitrobacter Species 0.000 description 1
- 241000605156 Nitrobacter hamburgensis Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000192497 Oscillatoria Species 0.000 description 1
- 101150111781 PGL1 gene Proteins 0.000 description 1
- 101150062589 PTGS1 gene Proteins 0.000 description 1
- BELBBZDIHDAJOR-UHFFFAOYSA-N Phenolsulfonephthalein Chemical compound C1=CC(O)=CC=C1C1(C=2C=CC(O)=CC=2)C2=CC=CC=C2S(=O)(=O)O1 BELBBZDIHDAJOR-UHFFFAOYSA-N 0.000 description 1
- 101150016155 Pml gene Proteins 0.000 description 1
- 241000195879 Polytrichum Species 0.000 description 1
- 241001088162 Primula auricula Species 0.000 description 1
- 235000006894 Primula auricula Nutrition 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 102100036042 Proteasome subunit alpha type-1 Human genes 0.000 description 1
- 102100034207 Protein argonaute-2 Human genes 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 102100022154 Ragulator complex protein LAMTOR2 Human genes 0.000 description 1
- 241001135508 Ralstonia syzygii Species 0.000 description 1
- 102000003901 Ras GTPase-activating proteins Human genes 0.000 description 1
- 108090000231 Ras GTPase-activating proteins Proteins 0.000 description 1
- 102100029165 Receptor-binding cancer antigen expressed on SiSo cells Human genes 0.000 description 1
- 101710122931 Replication and transcription activator Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000187693 Rhodococcus rhodochrous Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102100040119 SH3 domain-binding protein 5 Human genes 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241001464874 Solobacterium moorei Species 0.000 description 1
- 241000383837 Sphingobium Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 101000898746 Streptomyces clavuligerus Clavaminate synthase 1 Proteins 0.000 description 1
- 241001518258 Streptomyces pristinaespiralis Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 1
- 101710150875 TAR DNA-binding protein 43 Proteins 0.000 description 1
- 101150081494 TMPO gene Proteins 0.000 description 1
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 1
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 241000589892 Treponema denticola Species 0.000 description 1
- 241000589884 Treponema pallidum Species 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 102100036973 X-ray repair cross-complementing protein 5 Human genes 0.000 description 1
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 108090000185 alpha-Synuclein Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000002424 anti-apoptotic effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 229940011019 arthrospira platensis Drugs 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229940002008 bifidobacterium bifidum Drugs 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 101150049463 cas5 gene Proteins 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 108700021031 cdc Genes Proteins 0.000 description 1
- 210000005056 cell body Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000033026 cell fate determination Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000009134 cell regulation Effects 0.000 description 1
- 238000003570 cell viability assay Methods 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 108700010039 chimeric receptor Proteins 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000005226 corpus cavernosum Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- LNNWVNGFPYWNQE-GMIGKAJZSA-N desomorphine Chemical compound C1C2=CC=C(O)C3=C2[C@]24CCN(C)[C@H]1[C@@H]2CCC[C@@H]4O3 LNNWVNGFPYWNQE-GMIGKAJZSA-N 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 101150046913 ecpA gene Proteins 0.000 description 1
- 230000002900 effect on cell Effects 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000007247 enzymatic mechanism Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 238000012236 epigenome editing Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 229910001751 gemstone Inorganic materials 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 238000003875 gradient-accelerated spectroscopy Methods 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 210000004020 intracellular membrane Anatomy 0.000 description 1
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 1
- 101150085005 ku70 gene Proteins 0.000 description 1
- 229940039695 lactobacillus acidophilus Drugs 0.000 description 1
- 229940017800 lactobacillus casei Drugs 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 230000025732 negative regulation of DNA recombination Effects 0.000 description 1
- 230000000626 neurodegenerative effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000004031 neuronal differentiation Effects 0.000 description 1
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000000242 pagocytic effect Effects 0.000 description 1
- 230000008823 permeabilization Effects 0.000 description 1
- 229960003531 phenolsulfonphthalein Drugs 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 230000007505 plaque formation Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- BITYAPCSNKJESK-UHFFFAOYSA-N potassiosodium Chemical compound [Na].[K] BITYAPCSNKJESK-UHFFFAOYSA-N 0.000 description 1
- 210000001948 pro-b lymphocyte Anatomy 0.000 description 1
- 101710082686 probable leucine aminopeptidase 2 Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 102100029526 rRNA 2'-O-methyltransferase fibrillarin Human genes 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102220235118 rs1131691530 Human genes 0.000 description 1
- 102220331493 rs782765957 Human genes 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000033863 telomere maintenance Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000002287 time-lapse microscopy Methods 0.000 description 1
- 101150101855 tomm-40 gene Proteins 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 239000000225 tumor suppressor protein Substances 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/74—Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor
- C07K2319/75—Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor containing a fusion for activation of a cell surface receptor, e.g. thrombopoeitin, NPY and other peptide hormones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Toxicology (AREA)
- Endocrinology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文提供了用于控制细胞中隔室或隔室样环境相对于靶多核苷酸的空间定位的系统和方法。
Description
相关申请的交叉引用
本申请要求2018年10月11日提交的美国临时申请第62/744,504号的优先权和权益,其全部内容通过引用并入本文。
背景
活细胞内多核苷酸的三维(3D)空间组织在诸如调节和维持基因表达、基因组稳定性和细胞功能的过程中起重要作用。
需要进行靶多核苷酸的空间组织的系统和方法。本公开解决了这个需要和其它需要。
概述
通常,本文提供了用于可编程多核苷酸重组的系统和方法。所述系统和方法可以通过化学诱导型系统将致动器部分与细胞隔室特异性蛋白连接,并且可以允许将多核苷酸(例如基因组基因座)有效、可诱导和动态重新定位到特定的细胞位置,例如核周边、Cajal小体和PML核小体(图1)。例如,所述系统和方法可以通过化学诱导型系统将致动器部分与细胞隔室特异性蛋白连接,并且可以允许围绕多核苷酸(例如基因组基因座)的所述隔室特异性蛋白(例如核异染色质、Cajal小体和PML核小体)的隔室的有效、可诱导和动态形成。所述系统和方法可以扩展现有的多核苷酸编辑和调节工具,提供改进的技术来相对于细胞隔室操纵多核苷酸的3D组织,操纵围绕多核苷酸的3D组织的细胞隔室,以及研究大规模空间多核苷酸组织与细胞功能之间的关系。此外,围绕靶多核苷酸的隔室的形成可以帮助操纵细胞命运或功能。
在一些方面,组合物包含:a)与第一二聚化结构域连接的隔室组成蛋白;和b)与支架连接的致动器部分,其中所述支架与第二二聚化结构域连接;并且其中所述第一二聚化结构域与所述第二二聚化结构域结合。在一些实施方案中,所述支架与至少1、2、3、4、5、6、7、8、9、10或更多个第二二聚化结构域连接。在一些实施方案中,所述隔室组成蛋白还与第二支架连接,其中所述第二支架与至少一个第一二聚化结构域连接。在一些实施方案中,所述第二支架与1、2、3、4、5、6、7、8、9、10或更多个第一二聚化结构域连接。在一些实施方案中,所述支架或第二支架是重复肽阵列。在一些实施方案中,所述支架或第二支架是SpyTag、SunTag、分裂sfGFP、MoonTag、SnoopTag、分裂sfCherry2或mNeonGreen2蛋白支架。在一些实施方案中,所述组合物还包含配体,其中所述第一二聚化结构域与所述第二二聚化结构域的结合在所述配体的存在下发生。权利要求1-6中任一项所述的组合物,其中所述组合物调节靶多核苷酸的表达。在一些实施方案中,所述组合物增加所述靶多核苷酸的表达。在一些实施方案中,所述组合物降低所述靶多核苷酸的表达。在一些实施方案中,所述组合物调节另外的多核苷酸的表达。在一些实施方案中,所述组合物增加另外的多核苷酸的表达。在一些实施方案中,所述组合物降低另外的多核苷酸的表达。在一些实施方案中,所述另外的多核苷酸是所述靶多核苷酸的远端基因。在一些实施方案中,所述另外的多核苷酸是所述靶多核苷酸的近端基因。在一些实施方案中,复合物的三维结构调节基因或基因的调节元件。在一些实施方案中,所述调节元件是增强子或启动子。在一些实施方案中,所述三维结构形成三维环、染色体边界、拓扑相关结构域或基因簇。在一些实施方案中,所述三维环在增强子与启动子之间形成。在一些实施方案中,所述组合物隔离靶多核苷酸。在一些实施方案中,所述组合物通过分离所述靶多核苷酸来隔离所述靶多核苷酸用于染色体保护或操作。在一些实施方案中,所述组合物将靶多核苷酸捕获在隔室的空间区域中。在一些实施方案中,所述隔室的空间区域操纵所述靶多核苷酸或所述另外的多核苷酸的命运或功能。在一些实施方案中,所述隔室的空间区域促进或防止重组或诱变,促进或抑制基因表达、剪接或翻译,促进或抑制多核苷酸转运或移动。在一些实施方案中,所述组合物在所述靶多核苷酸处引入表观遗传修饰。在一些实施方案中,所述表观遗传修饰是DNA甲基化、DNA脱甲基化、组蛋白甲基化、组蛋白脱甲基化、乙酰化、脱乙酰化、磷酸化、脱磷酸化、泛素化、GlcNAcylation、瓜氨酸化、krotonization、异构化或它们的任意组合。在一些实施方案中,所述组合物修复DNA断裂。在一些实施方案中,所述组合物通过引入外源DNA来修复DNA断裂。在一些实施方案中,所述组合物通过引入重组、非同源性末端连接或同源性定向修复来修复DNA断裂。在一些实施方案中,所述组合物创建人工聚集体,其中所述人工聚集体包含蛋白质、RNA、DNA或它们的组合。在一些实施方案中,所述人工聚集体蛋白、RNA、DNA或它们的组合由所述隔室组成蛋白募集。在一些实施方案中,所述靶多核苷酸是基因组DNA。在一些实施方案中,所述靶多核苷酸是编码基因的多核苷酸。在一些实施方案中,所述靶多核苷酸是非编码多核苷酸。在一些实施方案中,所述靶多核苷酸是基因组DNA的串联重复区。在一些实施方案中,所述靶多核苷酸是RNA。在一些实施方案中,所述隔室是Cajal小体。在一些实施方案中,所述隔室组成蛋白包含来自Cajal小体的蛋白。在一些实施方案中,所述隔室组成蛋白包括coilin、SMN、Gemin 3、SmD1、SmE或它们的组合。在一些实施方案中,所述隔室是核小点。在一些实施方案中,所述隔室组成蛋白是来自核小点的蛋白。在一些实施方案中,所述隔室组成蛋白包括SC35。在一些实施方案中,所述隔室是PML小体。在一些实施方案中,所述隔室组成蛋白是来自PML小体的蛋白。在一些实施方案中,所述隔室组成蛋白包括PML、SP100或它们的组合。在一些实施方案中,所述隔室是细胞溶质隔室。在一些实施方案中,所述隔室组成蛋白是来自细胞溶质隔室的蛋白。在一些实施方案中,所述隔室是合成的细胞相。在一些实施方案中,所述隔室组成蛋白是来自合成细胞相的蛋白。在一些实施方案中,所述隔室组成蛋白包括:Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、核酸外切酶(Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。在一些实施方案中,所述合成的细胞相促进同源性定向修复。在一些实施方案中,所述隔室是核异染色质。在一些实施方案中,所述隔室组成蛋白是来自核异染色质的蛋白。在一些实施方案中,所述隔室组成蛋白包包括:HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。在一些实施方案中,所述隔室组成蛋白还包括寡聚化结构域。在一些实施方案中,所述隔室组成蛋白还与荧光蛋白连接。在一些实施方案中,所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白。在一些实施方案中,所述致动器部分包含Cas蛋白,并且其中所述系统还包含:(c)与所述致动器部分复合并与所述靶多核苷酸杂交的导向RNA。在一些实施方案中,所述致动器部分包含与与所述靶多核苷酸杂交的导向RNA复合的RNA结合蛋白,并且其中所述组合物还包含:(c)与所述导向RNA复合的Cas蛋白。在一些实施方案中,所述Cas蛋白实质上缺乏DNA切割活性。在一些实施方案中,所述Cas蛋白是Cas9蛋白、Cas12蛋白、Cas13蛋白、CasX蛋白或CasY蛋白。在一些实施方案中,所述Cas12蛋白选自:Cas12a、Cas12b、Cas12c、Cas12d和Cas12e。在一些实施方案中,所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白,其中所述结合蛋白是锌指核酸酶或TALE核酸酶。在一些实施方案中,所述致动器部分包含与导向多核苷酸复合的Argonaute蛋白,其中所述导向多核苷酸是导向RNA或导向DNA,并且其中所述导向多核苷酸与所述靶多核苷酸杂交。在一些实施方案中,所述致动器部分还与荧光蛋白连接。在一些实施方案中,所述第一二聚化结构域在配体的存在下与所述第二二聚化结构域结合。在一些实施方案中,所述第一二聚化结构域与所述配体结合并且所述配体与所述第二二聚化结构域结合以组装二聚体。在一些实施方案中,所述配体是化学诱导型的配体。在一些实施方案中,所述配体是脱落酸。在一些实施方案中,所述二聚体是诱导型和可逆型的二聚体。在一些实施方案中,所述二聚体是异二聚体。在一些实施方案中,所述二聚体是同型二聚体。在一些实施方案中,所述第一二聚化结构域是ABI结构域。在一些实施方案中,所述第二二聚化结构域是PYL1结构域。在一些实施方案中,所述第一二聚化结构域是PYL1结构域。在一些实施方案中,所述第二二聚化结构域是ABI结构域。在一些实施方案中,与所述第一二聚化结构域连接的所述隔室组成蛋白是融合蛋白。在一些实施方案中,与所述第二二聚化结构域连接的所述致动器部分是融合蛋白。在一些实施方案中,所述隔室组成蛋白通过连接子与所述第一二聚化结构域连接。在一些实施方案中,所述致动器部分通过连接子与所述第二二聚化结构域连接。
在一些方面,所述方法包括:(a)提供与第一二聚化结构域连接的隔室组成蛋白;(b)提供与第二二聚化结构域连接的致动器部分,其中所述致动器部分和所述靶多核苷酸形成复合物;和(c)组装包含所述复合物的所述第一二聚化结构域和所述第二二聚化结构域的二聚体,从而形成围绕所述靶多核苷酸的所述隔室。在一些实施方案中,所述方法还包括在步骤(c)之前提供配体,其中所述配体将所述第一二聚化结构域结合与所述第二二聚化结构域结合以组装所述步骤(c)的二聚体。在一些实施方案中,所述方法还包括在围绕所述靶多核苷酸形成所述隔室之后调节所述靶多核苷酸的表达。在一些实施方案中,所述方法还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后增加所述靶多核苷酸的表达。在一些实施方案中,所述方法还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后降低所述靶多核苷酸的表达。在一些实施方案中,所述方法还包括在围绕所述靶多核苷酸形成所述隔室之后调节另外的多核苷酸的表达。在一些实施方案中,所述方法还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后增加另外的多核苷酸的表达。在一些实施方案中,所述方法还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后降低另外的多核苷酸的表达。在一些实施方案中,所述另外的多核苷酸是所述靶多核苷酸的远端基因。在一些实施方案中,所述另外的多核苷酸是所述靶多核苷酸的近端基因。在一些实施方案中,所述复合物的三维结构调节基因或基因的调节元件。在一些实施方案中,所述调节元件是增强子或启动子。在一些实施方案中,所述三维结构形成三维环、染色体边界、拓扑相关结构域或基因簇。在一些实施方案中,所述三维环在增强子与启动子之间形成。在一些实施方案中,所述方法还包括隔离靶多核苷酸。在一些实施方案中,所述隔离包括分离所述靶多核苷酸用于染色体保护或操作。在一些实施方案中,所述方法还包括将靶多核苷酸捕获在隔室的空间区域中。在一些实施方案中,所述方法还包括操纵所述空间区域或隔室中所述靶多核苷酸或所述另外的多核苷酸的命运或功能。在一些实施方案中,隔室的所述空间区域促进或防止重组或诱变,促进或抑制基因表达、剪接或翻译,促进或抑制多核苷酸转运或移动。在一些实施方案中,所述方法还包括在围绕所述靶多核苷酸形成所述隔室之后,在所述靶多核苷酸处引入表观遗传修饰。
如权利要求100所述的方法,其中所述表观遗传修饰是DNA甲基化、DNA脱甲基化、组蛋白甲基化、组蛋白脱甲基化、乙酰化、脱乙酰化、磷酸化、脱磷酸化、泛素化、GlcNAcylation、瓜氨酸化、krotonization、异构化或它们的任意组合。在一些实施方案中,所述方法还包括修复DNA断裂。在一些实施方案中,所述修复包括引入外源DNA。在一些实施方案中,所述引入包括重组、非同源性末端连接或同源性定向修复。在一些实施方案中,围绕所述靶多核苷酸形成所述隔室还包括创建人工聚集体,其中所述人工聚集体包含蛋白质、RNA、DNA或它们的组合。在一些实施方案中,所述人工聚集体蛋白、RNA、DNA或它们的组合由所述隔室组成蛋白募集。在一些实施方案中,所述靶多核苷酸是基因组DNA。在一些实施方案中,所述靶多核苷酸是编码基因的多核苷酸。在一些实施方案中,所述靶多核苷酸是非编码多核苷酸。在一些实施方案中,所述靶多核苷酸是基因组DNA的串联重复区。在一些实施方案中,所述靶多核苷酸是RNA。在一些实施方案中,所述隔室是Cajal小体。在一些实施方案中,所述隔室组成蛋白包括来自Cajal小体的蛋白。在一些实施方案中,所述隔室组成蛋白包括coilin、SMN、Gemin 3、SmD1、SmE或它们的组合。在一些实施方案中,所述隔室是核小点。在一些实施方案中,所述隔室组成蛋白是来自核小点的蛋白。在一些实施方案中,所述隔室组成蛋白包括SC35。在一些实施方案中,所述隔室是PML小体。在一些实施方案中,所述隔室组成蛋白是来自PML小体的蛋白。在一些实施方案中,所述隔室组成蛋白包括PML、SP100或它们的组合。在一些实施方案中,所述隔室是细胞溶质隔室。在一些实施方案中,所述隔室组成蛋白是来自细胞溶质隔室的蛋白。在一些实施方案中,所述隔室是合成的细胞相。在一些实施方案中,所述隔室组成蛋白是来自合成细胞相的蛋白。在一些实施方案中,所述隔室组成蛋白包括:Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、核酸外切酶(Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。在一些实施方案中,所述合成的细胞相促进同源性定向修复。在一些实施方案中,所述隔室是核异染色质。在一些实施方案中,所述隔室组成蛋白是来自核异染色质的蛋白。在一些实施方案中,所述隔室组成蛋白包括:HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。在一些实施方案中,所述隔室组成蛋白还包括寡聚化结构域。在一些实施方案中,所述隔室组成蛋白还与荧光蛋白连接。在一些实施方案中,所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白。在一些实施方案中,所述致动器部分包含Cas蛋白,并且其中所述系统还包含:(c)与所述致动器部分复合并与所述靶多核苷酸杂交的导向RNA。在一些实施方案中,所述致动器部分包含与与所述靶多核苷酸杂交的导向RNA复合的RNA结合蛋白,并且其中所述系统还包含:(c)与所述导向RNA复合的Cas蛋白。在一些实施方案中,所述Cas蛋白实质上缺乏DNA切割活性。在一些实施方案中,所述Cas蛋白是Cas9蛋白、Cas12蛋白、Cas13蛋白、CasX蛋白或CasY蛋白。在一些实施方案中,所述Cas12蛋白选自Cas12a、Cas12b、Cas12c、Cas12d和Cas12e。在一些实施方案中,所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白,其中所述结合蛋白是锌指核酸酶或TALE核酸酶。在一些实施方案中,所述致动器部分包含与导向多核苷酸复合的Argonaute蛋白,其中所述导向多核苷酸是导向RNA或导向DNA,并且其中所述导向多核苷酸与所述靶多核苷酸杂交。在一些实施方案中,所述致动器部分还与荧光蛋白连接。在一些实施例中,所述致动器部分还与支架连接,其中所述致动器与所述支架连接,并且所述支架与至少一个第二二聚化结构域连接。在一些实施方案中,所述致动器部分还与支架连接,其中所述致动器与所述支架连接,并且所述支架与2、3、4、5、6、7、8、9、10或更多个第二二聚化结构域连接。在一些实施方案中,所述支架是重复肽阵列。在一些实施方案中,所述支架是SpyTag、SunTag、分裂sfGFP、MoonTag、SnoopTag、分裂sfCherry2或mNeonGreen2蛋白支架。在一些实施方案中,所述组装在配体存在下发生。在一些实施方案中,所述第一二聚化结构域与所述配体结合,并且所述配体与所述第二二聚化结构域结合以组装所述二聚体。在一些实施方案中,所述配体是化学诱导型的配体。在一些实施方案中,所述配体是脱落酸。在一些实施方案中,所述组装是是诱导型和可逆型的组装。在一些实施方案中,所述二聚体是异二聚体。在一些实施方案中,所述二聚体是同型二聚体。在一些实施方案中,所述第一二聚化结构域是ABI结构域。在一些实施方案中,所述第二二聚化结构域是PYL1结构域。在一些实施方案中,所述第一二聚化结构域是PYL1结构域。在一些实施方案中,所述第二二聚化结构域是ABI结构域。在一些实施方案中,与所述第一二聚化结构域连接的所述隔室组成蛋白是融合蛋白。在一些实施方案中,与所述第二二聚化结构域连接的所述致动器部分是融合蛋白。在一些实施方案中,所述隔室组成蛋白通过连接子与所述第一二聚化结构域连接。在一些实施方案中,所述致动器部分通过连接子与所述第二二聚化结构域连接。
在一些方面,通过施用前述实施方案中任一项所述的组合物来治疗有需要的对象的疾病的方法。在一些实施方案中,所述疾病是蛋白质错误折叠疾病。在一些实施方案中,所述疾病选自:阿尔茨海默病(AD)、帕金森病(PD)、多系统萎缩、亨廷顿病(HD)、朊病毒病、肌萎缩性侧索硬化(ALS)和额颞痴呆(FTD)。
在一些方面,系统包含前述实施方案中任一项所述的组合物。
通过引用并入
本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度就好像每个单独的出版物、专利或专利申请被具体地和单独地指示为通过引用并入一样。
附图简述
本公开的新颖特征在所附权利要求中被具体阐述。通过参考以下阐述其中利用了本发明的原理的说明性实施方案的详细描述获得了对本公开的特征和优点的更好理解,以及附图为:
图1是用于将基因组基因座靶向各种核隔室的可编程、可诱导和通用的系统的示意图。dCas9和核隔室特异性蛋白融合到互补的异二聚化结构域对,其仅在化学诱导剂存在下组装。基因组靶标由sgRNA序列指定,并且通过将CRISPR-GO与隔室特异性分子融合来编程核隔室。
图2是脱落酸(ABA)诱导型CRISPR-GO系统通过ABI-dCas9和PYL1-GFP-Emerin在人细胞中的共表达将基因组基因座靶向核包膜(NE)的示意图。在ABA、ABI和PYL1二聚化的存在下,导致ABI-dCas9靶向的基因组基因座重新定位到核包膜处的PYL1-GFP-Emerin。去除ABA后,ABI和PYL1解离,并且基因组基因座不再束缚于NE。
图3是ABA诱导型CRISPR-GO系统与ABI-BFP-dCas9和PYL1-GFP-Emerin在人细胞中共表达的示意图。ABA处理使ABI和PYL1二聚化,并将ABI-BFP-dCas9靶向的基因组基因座重新定位到含有PYL1-GFP-Emerin的核周边。
图4是TMP-HTag诱导型CRISPR-GO系统与dCas9-EGFP-HaloTag和DHFR-Emerin-mCherry在人细胞中共表达的示意图。TMP-HTag处理使DHFR和HaloTag二聚化,并将dCas9-EGFP-HaloTag靶向的基因组基因座重新定位到含有DHFR-Emerin-mCherry的核周边。
图5是使用CRISPR-Cas9成像来可视化活细胞中CRISPR-GO系统靶向的重复基因组基因座的方法的示意图。ABI-dCas9和dCas9-HaloTag都与相同的重复基因组基因座结合。当ABI-dCas9与PYL1-Emerin二聚化以重新定位基因组基因座时,dCas9-HaloTag与细胞可渗透的JF549-HaloTag染料配体结合以使得活细胞中靶向的基因组基因座能够可视化。
图6显示了U2OS细胞的代表性显微图像,其显示ABI-BFP-dCas9、PYL1-GFP-Emerin和dCas9-HaloTag的共表达,没有sgRNA。ABI-BFP-dCas9在没有ABA处理的情况下可能在核仁中积累。如PYL1-GFP-Emerin所标记的,ABA处理诱导的异二聚化将ABI-BFP-dCas9重新定位于核包膜(NE)和内质网(ER)。dCas9-HaloTag具有低的表达水平,并且均匀分布于整个核;其定位不受ABA处理的影响。比例尺为10μm。
图7是图8和图9中CRISPR-GO靶向的高度重复区域的染色体位置的概述。单一sgRNA结合靶向区域内的多个重复序列(实心灰色框)。与靶向位点相邻的基因以斜体字母显示在灰色框中。
图8显示了高度重复的基因组基因座的CRISPR-GO诱导的基因组重新定位效率的定量图。使用活细胞中的CRISPR-Cas9成像来标记Chr3、Chr13和LacO基因座。端粒被端粒标志物TRF1-mCherry标记。通过GFP-Emerin可视化核包膜。所分析的基因座和细胞的数量在底部。从左到右,图1(顶部)、1(底部)、3(顶部)和3(底部)显示核周边处的基因座的百分比,以及图2(顶部)、2(底部)、4(顶部)和4(底部)显示包含至少一个周边相关基因座的细胞的百分比。
图9显示了较少重复的内源性基因组基因座的CRISPR-GO诱导的核重新定位效率的定量图。通过3D-FISH可视化基因组基因座,并通过DAPI染色细胞核。从左到右:图1和图3:核周边处的基因组基因座的百分比;图2和图4:含有至少一个核周边相关基因座的细胞的百分比。所分析的基因座和细胞的数目在底部。
图10显示了代表性的显微图像,其比较了通过CRISPR-Cas9成像在有或没有ABA的情况下标记的靶向的基因组基因座(箭头)的定位。PYL1-GFP-Emerin显示定位于核包膜(NE)和内质网(ER)。核周边由虚白线显示,除了邻近束缚的基因组基因座的区域。插图显示了周边束缚的基因组基因座的放大图像。比例尺为10μm。
图11显示了图10中代表性显微图像的各个通道,其比较了在有或没有ABA的情况下靶向的基因组基因座(箭头)和核周边(虚线)的定位。顶行显示了PYL1-GFP-Emerin,其定位于核包膜(NE)和内质网(ER)。核周边由虚白线(底部)显示,除了邻近束缚的基因组基因座的区域。比例尺为10μm。
图12显示了在没有(顶部)和有ABA处理(底部)的情况下,沿着图11中所示的虚线,标记的Chr3基因座5和标记的PYL1-GFP-Emerin的荧光强度的线性扫描图。通过加入JF549-halotag染料通过CRISPR-Cas9成像来标记Chr3基因座。
图13显示了在没有(顶部)和有ABA处理(底部)的情况下,沿着所示的虚线,标记的LacO基因座的荧光强度的线性扫描图。
图14是图8和图9中CRISPR-GO靶向的较少重复的区域的染色体位置的概述。单一sgRNA结合靶向区域内的多个重复序列(实心灰色框)。与靶向位点相邻的基因以斜体字母显示在灰色框中。
图15显示了代表性的显微图像,其比较了在有或没有ABA的情况下通过3D-FISH标记的靶向基因组基因座(箭头)的定位。显示了DAPI标记的细胞核。核周边由虚白线显示,除了邻近束缚的基因组基因座的区域。插图显示了周边束缚的基因组基因座的放大图像。对于单独的通道,参见图11。比例尺为10μm。
图16显示了用非靶向sgRNA转染的CRISPR-GO细胞中核周边定位的基因组基因座(Chr7、ChrX和CXCR4)的百分比的定量图。从左到右:图1、3和5::核周边定位的基因组基因座的百分比;图2、4和6:含有至少一个周边相关基因座的细胞的百分比。
图17显示了图18和图19中的CRISPR-GO靶向的非重复区域的染色体位置的概述。设计多种sgRNA以沿着靶向基因(XIST、PTEN、CXCR4)上游或基因主体内的区域展开。sgRNA靶向区域以实心灰色框显示。顶部灰色框显示正向链内的sgRNA靶标,底部灰色框显示反向链内的sgRNA靶标。与靶向位点相邻的基因以斜体字母显示在灰色框中。
图18显示了非重复内源性基因组基因座的CRISPR-GO诱导的核重新定位效率的定量图。与CXCR4相邻的非重复基因座用单一sgRNA或汇集在一起的多种sgRNA靶向。通过3D-FISH可视化基因组基因座,并通过DAPI染色细胞核。从左到右:图1和3:核周边处的基因组基因座的百分比;图2和5:含有至少一个核周边相关基因座的细胞的百分比。所分析的基因座和细胞的数目在底部。
图19显示了使用单一sgRNA(sgCXCR4-1,左;sgCXCR4-2,中间)或6种sgRNA(右)靶向CXCR4基因座的重新定位功效的比较图。从左到右:图1和3(顶部)以及图1(底部):核周边处的基因组基因座的百分比;图2和4(顶部)以及图2(底部):含有至少一个核周边相关基因座的细胞的百分比。所分析的基因座和细胞的数目在底部。
图20是通过加入或去除ABA介导的内源性基因座Chr3:q29的可诱导和可逆的重新定位的时间过程图。Y轴显示了周边定位的Chr3:q29基因座的百分比。X轴显示了加入或去除ABA的时间(小时)。数据表示为平均值±SEM。
图21是在加入ABA后的不同时间点S期停滞细胞(+ABA、+HU)和对照细胞(+ABA、-HU)中基因组重新定位功效的比较图。Y轴显示了在不同时间点周围定位的Chr3:q29基因座的百分比。数据表示为平均值±SEM。左边的框表示时间过程实验的概要。
图22显示了代表性的显微图像,其显示了内源性Chr3:q29基因座(箭头)有丝分裂非依赖性束缚至核包膜。Chr3:q29基因座(箭头)在记录的前4h开始与核包膜分离。核周边束缚发生在4.5h时并且在记录的8h的其余时间保持稳定。此处的图像是图23中的插图。比例尺为2μm。
图23显示了代表性的显微图像,其显示了内源性基因组基因座有丝分裂非依赖性束缚至核周边。插图也在图22中示出。PYL1-GFP-Emerin定位于核包膜(NE)和内质网(ER),并且核包膜由虚线显示。Chr3基因座在记录的前4h不与核包膜相邻。核周边束缚发生在4.5h时,并在记录的8h的其余时间保持。核旋转发生在10h至12h。比例尺为10μm。
图24是显示在不同时间点图22中的基因组基因座与最近的核周边之间的距离的图。每30min拍摄一次图像。
图25显示了未束缚(1&2)和束缚(3&4)的Chr3基因座的步长位移(dx、dy)的散点图。通过从新位置减去前一时间点的位置来计算步长位移:dxt=(xt–xt–1)和dyt=yt–yt–1。每4s追踪移动,持续6min。
图26是未束缚(19个细胞中的1696个步长)和束缚(14个细胞中的1669个步长)的Chr3:q29基因座的平均步长距离的比较图。通过具有不等方差的双侧t检验,p<0.0001。数据表示为平均值±SD。
图27是使用伽马分布的未束缚和束缚的Chr3:q29基因座的步长距离的拟合图。拟合参数:形状参数k=2.4(对于未束缚基因座)和1.9(对于束缚基因座);速率参数β=21.9(对于未束缚基因座)和46.3(对于束缚基因座)。
图28是通过ABI-dCas9和PYL1-GFP-Coilin在人细胞中共表达将基因组基因座靶向CB的ABA诱导型CRISPR-GO系统的示意图。ABA处理使ABI和PYL1二聚化,并将ABI-dCas9靶向的基因组基因座束缚至含有PYL1-GFP-Coilin的CB。
图29显示了代表性的显微图像,其显示了在有或没有ABA的情况下的靶向LacO基因座(上图,通过FISH)和Coilin-GFP-标记的CB(中图)的共定位。
图30显示了LacO基因座的CRISPR-GO诱导的CB束缚效率的定量图。从左到右,图1:与Coilin-GFP标记的CB共定位的LacO基因座的百分比;图2:含有至少一个CB共定位的LacO基因座的细胞的百分比。在底部标记了所分析的基因座和细胞的数目。数据表示为平均值±SEM。
图31显示了代表性的显微图像,其显示了使用CRISPR-GO系统将LacO基因座束缚到CB,其它CB组分(SMN、纤维蛋白、Gemin2,通过免疫染色)与LacO基因座(通过FISH)的共定位。
图32显示了代表性的显微图像,其显示了在有或没有ABA的情况下,靶向的Chr3:q29基因座(上图,通过CRISPR-Cas9成像)和Coilin-GFP标记的CB(中图)的共定位。
图33显示了Chr3:q29基因座的CRISPR-GO诱导的CB束缚效率的定量图。从左到右,图1:与CB共定位的Chr3:q29基因座的百分比;图2:含有至少一个CB共定位的Chr3:q29基因座的细胞的百分比。基因座和细胞的数目在底部。数据表示为平均值±SEM。
图34是通过ABI-dCas9和PYL1-GFP-PML共表达将基因组基因座靶向PML小体的ABA诱导型CRISPR-GO系统的示意图。
图35显示了代表性的显微图像,其显示了在有或没有ABA的情况下,靶向的Chr3:q29基因座(上图,通过CRISPR-Cas9成像)和PML-GFP标记的PML小体(中图)的共定位。
图36显示了CRISPR-GO诱导的PML小体对靶向的Chr3:q29基因座的束缚效率的定量图。从左到右,图1:与PML小体共定位的Chr3:q29基因座的百分比;图2:含有至少一个PML小体共定位的Chr3:q29基因座的细胞的百分比。基因座和细胞的数目在底部。数据表示为平均值±20倍SEM。
图37显示了代表性的显微图像,其显示了在使用CRISPR-GO将Chr3:q29基因座束缚到PML小体之后,另一种PML体标志物SP100(免疫染色)与Chr3:q29基因座(通过CRISPR-Cas9成像)的共定位。比例尺为10μm。
图38是通过加入ABA快速诱导的染色质-CB缔合的图。Y轴显示了CB共定位的LacO基因座的百分比。数据表示为平均值±SEM。
图39是显示去除ABA后染色质-CB解离的动力学的曲线图。Y轴显示了CB共定位的LacO基因座的百分比。X轴显示了从ABA去除后的时间(小时)。数据表示为平均值±SEM。
图40显示了用ABA处理(顶部)和ABA去除后6小时(底部两行)的细胞中靶向的LacO基因座处的GFP-Coilin荧光的比较。显示了具有变暗的CB的细胞(中间)或其中GFP-CoilinCB已经消失的细胞(底部)的两个代表性的显微图像。线性扫描(右侧)测量GFP-Coilin和LacO基因座沿左边所示的虚线的原始荧光强度。
图41显示了代表性的实时显微图像,其显示了由CRISPR-GO介导的靶向的LacO位点处的从头CB(Coilin)的快速形成。在ABA处理之前(-150s)首先对所选择的细胞成像。在-150s至0s将ABA加入到培养基中,并且0s表示在加入ABA后立即拍摄的同一细胞的第一个图像。
图42显示了Cajal小体共定位对邻近靶向的基因座和跨长距离的内源性基因表达的抑制。左:在U2OS细胞中,将Chr3:q29基因座共定位至CB的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb。右侧:在+/-ABA条件下,使用CRISPR-GO将Chr3:q29基因座共定位于CB的ACAP2和PPP1R2基因表达的比较图(通过RT-qPCR测量)。对于对照参见图43。图中无ABA以深灰色表示,有ABA以浅灰色表示。
图43显示了使用CRISPR-GO将内源性Chr3基因座与CB共定位的对照图。左侧:在有和没有ABA的情况下,用CRISPR-GO系统但没有靶向sgRNA来测量ACAP2和PPP1R2 mRNA表达;右侧:在有和没有ABA的情况下,用ABI-dCas9和Chr3靶向sgRNA,但没有PYL1-GFP-Coilin来测量ACAP2和PPP1R2 mRNA表达。在不同条件下使用RT-qPCR测量mRNA。图中无ABA以深灰色表示,有ABA以浅灰色表示。
图44是在图41所示的靶向的LacO基因座处Coilin-GFP荧光强度的定量图。在加入ABA前-150s的荧光强度设定为0(背景)。
图45显示了实时显微图像,其显示了CRISPR-GO介导的现有CB(Coilin,箭头)与相邻靶向的LacO基因座的共定位。在ABA处理之前(-200s),对所选择的细胞成像。在-200s至0s将ABA加入到培养基中,并且0s表示在加入ABA后立即拍摄的第一个图像。比例尺为10μm。
图46显示了通过将靶向的染色质DNA重新定位到核周边而抑制的相邻报告基因表达。左侧:在U2OS 2-6-3细胞中,将LacO重复序列阵列重新定位到核周边的CRISPR-GO系统的示意图,所述LacO重复序列阵列插入到驱动CFP-SKL报告基因的强力霉素(Dox)诱导型TRE-miniCMV启动子附近。右侧:使用CRISPR-GO系统在+/-Dox和+/-ABA条件下将LacO基因座重新定位到核周边的CFP报告基因表达水平的比较图。数据表示为平均值±SD。图中无ABA以深灰色表示,有ABA以浅灰色表示。图中无ABA以深灰色表示,有ABA以浅灰色表示。对于代表性直方图和对照参见图47。
图47显示了代表性的流式细胞术直方图,其比较了在不同处理下使用CRISPR-GO将LacO基因座束缚至核周边的CFP报告基因表达的荧光强度。统计图显示于图46中。右图显示了对于+/-Dox,在有或没有ABA处理的情况下,使用非靶向sgRNA的相对CFP荧光的定量。图中无ABA以深灰色表示,有ABA以浅灰色表示。数据表示为平均值±SD。
图48显示了当使用CRISPR-GO系统将Chr3基因座重新定位到核周边时,ACAP2和PPP1R2基因表达的比较图。在不同条件下使用RT-qPCR测量mRNA。非靶向sgRNA(sgNT)转染的细胞用作对照。数据表示为平均值±SD。
图49显示了通过Cajal小体共定位抑制的靶向的基因座相邻的报告基因表达。左侧:在U2OS 2-6-3细胞中,将LacO重复序列阵列共定位至CB的CRISPR-GO系统的示意图。右侧:对于+/-Dox和+/-ABA条件,使用CRISPR-GO系统将LacO基因座共定位于CB的CFP报告基因表达的比较图。图中无ABA以深灰色表示,有ABA以浅灰色表示。对于代表性直方图和对照参见图50。
图50显示了代表性的流式细胞术直方图,其比较了在不同处理下,使用CRISPR-GO将LacO基因座束缚到CB的CFP报告基因表达的荧光强度。统计图显示于图49中。右图显示了对于+/-Dox,在有或没有ABA处理的情况下,使用非靶向sgRNA的相对CFP荧光的定量。使用非靶向sgRNA的情况下,ABA处理导致CFP报告基因表达的轻微但不显著的降低(p>0.05)。数据表示为平均值±SD。图中无ABA以深灰色表示,有ABA以浅灰色表示。
图51显示了在用或不用ABA处理的示例细胞中,在间期期间,端粒和最近的核包膜点之间的距离的直方图。
图52是在使用CRISPR-GO系统将端粒重新定位到核包膜后,如通过Alamar蓝测定测量的相对细胞活力的比较图。数据表示为平均值±SD。
图53显示了使用CRISPR-GO将端粒重新定位到核周边的细胞的细胞周期分析。细胞用ABA处理3天。顶部:代表性的流式细胞术直方图(左侧)比较端粒靶向ABA处理的细胞(处理的)和非靶向sgRNA对照细胞中的荧光Hoechst 33342染色的DNA组分。底部:三个实验重复的定量。数据表示为平均值±SD。
图54显示了在有或没有ABA的情况下,使用CRISPR-GO将端粒(TRF1-mCherry,顶部)和CB(GFP-Coilin,中间)共定位的U2OS细胞的代表性显微图像。比例尺为10μm。
图55显示了在有或没有ABA的情况下,使用CRISPR-GO将端粒(TRF1-mCherry,顶部)和CB(GFP-Coilin,中间)共定位的HeLa细胞的代表性显微图像。比例尺为10μm。
图56是在有或没有ABA的情况下,使用CRISPR-GO系统将端粒靶向CB的Alamar蓝测定测量的相对U2OS细胞活力的比较图。细胞用ABA处理两天。数据表示为平均值±SD。
图57是在有或没有ABA的情况下,通过U2OS细胞的Alamar蓝测定测量的相对细胞活力的比较图。细胞用ABA处理两天。数据表示为平均值±SD。
图58显示了CRISPR-GO系统,其能够相对于其它核隔室对3D基因组组织进行可编程控制,从而扩展了用于基因组工程的CRISPR-Cas工具箱。CRISPR-GO方法允许3D基因组定位的可编程控制和靶向的染色质基因座相对于不同的核隔室的组织。这扩展了CRISPR-Cas工具箱的用途,超出了诸如基因编辑、转录调节、表观遗传修饰的应用。
图59是通过ABI-dCas9和PYL1-GFP-HP1α在人细胞中共表达将基因组基因座靶向异染色质的ABA诱导型CRISPR-GO系统的示意图。还呈现了显示ABA处理使ABI和PYL1二聚化并且使ABI-dCas9靶向的基因组基因座共定位于PYL1-GFP-HP1α的代表性显微图像。比例尺为10μm。
图60是每个人类染色体的重复序列(四个或更多个)的分布及其相对坐标的图。
图61是全基因组生物信息学分析的图,其揭示了位于与相邻重复序列的给定距离内的人类基因的百分比。
图62显示了CRISPR-GO系统3D基因组组织平台的概述。
图63显示了用于产生大规模异二聚化结构域的诱导型dCas9碱基策略的示意图。图63A显示了诱导型dCas9系统,其在加入植物激素脱落酸(ABA)时通过ABI和PYL1结构域的异二聚化将异染色质蛋白(如HP1α)募集到靶位点。图63B显示了通过靶向串联重复区域产生的高局部浓度的异染色质蛋白。由于包含串联重复的区域,单一sgRNA序列允许彼此紧密接近的数百个基因组位点的潜在结合。此外,HP1α通过其色影结构域自发地形成同型二聚体,并且已被报道通过N-末端与铰链区的相互作用而寡聚化。这些机制使得单一HP1α能够将另外的HP1α募集到靶位点。图63C显示了工程化的蛋白支架还可以增加与各dCas9结合的异染色质蛋白的拷贝数。
图64显示了代表性的显微图像,其显示了在有或没有ABA的情况下,靶向的Chr3:q29基因座(通过CRISPR-Cas9成像的左图)、ABI-BFP-dCas9(中图)、PYL1-sfGFP-HP1α标记(第三个图)和复合图像(右图)的共定位(箭头)。
图65显示了代表性的实时显微图像(0-60分钟),其显示了ABA加入后从头快速形成异染色质基因座PYL1-sfGFP-HP1α。在ABA处理(0min)之前,对所选择的细胞首先成像。在0min至1min,将ABA加入到培养基中,并且1min表示在加入ABA后立即拍摄的同一细胞的第一个图像。
图66显示了通过将PYL1-sfGFP-HP1α募集至Chr3q29基因座而对邻近靶向的基因座和跨长距离的内源基因表达的抑制。图66A显示了在U2OS细胞中通过将PYL1-sfGFP-HP1α募集至Chr3:q29基因座的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb。TFRC位于sgRNA靶位点下游约575kb。图66B显示了在+/-ABA条件(-ABA:DMSO)下,使用CRISPR-GO将PYL1-sfGFP-HP1α共定位至Chr3:q29基因座的ACAP2、PPP1R2和TFRC基因表达(通过RT-qPCR测量)的比较图。数据表示为平均值±SD。
图67显示了合成的HP1α焦点能够募集游离的HP1α。在ABA处理2天和6天后,将游离漂浮的mCherry-HP1α(右图)募集到由PYL1-sfGFP-HP1α(中间图)和ABI-BFP-dCas9(左图)形成的合成异染色质焦点(箭头)。
图68显示了mCherry-HP1α与合成的HP1α焦点的共定位。图68A和图68B显示了复合图像(左图)的荧光图像,其显示了mCherry-HP1α基因座和合成的HP1α焦点的共定位(由箭头指示)。右图显示了用线表示的每幅图像的两个焦点的线性轨迹。mCherry-HP1α与合成的异染色质斑点的共定位的归一化的线性荧光图谱显示了PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处的选择性富集(曲线图)。对于两个图,顶部的深色线代表mCherry-HP1α,浅灰色线代表PYL1-sfGFP-HP1α,底部灰色的线代表ABI-BFP-dCas9。
图69显示了在罕见的亮斑点处可以观察到HP1β与合成的HP1α焦点的共定位。在ABA处理2天后,用HP1β(右图)免疫染色的细胞定位于由PYL1-sfGFP-HP1α(中间图)和ABI-BFP-dCas9(左图)在亮斑点(实心箭头)处而非其它斑点(空心箭头)处形成的合成异染色质焦点。
图70显示了在合成的HP1α焦点处局部染色质密度不增加。图70A和图70B显示了分别在ABA处理后2天和5天拍摄的代表性荧光图像,其表示通过在由PYL1-sfGFP-HP1α(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点(箭头)处的通过mCherry-H2B荧光信号(第三图)测量的组蛋白密度,以及在合成异染色质斑点处的mCherry-H2B信号的相应归一化的线性荧光图谱,其显示在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处没有mCherry-H2B的选择性富集(曲线图)。对于两个曲线图,顶部线代表mCherry-H2B,浅灰色线代表PYL1-sfGFP-HP1α,底部灰色线代表ABI-BFP-dCas9。
图71显示了在合成的HP1α焦点处局部染色质密度不增加。图71A和图71B分别显示了在ABA处理后2天拍摄的代表两种远红DNA染色SiR-DNA(小沟嵌入剂)和DRAQ5(大沟嵌入剂)的代表性荧光图像。图71A显示了在由PYL1-sfGFP-HP1α(第二图,顶部)和ABI-BFP-dCas9(第一图,顶部)形成的合成异染色质焦点(箭头)处通过SiR-DNA染色(第三图,顶部)测量的DNA密度,以及在合成的异染色质斑点处的SiR-DNA的相应归一化的线性荧光图谱,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9(曲线图,顶部)的峰处没有SiR-DNA的选择性富集。对于该曲线图,具有三个峰的线代表siR-DNA染色,并且与两个峰重叠的线代表PYL1-sfGFP-HP1α(较高的第一峰)和ABI-BFP-dCas9(较低的第一峰)。图71B显示了在由PYL1-sfGFP-HP1α(第二图,底部)和ABI-BFP-dCas9(第一图,底部)形成的合成异染色质焦点(箭头)处如通过DRAQ5 DNA染色(第三图,底部)测量的DNA密度,以及在合成的异染色质斑点处的DRAQ5信号的相应归一化的线性荧光图,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9(曲线图,底部)的峰处没有DRAQ5的选择性富集。对于两个曲线图,顶部的线代表mCherry-H2B,浅灰色线代表PYL1-sfGFP-HP1α,底部灰色线代表ABI-BFP-dCas9。对于该曲线图,较高的线代表DRAQ5 DNA染色,与两个峰重叠的线代表PYL1-sfGFP-HP1α和ABI-BFP-dCas9。
图72显示了H3K9me3不在合成的HP1α焦点(箭头)处富集。图72A和图72B分别显示了在ABA处理后2天和5天拍摄的代表性荧光图像。由PYL1-sfGFP-HP1α(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点用箭头表示,并且在第三图中显示了用H3K9me3的免疫染色。曲线图中显示了H3K9me3与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处没有H3K9me3的选择性富集。对于这两个曲线图,具有第一个峰的线代表H3K9me3染色,并且与两个峰重叠的线代表PYL1-sfGFP-HP1α和ABI-BFP-dCas9。
图73显示了共阻抑蛋白KAP1不在合成的HP1α焦点处富集。显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用KAP1(第三图)免疫染色的细胞和由PYL1-sfGFP-HP1α(第二图)和ABI-BFP-dCas9(第一图)形成的合成的异染色质焦点(箭头)。曲线图中显示了KAP1与合成的异染色质斑点的共定位的相应归一化的线性荧光图谱,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处没有KAP1的选择性富集。对于该曲线图,深色较高的线代表KAP1染色,与两个峰重叠的线代表PYL1-sfGFP-HP1α和ABI-BFP-dCas9。
图74显示了野生型HP1α引起邻近和跨长距离的内源性基因表达的抑制,所述长距离是在U2OS细胞中将PYL1-sfGFP-HP1α募集至靶向的Chr3q29基因座引起的。图74A显示了在U2OS细胞中,通过将PYL1-sfGFP-HP1α募集至Chr3:q29基因座处的sgRNA靶位点的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb,并且TFRC位于sgRNA靶位点下游约575kb。图74B显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:100uM ABA;深灰色(每个处理的右条))下,在将PYL1-sfGFP-HP1α定位至Chr3:q29基因座的表达野生型HP1α(HP1α-WT)、突变HP1α(CSD)或突变HP1α(165E)的U2OS细胞中,PPP1R2基因表达(通过RT-qPCR测量)的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α(WT);HP1α(CSD);HP1α(I165E)。图74C显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:100uM ABA;深灰色(每个处理的右条))下,在将PYL1-sfGFP-HP1α定位至Chr3:q29基因座的表达野生型HP1α(HP1α-WT)、突变HP1α(CSD)或突变HP1α(165E)的U2OS细胞中,ACAP2基因表达(通过RT-qPCR测量)的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α(WT);HP1α(CSD);HP1α(I165E)。图74D显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:100uM ABA;深灰色(每个处理的右条))下,在将PYL1-sfGFP-HP1α定位至Chr3:q29基因座的表达野生型HP1α(HP1α-WT)、突变HP1α(CSD)或突变HP1α(165E)的U2OS细胞中,TFRC基因表达(通过RT-qPCR测量)的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α(WT);HP1α(CSD);HP1α(I165E)。数据表示为平均值±SD。
图75显示了二聚化而不是克罗莫结构域(chromodomain)的损失消除了合成的HP1α焦点处的游离HP1α(箭头)。图75A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了将游离漂浮的mCherry-HP1α(第三图)募集至由PYL1-sfGFP-HP1α(CSD)(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点(箭头),以及如通过在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处选择性富集mCherry-HP1α所见的mCherry-HP1α与合成的异染色质焦点(箭头)共定位的相应的归一化的线性荧光图谱(曲线图)。曲线图中,深色最高线代表mCherry-HP1α,中间浅色的线代表PYL1-sfGFP-HP1α(CSD),较低的深色线代表ABI-BFP-dCas9。图75B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了没有将游离漂浮的mCherry-HP1α(第三图)募集至由PYL1-sfGFP-HP1α(I165E)(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点(箭头),以及mCherry-HP1α与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处没有mCherry-HP1α的选择性富集(曲线图)。对于该曲线图,深色的最高线代表mCherry-HP1α,中间浅色线代表PYL1-sfGFP-HP1α(I165E),较低的深色线代表ABI-BFP-dCas9。
图76显示了克罗莫结构域的损失损害正常的HP1α核分布。图76A显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了如通过mCherry-HP1α荧光所见的正常HP1α核分布(中间图),如通过PYL1-sfGFP-HP1α(CSD)所见的受损HP1α核分布(左图),以及mCherry-HP1α和PYL1-sfGFP-HP1α(CSD)信号的相应的归一化的线性荧光图谱(曲线图),其显示了PYL1-sfGFP-HP1α(CSD)的降低的动态范围。对于该曲线图,浅色最高的线代表PYL1-sfGFP-HP1α(CSD),较低的线代表mCherry-HP1α。图76B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了通过mCherry-HP1α荧光所见的正常HP1α核分布(中间图),通过PYL1-sfGFP-HP1α(WT)荧光所见的正常HP1α核分布(左图),以及mCherry-HP1α和PYL1-sfGFP-HP1α(WT)信号的相应的归一化的线性荧光图谱(曲线图),其显示了PYL1-sfGFP-HP1α(WT)的等效动态范围。对于该曲线图,线近似重叠,并且用于PYL1-sfGFP-HP1α(WT)(较浅的线)和mCherry-HP1α(较深的线)。
图77显示了HP1α定位在KRAB束缚的焦点处微弱地富集。图77A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了将游离漂浮的mCherry-HP1α(第三图,顶部)募集至由PYL1-sfGFP-KRAB(第二图,顶部)和ABI-BFP-dCas9(第一图,顶部)显示的合成异染色质焦点(箭头),以及如通过在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处mCherry-HP1α的选择性富集所示的(曲线图,顶部),mCherry-HP1α与合成的异染色质斑点共定位的相应的归一化的线性荧光图谱。对于该曲线图,最高的深色线代表mCherry-HP1α,浅的中间线代表PYL1-sfGFP-KRAB,最低的深色线代表ABI-BFP-dCas9。图77B显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了将游离漂浮的mCherry-HP1α(第三图,底部)募集至通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(第一图,底部)显示的合成异染色质焦点(箭头),以及如通过在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处mCherry-HP1α的选择性富集所示的,mCherry-HP1α与合成的异染色质斑点共定位的相应的归一化的线性荧光图谱。对于该曲线图,最高的深色线代表mCherry-HP1α,浅的中间线代表PYL1-sfGFP-KRAB,最低的深色线代表ABI-BFP-dCas9。
图78显示了KRAB将KAP1募集至合成的焦点。图78A显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了针对KAP1(第三图,顶部)进行免疫染色的细胞以及通过PYL1-sfGFP-KRAB(中间图,顶部)和ABI-BFP-dCas9(左图,顶部)所示的合成的异染色质焦点(箭头),以及如通过在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处的KAP1选择性富集所示的(顶部曲线图)KAP1与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱。对于该曲线图,最高的灰色线代表KAP1,另外两条近似重叠的线代表PYL1-sfGFP-KRAB(较浅的线)和对ABI-BFP-dCas9(较深的线)。图78B显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了用KAP1(第三图,底部)进行免疫染色的细胞以及通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(第一图,底部)所示的合成的异染色质焦点(箭头),以及如通过在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处的KAP1选择性富集所示的(曲线图,底部)KAP1与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱。对于该曲线图,最高的灰色线代表KAP1,另外两条近似重叠的线代表PYL1-sfGFP-KRAB(较浅的线)和ABI-BFP-dCas9(较深的线)。
图79显示了基于KRAB的焦点对于H3K9me3富集仍然不足。图79A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了针对H3K9me3(第三图,顶部)进行免疫染色的细胞、通过PYL1-sfGFP-KRAB(第二图,顶部)和ABI-BFP-dCas9(右图,顶部)所示的合成的异染色质焦点(箭头),以及如通过在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有H3K9me3的选择性富集所示的(曲线图,顶部)H3K9me3与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱。对于该曲线图,中间灰色的线代表H3K9me3,浅灰色的线代表PYL1-sfGFP-KRAB,深灰色的线代表ABI-BFP-dCas9。图79B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了用H3K9me3(第三图,底部)进行免疫染色的细胞和通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(左图,底部)所示的合成的异染色质焦点(箭头),以及H3K9me3与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有H3K9me3的选择性富集(曲线图,底部)。对于该曲线图,中间灰色的线代表H3K9me3,浅灰色的线代表PYL1-sfGFP-KRAB,深灰色的线代表ABI-BFP-dCas9。
图80显示了染色质和DNA密度在KRAB束缚的焦点内没有增加。图80A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了在通过PYL1-sfGFP-KRAB(第二图,顶部)和ABI-BFP-dCas9(第一图,顶部)所示的合成的异染色质焦点(箭头)处的如通过mCherry-H2B(第三图,顶部)荧光信号测量的组蛋白密度,以及在合成的异染色质斑点处的mCherry-H2B信号的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有mCherry-H2B的选择性富集(曲线图,顶部)。对于该曲线图,最高的深色线代表H2B-mCherry,浅灰色的线代表PYL1-sfGFP-KRAB,最低的深色线代表ABI-BFP-dCas9。图80B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了如通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(左图,底部)所示的合成的异染色质焦点(箭头)处的如通过SiR-DNA染色(第三图,底部)测量的DNA密度,以及在合成的异染色质斑点处的siR-DNA信号的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有siR-DNA的选择性富集(曲线图,底部)。对于该曲线图,最高的深色线代表siR-DNA,浅灰色的线代表PYL1-sfGFP-KRAB,最低的深色线代表ABI-BFP-dCas9。
图81显示了KRAB不能在Chr3q29处重现HP1α抑制。图81A显示了在U2OS细胞中通过将PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB募集至Chr3:q29基因座的sgRNA靶位点的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb,并且TFRC位于sgRNA靶位点下游约575kb。图81B显示了在+/-ABA条件(-ABA:DMSO,浅灰色;+ABA:100μM ABA;深灰色)下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中PPP1R2基因表达(通过RT-qPCR测量的)与Chr3:q29基因座的比较图。Y轴:相对倍数变化;X轴从左到右:HP1αsgNT;HP1 sgChr3;KRAB sgChr3。图81C显示了在+/-ABA条件(-ABA:DMSO,浅灰色;+ABA:100μM ABA;深灰色)下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中ACAP2基因表达(通过RT-qPCR测量的)与Chr3:q29基因座的比较图。Y轴:相对倍数变化;X轴从左到右:HP1αsgNT;HP1 sgChr3;KRAB sgChr3。图81D显示了在+/-ABA条件(-ABA:DMSO,浅灰色;+ABA:100μM ABA;深灰色)下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中TFRC基因表达(通过RT-qPCR测量的)与Chr3:q29基因座的比较图。Y轴:相对倍数变化;X轴从左到右:HP1αsgNT;HP1 sgChr3;KRAB sgChr3。用非靶向sgRNA(sgNT)转染的细胞被用作对照。数据表示为平均值±SD。
图82显示了KRAB而不是HP1α抑制Chr1p36重复处的近端。图82A显示了在U2OS细胞中通过将PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB募集至Chr1:p36基因座处的sgRNA靶位点的CRISPR-GO系统的示意图。CPTP位于sgRNA靶位点上游~25kb,INTS11位于sgRNA靶位点上游~26kb,DVL1位于sgRNA靶位点上游约0.9kb。图82B显示了在+/-ABA条件(-ABA:DMSO,浅灰色;+ABA:100μM ABA;深灰色)下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中DVL1基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左到右:HP1αsgNT;HP1 sgChr1;KRAB sgChr1。图82C显示了在+/-ABA条件(-ABA:DMSO,浅灰色;+ABA:100μM ABA;深灰色)下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中CPTP基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左到右:HP1αsgNT;HP1 sgChr1;KRAB sgChr1。图82D显示了在+/-ABA条件(-ABA:DMSO,浅灰色;+ABA:100μM ABA;深灰色)下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中INTS11基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左到右:HP1αsgNT;HP1 sgChr1;KRAB sgChr1。用非靶向sgRNA(sgNT)转染的细胞被用作对照。数据表示为平均值±SD。
图83显示了HP1α和KRAB对Chr1p36的基因抑制具有拮抗作用。图83A显示了在U2OS细胞中将PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者募集至Chr1:p36基因座处的sgRNA靶位点的示意图。CPTP位于sgRNA靶位点上游~25kb,INTS11位于sgRNA靶位点上游~26kb,并且DVL1位于sgRNA靶位点上游约0.9kb。图83B显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:ABA;深灰色(每个处理的右条))下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的DVL1基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α;KRAB;HP1α+KRAB。图83C显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:ABA;深灰色(每个处理的右条))下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的CPTP基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α;KRAB;HP1α+KRAB。图83D显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:ABA;深灰色(每个处理的右条))下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的INTS11基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α;KRAB;HP1α+KRAB。数据表示为平均值±SD。
图84显示了HP1α和KRAB在Chr3q29处对基因抑制具有拮抗作用。图84A显示了在U2OS细胞中通过将PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者募集至Chr3:q29基因座处的sgRNA靶位点的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb,并且TFRC位于sgRNA靶位点下游约575kb。图84B显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:ABA;深灰色(每个处理的右条))下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的PPP1R2基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α;KRAB;HP1α+KRAB。图84C显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:ABA;深灰色(每个处理的右条))下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的ACAP2基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α;KRAB;HP1α+KRAB。图84D显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:ABA;深灰色(每个处理的右条))下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的TFRC基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。Y轴:相对倍数变化;X轴从左至右:HP1α;KRAB;HP1α+KRAB。数据表示为平均值±SD。
图85显示了H3K9me3通过SUV39H1(全长)被沉积在焦点的子集。图85显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(第三图,顶部和底部)进行免疫染色的细胞,所述H3K9me3定位于由PYL1-mCherry-SUV39H1(第二图,顶部和底部)和ABI-BFP-dCas9(第一图,顶部和底部)形成的合成的异染色质焦点。如通过在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处H3K9me3的选择性富集所示的(曲线图,顶部和底部),相应的归一化的线性荧光图谱显示了H3K9me3与合成的异染色质斑点的共定位。对于该曲线图,最高的深色线代表H3K9me3,浅灰色的近似重叠线代表PYL1-mCherry-SUV39H1和ABI-BFP-dCas9。
图86显示了H3K9me3通过SUV39H1(Δ1-76)未被沉积在焦点处。图86显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(右图,顶部和底部)进行免疫染色的细胞和由PYL1-mCherry-SUV39H1(Δ1-76)(中间图,顶部和底部)和ABI-BFP-dCas9(左图,顶部和底部)形成的合成的异染色质焦点。
图87显示了H3K9me3未被沉积在G9a(全长)。图87显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(右图,顶部和底部)进行免疫染色的细胞和由PYL1-mCherry-G9a(全长)(中间图,顶部和底部)和ABI-BFP-dCas9(左图,顶部和底部)形成的合成的异染色质焦点。
图88显示了G9a(催化结构域;G9aΔ1-829)定位于细胞质。图88显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(右图)进行免疫染色的细胞,所述H3K9me3(右图)定位于由PYL1-mCherry-G9aΔ1-829(左图)形成的合成异染色质焦点。
图89显示了SUV39H1(全长)没有明显富集HP1α。图89显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用HP1α(第三图,顶部和底部)进行免疫染色的细胞和由PYL1-mCherry-SUV39H1(第二图,顶部和底部)和ABI-BFP-dCas9(第一图,顶部和底部)形成的合成的异染色质焦点,以及HP1α与合成的异染色质斑点共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-mCherry-SUV39H1和ABI-BFP-dCas9的峰处没有HP1α的选择性富集(曲线图,顶部和底部)。对于曲线图,最高的深色线代表HP1α,近似重叠的线代表PYL1-sfGFP-SUV39H1和ABI-BFP-dCas9。
图90显示了PYL1-sfGFP-HP1α展示正常的亚核定位。图90A显示了在不存在ABA诱导剂的情况下,PYL1-sfGFP-HP1α(中间图,顶部)的核分布类似于免疫染色的HP1β的核分布(右图,顶部),但不类似于ABI-BFP-dCas9的核分布(左图,顶部)。图90B显示了在不存在ABA诱导剂的情况下,PYL1-sfGFP-HP1α(中间图,底部)的核分布类似于免疫染色的H3K9me3的核分布(右图,底部),但不类似于ABI-BFP-dCas9的核分布(左图,底部)。
图91显示了通过将非靶向sgRNA募集至Chr3q29基因座,不抑制邻近靶基因座和跨长距离的内源性基因表达。图91A显示了在U2OS细胞中的Chr3:q29基因座处测量基因的基因组位置的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb。TFRC位于sgRNA靶位点下游约575kb。图91B显示了在+/-ABA条件(-ABA:DMSO,浅灰色(每个处理的左条);+ABA:ABA;深灰色(每个处理的右条))下,使用未定位于Chr3:q29基因座的非靶向sgRNA的ACAP2、PPP1R2和TFRC基因表达(通过RT-qPCR测量)的比较图。Y轴:相对倍数变化;X轴从左至右:ACAP2;PPP1R2;TFRC。数据表示为平均值±SD。
图92显示了Chr3q29基因座不是天然异染色质的。图92显示了在不存在ABA诱导剂,存在DMSO的情况下,缺少H3K9me3与mCherry-HP1α的共定位(中间图,顶部)或ABI-BFP-dCas9与mCherry-HP1α的共定位(sgChr3)(左图,顶部和底部)。HP1α与异染色质的共定位图谱的相应的归一化的线性荧光图谱显示在H3K9me3和ABI-BFP-dCas9的峰处缺乏HP1α的选择性富集(曲线图)。对于顶部曲线图,浅灰色较高的线代表H3K9me3,深色较低的线代表ABI-BFP-dCas9。对于底部曲线图,浅灰色的较高线代表mCherry-HP1α,深色的较低线代表ABI-BFP-dCas9。
公开详述
活细胞内多核苷酸的三维(3D)空间组织在调节和维持诸如基因表达、基因组稳定性和细胞功能的过程中起重要作用。例如,与核层或核周边相关的基因组序列通常显示低转录活性,而定位于核内部的那些基因组序列通常展示相对较高的活性。此外,真核细胞核含有许多无膜核小体(如Cajal小体、PML小体、核仁和斑点),它们在各种生物学过程中在功能上是重要的。基因组学和细胞生物学的中心目标是理解基因组结构,其在各种核隔室内的组织,与基因表达之间的关系,但是该目标受到目前可用的方法的限制。
通过使用基于显微镜检查的成像(例如FISH)和染色体构象捕获(3C)技术的许多研究已经提出了基因组组织和细胞命运确定之间的相关性。例如,在淋巴细胞发育过程中,在祖细胞中位于核周边的IgH和Igx基因座通常在前B细胞中重新定位至核内部,这是与免疫球蛋白基因座的激活和重排同步的过程。类似地,原神经转录因子Asc11的基因组基因座位于未分化胚胎干细胞的核周边,但在神经元分化过程中重新定位到核内部。此外,基于3C的研究已经揭示了在发育和疾病过程中高分辨率染色质相互作用(例如,拓扑相关结构域)的变化。总之,这些是用于绘制基因组组织和测量染色质元件的物理相互作用的强有力的方法,但是它们通常不能提供基因组定位和功能之间的因果联系,并且它们不能测量活细胞中的动态变化。
已经观察到核隔室在基因组组织和功能中起重要作用。提出通过液相-液相分离来组装核小体,所述液相-液相分离是由蛋白质与RNA之间的多价相互作用驱动的。通过蛋白质或RNA组分固定在染色质上,从头的核小体形成可以成核。在核小体中,Cajal小体(CB)对于脊椎动物胚胎发生是必需的,并且在肿瘤细胞和神经元中是丰富的。CB可以由支架蛋白组分Coilin标记,并且在小核RNA(snRNA)生物发生、核糖核蛋白(RNP)组装和端粒酶生物发生中起重要作用。由肿瘤抑制蛋白PML标记的早幼粒细胞白血病(PML)核小体是与疾病过程(包括肿瘤和病毒感染)相关的丰富的核点结构。然而,核小体和染色质的共定位如何因果地影响基因表达和细胞功能仍然是很难解决的。
为了理解这种因果关系,已经开发了序列特异性DNA-蛋白质相互作用来介导靶向的基因组重组。该技术利用插入到基因组基因座中的LacO重复序列阵列,其当与融合到核膜蛋白的Lad组合时,有助于将相邻的基因组序列束缚到核周边。使用这种技术,一些研究已经报道了将基因重新定位到核周边可以导致基因抑制。然而,这种技术可能不适于可编程的基因组靶向,并且可能是繁琐且难以实施的。例如,建立稳定的含有LacO重复序列的细胞系是该技术的先决条件,其已经涉及许多步骤,诸如使大的LacO重复序列阵列随机插入基因组,筛查含有单个插入基因座的细胞,产生稳定的细胞系,以及通过FISH表征基因组插入位点。需要新的工具来以可编程的、精确的和靶向的方式操纵基因组的空间和时间组织。
原核II类CRISPR-Cas(成簇规律间隔短回文重复序列-CRISPR相关的)系统已经被用作用于基因编辑、基因调节、表观基因组编辑、染色质环形成和活细胞基因组成像的工具箱(例如Cas9和Cpf1)。与转录效应物或表观遗传修饰结构域连接的核酸酶失活的Cas(dCas)蛋白允许调节邻近单一导向RNA(sgRNA)靶位点的基因的表达。CRISPR-Cas系统是否可用于介导基因组组织和重新定位染色质DNA相对于哺乳动物细胞核内各种核隔室的位置仍然是未知的。鉴于以上所述,存在对进行靶多核苷酸的空间组织的可替代系统和方法的需求。本公开解决了这种需求和其它需求。
此外,真核细胞是能够在空间和时间上协调许多生化反应的复杂结构。这种协调的关键是多核苷酸(如基因组)的3D组织,以及将细胞内空间细分为功能隔室。可以通过围绕细胞器并充当物理屏障的细胞内膜来实现隔室化。此外,细胞已经开发出了复杂的机制来以严格调节的方式分隔它们的内部物质。最近的研究提供了引人注目的证据,即无膜隔室化可以通过液体分离(最终导致液-液相分离以及相界的形成的过程)来实现。
本发明的发明人已经令人惊奇地发现了可以有效地控制多核苷酸相对于功能隔室(包括核隔室,诸如核周边,Cajal小体和早幼粒细胞白血病(PML)小体)的空间定位的通用系统和方法。此外,本发明的发明人已经发现可以有效控制隔室相对于多核苷酸的空间定位的通用系统和方法。该系统、组合物和方法还可以用于通过形成在细胞内组织或分配的蛋白质、RNA和/或DNA分子的超分子组装体来产生合成相分离。例如,有助于形成特定隔室的蛋白质(例如隔室特异性蛋白或隔室组成蛋白)可以被用于围绕靶多核苷酸周围形成隔室。本文所公开的系统和方法可以用于操纵细胞核/细胞质中基因组DNA和RNA组分的时空组织和用于调节多种细胞功能。所提供的系统、组合物和方法还可以被用于空间基因组组织的可编程控制,并用于应用该组织影响多核苷酸调节和细胞功能,以及介导靶向的多核苷酸与不同细胞隔室之间的相互作用动力学。所公开的系统、组合物和方法可以被用于例如实现亚细胞空间的动态重组,作为在疾病(包括癌症和神经退行性变)中操纵病理性蛋白质组装的框架。所公开的系统、组合物和方法还可以被用于例如实现亚细胞空间和靶多核苷酸的动态重组以促进同源性定向修复(HDR)、非同源性末端连接(NHEJ)或多核苷酸修复的其它方法。
此外,所公开的系统、组合物和方法可以产生三维结构,包括三维环,例如,增强子与启动子之间的三维环、染色体边界、拓扑相关结构域、或用于调节多个基因及它们的调节元件的基因簇。所公开的系统、组合物和方法可以被用于产生分离包含靶多核苷酸的靶区域的基因组隔离体用于染色体保护和操作。所公开的系统、组合物和方法还可以被用于将多核苷酸定位在特定类型的隔室内。例如,所公开的系统、组合物和方法被用于将包含靶多核苷酸的多核苷酸区域捕获在隔室的空间区域中或包含独特限定的生化性质的隔室内,所述生化性质促进或防止重组或诱变,促进或抑制基因转录、剪接或翻译,或促进或抑制多核苷酸转运和移动。因此,重要的是,如本文所述的系统、组合物和方法可以被用于操纵靶多核苷酸和包含靶多核苷酸的基因组区域的命运、功能和性质,其也可以被用于操纵包含靶多核苷酸的细胞的命运、功能和性质。
所公开的系统、组合物和方法可以是化学诱导型和可逆型的系统、组合物和方法,使得能够探查例如染色质与活细胞中的核隔室的相互作用的实时动态。作为另外的实例,基因组基因座至核周边的可诱导的重新定位可以允许解剖有丝分裂依赖性和非依赖性重新定位事件,探查基因位置与表达之间的关系,以及理解端粒重新定位对细胞生长的影响。本文所述的系统,组合物和方法可以介导Cajal小体在靶染色质基因座处的快速从头形成,并引起跨长距离(>30kb)的相邻内源性基因表达的显著抑制。本文所述的系统、组合物和方法可以介导包含促进HDR的蛋白质的隔室在已切割的靶多核苷酸处快速从头形成,所述蛋白质为例如Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、核酸外切酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。本文所述的系统、组合物和方法从头快速形成促进核异染色质形成的隔室,诸如HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。隔室可以包含特异性针对该特定隔室特异的蛋白(隔室特异性蛋白)或作为该特定隔室的一部分的蛋白(隔室组成蛋白)。因此,所提供的系统、组合物和方法提供了以靶向方式研究大规模空间多核苷酸组织和功能的新平台,以及用于操纵靶多核苷酸、包含靶多核苷酸的区域以及包含靶多核苷酸的细胞的命运、功能和性质的新平台。
在一些实施方案中,使用不同的sgRNA允许系统、组合物和方法被编程以灵活地靶向不同的基因组序列。靶多核苷酸与隔室的共定位可以通过快速从头形成隔室,形成围绕靶多核苷酸隔室,或通过将靶多核苷酸重新定位到现有的隔室来触发。基因组基因座至核周边的重新定位可以以有丝分裂依赖性和非依赖性的方式实现。靶DNA与Cajal小体的共定位可以通过快速从头形成Caja小体或通过将靶DNA重新定位到现有的Caja小体来触发。使用所提供的系统和方法将基因组基因座靶向至核周边或Cajal小体也可以抑制相邻的报告基因表达。重要的是,基因组基因座与Caja小体的共定位还可以抑制相邻内源性基因(>30kb)的表达。此外,使用本公开内容的方面将端粒隔绝至核周边可以负面地影响细胞生长。将基因组基因座靶向至包含促进HDR的蛋白质在已切割的靶多核苷酸处的隔室或隔室的形成还可以被用于促进切割的靶多核苷酸的HDR,所述蛋白质为如Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、核酸外切酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。将基因组基因座靶向至包含促进核异染色质形成的蛋白质的隔室或隔室的形成可以被用于促进包含靶多核苷酸的基因组区域的转录调节,所述蛋白质为如HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。
CRISPR-Cas系统已经被重新用作灵活的基因组工程平台,并且已经被用于诸如基因编辑、转录调节、表观遗传修饰、DNA环形成和基因组成像的应用。本文提供了对呈多核苷酸组织系统形式的CRISPR-Cas工具箱的进一步扩展,其使得能够对细胞隔室内的靶向的多核苷酸定位进行可编程控制。在某些方面,靶向的多核苷酸包含基因组DNA,并且所述系统被称为CRISPR-GO(图58),其中GO是指基因组组织。本文所公开的系统和方法可以有效地将多核苷酸(例如,内源性基因组基因座)靶向各种细胞隔室(例如,核周边、Cajal小体和PML小体)或围绕靶多核苷酸有效地组装或形成各种细胞隔室。所提供的系统、组合物和方法可以是诱导型和可逆型的系统、组合物和方法,其允许例如对靶向的染色质DNA与核隔室之间的相互作用动力学进行探查。所提供的系统、组合物和方法可以是诱导型和可逆型的系统、组合物和方法,其允许对围绕靶多核苷酸的隔室的形成进行空间和时间控制。利用该特征,已经实现了基因组基因座至核周边的有丝分裂依赖性和非依赖性的重新定位,并且已经证明了Cajal小体在靶基因座处的从头形成和现有Cajal小体与靶向的染色质基因座的共定位。使用本文所公开的系统和方法将基因组基因座与核周边或Cajal小体共定位已被用于影响相邻基因的表达。值得注意的是,使用所提供的系统和方法将内源性基因座与Cajal小体共定位可以显著抑制附近的基因表达,即使这些基因远离(>30kb)靶位点。还已经发现用本文所公开的系统和方法将端粒重新定位致核周边可以破坏端粒动力学并降低细胞活力。将基因组基因座靶向至包含促进HDR的蛋白质在已切割的靶多核苷酸处的隔室或隔室的形成还可以被用于促进切割的靶多核苷酸的HDR,所述蛋白质为如Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、核酸外切酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。将基因组基因座靶向至包含促进核异染色质形成的蛋白质的隔室或隔室的形成可以被用于促进包含靶多核苷酸的基因组区域的转录调节,所述蛋白质为如HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。所提供的方法提供了用于可编程控制多核苷酸(例如基因组DNA)与各种细胞(例如核)隔室相互作用的平台,其可以促进对时空多核苷酸组织在调节、稳定性和细胞功能方面的功能作用的更深入的理解。此外,如本文所述的系统、组合物和方法通过围绕在多核苷酸区域内的靶多核苷酸形成隔室,提供了多核苷酸区域(如细胞核内基因组多核苷酸的特定区域)环境的平台可编程控制,这导致多核苷酸区域的命运、功能和性质的时空操纵。
细胞生物学的主要目标是了解基因组与不同核隔室的相互作用如何影响基因表达、染色质构象和细胞功能。CRISPR-GO系统可以有效地将特定基因组基因座靶向核周边、Cajal小体和PML小体,并且还具有扩展至其他核隔室(如核仁)、核孔复合物和核小点的潜力。可以通过将CRISPR-GO与不同的隔室特异性蛋白(如异染色质蛋白1α(HP1α))连接来实现将基因组基因座靶向至其它核隔室(图59)。CRISPR-GO系统还可以有效地组装或形成隔室(诸如包含Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、外切核酸酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1的隔室)以靶向多核苷酸促进HDR。组装或形成其它隔室(如促进NHEJ的隔室)可以通过将CRISPR-GO与不同的隔室特异性蛋白质(如KU70、KU80、Artemis、PKcs、LigIV或XRCC4)连接来实现。类似地,本文所公开的系统和方法提供了可以被应用于各种细胞隔室研究的通用模块化平台。CRISPR-GO系统还可以有效地组装或形成隔室(如包含隔室组成蛋白(例如HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a)的隔室)以促进围绕靶多核苷酸的核异染色质形成。可以通过将CRISPR-GO与不同的隔室特异性蛋白或隔室组成蛋白连接来实现围绕靶多核苷酸周围组装或形成其它隔室,所述隔室特异性蛋白或隔室组成蛋白可以被用于调节(例如,增加或降低)表达,引入表观遗传修饰,产生三维结构、拓扑相关结构域或包含靶多核苷酸或另外的多核苷酸(例如,来自靶多核苷酸的远端或近端基因)的基因组边界。
所提供的系统(例如CRISPR-GO)、组合物和方法允许以精确和靶向的方式可编程地重新定位多核苷酸(例如,基因组基因座)。所提供的系统(例如,CRISPR-GO)、组合物和方法允许以精确和靶向的方式使用围绕靶多核苷酸(例如,基因组基因座)的隔室组成蛋白可编程地形成隔室。所提供的系统(例如,CRISPR-GO)、组合物和方法还允许通过以精确且靶向的方式将隔室组装或共定位至多核苷酸来控制靶多核苷酸的局部环境。例如,CRISPR-GO系统可以有效地将位于不同染色体上的重复和非重复染色质基因座定位至核隔室。作为另一个实例,CRISPR-G系统可以有效地组装包含蛋白质的隔室,以促进HDR到达位于染色体上的靶重复或非重复染色质基因座。作为另一个实例,CRISPR-GO系统有效地围绕位于不同染色体上的靶重复和非重复染色质基因座形成隔室(如异染色质隔室)。CRISPR-GO系统可以有效地组装包含蛋白质的隔室,以促进围绕位于染色体上的靶重复或非重复染色质基因座的核异染色质。与LacI-LacO系统不同,CRISPR-GO系统的基因组靶标可以通过sgRNA与靶DNA序列之间的碱基配对相互作用灵活地限定,并且简单地改变sgRNA上的~20nt区域允许靶向不同的基因组基因座。该可编程特征可以允许使用CRISPR-GO靶向各种基因组元件,其包括蛋白质编码基因、非编码RNA基因和调节元件。相比之下,LacO-LacI技术不适于可编程的基因组靶向,因为它只能在含有高度重复的LacO阵列的良好表征的细胞系上进行。建立和表征有用的含LacO细胞系是困难且费力的。通常将LacO阵列随机插入到基因组中,之后选择含有单拷贝插入的细胞以在通过FISH和其它方法表征精确的基因组整合位点之前构建稳定的细胞系。此外,基因组中大LacO阵列的整合可能改变局部染色质构象。总之,本文所公开的系统、组合物和方法的通用性提供了比研究细胞组织以及操纵靶多核苷酸、包含靶多核苷酸的基因组区域或包含靶多核苷酸的细胞的命运、功能和性质的常规方法更大的技术优势。
用本文所公开的系统、组合物和方法靶向多核苷酸的新基因座或隔室的总的便利性可以促进对3D多核苷酸组织中的扰动与细胞表型变化之间的关系的更广泛的研究。例如,不同的sgRNA设计策略可以被用于靶向重复和非重复基因组基因座。使用在确定的基因组区域内具有多个靶标的单一sgRNA可以容易地靶向重复的基因组基因座。人类基因组具有丰富的重复序列或重复序列衍生的序列,其中许多可能具有重要的基因组组织作用。这些重复序列是大规模筛查实验的候选序列,为研究基因组相对于核隔室的组织与细胞表型之间的关系开辟了更高通量方法的大门。此外,可以使用多种sgRNA或使用单一sgRNA靶向非重复的基因组基因座。为了靶向非重复的基因座,可以使用展开sgRNA的库作为起始点。
所提供的系统、组合物和方法也可以被用于研究多核苷酸重新定位的实时动力学以及细胞隔室与活细胞中特定区域的缔合和解离。在CRISPR-GO系统中,基因组基因座通过化学诱导的dCas9结合的基因组基因座与隔室特异性蛋白之间的物理相互作用靶向至所期望的隔室。可替代地,通过dCas9结合的基因组位点与隔室特异性蛋白质或隔室组成蛋白之间的化学诱导物理相互作用,将隔室在靶多核苷酸处靶向或组装。CRISPR-GO的可诱导的和可逆的特征防止了将染色质DNA连续地重新定位至给定的核隔室或将隔室连续地重新定位至靶多核苷酸的潜在的不利影响。
作为一个实例,通过组合使用CRISPR-Cas9活细胞基因组成像和CRISPR-GO,已显示内源性基因组基因座重新定位至核周边以有丝分裂依赖性和非依赖性方式发生。在有丝分裂过程中,核膜在前中期瓦解,然后在末期重新形成。有丝分裂过程中染色质和核结构的显著变化可以促进基因组基因座与核膜之间的相互作用以产生核包膜束缚。在间期期间,尽管染色质结构保持相对稳定,但基因组基因座与核周边在其紧密接近时仍可形成相互作用。在间期期间的核周边束缚可能依赖于靶向的基因座与核周边之间的接近度,并且位于核周边远端的基因组基因座不太可能通过有丝分裂非依赖性方式被束缚。
一些提供的实施方案的化学诱导过程还允许研究靶多核苷酸基因座与活细胞中的细胞隔室之间的实时关联。例如,与相对较慢地重新定位到核周边(在数小时内)相比,基因组基因座和Cajal小体之间的共定位以快得多的速率(在数分钟内)发生,这可能是因为Cajal小体组分更多地扩散到整个细胞核中。使用所公开的系统和方法,已经观察到CB与靶基因组基因座之间的共定位可以以两种方式发生:一种是在基因组基因座处快速形成从头Cajal小体,另一种是现有的CB与靶基因组基因座的重新定位,这是一种以前没有报道过的现象。先前的工作已经提出Cajal小体是通过相分离形成的。CRISPR-GO将核小体组分(例如CB的Coilin)募集至靶向的基因组基因座可以在靶染色质基因座处产生合成的相分离。
所提供的组合物、方法和系统还被用于在将基因组基因座重新定位到核周边时观察相邻荧光报告基因的抑制。先前的工作报道了在将LacO基因座束缚到核周边后对基因表达的不同影响。特别地,早期的研究已经观察到LacO重复序列被LacI-核纤层蛋白B募集到核周边后转录没有变化,并且已经显示通过LacI-Emerin将LacO重复序列束缚到核周边导致相邻基因的抑制。本文所公开的系统已经显示将报告基因重新定位致Emerin引起基因抑制(~59%)。
本文所公开的系统、组合物和方法还被用于在CRISPR-GO介导的染色质基因座共定位于CB之后抑制相邻的报告基因和内源性基因。重要的是,Cajal小体与内源性基因座的靶向共定位抑制了跨长距离(>30kb)的相邻基因的表达。在将基因组基因座靶向CB后的这种观察到的基因抑制尚未被报道。相比之下,CRISPRi/a方法通过募集转录效应物起作用,所述转录效应物主要影响靶位点周围几千碱基内的局部基因的表达。因此,所提供的方法和系统提供了一种重要的用于调节长距离内的多核苷酸的表达的新方法。所述方法和系统还提供了以系统方式控制靶多核苷酸重新定位至不同细胞隔室的以研究细胞效应和程序多核苷酸调节的能力。
本文所公开的系统、组合物和方法也已经被用于在CRISPR-GO介导的靶多核苷酸(例如包含串联重复序列的染色体上的区域)的异染色质的形成之后调节近端基因和远端基因。重要的是,具有内源性基因座的异染色质的靶向形成可以调节跨包含靶多核苷酸的区域的基因表达。这可以包括调节靠近靶多核苷酸或远离靶多核苷酸的基因的表达。因此,所提供的方法和系统提供了用于在短距离和长距离上调节多核苷酸表达的重要的新方法。所述方法和系统还提供通过靶向特异性多核苷酸来控制隔室(例如异染色质隔室)的形成的定位的能力。
隔室形成
在一些实施方案中,本文所公开的系统、组合物和方法与自聚集的内源性或合成寡聚化蛋白一起使用以形成人工蛋白/RNA/DNA聚集体,所述人工蛋白/RNA/DNA聚集体可以具有一种或多种独特的化学、物理或生物学性质(如特定蛋白、RNA或DNA的选择性扩散;与其它分子缔合或解离;基因调节机制的促进或抑制;或促进或抑制DNA重组或稳定性机制)。此类聚集体是可以围绕靶多核糖核苷酸形成的隔室,并且在本文中被称为合成的细胞相(synthetic cellular phases,SCP)。这些聚集体可以对基因调节或多核苷酸修复机制具有强的影响。这些聚集体的形成可以被另外地用于将表观遗传修饰引入到包含靶多核苷酸或另外的多核苷酸(例如,来自靶多核苷酸的远端或近端基因)的三维结构、拓扑相关结构域或基因组边界中,产生所述三维结构、拓扑相关结构域或基因组边界。在一些实施方案中,蛋白质、蛋白质结构域、RNA、RNA结构域或它们的组合与所提供的系统连接,以围绕所期望的染色质DNA或RNA特异性地形成所期望的SCP。例如,促进HDR的蛋白质被用于围绕已经或将要通过基因编辑技术(如CRISPR/Cas、TALEN、ZFN或大范围核酸酶或其它多核苷酸切割机制)切割的靶多核苷酸形成SCP。促进HDR的示例性蛋白质可以包括Rad51、Rad52、RPA、MRN复合物,MRX复合物,CtlP、Sae2、BLM、Sgs1、BRCA2、外切核酸酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。另外地,促进HDR的SCP可以包含模板多核苷酸。例如,促进异染色质的蛋白质被用于围绕靶多核苷酸形成SCP,以调节包含靶多核苷酸的基因组区域内多核苷酸的基因表达。促进这种异染色质SCP的示例性蛋白是HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。在一些实施方案中,所提供的系统、组合物和方法可用于操纵细胞核和/或细胞质中基因组DNA和RNA组分的时空组织,以及用于调节不同的细胞功能。
如本文所公开的系统、组合物和方法可以被用于控制靶多核苷酸的局部环境。这可以通过将蛋白质空间定位至靶多核苷酸来实现。在一个方面,提供了用于将隔室组成蛋白空间定位至靶多核苷酸的系统。隔室组成蛋白还可以包含寡聚化结构域或其它结构域,其将另外的隔室组成蛋白募集到靶多核苷酸以形成隔室(如SCP)。在一些实施方案中,形成围绕靶多核苷酸的隔室的方法,所述方法包括:(a)提供与第一二聚化结构域连接的隔室组成蛋白;(b)提供与第二二聚化结构域连接的致动器部分,其中所述致动器部分和所述靶多核苷酸形成复合物;和(c)组装包含复合物的第一二聚化结构域和第二二聚化结构域的二聚体,从而形成围绕靶多核苷酸的隔室。例如,隔室组成蛋白是异染色质蛋白。所述系统可以包含与第一二聚化结构域连接的异染色质蛋白。所述系统还可包含靶向靶多核苷酸的致动器部分,其中所述致动器部分与第二二聚化结构域连接,所述第二二聚化结构域能够组装成具有所述二聚化结构域的二聚体。所述二聚体的组装可以导致异染色质蛋白定位于靶多核苷酸。在一些实施方案中,通过施用如本文所述的组合物形成隔室。组合物可以包含a)与第一二聚化结构域连接的隔室组成蛋白;和b)与第二二聚化结构域连接的致动器部分;并且其中所述第一二聚化结构域与所述第二二聚化结构域结合。在一些实施方案中,隔室由包含以下的组合物形成:a)与第一二聚化结构域连接的隔室组成蛋白;和b)与支架连接的致动器部分,其中所述支架与第二二聚化结构域连接;并且其中所述第一二聚化结构域与所述第二二聚化结构域结合。在一些实施方案中,所述组合物还包含配体,其中所述第一二聚化结构域和所述第二二聚化结构域与所述配体结合,从而将所述第一二聚化结构域与所述第二二聚化结构域连接。在一些实施方案中,配体是诱导型的配体。在一些实施方案中,所述支架与至少1、2、3、4、5、6、7、8、9或10个第二二聚化结构域连接。在一些实施方案中,所述支架与多于1、2、3、4、5、6、7、8、9或10个第二二聚化结构域连接。在一些实施方案中,所述支架与1、2、3、4、5、6、7、8、9或10个第二二聚化结构域连接。在一些实施方案中,所述隔室组成蛋白还与第二支架连接,其中第二支架与至少一个第一二聚化结构域连接。在一些实施方案中,所述第二支架与至少1、2、3、4、5、6、7、8、9或10个第一二聚化结构域连接。在一些实施方案中,所述第二支架与多于1、2、3、4、5、6、7、8、9或10个第一二聚化结构域连接。在一些实施方案中,所述第二支架与1、2、3、4、5、6、7、8、9或10个第二第一结构域连接。
在一些实施方案中,所述系统、组合物和方法包含诱导型二聚化,其中所述二聚化可以是化学或光遗传学介导的。二聚体可以是同型二聚体。二聚体可以是异二聚体。在一些实施方案中,所述二聚化由分子配体(如化学诱导剂)介导。在某些方面,二聚化系统选自ABA诱导的ABI/PYL1二聚化系统、GA诱导的GA/GAI二聚化系统、雷帕霉素诱导的FRB/FKBP二聚化系统、TMP-Htag诱导的HaloTag/DHFR二聚化系统或使用酶催化反应的二聚化系统。也考虑其它二聚化系统。
在一些实施方案中,所提供的系统和方法的靶向多核苷酸包含DNA(如基因组DNA)。在一些实施方案中,靶多核苷酸包含RNA,例如mRNA、微RNA、siRNA或非编码RNA。适用于所提供的系统和方法的致动器部分和相关靶向系统包括例如CRISPR-Cas(包括所有类型的CRISPR,I型、II型、III型、IV型、V型、VI型,例如Cas9、Cas12、Cas13);Argonaute介导的靶向或锌指靶向;TALE(转录激活因子样效应物);LacO-Lac1或TetO-TetR;以及DNA相互作用蛋白或RNA结构域的特异性对。Cas9和Cas13也可以以序列依赖性的方式靶向RNA,并且可以以这种方式与所提供的系统一起用于将RNA分子重新定位至不同的细胞隔室。Cas蛋白可以缺乏DNA切割活性。靶向系统可以包括序列特异性导向RNA或导向DNA。
致动器部分可以包含核酸酶(例如DNA核酸酶和/或RNA核酸酶)、与野生型核酸酶相比,核酸酶缺陷型的或具有降低的核酸酶活性的修饰的核酸酶(例如DNA核酸酶和/或RNA核酸酶)、其衍生物、其变体或其片段。致动器部分可以调节基因的表达或活性和/或编辑核酸(例如基因和/或基因产物)的序列。在一些实施方案中,致动器部分包含DNA核酸酶(如经工程化的(例如,可编程或可靶向)的DNA核酸酶)以诱导靶DNA序列的基因组编辑。在一些实施方案中,致动器部分包含RNA核酸酶(如经工程化的(例如,可编程或可靶向)的RNA核酸酶)以诱导靶RNA序列的编辑。在一些实施方案中,致动器部分具有降低的或最小的核酸酶活性。具有降低的或最小的核酸酶活性的致动器部分可以通过靶多核苷酸的物理阻塞或有效抑制或增强靶多核苷酸表达的其它因子的募集来调节基因的表达和/或活性。在一些实施方案中,致动器部分包含来源于DNA核酸酶的无核酸酶的DNA结合蛋白,其可以诱导靶DNA序列的转录激活或抑制。在一些实施方案中,致动器部分包含来源于RNA核酸酶的无核酸酶的RNA结合蛋白,其可以诱导靶RNA序列的转录激活或抑制。在一些实施方案中,致动器部分是核酸引导的致动器部分。在一些实施方案中,致动器部分是DNA引导的致动器部分。在一些实施方案中,致动器部分是RNA引导的致动器部分。致动器部分可以调节基因的表达或活性和/或编辑核酸序列,无论是外源性的还是内源性的。
任何合适的核酸酶可以被用于致动器部分。合适的核酸酶包括但不限于CRISPR-相关(Cas)蛋白或Cas核酸酶,其包括I型CRISPR相关(Cas)多肽、II型CRISPR相关(Cas)多肽、III型CRISPR相关(Cas)多肽、IV型CRISPR相关(Cas)多肽、V型CRISPR相关(Cas)多肽和VI型CRISPR相关(Cas)多肽;锌指核酸酶(ZFN);转录激活因子样效应物核酸酶(TALEN);大范围核酸酶;RNA结合蛋白(RBP);CRISPR相关的RNA结合蛋白;重组酶;翻转酶(flippases);转座酶;Argonaute(Ago)蛋白(例如原核Argonaute(pAgo)、古细菌Argonaute(aAgo)和真核Argonaute(eAgo));它们的任何衍生物;它们的任何变体;及它们的任何片段。
在一些实施方案中,致动器部分包含CRISPR相关(Cas)蛋白或Cas核酸酶,其在非天然存在的CRISPR(成簇规律间隔短回文重复序列)/Cas(CRISPR相关的)系统中起作用。在细菌中,该系统可以提供针对外源DNA的适应性免疫(Barrangou,R.等人,“CRISPRprovides acquired resistance against viruses in prokaryotes,”Science(2007)315:1709-1712;Makarova,K.S.等人,“Evolution and classification of the CRISPR-Cas systems,”Nat Rev Microbiol(2011)9:467-477;Garneau,J.E.等人,“The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA,”Nature(2010)468:67-71;Sapranauskas,R.等人,“The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli,”Nucleic Acids Res(2011)39:9275-9282)。
在包括不同的哺乳动物、动物、植物、微生物和酵母在内的多种生物体中,CRISPR/Cas系统(例如,修饰的和/或未修饰的)可以被用作基因组工程化工具。CRISPR/Cas系统可以包含与Cas蛋白复合的导向核酸(如导向RNA(gRNA)),以用于靶向调节基因表达和/或活性或核酸编辑。RNA导向的Cas蛋白(例如,Cas核酸酶,如Cas9核酸酶)可以以序列依赖性方式特异性结合靶多核苷酸(例如,DNA)。Cas蛋白,如果具有核酸酶活性,可以切割DNA(Gasiunas,G.等人,“Cas9-crRNA ribonucleoprotein complex mediates specific DNAcleavage for adaptive immunity in bacteria,”Proc Natl Acad Sci USA(2012)109:E2579-E2 86;Jinek,M.等人,“A programmable dual-RNA-guided DNA endonuclease inadaptive bacterial immunity,”Science(2012)337:816-821;Sternberg,S.H.等人,“DNAinterrogation by the CRISPR RNA-guided endonuclease Cas9,”Nature(2014)507:62;Deltcheva,E.等人,“CRISPR RNA maturation by trans-encoded small RNA and hostfactor RNase III,”Nature(201 1)471:602-607),并且已被广泛用于在各种生物体和模型系统中进行可编程的基因组编辑(Cong,L.等人,“Multiplex genome engineeringusing CRISPR Cas systems,”Science(2013)339:819-823;Jiang,W.等人,“RNA-guidedediting of bacterial genomes using CRISPR-Cas systems,”Nat.Biotechnol.(2013)31:233-239;Sander,J.D.&Joung,J.K,“CRISPR-Cas systems for editing,regulatingand targeting genomes,”Nature Biotechnol.(2014)32:347-355)。
在一些情况下,Cas蛋白被突变和/或修饰以产生核酸酶缺陷蛋白或相对于野生型Cas蛋白具有降低的核酸酶活性的蛋白质。核酸酶缺陷蛋白可以保留结合DNA的能力,但可能缺乏或具有降低的核酸切割活性。包含Cas核酸酶(例如,保留野生型核酸酶活性,具有降低的核酸酶活性,和/或缺乏核酸酶活性)的致动器部分可以在CRISPR/Cas系统中起作用以调节靶基因或蛋白质的水平和/或活性(例如,降低、增加或消除)。Cas蛋白可以与靶多核苷酸结合并通过物理障碍阻止转录或编辑核酸序列以产生非功能性基因产物。Cas蛋白可以通过在靶多核苷酸中产生双链断裂或单链断裂来编辑核酸序列。DNA中的双链断裂可以导致DNA断裂修复,其允许引入基因修饰(例如,核酸编辑)。DNA断裂修复可以通过非同源性末端连接(NHEJ)或同源性定向修复(HDR)进行。在HDR中,可以提供包含靶DNA的同源臂侧翼位点的供体DNA修复模板或模板多核苷酸。
在一些实施方案中,致动器部分包含与导向核酸(如导向RN)A形成复合物的Cas蛋白。在一些实施方案中,致动器部分包含与单一导向核酸(如单一导向RNA(sgRNA))形成复合物的Cas蛋白。在一些实施方案中,致动器部分包含任选地与导向核酸(如导向RNA(例如sgRNA))复合的RNA-结合蛋白(RBP),所述导向核酸能够与Cas蛋白形成复合物。在一些实施方案中,致动器部分包含来源于DNA核酸酶的无核酸酶的DNA结合蛋白,其可以诱导靶DNA序列的转录激活或抑制。在一些实施方案中,致动器部分包含来源于RNA的无核酸酶的RNA结合蛋白。
可以使用任何合适的CRISPR/Cas系统。CRISPR/Cas系统可以使用各种命名系统来提及。在以下当中提供了示例性的命名系统:Makarova,K.S.等人,“An updatedevolutionary classification of CRISPR-Cas systems,”Nat Rev Microbiol(2015)13:722-736和Shmakov,S.等人,“Discovery and Functional Characterization of DiverseClass 2CRISPR-Cas Systems,”Mol Cell(2015)60:1-13。CRISPR/Cas系统可以是I型、II型、III型、IV型、V型、VI型系统或任何其它合适的CRISPR/Cas系统。如本文所使用的CRISPR/Cas系统可以是1类、2类或任何其它适当分类的CRISPR/Cas系统。1类或2类的确定可以基于编码效应物模块的基因。1类系统通常具有多亚单位crRNA-效应物复合物,而2类系统通常具有单一蛋白(如Cas9、Cpf1、C2c1、C2c2、C2c3或crRNA-效应物复合物)。1类CRISPR/Cas系统可以使用多种Cas蛋白的复合物来实现调节。1类CRISPR/Cas系统可以包括例如I型(例如,I、IA、IB、IC、ID、IE、IF、IU)、III型(例如,III、IIIA、IIIB、IIIC、IIID)和IV型(例如,IV、IVA、IVB)CRISPR/Cas类型。2类CRISPR/Cas系统可以使用单一大Cas蛋白来实现调节。2类CRISPR/Cas系统可以包括例如II型(例如,II、IIA、IIB)和V型CRISPR/Cas类型。CRISPR系统可以彼此互补,和/或可以反式提供功能单元以促进CRISPR基因座靶向。
包含Cas蛋白的致动器部分可以是1类或2类Cas蛋白。Cas蛋白可以是I型、II型、III型、IV型、V型Cas蛋白或VI型Cas蛋白。Cas蛋白可以包含一个或多个结构域。结构域的非限制性实例包括导向核酸识别和/或结合结构域、核酸酶结构域(例如DNase或RNase结构域、RuvC、HNH)、DNA结合结构域、RNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域。导向核酸识别和/或结合结构域可以与导向核酸相互作用。核酸酶结构域可以包含用于核酸切割的催化活性。核酸酶结构域可以缺乏防止核酸切割的催化活性。Cas蛋白可以是与其它蛋白或多肽融合的嵌合Cas蛋白。Cas蛋白可以是各种Cas蛋白的嵌合体,例如包含来自不同Cas蛋白的结构域。
CAS蛋白的非限制性实例包括c2c1、C2c2、c2c3、Casl、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cash、Cas6e、Cas6f、Cas7、Cas8a、Cas8al、Cas8a2、Cas8b、Cas8c、Cas9(Csnl或Csx12)、Cas10、Cas1Od、Cas10、Cas1Od、CasF、CasG、CasH、Cpf1、Csyl、Csy2、Csy3、Csel(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csx1、Csx3、Csxl5、Csfl、Csf2、Csf3、Csf4和Cul966,以及它们的同系物或修改版本。
Cas蛋白可以来自任何合适的生物体。非限制性实例包括化脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinae spiralis)、绿色产色链霉菌(Streptomyces viridochromo genes)、绿色产色链霉菌(Streptomycesviridochromogenes)、玫瑰链孢囊菌(Streptosporangium roseum)、玫瑰链孢囊菌、酸热脂环酸杆菌(AlicyclobacHlus acidocaldarius)、假真菌样芽孢杆菌(Bacilluspseudomycoides)、还原硒酸盐芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤蓝细菌(Microscilla marina)、伯克霍尔德氏菌目细菌(Burkholderiales bacterium)、萘降解极地单胞菌(Polaromonasnaphthalenivorans)、极地单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaerawatsonii)、蓝丝菌(Cyanothece sp.)、铜绿微囊蓝细菌(Microcystis aeruginosa)、铜绿假单胞菌(Pseudomonas aeruginosa)、聚球蓝细菌(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、Ammonifex degensii、Caldicelulosiruptor becscii、Candidatus Desulforudis、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridiumdifficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobiusthermophilus)、喜温发酵菌(Pelotomaculum thermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、氧化亚铁嗜酸硫杆菌(Acidithiobacillusferrooxidans)、Allochromatium vinosum、海杆菌(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、Nitrosococcus watsoni、Pseudoalteromonashaloplanktis、消旋纤线杆菌(Ktedonobacter racemifer)、Methanohalobiumevestigatum、多变鱼腥蓝细菌(Anabaena variabilis)、产泡沫节球蓝细菌(Nodulariaspumigena)、念珠蓝细菌(Nostoc sp.)、最大节螺蓝细菌(Arthrospira maxima)、盘状节螺蓝细菌(Arthrospira platensis)、节螺蓝细菌(Arthrospira sp.)、鞘丝蓝细菌(Lyngbyasp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤蓝细菌(Oscillatoria sp.)、Petrotoga mobilis、非洲栖热腔菌(Thermosipho africanus)、深海单细胞蓝藻(Acaryochloris marina)、Leptotrichia shahii和新凶手弗朗西丝氏菌(Francisellanovicida)。在一些方面,生物体是化脓链球菌(S.pyogenes)。在一些方面,生物体是金黄色葡萄球菌(S.aureus)。在一些方面,生物体是嗜热链球菌(S.thermophilus)。
Cas蛋白可以衍生自多种细菌物种,包括但不限于非典型韦荣氏球菌(Veillonella atypical)、具核梭杆菌(Fusobacterium nucleatum)、龈沟产线菌(Filifactor alocis)、Solobacterium moorei、尖锐粪球菌(Coprococcus catus)、齿垢密螺旋体(Treponema denticola)、Peptoniphilus duerdenii、Catenibacteriummitsuokai、变异链球菌(Streptococcus mutans)、无害利斯特氏菌(Listeria innocua)、伪中间葡萄球菌(Staphylococcus pseudintermedius)、肠氨基酸球菌(Acidaminococcusintestine)、Olsenella uli、北原酒球菌(Oenococcus kitaharae)、双歧双歧杆菌(Bifidobacterium bifidum)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、加氏乳杆菌(Lactobacillus gasseri)、大芬戈尔德菌(Finegoldia magna)、运动支原体(Mycoplasmamobile)、鸡败血支原体(Mycoplasma gallisepticum)、羊肺炎支原体(Mycoplasmaovipneumoniae)、犬支原体(Mycoplasma canis)、关节液支原体(Mycoplasma synoviae)、直肠假杆菌(Eubacterium rectale)、嗜热链球菌、长真杆菌(Eubacterium dolichum)、棒状乳杆菌极取亚种(Lactobacillus coryniformis subsp.Torquens)、多养型泥杆菌(Ilyobacter polytropus)、白色瘤胃球菌(Ruminococcus albus)、阿克曼氏菌(Akkermansia muciniphila)、解纤维热酸菌(Acidothermus cellulolyticus)、长双歧杆菌(Bifidobacterium longum)、齿双歧杆菌(Bifidobacterium dentium)、白喉棒杆菌(Corynebacterium diphtheria)、Elusimicrobium minutum、Nitratifractorsalsuginis、Sphaerochaeta globus、产琥珀酸丝状杆菌产琥珀酸亚种(Fibrobacter succinogenessubsp.Succinogenes)、脆弱拟杆菌(Bacteroides fragilis)、黄褐二氧化碳嗜纤维菌(Capnocytophaga ochracea)、血色红假单胞菌(Rhodopseudomonas palustris)、彩虹普雷沃菌(Prevotella micans)、栖瘤胃普雷沃氏菌(Prevotella ruminicola)、柱状黄杆菌(Flavobacterium columnare)、少食氨基单胞菌(Aminomonas paucivorans)、深红红螺菌(Rhodospirillum rubrum)、Candidatus Puniceispirillum marinum、Verminephrobactereiseniae、Ralstonia syzygii、Dinoroseobacter shibae、固氮螺菌属(Azospirillum)、汉堡硝化杆菌(Nitrobacter hamburgensis)、慢生根瘤菌属(Bradyrhizobium)、产琥珀酸沃林氏菌(Wolinella succinogenes)、空肠弯曲杆菌空肠亚种(Campylobacter jejunisubsp.Jejuni)、鼬鼠螺杆菌(Helicobacter mustelae)、蜡状芽孢杆菌(Bacilluscereus)、Acidovorax ebreus、产气荚膜梭菌(Clostridium perfringens)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、Roseburia intestinalis、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、多杀巴斯德氏菌属多杀亚种(Pasteurella multocidasubsp.Multocida)、华德萨特菌(Sutterella wadsworthensis)、变形菌(proteobacterium)、侵肺军团菌(Legionella pneumophila)、Parasutterellaexcrementihominis、产琥珀酸沃林氏菌和新凶手弗朗西丝氏菌。
如本文所用的Cas蛋白可以是Cas蛋白的野生型或修饰形式。Cas蛋白可以是野生型或修饰的Cas蛋白的活性变体、无活性变体或片段。相对于野生型形式的Cas蛋白,Cas蛋白可以包含氨基酸改变,诸如缺失、插入、取代、变体、突变、融合、嵌合体或以上的任何组合。Cas蛋白可以是与野生型示例性Cas蛋白具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性或序列相似性的多肽。Cas蛋白可以是与野生型示例性Cas蛋白具有最多约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的多肽。变体或片段可以包含与野生型或修饰的Cas蛋白或其部分至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性或序列相似性。变体或片段可以被靶向至与导向核酸复合的核酸基因座,同时缺乏核酸切割活性。
Cas蛋白可以包含一个或多个核酸酶结构域(如DNase结构域)。例如,Cas9蛋白可以包含RuvC样核酸酶结构域和/或HNH样20核酸酶结构域。RuvC和HNH结构域可以各自切割双链DNA的不同链以在DNA中产生双链断裂。Cas蛋白可以仅包含一个核酸酶结构域(例如,Cpf1包含RuvC结构域但缺乏HNH结构域)。
Cas蛋白可以包含与野生型Cas蛋白的核酸酶结构域(例如,RuvC结构域、HNH结构域)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性或序列相似性的氨基酸序列。
可以修饰Cas蛋白以优化基因表达的调节。Cas蛋白可以被修饰以增加或降低核酸结合亲和力、核酸结合特异性和/或酶促活性。Cas蛋白还可以被修饰以改变蛋白的任何其它活性或性质(如稳定性)。例如,Cas蛋白的一个或多个核酸酶结构域可以被修饰、缺失或失活,或者Cas蛋白可以被截短以去除对于蛋白质的功能不是必需的结构域或优化(例如,增强或降低)Cas蛋白的调节基因表达的活性。
Cas蛋白可以是融合蛋白。例如,Cas蛋白可以与切割结构域、表观遗传修饰结构域、转录激活结构域或转录阻抑结构域融合。Cas蛋白也可以与提供增加的或降低的稳定性的异源多肽融合。融合的结构域或异源多肽可以位于Cas蛋白的N-末端、C-末端或内部。
Cas蛋白可以任何形式提供。例如,Cas蛋白可以以蛋白质的形式提供,诸如仅Cas蛋白或与导向核酸复合的Cas蛋白。Cas蛋白可以以编码Cas蛋白的核酸的形式提供,诸如RN(例如信使RNA(mRNA))或DNA。可以对编码Cas蛋白的核酸进行密码子优化,以便在特定的细胞或生物体中有效地翻译成蛋白质。
编码Cas蛋白的核酸可以被稳定地整合到细胞的基因组中。编码Cas蛋白的核酸可以与细胞中有活性的启动子可操作地连接。编码Cas蛋白的核酸可以与表达构建体中的启动子可操作地连接。表达构建体可以包括能够指导基因或其它感兴趣的核酸序列(例如Cas基因)的表达并且可以将此类感兴趣的核酸序列转移到靶细胞的任何核酸构建体。
在一些实施方案中,Cas蛋白是死亡的Cas蛋白。死亡的Cas蛋白可以是缺乏核酸切割活性的蛋白质。
Cas蛋白可以包含野生型Cas蛋白的修饰形式。野生型Cas蛋白的修饰形式可以包含降低Cas蛋白的核酸切割活性的氨基酸改变(例如,缺失、插入或取代)。例如,Cas蛋白的修饰形式可以具有不多于90%、不多于80%、不多于70%、不多于60%、不多于50%、不多于40%、不多于30%、不多于20%、不多于10%、不多于5%或不多于1%的野生型Cas蛋白(例如,来自化脓链球菌的Cas9)的核酸切割活性。Cas蛋白的修饰形式可以不具有实质性的核酸切割活性。当Cas蛋白是没有实质性核酸切割活性的修饰形式时,它可以被称为无酶促活性的和/或“死亡的”(缩写为“d”)。死亡的Cas蛋白(例如,dCAS、dCas9)可以结合靶多核苷酸,但不可以切割靶多核苷酸。在一些方面,死亡的Cas蛋白是死亡的Cas9蛋白。
dCas9多肽可以与单一导向RNA(sgRNA)结合以激活或抑制靶DNA的转录。可以将sgRNA引入表达工程化嵌合受体多肽的细胞中。在一些情况下,此类细胞含有一种或多种靶向相同核酸的不同sgRNA。在其它情况下,sgRNA靶向细胞中的不同核酸。由导向RNA靶向的核酸可以是在细胞(如免疫细胞)中表达的任何核酸。靶向的核酸可以是参与免疫细胞调节的基因。在一些实施方案中,核酸与癌症相关。与癌症相关的核酸可以是细胞周期基因、细胞应答基因、细胞凋亡基因或吞噬基因。重组导向RNA可以被CRISPR蛋白、无核酸酶的CRISPR蛋白、它们的变体或它们的衍生物识别。
无酶促活性的可以指能以序列特异性方式与多核苷酸中的核酸序列结合,但不能切割靶多核苷酸的多肽。无酶促活性的定点多肽可以包含无酶促活性的结构域(例如核酸酶结构域)。无酶促活性的可以指无活性。无酶促活性的可以指基本上没有活性。无酶促活性的可以指基本上没有活性。无酶促活性的可以指与野生型示例性活性(例如核酸切割活性、野生型Cas9活性)相比不多于1%、不多于2%、不多于3%、不多于4%、不多于5%、不多于6%、不多于7%、不多于8%、不多于9%或不多于10%的活性的活性。
Cas蛋白的一个或多个核酸酶结构域(例如RuvC、HNH)可以被缺失或突变,使得它们不再有功能或包含降低的核酸酶活性。例如,在包含至少两个核酸酶结构域的Cas蛋白(例如,Cas9)中,如果核酸酶结构域之一被缺失或突变,则所得Cas蛋白(被称为切口酶)可以在双链DNA内的CRISPR RNA(crRNA)识别序列处产生单链断裂,但不产生双链断裂。这种切口酶可以切割互补链或非互补链,但不能切割两者。如果Cas蛋白的所有核酸酶结构域(例如,Cas9蛋白中的RuvC和HNH核酸酶结构域;Cpf1蛋白中的RuvC核酸酶结构域)被缺失或突变,则所得Cas蛋白可以具有降低的切割双链DNA的两条链的能力或没有切割双链DNA的两条链的能力。可以将Cas9蛋白转化为切口酶的突变的实例是来自化脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的第10位的天冬氨酸变为丙氨酸)突变。来自化脓链球菌的Cas9的HNH结构域中的H939A(在氨基酸位置839处的组氨酸变为丙氨酸)或H840A(在氨基酸位置840处的组氨酸变为丙氨酸)可以将Cas9转化为切口酶。可以将Cas9蛋白转化为死亡的Cas9的突变的实例是来自化脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的第10位的天冬氨酸变为丙氨酸)突变和HNH结构域中的H939A(在氨基酸位置839处的组氨酸变为丙氨酸)或H840A(在氨基酸位置840处的组氨酸变为丙氨酸)。
死亡的Cas蛋白相对于野生型形式的蛋白可以包含一个或多个突变。突变可以导致不多于90%、不多于80%、不多于70%、不多于60%、不多于50%、不多于40%、不多于30%、不多于20%、不多于10%、不多于5%或不多于1%的野生型Cas蛋白的多个核酸切割结构域的一个或多个中的核酸切割活性。突变可以导致多个核酸切割结构域中的一个或多个保留切割靶核酸的互补链的能力,但降低其切割靶核酸的非互补链的能力。突变可以导致多个核酸切割结构域中的一个或多个保留切割靶核酸的非互补链的能力,但降低切割靶核酸的互补链的能力。突变可以导致多个核酸切割结构域中的一个或多个缺乏切割靶核酸的互补链和非互补链的能力。核酸酶结构域中待突变的残基可以对应于核酸酶的一个或多个催化残基。例如,野生型示例性化脓链球菌Cas9多肽中的残基(如Asp10、His840、Asn854和Asn856)可以被突变以使多个核酸切割结构域(例如核酸酶结构域)中的一个或多个失活。例如,如通过序列和/或结构比对确定的,Cas蛋白的核酸酶结构域中待突变的残基可以对应于野生型化脓链球菌Cas9多肽中的残基Asp10、His840、Asn854和Asn856。
作为非限制性实例,残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986和/或A987(或任何Cas蛋白的相应突变)可以被突变。例如,D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A和/或D986A。除了丙氨酸取代以外的突变也是合适的。
D1OA突变可以与H840A、N854A或N856A突变中的一种或多种组合以产生实质上缺乏DNA切割活性的Cas9蛋白(例如,死亡的Cas9蛋白)。H840A突变可以与D1OA、N854A或N856A突变中的一种或多种组合以产生实质上缺乏DNA切割活性的定点多肽。N854A突变可以与H840A、D1OA或N856A突变中的一种或多种组合以产生实质上缺乏DNA切割活性的定点多肽。N856A突变可以与H840A、N854A或D10A突变中的一种或多种组合以产生实质上缺乏DNA切割活性的定点多肽。
在一些实施方案中,Cas蛋白是2类Cas蛋白。在一些实施方案中,Cas蛋白是II型Cas蛋白。在一些实施方案中,Cas蛋白是Cas9蛋白、Cas9蛋白的修饰形式或衍生自Cas9蛋白。例如,Cas9蛋白缺乏切割活性。在一些实施方案中,Cas9蛋白是来自化脓链球菌的Cas9蛋白(例如,SwissProt登记号Q99ZW2)。在一些实施方案中,Cas9蛋白是来自金黄色葡萄球菌的Cas9(例如,SwissProt登记号J7RUA5)。在一些实施方案中,Cas9蛋白是来自化脓链球菌或金黄色葡萄球菌的Cas9蛋白的修饰形式。在一些实施方案中,Cas9蛋白衍生自来自化脓链球菌或金黄色葡萄球菌的Cas9蛋白。例如,化脓链球菌或金黄色葡萄球菌Cas9蛋白缺乏切割活性。
Cas9通常可以指与野生型示例性Cas9多肽(例如来自化脓链球菌的Cas9)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的多肽。Cas9可以指与野生型示例性Cas9多肽(例如来自化脓链球菌)具有最多约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%序列同一性和/或序列相似性的多肽。Cas9可以指野生型或修饰形式的Cas9蛋白,其可以包含氨基酸改变(如缺失、插入、取代、变体、突变、融合、嵌合体或以上的任何组合)。
在一些实施方案中,致动器部分包含“锌指核酸酶”或“ZFN”。ZFN是指切割结构域(如FokI的切割结构域)与能结合多核苷酸(如DNA和RNA)的至少一个锌指基序(例如至少2、3、4或5个锌指基序)之间的融合。两个单独的ZFN以某方向和间隔在多核苷酸的某位置处的异二聚化可以导致多核苷酸的切割。例如,与DNA结合的ZFN可以诱导DNA中的双链断裂。为了允许两个切割结构域二聚化和切割DNA,两个单独的ZFN可以以其C-末端相隔一定距离结合DNA的相反链。在一些情况下,锌指结构域与切割结构域之间的连接子序列可能需要每个结合位点的5’边缘被分开约5-7个碱基对。在一些情况下,切割结构域与每个锌指结构域的C-末端融合。示例性ZFN包括但不限于以下描述的那些:Urnov等人,Nature ReviewsGenetics,2010,11:636-646;Gaj等人,Nat Methods,2012,9(8):805-7;美国专利第6,534,261号;第6,607,882号;第6,746,838号;第6,794,136号;第6,824,978号;第6,866,997号;第6,933,113号;第6,979,539号;第7,013,219号;第7,030,215号;第7,220,719号;第7,241,573号;第7,241,574号;第7,585,849号;第7,595,376号;第6,903,185号;第6,479,626号;以及美国公开第2003/0232410号和第2009/0203140号。
在一些实施方案中,包含ZFN的致动器部分可以在靶多核苷酸(如DNA)中产生双链断裂。DNA中的双链断裂可以导致DNA断裂修复,其允许引入基因修饰(例如,核酸编辑)。DNA断裂修复可以通过非同源性末端连接(NHEJ)或同源性定向修复(HDR)发生。在HDR中,可以提供含有靶DNA的同源臂侧翼位点的供体DNA修复模板或模板多核苷酸。在一些实施方案中,ZFN是锌指切口酶,其诱导位点特异性单链DNA断裂或缺口,从而导致HDR。锌指切口酶的描述见于例如Ramirez等人,Nucl Acids Res,2012,40(12):5560-8;Kim等人,Genome Res,2012,22(7):1327-33。在一些实施方案中,ZFN结合多核苷酸(例如DNA和/或RNA),但不能切割多核苷酸。
在一些实施方案中,包含ZFN的致动器部分的切割结构域包含野生型切割结构域的修饰形式。切割结构域的修饰形式可以包含降低切割结构域的核酸切割活性的氨基酸改变(例如,缺失、插入或取代)。例如,切割结构域的修饰形式可以具有不多于90%、不多于80%、不多于70%、不多于60%、不多于50%、不多于40%、不多于30%、不多于20%、不多于10%、不多于5%或不多于1%的野生型切割结构域的核酸切割活性。切割结构域的修饰形式可以不具有实质性的核酸切割活性。在一些实施方案中,切割结构域是无酶促活性的。
在一些实施方案中,致动器部分包含“TALEN”或“TAL效应物核酸酶”。TALEN是指工程化的转录激活因子样效应物核酸酶,其通常含有DNA结合串联重复序列的中心结构域和切割结构域。可以通过将TAL效应物DNA结合结构域与DNA切割结构域融合来产生TALEN。在一些情况下,DNA结合串联重复序列包含33-35个氨基酸的长度,并且在位置12和13处含有两个可以识别至少一个特定DNA碱基对的高变氨基酸残基。转录激活因子样效应物(TALE)蛋白可以与核酸酶(如野生型或突变的Fok1内切核酸酶或Fok1的催化结构域)融合。已经对Fok1进行了几种突变,以用于TALEN,其例如提高切割特异性或活性。可以对此类TALEN进行工程化以结合任何所期望的DNA序列。通过在靶DNA序列中产生双链断裂,其依次经历NHEJ或HDR,可以使用TALEN来产生基因修饰(例如,核酸序列编辑)。DNA中的双链断裂可以导致DNA断裂修复,其允许引入基因修饰(例如,核酸编辑)。DNA断裂修复可以通过非同源性末端连接(NHEJ)或同源性定向修复(HDR)发生。在HDR中,可以提供含有靶DNA的同源臂侧翼位点的供体DNA修复模板或模板多核苷酸。在一些情况下,提供单链供体DNA修复模板以促进HDR。TALEN及其基因编辑用途的详细描述参见,例如,美国专利第8,440,431号;第8,440,432号;第8,450,471号;第8,586,363号和第8,697,853号;Scharenberg等人,Curr GeneTher,2013,13(4):291-303;Gaj等人,Nat Methods,2012,9(8):805-7;Beurdeley等人,NatCommun,2013,4:1762;以及Joung和Sander,Nat Rev Mol Cell Biol,2013,14(1):49-55。
在一些实施方案中,为降低核酸酶活性而工程化TALEN。在一些实施方案中,TALEN的核酸酶结构域包含野生型核酸酶结构域的修饰形式。核酸酶结构域的修饰形式可以包含降低核酸酶结构域的核酸切割活性的氨基酸改变(例如,缺失、插入或取代)。例如,核酸酶结构域的修饰形式可以具有不多于90%、不多于80%、不多于70%、不多于60%、不多于50%、不多于40%、不多于30%、不多于20%、不多于10%、不多于5%或不多于1%的野生型核酸酶结构域的核酸切割活性。核酸酶结构域的修饰形式可以不具有实质性的核酸切割活性。在一些实施方案中,核酸酶结构域是无酶促活性的。
在一些实施方案中,转录激活因子样效应物(TALE)蛋白与可以调节转录且不包含核酸酶的结构域融合。在一些实施方案中,转录激活因子样效应物(TALE)蛋白被设计成起转录激活物的作用。在一些实施方案中,转录激活因子样效应物(TALE)蛋白被设计成起转录阻抑物的作用。例如,转录激活物样效应物(TALE)蛋白的DNA结合结构域可以与一个或多个转录激活结构域,或与一个或多个转录阻抑结构域融合(例如,连接)。转录激活结构域的非限制性实例包括单纯疱疹VP16激活结构域和VP16激活结构域的四聚体重复(例如VP64激活结构域)。转录阻抑结构域的非限制性实例包括Kruppel相关的盒结构域。
在一些实施方案中,致动器部分包含大范围核酸酶。大范围核酸酶通常是指可以是高度特异性的稀有切割内切核酸酶或归巢内切核酸酶。大范围核酸酶可以识别长度范围为至少12个碱基对(例如长度为12到40个碱基对、12到50个碱基对或12到60个碱基对)的DNA靶位点。大范围核酸酶可以是模块化DNA结合核酸酶,诸如包含内切核酸酶的至少一个催化结构域和至少一个DNA结合结构域的任何融合蛋白,或指定核酸靶序列的蛋白质。DNA结合结构域可以含有至少一个识别单链或双链DNA的基序。大范围核酸酶可以产生双链断裂。DNA中的双链断裂可以导致DNA断裂修复,其允许引入基因修饰(例如,核酸编辑)。DNA断裂修复可以通过非同源性末端连接(NHEJ)或同源性定向修复(HDR)发生。在HDR中,可以提供含有靶DNA的同源臂侧翼位点的供体DNA修复模板或模板多核苷酸。大范围核酸酶可以是单体的或二聚体的。在一些实施方案中,大范围核酸酶是天然存在的(在自然界中发现的)或野生型的,并且在其它情况下,大范围核酸酶是非天然的、人工的、工程化的、合成的、合理设计的或人造的。在一些实施方案中,本公开的大范围核酸酶包括I-CreI大范围核酸酶、I-CeuI大范围核酸酶、I-Mso1大范围核酸酶、I-SceI大范围核酸酶、它们的变体、它们的衍生物及它们的片段。有用的大范围核酸酶及其在基因编辑中的应用的详细描述参见例如Silva等人,Curr Gene Ther,2011,11(1):11-27;Zaslavoskiy等人,BMC Bioinformatics,2014,15:191;Takeuchi等人,Proc Natl Acad Sci USA,2014,111(11):4061-4066以及美国专利缔7,842,489号;第7,897,372号;第8,021,867号;第8,163,514号;第8,133,697号;第8,021,867号;第8,119,361号;第8,119,381号;第8,124,36号和第8,129,134号。
在一些实施方案中,大范围核酸酶的核酸酶结构域包含野生型核酸酶结构域的修饰形式。核酸酶结构域的修饰形式可以包含降低核酸酶结构域的核酸切割活性的氨基酸改变(例如,缺失、插入或取代)。例如,核酸酶结构域的修饰形式可以具有不多于90%、不多于80%、不多于70%、不多于60%、不多于50%、不多于40%、不多于30%、不多于20%、不多于10%、不多于5%或不多于1%的野生型核酸酶结构域的核酸切割活性。核酸酶结构域的修饰形式可以不具有实质性的核酸切割活性。在一些实施方案中,核酸酶结构域是无酶促活性的。在一些实施方案中,大范围核酸酶可以结合DNA但不能切割DNA。
在一些实施方案中,致动器部分与一个或多个转录阻抑结构域、激活结构域、表观遗传结构域、重组酶结构域、转座酶结构域、翻转酶结构域、切口酶结构域或以上的任何组合融合。激活结构域可以包括位于酶的羧基末端的一个或多个串联激活结构域。在其它情况下,致动器部分包括位于蛋白质羧基末端的一个或多个串联阻抑结构域。非限制性的示例性激活结构域包括GAL4、单纯疱疹病毒激活结构域VP16、VP64(单纯疱疹病毒激活结构域VP16的四聚体)、NF-κB p65亚基、Epstein-Barr病毒R反式激活因子(Rta),并且描述于Chavez等人,Nat Methods,2015,12(4):326-328和美国专利申请公开第20140068797号。非限制性的示例性阻抑结构域包括Kox1的KRAB(Kruppel相关盒)结构域,Mad mSIN3相互作用结构域(SID)、ERF阻抑结构域(ERD),并且描述于Chavez等人,Nat Methods,2015,12(4):326-328和美国专利申请公开第20140068797号。致动器部分也可以与提供增加或降低的稳定性的异源多肽融合。融合的结构域或异源多肽可以位于致动器部分的N-末端、C-末端或内部。
致动器部分可以包含易于追踪或纯化的异源多肽(如荧光蛋白、纯化标签或表位标签)。荧光蛋白的实例包括绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、EmeraId、Azami Green、单体Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如,YFP、eYFP、Citrine、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如eBFP、eBFP2、Azurite、mKalamal、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如eCFP、Cerulean、CyPet、AmCyanl、Midoriishi-Cyan)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、单体Kusabira-Orange、mTangerine、tdTomato)和任何其它合适的荧光蛋白。标签的实例包括谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素(HA)、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、SI、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。
在一些实施方案中,致动器部分通过连接子与第二二聚化结构域连接。连接子可以是本领域任何已知的连接子。在一些实施方案中,致动器部分与第二二聚化结构域连接为融合蛋白。在一些实施方案中,隔室组成蛋白通过连接子与第一二聚化结构域连接。连接子可以是本领域任何已知的连接子。在一些实施方案中,隔室组成蛋白与第一二聚化结构域连接为融合蛋白。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在内核膜中。适用于靶向内核膜的隔室特异性蛋白包括但不限于Emerin、Lap2β和核纤层蛋白B。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在Cajal小体中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位Cajal小体。用于所提供的系统和方法的Cajal小体的合适隔室特异性蛋白包括但不限于Coilin、SMN、Gemin3、SmD1和SmE。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在核小点中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位核小点。用于所提供系统和方法的核小点的合适隔室特异性蛋白包括但不限于SC35。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在PML小体中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位PML小体。用于所提供系统和方法的PML小体的合适隔室特异性蛋白包括但不限于PML和SP100。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在核孔复合物中。适用于靶向核孔复合物的隔室特异性蛋白包括但不限于Nup50、Nup98、Nup53、Nup153和Nup62。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在核仁中。适用于靶向核仁的隔室特异性蛋白包括但不限于核蛋白质B23。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在P颗粒中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位P颗粒。用于所提供系统和方法的P颗粒的合适隔室特异性蛋白包括但不限于RGG结构域蛋白、PGL-1和PGL-3;死盒蛋白和GLH-1-4。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在GW小体中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位GW小体。用于所提供系统和方法的GW小体的合适隔室特异性蛋白包括但不限于GW182。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在应力颗粒中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位应力颗粒。用于所提供系统和方法的应激颗粒的合适隔室特异性蛋白包括但不限于G3BP(Ras-GAP SH3结合蛋白)、TIA-1(T细胞胞内抗原)、eIF2和eIF4E。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在海绵体中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位海绵体。用于所提供系统和方法的海绵体的合适隔室特异性蛋白包括但不限于EXu、Btz、Tral、Cup、eIF4E、Me31B、Yps、Gus、Dcpl/2、Sqd、BicC、Hrb27C和Bru。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在细胞质朊病毒蛋白诱导的核糖核蛋白(CyPrP-RNP)颗粒中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位CyPrP-RNP。适用于所提供系统和方法的CyPrP-RNP颗粒的隔室特异性蛋白包括但不限于Dcpla、DDX6/Rck/p54/Me31B/Dhhl和Dicer。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在U小体中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位U小体。用于所提供系统和方法的U小体的合适隔室特异性蛋白包括但不限于富含尿苷的小核核糖核蛋白U1、U2、U4/U6和U5;LSml-7;和存活的运动神经元(SMN)蛋白。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在内质网中。适用于靶向内质网的隔室特异性蛋白包括但不限于钙网蛋白、钙联接蛋白、PDI、GRP 78和GRP94。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在线粒体中。适用于靶向线粒体的隔室特异性蛋白包括但不限于HIF1A、PLN、Cox 1、己糖激酶和TOMM40。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在质膜中。适用于靶向质膜的隔室特异性蛋白包括但不限于钠钾ATP酶、CD98、钙粘蛋白和质膜钙ATP酶(PMCA)。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位于高尔基体中。适用于靶向高尔基体的隔室特异性蛋白包括但不限于GM130、MAN2A1、MAN2A2、GLG1、B4GALT1、RCAS1和GRASP65。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在核糖体中。在一些实施方案中,核糖体通过所提供的系统和方法在靶多核苷酸处组装或定位核糖体。用于所提供系统和方法的核糖体的合适隔室特异性蛋白包括但不限于AGO2、MTOR、PTEN、RPL26、FBL和RPS3。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在蛋白酶体中。在一些实施方案中,通过所提供的系统和方法在靶多核苷酸处组装或定位蛋白酶体。用于所提供系统和方法的蛋白酶体的合适隔室特异性蛋白包括但不限于PSMA1、PSMBS、PSMC1、PSMD1和PSMD7。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在内体中。适用于靶向内体的隔室特异性蛋白包括但不限于CFTR、ADRB1、EGFR、IGF2R、AP2S1、CD4、HLA-A、Coveolin、RABS和ErbB2。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在脂质体中。适用于靶向脂质体的隔室特异性蛋白包括但不限于EEA1、LAMTOR2和LAMTOR4。
在一些实施方案中,靶多核苷酸通过所提供的系统和方法定位在合成的细胞相中。在一些实施方案中,通过所提供的系统和方法由靶多核苷酸定位合成的细胞相。合成的细胞相可以促进HDR。用于促进HDR的合适隔室组成蛋白包括但不限于Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、外切核酸酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。合成的细胞相可以促进异染色质。用于促进异染色质的合适的隔室组成蛋白包括但不限于HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。
可以用本文所公开的系统和方法靶向的其他细胞隔室包括RNP体、有丝分裂纺锤体、组蛋白基因座体、异染色质区域和细胞骨架。还考虑了另外的隔室。
靶多核苷酸对于它所在的细胞隔室可以是内源性的或外源性的。靶多核苷酸对于细胞可以是内源性的或外源性的。靶多核苷酸可以是人的或非人的。靶多核苷酸可以是病毒来源的、质粒、核糖核蛋白或合成的RNA或DNA链。
本文所公开的方法和系统适用于多重过程,其中将多个多核苷酸重新定位到相同或不同的细胞隔室。
在一些实施方案中,所提供的系统和方法被用于介导靶向多核苷酸(例如,基因组)基因座处的从头细胞隔室(例如,核小体)形成,其提供通过液-液相分离的启动无膜细胞器形成的潜在方法。无膜细胞器或隔室组装可以被用于围绕多核苷酸创建特定环境,诸如促进多核苷酸修复的环境。例如,围绕使用基因编辑技术切割的靶多核苷酸组装隔室,并且该隔室包含模板多核苷酸和Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、外切核酸酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。例如,围绕靶多核苷酸组装隔室以调节基因表达,并且该隔室包含HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。亚细胞空间的无膜隔室化通过液-液相分离发生。异型协同弱相互作用使液体隔室内的快速重排成为可能。由于其结构可塑性和类朊病毒的性质,内在无序蛋白质在相变中起着重要作用。细胞动态地控制相变的程度和持续时间。DNA、RNA或聚(ADP-核糖)(PAR)等分子种子可以以刺激和环境特异性的方式触发相变。分子伴侣、分解酶机制和翻译后修饰协同控制相变。存在连续的聚集倾向,并且细胞在蛋白质组装中采用了意想不到的广泛材料状态。这些可以进展为与神经退行性疾病相关的病理性聚集体。
可以使用本文所公开的系统和方法形成的合成相的实例包括但不限于可以在病毒防御和端粒维持中起作用的合成PML小体,可以是应激诱导的抗凋亡结构的合成核小点和旁斑(paraspeckle),可以是参与神经退行性变的因子的中枢的合成宝石,可以播种核小体的合成结构RNA,合成的核仁,合成的异染色质或常染色质,合成的组蛋白基因座体(其可以是FLASH积累的位点并增强组蛋白mRNA加工),合成的染色质包装系统(其可以涉及使用Xist以使整个染色体顺式沉默),合成的表观遗传相,合成的(细胞质)P小体,合成的应激体,合成的胚粒(其可以在发育的胚胎中减数分裂时产生有性细胞),神经退行性疾病中的合成mRNP颗粒,可以调节无膜细胞器结构和动力学的合成翻译后修饰(PTM),形成聚集体的合成IDP(固有无序蛋白质),合成的朊病毒样结构域(PLD)或富含RGG的低复杂度结构域(LCD)以及合成的多核苷酸修复体。例如,合成的多核苷酸修复体可以是合成的HDR体,其包含促进HDR的模板多核苷酸和蛋白质,诸如Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、外切核酸酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。例如,合成的基因调控体可以是包含促进基因调节的蛋白质的合成异染色质体,诸如HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。可以定位多核苷酸的其它非内源性蛋白质/RNA聚集体包括β-淀粉样蛋白体、mRNA聚集体、Xist包装复合物等。
如本文所述的多核苷酸的受控定位可以被用于调节、修饰或影响,例如,DNA与RNA聚合酶、转录因子、先驱因子、介体、DNA环形成分子和其它DNA相关蛋白的相互作用;表观遗传修饰标志物或常染色质/异染色质调节酶(例如HP1);染色质致密度和其它生物物理学/生化性质;基因编辑,包括重组、NHEJ或HDR;基因组稳定性和癌症;DNA修复过程;通过剪接、降解、翻译、甲基化、定位、和与其他伴侣蛋白和RNA结合蛋白相互作用,实现mRNA的代谢。
本文所公开的方法、组合物和系统可以被用于建立诱导型和可逆型疾病模型以理解疾病机制。例如,所提供的系统和方法可以被用于研究由蛋白质/RNA错误折叠或聚集引起的疾病。蛋白质组失衡与老化有关,并且经常涉及超过溶解度并倾向于形成细胞内和细胞外聚集体的丰富蛋白质。老化是几种蛋白质错误折叠病症(PMD),特别是进行性神经退行性变发作的危险因素。蛋白质聚集是神经退行性变的主要标志,其包括阿尔茨海默病(AD)中的淀粉样蛋白β(Ab)和tau聚集、帕金森病(PD)和多系统萎缩中的细胞内α-突触核蛋白聚集、亨廷顿病(HD)中的多Q驱动蛋白聚集、朊病毒病中的PrPSc以及肌萎缩性侧索硬化(ALS)和额颞痴呆(FTD)中的TDP-43和FET蛋白聚集,只是列出了几个实例。尽管参与斑块形成的蛋白质的化学性质和(病理)生理拓扑结构不同,但控制它们聚集的原理令人惊奇地相似,并且所提供的方法和系统可以被用于将靶多核苷酸定位在这些斑块或聚集体处。
本文所公开的系统、组合物和方法可以被用于通过将关键驱动基因重新定位到不同的核隔室中来控制细胞分化。所述系统和方法可以被用于通过控制内源性VD(J)基因座的重组速率来增强抗体产生。所述系统和方法可以被用于通过消除错误折叠蛋白体的形成来减轻阿尔茨海默病。
本文所公开的系统、组合物和方法可以被在靶多核苷酸或基因座处共定位或组装隔室。通过重新定位或形成隔室,靶多核苷酸或基因座的位置被维持在细胞内,因此允许隔室影响靶多核苷酸或基因座,而不会更广泛地影响染色质的位置和与染色质的定位相关的功能。通过组装包含促进围绕靶多核苷酸的多核苷酸修复机制的蛋白质的隔室,系统和方法可以被用于增强或促进多核苷酸修复机制(如HDR、重组或NHEJ)。
本文所公开的系统、组合物和方法广泛适用于所有生命界,其包括植物、细菌、古细菌、酵母、鱼类、昆虫、鸟类、哺乳动物、小鼠、猪和人类。该系统和方法可以被用于活的完整生物体或组织或细胞中。
本文所公开的系统、组合物和方法可以被用于形成围绕靶多核苷酸隔室,所述隔室可以被用于调节表达(例如,增加或降低),引入表观遗传修饰,产生三维结构、拓扑相关结构域,或包含靶多核苷酸或另外的多核苷酸(例如,来自靶多核苷酸的远端或近端基因)的基因组边界。
编号的实施方案
以下实施方案列举了本文所公开的特征的组合的非限制性排列。还考虑了特征组合的其他排列。具体地,这些编号的实施方案中的每一个都被考虑为依赖于或涉及每个先前或随后编号的实施方案,而与它们所列出的顺序无关。1.用于控制靶多核苷酸在细胞隔室中的空间和时间定位的系统,所述系统包含:(a)与第一二聚化结构域连接的隔室特异性蛋白;(b)靶向靶多核苷酸的致动器部分,其中所述致动器部分与能够与所述第一二聚化结构域组装成二聚体的第二二聚化结构域连接。2.如实施方案1所述的系统,其中所述靶多核苷酸包括基因组DNA。3.如实施方案1所述的系统,其中所述靶多核苷酸包括RNA。4.如实施方案1-3中任一项所述的系统,其中所述致动器部分包含Cas蛋白,并且其中所述系统还包含:(c)与所述致动器部分复合并与所述靶多核苷酸杂交的导向RNA。5.如实施方案1-3中任一项所述的系统,其中所述致动器部分包含与与所述靶多核苷酸杂交的导向RNA复合的RNA结合蛋白,并且其中所述系统还包含:(c)与导向RNA复合的Cas蛋白。6.如实施方案4或5所述的系统,其中所述Cas蛋白实质上缺乏DNA切割活性。7.如实施方案4-6中任一项所述的系统,其中所述Cas蛋白是Cas9蛋白、Cas12蛋白、Cas13蛋白、CasX蛋白或CasY蛋白。8.如实施方案7所述的系统,其中所述Cas12蛋白选自:Cas12a、Cas12b、Cas12c、Cas12d和Cas12e。9.如实施方案1-3中任一项所述的系统,其中所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白,其中所述结合蛋白是锌指核酸酶或TALE核酸酶。10.如实施方案1-3中任一项所述的系统,其中所述致动器部分包含与导向多核苷酸复合的Argonaute蛋白,其中所述导向多核苷酸是导向RNA或导向DNA,并且其中所述导向多核苷酸与所述靶多核苷酸杂交。11.如实施方案1-10中任一项所述的系统,其中所述隔室是核隔室。12.如实施方案11所述的系统,其中所述核隔室包括内核膜。13.如实施方案12所述的系统,其中所述隔室特异性蛋白包括Emerin、Lap2beta、核纤层蛋白B或它们的组合。14.如实施方案11所述的系统,其中所述核隔室包括Cajal小体。15.如实施方案14所述的系统,其中所述隔室特异性蛋白包括coilin、SMN、Gemin 3、SmD1、SmE或它们的组合。16.如实施方案11所述的系统,其中所述核隔室包括核小点。17.如实施方案16所述的系统,其中所述隔室特异性蛋白包括SC35。18.如实施方案11所述的系统,其中所述核隔室包括PML小体。19.如实施方案18所述的系统,其中所述隔室特异性蛋白包括PML、SP100或它们的组合。20.如实施方案11所述的系统,其中所述核隔室包括核核心复合物。21.如实施方案20所述的系统,其中所述隔室特异性蛋白包括Nup50、Nup98、Nup53、Nup153、Nup62或它们的组合。22.如实施方案11所述的系统,其中所述核隔室包括核仁。23.如实施方案22所述的系统,其中所述隔室特异性蛋白包括核仁蛋白质B23。24.如实施方案1-10中任一项所述的系统,其中所述隔室是细胞溶质隔室。25.如实施方案1-24中任一项所述的系统,其中所述隔室特异性蛋白还与荧光蛋白连接。26.如实施方案1-25中任一项所述的系统,其中所述致动器部分还与荧光蛋白连接。27.如实施方案1-27中任一项所述的系统,其中仅在配体存在的情况下,所述第一二聚化结构域和所述第二二聚化结构域组装形成二聚体。28.如实施方案27所述的系统,其中所述第一二聚化结构域和所述第二二聚化结构域各自在配体存在下与配体结合。29.如实施方案27或28所述的系统,其中所述配体是化学诱导剂。30.控制靶多核苷酸在细胞的隔室中的空间和时间定位的方法,所述方法包括:(a)提供与第一二聚化结构域连接的隔室特异性蛋白;(b)提供与第二二聚化结构域连接的致动器部分;(c)形成包含致动器部分和靶多核苷酸的复合物;和(d)组装包含所述第一二聚化结构域和所述第二二聚化结构域的二聚体,从而将靶多核苷酸定位在隔室中。31.如实施方案30所述的方法,其中所述靶多核苷酸对于所述隔室而言不是内源性的。32.如实施方案30或31所述的方法,其中所述靶多核苷酸的定位包括调节所述靶多核苷酸的表达。33.如实施方案32所述的方法,其中所述调节包括降低所述靶多核苷酸的表达。34.如实施方案32所述的方法,其中所述调节包括增加所述靶多核苷酸的表达。35.如实施方案30-34中任一项所述的方法,其中所述靶多核苷酸的定位还包括调节相对于所述隔室为内源形的一种或多种另外的多核苷酸的表达。36.如实施方案30-35中任一项所述的方法,其中所述靶多核苷酸的定位还包括在所述细胞内创建一个或多个另外的隔室。37.如实施方案30-36中任一项所述的方法,其中所述靶多核苷酸的定位还包括修复DNA断裂。38.如实施方案41所述的方法,其中所述修复包括引入外源性DNA。39.如实施方案42所述的方法,其中所述引入包括重组、非同源性末端连接或同源性定向修复。40.如实施方案30-39中任一项所述的方法,其中所述靶多核苷酸的定位还包括创建人工聚集体,其中所述人工聚集体包括蛋白质、RNA、DNA或它们的组合。41.如实施方案30-40中任一项所述的方法,其中所述靶多核苷酸包括基因组DNA。42.如实施方案30-40中任一项所述的方法,其中所述靶多核苷酸包括RNA。43.如实施方案30-42中任一项所述的方法,其中所述致动器部分包含Cas蛋白,并且其中所述系统还包含:(c)与所述致动器部分复合并与所述靶多核苷酸杂交的导向RNA。44.如实施方案30-42中任一项所述的方法,其中所述致动器部分包含与与所述靶多核苷酸杂交的导向RNA复合的RNA结合蛋白,并且其中所述系统还包含:(c)与导向RNA复合的Cas蛋白。45.如实施方案43或44所述的方法,其中所述Cas蛋白实质上缺乏DNA切割活性。46.如实施方案43-45中任一项所述的方法,其中所述Cas蛋白是Cas9蛋白、Cas12蛋白、Cas13蛋白、CasX蛋白或CasY蛋白。47.如实施方案46所述的方法,其中所述Cas12蛋白选自:Cas12a、Cas12b、Cas12c、Cas12d和Cas12e。48.如实施方案30-42中任一项所述的方法,其中所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白,其中所述结合蛋白是锌指核酸酶或TALE核酸酶。49.如实施方案30-42中任一项所述的方法,其中所述致动器部分包含与导向多核苷酸复合的Argonaute蛋白,其中所述导向多核苷酸是导向RNA或导向DNA,并且其中所述导向多核苷酸与所述靶多核苷酸杂交。50.如实施方案30-49中任一项所述的方法,其中所述隔室是核隔室。51.如实施方案50所述的方法,其中所述核隔室包括内核膜。52.如实施方案51所述的方法,其中所述隔室特异性蛋白包括Emerin、Lap2beta、核纤层蛋白B或它们的组合。53.如实施方案50所述的方法,其中所述核隔室包括Cajal小体。54.如实施方案53所述的方法,其中所述隔室特异性蛋白包括coilin、SMN、Gemin 3、SmD1、SmE或它们的。55.如实施方案50所述的方法,其中所述核隔室包括核小点。56.如实施方案55所述的方法,其中所述隔室特异性蛋白包括SC35。57.如实施方案50所述的方法,其中所述核隔室包括PML小体。58.如实施方案57所述的方法,其中所述隔室特异性蛋白包括PML、SP100或它们的组合。59.如实施方案50所述的方法,其中所述核隔室包括核核心复合物。60.如实施方案59所述的方法,其中所述隔室特异性蛋白包括Nup50、Nup98、Nup53、Nup153、Nup62或它们的组合。61.如实施方案50所述的方法,其中所述核隔室包括核仁。62.如实施方案61所述的方法,其中所述隔室特异性蛋白包括核仁蛋白质B23。63.如实施方案30-49中任一项所述的方法,其中所述隔室是细胞溶质隔室。64.如实施方案30-63中任一项所述的方法,其中所述隔室特异性蛋白还与荧光蛋白连接。65.如实施方案30-64中任一项所述的方法,其中所述致动器部分还与荧光蛋白连接。66.如实施方案30-65中任一项所述的方法,其中所述组装仅在配体存在下发生。67.如实施方案66所述的方法,其中所述第一二聚化结构域和所述第二二聚化结构域各自在配体存在下与配体结合。68.如实施方案66或67所述的方法,其中所述配体是化学诱导剂。69.控制细胞的隔室相对于靶多核苷酸的空间和时间定位的方法,所述方法包括:(a)提供与第一二聚化结构域连接的隔室组成蛋白;(b)提供与第二二聚化结构域连接的致动器部分;(c)形成包含所述致动器部分和所述靶多核苷酸的复合物;(d)组装包含所述第一二聚化结构域和所述第二二聚化结构域的二聚体,从而围绕所述靶多核苷酸定位所述隔室。70.如实施方案69所述的方法,其中所述靶多核苷酸对于所述隔室而言不是内源性的。71.如实施方案69或70所述的方法,其中所述隔室的定位包括调节所述靶多核苷酸的表达。72.如实施方案71所述的方法,其中所述调节包括降低所述靶多核苷酸的表达。73.如实施方案71所述的方法,其中所述调节包括增加所述靶多核苷酸的表达。74.如实施方案69-75中任一项所述的方法,其中所述隔室的定位还包括调节相对于所述隔室为内源性的一种或多种另外的多核苷酸的表达。75.如实施方案69-74中任一项所述的方法,其中所述隔室的定位啊包括修复DNA断裂。76.如实施方案75所述的方法,其中所述修复包括引入外源性DNA。77.如实施方案76所述的方法,其中所述引入包括重组、非同源性末端连接或同源性定向修复。78.如实施方案69-77中任一项所述的方法,其中所述靶多核苷酸的定位还包括产生人工聚集体,其中所述人工聚集体包括蛋白质、RNA、DNA或它们的组合。79.如实施方案69-78中任一项所述的方法,其中所述靶多核苷酸包括基因组DNA。80.如实施方案69-78中任一项所述的方法,其中所述靶多核苷酸包括RNA。81.如实施方案69-80中任一项所述的方法,其中所述致动器部分包含Cas蛋白,并且其中所述系统还包含:(c)与所述致动器部分复合并与所述靶多核苷酸杂交的导向RNA。82.如实施方案69-80中任一项所述的方法,其中所述致动器部分包含与与所述靶多核苷酸杂交的导向RNA复合的RNA结合蛋白,并且其中所述系统还包含:(c)与导向RNA复合的Cas蛋白。83.如实施方案81或82所述的方法,其中所述Cas蛋白实质上缺乏DNA切割活性。84.如实施方案81-83中任一项所述的方法,其中所述Cas蛋白是Cas9蛋白、Cas12蛋白、Cas13蛋白、CasX蛋白或CasY蛋白。85.如实施方案所述84的方法,其中所述Cas12蛋白选自:Cas12a、Cas12b、Cas12c、Cas12d和Cas12e。86.如实施方案69-81中任一项所述的方法,其中所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白,其中所述结合蛋白是锌指核酸酶或TALE核酸酶。87.如实施方案69-81中任一项所述的方法,其中所述致动器部分包含与导向多核苷酸复合的Argonaute蛋白,其中所述导向多核苷酸是导向RNA或导向DNA,并且其中所述导向多核苷酸与所述靶多核苷酸杂交。88.如实施方案69-87中任一项所述的方法,其中所述隔室包括Cajal小体。89.如实施方案88所述的方法,其中所述隔室组成蛋白包含coilin、SMN、Gemin 3、SmD1、SmE或它们的组合。90.如实施方案69-87中任一项所述的方法,其中所述隔室包含核小点。91.如实施方案90所述的方法,其中所述隔室组成蛋白包括SC35。92.如实施方案69-87中任一项所述的方法,其中所述隔室包括PML小体。93.如实施方案93所述的方法,其中所述隔室组成蛋白包含PML、SP100或它们的组合。94.如实施方案69-87中任一项所述的方法,其中所述隔室是细胞溶质隔室。95.如实施方案69-87中任一项所述的方法,其中所述隔室是合成的细胞相。96.如实施方案95的方法,其中合成的细胞相促进同源性定向修复。97.如实施方案96所述的方法,其中所述隔室组成蛋白包含Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、外切核酸酶(如Exo1或OsExo1)、ATM、BRCA2、RAD54或MDC1。98.如实施方案69-97中任一项所述的方法,其中所述隔室组成蛋白还与荧光蛋白连接。99.如实施方案69-98中任一项所述的方法,其中所述致动器部分还与荧光蛋白连接。100.如实施方案69-99中任一项所述的方法,其中所述组装仅在配体存在下发生。101.如实施方案100所述的方法,其中所述第一二聚化结构域和所述第二二聚化结构域各自在配体存在下与配体结合。102.如实施方案100或101所述的方法,其中所述配体是化学诱导剂。
实施例
给出以下实施例用于说明本公开的各实施方案的目的,并且不意味着以任何方式限制本公开。本发明的实施例以及本文所述的方法是优选实施方案的代表,是示例性的,并不旨在限制本公开的范围。
实施例1.用于靶标特异性基因组重新定位的化学诱导型CRISPR-GO平台的开发
为了实现诱导型CRISPR介导的染色质重新定位系统,测试了两种化学诱导型异二聚化系统。第一种是脱落酸(ABA)诱导型ABI/PYL1系统,第二种是TMP-Htag(甲氧苄氨嘧啶-卤配体)诱导型DHFR/HaloTag系统。对于这两种系统,将化脓链球菌dCas9(D10A&H840A)蛋白与一种异二聚体融合,并将内核包膜(NE)蛋白Emerin与同源异二聚体融合(图2-4)。由EMD基因编码的Emerin是在核内膜介导染色质组织的一组LEM(LAP2、Emerin、MAN1)结构域蛋白中的。Emerin在细胞质中合成,插入内质网(ER)中,然后通过在连续的ER/NE膜内扩散而易位至NE(Berk等人,2013)。使用稳定表达每种二聚化系统的慢病毒转导建立U2OS人骨骨肉瘤上皮细胞系。在这些细胞系中,由于其与PYL1-GFP-Emerin的二聚化,ABA的加入引起ABI-BFP-dCas9蛋白从核内部到NE和ER的空间重新定位(图5和6)。相比之下,TMP-Htag诱导型系统对dCas9-EGFP-HaloTag和DHFR-mCherry-Emerin与配体的共定位没有明显影响。因此,将ABA诱导型ABI/PYL1异源二聚化系统用于以后的实验。
为了测试ABA诱导的CRISPR-GO系统是否能够改变染色体的位置,靶向染色体3(Chr3)上的内源性基因座。将靶向染色体3(3q29)内高度重复(~500x)区的sgRNA经慢病毒转导到稳定表达ABI-BFP-dCas9和PYL1-GFP-Emerin的U2OS细胞系中(图2和7)。考虑到AB1-BFP-dCas9在ABA处理后主要被募集到PYL-GFP-Emerin定位(NE和ER),加入另一种独立的CRISPR-Cas9成像组分dCas9-HaloTag融合蛋白以可视化靶向的Chr3基因组基因座的位置(图5和6)。在sgChr3的存在下,将JF549-HaloTag染料加入到培养基中以结合dCas9-HaloTag,并使得能够可视化活细胞中的靶向的Chr3:q29基因座。sgChr3通过靶向同一Chr3:q29基因组区域内的多个重复序列而介导CRISPR-Cas9成像(通过dCas9-HaloTag)和CRISPR-GO基因组重新定位(通过AB1-dCas9)。还证实,在不存在sgRNA的情况下,dCas9-HaloTag定位不受AB1-BFP-dCas9与PYL-GFP-Emerin之间的ABA介导的异二聚化的影响(图6)。
在ABA处理2天后,与没有ABA处理的细胞相比,观察到束缚到核周边的靶向的Chr3基因座显著增加(图8和10-12)。在没有ABA处理的情况下,19%的dCas9-HaloTag标记的Chr3基因座被定位于由PYL1-GFP-Emerin标记的核周边,而大部分标记的基因座保留在核内部(分析的142个基因座,图8)。相比之下,87%标记的Chr3基因座在ABA处理的细胞中重新定位到核周边(163个基因座,图8)。ABA处理还将显示至少一个位于核膜的Chr3基因座的细胞的百分比从27%(77个细胞)增加到95%(76个细胞,图8)。用化学处理使重新定位的基因组基因座(p<0.0001)和细胞(p<0.0001)都显著增加表明本文所公开的系统在细胞中重新定位高度重复的多核苷酸(如内源性基因组基因座)是有效的。
实施例2.CRISPR-GO系统对重复基因组基因座的有效重新定位
除了Chr3:q29基因座外,还测试了将其它高度重复的内源性基因组基因座(包括Chr13基因座和端粒)重新定位到核周边。使用靶向染色体13q34(Chr13)上的重复区域(~350x重复序列)的sgRNA(图7),束缚的Chr13基因座的百分比从13%(n=103)增加到69%(n=157,p<0.0001),并且含有至少一个周边定位的基因座的细胞的百分比从34%(n=30)增加到94%(n=53,图8,p<0.0001)。类似地,转导具有端粒靶向sgRNA的含有CRISPR-GO的细胞以测试端粒是否也可用我们的系统重新定位。TRF1-mCherry(一种端粒标志物)也被共表达以可视化端粒。在这种情况下,周边定位的端粒基因座的百分比从26%(n=1255)增加到65%(n=491,图8,p<0.0001)。
位于染色体1p36处的合成整合的LacO阵列也靶向于先前用于研究染色体重新定位的U2OS 2-6-3报告细胞系中(图7)。使用靶向LacO序列的sgRNA,活细胞中的CRISPR-Cas9成像揭示了核周边束缚的靶向基因组基因座的百分比从4%(n=73)增加到60%(n=161,p<0.0001),并且含有至少一个周边定位的基因座的细胞的百分比从4.5%(n=66)增加到65%(n=133)(图8,1G,p<0.0001)。用DAPI在固定的细胞中进行荧光原位杂交(FISH)染色进一步证实在ABA处理后大部分LacO基因座位于核周边(图13)。
接下来测试CRISPR-GO系统在重新定位较少重复(<100个重复序列)的序列中的效率。选择含有~71个sgRNA-可靶向重复序列的Chr7 q36.3上的基因组区域和含有~15个sgRNA-可靶向重复序列的ChrX p21.2上的基因组区域作为靶标(图14)。使用3D-FISH可视化靶向的基因组基因座的位置,并通过DAPI对细胞核进行染色(图15)。在ABA处理3天后,对于Chr7,周边定位基因座的百分比从28%(n=97)增加到68%(n=142,p<0.0001),并且对于ChrX,从33%(n=230)增加到62%(n=123,p<0.0001)。对于Chr7,含有至少一个周边相邻基因座的细胞的百分比从32%(n=68)增加到79%(n=76,p<0.0001),并且对于ChrX,从41%(n=136)增加到76%(n=74,p<0.0001)(图9)。当使用非靶向sgRNA作为对照时,在核周边的Chr7和ChrX的百分比与用非ABA处理的样品观察到的那些相似,并且在ABA处理后保持不变(图16)。总之,这些结果提示本文所提供的化学诱导型系统在将高度重复和较少重复的序列重新定位到细胞隔室(如核周边)方面是有效的。
实施例3.CRISPR-GO系统对非重复基因组基因座的有效重新定位
尽管重复序列大量存在于人类基因组中,但如果CRISPR-GO系统能够重新定位非重复的基因组基因座,则其是进一步关注的。位于ChrX q13.2的非重复基因XIST首先被靶向,并且设计了展开XIST基因组区域的13种sgRNA(图17)。将所有构建体经慢病毒转导到稳定表达CRISPR-GO系统的U2OS细胞中。使用ABA处理,周边定位的XIST基因座的百分比从39%(n=83)增加到79%(n=71,p<0.0001),并且含有周边定位的基因座的细胞的百分比从59%(n=39)增加到90%(n=33)(图18,1H,p=0.0028)。使用靶向Chr10的基因PTEN附近和内部区域的9种sgRNA的库(图17),CRISPR-GO系统将周边定位的PTEN基因座的百分比从39%(n=128)增加到61%(n=308,p<0.0001),并且含有至少一个周边相邻基因座的细胞的百分比从62%(n=60)增加到88%(n=106,p=0.0002)(图15和18)。
还测试了靶向非重复区域的单一sgRNA是否足以重新定位基因组基因座。使用靶向Chr2上CXCR4基因座的单一sgRNA(sgCXCR4-1),周边定位的CXCR4基因座的百分比从20%(n=241)增加到50%(n=425,p<0.0001),并且含有周边定位的基因座的细胞的百分比从52%(n=69)增加到85%(n=131,p<0.0001)(图19)。类似地,另一单一sgRNA 25(sgCXCR4-2)将定位的CXCR4基因座从25%(n=202)增加到47%(n=284),并且将细胞从49%(n=74)增加到82%(n=84,p<0.0001)(图19)。比较了使用单一sgRNA和6中sgRNA的库靶向CXCR4基因座的效率。当使用多种sgRNA时,CRISPR-GO系统分别将定位的CXCR4基因座的百分比从32%(n=270)增加到62%(n=402,p<0.0001)和细胞的百分比从46%(n=170)增加到90%(n=168,p<0.0001)(图15和19)。当使用非靶向sgRNA作为对照时,在核周边的CXCR4基因座的百分比与用非ABA处理的样品所观察到的相似,并且在ABA处理后保持不变(图16)。这些结果一起证实了本文所公开的系统可以介导非重复基因座到细胞隔室(如核周边)的有效重新定位。
实施例4.化学诱导型且可逆型CRISPR-GO介导的基因组重新定位
所提供的系统和方法的一个优点是能够通过向培养基中加入或去除化学诱导剂而容易地打开或关闭多核苷酸重新定位。进行化学诱导和去除实验以研究ABA诱导型CRISPR-GO系统的动态和可逆性(图20)。为了研究化学诱导,用ABA处理含有靶向Chr3基因座的CRISPR-GO系统的U2OS细胞,并在不同的时间点检查。对于化学逆转,首先用ABA处理含有靶向Chr3基因座的CRISPR-GO系统的U2OS细胞2天,然后切换到不含ABA的培养基。ABA诱导的基因组重新定位发生相对较快,因为ABA加入16小时内,束缚到核膜的Chr3基因座的百分比由19%(n=142)增加到75%(n=93,p<0.0001),并且在ABA加入72小时后达到91%(n=160)。ABA去除后,束缚到核膜的Chr3基因座的百分比在24小时后从82%(n=163)降低到45%(n=84,p<0.0001),并且在48小时和72小时后分别进一步降低到27%(n=146)和26%(n=159)。ABA去除48小时和72小时后,在核周边的Chr3的百分比与同时成像的没有ABA处理的对照样品(25%,n=106,p=0.77)没有区别,这表明ABA去除在48小时内完全逆转了由CRISPR-GO系统介导的基因组重新定位效应(图20)。这些结果表明,通过本文所公开的系统和方法介导的核重新定位可以容易地通过例如加入或去除化学诱导剂(如ABA)而打开和关闭。
实施例5.CRISPR-GO系统介导的核周边重新定位的有丝分裂依赖性和有丝分裂非依赖性的机制
CRISPR-GO系统被用于靶向内源性Chr3基因座。通过血清饥饿和羟基脲(HU)处理使含有Chr3靶向的sgRNA的CRISPR-GO细胞同步并停滞在S期,然后用ABA处理用于化学诱导(图21)。有趣的是,在ABA处理24小时后,在HU处理的S期停滞细胞中,核周边束缚的Chr3基因座的百分比从17%(n=175)增加到33%(n=177,p=0008),这显著低于非同步细胞中的百分比(75%,n=251,p=0.0001)。在ABA处理48小时后,HU处理的S期停滞细胞中的核周边束缚的Chr3基因座的百分比增加到54%(n=177,p<0.0001),这也低于非同步细胞中的百分比(83%,n=178,p<0.0001)。因此,在HU处理的S期停滞细胞中,仍观察到核周边重新定位,但与经历有丝分裂的细胞相比,其程度较低。这些结果表明,使用本文所公开的系统和方法将内源性基因座重新定位到细胞隔室(如核周边)可以通过有丝分裂依赖性和有丝分裂非依赖性的机制发生。
有丝分裂非依赖性的周边重新定位据我们所知尚没有被报道。为了探查在间期期间基因组基因座是否可以被束缚到核周边,使用活细胞CRISPR-Cas9成像来追踪核周边束缚的动态。检测了内源性Chr3基因座在间期期间束缚到核周边的动态过程。在图22和23所示的代表性实例中,Chr3:q29基因座(箭头)在记录的最初4小时期间开始与核周边(GFP-Emerin)分离,在4.5小时时被束缚到核周边,然后在记录的剩余8小时内保持束缚,甚至在核经历10小时至12小时的旋转时也是如此。我们随时间对该Chr3基因座与最近的核周边之间的距离进行定量,发现在4.5小时发生束缚后,该距离保持为0(图24)。这些结果表明,尽管在间期期间染色质结构相对稳定地组织,但使用本文所公开的系统和方法,位于核周边附近的基因组基因座能够以有丝分裂非依赖性方式合成地束缚到核周边。
实施例6.通过在核周边处束缚对内源性基因组基因座的移动的抑制
通过将CRISPR-GO系统与活细胞内CRISPR-Cas9成像相结合,研究了基因组束缚后基因组基因座的短时移动动力学。与30未束缚的基因座相比,检查被束缚在核周边的Chr3基因座的短期动态(图25)。在共聚焦显微镜下每4-6s拍摄图像。我们观察到未束缚的Chr3基因座比束缚的Chr3基因座移动更多(图25)。我们在2维空间(dxt=xt-xt-1&dyt=yt-yt-1,其中(xt,yt)是时间t时的基因座的坐标)中表征每个基因座的连续运动步长之间的位移,并将它们的组合分布绘制为移动幅度的量度(图25)。未束缚的Chr3基因座与周边束缚的基因座相比显示出更宽的步长位移分布以及更高的幅度。被束缚的基因组基因座展示出更多的受限移动的观察结果证实了这些基因座被物理束缚至核包膜。我们还量化平均欧几里德步距(√(xt–xt–1)2+(yt–yt–1)2)。我们发现未束缚的Chr3基因座显示出步距为0.11±0.07μm(19个基因座为1696步),周边束缚的Chr3基因座显示出低得多的步距为0.04±0.03μm(14个基因座为1669步)(p<0.0001,图26)。未束缚和束缚的基因座的步距都可以由不同的伽马分布很好地近似(图27)。这些结果表明,由本文所公开的系统和方法介导的细胞隔室束缚可以抑制靶向的多核苷酸的移动性和动态。
实施例7.基因组基因座与无膜核小体(包括Cajal小体和PML小体)的共定位
接下来测试CRISPR-GO系统是否可以介导染色质基因座与无膜核小体的共定位。选择基因组基因座以募集至Cajal 20小体(CB)。为此,通过将PYL1与Cajal小体的标志物Coilin融合来设计Cajal小体靶向的CRISPR-GO系统。通过慢病毒转导将PYL1-GFP-Coilin和ABI-dCas9引入U2OS细胞(图28)。我们测试了在含有插入Chr1:p36的LacO重复序列阵列的U2OS 2-6-3细胞中的募集效率。
使用靶向LacO序列的sgRNA,我们在ABA处理2天后使用3D-FISH可视化LacO阵列的空间定位和通过GFP-Coilin可视化CB的位置(图29)。与GFP-Coilin-标记的CB共定位的LacO基因座的百分比从没有ABA处理的9%(n=78)增加到ABA处理后的64%(n=84),并且含有与LacO基因座共定位的至少一个CB的细胞的百分比从10%(n=68)增加到65%(n=77)(图30,p<0.0001)。组合的用FISH的免疫染色显示,在ABA处理20小时后,其它CB组分(SMN,纤维蛋白和Gemin2)也与LacO基因座共定位(图31),这证实了CRISPR-GO介导的靶向基因组基因座与CB的共定位。
为了使内源性基因组基因座靶向CB,将Chr3:q29靶向的sgRNA引入表达Cajal小体靶向的CRISPR-GO系统的U2OS细胞中。ABA处理24小时后,观察到Chr3基因座(用CRISPR-Cas9成像可视化)与CB(用GFP-Coilin可视化)之间显著的共定位(图32)。与CB共定位的Chr3基因座的百分比从ABA处理前的2%(n=149)增加到ABA处理后的94%(n=229,p<0.0001),并且含有与Chr3基因座共定位的至少一个CB的细胞的百分比从6%(n=50)增加到96%(n=101,p<0.0001)(图33)。
还测试了CRISPR-GO是否可以介导染色质基因座与PML核小体的共定位。为此,通过将PYL1与PML小体的支架蛋白PML基因融合来设计PML小体靶向的CRISPR-GO系统。为了使内源性基因组基因座靶向PML小体,将Chr3:q29靶向的sgRNA引入表达PYL1-GFP-PML和ABI-dCas9的细胞中,通过CRISPR-Cas9成像可视化Chr3基因座的定位,并通过GFP-PML可视化PML小体的位置(图34和35)。有趣的是,在没有ABA处理的情况下,高百分比(52.6%,n=300)的Chr3:q29基因座与PML小体共定位,这可能提示天然的Chr3:q29-PML小体共定位(图35和36)。在ABA处理后,与PML小体共定位的靶Chr3基因座的百分比增加到94%(n=196,p<0.0001),并且含有与Chr3基因座共定位的至少一个PML小体的细胞的百分比从75%(n=100)增加到96%(n=69,p=0.0003)(图35和36)。免疫染色也证实了Chr3基因座与SP100(另一种PML小体标志物)共定位(图37)。
实施例8.快速、可诱导和可逆的CRISPR-GO介导的靶基因组基因座与Cajal小体之间的关联
进行化学诱导和去除实验以研究CRISPR-GO介导的染色质与CB共定位的动态和可逆性。以U2OS 2-6-3细胞中Chr1:p36所插入的LacO基因座为例,我们观察到LacO基因座与GFP-Coilin标记的CB之间的关联快速发生:在ABA加入后30分钟内,与CB共定位的LacO基因座的百分比从2.6%(n=78)增加到89%(n=85,p<0.0001)(图38)。
在用ABA预处理1天的细胞中,观察到ABA去除导致CB从LacO基因座解离。ABA去除后,与CB共定位的靶向的LacO基因座的百分比在6小时后从89%(n=85)降低到22%(n=60,p<0.0001),在24小时后进一步降低到4.6%(n=45,p<0.0001)(图39)。在ABA去除后6小时,在仍然具有LacO-共定位GFP-Coilin的细胞群(22%)中,剩余的GFP-Coilin强度比进行持续ABA处理的细胞的GFP-Coilin强度更暗(图40),这可能表明ABA去除后CB的逐步分解过程。
实施例9.在靶向的染色质基因座处的从头CB形成和现有CB的重新定位
为了进一步表征CRISPR-GO介导的Cajal小体与靶向的基因组基因座的关联的动态,在ABA处理之前和之后进行个体细胞的时间推移显微成像。理论上,基因组基因座与核小体之间的共定位可以通过在基因组基因座处核小体的从头形成,或者通过将基因组基因座重新定位到现有的核小体来发生。使用LacO-Lac1束缚系统的先前报道表明Cajal小体在靶向DNA位点处从头形成。
使用CRISPR-GO系统使LacO基因座靶向Cajal小体,在加入ABA后在大多数分析的细胞中在LacO基因座处观察到快速(在20分钟内)从头CB形成(图41)。例如,在没有ABA的LacO基因座处没有初始GFP-Coilin积累的细胞中(图41,-150s),ABA处理(在-150s至Os加入,图42)迅速将GFP-Coilin募集到LacO基因座(图41,150s),导致Cajal小体的从头形成。在加入ABA后10分钟内,LacO基因座处的GFP-Coilin荧光强度接近饱和(图44)。
有趣的是,如果靶向的染色质基因座与现有CB最初在空间上彼此接近,则观察到两者的动态重新定位。例如,在其中现有CB与没有ABA处理(图45,-200s)的LacO基因座相邻的细胞中,ABA处理(在-200s至Os加入,图45)导致现有的CB和LacO基因座的快速共定位,这表明本文所公开的系统也可以介导多核苷酸(例如基因组基因座)与细胞隔室(例如现有的核小体)之间的直接关联,这是一种以前尚未报道的现象。
实施例10.由CRISPR-GO介导的基因组基因座向核周边的重新定位引起的报告基因表达降低
先前的研究提供了关于基因组重新定位到核周边对基因表达的影响的不同证据。一些研究显示,使用LacI-Emerin或LacI-Lap2β将LacO重复序列束缚到核周边引起相邻基因的抑制。其它研究显示,在U2OS 2-6-3细胞中使用LacI-核纤层蛋白B1融合蛋白将LacO阵列重新定位到核周边,但是在相邻基因表达中没有观察到明显的变化。CRISPR-GO提供了另一种研究这一问题的方法,因为它更容易测试将不同染色体基因座募集到核周边的效果。
检测CRISPR-GO介导的LacO阵列重新定位到核周边是否可以影响基因表达。U2OS2-6-3细胞中的LacO基因座位于驱动CFP报告基因表达的强力霉素(Dox)诱导型TRE(四环素应答元件)-CMV启动子的上游(图46)。通过流式细胞术测量ABA处理和未处理细胞中相邻CFP报道基因的表达,观察到与未处理细胞相比,ABA处理细胞显示出一致降低的报告基因表达(降低59%,图46和47)。该基因抑制作用类似于使用LacI-Emerin融合蛋白将LacO基因座重新定位到核周边。作为证实基因抑制是靶标特异性的对照,我们还测试了非靶向sgRNA,并且观察到报告基因表达没有降低(图47)。
接下来测试将内源性基因组基因座重新定位到核周边是否可以改变基因表达。将Chr3、XIST和CXCR4基因座分别重新定位于核周边,并进行RT-qPCR检测相邻基因表达中的变化(Chr3:ACAP2&PPP1R2;CXCR4;XIST)。令人惊讶的是,这些基因(例如,图48中的ACAP2和PPP1R2)没有观察到基因表达变化的证据。因此,它提出了这样的问题:基因重新定位至核周边附近是否足以引起内源性基因表达变化,并且重新定位诱导的基因表达变化仍然可能是基因座依赖性的。
实施例11.由CRISPR-GO介导的基因组基因座向CB的重新定位引起的报告基因表达降低
接下来测试在U2OS 2-6-3细胞系中使用CRISPR-GO系统将LacO基因座共定位到CB是否足以影响相邻基因的表达(图49)。用ABA处理细胞2天,用Dox诱导1天,并通过流式细胞术测量CFP表达。与未处理的细胞相比,在ABA处理的细胞中观察到报告基因表达持续降低(平均降低45%,图49和50,p<0.0001)。为了证实该基因抑制作用是靶标特异性的,测试了非靶向sgRNA,并且观察到报告基因表达的轻微但不显著的降低(p>0.05)(图50)。
接下来测试将内源性基因组基因座共定位到CB是否可以改变相邻基因的表达。CRISPR-GO系统被用于诱导Chr3:q29与CB的共定位(图32和33),然后进行RT-qPCR以检测ABA处理4天后相邻基因表达(Chr3:ACAP2&PPP1R2)中的变化。令人惊奇的是,与未处理的细胞相比,观察到两个相邻基因的显著抑制。位于Chr3上CB-靶向基因座上游约35kb的ACAP2在ABA处理后表现出3.3倍的抑制(p<0.0001,图42),而位于Chr3上CB-靶向基因座下游约36kb的PPP1R2表现出7.7倍的抑制(p<0.0001,图42)。证实没有sgRNA或没有PYL-GFP-Coillin组分的细胞在ACAP2和PPP1R2基因表达上没有变化(图43)。总之,这些结果显示,给定多核苷酸(例如基因组基因座)与细胞隔室(例如CB)的靶向共定位能够抑制相邻多核苷酸的表达。例如,使用本文所公开的系统和方法的基因表达扰动介导的长距离功效与CRISPRi或CRISPRa相反,CRISPRi或CRISPRa仅引起距dCas9结合位点相对短距离的基因表达中的扰动。所提供的方法和系统能够介导长距离多核苷酸表达扰动的观察结果可以提供有用的新方法,例如基因调节。
实施例12.CRISPR-GO介导的端粒重新定位引起细胞表型改变
CRISPR-GO系统被用于研究端粒重组至核隔室如何影响细胞表型。在所有测试的基因组基因座中,端粒的动态是研究的最佳的,并且显示出与细胞周期的某些阶段的核周边和CB相关。考虑到端粒对基因组完整性的重要作用,它们与核隔室的相互作用可能具有功能意义。例如,在细胞周期期间,当核膜在有丝分裂后的细胞中重新组装时,端粒被动态地束缚到核包膜,然后在G1期期间被重新定位到核的内部,在细胞周期的其余部分它们保持在那。端粒束缚至核包膜和与其解束缚的循环对于染色质组织和细胞周期/活力可能是重要的。
为了测试这一点,使用CRISPR-GO系统在细胞周期期间破坏端粒解束缚过程并在间期期间保留端粒至核隔室(图51)。使用通过测量细胞的代谢活性来定量细胞增殖的Alamar蓝细胞活力测定,当与未处理的细胞相比时,发现通过CRISPR-GO维持端粒在核周边在ABA处理6天后导致细胞活力的显著降低(图52,平均72%的降低,p<0.0001)。在ABA处理3天后,细胞周期分析表明,将端粒束缚到核周边增加了GO/G1期的细胞百分比,并降低了S期和G2/M期的细胞百分比,这可能表明GO/G1期停滞(图53)。还检测了端粒与CB共定位的效果,这证实了CRISPR-GO系统能够诱导端粒和CB的共定位,并且发现当将用ABA处理2天的细胞与未处理的细胞进行比较时,共定位增加了细胞活力(平均50%增加,图54-56)。作为对照,单独的ABA处理对U2OS细胞中的细胞活力没有影响(图57)。总之,这些观察结果表明多核苷酸(例如端粒)相对于各种细胞隔室(例如核隔室)的空间组织在细胞功能中起重要作用。
实施例13.质粒收集和构建
通过用PYL1替换pHR-SFFV-scFv-sfGFP质粒(Tanenbaum等人,2014)中的scFv序列并在sfGFP后插入Emerin,克隆了pHR-SFFV-PYL1-sfGFP-Emerin。Emerin(由EMD基因编码)克隆自Emerin pEGFP-C1(637),其为来自Eric Schirmer的礼物(Zuleger等人,2011)(Addgene质粒61993)。通过用Coilin替换pHR-SFFV-PYL1-sfGFP-Emerin质粒中的Emerin,克隆了pHR-SFFV-PYL1-sfGFP-Coilin。Coilin克隆自pEGFP-Coilin(Addgene质粒36906),其为来自Greg Matera博士的礼物。通过用PGK启动子替换pHR-SFFV-PYL1-sfGFP-Coilin质粒中的SFFV启动子,克隆了pHR-PGK-PYL1-sfGFP-Coilin。通过用TRE3G启动子替换PGK启动子,并用PML或HP1a替换pHR-PGK-PYL1-sfGFP-Coilin质粒中Coilin,克隆了pHR-TRE3G-PYL1-sfGFP-PML或pHR-TRE3G-10PYL1-sfGFP-HP1a。PML克隆自pLPC-Flag-PML-IV(addgene质粒62804),其为来自Gerardo Ferbeyre的礼物(Vernier等人,2011)。HP1a克隆自GFP-HP1a(Addgene质粒17652),其为来自Tom Misteli的礼物(Cheutin等人,2003)。
先前描述了pHR-SFFV-ABI-tagBFP-dCas9(Gao等人,2016)。通过用PGK启动子pHR-SFFV-ABI-tagBFP-dCas9替换SFFV启动子克隆了pHR-SFFV-ABI-tagBFP-dCas9。在dCas9pHR-SFFV-ABI-tagBFP-dCas9中,通过用PGK启动子替换SFFV,删除tagBFP,并加入P2A-mCherry或P2A-Puro,克隆了pHR-PGK-ABI-dCas9-P2A-Cherry或pHR-PGK-ABI-dCas9-P2A-Puro。ABI和PYL1克隆自Addgene质粒38247(Liang等人,2011),其为来自J.Crabtree,Stanford博士的礼物。
通过用HaloTag替换质粒pHR-TRE3G-dCas9-HA-SunTag10-P2A-mCherry(Tanenbaum等人,2014)中的SunTag10-P2A-mCherry,克隆了pHR-TRE3G-dCas9-HaloTag。通过将HaloTag插入pHR-TRE3G-dCas9-EGFP的EGFP之后,克隆了pHR-TRE3G-dCas9-EGFP-HaloTag(Chen等人,2013)。通过用mCherry-DHFR替换pHR-SFFV-PYL1-sfGFP-Emerin中的PYL1-sfGFP序列,克隆了pHR-SFFV-DHFR-mCherry-Emerin。HaloTag和mCherry-DHFR克隆自pERB221,其为来自David Chenoweth&Michael Lampson的礼物(Ballister等人,2014)(Addgene质粒61502)。
将所有sgRNA克隆到去除P2A-mCherry后的pHR-U6-sgTel-CMV-puro-P2A-mCherry载体中(Chen等人,2013)。将TRF1-mCherry克隆到pHR-U6-sgTel-CMV-puro-P2A-mCherry载体中代替mCherry。TRF1克隆自pLPC-NFLAG TRF1,其为来自Titia de Lange博士的礼物(Smogorzewska和de Lange,2002)(Addgene质粒#16058)。
实施例14.细胞培养和稳定细胞系的产生
U2OS(人骨肉瘤上皮,雌性)细胞和Hela细胞(雌性)在含有GlutaMAX的DMEM(LifeTechnologies)中在10%Tet系统批准的FBS(Life Technologies)中培养。U2OS 2-6-3细胞系是来自冷泉港实验室的David L.Spector博士的礼物,并且在相同条件下培养(Kumaran和Spector,2008)。将所有细胞在37℃和5%CO2下在加湿培养箱中培养。
为了建立将内源性基因座靶向核隔室的稳定的CRISPR-GO细胞系,提前1天将U2OS细胞铺板到24孔板中,达到50%汇合,然后用慢病毒混合物转导。在针对BFP和GFP阳性细胞的Stanford共享FACS设备上通过荧光激活细胞分选(FACS)对通过表达PYL1-sfGFP-Emerin、PYL1-sfGFP-Coilin、PYL1-sfGFP-PML或PYL1-sfGFP-HP1a和ABI-tagBFP-dCas9的慢病毒转导的细胞进行分选以建立稳定的细胞系。对于核周边束缚,选择高BFP和GFP表达水平的细胞。对于其它核隔室束缚,选择高BFP和GFP表达水平的细胞。在用表达靶向sgRNA的慢病毒转导CRISPR-GO细胞系后,用2μg/ml的嘌呤霉素选择sgRNA阳性细胞。
为了靶向U2OS 2-6-3细胞系中的LacO基因座(Kumaran和Spector,2008),通过含有PYL1-sfGFP-Emerin或PYL1-sfGFP-Coilin和ABI-dCas9-P2A-mCherry的慢病毒混合物转导细胞。对含有PYL1-sfGFP-Coilin和ABI-dCas9-P2A-mCherry的细胞分选GFP和mCherry阳性细胞以建立稳定的细胞系。用2μg/ml的嘌呤霉素选择sgRNA阳性细胞。
为了通过CRISPR成像定量LacO核周边重新定位的功效,用编码ABI-dCas9-P2A-Puro而不是ABI-dCas9-P2A-mCherry的慢病毒转导U2OS 2-6-3细胞,并且用2μg/ml的嘌呤霉素选择。
实施例15.通过CRISPR-GO系统靶向的基因组基因座
测试靶向U2OS细胞中不同染色体区域的CRISPR-GO系统的功效。对重复区域和非重复基因进行测试(图7、14和17)。内源性重复区域包括Chr3.q29:195478324-195506987;Ch13.q34:5112,277485-112,319169;Ch7:q36.3:158,122,661-158,135,328;ChX p21.2:30,806,671-30,824,818和端粒。插入U2OS 2-6-3细胞的Chr1.p36区域的合成LacO重复序列也被用于靶向。对于重复区域,使用单一sgRNA设计来靶向靶向区域内的多个重复序列(表1中SEQ ID NO.1-8)。非重复基因包括位于Chr2.q22.1的CXCR4,位于ChrX.q13.2的XIST和位于Chr10.q23.31的PTEN。为了靶向每个非重复基因,设计了靶向其基因主体和上游区域的多种sgRNA(表2中的SEQ ID NO.9-36)。
表1.靶向重复区域的sgRNA
表2靶向非重复区域的sgRNA
实施例16.慢病毒产生
为了产生慢病毒,用目的pHR构建体和包装质粒pCMV-dR8.91和pMD2.G瞬时转染HEK293T细胞。转染后72小时通过用0.45μm过滤器过滤上清液收集慢病毒。必要时,可以使用Lenti-X浓缩器在4℃下将病毒上清液浓缩过夜,并且在4℃下在1500g下离心30min以收集病毒沉淀。将沉淀悬浮在冷培养基中,直接加入细胞中或在-80℃冷冻。
实施例17.通过CRISPR成像和FISH的基因组基因座可视化
进行CRISPR成像以可视化Chr3、Chr13和LacO基因座在活细胞中的定位(图5)。对于活细胞CRISPR成像,用编码dCas9-HaloTag和靶向sgRNA的慢病毒在ibidi 24孔微孔板(Ibidi.inc)中转导表达CRISPR-GO组分的稳定细胞系。用dCas9-HaloTag标记靶向的基因组基因座,并用JF549-HaloTag配体以0.1-0.5μM在37℃下在培养基中染色15min。染色后,用培养基洗涤细胞两次,然后在显微镜检查过程中在无酚红的培养基中孵育。JF549-HaloTag是在Janelia Research Campus的Luke D.Lavis博士的礼物(Grimm等人,2015)。端粒基因座通过表达端粒结合蛋白TRF1-mCherry在活细胞中被标记。
其它基因组基因座在固定细胞中被DNA FISH标记。使细胞在具有可移除的12孔硅酮室的ibidi室载玻片中生长,并用4%PFA固定20分钟。使用合成的荧光核苷酸探针(Integrated DNA Technologies,雷德伍德城,CA),根据所描述的FISH方案(Takei等人,2017)标记Lac0、Chr7和ChrX基因座。用Alexa Fluor 647标记的FISH探针5'-TTGTTATCCGCTCACAATTCCACATGTGGCCACAAA-3'(SEQ ID NO:40)以10nM浓度标记LacO基因座。用200nM的Cy3标记的FISH探针5’-Cy3-CCCACACTCTCACCATAAGAGC-3’(SEQ ID NO:41)标记Chr7基因座,并用200nM的5-Cy3-TTGCCTTGTGCCTTGCCTTGC-3’(SEQ ID NO:42)标记ChrX基因座。CXCR4 FISH探针购自Empire Genomics。PTEN和XIST FISH探针购自Cell Line Genetics。根据商人的方案进行FISH。
实施例18.核小体标志物的免疫染色
为了检测Cajal小体标志物与靶向LacO基因座之间的共定位,在第0天用编码PGK-ABI-dCas9-P2A-Puro和sgLacO的慢病毒转染表达低水平PYL1-sfGFP-Coilin的U2OS 2-6-3细胞,在第1天用嘌呤霉素和3mM ABA处理,并在第2天在ABA处理20小时后固定。使用AlexaFluor 647标记的FISH探针在固定样品中进行FISH以检测LacO基因座,然后使用小鼠单克隆抗SMN,抗纤维蛋白和抗Gemin2抗体,以及驴抗小鼠Alex Fluor 594第二抗体进行免疫染色。
为了检测PML小体标志物和靶向Chr3基因座之间的共定位,在第0天用编码dCas9-HaloTag(用于CRISPR成像)和sgChr3的慢病毒转染表达PYL1-sfGFP-Coilin和PGK-ABI-dCas9的U2OS细胞,在第1天用嘌呤霉素和3mM ABA处理,在第3天通过JF549-HaloTag染色并固定在4%多聚甲醛(PFA)中。用兔多克隆抗SP100和驴抗兔Alex Fluor 647第二抗体在固定样品中进行免疫染色。
对于免疫染色,固定的样品在透化缓冲液(PBS,1%Triton-X100)中透化15分钟,在封闭缓冲液(PBS,0.3%Triton-X 100,5%驴正常血清)中封闭1小时,与在封闭缓冲液中稀释的第一抗体一起在4℃孵育过夜,在PBS中洗涤三次,然后与第二抗体一起在室温孵育1-2小时,在PBS中洗涤4次。
实施例19.化学诱导和逆转实验
对于重新定位实验,在成像或固定之前,用3mM脱落酸(ABA,Sigma-Aldrich,A1049)处理含有化学诱导型重新定位系统和sgRNA的U2OS细胞2天。
对于将Chr3靶向核周边的时间过程化学诱导实验,用或不用3mM ABA处理含有CRISPR-GO和CRISPR成像系统和靶向Chr3的sgRNA的U2OS细胞,用JF549-HaloTag染色,并在不同的时间点固定。对于时间过程逆转实验,用3mM ABA预处理Chr3靶向U2OS细胞2天,洗涤5次,并转换到无ABA的培养基中。细胞通过用于CRISPR成像的JF549-HaloTag配体染色,并在不同时间点在4%多聚甲醛中固定20min。
对于将LacO靶向Cajal小体的的时间过程化学诱导实验,在第0天用编码PGK-ABI-BFP-dCas9和sgLacO的慢病毒转染表达低水平PYL1-sfGFP-Coilin的U2OS 2-6-3细胞,在第1天用嘌呤霉素处理,在第2天用或不用3mM ABA处理,并在ABA处理30分钟后固定。对于时间过程逆转实验,细胞用3mM ABA预处理2天,洗涤5次,并转换到无ABA的培养基中。在不同的时间点将细胞固定在4%多聚甲醛中20min。
实施例20.细胞周期同步
为了分析基因组重新定位的有丝分裂依赖性效应,将含有CRISPR-GO和CRISPR成像系统和靶向Chr3的sgRNA的U2OS细胞用于该实验。在第-3天,使细胞在培养基的0.5%FBS中饥饿2天。在第-1天,将细胞转换至具有10%FBS的正常生长培养基,并用2mM羟基脲(HU)处理用于G1/S期阻断1天。在第0天,在保持HU处理的同时,用或不用ABA处理细胞。对照细胞以相同方式处理,但不用HU。细胞通过用于CRISPR成像的JF549-HaloTag染色并在ABA处理后24h或48h固定在4%多聚甲醛中。
实施例21.显微镜检查
除了图22外,所有显微镜检查在Nikon TiE倒置共聚焦显微镜上进行,该显微镜配备有100×PLAN APO油物镜(NA=1.49)、60×PLAN APO油物镜(NA=1.40)或60×PLAN APOIR水物镜(NA=1.27)、Andor iXon Ultra-897 EM-CCD照相机和405-nm、488-nm、561-nm和642-nm的激光器。使用NIS Elements 4.60版软件通过时间推移显微镜检查以0.2-[tm或0.4-[tm的步长使用Z堆叠拍摄图像。对于活细胞成像,将细胞在37℃和5%CO2下保持在加湿室中。
对于图22所示的长期活细胞成像,在配备有63×HC PLAN APO油物镜(NA=1.40)、Leica DFC9000 CT照相机和Lumoncor SOLA SM II 405光源的Leica DMI8倒置显微镜中进行显微镜检查。使用GFP和TXR滤镜(filter cube),使用LAS X软件通过时间推移显微镜检查每30分钟拍摄图像,持续20小时。在成像期间,将细胞在37℃和5%CO2下保持在加湿室(Okolab Cage孵育系统)中。
为了使单个细胞中染色质-Cajal小体关联的动态可视化(图38-41、44和45),在第0天,用编码PGK-ABI-BFP-dCas9和sgLacO的慢病毒转染表达较低水平的PYL1-sfGFP-Coilin的U2OS 2-6-3细胞,在第1天用嘌呤霉素处理,并接种在ibidi 96孔u板中。将每个孔在共聚焦显微镜下成像以聚焦于所选细胞中的ABI-BFP-dCas9标记的LacO基因座。在ABA处理之前捕获图像以进行比较。在共聚焦显微镜下不移动样品的情况下,将10倍含ABA的培养基加入到成像孔中以达到1mM ABA的最终浓度,然后在加入ABA后立即对含有先前聚焦的LacO基因座的同一细胞成像。在ABA加入后拍摄的第一个图像被给出t=0,并且所有其它图像相应地通过捕获时间进行比对。
实施例22.成像处理与数据分析
在Fiji(图像J)(Schindelin等人,2012)或MetaMorph(Molecular Devices,CA)中进行图像处理。在本文附图中显示了显示标记的基因组基因座的最大荧光的单个显微镜平面,或显示最大基因座荧光的两个/三个相邻Z平面的平均值。使用Fiji中的“平滑”函数处理一些图像以仅减少用于可视化的噪声。
使用Fiji中的“分析/绘图配置文件(Analyze/Plot Profile)”功能进行线扫描,在Excel中分析并在GraphPad Prism(7.00版,Mac OS,GraphPad Software,La JollaCalifornia USA,www.graphpad.com)中作图。相对于沿着线的最大(=1)和最小(=0)荧光强度,将沿着线的每个点处的荧光强度归一化。
使用FIJI/ImageJ(1.52版)软件对所呈现的图像进行线性追踪以评估靶蛋白在细胞上的共定位(图68、70-73、75-80、85、89和92),所述所呈现的图像代表标记基因组基因座的最大荧光处的单个显微镜平面。使用FIJI的“直线”功能在两个合成焦点之间画一条线,端点延伸到细胞核外。如果多于两个的合成焦点是可见的,则任意选择两个。如果只有一个合成焦点是可见的,则该线向任意方向延伸。沿线所有通道的原始荧光强度使用FIJI中的“分析/绘图配置文件”功能绘制。沿线每个点的原始强度被归一化为沿线测量的最大(1)或最小(0)荧光强度。
实施例23.基因组重新定位事件的定量
为了测定活U2OS细胞中的周边募集功效,通过CRISPR成像标记Chr3、Chr13和Chr1/Lac0基因座,并通过TRF1-mCherry标记端粒,而通过PYL1-sfGFP-Emerin标记核膜。在扫描共聚焦平面的Z堆叠之后,在切片观察器(NIS元件观察器)中观察每个标记基因座的位置,以确定其在XY、XZ和YZ平面中的位置。在没有双重计数任何基因座的情况下,将基因座分为三类:与PYL1-GFP-Emerin在XY、YZ和YZ平面中共定位的直接位于核周边的基因座,不与PYL1-GFP-Emerin共定位的基因座,和不在核周边的与内部PYL1-GFP-Emerin共定位的基因座(在罕见的情况下)。记录每个单独细胞的每个类别中的基因座的数目。只有与PYL1-GFP-Emerin共定位于核包膜的第一类基因座被计数为核周边定位的基因座。对含有至少一个位于核周边的基因座的细胞进行定量。
为了测定固定的U2OS细胞(例如,Chr7、ChrX、PTEN、CXCR4、XIST)中的周边募集功效,用FISH标记靶向的基因组基因座,并用DAPI染色细胞核。在扫描共聚焦平面的Z堆叠之后,在3D空间中观察每个标记基因座的位置,以确定其在XY、XZ和YZ平面中的位置。在3D空间中位于细胞核(DAPI)边缘的基因组基因座被归类为周边定位的基因座。否则,它被认为是内部定位的基因座。记录每个单独细胞的每个类别中的基因座的数目。还对含有至少一个位于核周边的基因座的细胞进行定量。
为了测定Cajal小体在固定的U2OS 2-6-3细胞中的共定位功效,用FISH标记靶向的LacO基因座,用Hoechst 33342染色细胞核,并用PYL1-GFP-Coilin标记Cajal小体。在扫描共聚焦平面的Z叠堆之后,我们在3D空间中鉴定每个LacO基因座的位置。在没有双重计数的情况下,基因座分为两类:与PYL1-GFP-Coilin共定位的基因座,和不与PYL1-GFP-Coilin共定位的基因座。记录每个单独细胞的每个类别中的基因座的数目。还对含有至少一个Cajal小体共定位基因座的细胞进行定量。
实施例24.使用流式细胞术分析的荧光测定
为了定量CFP-SKL表达,用靶向lacO基因座的sgRNA或非靶向sgRNA转导含有ABI-dCas9-P2A-mCherry和PYL1-sfGFP-Emerin或PYL1-sfGFP-Coilin的U2OS 2-6-3细胞,用3mM的ABA处理2天,然后用50ng/ml的强力霉素诱导40小时(核周边细胞束缚)或24小时(Cajal小体束缚)。处理后,使用0.25%胰蛋白酶EDTA(Life Technologies)解离U2OS 2-6-3细胞,并使用405-nm、488-nm和561-nm激光器在CytoFlex S(Beckman Coulter Life Sciences)上通过流式细胞术进行分析。对每个样品分析至少8,000个细胞。门控阳性dCas9(mCherry)和Emerin(GFP)表达的细胞。使用405nm激光器和450/45过滤器检测CFP-SKL荧光。为了定量相对荧光,将未处理的(没用Dox和ABA)细胞的平均总荧光设为0,而将强力霉素诱导的细胞(仅用Dox)的平均总荧光设为1。报道了在3个独立实验中的技术重复。
实施例25.用于内源性基因表达的实时RT-PCR
进行实时RT-PCR以确定基因组重组后邻近靶向Chr3基因座的PPP1R2、TFRC和ACAP2基因的表达变化。对于每个样品,根据制造商的方案,使用RNeasy Plus微型试剂盒(Qiagen Cat 74134)分离总RNA,并使用iScript cDNA合成试剂盒(BioRad,Cat 1708890)合成cDNA。根据制造商的说明书,使用SYBR Green Master Mix(BioRad),利用PrimePCR测定进行定量PCR,并在Biorad CFX384实时系统(C1000 Touch Thermal Cycler)上运行。Cq值被用于定量基因表达。将PPP1R2、TFRC和ACAP2基因的相对表达相对于GAPDH对照进行归一化。为了计算相对mRNA表达水平,通过将非ABA处理的样品中的平均值设定为1来归一化各处理的相对表达。报道了在3个实验中的重复。
实施例26.细胞活力测定
使用Alamar蓝细胞活力试剂(ThermoFisher Scientific)进行细胞活力测定,其测量细胞的代谢活性。对于每种条件,将用和不用ABA处理的100μl细胞以相等的浓度(500-1000个细胞/孔)接种在相同的96孔板中。在检测时,将10μl的Alamar蓝试剂加入到每个孔中,并将板在37℃孵育1小时。然后,在Synergy H1微板读数器(Biotek Inc.)中使用540nm处的激发波长和585nm处的发射波长测量荧光强度。使用仅含有100μl培养基(含有和不含ABA)的孔的平均荧光强度作为空白。对于每个孔,通过从其原始荧光强度减去背景(空白孔的平均强度)来计算相对荧光强度。为了计算相对细胞活力,通过将非ABA处理的孔中的平均值设定为1来归一化每个孔中的相对荧光强度。报道了在3个实验中的重复。
实施例27.细胞周期细胞术分析
为了定量端粒核周边束缚如何影响细胞周期进程,用编码sgTelomere和TRF1-mCherry的慢病毒混合物或编码非靶向sgRNA的慢病毒处理含有核周边束缚系统的U2OS细胞。在ABA处理2天后通过显微镜检查证实端粒束缚。在ABA处理3天后,对照和处理的细胞用0.25%胰蛋白酶EDTA解离,用Hoechst 33342以1:1000稀释液染色1h,并在CytoFlex S(Beckman Coulter Life Sciences)上使用405-nm激光器通过流式细胞术进行分析。对每个样品分析至少20,000个细胞。使用FlowJO进行细胞周期分析。
实施例28.人类重复序列簇的鉴定
使用软件Tandem Repeats Finder(Benson,1999)鉴定来自人类基因组(hg38)的14个核苷酸或更长序列的所有串联重复序列。含有10个或更多个相同串联重复序列的区域被定义为“重复序列簇”。这些重复序列簇针对每条人类染色体。使用BEDTools程序组计算重复序列簇与基因之间的距离。
实施例29.内源性基因座的短期动态追踪
使用TrackMate插件(Tineve等人,2017)在Fiji中进行基因组基因座追踪。为了追踪基因组基因座,将估算的blob直径设定为0.5-1。将连接最大距离设定为2,将间隙闭合距离设定为3μm,并且将间隙闭合最大框架设定为2。测量每个基因座(xt,yt)在不同时间点(t)的位置,在Excel中分析,并在GraphPad Prism 7中作图。通过从新位置减去先前时间点的位置来计算移动步长(dx,dy):dxt=xt-xt-1&dyt=yt-yt-1,其中(xt,yt)是基因座在时间t时的位置,而(xt-1,yt-1)是基因座在先前的时间(t-1)时的位置。被计算为基因座从其先前的时间点时的位置移动多远。
为了比较步距,对19个内部定位的Chr3基因座的1696个步距和14个周边定位的Chr3基因座的1669个步距进行了分析。进行具有不等方差的双侧t检验。使用Excel中的直方图函数分析直方图,并在GraphPad Prism 7中作图。
实施例30.统计分析
为了定量重新定位的功效(图8、9、16、18-21、30、33、36、38和39),使用GraphPad中的费希尔精确检验计算p值,并且误差条显示根据Bernoulli分布计算的平均值的标准误差(SEM)。计数的基因座/细胞的数目列在每个图的底部。对于图26、42、43、46-51、53、56和57,使用Excel中的具有不等方差的双侧t检验计算p值,并且误差条显示标准偏差。分析3个实验中的重复。对于图27,拟合γ分布使用R包fitdistrplus以最大似然拟合,并使用Kolmogorov-Smirnov检验(对于周边基因座p=0.06&对于内部基因座p=0.77)检验拟合优度。
尽管为了清楚理解的目的,已经通过说明和实施例的方式详细描述了上述发明,但是本领域技术人员将理解,在所附权利要求的范围内可以实施某些改变和修改。此外,本文所提供的每篇参考文献通过引用整体并入本文,其程度如同每篇参考文献单独通过引用并入本文一样。
实施例31.同源性定向修复
为了实施诱导型CRISPR介导的染色质重新定位系统以促进同源性定向修复(HDR),测试了化学诱导型异二聚化系统。该系统是脱落酸(ABA)诱导型ABI/PYL1系统。化脓性链球菌dCas9(D10A&H840A)蛋白与一个异源二聚体融合,并且促进HDR的各种蛋白质(如Rad51、Rad52和MRN复合体)与同源异源二聚体融合。用于HDR的模板多核苷酸也与同源异源二聚体融合。U2OS人骨骨肉瘤上皮细胞系是使用稳定表达二聚化系统的慢病毒转导建立的。在这些细胞系中,由于ABA与PYL1-GFP-HDR蛋白的二聚化,HDR融合蛋白在空间重新定位到ABI-BFP-dCas9蛋白是由加入ABA引起的。将在ABI-BFP-dCas9蛋白的靶多核苷酸中产生双链断裂的CRISPR/Cas9复合物引入细胞,并在靶多核苷酸中产生双链断裂。靶多核苷酸中的双链断裂优先被HDR修复。
实施例32:在靶向的基因组基因座处产生大规模异染色质结构域
该实施例显示了在靶向的基因组基因座处产生异染色质结构域。诱导型dCas9和异染色质蛋白融合到互补的异二聚化结构域对上,这些结构域在化学诱导剂的存在下组装。图63是用于通过靶向串联重复区域在基因组基因座处产生高浓度异染色质蛋白的可编程的、诱导型和通用系统的示意图。
为了在靶位点产生高浓度的异染色质蛋白,使用诱导型ABI-PYLl异二聚体系统。图63A显示了诱导型dCas9系统(与ABI连接的d-Cas9)在加入植物激素脱落酸(ABA)后通过ABI和PYL1结构域的异二聚化将异染色质蛋白(如HP1α(与HP1α连接的PYL1))募集到靶位点。基因组靶多核苷酸由sgRNA指定,其通过与dCas9结合形成复合物,然后通过与基因组靶多核苷酸结合将dCas9导向基因组靶多核苷酸。图63B显示了靶向串联重复序列的基因组多核苷酸的单一sgRNA允许彼此紧密接近的多个(例如,数十、数百等)基因组位点的潜在结合。此外,HP1α通过其色影结构域自发形成同源二聚体,并且据报道通过N-末端与铰链区相互作用进行寡聚化,进一步增加靶位点异染色质蛋白的浓度。这些机制使单个HP1α能够将另外的HP1α募集到基因组靶多核苷酸。图63C显示了通过工程化的蛋白质支架,在每个致动器部分的基础上进一步增加募集到基因组靶多核苷酸的蛋白质的数量,诸如通过增加与该系统的dCas9结合的异染色质蛋白质的数量。通过将dCas9连接到支架(如肽阵列或SpyTag、SunTag、分裂sf-GFP、MoonTag、SnoopTag、分裂sfCherry2或mNeonGreen2蛋白支架),将异染色质蛋白的大量拷贝募集到靶位置,其中可以作为蛋白质多聚化结构域。
实施例33:工程化异染色质蛋白HP1α募集到Chr3靶位点
该实施例显示了工程化异染色质蛋白HP1α动态募集到染色体3上的靶位点。为了产生到靶位点的异染色质蛋白HP1α,在加入脱落酸后,使用诱导型ABI-PYLl实现蛋白质复合物的二聚化。将dCas9-HaloTag、ABI-BFP-dCas9、PYL1-sfGFP-HP1α和sgChr3q29通过慢病毒转导稳定整合到U2OS人骨肉瘤细胞中(sgChr3q29:SEQ ID NO:1;sgChr3q29的靶PAM序列(SEQ ID NO:37))。图64显示了代表性显微图像,其显示了在有或没有ABA的情况下,靶向的Chr3:q29基因座(通过CRISPR-Cas9成像的左图)、ABI-BFP-dCas9(中间图)、PYL1-sfGFP-HP1α标记(第三图)和复合图像(右图)的共定位(箭头)。在没有脱落酸的情况下,PYL1-sfGFP-HP1α定位于细胞核中的天然异染色质位点,而不是Chr3q29。图90显示了在不存在ABA的情况下,PYL1-sfGFP-HP1α表现出正常的亚核定位。在DMSO媒介物处理2天后,对稳定表达ABI-BFP-dCas9、PYL1-sfGFP-HP1α和sgChr3q29的U2OS细胞进行成像。细胞用HP1β或H3K9me3第一抗体和AlexaFluor647第二抗体进行免疫染色。在不存在ABA诱导剂的情况下,PYL1-sfGFP-HP1α定位于天然异染色质区域,由HP1β和H3K9m定为的存在来限定。
用ABA处理后,PYL1-sfGFP-HP1α在Chr3q29基因座处形成强荧光焦点。时间推移共聚焦显微镜揭示了PYL1-sfGFP-HP1α募集和焦点形成最早在加入ABA后1-10min发生。图65显示了代表性的实时显微图像(0-60分钟),其显示了加入ABA后PYL1-sfGFP-HP1α(白色基因座)的从头异染色质基因座的快速形成。PYL1-sfGFP-HP1α的核定位在加入100μM的ABA之前和之后60min内立即进行追踪。在ABA处理(0min)之前首先对所选细胞进行成像。在0min至1min,将ABA加入到培养基中,1min代表加入ABA后立即拍摄的同一细胞的第一个图像。显示了三个代表性细胞的焦点形成时间。
此外,Chr3q29上远端基因的表达被PYL1-sfGFP-HP1α的募集所抑制。用100μM的ABA或DMSO媒介物处理4天后,通过RT-qPCR定量Chr3q29上35kb至575kb的串联重复靶位点侧翼的三个基因的表达。图66显示了PYL1-sfGFP-HP1α的募集显著降低了所有三种基因的表达。图66A显示了在U2OS细胞中,通过将PYL1-sfGFP-HP1α募集到Chr3:q29基因座的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶标位点上游~35kb,和PPP1R2位于sgRNA靶位点下游~36kb。TFRC位于sgRNA靶位点下游约575kb。图66B显示了在+/-ABA条件下,使用CRISPR-GO将PYL1-sfGFP-HP1α共定位至Chr3:q29基因座的ACAP2、PPP1R2和TFRC基因表达(通过RT-qPCR测量)的比较图。数据表示为平均值±SD。图91显示了通过将非靶向sgRNA募集到Chr3q29基因座并因此在不存在PYL1-sfGFP-HP1αsgChr3的情况下,与靶向的基因座相邻并跨越长距离的内源性基因表达没有抑制。对照实验表明,加入100μM的ABA和非靶向PYL1-sfGFP-HP1αsgGAL4(sgGAL4:不靶向Chr3q29串联重复位点的导向RNA)不会诱导对Chr3q29基因的抑制。在100μM的ABA或DMSO媒介物处理后4天,通过RT-qPCR定量基因表达。
此外,游离漂浮的HP1α被募集到合成的HP1α焦点。天然异染色质募集异染色质蛋白1(HP1)家族蛋白HP1α和HP1β。图67显示了显示了合成的HP1α焦点能够募集游离的HP1α。在ABA处理2天和6天后,将游离漂浮的mCherry-HP1α(右图)募集到由PYL1-sfGFP-HP1α(中间图)和ABI-BFP-dCas9(左图)形成的合成异染色质焦点(箭头)。在100μM的ABA处理后的2天和6天,观察到用mCherry标记的游离漂浮的HP1α焦点在由PYL1-sfGFP-HP1α形成的合成异染色质焦点处富集。
图92显示了Chr3q29基因座不是天然异染色质的。图92显示了在不存在ABA诱导剂,存在DMSO的情况下,缺少H3K9me3与mCherry-HP1α的共定位(中间图,顶部)或ABI-BFP-dCas9与mCherry-HP1α的共定位(sgChr3)(左图,顶部和底部)。HP1α与异染色质的共定位图谱的相应的归一化的线性荧光图谱显示在H3K9me3和ABI-BFP-dCas9的峰处缺乏HP1α的选择性富集(曲线图)。对于顶部曲线图,浅灰色较高的线代表H3K9me3,深色较低的线代表ABI-BFP-dCas9。对于底部曲线图,浅灰色的较高线代表mCherry-HP1α,深色的较低线代表ABI-BFP-dCas9。
使用线性荧光强度追踪来确认mCherry-HP1α与合成HP1α焦点的共定位。图68A和图68B显示了复合图像(左图)的荧光图像,其显示了mCherry-HP1α基因座和合成的HP1α焦点的共定位(由箭头指示)。右图显示了用线表示的每幅图像的两个焦点的线性轨迹。mCherry-HP1α与合成的异染色质斑点的共定位的归一化的线性荧光图谱显示了PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处的选择性富集(曲线图)。对于两个图,顶部的深色线代表mCherry-HP1α,浅灰色线代表PYL1-sfGFP-HP1α,底部灰色的线代表ABI-BFP-dCas9。绘制两个焦点的线性轨迹(顶部中间和底部中间图中的白线)以与两个给定的合成异染色质斑点从核边缘到边缘相交。对于这些附图,mCherry-HP1α、PYL1-sfGFP-HP1α和ABI-BFP-dCas9的荧光强度沿着绘制的线作图,以与两个给定的合成异染色质斑点从核边缘到边缘相交。如在PYL1-sfGFP-HP1α和ABI-BFP-dCas9(右上图和右下图)峰值处mCherry-HP1α峰的选择性富集所示的,线性荧光图谱追踪显示mCherry-HP1α与合成异染色质斑点共定位。荧光值被归一化,1是沿线的最大荧光,0是沿线的最小荧光。
HP1β是HP1α的直向同源物并且也在天然异染色质中富集。HP1β的富集通过免疫荧光和荧光追踪测试。在100μM的ABA处理2天后,用HP1β第一抗体和AlexaFluor647第二抗体对细胞进行免疫染色。图69显示了在罕见的亮斑点处可以观察到HP1β与合成的HP1α焦点的共定位。在ABA处理2天后,用HP1β(右图)免疫染色的细胞定位于由PYL1-sfGFP-HP1α(中间图)和ABI-BFP-dCas9(左图)在亮斑点(实心箭头)处而非其它斑点(空心箭头)处形成的合成异染色质焦点。虽然大多数合成的异染色质焦点没有显示出明显的HP1β富集,但罕见的明亮焦点却有。这一结果表明合成的异染色质焦点正在募集HP1β,但在大多数情况下,其数量不足以通过成像进行识别。
在合成的HP1α焦点处局部染色质密度不增加。图70A和图70B显示了分别在ABA处理后2天和5天拍摄的代表性荧光图像,其表示通过在由PYL1-sfGFP-HP1α(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点(箭头)处的通过mCherry-H2B荧光信号(第三图)测量的组蛋白密度。通过mCherry-H2B的选择性富集测量了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处(右图)mCherry-H2B与合成异染色质斑点的共定位的相应归一化的线性荧光图谱。H2B-mCherry的荧光强度被用作组蛋白的代理测量,因此细胞核不同区域内的染色质密度。在100μM的ABA处理2天或5天后,H2B-mCherry信号似乎没有在合成异染色质位点处被选择性富集。用于线性追踪的线和斑点被用于确认这些发现。
HP1α相关的天然异染色质的另一个关键标志物是组蛋白3尾部赖氨酸9的翻译后三甲基化(H3K9me3)。在100uM的ABA处理2天或5天后,用H3K9me3第一抗体和AlexaFluor647第二抗体对细胞进行免疫染色。图72A和图72B分别显示了在ABA处理后2天和5天拍摄的代表性荧光图像。由PYL1-sfGFP-HP1α(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点用箭头表示,并且在第三图中显示了用H3K9me3的免疫染色。通过线性追踪显示了H3K9me3与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处没有H3K9me3的选择性富集。对于这两个曲线图,具有第一个峰的线代表H3K9me3染色,并且与两个峰重叠的线代表PYL1-sfGFP-HP1α和ABI-BFP-dCas9。
KAP1(结合HP1α和其它染色质修饰蛋白的共阻抑支架蛋白)在合成HP1α焦点处的存在也使用免疫染色进行了测定。在100μM的ABA处理2天后,用KAP1第一抗体和AlexaFluor647第二抗体对细胞进行免疫染色。图73显示了共阻抑蛋白KAP1不在合成的HP1α焦点处富集。显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用KAP1(第三图)免疫染色的细胞和由PYL1-sfGFP-HP1α(第二图)和ABI-BFP-dCas9(第一图)形成的合成的异染色质焦点(箭头)。使用线性追踪显示了KAP1与合成的异染色质斑点的共定位的相应归一化的线性荧光图谱,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处没有KAP1的选择性富集。对于该曲线图,深色较高的线代表KAP1染色,与两个峰重叠的线代表PYL1-sfGFP-HP1α和ABI-BFP-dCas9。尽管在天然异染色质位点处与PYL1-sfGFP-HP1α共定位,但KAP1并未在合成的HP1α焦点处被选择性富集。
实施例34:用于合成的异染色质生成的HP1α的突变分析。
为了确定由HP1α引起的抑制是否是由于HP1α内的任何特定结构域的功能,其中克罗莫结构域被去除的突变HP1α(例如HP1α(CSD)),并且其中色影结构域无法进行同源二聚化(例如HP1α(I165E)),针对全长野生型HP1α进行了对Chr3q29的抑制测试。通过RT-qPCR测量,只有全长野生型HP1α能够抑制三个测试的远端基因。图74A显示了在U2OS细胞中,通过将PYL1-sfGFP-HP1α募集至Chr3:q29基因座处的sgRNA靶位点的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb,并且TFRC位于sgRNA靶位点下游约575kb。图74B显示了在+/-ABA条件下,在将PYL1-sfGFP-HP1α定位至Chr3:q29基因座的表达野生型HP1α(HP1α-WT)、突变HP1α(CSD)或突变HP1α(165E)的U2OS细胞中,PPP1R2基因表达(通过RT-qPCR测量)的比较图。只有野生型HP1α能够抑制PPP1R2基因表达。图74C显示了在+/-ABA条件下,在将PYL1-sfGFP-HP1α定位至Chr3:q29基因座的表达野生型HP1α(HP1α-WT)、突变HP1α(CSD)或突变HP1α(165E)的U2OS细胞中,ACAP2基因表达(通过RT-qPCR测量)的比较图。只有野生型HP1α能够抑制ACAP2基因表达。图74D显示了在+/-ABA条件下,在将PYL1-sfGFP-HP1α定位至Chr3:q29基因座的表达野生型HP1α(HP1α-WT)、突变HP1α(CSD)或突变HP1α(165E)的U2OS细胞中,TFRC基因表达(通过RT-qPCR测量)的比较图。只有野生型HP1α能够抑制TFRC基因表达。将用非靶向sgRNA(sgNT)转染的细胞用作对照。数据表示为平均值±SD。据报道,HP1α(CSD)能够抑制近端基因并局部沉积H3K9me3标志物。这些结果表明,全长HP1α对Chr3q29的所观察到的抑制利用了与先前报道的HP1α(CSD)机制不同的机制。
为了了解HP1α(I165E)和HP1α(CSD)突变体的异染色质特性与全长野生型蛋白质有何不同,检查了它们募集游离漂浮的mCherry-HP1α的能力。虽然HP1α(CSD)仍然能够将mCherry-HP1α募集到合成的HP1α焦点,但HP1α(I165E)突变体失去了这种能力。图75显示了二聚化而不是克罗莫结构域(chromodomain)的损失消除了合成的HP1α焦点处的游离HP1α(箭头)。图75A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了将游离漂浮的mCherry-HP1α(第三图)募集至由PYL1-sfGFP-HP1α(CSD)(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点(箭头)。线和斑点线性追踪被用于确认如通过在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处选择性富集mCherry-HP1α所见的mCherry-HP1α与合成的异染色质焦点共定位的相应的归一化的线性荧光图谱(曲线图)所示的共定位分析。图75B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了没有将游离漂浮的mCherry-HP1α(第三图)募集至由PYL1-sfGFP-HP1α(I165E)(第二图)和ABI-BFP-dCas9(第一图)形成的合成异染色质焦点(箭头),以及mCherry-HP1α与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-HP1α和ABI-BFP-dCas9的峰处没有mCherry-HP1α的选择性富集(曲线图)。这表明HP1α产生远端基因抑制的机制依赖于它的同源二聚化和/或随后与二聚化色影界面处的PxVxL基序转录因子的相互作用。
虽然HP1α(CSD)突变体仍然能够将游离漂浮的HP1α募集到合成的HP1α焦点,但去除N-末端和克罗莫结构域会损害其定位到天然异染色质位点的能力(使用mCherry-HP1α亚核定位作为代理)。图76显示了克罗莫结构域的损失损害正常的HP1α核分布。图76A显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了如通过mCherry-HP1α荧光所见的正常HP1α核分布(中间图),如通过PYL1-sfGFP-HP1α(CSD)所见的受损HP1α核分布(左图),以及mCherry-HP1α和PYL1-sfGFP-HP1α(CSD)信号的相应的归一化的线性荧光图谱(曲线图),其显示了PYL1-sfGFP-HP1α(CSD)的降低的动态范围。图76B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了通过mCherry-HP1α荧光所见的正常HP1α核分布(中间图),通过PYL1-sfGFP-HP1α(WT)荧光所见的正常HP1α核分布(左图),以及mCherry-HP1α和PYL1-sfGFP-HP1α(WT)信号的相应的归一化的线性荧光图谱(曲线图),其显示了PYL1-sfGFP-HP1α(WT)的等效动态范围。这些结果表明完整的N-末端和/或克罗莫结构域对于全长HP1α的远端基因抑制作用很重要。
实施例35:KRAB作为异染色质形成的可替代方法
为了确定来自合成HP1α的不完整异染色质标志物是否是由于将另外的蛋白质结构域融合到其N-末端而导致的HP1α功能受损,测试了间接募集未受阻碍的内源性HP1α的能力。在这种可替代策略中,诱导型系统中的HP1α被CRISPR干扰(CRISPRi)常用的KRAB域替代。KRAB充当共抑制支架蛋白KAP1的募集信号,KAP1反过来募集内源性HP1α(Ecco等人,Development 2017)。
可替代的KRAB异染色质系统也证明了将游离漂浮的HP1α募集到合成的异染色质焦点的能力,尽管其水平似乎低于原始合成HP1α系统的水平。免疫荧光分析显示了HP1α定位在KRAB束缚的焦点处微弱富集。图77显示了HP1α定位在KRAB束缚的焦点处微弱地富集。图77A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了将游离漂浮的mCherry-HP1α(第三图,顶部)募集至由PYL1-sfGFP-KRAB(第二图,顶部)和ABI-BFP-dCas9(第一图,顶部)显示的合成异染色质焦点(箭头)。用于线性追踪的线和斑点被用于mCherry-HP1α与合成的异染色质斑点共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处mCherry-HP1α的选择性富集。图77B显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了将游离漂浮的mCherry-HP1α(第三图,底部)募集至通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(第一图,底部)显示的合成异染色质焦点(箭头)。用于线性追踪的线和斑点被用于mCherry-HP1α与合成的异染色质斑点共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处mCherry-HP1α的选择性富集(曲线图)。
与原始合成的HP1α系统不同,KRAB系统在合成的异染色质焦点处富含KAP1。图78显示了KRAB将KAP1募集至合成的焦点。在100μM的ABA处理2天后,用KAP1第一抗体和AlexaFluor647第二抗体对细胞进行免疫染色。图78A显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了针对KAP1(第三图,顶部)进行免疫染色的细胞以及通过PYL1-sfGFP-KRAB(中间图,顶部)和ABI-BFP-dCas9(左图,顶部)所示的合成的异染色质焦点(箭头)。线和斑点追踪被用于KAP1与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处的KAP1选择性富集(顶部曲线图)。图78B显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了用KAP1(第三图,底部)进行免疫染色的细胞以及通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(第一图,底部)所示的合成的异染色质焦点(箭头)。线和斑点追踪被用于KAP1与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处的KAP1选择性富集所示的(曲线图,底部)。
尽管将HP1a和KAP1都募集到合成焦点,但KRAB仍然无法增加Chr3q29靶位点处的H3K9me3丰度。图79显示了基于KRAB的焦点对于H3K9me3富集仍然不足。在100μM的ABA处理2天后,用KAP1第一抗体和AlexaFluor647第二抗体对细胞进行免疫染色。图79A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了针对H3K9me3(第三图,顶部)进行免疫染色的细胞、通过PYL1-sfGFP-KRAB(第二图,顶部)和ABI-BFP-dCas9(右图,顶部)所示的合成的异染色质焦点(箭头)。线和斑点追踪被用于H3K9me3与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有H3K9me3的选择性富集所示的(曲线图,顶部)。图79B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了用H3K9me3(第三图,底部)进行免疫染色的细胞和通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(左图,底部)所示的合成的异染色质焦点(箭头)。线和斑点追踪被用于H3K9me3与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有H3K9me3的选择性富集(曲线图,底部)。
类似地,通过H2B-mCherry荧光测量的局部染色质/组蛋白密度,以及通过SiR-DNA染色强度测量的DNA密度,在基于KRAB的合成焦点处增加。图80A显示了在ABA处理后2天拍摄的代表性荧光图像,其显示了在通过PYL1-sfGFP-KRAB(第二图,顶部)和ABI-BFP-dCas9(第一图,顶部)所示的合成的异染色质焦点(箭头)处的如通过mCherry-H2B(第三图,顶部)荧光信号测量的组蛋白密度。线和斑点追踪被用于在合成的异染色质斑点处的mCherry-H2B信号的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有mCherry-H2B的选择性富集(曲线图,顶部)。图80B显示了在ABA处理后2天拍摄的代表性荧光图像,其代表了如通过PYL1-sfGFP-KRAB(第二图,底部)和ABI-BFP-dCas9(左图,底部)所示的合成的异染色质焦点(箭头)处的如通过SiR-DNA染色(第三图,底部)测量的DNA密度。线和斑点追踪被用于在合成的异染色质斑点处的siR-DNA信号的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处没有siR-DNA的选择性富集(曲线图,底部)。
图81显示了KRAB不能在Chr3q29处重现HP1α抑制。100μM的ABA处理5天后的RT-qPCR显示,虽然KRAB抑制了ACAP2,但PPP1R2和TFRC仍然不受其募集到Chr3q29串联重复靶位点的影响。图81A显示了在U2OS细胞中通过将PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB募集至Chr3:q29基因座的sgRNA靶位点的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb,并且TFRC位于sgRNA靶位点下游约575kb。图81B显示了在+/-ABA条件下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中PPP1R2基因表达(通过RT-qPCR测量的)与Chr3:q29基因座的比较图。图81C显示了在+/-ABA条件下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中ACAP2基因表达(通过RT-qPCR测量的)与Chr3:q29基因座的比较图。图81D显示了在+/-ABA条件下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中TFRC基因表达(通过RT-qPCR测量的)与Chr3:q29基因座的比较图。用非靶向sgRNA(sgNT)转染的细胞被用作对照。数据表示为平均值±SD。
KRAB和HP1α系统也在Chr1p36的可替代基因组环境中进行了测试。该靶位点包含串联重复区域的36个拷贝,与侧翼基因更接近。最近基因DVL1的转录起始位点距离串联重复位点0.9kb。在该位点,ABA处理5天后的RT-qPCR显示KRAB能够强烈抑制DVL1表达,但对远端基因INTS11和CPTP没有显著抑制。另一方面,HP1α完全没有抑制这三个基因中的任何一个。图82显示了KRAB而不是HP1α抑制Chr1p36重复处的近端。图82A显示了在U2OS细胞中通过将PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB募集至Chr1:p36基因座处的sgRNA靶位点的CRISPR-GO系统的示意图。CPTP位于sgRNA靶位点上游~25kb,INTS11位于sgRNA靶位点上游~26kb,DVL1位于sgRNA靶位点上游约0.9kb。图82B显示了在+/-ABA条件下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中DVL1基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。图82C显示了在+/-ABA条件下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中CPTP基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。图82D显示了在+/-ABA条件下表达PYL1-sfGFP-HP1α或PYL1-sfGFP-KRAB的U2OS细胞中INTS11基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。用非靶向sgRNA(sgNT)转染的细胞被用作对照。数据表示为平均值±SD。
当KRAB和HP1α都被募集到同一位点时,Chr1p36靶位点处的基因表达受到影响。图83显示了HP1α和KRAB对Chr1p36的基因抑制具有拮抗作用。在本实验中,表达ABI-BFP-dCas9和sgChr1p36、共表达PYL1-sfGFP-HP1α和PYL1-mCherry-KRAB单独或组合的U2OS细胞用100μM的ABA处理5天,然后在Chr1p36处进行基因表达通过RT-qPCR(sgChrlp36:GCGACGGGGGGAGTGAGGAG(SEQ ID NO:38);靶PAM序列:GGG(SEQ ID NO:39))定量。为了进一步支持KRAB和HP1α通过不同机制进行抑制,当KRAB和HP1α都被募集Chr1p36联重复位点时,KRAB对DVL1的抑制作用被稀释,可能是因为一半的串联重复位点是由惰性HP1α而不是KRAB占据的。图83A显示了在U2OS细胞中将PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者募集至Chr1:p36基因座处的sgRNA靶位点的示意图。CPTP位于sgRNA靶位点上游~25kb,INTS11位于sgRNA靶位点上游~26kb,并且DVL1位于sgRNA靶位点上游约0.9kb。图83B显示了在+/-ABA条件下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的DVL1基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。图83C显示了在+/-ABA条件下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的CPTP基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。图83D显示了在+/-ABA条件下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的INTS11基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。数据表示为平均值±SD。
同样,当对Chr3q29测试位点进行相同的实验时,当KRAB共同募集串联重复位点时,单独对HP1α观察到的远端基因抑制作用被稀释。图84显示了HP1α和KRAB在Chr3q29处对基因抑制具有拮抗作用。图84A显示了在U2OS细胞中通过将PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者募集至Chr3:q29基因座处的sgRNA靶位点的CRISPR-GO系统的示意图。ACAP2位于sgRNA靶位点上游~35kb,PPP1R2位于sgRNA靶位点下游~36kb,并且TFRC位于sgRNA靶位点下游约575kb。图84B显示了在+/-ABA条件下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的PPP1R2基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。图84C显示了在+/-ABA条件下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的ACAP2基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。图84D显示了在+/-ABA条件下,表达PYL1-sfGFP-HP1α、PYL1-sfGFP-KRAB或两者的U2OS细胞中的TFRC基因表达(通过RT-qPCR测量的)与Chr1:p36基因座的比较图。数据表示为平均值±SD。
实施例36:组蛋白甲基转移酶直接写入H3K9me3标志物
为了更好地理解为什么用合成的HP1a或基于KRAB的异染色质都没有观察到H3K9me3富集,诱导型系统中的效应物被SUV39H1(一种酶促沉积H3K9me3标志物的人组蛋白甲基转移酶)替代。如果该基因座适合H3K9me3并且共聚焦显微镜具有足够的分辨能力,则当SUV39H1被募集到Chr3q29位点时,预计会观察到H3K9me3的富集。
图85显示了H3K9me3通过SUV39H1(全长)被沉积在焦点的子集。ABA处理两天后,其中SUV39H1被募集到Chr3q29位点的U2OS细胞显示出合成斑点的子集,其中H3K9me3被选择性地富集图85显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(第三图,顶部和底部)进行免疫染色的细胞,所述H3K9me3定位于由PYL1-mCherry-SUV39H1(第二图,顶部和底部)和ABI-BFP-dCas9(第一图,顶部和底部)形成的合成的异染色质焦点。这些结果证实,被测试的基因座确实能够接受H3K9me3修饰,并且可以通过显微镜观察到这种变化。线和斑点追踪被用于H3K9me3与合成的异染色质斑点的共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-sfGFP-KRAB和ABI-BFP-dCas9的峰处H3K9me3的选择性富集所示的(曲线图,顶部和底部)。这些结果证实,被测试的基因座确实能够接受H3K9me3修饰,并且可以通过显微镜观察到这种变化。
还测试了另外的组蛋白甲基转移酶变体。与全长SUV39H1不同,SUV3H1的催化域变体,其中蛋白质的前76个氨基酸(包含HP1相互作用域和克罗莫结构域)被移除,并且未能在Chr3q29靶位点沉积H3K9me3标志物。图86显示了H3K9me3通过SUV39H1(Δ1-76)未被沉积在焦点处。图86显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(右图,顶部和底部)进行免疫染色的细胞和由PYL1-mCherry-SUV39H1(Δ1-76)(中间图,顶部和底部)和ABI-BFP-dCas9(左图,顶部和底部)形成的合成的异染色质焦点。该结果表明SUV39H1的甲基转移酶活性取决于其与HP1家族蛋白的相互作用。
还测试了第二种人组蛋白甲基转移酶G9a。虽然G9a直接催化H3K9me1和H3K9me2的沉积,但它在某个基因组处的存在与H3K9me3的增加有关,这可能是通过间接机制,诸如产生H3K9me2底物以促进对H3K9me3的进一步修饰或通过与SUV39H1形成复合物。当全长G9a与诱导型系统融合并募集到Chr3q29时,没有观察到H3K9me3的富集。图87显示了H3K9me3未被沉积在G9a(全长)。图87显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(右图,顶部和底部)进行免疫染色的细胞和由PYL1-mCherry-G9a(全长)(中间图,顶部和底部)和ABI-BFP-dCas9(左图,顶部和底部)形成的合成的异染色质焦点。
最后,单独测试G9a的催化结构域,其中前829个氨基酸被删除。该变体先前已在体外显示出保留酶活性。然而,去除G9a的前829个氨基酸导致融合蛋白定位于细胞质而不是细胞核,这可能是由于去除了G9a内的天然核定位序列。图88显示了G9a(催化结构域;G9aΔ1-829)定位于细胞质。图88显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用H3K9me3(右图)进行免疫染色的细胞,所述H3K9me3(右图)定位于由PYL1-mCherry-G9aΔ1-829(左图)形成的合成异染色质焦点。
尽管在Chr3q29靶基因座处富集了H3K9me3标志物,但如通过免疫染色测定的,全长SUV39H1蛋白的募集并未在靶基因座处明显富集内源性HP1α。图89显示了SUV39H1(全长)没有明显富集HP1α。图89显示了在ABA处理后2天拍摄的代表性荧光图像,其描绘了用HP1α(第三图,顶部和底部)进行免疫染色的细胞和由PYL1-mCherry-SUV39H1(第二图,顶部和底部)和ABI-BFP-dCas9(第一图,顶部和底部)形成的合成的异染色质焦点。线和斑点追踪被用于HP1α与合成的异染色质斑点共定位的相应的归一化的线性荧光图谱,其显示了在PYL1-mCherry-SUV39H1和ABI-BFP-dCas9的峰处没有HP1α的选择性富集(曲线图,顶部和底部)。
参考文献
Ballister,E.R.,Aonbangkhen,C.,Mayo,A.M.,Lampson,M.A.,and Chenoweth,D.M.(2014).Localized light-induced protein dimerization in living cells usinga photocaged dimerizer.Nat Commun 5,5475.
Barrangou,R.,Fremaux,C.,Deveau,H.,Richards,M.,Boyaval,P.,Moineau,S.,Romero,D.A.,and Horvath,P.(2007).CRISPR provides acquired resistance againstviruses in prokaryotes.Science 315,1709-1712.
Benson,G.(1999).Tandem repeats finder:a program to analyze DNAsequences.Nucleic Acids Res 27,573-580.
Berk,J.M.,Tifft,K.E.,and Wilson,K.L.(2013).The nuclear envelope LEM-domain protein emerin.Nucleus 4,298-314.
Bernardi,R.,and Pandolfi,P.P.(2003).Role of PML and the PML-nuclearbody in the control of programmed cell death.Oncogene 22,9048-9057.
Bickmore,W.A.(2013).The spatial organization of the human genome.AnnuRev Genomics Hum Genet 14,67-84.
Bonev,B.,and Cavalli,G.(2016).Organization and function of the 3Dgenome.Nat Rev Genet 17,772.
Chen,B.,Gilbert,L.A.,Cimini,B.A.,Schnitzbauer,J.,Zhang,W.,Li,G.W.,Park,J.,Blackburn,E.H.,Weissman,J.S.,Qi,L.S.,et al.(2013).Dynamic imaging ofgenomic loci in living human cells by an optimized CRISPR/Cas system.Cell155,1479-1491.
Cheutin,T.,McNairn,A.J.,Jenuwein,T.,Gilbert,D.M.,Singh,P.B.,andMisteli,T.(2003).Maintenance of stable heterochromatin domains by dynamicHP1binding.Science 299,721-725.
Clowney,E.J.,LeGros,M.A.,Mosley,C.P.,Clowney,F.G.,Markenskoff-Papadimitriou,E.C.,Myllys,M.,Barnea,G.,Larabell,C.A.,and Lomvardas,S.(2012).Nuclear aggregation of olfactory receptor genes governs their monogenicexpression.Cell 151,724-737.
Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,et al.(2013).Multiplex genome engineering usingCRISPR/Cas systems.Science 339,819-823.
Crabbe,L.,Cesare,A.J.,Kasuboski,J.M.,Fitzpatrick,J.A.,and Karlseder,J.(2012).Human telomeres are tethered to the nuclear envelope duringpostmitotic nuclear assembly.Cell Rep 2,1521-1529.
Cristofari,G.,Adolf,E.,Reichenbach,P.,Sikora,K.,Terns,R.M.,Terns,M.P.,and Lingner,J.(2007).Human telomerase RNA accumulation in Cajal bodiesfacilitates telomerase recruitment to telomeres and telomere elongation.MolCell 27,882-889.
de Koning,A.P.,Gu,W.,Castoe,T.A.,Batzer,M.A.,and Pollock,D.D.(2011).Repetitive elements may comprise over two-thirds of the human genome.PLoSGenet 7,e1002384.
Dekker,J.,Marti-Renom,M.A.,and Mirny,L.A.(2013).Exploring the three-dimensional organization of genomes:interpreting chromatin interactiondata.Nat Rev Genet 14,390-403.
Dekker,J.,Rippe,K.,Dekker,M.,and Kleckner,N.(2002).Capturingchromosome conformation.Science 295,1306-1311.
Denker,A.,and de Laat,W.(2016).The second decade of 3C technologies:detailed insights into nuclear organization.Genes Dev 30,1357-1382.
Finlan,L.E.,Sproul,D.,Thomson,I.,Boyle,S.,Kerr,E.,Perry,P.,Ylstra,B.,Chubb,J.R.,and Bickmore,W.A.(2008).Recruitment to the nuclear periphery canalter expression of genes in human cells.PLoS Genet 4,e1000039.
Gall,J.G.(2000).Cajal bodies:the first 100 years.Annu Rev Cell DevBiol 16,273-300.
Gao,Y.,Xiong,X.,Wong,S.,Charles,E.J.,Lim,W.A.,and Qi,L.S.(2016).Complex transcriptional modulation with orthogonal and inducible dCas9regulators.Nat Methods 13,1043-1049.
Gilbert,L.A.,Horlbeck,M.A.,Adamson,B.,Villalta,J.E.,Chen,Y.,Whitehead,E.H.,Guimaraes,C.,Panning,B.,Ploegh,H.L.,Bassik,M.C.,et al.(2014).Genome-Scale CRISPR-Mediated Control of Gene Repression and Activation.Cell159,647-661.
Grimm,J.B.,English,B.P.,Chen,J.,Slaughter,J.P.,Zhang,Z.,Revyakin,A.,Patel,R.,Macklin,J.J.,Normanno,D.,Singer,R.H.,et al.(2015).A general methodto improve fluorophores for live-cell and single-molecule microscopy.NatMethods12,244-250,243 p following 250.
Guan,J.,Liu,H.,Shi,X.,Feng,S.,and Huang,B.(2017).Tracking MultipleGenomic Elements Using Correlative CRISPR Imaging and Sequential DNAFISH.Biophys J 112,1077-1084.
Hilton,LB.,D'Ippolito,A.M.,Vockley,C.M.,Thakore,P.I.,Crawford,G.E.,Reddy,T.E.,and Gersbach,C.A.(2015).Epigenome editing by a CRISPR-Cas9-basedacetyltransferase activates genes from promoters and enhancers.Nat Biotechnol33,510-517.
Jady,B.E.,Richard,P.,Bertrand,E.,and Kiss,T.(2006).Cell cycle-dependent recruitment of telomerase RNA and Cajal bodies to humantelomeres.Mol Biol Cell 17,944954.
Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,andCharpentier,E.(2012).A programmable dual-RNA-guided DNA endonuclease inadaptive bacterial immunity.Science 337,816-821.
Jinek,M.,East,A.,Cheng,A.,Lin,S.,Ma,E.,and Doudna,J.(2013).RNA-programmed genome editing in human cells.Elife 2,e00471.
Kaiser,T.E.,Intine,R.V.,and Dundr,M.(2008).De novo formation of asubnuclear body.Science 322,1713-1717.
Kearns,N.A.,Pham,H.,Tabak,B.,Genga,R.M.,Silverstein,N.J.,Garber,M.,and Maehr,R.(2015).Functional annotation of native enhancers with a Cas9-histone demethylase fusion.Nat Methods 12,401-403.
Knight,S.C.,Xie,L.,Deng,W.,Guglielmi,B.,Witkowsky,L.B.,Bosanac,L.,Zhang,E.T.,El Beheiry,M.,Masson,J.B.,Dahan,M.,et al.(2015).Dynamics ofCRISPR-Cas9 genome interrogation in living cells.Science 350,823-826.
Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.,and Liu,D.R.(2016).Programmable editing of a target base in genomic DNA without double-strandedDNA cleavage.Nature 533,420-424.
Kosak,S.T.,Skok,J.A.,Medina,K.L.,Riblet,R.,Le Beau,M.M.,Fisher,A.G.,and Singh,H.(2002).Subnuclear compartmentalization of immunoglobulin lociduring lymphocyte development.Science 296,158-162.
Kumaran,R.I.,and Spector,D.L.(2008).A genetic locus targeted to thenuclear periphery in living cells maintains its transcriptional competence.JCell Biol180,51-65.
Langer-Safer,P.R.,Levine,M.,and Ward,D.C.(1982).Immunological methodfor mapping genes on Drosophila polytene chromosomes.Proc Natl Acad Sci U S A79,4381-4385.
Levine,M.,Cattoglio,C.,and Tjian,R.(2014).Looping back to leapforward:transcription enters a new era.Cell 157,13-25.
Liang,F.S.,Ho,W.Q.,and Crabtree,G.R.(2011).Engineering the ABA plantstress pathway for regulation of induced proximity.Sci Signal 4,rs2.
Ma,H.,Tu,L.C.,Naseri,A.,Huisman,M.,Zhang,S.,Grunwald,D.,and Pederson,T.(2016).Multiplexed labeling of genomic loci with dCas9 and engineeredsgRNAs using CRISPRainbow.Nat Biotechnol 34,528-530.
Machyna,M.,Neugebauer,K.M.,and Stanek,D.(2015).Coilin:The first25years.RNA Biol 12,590-596.
Mali,P.,Yang,L.,Esvelt,K.M.,Aach,J.,Guell,M.,DiCarlo,J.E.,Norville,J.E.,and Church,G.M.(2013).RNA-guided human genome engineering viaCas9.Science 339,823-826.
Mao,Y.S.,Zhang,B.,and Spector,D.L.(2011).Biogenesis and function ofnuclear bodies.Trends Genet 27,295-306.
Morgan,S.L.,Mariano,N.C.,Bermudez,A.,Arruda,N.L.,Wu,F.,Luo,Y.,Shankar,G.,Jia,L.,Chen,H.,Hu,J.F.,et al.(2017).Manipulation of nucleararchitecture through CRISPR-mediated chromosomal looping.Nat Commun 8,15993.
Neugebauer,K.M.(2017).Special focus on the Cajal Body.RNA Biol 14,669-670.
Qi,L.S.,Larson,M.H.,Gilbert,L.A.,Doudna,J.A.,Weissman,J.S.,Arkin,A.P.,and Lim,W.A.(2013).Repurposing CRISPR as an RNA-guided platform forsequence-specific control of gene expression.Cell 152,1173-1183.
Reddy,K.L.,Zullo,J.M.,Bertolino,E.,and Singh,H.(2008).Transcriptionalrepression mediated by repositioning of genes to the nuclear lamina.Nature452,243-247.
Schmitt,A.D.,Hu,M.,and Ren,B.(2016).Genome-wide mapping and analysisof chromosome architecture.Nat Rev Mol Cell Biol 17,743-755.
Schreer,A.,Tinson,C.,Sherry,J.P.,and Schirmer,K.(2005).Application ofAlamar blue/5-carboxyfluorescein diacetate acetoxymethyl ester as anoninvasive cell viability assay in primary hepatocytes from rainbowtrout.Anal Biochem 344,76-85.
Shachar,S.,Voss,T.C.,Pegoraro,G.,Sciascia,N.,and Misteli,T.(2015).Identification of Gene Positioning Factors Using High-Throughput ImagingMapping.Cell 162,911-923.
Shevtsov,S.P.,and Dundr,M.(2011).Nucleation of nuclear bodies byRNA.Nat Cell Biol 13,167-173.
Schindelin,J.,Arganda-Carreras,I.,Frise,E.,Kaynig,V.,Longair,M.,Pietzsch,T.,Preibisch,S.,Rueden,C.,Saalfeld,S.,Schmid,B.,et al.(2012).Fiji:anopen-source platform for biological-image analysis.Nat Methods 9,676-682.
Smogorzewska,A.,and de Lange,T.(2002).Different telomere damagesignaling pathways in human and mouse cells.EMBO J 21,4338-4348.
Smoyer,C.J.,and Jaspersen,S.L.(2014).Breaking down the wall:thenuclear envelope during mitosis.Curr Opin Cell Biol 26,1-9.
Takei,Y.,Shah,S.,Harvey,S.,Qi,L.S.,and Cai,L.(2017).MultiplexedDynamic Imaging of Genomic Loci by Combined CRISPR Imaging and DNA SequentialFISH.Biophys J 112,1773-1776.
Tanenbaum,M.E.,Gilbert,L.A.,Qi,L.S.,Weissman,J.S.,and Vale,R.D.(2014).A protein-tagging system for signal amplification in gene expressionand fluorescence imaging.Cell 159,635-646.
Tinevez,J.Y.,Perry,N.,Schindelin,J.,Hoopes,G.M.,Reynolds,G.D.,Laplantine,E.,Bednarek,S.Y.,Shorte,S.L.,and Eliceiri,K.W.(2017).TrackMate:Anopen and extensible platform for single-particle tracking.Methods 115,80-90.
Tsuchiya,Y.,Hase,A.,Ogawa,M.,Yorifuji,H.,and Arahata,K.(1999).Distinct regions specify the nuclear membrane targeting of emerin,theresponsible protein for Emery-Dreifuss muscular dystrophy.Eur J Biochem 259,859-865.
van Steensel,B.,and Belmont,A.S.(2017).Lamina-Associated Domains:Links with Chromosome Architecture,Heterochromatin,and GeneRepression.Cell169,780-791.
Vernier,M.,Bourdeau,V.,Gaumont-Leclerc,M.F.,Moiseeva,0.,Begin,V.,Saad,F.,Mes-Masson,A.M.,and Ferbeyre,G.(2011).Regulation of E2Fs andsenescence by PML nuclear bodies.Genes Dev 25,41-50.
Wang,Q.,Sawyer,I.A.,Sung,M.H.,Sturgill,D.,Shevtsov,S.P.,Pegoraro,G.,Hakim,0.,Baek,S.,Hager,G.L.,and Dundr,M.(2016).Cajal bodies are linked togenome conformation.Nat Commun 7,10966.
Williams,R.R.,Azuara,V.,Perry,P.,Sauer,S.,Dvorkina,M.,Jorgensen,H.,Roix,J.,McQueen,P.,Misteli,T.,Merkenschlager,M.,et al.(2006).Neural inductionpromotes large-scale chromatin reorganisation of the Mashl locus.J Cell Sci119,132-140.
Yu,M.,and Ren,B.(2017).The Three-Dimensional Organization ofMammalian Genomes.Annu Rev Cell Dev Biol 33,265-289.
Zhu,L.,and Brangwynne,C.P.(2015).Nuclear bodies:the emergingbiophysics of nucleoplasmic phases.Curr Opin Cell Biol 34,23-30.
Zuleger,N.,Kelly,D.A.,Richardson,A.C.,Kerr,A.R.,Goldberg,M.W.,Goryachev,A.B.,and Schirmer,E.C.(2011).System analysis shows distinctmechanisms and common principles of nuclear envelope protein dynamics.J CellBiol193,109-123.
Zullo,J.M.,Demarco,I.A.,Pique-Regi,R.,Gaffney,D.J.,Epstein,C.B.,Spooner,C.J.,Luperchio,T.R.,Bernstein,B.E.,Pritchard,J.K.,Reddy,K.L.,et al.(2012).DNA sequence-dependent compartmentalization and silencing of chromatinat the nuclear lamina.Cell 149,1474-1487.
Claims (163)
1.组合物,其包含:
a)与第一二聚化结构域连接的隔室组成蛋白;和
b)与支架连接的致动器部分,其中所述支架与第二二聚化结构域连接;并且其中所述第一二聚化结构域与所述第二二聚化结构域结合。
2.如权利要求1所述的组合物,其中所述支架与至少1、2、3、4、5、6、7、8、9、10或更多个第二二聚化结构域连接。
3.如权利要求1或2所述的组合物,其中所述隔室组成蛋白与第二支架连接,其中所述隔室组成蛋白与所述第二支架连接,并且所述第二支架与至少一个第二二聚化结构域连接。
4.如权利要求1-3所述的组合物,其中所述第二支架与1、2、3、4、5、6、7、8、9、10或更多个第一二聚化结构域连接。
5.如权利要求1-4中任一项所述的组合物,其中所述支架或第二支架是重复肽阵列。
6.如权利要求1-4中任一项所述的组合物,其中所述支架或第二支架是SpyTag、SunTag、分裂sfGFP、MoonTag、SnoopTag、分裂sfCherry2或mNeonGreen2蛋白支架。
7.如权利要求1-6中任一项所述的组合物,其还包含配体,其中所述第一二聚化结构域与所述第二二聚化结构域的结合在所述配体的存在下发生。
8.如权利要求1-6中任一项所述的组合物,其中所述组合物调节靶多核苷酸的表达。
9.如权利要求8所述的组合物,其中所述组合物增加所述靶多核苷酸的表达。
10.如权利要求8所述的组合物,其中所述组合物降低所述靶多核苷酸的表达。
11.如权利要求1-7中任一项所述的组合物,其中所述组合物调节另外的多核苷酸的表达。
12.如权利要求1-7中任一项所述的组合物,其中所述组合物增加另外的多核苷酸的表达。
13.如权利要求1-7中任一项所述的组合物,其中所述组合物降低另外的多核苷酸的表达。
14.如权利要求11-13中任一项所述的组合物,其中所述另外的多核苷酸是所述靶多核苷酸的远端基因。
15.如权利要求11-14中任一项所述的组合物,其中所述另外的多核苷酸是所述靶多核苷酸的近端基因。
16.如权利要求1-15中任一项所述的组合物,其中复合物的三维结构调节基因或基因的调节元件。
17.如权利要求16所述的组合物,其中所述调节元件是增强子或启动子。
18.如权利要求16或17所述的组合物,其中所述三维结构形成三维环、染色体边界、拓扑相关结构域或基因簇。
19.如权利要求18所述的组合物,其中所述三维环在增强子与启动子之间形成。
20.如权利要求8-19中任一项所述的组合物,其中所述组合物隔离靶多核苷酸。
21.如权利要求20所述的组合物,其中所述组合物通过分离所述靶多核苷酸来隔离所述靶多核苷酸用于染色体保护或操作。
22.如权利要求8-21中任一项所述的组合物,其中所述组合物将靶多核苷酸捕获在隔室的空间区域中。
23.如权利要求22所述的组合物,其中所述隔室的空间区域操纵所述靶多核苷酸或所述另外的多核苷酸的命运或功能。
24.如权利要求23所述的组合物,其中所述隔室的空间区域促进或防止重组或诱变,促进或抑制基因表达、剪接或翻译,促进或抑制多核苷酸转运或移动。
25.如权利要求1-24中任一项所述的组合物,其中所述组合物在所述靶多核苷酸处引入表观遗传修饰。
26.如权利要求25任一项所述的组合物,其中所述表观遗传修饰是DNA甲基化、DNA脱甲基化、组蛋白甲基化、组蛋白脱甲基化、乙酰化、脱乙酰化、磷酸化、脱磷酸化、泛素化、GlcNAcylation、瓜氨酸化、krotonization、异构化或它们的任意组合。
27.如权利要求1-26中任一项所述的组合物,其中所述组合物修复DNA断裂。
28.如权利要求27所述的组合物,其中所述组合物通过引入外源DNA来修复DNA断裂。
29.如权利要求28所述的组合物,其中所述组合物通过引入重组、非同源性末端连接或同源性定向修复来修复DNA断裂。
30.如权利要求1-29中任一项所述的组合物,其中所述组合物创建人工聚集体,其中所述人工聚集体包含蛋白质、RNA、DNA或它们的组合。
31.如权利要求30所述的组合物,其中所述人工聚集体蛋白、RNA、DNA或它们的组合由所述隔室组成蛋白募集。
32.如权利要求1-31中任一项所述的组合物,其中所述靶多核苷酸是基因组DNA。
33.如权利要求1-31中任一项所述的组合物,其中所述靶多核苷酸是编码基因的多核苷酸。
34.如权利要求1-31中任一项所述的组合物,其中所述靶多核苷酸是非编码多核苷酸。
35.如权利要求1-31中任一项所述的组合物,其中所述靶多核苷酸是基因组DNA的串联重复区。
36.如权利要求1-31中任一项所述的组合物,其中所述靶多核苷酸是RNA。
37.如权利要求1-36中任一项所述的组合物,其中所述隔室是Cajal小体。
38.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白包含来自Cajal小体的蛋白。
39.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白包括coilin、SMN、Gemin 3、SmD1、SmE或它们的组合。
40.如权利要求1-36中任一项所述所述的组合物,其中所述隔室是核小点。
41.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白是来自核小点的蛋白。
42.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白包括SC35。
43.如权利要求1-36中任一项所述所述的组合物,其中所述隔室是PML小体。
44.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白是来自PML小体的蛋白。
45.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白包括PML、SP100或它们的组合。
46.如权利要求1-36中任一项所述的组合物,其中所述隔室是细胞溶质隔室。
47.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白是来自细胞溶质隔室的蛋白。
48.如权利要求1-36中任一项所述所述的组合物,其中所述隔室是合成的细胞相。
49.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白是来自合成细胞相的蛋白。
50.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白包括:Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、如Exo1或OsExo1的核酸外切酶、ATM、BRCA2、RAD54或MDC1。
51.如权利要求1-36中任一项所述的组合物,其中所述合成的细胞相促进同源性定向修复。
52.如权利要求1-36中任一项所述的组合物,其中所述隔室是核异染色质。
53.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白是来自核异染色质的蛋白。
54.如权利要求1-36中任一项所述的组合物,其中所述隔室组成蛋白包括:HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。
55.如权利要求1-54中任一项所述的组合物,其中所述隔室组成蛋白还包括寡聚化结构域。
56.如权利要求1-55中任一项所述的组合物,其中所述隔室组成蛋白还与荧光蛋白连接。
57.如权利要求1-56中任一项所述的组合物,其中所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白。
58.如权利要求1-57中任一项所述的组合物,其中所述致动器部分包含Cas蛋白,并且其中所述系统还包含:
(c)与所述致动器部分复合并与所述靶多核苷酸杂交的导向RNA。
59.如权利要求1-58中任一项述的组合物,其中所述致动器部分包含与与所述靶多核苷酸杂交的导向RNA复合的RNA结合蛋白,并且其中所述组合物还包含:
(c)与所述导向RNA复合的Cas蛋白。
60.如权利要求58或59中任一项所述的组合物,其中所述Cas蛋白实质上缺乏DNA切割活性。
61.如权利要求58-60中任一项所述的组合物,其中所述Cas蛋白是Cas9蛋白、Cas12蛋白、Cas13蛋白、CasX蛋白或CasY蛋白。
62.如权利要求61所述的组合物,其中所述Cas12蛋白选自:Cas12a、Cas12b、Cas12c、Cas12d和Cas12e。
63.如权利要求1-57中任一项所述的组合物,其中所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白,其中所述结合蛋白是锌指核酸酶或TALE核酸酶。
64.如权利要求1-57中任一项所述的组合物,其中所述致动器部分包含与导向多核苷酸复合的Argonaute蛋白,其中所述导向多核苷酸是导向RNA或导向DNA,并且其中所述导向多核苷酸与所述靶多核苷酸杂交。
65.如权利要求1-64中任一项所述的组合物,其中所述致动器部分还与荧光蛋白连接。
66.如权利要求1-65中任一项所述的组合物,其中所述第一二聚化结构域在配体存在下与所述第二二聚化结构域结合。
67.如权利要求1-66中任一项所述的组合物,其中所述第一二聚化结构域与所述配体结合,并且所述配体与所述第二二聚化结构域结合以组装二聚体。
68.如权利要求1-67中任一项所述的组合物,其中所述配体是化学诱导型的配体。
69.如权利要求1-68中任一项所述所述的组合物,其中所述配体是脱落酸。
70.如权利要求67-69中任一项所述的组合物,其中所述二聚体是诱导型和可逆型的二聚体。
71.如权利要求67-70中任一项所述的组合物,其中所述二聚体是异二聚体。
72.如权利要求67-70中任一项所述的组合物,其中所述二聚体是同型二聚体。
73.如权利要求1-72中任一项所述的组合物,其中所述第一二聚化结构域是ABI结构域。
74.如权利要求1-72或73中任一项所述的组合物,其中所述第二二聚化结构域是PYL1结构域。
75.如权利要求1-73中任一项所述的组合物,其中所述第一二聚化结构域是PYL1结构域。
76.如权利要求1-73或75中任一项所述的组合物,其中所述第二二聚化结构域是ABI结构域。
77.如权利要求1-76中任一项所述的组合物,其中与所述第一二聚化结构域连接的所述隔室组成蛋白是融合蛋白。
78.如权利要求1-77中任一项所述的组合物,其中与所述第二二聚化结构域连接的所述致动器部分是融合蛋白。
79.如权利要求1-76或77中任一项所述的组合物,其中所述隔室组成蛋白通过连接子与所述第一二聚化结构域连接。
80.如权利要求1至79中任一项所述所述的组合物,其中所述致动器部分通过连接子与所述第二二聚化结构域连接。
81.形成围绕靶多核苷酸隔室的方法,所述方法包括:
(a)提供与第一二聚化结构域连接的隔室组成蛋白;
(b)提供与第二二聚化结构域连接的致动器部分,其中所述致动器部分和所述靶多核苷酸形成复合物;和
(c)组装包含所述复合物的所述第一二聚化结构域和所述第二二聚化结构域的二聚体,从而形成围绕所述靶多核苷酸的所述隔室。
82.如权利要求81所述的方法,其还包括在步骤(c)之前提供配体,其中所述配体将所述第一二聚化结构域与所述第二二聚化结构域结合以组装所述步骤(c)的二聚体。
83.如权利要求81或82任一项所述的方法,其还包括在围绕所述靶多核苷酸形成所述隔室之后调节所述靶多核苷酸的表达。
84.如权利要求83所述的方法,其还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后增加所述靶多核苷酸的表达。
85.如权利要求83所述的方法,其还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后降低所述靶多核苷酸的表达。
86.如权利要求81-85中任一项所述的方法,其还包括在围绕所述靶多核苷酸形成所述隔室之后调节另外的多核苷酸的表达。
87.如权利要求81-85中任一项所述的方法,其还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后增加另外的多核苷酸的表达。
88.如权利要求81-85中任一项所述的方法,其还包括与在围绕所述靶多核苷酸形成所述隔室之前相比,在围绕所述靶多核苷酸形成所述隔室之后降低另外的多核苷酸的表达。
89.如权利要求86-88中任一项所述的方法,其中所述另外的多核苷酸是所述靶多核苷酸的远端基因。
90.如权利要求86-89中任一项所述的方法,其中所述另外的多核苷酸是所述靶多核苷酸的近端基因。
91.如权利要求81-90中任一项所述的方法,其中所述复合物的三维结构调节基因或基因的调节元件。
92.如权利要求91所述的方法,其中所述调节元件是增强子或启动子。
93.如权利要求91或92所述的方法,其中所述三维结构形成三维环、染色体边界、拓扑相关结构域或基因簇。
94.如权利要求93所述的方法,其中所述三维环在增强子与启动子之间形成。
95.如权利要求81-94中任一项所述的方法,其还包括隔离靶多核苷酸。
96.如权利要求95所述的方法,其中所述隔离包括分离所述靶多核苷酸用于染色体保护或操作。
97.如权利要求81-96中任一项所述的方法,其还包括将靶多核苷酸捕获在隔室的空间区域中。
98.如权利要求97所述的方法,其还包括操纵所述空间区域或隔室中所述靶多核苷酸或所述另外的多核苷酸的命运或功能。
99.如权利要求97所述的方法,其中隔室的所述空间区域促进或防止重组或诱变,促进或抑制基因表达、剪接或翻译,促进或抑制多核苷酸转运或移动。
100.如权利要求81-99中任一项所述的方法,其还包括在围绕所述靶多核苷酸形成所述隔室之后,在所述靶多核苷酸处引入表观遗传修饰。
101.如权利要求100所述的方法,其中所述表观遗传修饰是DNA甲基化、DNA脱甲基化、组蛋白甲基化、组蛋白脱甲基化、乙酰化、脱乙酰化、磷酸化、脱磷酸化、泛素化、GlcNAcylation、瓜氨酸化、krotonization、异构化或它们的任意组合。
102.如权利要求81-101中任一项所述的方法,其还包括修复DNA断裂。
103.如权利要求102所述的方法,其中所述修复包括引入外源DNA。
104.如权利要求103所述的方法,其中所述引入包括重组、非同源性末端连接或同源性定向修复。
105.如权利要求81-104中任一项所述的方法,其中围绕所述靶多核苷酸形成所述隔室还包括创建人工聚集体,其中所述人工聚集体包含蛋白质、RNA、DNA或它们的组合。
106.如权利要求105所述的方法,其中所述人工聚集体蛋白、RNA、DNA或它们的组合由所述隔室组成蛋白募集。
107.如权利要求81-106中任一项所述的方法,其中所述靶多核苷酸是基因组DNA。
108.如权利要求81-106中任一项所述的方法,其中所述靶多核苷酸是编码基因的多核苷酸。
109.如权利要求81-106中任一项所述的方法,其中所述靶多核苷酸是非编码多核苷酸。
110.如权利要求81-106中任一项所述的方法,其中所述靶多核苷酸是基因组DNA的串联重复区。
111.如权利要求81-106中任一项所述的方法,其中所述靶多核苷酸是RNA。
112.如权利要求81-111中任一项所述的方法,其中所述隔室是Cajal小体。
113.如权利要求1-111中任一项所述的方法,其中所述隔室组成蛋白包括来自Cajal小体的蛋白。
114.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白包括coilin、SMN、Gemin 3、SmD1、SmE或它们的组合。
115.如权利要求81-111中任一项所述的方法,其中所述隔室是核小点。
116.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白是来自核小点的蛋白。
117.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白包括SC35。
118.如权利要求81-111中任一项所述的方法,其中所述隔室是PML小体。
119.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白是来自PML小体的蛋白。
120.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白包括PML、SP100或它们的组合。
121.如权利要求81-111中任一项所述的方法,其中所述隔室是细胞溶质隔室。
122.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白是来自细胞溶质隔室的蛋白。
123.如权利要求81-111中任一项所述的方法,其中所述隔室是合成的细胞相。
124.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白是来自合成细胞相的蛋白。
125.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白包括:Rad51、Rad52、RPA、MRN复合物、MRX复合物、CtlP、Sae2、BLM、Sgs1、BRCA2、如Exo1或OsExo1的核酸外切酶、ATM、BRCA2、RAD54或MDC1。
126.如权利要求81-111中任一项所述的方法,其中所述合成的细胞相促进同源性定向修复。
127.如权利要求81-111中任一项所述的方法,其中所述隔室是核异染色质。
128.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白是来自核异染色质的蛋白。
129.如权利要求81-111中任一项所述的方法,其中所述隔室组成蛋白包括:HP1α、HP1β、KAP1、KRAB、SUV39H1或G9a。
130.如权利要求81-129中任一项所述的方法,其中所述隔室组成蛋白还包括寡聚化结构域。
131.如权利要求81-130中任一项所述的方法,其中所述隔室组成蛋白还与荧光蛋白连接。
132.如权利要求81-131中任一项所述的方法,其中所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白。
133.如权利要求81-132中任一项所述的方法,其中所述致动器部分包含Cas蛋白,并且其中所述系统还包含:
(c)与所述致动器部分复合并与所述靶多核苷酸杂交的导向RNA。
134.如权利要求81-133中任一项所述的方法,其中所述致动器部分包含与与所述靶多核苷酸杂交的导向RNA复合的RNA结合蛋白,并且其中所述系统还包含:
(c)与所述导向RNA复合的Cas蛋白。
135.如权利要求133或134中任一项所述的方法,其中所述Cas蛋白实质上缺乏DNA切割活性。
136.如权利要求133-135中任一项所述的方法,其中所述Cas蛋白是Cas9蛋白、Cas12蛋白、Cas13蛋白、CasX蛋白或CasY蛋白。
137.如权利要求136所述的方法,其中所述Cas12蛋白选自Cas12a、Cas12b、Cas12c、Cas12d和Cas12e。
138.如权利要求81-132中任一项所述的方法,其中所述致动器部分包含与所述靶多核苷酸杂交的结合蛋白,其中所述结合蛋白是锌指核酸酶或TALE核酸酶。
139.如权利要求81-132中任一项所述的方法,其中所述致动器部分包含与导向多核苷酸复合的Argonaute蛋白,其中所述导向多核苷酸是导向RNA或导向DNA,并且其中所述导向多核苷酸与所述靶多核苷酸杂交。
140.如权利要求81-139中任一项所述的方法,其中所述致动器部分还与荧光蛋白连接。
141.如权利要求81-140中任一项所述的方法,其中所述致动器部分还与支架连接,其中所述致动器与所述支架连接,并且所述支架与至少一个第二二聚化结构域连接。
142.如权利要求81至141中任一项所述的方法,其中所述致动器部分还与支架连接,其中所述致动器与所述支架连接,并且所述支架与2、3、4、5、6、7、8、9、10或更多个第二二聚化结构域连接。
143.如权利要求141或142所述的方法,其中所述支架是重复肽阵列。
144.如权利要求141或142所述的方法,其中所述支架是SpyTag、SunTag、分裂sfGFP、MoonTag、SnoopTag、分裂sfCherry2或mNeonGreen2蛋白支架。
145.如权利要求81-144中任一项所述的方法,其中所述组装在配体存在下发生。
146.如权利要求81-145中任一项所述的方法,其中所述第一二聚化结构域与所述配体结合,并且所述配体与所述第二二聚化结构域结合以组装所述二聚体。
147.如权利要求81-146中任一项所述的方法,其中所述配体是化学诱导型的配体。
148.如权利要求81-147中任一项所述所述的方法,其中所述配体是脱落酸。
149.如权利要求81-148中任一项所述的方法,其中所述组装是诱导型和可逆型的组装。
150.如权利要求81-149中任一项所述的方法,其中所述二聚体是异二聚体。
151.如权利要求81-149中任一项所述的方法,其中所述二聚体是同型二聚体。
152.如权利要求81-150中任一项所述的方法,其中所述第一二聚化结构域是ABI结构域。
153.如权利要求81-150或152中任一项所述的方法,其中所述第二二聚化结构域是PYL1结构域。
154.如权利要求81-150中任一项所述的方法,其中所述第一二聚化结构域是PYL1结构域。
155.如权利要求81-150或154中任一项所述的方法,其中所述第二二聚化结构域是ABI结构域。
156.如权利要求81-155中任一项所述的方法,其中与所述第一二聚化结构域连接的所述隔室组成蛋白是融合蛋白。
157.如权利要求81-156中任一项所述的方法,其中与所述第二二聚化结构域连接的所述致动器部分是融合蛋白。
158.如权利要求81-155或157中任一项所述的方法,其中所述隔室组成蛋白通过连接子与所述第一二聚化结构域连接。
159.如权利要求81-156或158中任一项所述的方法,其中所述致动器部分通过连接子与所述第二二聚化结构域连接。
160.通过施用权利要求1-80中任一项所述的组合物来治疗有需要的对象的疾病的方法。
161.如权利要求160所述的方法,其中所述疾病是蛋白质错误折叠疾病。
162.如权利要求161所述的方法,其中所述疾病选自:阿尔茨海默病(AD)、帕金森病(PD)、多系统萎缩、亨廷顿病(HD)、朊病毒病、肌萎缩性侧索硬化(ALS)和额颞痴呆(FTD)。
163.系统,其包含权利要求1-80中任一项所述的组合物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862744504P | 2018-10-11 | 2018-10-11 | |
US62/744,504 | 2018-10-11 | ||
PCT/US2019/055976 WO2020077293A1 (en) | 2018-10-11 | 2019-10-11 | Systems and methods for compartment spatial organization |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113195004A true CN113195004A (zh) | 2021-07-30 |
Family
ID=70164988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980081914.6A Pending CN113195004A (zh) | 2018-10-11 | 2019-10-11 | 用于隔室空间组织的系统和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220056097A1 (zh) |
EP (1) | EP3863683A4 (zh) |
JP (1) | JP2022512660A (zh) |
CN (1) | CN113195004A (zh) |
WO (1) | WO2020077293A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114085918A (zh) * | 2021-12-16 | 2022-02-25 | 重庆医科大学 | 一种RPA-CRISPR/Cas12a-FQ系统及其在环境水体生物检测中的应用 |
CN114369561A (zh) * | 2022-01-11 | 2022-04-19 | 江南大学 | 调控CapBCA单体表达水平的菌株及在聚谷氨酸生产的应用 |
WO2023179781A1 (zh) * | 2022-03-25 | 2023-09-28 | 中山大学 | 用于治疗病毒感染的方法和药物组合物 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105899657A (zh) * | 2013-12-12 | 2016-08-24 | 布罗德研究所有限公司 | 用于改变基因产物表达的crispr-cas系统和方法、结构信息以及诱导型模块化cas酶 |
US20180002682A1 (en) * | 2015-01-12 | 2018-01-04 | The Regents Of The University Of California | Heterodimeric cas9 and methods of use thereof |
-
2019
- 2019-10-11 EP EP19870335.7A patent/EP3863683A4/en not_active Withdrawn
- 2019-10-11 CN CN201980081914.6A patent/CN113195004A/zh active Pending
- 2019-10-11 JP JP2021519750A patent/JP2022512660A/ja active Pending
- 2019-10-11 WO PCT/US2019/055976 patent/WO2020077293A1/en unknown
-
2021
- 2021-04-05 US US17/222,851 patent/US20220056097A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105899657A (zh) * | 2013-12-12 | 2016-08-24 | 布罗德研究所有限公司 | 用于改变基因产物表达的crispr-cas系统和方法、结构信息以及诱导型模块化cas酶 |
US20180002682A1 (en) * | 2015-01-12 | 2018-01-04 | The Regents Of The University Of California | Heterodimeric cas9 and methods of use thereof |
Non-Patent Citations (2)
Title |
---|
LUCAS F RIBEIRO等: "Protein Engineering Strategies to Expand CRISPR-Cas9 Applications", INT J GENOMICS, vol. 10 * |
XIAOSHU XU等: "A CRISPR-dCas Toolbox for Genetic Engineering and Synthetic Biology", J MOL BIOL, vol. 431, no. 01, pages 34 - 47, XP085564888, DOI: 10.1016/j.jmb.2018.06.037 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114085918A (zh) * | 2021-12-16 | 2022-02-25 | 重庆医科大学 | 一种RPA-CRISPR/Cas12a-FQ系统及其在环境水体生物检测中的应用 |
CN114085918B (zh) * | 2021-12-16 | 2023-10-24 | 重庆医科大学 | 一种RPA-CRISPR/Cas12a-FQ系统及其在环境水体生物检测中的应用 |
CN114369561A (zh) * | 2022-01-11 | 2022-04-19 | 江南大学 | 调控CapBCA单体表达水平的菌株及在聚谷氨酸生产的应用 |
WO2023179781A1 (zh) * | 2022-03-25 | 2023-09-28 | 中山大学 | 用于治疗病毒感染的方法和药物组合物 |
Also Published As
Publication number | Publication date |
---|---|
EP3863683A4 (en) | 2022-08-24 |
WO2020077293A1 (en) | 2020-04-16 |
US20220056097A1 (en) | 2022-02-24 |
EP3863683A1 (en) | 2021-08-18 |
JP2022512660A (ja) | 2022-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220056097A1 (en) | Systems and methods for compartment spatial organization | |
US20220002753A1 (en) | Systems and methods for polynucleotide spatial organization | |
US20240247286A1 (en) | Methods for improved homologous recombination and compositions thereof | |
KR102458395B1 (ko) | 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선 | |
WO2019210268A2 (en) | Sequencing-based proteomics | |
KR20170124601A (ko) | 3-성분 crispr/cas 복합체 시스템 및 그 용도 | |
IL271197B2 (en) | Use of protein domains interacting with the nucleosome to enhance targeted genome modification | |
JP2021505180A (ja) | 真核ゲノム修飾のための操作されたCas9システム | |
WO2006008539A1 (en) | Cell cycle markers | |
Nora et al. | Targeted degradation of CTCF decouples local insulation of chromosome domains from higher-order genomic compartmentalization | |
Hagen et al. | The domed architecture of Giardias ventral disc is necessary for attachment and host pathogenesis | |
US20190300911A1 (en) | Methods for increasing the frequency of gene targeting by chromatin modification | |
Fernandez | The implication of histone H2A phosphorylation in chromatin mobility, organization and repair after double strand break | |
Friman | The role of OCT4 and SOX2 in regulating chromatin accessibility and cell fate across the cell cycle in embryonic stem cells | |
Solvie | Molecular Mechanisms of MYC as Stress Resilience Factor | |
Shyian | On Start and Pause of Replication Fork | |
Zhang | Towards Understanding the Mechanism of Wolbachia-Induced Cytoplasmic Incompatibility | |
US20210189485A1 (en) | Sequence detection systems | |
Miller | Mechanisms of Size Control in Pipid Frogs | |
Borsos | Molecular mapping of nuclear organization in the mouse preimplantation embryo | |
Guardamagna | A new functional in vitro cell-free assay to evaluate DNA repair mechanisms | |
Nora et al. | Let us know how access to this document benefits you. | |
Rhodes | A microscopic study of cohesin | |
Karg | Investigation of the epigenetic protein landscape using proteomics-based strategies | |
Godfrey | Cell Cycle Regulation by Phosphatases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210730 |