CN109072233A - 可扩展的重组酶级联 - Google Patents
可扩展的重组酶级联 Download PDFInfo
- Publication number
- CN109072233A CN109072233A CN201780026091.8A CN201780026091A CN109072233A CN 109072233 A CN109072233 A CN 109072233A CN 201780026091 A CN201780026091 A CN 201780026091A CN 109072233 A CN109072233 A CN 109072233A
- Authority
- CN
- China
- Prior art keywords
- recombinase
- cell
- gene
- box
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010091086 Recombinases Proteins 0.000 title claims description 247
- 102000018120 Recombinases Human genes 0.000 title claims description 247
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 223
- 230000002068 genetic effect Effects 0.000 claims abstract description 156
- 230000014509 gene expression Effects 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 23
- 210000004027 cell Anatomy 0.000 claims description 158
- 150000007523 nucleic acids Chemical class 0.000 claims description 101
- 239000000411 inducer Substances 0.000 claims description 98
- 102000039446 nucleic acids Human genes 0.000 claims description 82
- 108020004707 nucleic acids Proteins 0.000 claims description 82
- 102000004190 Enzymes Human genes 0.000 claims description 77
- 108090000790 Enzymes Proteins 0.000 claims description 77
- 108020005004 Guide RNA Proteins 0.000 claims description 61
- 230000006798 recombination Effects 0.000 claims description 59
- 238000005215 recombination Methods 0.000 claims description 59
- 230000006698 induction Effects 0.000 claims description 53
- 108091033409 CRISPR Proteins 0.000 claims description 36
- 229930191978 Gibberellin Natural products 0.000 claims description 25
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 claims description 25
- 239000003448 gibberellin Substances 0.000 claims description 25
- 230000002255 enzymatic effect Effects 0.000 claims description 19
- 239000003446 ligand Substances 0.000 claims description 16
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 16
- 102000004169 proteins and genes Human genes 0.000 claims description 16
- 108090000994 Catalytic RNA Proteins 0.000 claims description 15
- 102000053642 Catalytic RNA Human genes 0.000 claims description 15
- 108091092562 ribozyme Proteins 0.000 claims description 15
- 229920002477 rna polymer Polymers 0.000 claims description 15
- 239000002679 microRNA Substances 0.000 claims description 14
- 210000000130 stem cell Anatomy 0.000 claims description 14
- 239000002253 acid Substances 0.000 claims description 13
- 150000003384 small molecules Chemical class 0.000 claims description 12
- 108091070501 miRNA Proteins 0.000 claims description 11
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 10
- 239000004055 small Interfering RNA Substances 0.000 claims description 10
- 238000003776 cleavage reaction Methods 0.000 claims description 9
- 230000007017 scission Effects 0.000 claims description 9
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 claims description 8
- 102000057593 human F8 Human genes 0.000 claims description 8
- 229940047431 recombinate Drugs 0.000 claims description 8
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 7
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 230000003115 biocidal effect Effects 0.000 claims description 7
- 239000005556 hormone Substances 0.000 claims description 7
- 229940088597 hormone Drugs 0.000 claims description 7
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 7
- IEDVJHCEMCRBQM-UHFFFAOYSA-N trimethoprim Chemical compound COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 IEDVJHCEMCRBQM-UHFFFAOYSA-N 0.000 claims description 6
- 229960001082 trimethoprim Drugs 0.000 claims description 6
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- NMFHJNAPXOMSRX-PUPDPRJKSA-N [(1r)-3-(3,4-dimethoxyphenyl)-1-[3-(2-morpholin-4-ylethoxy)phenyl]propyl] (2s)-1-[(2s)-2-(3,4,5-trimethoxyphenyl)butanoyl]piperidine-2-carboxylate Chemical compound C([C@@H](OC(=O)[C@@H]1CCCCN1C(=O)[C@@H](CC)C=1C=C(OC)C(OC)=C(OC)C=1)C=1C=C(OCCN2CCOCC2)C=CC=1)CC1=CC=C(OC)C(OC)=C1 NMFHJNAPXOMSRX-PUPDPRJKSA-N 0.000 claims description 5
- 235000003869 genetically modified organism Nutrition 0.000 claims description 5
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 claims description 4
- 230000002538 fungal effect Effects 0.000 claims description 4
- 210000005253 yeast cell Anatomy 0.000 claims description 4
- JLIDBLDQVAYHNE-LXGGSRJLSA-N 2-cis-abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\C1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-LXGGSRJLSA-N 0.000 claims description 3
- 241000238631 Hexapoda Species 0.000 claims description 3
- 210000002894 multi-fate stem cell Anatomy 0.000 claims description 3
- 210000001671 embryonic stem cell Anatomy 0.000 claims description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims 1
- 239000002773 nucleotide Substances 0.000 description 72
- 125000003729 nucleotide group Chemical group 0.000 description 72
- 230000027455 binding Effects 0.000 description 35
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 28
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 26
- 230000000694 effects Effects 0.000 description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 description 25
- 210000004899 c-terminal region Anatomy 0.000 description 22
- 230000004913 activation Effects 0.000 description 19
- 102100031780 Endonuclease Human genes 0.000 description 16
- 108010042407 Endonucleases Proteins 0.000 description 16
- 102000040945 Transcription factor Human genes 0.000 description 16
- 108091023040 Transcription factor Proteins 0.000 description 16
- 108091005948 blue fluorescent proteins Proteins 0.000 description 15
- 108020004999 messenger RNA Proteins 0.000 description 15
- 241000589516 Pseudomonas Species 0.000 description 14
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 14
- 230000035772 mutation Effects 0.000 description 14
- 230000024245 cell differentiation Effects 0.000 description 13
- 230000004927 fusion Effects 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- 239000002585 base Substances 0.000 description 10
- 238000010354 CRISPR gene editing Methods 0.000 description 9
- 101710163270 Nuclease Proteins 0.000 description 9
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 9
- 108010051219 Cre recombinase Proteins 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 108700011259 MicroRNAs Proteins 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 101100412102 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) rec2 gene Proteins 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- MURGITYSBWUQTI-UHFFFAOYSA-N fluorescin Chemical compound OC(=O)C1=CC=CC=C1C1C2=CC=C(O)C=C2OC2=CC(O)=CC=C21 MURGITYSBWUQTI-UHFFFAOYSA-N 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 239000013589 supplement Substances 0.000 description 6
- 241000193830 Bacillus <bacterium> Species 0.000 description 5
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 5
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 5
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 5
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000006471 dimerization reaction Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 206010060862 Prostate cancer Diseases 0.000 description 4
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 4
- 108010009460 RNA Polymerase II Proteins 0.000 description 4
- 102000009572 RNA Polymerase II Human genes 0.000 description 4
- 241000235070 Saccharomyces Species 0.000 description 4
- 108020005543 Satellite RNA Proteins 0.000 description 4
- 108091036066 Three prime untranslated region Proteins 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 102100030011 Endoribonuclease Human genes 0.000 description 3
- 108010093099 Endoribonucleases Proteins 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- 101100356020 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) recA gene Proteins 0.000 description 3
- 241000724709 Hepatitis delta virus Species 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000588650 Neisseria meningitidis Species 0.000 description 3
- 108091036407 Polyadenylation Proteins 0.000 description 3
- 241000187560 Saccharopolyspora Species 0.000 description 3
- 241000191967 Staphylococcus aureus Species 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 241000194020 Streptococcus thermophilus Species 0.000 description 3
- 241000218636 Thuja Species 0.000 description 3
- 241000589892 Treponema denticola Species 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000000151 deposition Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000002124 endocrine Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 230000000087 stabilizing effect Effects 0.000 description 3
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- 241000589220 Acetobacter Species 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 241000607534 Aeromonas Species 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 241001136561 Allomyces Species 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 241000723635 Arabis mosaic virus Species 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000186063 Arthrobacter Species 0.000 description 2
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000589151 Azotobacter Species 0.000 description 2
- 241001465180 Botrytis Species 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 241000722885 Brettanomyces Species 0.000 description 2
- 238000010446 CRISPR interference Methods 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 241000588881 Chromobacterium Species 0.000 description 2
- 244000298479 Cichorium intybus Species 0.000 description 2
- 235000007542 Cichorium intybus Nutrition 0.000 description 2
- 241000588923 Citrobacter Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 241000589519 Comamonas Species 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 241000235035 Debaryomyces Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241000589565 Flavobacterium Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 2
- 102000002464 Galactosidases Human genes 0.000 description 2
- 108010093031 Galactosidases Proteins 0.000 description 2
- 241000589236 Gluconobacter Species 0.000 description 2
- 208000037262 Hepatitis delta Diseases 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 108010061833 Integrases Proteins 0.000 description 2
- 206010069755 K-ras gene mutation Diseases 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000194036 Lactococcus Species 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- 101100042680 Mus musculus Slc7a1 gene Proteins 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 241000232299 Ralstonia Species 0.000 description 2
- 241000589180 Rhizobium Species 0.000 description 2
- 241000235527 Rhizopus Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- 241001135312 Sinorhizobium Species 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241000205091 Sulfolobus solfataricus Species 0.000 description 2
- 241000192584 Synechocystis Species 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 241000589596 Thermus Species 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000221566 Ustilago Species 0.000 description 2
- 241000589634 Xanthomonas Species 0.000 description 2
- 230000004721 adaptive immunity Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 210000001900 endoderm Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- -1 fluorescence Proteins 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- ZWMNTFJERFRROC-UHFFFAOYSA-N 2-benzyl-3-methoxypyridine Chemical compound COC1=CC=CN=C1CC1=CC=CC=C1 ZWMNTFJERFRROC-UHFFFAOYSA-N 0.000 description 1
- 241000266272 Acidithiobacillus Species 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- 241000588986 Alcaligenes Species 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- 108010013534 Auxilins Proteins 0.000 description 1
- 241000588807 Bordetella Species 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108010014419 Chemokine CXCL1 Proteins 0.000 description 1
- 102000016950 Chemokine CXCL1 Human genes 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 108010002700 Exoribonucleases Proteins 0.000 description 1
- 102000004678 Exoribonucleases Human genes 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 241001135750 Geobacter Species 0.000 description 1
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010080280 HP1 integrase Proteins 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 101710195517 Histone H2AX Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101001050886 Homo sapiens Lysine-specific histone demethylase 1A Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- 102100024985 Lysine-specific histone demethylase 1A Human genes 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001148170 Microlunatus Species 0.000 description 1
- 101100412856 Mus musculus Rhod gene Proteins 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100282746 Oryza sativa subsp. japonica GID1 gene Proteins 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 241000235652 Pachysolen Species 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 241000520272 Pantoea Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102100027913 Peptidyl-prolyl cis-trans isomerase FKBP1A Human genes 0.000 description 1
- 241001542817 Phaffia Species 0.000 description 1
- 241000081271 Phaffia rhodozyma Species 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 101710089165 Protein white Proteins 0.000 description 1
- 102100023922 Putative tyrosine-protein phosphatase auxilin Human genes 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101100156295 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VID30 gene Proteins 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 102220497176 Small vasohibin-binding protein_T47D_mutation Human genes 0.000 description 1
- 241000221948 Sordaria Species 0.000 description 1
- 244000188014 Spathodea campanulata Species 0.000 description 1
- 235000017899 Spathodea campanulata Nutrition 0.000 description 1
- 241000251131 Sphyrna Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000191963 Staphylococcus epidermidis Species 0.000 description 1
- 241000122971 Stenotrophomonas Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108010006877 Tacrolimus Binding Protein 1A Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 101100242191 Tetraodon nigroviridis rho gene Proteins 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- 241000723677 Tobacco ringspot virus Species 0.000 description 1
- 241001428638 Tobacco ringspot virus satellite RNA Species 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- 238000000184 acid digestion Methods 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 208000029664 classic familial adenomatous polyposis Diseases 0.000 description 1
- 230000037011 constitutive activity Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 108010079502 exoribonuclease T Proteins 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 210000005256 gram-negative cell Anatomy 0.000 description 1
- 210000005255 gram-positive cell Anatomy 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 208000029570 hepatitis D virus infection Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 210000000415 mammalian chromosome Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 210000003360 nephrocyte Anatomy 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 210000004493 neutrocyte Anatomy 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 230000010181 polygamy Effects 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 108020001775 protein parts Proteins 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000007398 protein translocation Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 102220278926 rs759871071 Human genes 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108091069025 single-strand RNA Proteins 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/635—Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Environmental Sciences (AREA)
- Analytical Chemistry (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文中提供了包含基因扰动盒的遗传构建体和使用其来评估基因表达之时机和顺序的方法。
Description
相关申请
本申请依据35U.S.C.§119(e)要求于2016年4月26日提交的美国临时申请号62/327,479的权益,其通过引用整体并入本文。
技术领域
本发明涉及用于依次、多重且可扩展的基因扰动(gentic perturbation)的方法和遗传构建体。
背景技术
由于有限数量的诱导型系统和诱导物分子,包含诱导型组件的常规遗传工具的复杂性受到限制。此外,这样的工具仅提供基因调节的有限视角,并且缺乏对基因调节的时空动态以及这如何转换为细胞中生物功能的理解。
发明概述
本发明的一些方面提供了包含多个基因扰动盒的遗传构建体,其中所述多个基因扰动盒包含:第一类型的基因扰动盒,其包含编码以下的第一核酸:重组酶活性由第一诱导物诱导的第一诱导型重组酶、第一基因元件、第一终止子,以及在第一重组酶、第一基因元件和第一终止子侧翼的第一对重组酶识别位点,其中第一重组酶能够在第一对重组识别位点的每个重组酶识别位点与第一核酸结合并对其进行切割;以及第二类型的基因扰动盒,其包含编码以下的第二核酸:重组酶活性由第二诱导物诱导的第二诱导型重组酶、第二基因元件、第二终止子,以及在第二重组酶、第二基因元件和第二终止子侧翼的第二对重组酶识别位点,其中第二重组酶能够在第二对重组识别位点的每个重组酶识别位点与第二核酸结合并对其进行切割。在一些实施方案中,所述多个基因扰动盒包含与一个或更多个第二类型的基因扰动盒交替的一个或更多个第一类型的基因扰动盒。
在一些实施方案中,遗传构建体还包含第三类型的基因扰动盒,其包含编码以下的第三核酸:重组酶活性由第三诱导物诱导的第三诱导型重组酶、第三基因元件、第三终止子,以及在第三重组酶、第三基因元件和第三终止子侧翼的第三对重组酶识别位点,其中第三重组酶能够在第三对重组识别位点的每个重组酶识别位点与第三核酸结合并对其进行切割。
在一些实施方案中,遗传构建体还包含位于第一类型的基因扰动盒上游的启动子。在一些实施方案中,启动子是细胞特异性启动子或细胞状态特异性启动子。
在一些实施方案中,编码第一基因元件的核酸位于编码第一诱导型重组酶的核酸的3’非翻译区内和/或编码第二基因元件的核酸位于编码第二诱导型重组酶的核酸的3’非翻译区内。在一些实施方案中,编码第一基因元件的核酸位于编码第一诱导型重组酶的核酸的内含子内和/或编码第二基因元件的核酸位于编码第二诱导型重组酶的核酸的内含子内。在一些实施方案中,基因元件是编码蛋白质的核酸、RNA、gRNA、miRNA或shRNA。
在一些实施方案中,第一诱导型重组酶和/或第二诱导型重组酶是酪氨酸重组酶。在一些实施方案中,第一诱导型重组酶和/或第二诱导型重组酶是丝氨酸重组酶。在一些实施方案中,第一诱导型重组酶和/或第二诱导型重组酶是断裂重组酶(splitrecombinase)。在一些实施方案中,断裂重组酶包含该断裂重组酶的第一部分和第二部分。
在一些实施方案中,多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核酶序列。在一些实施方案中,多个基因扰动盒中的每个基因扰动盒包含一个或更多个核酶序列。在一些实施方案中,多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核糖核酸酶识别序列。在一些实施方案中,多个基因扰动盒中的每个基因扰动盒包含一个或更多个核糖核酸酶识别序列。在一些实施方案中,所述一个或更多个核糖核酸酶识别序列是Cas6/Csy4识别序列。
在一些实施方案中,多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个自切割肽序列。在一些实施方案中,所述一个或更多个自切割肽序列是P2A序列。
在一些实施方案中,任何诱导物是小分子诱导物。在一些实施方案中,小分子诱导物是激素。在一些实施方案中,激素是赤霉素(gibberellin,GIB)或脱落酸(abscisicacid,ABA)。在一些实施方案中,小分子诱导物是抗生素。在一些实施方案中,抗生素是甲氧苄啶(trimethoprim)。在一些实施方案中,小分子诱导物是合成配体。在一些实施方案中,合成配体是4-羟基他莫昔芬或Shield-1配体。
本发明的一些方面提供了包含本文中所述的任何遗传构建体的载体。本发明的另一些方面提供了重组细胞,其包含本文中所述的任何遗传构建体或含有本文中所述的任何遗传构建体的载体。在一些实施方案中,重组细胞还包含Cas6/Csy4核糖核酸酶。在一些实施方案中,重组细胞还包含Cas9内切核酸酶。
在一些实施方案中,重组细胞是细菌细胞、真菌细胞、酵母细胞、昆虫细胞、植物细胞、动物细胞或人细胞。在一些实施方案中,重组细胞是干细胞。在一些实施方案中,干细胞是胚胎干细胞或诱导多能干细胞(induced pluripotent stem cell,iPS)。
本文中还提供了包含本文中所述的任何重组细胞的转基因生物。在一些实施方案中,转基因生物是转基因非人生物。
本发明的另一些方面提供了用于评估细胞中基因表达的方法,其包括:(i)向细胞提供包含多个基因扰动盒的遗传构建体,其中所述多个基因扰动盒包含:(a)第一类型的基因扰动盒,其包含编码以下的核酸:重组酶活性由第一诱导物诱导的第一诱导型重组酶、第一基因元件、第一终止子,以及在第一重组酶、第一基因元件和第一终止子侧翼的第一对重组酶识别位点,其中第一重组酶能够在第一对重组识别位点的每个重组酶识别位点与第一核酸结合并对其进行切割;以及(b)第二类型的基因扰动盒,其包含编码以下的第二核酸:重组酶活性由第二诱导物诱导的第二诱导型重组酶、第二基因元件、第二终止子,以及在第二重组酶、第二基因元件和第二终止子侧翼的第二对重组酶识别位点,其中第二重组酶能够在第二对重组识别位点的每个重组酶识别位点与第二核酸结合并对其进行切割;(ii)在其中第一基因扰动盒被表达并且基因元件从核酸上切割的条件下孵育(i)的细胞;以及(iii)评估基因元件的一个或更多个靶标的输出。
在一些实施方案中,多个基因扰动盒还包含第三类型的基因扰动盒,其包含编码以下的第三核酸:重组酶活性由第三诱导物诱导的第三诱导型重组酶、第三基因元件、第三终止子,以及在第三重组酶、第三基因元件和第三终止子侧翼的第三对重组酶识别位点,其中第三重组酶能够在第三对重组识别位点的每个重组酶识别位点与第三核酸结合并对其进行切割。
在一些实施方案中,第一、第二和/或第三基因元件的一个或更多个靶标的输出包括评估所述一个或更多个靶标的表达。
参照本发明的附图和详细描述,本发明的这些及其他方面及其多个实施方案将变得更加明显。
本发明的每项限制可涵盖本发明的多个实施方案。因此,预期涉及任意一个元件或元件组合的本发明的每项限制可被包括在本发明的每个方面中。本发明的应用不限于以下描述中阐述的或附图中举例说明的组件的构造和布置的细节。本发明能够具有其他实施方案并且能够以多种方式实施或进行。
附图简述
附图不旨在按比例绘制。为清楚起见,并非每个组件在每个附图中都会标记。在附图中:
图1A至1C示出了用于依次、多重且可扩展的原位基因扰动的示例性在时空上受调节的级联的示意图。图1A示出了在时空上受调节的级联,其包括细胞类型特异性启动子(P特异性)和三个基因扰动盒(Genetic Perturbation Cassette,GPC),每个基因扰动盒由以下组成:诱导型重组酶(rec)、当与CRISPR-Cas转录因子一起使用时可以以多重方式调节下游靶标的gRNA、以及转录终止子(Term),其所有都侧接在同源重组酶识别位点(R1)之间。重组酶1(Rec1)(包括gRNA1在内)在P特异性的控制之下表达。诱导物1激活Recl活性,其使用相应的重组酶位点(R1,由括号示出)自切除第一GPC。图1B示出了重组酶2(Rec2)(包括gRNA2在内)的表达。gRNA2使用CRISPR-Cas转录因子调节下游靶标。诱导物2激活Rec2活性,其使用相应的重组酶位点(R2,由三角形示出)自切除第二GPC。图1C示出了重组酶3(Rec3)(包括gRNA3在内)的表达。gRNA3使用CRISPR-Cas转录因子调节下游靶标。诱导物1激活Rec3活性,其使用相应的重组酶位点(R3,由箭头示出)自切除第三GPC。
图2示出了使用断裂重组酶的一个示例性盒的示意图。与诱导物赤霉素(GIB)或脱落酸(ABA)的结合结构域和报道子荧光蛋白(mCherry)融合的重组酶的N端片段和C端片段(断裂-N(Split-N)和断裂-C(Split-C))以重组酶的识别序列(由三角形标示)为侧翼。诱导物(GIB或ABA)的添加诱导断裂重组酶盒的二聚化和激活以切除基因扰动盒并且触发下游基因(BFP)的表达。
图3A和3B示出了包含断裂重组酶的基因扰动盒在细胞培养中的使用的验证。将293T细胞用指定的断裂重组酶盒瞬时转染并用载剂(乙醇,EtOH)或诱导物(GIB或ABA)处理。由通过流式细胞术检测的BFP表达(y轴)来评估重组酶介导的盒切除。图3A示出了用载剂或药物处理之后96小时的代表性流式细胞术图。图3B示出了图3A中分析的样品的切除效率的定量图。按照(%BFP阳性)/(%BFP或mCherry阳性)计算切除效率。
图4A和4B示出了本文中所述的可扩展重组酶级联用于建立肿瘤发生模型的示例性用途。图4A示出了由正常上皮通过APC、KRS、p53和Smad4的依次突变发生结直肠癌的示意图(改编自Walther等Nat.Rev.Cancer.(2009)9(7):489-99)。图4B示出了包括四个基因扰动盒的可扩展重组酶级联的示意图。第一基因扰动盒编码重组酶(recl)和导致APC突变的gRNA,其以该重组酶的识别序列(由括号标示)为侧翼。第二基因扰动盒编码重组酶(rec2),其以该重组酶的识别序列(由三角形标示)为侧翼。第三基因扰动盒编码重组酶(rec3)和导致Smad4突变的gRNA,其以该重组酶的识别序列(由箭头标示)为侧翼。第四基因扰动盒编码重组酶(rec4)和导致p53突变的gRNA,其以该重组酶的识别序列(由半圆标示)为侧翼。
图5A和5B示出了本文中所述的可扩展重组酶级联用于使祖细胞(progenitorcell)分化成特定细胞类型的示例性用途。图5A示出了细胞分化的示意图,其包括该过程涉及的转录因子的子集(改编自Pagliuca和Melton,Development(2013)140(12):2472-83)。图5B示出了包括四个基因扰动盒的可扩展重组酶级联的示意图。第一基因扰动盒编码重组酶(rec1)和导致细胞分化成定形内胚层的gRNA,其以该重组酶的识别序列(由括号标示)为侧翼。第二基因扰动盒编码重组酶(rec2)和导致细胞分化成胰腺内胚层的gRNA,其以该重组酶的识别序列(由三角形标示)为侧翼。第三基因扰动盒编码重组酶(rec3)和导致细胞分化成内分泌祖细胞的gRNA,其以该重组酶的识别序列(由箭头标示)为侧翼。第四基因扰动盒编码重组酶(rec4)和导致细胞分化成胰腺β细胞的gRNA,其以该重组酶的识别序列(由半圆标示)为侧翼。
发明详述
常规的重组表达工具允许并行地可诱导控制多个基因,例如使用CRISPR-Cas转录因子,并且允许在特定组织中或在限定时间诱导遗传改变,例如使用重组酶系统如Cre-LoxP系统。可相对于彼此正交地使用的诱导型系统的有限可用性限制了可在单个细胞中实现的基因扰动的时间复杂性。本文中提供了包含一系列基因扰动盒的合成遗传构建体,其用于多组内源基因的可扩展、依次且可控的扰动。基因扰动构建体(例如本文中所述的那些)可用于评价基因表达的时空调节,例如时空基因表达如何影响发生和/或疾病进展,例如在癌症模型、代谢疾病和神经退行性疾病中。
本文中所述的遗传构建体的设计允许在诱导至少两种不同重组酶的两种不同诱导物之间切换(交替),提供了诱导广泛多个依次且组合的基因程序的潜力。本文中所述的遗传构建体包含至少两种类型的基因扰动盒,每种基因扰动盒包含重组酶、基因元件、终止子和一对重组酶识别位点。这样的遗传构建体允许细胞中多组基因的依次的且受调节的扰动控制,使诱导物的数量最小化(例如,仅使用两种诱导物)。此外,在每个基因扰动盒的3’末端存在终止子序列允许一次表达一种重组酶并且可用于被诱导物激活。如本文中所述,重组酶的激活导致与重组酶识别位点对结合,切除相应的基因扰动盒,使DNA主链重组,从而使下一个基因扰动盒表达。
本公开内容的一些方面涉及遗传构建体、包含遗传构建体的载体、编码遗传构建体的重组细胞和使用所述遗传构建体的方法。如本文中所用,“遗传构建体”是指一个或更多个包含两个或更多个基因扰动盒的DNA元件。术语“基因扰动盒”(GPC)是指包含诱导型重组酶、基因元件、终止子和一对重组酶识别位点的核酸序列。遗传构建体还可编码在第一基因扰动盒上游的允许以依次方式表达基因扰动盒的启动子。本文中所述的遗传构建体允许通过交替遗传构建体中基因扰动盒的类型的顺序在两种诱导物之间切换(交替)。例如,如图1A中所示,遗传构建体的第一GPC(最5′GPC)可以是由第一诱导物(诱导物1)诱导的第一类型的GPC;接着是第二GPC,其是第二类型的GPC并且由第二诱导物(诱导物2)诱导;然后是第三GPC,其是第一类型的GPC并且由第一诱导物(诱导物1)诱导。在一些实施方案中,第一诱导物可用于激活重组酶1、3、5等,而第二诱导物可用于激活重组酶2、4、6等。在一些实施方案中,遗传构建体包含至少2、3、4、5、6、7、8、9、10个或更多个基因扰动盒。
在一些实施方案中,本文中所述的任何遗传构建体可包含第三类型的基因扰动盒,其包含诱导型重组酶、基因元件、终止子和重组酶识别位点对。在一些实施方案中,第三类型的基因扰动盒的重组酶由不同于第一和第二诱导物的诱导物诱导。
本公开内容的一些方面提供了诱导型重组酶,其当激活时从遗传构建体切除其相应的基因扰动盒。介导其自身切除的这样的重组酶或编码这样的重组酶的盒可被称为自杀型重组酶或自杀型盒。
如本文中所用,“诱导型重组酶”是指具有可诱导的重组酶活性(即,能够催化双链DNA的重组)的蛋白质。术语“诱导物”是指触发或诱导重组酶的激活的分子或信号。在一些实施方案中,重组酶活性的诱导物是小分子的存在和/或结合。在一些实施方案中,诱导物是小分子的不存在或去除。作为替代或补充,重组酶的活性由宿主细胞内的信号诱导。在一些实施方案中,诱导物通过诱导蛋白质二聚化来促进重组酶活性的激活。在一些实施方案中,诱导物通过蛋白质转位来促进重组酶活性的激活。
本领域中已知的任何诱导物均可与本文中所述的基因扰动盒相容。诱导物的一些实例包括但不限于甲醇、IPTG、铜、抗生素(例如四环素或甲氧苄啶)、碳源、光和激素。在一些实施方案中,本文中所述的任何诱导物可以是小分子,例如小分子抑制剂或小分子激活剂。如本文中所用,“小分子”是指低分子量(即,低于900道尔顿)的化合物。在一些实施方案中,诱导物是激素。激素诱导物的一些实例包括赤霉素(GIB)和脱落酸(ABA)。在一些实施方案中,诱导物是外源性分子。在一些实施方案中,诱导物是抗生素。在一些实施方案中,诱导物是由细胞产生的内源性分子,例如在特定的发育阶段期间。
在一些实施方案中,诱导物是合成配体。如本文中所用,术语“合成配体”是指可直接或间接地诱导或激活重组酶的任何非天然存在的配体。在一些实施方案中,合成配体与重组酶相互作用(结合)并且激活其酶活性。在一些实施方案中,合成配体与结合结构域或其一部分相互作用以激活重组酶的酶活性。在一些实施方案中,合成配体是4-羟基他莫昔芬。在一些实施方案中,合成配体是Shield-1配体。
调节重组酶活性的诱导物的浓度将取决于以下因素,例如诱导型系统的任何组件和期望的重组酶活性水平。在一些实施方案中,诱导物的浓度为0.001至50μM、0.05至10μM、0.01至5μM、0.05至1μM、或0.1至1μM。在一些实施方案中,诱导物的浓度为至少0.01μM、0.02μM、0.03μM、0.04μM、0.05μM、0.06μM、0.07μM、0.08μM、0.09μM、0.1μM、0.15μM、0.2μM、0.3μM、0.425μM、0.5μM、0.6μM、0.7μM、0.8μM、0.9μM、1.0μM、1.1μM、1.2μM、1.3μM、1.4μM、1.5μM或更高。
应理解,一些重组酶可需要一种或更多种另外的辅因子和/或辅助蛋白以介导遗传构建体的重组。在一些实施方案中,诱导型重组酶获自或来源于细菌重组酶、真菌重组酶、酵母重组酶或噬菌体重组酶。多种重组酶组合可用于本文中所述的遗传构建体。
通常来说,重组酶基于蛋白质的保守亲核性氨基酸残基可分类为酪氨酸重组酶或丝氨酸重组酶。在一些实施方案中,任意一种或更多种诱导型重组酶可以是酪氨酸重组酶。本领域中已知的酪氨酸重组酶的一些实例包括Cre重组酶、Flp重组酶、XerC重组酶、XerD重组酶、λ整合酶、HP1整合酶、或者其衍生物或变体。在一些实施方案中,任意一种或更多种诱导型重组酶可以是丝氨酸重组酶。本领域中已知的丝氨酸重组酶的一些实例包括γδ、ParA、Tn3、Gin、BxbI和R4。本文中所述的遗传构建体可包含酪氨酸重组酶、丝氨酸重组酶、或酪氨酸重组酶和丝氨酸重组酶二者的组合。用于本文中所述的遗传构建体的重组酶的另外的实例包括但不限于KD、B2、B3、R和Dre重组酶,以及大丝氨酸型噬菌体整合酶。
其中在编码重组酶的核酸序列中产生一个或更多个突变的重组酶衍生物或变体也在本公开内容的范围内。例如,可产生这样的突变(包括缺失、插入和/或替换突变)以改变重组酶的活性、改变诱导重组酶活性的机制和/或改善重组酶的表达。在一些实施方案中,在编码重组酶的核酸序列中产生一个或更多个突变以使重组酶的活性可诱导。在一些实施方案中,重组酶是合成或人工的重组酶。
在一些实施方案中,重组酶与结合结构域融合,该结合结构域与诱导物分子相互作用从而调节重组酶的酶活性。
在一些实施方案中,诱导物分子结合结构域与重组酶的融合允许通过诱导物的存在来调节重组酶的稳定性。使重组酶稳定从而提高重组酶活性的诱导物的一些实例包括但不限于4-羟基他莫昔芬、Shield-1配体和甲氧苄啶。
4-羟基他莫昔芬的结合结构域是ERT2,其是雌激素受体配体结合结构域的点突变体。在一些实施方案中,ERT2或其一部分与重组酶或重组酶的一部分(例如具有重组酶活性的重组酶蛋白部分或者断裂重组酶的N端或C端部分)融合。Shield-1的结合结构域是去稳定化结构域(destabilization domain,DD),其是FKBP12结构域的点突变体。在一些实施方案中,DD或其一部分与重组酶或重组酶的一部分融合。甲氧苄啶的结合结构域是来自大肠杆菌(E.coli)的二氢叶酸还原酶的点突变体。在一些实施方案中,甲氧苄啶结合结构域或其一部分与重组酶或重组酶的一部分融合。
在一些实施方案中,诱导物结合结构域与全长重组酶的N端融合。在一些实施方案中,诱导物结合结构域与全长重组酶的C端融合。
断裂重组酶也在本发明的范围内。通常来说,断裂重组酶是已被表达为该酶的两个或更多个独立部分的重组酶。例如,重组酶可被表达为两个或更多个(例如2、3、4个或更多个)部分。在一些实施方案中,重组酶的每个独立部分各自与结合结构域(例如,诱导物结合结构域)的一部分融合。在一些实施方案中,结合结构域的部分与诱导物的相互作用导致重组酶的部分相互作用(例如,二聚化)以重构酶活性,从而调节重组酶的活性。本领域中已知的任何重组酶均可在本文中所述的基因扰动盒中用作断裂重组酶。
在一些实施方案中,断裂重组酶被表达为重组酶的N端部分和C端部分。术语“N端部分”在本文中用于指从蛋白质的第一个氨基酸残基(N端)延伸的重组酶部分。在一些实施方案中,N端部分为全长重组酶的约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多。还如本文中所用,术语“C端部分”是指包含蛋白质的最后一个氨基酸残基(C端)的重组酶部分。在一些实施方案中,C端部分为全长重组酶的约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多。
在一些实施方案中,重组酶是Cre重组酶并且被表达为包含N端部分和C端部分的断裂重组酶。在一些实施方案中,重组酶是断裂Cre重组酶,并且包含为全长Cre重组酶的75%的N端部分和为全长Cre重组酶的25%的C端部分。
在一些实施方案中,重组酶是FlpO重组酶并且被表达为包含N端部分和C端部分的断裂重组酶。在一些实施方案中,重组酶是断裂FlpO重组酶,并且包含为全长FlpO重组酶的95%的N端部分和为全长FlpO重组酶的5%的C端部分。
在一些实施方案中,重组酶是重组酶并且被表达为包含N端部分和C端部分的断裂重组酶。在一些实施方案中,断裂重组酶包含为全长重组酶的40%的N端部分和为全长重组酶的60%的C端部分。
如本文中所述,断裂重组酶的每个部分可与结合结构域(例如诱导物结合结构域)的一部分融合,使得与相应的诱导物的相互作用允许重组酶的部分之间相互作用。在一些实施方案中,诱导物结合结构域可分为两个部分,例如结合结构域的N端部分和C端部分。在一些实施方案中,断裂重组酶的N端部分可与诱导物结合结构域的N端部分融合。在一些实施方案中,断裂重组酶的N端部分可与诱导物结合结构域的C端部分融合。在一些实施方案中,断裂重组酶的C端部分可与诱导物结合结构域的C端部分融合。在一些实施方案中,断裂重组酶的C端部分可与诱导物结合结构域的N端部分融合。
如本文中所用,关于诱导物结合结构域的“N端部分”意指从该结构域的第一个氨基酸残基(N端)延伸的诱导物结合结构域部分。在一些实施方案中,N端部分为全长结合结构域的约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多。还如本文中所用,关于诱导物结合结构域的术语“C端部分”意指包含该结构域的最后一个氨基酸残基(C端)的诱导物结合结构域部分。在一些实施方案中,C端部分为全长结合结构域的约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多。
与相应的诱导物相互作用的任何结合结构域都可用于本文中所述的构建体。例如,在一些实施方案中,诱导物是赤霉素,并且结合结构域是与赤霉素相互作用的蛋白质结构域。在一些实施方案中,诱导物是赤霉素,并且结合结构域是可与赤霉素结合的赤霉素不敏感矮化蛋白1(Gibberellin Insensitive Dwarfl,GID1)或其一部分,以及可与赤霉素结合的赤霉素不敏感蛋白(Gibberellin Insensitive,GAI)或其一部分。在一些实施方案中,诱导物是脱落酸,并且结合结构域是与脱落酸相互作用的蛋白质结构域。在一些实施方案中,诱导物是脱落酸,并且结合结构域是可与脱落酸结合的脱落酸不敏感蛋白(abscisicacid insensitive,ABI)或其一部分,以及可与脱落酸结合的PYL ABI受体或其一部分。
在一些实施方案中,在断裂重组酶的部分和结合结构域的部分之间可存在接头序列。如本领域技术人员所理解的,接头序列可用于允许适当的蛋白质折叠、酶活性和/或与配体(诱导物)和/或断裂重组酶的其他部分的相互作用。
本文中所述的基因扰动盒各自包含在该基因扰动盒的重组酶、基因元件和启动子组件侧翼的重组酶识别位点对。在重组酶激活之后,重组酶能够识别其同源重组酶识别位点并与其结合,导致切除位于重组酶识别位点之间的遗传物质(例如,编码重组酶、基因元件和终止子的核酸)。重组酶识别位点通常是由同源重组酶识别的短的(即,约30至40个核苷酸)DNA序列。重组酶识别位点可包含回文序列或回文区。
本文中所述的遗传构建体的每对重组酶识别位点是独特的,使得重组酶的激活导致切除编码该重组酶的基因扰动盒。例如,遗传构建体的第一基因扰动盒的重组酶的激活允许该重组酶识别并结合在第一基因扰动盒侧翼的同源重组酶识别位点,而不是在其他基因扰动盒(即,第二基因扰动盒、第三基因扰动盒等)侧翼的重组酶识别位点。
当第一组件位于另一些遗传元件之间并且与之紧邻时,认为遗传构建体的一个或更多个组件以另一些遗传元件为“侧翼”。例如,图1A示出了包含三个基因扰动盒的遗传构建体的示意图,每个基因扰动盒以重组酶识别位点对(一个在每个基因扰动盒的5’且一个在每个基因扰动盒的3’)为侧翼。
本公开内容的一些方面涉及包含基因元件的基因扰动盒。如本文中所用,“基因元件”是指其表达和/或活性可被评估的任何核酸序列。基因元件可包括但不限于蛋白质编码序列(基因)、RNA、微RNA、shRNA或gRNA。应理解,每个基因扰动盒可具有相同或不同类型的基因元件。例如,多个基因扰动盒中的一个基因扰动盒可包含gRNA,并且一个或更多个其他的基因扰动盒可包含另一类型的基因元件(例如,基因、RNA、微RNA或shRNA)。在一些实施方案中,多个基因扰动盒中的每个基因扰动盒可包含相同类型的基因元件,例如,多个中的所有基因扰动盒都可包含gRNA。
在一些实施方案中,基因元件是基因,例如蛋白质编码序列。对于本领域中已知的任何基因的表达或活性可进行评估以确定基因扰动盒的表达。在一些实施方案中,可评估由基因编码的产物的活性以确定基因扰动盒的表达。在一些实施方案中,基因编码转录因子,例如参与控制细胞命运的细胞分化网络的转录因子。在一些实施方案中,基因编码报道蛋白,例如酶(例如,半乳糖苷酶、荧光、萤光素酶或碱性磷酸酶)。在一些实施方案中,基因编码荧光蛋白,例如红色荧光蛋白(red fluorescent protein,RFP)、黄色荧光蛋白(yellow fluorescent protein,YFP)、蓝色荧光蛋白(blue fluorescent protein,BFP)。
在一些实施方案中,基因元件是微RNA。术语“微RNA”和“miRNA”可在全文中互换使用,并且是指短的、非编码的、单链RNA分子。本公开内容的miRNA可以是天然存在的或合成的(例如,人工的)。miRNA通常通过与见于所靶向mRNA的3′UTR(非翻译区)内的靶位点结合来诱导基因沉默。这种相互作用通过抑制蛋白质合成和/或通过启动mRNA降解来防止蛋白质产生。mRNA上的大部分靶位点与其相应的微RNA具有仅部分的碱基互补性,因此,单独微RNA可靶向100种不同的mRNA或更多。此外,单独mRNA可包含针对不同miRNA的多个结合位点,导致复杂的调节网络。在一些实施方案中,miRNA的长度为10至50个核苷酸。例如,miRNA的长度可以是10至40、10至30、10至20、20至50、20至40或20至30个核苷酸。在一些实施方案中,miRNA的长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方案中,miRNA的长度为22个核苷酸。
在一些实施方案中,基因元件是shRNA。通常来说,shRNA是形成或能够形成发夹结构的短的RNA分子。本公开内容的shRNA可以是天然存在的或合成的(例如,人工的)。shRNA与靶mRNA的结合通常导致该mRNA的降解。在一些实施方案中,shRNA的长度为50至120个核苷酸。例如,siRNA的长度可以是50至100、50至90、50至80、60至120、60至100或70至90个核苷酸。在一些实施方案中,siRNA的长度为60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、018、109、110、111、112、113、114、115、116、117、118、119或120个核苷酸。
在一些实施方案中,基因元件是gRNA。术语“gRNA”、“指导RNA”和“CRISPR指导序列”可在全文中互换使用,并且是指包含决定CRISPR/Cas系统的Cas DNA结合蛋白的特异性的序列的核酸。在一些实施方案中,编码gRNA的基因扰动盒用于:用CRISPR/Cas系统敲除一个或更多个基因;用CRISPR激活系统激活一个或更多个基因;或用CRISPR抑制系统抑制一个或更多个基因。gRNA与宿主细胞中的靶核酸序列互补。与靶核酸互补的gRNA或其部分的长度可以是15至25个核苷酸、18至22个核苷酸、或19至21个核苷酸。在一些实施方案中,与靶核酸互补的gRNA序列的长度为15、16、17、18、19、20、21、22、23、24或25个核苷酸。在一些实施方案中,与靶核酸互补的gRNA序列的长度为20个核苷酸。除与靶核酸互补的序列之外,在一些实施方案中,gRNA还包含支架序列。编码支架序列和与靶核酸互补的序列二者的gRNA的表达具有与靶核酸结合(杂交)和将内切核酸酶募集至靶核酸的双重功能,这可导致位点特异性的CRISPR活性。在一些实施方案中,这样的嵌合gRNA可被称为单指导RNA(single guide RNA,sgRNA)。
如本文中所用,“支架序列”,也被称为tracrRNA,是指将内切核酸酶募集至与互补gRNA序列结合(杂交)的靶核酸的核酸序列。包含至少一个茎环结构并且募集内切核酸酶的任何支架序列都可用于本文中所述的基因元件和载体。示例性支架序列对于本领域技术人员而言将是明显的,并且可见于例如Jinek,等Science(2012)337(6096):816-821;Ran,等Nature Protocols(2013)8∶2281-2308;PCT申请No.WO2014/093694;以及PCT申请No.WO2013/176772中。
在一些实施方案中,gRNA序列不包含支架序列,并且支架序列作为独立的转录物表达。在一些实施方案中,基因扰动盒也编码支架序列。在这样的一些实施方案中,gRNA序列还包含与支架序列的一部分互补并且用于结合支架序列(与其杂交)和将内切核酸酶募集至靶核酸的另外的序列。
应理解,如果gRNA序列能够与宿主细胞中的靶核酸杂交,则该gRNA序列或其一部分与该靶核酸互补。在一些实施方案中,gRNA序列与靶核酸至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或至少100%互补(还参见美国专利8,697,359,其由于其gRNA序列与靶多核苷酸序列的互补性的教导而通过引用并入)。已经示出,CRISPR指导序列与靶核酸之间在靶核酸的3’末端附近的的错配可消除核酸酶切割活性(UpadhVay,等Genes Genome Genetics(2013)3(12):2233-2238)。在一些实施方案中,gRNA序列与靶核酸的3’末端(例如,靶核酸的3’末端的最后5、6、7、8、9或10个核苷酸)至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或至少100%互补。
gRNA序列可从本领域中已知的任何来源获得。例如,gRNA序列可以是存在于宿主细胞的核酸(例如,基因组核酸和/或基因组外核酸)中的指定长度的任何核酸序列。在一些实施方案中,可设计和合成gRNA序列以靶向期望的核酸,例如编码转录因子、信号传导蛋白、转运蛋白的核酸等。
在一些实施方案中,本公开内容的gRNA的长度为10至500个核苷酸。在一些实施方案中,gRNA的长度为10至20个核苷酸、10至30个核苷酸、10至40个核苷酸、10至50个核苷酸、10至60个核苷酸、10至70个核苷酸、10至80个核苷酸、10至90个核苷酸、10至100个核苷酸、20至30个核苷酸、20至40个核苷酸、20至50个核苷酸、20至60个核苷酸、20至70个核苷酸、20至80个核苷酸、20至90个核苷酸、20至100个核苷酸、30至40个核苷酸、30至50个核苷酸、30至60个核苷酸、30至70个核苷酸、30至80个核苷酸、30至90个核苷酸、30至100个核苷酸、40至50个核苷酸、40至60个核苷酸、40至70个核苷酸、40至80个核苷酸、40至90个核苷酸、40至100个核苷酸、50至60个核苷酸、50至70个核苷酸、50至80个核苷酸、50至90个核苷酸或50至100个核苷酸。在一些实施方案中,gRNA的长度为10至200个核苷酸、10至250个核苷酸、10至300个核苷酸、10至350个核苷酸、10至400个核苷酸或10至450个核苷酸。在一些实施方案中,gRNA的长度为多于500个核苷酸。在一些实施方案中,gRNA的长度为10、15、20、15、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500个或更多个核苷酸。
术语“靶核酸”、“靶位点”和“靶序列”可在全文中互换使用,并且是指宿主细胞中可通过本文中所述的gRNA序列靶向的任何核酸序列。靶位点也可称为gRNA的“下游靶标”。靶核酸在3’侧以前间隔区邻近基序(protospacer adjacent motif,PAM)为侧翼,所述PAM可与内切核酸酶相互作用并且进一步参与将内切核酸酶活性靶向至靶核酸。通常认为在靶核酸侧翼的PAM序列取决于内切核酸酶和从中得到内切核酸酶的来源。例如,对于来源于化脓性链球菌(Streptococcus pyogenes)的Cas9内切核酸酶,PAM序列是NGG。对于来源于金黄色葡萄球菌(Staphylococcus aureus)的Cas9内切核酸酶,PAM序列是NNGRRT。对于来源于脑膜炎奈瑟菌(Neisseria meningitidis)的Cas9内切核酸酶,PAM序列是NNNNGATT。对于来源于嗜热链球菌(Streptococcus thermophilus)的Cas9内切核酸酶,PAM序列是NNAGAA。对于来源于齿垢密螺旋体(Treponema denticola)的Cas9内切核酸酶,PAM序列是NAAAAC。对于Cpfl核酸酶,PAM序列是TTN。
在另一些实施方案中,重组酶和基因元件被转录为独立的mRNA转录物。在一些实施方案中,基因扰动盒的重组酶和基因元件被转录为单mRNA转录物。在一些实施方案中,编码基因元件的核酸在编码重组酶的核酸内。如本文中所用,如果第一核酸序列插入在第二核酸序列的两个核苷酸之间,或者如果第一核酸序列替换第二核酸序列的一段连续核苷酸,则一个核酸序列被认为在另一核酸序列内。在一些实施方案中,编码基因元件的核酸在重组酶的非蛋白质编码部分(例如重组酶的非翻译区)内。在一些实施方案中,编码基因元件的核酸在重组酶的3’UTR序列内。在一些实施方案中,基因元件编码在重组酶核酸序列的内含子内。用于编码基因元件和从另一基因(例如本文中所述的重组酶)的一部分内去除基因元件的方法是本领域中已知的。参见例如Nissim等Mol.Cell(2014)54:1-13。
在一些实施方案中,编码基因元件的核酸在重组酶的3’UTR序列内,并且基因元件在转录之后从重组酶的序列中去除。在一些实施方案中,本公开内容的基因元件以核糖核酸酶识别位点为侧翼。核糖核酸酶(缩写为RNase)是催化RNA水解的核酸酶。核糖核酸酶可以是内切核糖核酸酶或外切核糖核酸酶。内切核糖核酸酶切割单链或双链RNA。外切核糖核酸酶通过从RNA的5’末端或3’末端去除末端核苷酸来降解RNA。在一些实施方案中,本公开内容的基因元件(例如gRNA)以Csy核糖核酸酶识别位点(例如,Csy4核糖核酸酶识别位点)为侧翼。Csy4是识别特定的RNA序列,切割RNA并且保持与上游片段结合的内切核糖核酸酶。在一些实施方案中,Csy核糖核酸酶(例如,Csy4核糖核酸酶)用于从核酸转录物释放基因元件。因此,在一些实施方案中,包含本文中所述的包含以Csy4或另外Cas6核糖核酸酶识别位点为侧翼的基因元件的任何遗传构建体的细胞还包含编码Csy4或另外Cas6核糖核酸酶的核酸。在一些实施方案中,Csy4或另外Cas6核糖核酸酶的活性可通过一个或更多个诱导物分子的存在诱导或调节,使得以核糖核酸酶识别位点为侧翼的基因元件仅在核糖核酸酶存在诱导物时被切割。Csy4或另外Cas6核糖核酸酶用于切除基因元件的用途是本领域中已知的,参见例如PCT申请No.WO 2015/153940。
在一些实施方案中,细胞可稳定地表达或被修饰以稳定地表达Csy4或另外Cas6核糖核酸酶。在一些实施方案中,Csy核糖核酸酶(例如,Csy4核糖核酸酶)来自铜绿假单胞菌(Pseudomonas aeruginosa)、表皮葡萄球菌(Staphylococcus epidermidis)、激烈火球菌(Pyrococcus furiosus)或硫磺矿硫化叶菌(Sulfolobus solfataricus)。本文中考虑了其他核糖核酸酶和核糖核酸酶识别位点(参见,例如Mojica,F.J.M.等,CRISPR-Cas Systems,RNA-mediated Adaptive Immunity in Bacteria and Archaea,Barrangou,Rodolphe,vander Oost,John(Eds.),2013,ISBN 978-3-642-34657-6,其中与核糖核酸酶/识别位点有关的主题通过引用并入本文)。
在一些实施方案中,核糖核酸酶识别位点(例如,Csy4核糖核酸酶识别位点)的长度为10至50个核苷酸。例如,Csy核糖核酸酶识别位点的长度可以是10至40、10至30、10至20、20至50、20至40或20至30个核苷酸。在一些实施方案中,Csy核糖核酸酶识别位点的长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方案中,Csy核糖核酸酶识别位点(例如,Csy4核糖核酸酶识别位点)的长度为28个核苷酸。在一些实施方案中,编码核糖核酸酶识别位点的核苷酸序列包含SEQ ID NO:1(GTTCACTGCCGTATAGGCAGCTAAGAAA)。本文还考虑了Csy同源物(参见,例如Mojica,F.J.M.等,CRISPR-Cas Systems,RNA-mediated Adaptive Immunity in Bacteria and Archaea,Barrangou,Rodolphe,van der Oost,John(Eds.),2013,ISBN 978-3-642-34657-6,其中与核糖核酸酶/识别位点有关的主题通过引用并入本文)。
本公开内容的一些方面涉及包含编码以核酶为侧翼的基因元件的序列的基因扰动盒。核酶是能够催化特定生化反应的RNA分子,类似于蛋白质酶的作用。顺式作用核酶通常是自形成的并且能够自切割。顺式作用核酶可介导基因元件(例如gRNA、shRNA或微RNA)由RNA pol II启动子的功能性表达。相比之下,反式作用核酶不进行自切割。自切割是指分子内催化的过程,其中包含核酶的RNA分子自身切割。根据本公开内容使用的顺式作用核酶的一些实例包括但不限于锤头型(hammerhead,HH)核酶和丁型肝炎病毒(Hepatitis deltavirus,HDV)核酶。根据本公开内容使用的反式作用核酶的一些实例包括但不限于见于烟草环斑病毒卫星RNA(satellite RNA of tobacco ringspot virus,sTRSV)、菊苣黄斑驳病毒卫星RNA(satellite RNA of chicory yellow mottle virus,sCYMV)和南芥菜花叶病毒卫星RNA(satellite RNA of arabis mosaic virus,sARMV)中的发夹型核酶的天然和人工形式。在一些实施方案中,核酶的活性是组成型的。
本公开内容的一些方面涉及包含编码重组酶的以下核酸的基因扰动盒,所述核酸包含3’RNA稳定化序列,例如形成三螺旋结构(或“三链体”)的RNA序列。在一些实施方案中,编码基因元件的核酸序列存在于重组酶的序列(例如重组酶的3’UTR)内。在这样的一些实施方案中,从转录物中切除基因元件可导致编码重组酶的mRNA缺少聚-(A)尾。在一些实施方案中,从转录物中切除基因元件降低编码重组酶的转录物的稳定性。3’RNA稳定化序列是被添加至编码产物的核酸序列3’末端以补充聚-(A)尾之缺失的序列。因此,3’RNA稳定化序列(例如形成三螺旋结构的那些)在一些实施方案中使得能够高效地翻译缺少聚-(A)尾的mRNA。三螺旋结构是例如由富含腺嘌呤和尿苷的基序形成的二级或三级RNA结构。在一些实施方案中,3’RNA稳定化序列来自核酸的3’非翻译区(untranslated region,UTR)。
在一些实施方案中,基因扰动盒包含自切割肽,例如2A肽(P2A)。通常来说,2A肽的长度为约18至22个氨基酸,并且其允许由单信使RNA(messenger RNA,mRNA)产生多种蛋白质。在一些实施方案中,2A肽是T2A肽(EGRGSLLTCGDVEENPGP(SEQ ID NO:2))、P2A(ATNFSLLKQAGDVEENPGP(SEQ ID NO:3))、E2A(QCTNYALLKLAGDVESNPGP(SEQ ID NO:4))或F2A(VKQTLNFDLLKLAGDVESNPGP(SEQ ID NO:5))。在一些实施方案中,编码重组酶的核苷酸序列可通过编码2A肽的核苷酸序列与编码基因元件的核苷酸序列分开。在一些实施方案中,编码断裂重组酶的第一部分的核苷酸序列可通过编码2A肽的核苷酸序列与编码断裂重组酶第二部分的核苷酸序列分开。每个基因扰动构建体还包含终止子序列。如本文中所用,“终止子”序列是指向RNA聚合酶发信号以停止转录DNA的核酸序列。终止子还可触发新转录的mRNA分子从转录机器(transcription machinery)释放和/或RNA聚合酶从DNA解离。应理解,合适的终止子的选择将取决于例如欲在其中使用遗传构建体的细胞或细胞类型。每个本文中所述的基因扰动盒在该盒的3’末端包含终止子序列,允许一次仅转录最接近启动子的基因扰动盒,并且一次产生一种可用于通过诱导物激活的重组酶。
在一些实施方案中,本公开内容的遗传构建体包含在基因扰动盒上游的启动子。启动子序列可与相邻的基因扰动盒可操作地连接。“启动子”是核酸的一个控制区,核酸的其余部分的转录的启动和速率在此被控制。启动子还可包含可结合调节蛋白和调节分子(例如RNA聚合酶和其他转录因子)的子区域。当启动子和/或任何另外的调节序列以例如将编码序列的表达或转录置于调节序列的影响或控制之下的方式共价连接时,认为其与另一核酸序列(例如基因扰动盒)“可操作地”连接。如果期望编码序列被翻译成功能性蛋白质,则如果诱导在5’调节序列中的启动子导致编码序列的转录和如果两个DNA序列之间连接的性质不会:(1)导致引入移码突变、(2)干扰启动子区指导编码序列转录的能力、或(3)干扰相应RNA转录物被翻译成蛋白质的能力,则认为这两个DNA序列可操作地连接。因此,如果启动子区能够实现DNA序列的转录使得所得转录物可被翻译成期望的蛋白质或多肽,则该启动子区与编码序列可操作地连接。
启动子可以是组成型的、诱导型的、激活型的、阻遏型的、组织特异性的、细胞特异性的、细胞状态特异性的、或其任意组合。在一些实施方案中,启动子是组成型活性启动子,例如来自酵母磷酸甘油酸激酶(phosphoglycerate kinase,pPGK)的启动子。在一些实施方案中,启动子是组织特异性启动子,意指启动子在特定类型的组织中具有活性。在一些实施方案中,启动子是细胞特异性启动子。使用组织特异性或细胞特异性启动子允许将遗传构建体的活性局限于限定的细胞组群中。如本文中所用,“细胞特异性启动子”是在特定类型的细胞中具有活性导致相邻基因扰动盒转录的启动子序列。细胞特异性启动子的一些实例包括但不限于在巨噬细胞、淋巴细胞、中性粒细胞、树突细胞、内皮细胞、上皮细胞、肌细胞、神经元细胞、给定组织的细胞(例如,肾细胞)中具有活性的启动子。作为替代或补充,启动子可以是细胞状态特异性启动子,其当细胞处于特定状态(例如发育状态、激活状态或疾病状态)时具有活性。启动子的一些实例包括但不限于细胞发育阶段特异性启动子、细胞状态特异性启动子、NFκB特异性启动子和工程细胞特异性启动子。
在一些实施方案中,本文中还考虑了RNA pol II和RNA pol III启动子。通过RNA聚合酶II指导转录的准确启动的启动子被称为RNA pol II启动子。根据本公开内容使用的RNApol II启动子的一些实例包括但不限于人巨细胞病毒启动子、人泛素启动子、人组蛋白H2A1启动子和人炎性趋化因子CXCL1启动子。本文中还考虑了其他RNA pol II启动子。通过RNA聚合酶III指导转录的准确启动的启动子被称为RNApol III启动子。根据本公开内容使用的RNA pol III启动子的一些实例包括但不限于U6启动子、H1启动子以及转移RNA、5S核糖体RNA(ribosomal RNA,rRNA)和信号识别颗粒7SL RNA的启动子。
本领域中已知的任何启动子都可用于本文中所述的遗传构建体,并且包括天然存在的启动子序列和合成或经遗传修饰的启动子序列。在一些实施方案中,启动子是人工启动子。
在一些实施方案中,遗传构建体可靶向并且插入DNA基因座(被称为宿主细胞的“着陆垫(1anding pad)”)中。在一些实施方案中,着陆垫在宿主细胞的基因组中。在一些实施方案中,着陆垫位于宿主细胞中的基因组外DNA基因座中,例如位于质粒或载体上。在一些实施方案中,遗传构建体存在于转导到宿主细胞中的载体上。通常来说,着陆垫是被认为是基因组(或基因组外DNA)的中性位点的核酸区域或在该核酸区域中,意指预期插入遗传构建体在所测试条件下不会对宿主细胞产生影响(负面或正面的)。用于插入本文中所述的遗传构建体的着陆垫或基因座的一些实例包括但不限于H11、AAVS1、CCR5和ROSA26基因座。在一些实施方案中,着陆垫在人或哺乳动物人工染色体上。
本文中还提供了包含本文中所述的任何遗传构建体的重组细胞。细胞的一些实例包括但不限于细菌细胞、藻类细胞、植物细胞、昆虫细胞、真菌细胞、酵母细胞、非人哺乳动物细胞和人细胞。在一些实施方案中,细胞是细菌细胞。
在一些实施方案中,细胞是真核细胞,例如哺乳动物细胞。例如,在一些实施方案中,基因扰动盒在人细胞、灵长类细胞(例如,Vero细胞)、大鼠细胞(例如,GH3细胞、OC23细胞)或小鼠细胞(例如,MC3T3细胞)中表达。存在多种人细胞系,包括但不限于HEK细胞、HeLa细胞、来自国家癌症研究所的60种癌细胞系(NCI60)的癌细胞、DU145(前列腺癌)细胞、Lncap(前列腺癌)细胞、MCF-7(乳腺癌)细胞、MDA-MB-438(乳腺癌)细胞、PC3(前列腺癌)细胞、T47D(乳腺癌)细胞、THP-1(急性髓细胞白血病)细胞、U87(胶质母细胞瘤)细胞、SHSY5Y人神经母细胞瘤细胞(克隆白骨髓瘤)和Saos-2(骨癌)细胞。在一些实施方案中,经改造构建体在人胚肾(human embryonic kidney,HEK)细胞(例如,HEK293或HEK 293T细胞)中表达。在一些实施方案中,基因扰动盒在干细胞(例如,人干细胞)例如多能干细胞(例如,胚胎干细胞或诱导多能干细胞(induced pluripotent stem cell,iPSC))中表达。
在另一些实施方案中,细胞是真菌细胞,例如酵母细胞,例如酵母属(Saccharomyces spp.)、裂殖酵母属(Schizosaccharomyces spp.)、毕赤酵母属(Pichiaspp.)、法夫酵母属(Phaffia spp.)、克鲁维酵母属(Kluyveromyces spp.)、假丝酵母属(Candida spp.)、踝节菌属(Talaromyces spp.)、酒香酵母属(Brettanomyces spp.)、管囊酵母属(Pachysolen spp.)、德巴利酵母属(Debaryomyces spp.)、耶氏酵母属(Yarrowiaspp.)和工业多倍体酵母菌株。优选地,酵母菌株是酿酒酵母(S.cerevisiae)菌株。真菌的另一些实例包括曲霉属(Aspergillus spp.)、青霉属(Penicillium spp.)、镰孢属(Fusarium spp.)、根霉属(Rhizopus spp.)、支顶孢属(Acremonium spp.)、链孢霉属(Neurospora spp.)、粪壳菌属(Sordaria spp.)、稻瘟菌属(Magnaporthe spp.)、异水霉属(Allomyces spp.)、黑粉菌属(Ustilago spp.)、葡萄孢属(Botrytis spp.)和木霉属(Trichoderma spp.)。
在一些实施方案中,细胞是细菌细胞,例如埃希氏菌属(Escherichia spp.)、链霉菌属(Streptomyces spp.)、发酵单孢菌属(Zymonas spp.)、醋杆菌属(Acetobacterspp.)、柠檬酸杆菌属(Citrobacter spp.)、集胞藻属(Synechocystis spp.)、根瘤菌属(Rhizobium spp.)、梭菌属(Clostridium spp.)、棒状杆菌属(Corynebacterium spp.)、链球菌属(Streptococcus spp.)、黄单胞菌属(Xanthomonas spp.)、乳杆菌属(Lactobacillus spp.)、乳球菌属(Lactococcus spp.)、芽孢杆菌属(Bacillus spp.)、产碱菌属(Alcaligenes spp.)、假单胞菌属(Pseudomonas spp.)、气单胞菌属(Aeromonasspp.)、固氮菌属(Azotobacter spp.)、丛毛单胞菌属(Comamonas spp.)、分枝杆菌属(Mycobacterium spp.)、红球菌属(Rhodococcus spp.)、葡糖杆菌属(Gluconobacterspp.)、罗尔斯通氏菌属(Ralstonia spp.)、酸硫杆状菌属(Acidithiobacillus spp.)、小月菌属(Microlunatus spp.)、地杆菌属(Geobacter spp.)、地芽孢杆菌属(Geobacillusspp.)、节杆菌属(Arthrobacter spp.)、黄杆菌属(Flavobacterium spp.)、沙雷氏菌属(Serratia spp.)、糖多孢菌属(Saccharopolyspora spp.)、栖热菌属(Thermus spp.)、寡养单胞菌属(Stenotrophomonas spp.)、色杆菌属(Chromobacterium spp.)、中华根瘤菌属(Sinorhizobium spp.)、糖多孢菌属、农杆菌属(Agrobacterium spp.)和泛菌属(Pantoeaspp.)。细菌细胞可以是革兰氏阴性细胞,例如大肠杆菌(Escherichia coli(E.coli))细胞,或革兰氏阳性细胞,例如芽孢杆菌属物种。
包含含有本文中所述遗传构建体的细胞的转基因生物也在本发明的范围内。本领域中已知的常规方法可用于产生包含含有本文中所述遗传构建体的细胞的转基因生物。在一些实施方案中,细胞是在多细胞生物,例如植物或哺乳动物中。在一些实施方案中,转基因生物是转基因非人哺乳动物。在一些实施方案中,哺乳动物是啮齿动物,例如小鼠或大鼠。
在一些实施方案中,在其中表达遗传构建体的细胞可表达一个或更多个另外的组件,例如一个或更多个CRISPR组件,例如内切核酸酶。在一些实施方案中,重组细胞天然地编码Cas9酶。在一些实施方案中,重组细胞被改造以编码Cas9酶或其变体。在一些实施方案中,宿主细胞也表达内切核酸酶,例如Cas9内切核酸酶。在一些实施方案中,宿主细胞表达来源于化脓性链球菌、金黄色葡萄球菌、脑膜炎奈瑟菌、嗜热链球菌或齿垢密螺旋体的Cas9内切核酸酶。在一些实施方案中,编码Cas9内切核酸酶的核苷酸序列可以是经密码子优化的以在宿主细胞或生物体中表达。在一些实施方案中,内切核酸酶是Cas9同源物或直向同源物。
在一些实施方案中,还对编码Cas9内切核酸酶的核苷酸序列进行修饰以改变蛋白质的活性。在一些实施方案中,Cas9内切核酸酶是无催化活性的Cas9。例如,dCas9包含催化活性残基(D10和H840)的突变,并且不具有核酸酶活性。作为替代或补充,Cas9内切核酸酶可与其他蛋白质或其一部分融合。在一些实施方案中,dCas9与阻遏物结构域(例如KRAB结构域)融合。在一些实施方案中,这样的dCas9融合蛋白与本文中所述的构建体一起用于多重基因抑制(例如,CRISPR干扰(CRISPRi))。在一些实施方案中,dCas9与激活物结构域(例如VP64或VPR)融合。包含与转录因子或结构域融合的dCas9的CRISPR蛋白由此通常被称为CRISPR-TF或CRISPR-转录因子。变体CRISPR-TF也是本领域中已知的,并且与包含例如dCas9-VP64的CRISPR-TF相比可赋予基因更强的转录激活。参见,例如Chavez等Nat.Methods 5(2015)12:326-328;Farzadfard等,ACS Synth.Biol.(2015)517:583-588;Tanenbaum Cell(2014)159:635-646。
在一些实施方案中,这样的dCas9融合蛋白与本文中所述的构建体一起用于多重基因激活(例如,CRISPR激活(CRISPRa))。参见,例如Gilbert等Cell(2014)159(3):647-661。在一些实施方案中,dCas9与表观遗传调节结构域(例如组蛋白脱甲基酶结构域或组蛋白乙酰转移酶结构域)融合。在一些实施方案中,dCas9与LSD1或p300或者其一部分融合。在一些实施方案中,dCas9融合用于基于CRISPR的表观遗传调节。在一些实施方案中,dCas9或Cas9与Fokl核酸酶结构域融合。在一些实施方案中,与Fok1核酸酶结构域融合的Cas9或dCas9用于多重基因编辑。在一些实施方案中,Cas9或dCas9与荧光蛋白(例如,GFP、RFP、BFP、mCherry等)融合。在一些实施方案中,与荧光蛋白融合的Cas9/dCas9蛋白用于基因组基因座的多重标记和/或可视化。
作为替代或补充,内切核酸酶是Cpfl核酸酶。在一些实施方案中,宿主细胞表达来源于普氏菌属(Provetella spp.)或弗朗西斯菌属(Francisella spp.)的Cpfl核酸酶。在一些实施方案中,编码Cpfl核酸酶的核苷酸序列可以是经密码子优化的以在宿主细胞或生物体中表达。
在一些实施方案中,本公开内容的细胞是经修饰的并且可被称为重组细胞。经修饰的细胞或重组细胞是含有外源核酸或天然不存在的核酸的细胞。在一些实施方案中,重组细胞含有独立复制的外源核酸(例如,存在于附加体型载体上的遗传构建体)。在一些实施方案中,通过将外来或外源核酸引入到细胞中来产生重组细胞。可通过常规的方法将核酸引入到细胞中,例如如电穿孔、化学转染、病毒转导、噬菌体转导、与含有重组质粒的细菌原生质体融合、或显微注射。在一些实施方案中,遗传构建体在质粒或载体上引入到细胞中。在一些实施方案中,遗传构建体通过病毒(例如慢病毒或腺病毒)引入到细胞中。表达核酸分子也可通过将核酸分子整合到基因组中来实现。
在一些实施方案中,在重组表达载体上提供本文中所述的遗传构建体。如本文中所用,“载体”可以是可在其中插入期望的序列的许多核酸中的任一种,例如通过限制性酶切消化和连接或通过重组插入以在不同遗传环境之间转运或在宿主细胞中表达。载体通常由DNA构成,但是RNA载体也是可用的。载体包括但不限于:质粒、F黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。在一些实施方案中,载体是慢病毒载体。在一些实施方案中,在同一重组表达载体上表达编码两个或三个微RNA之组合的基因中的每一个。在一些实施方案中,在载体上提供编码内切核酸酶(例如CRISPR内切核酸酶(例如,Cas9酶))的基因。在一些实施方案中,编码内切核酸酶(例如CRISPR内切核酸酶)的基因与本文中所述的遗传构建体在同一载体上提供。在一些实施方案中,在与包含本文中所述遗传构建体的载体不同的载体上提供编码内切核酸酶(例如CRISPR内切核酸酶)的基因。
载体还可包含一个或更多个适用于鉴定已经或尚未被载体转化或转染的细胞的标记序列。标记包括例如,编码提高或降低对抗生素或其他化合物的抗性或敏感性的蛋白质的基因、编码其活性可通过本领域中已知的标准测定检测的酶(例如,半乳糖苷酶、荧光、萤光素酶或碱性磷酸酶)的基因、以及明显地影响经转化或转染的细胞、宿主、菌落或噬斑的表型的基因(例如,绿色荧光蛋白、红色荧光蛋白)。优选的载体是能够自主复制和表达存在于与所述载体可操作地连接的DNA区段中的结构基因产物的那些。
用于评估细胞中基因表达的方法也在本公开内容的范围内,该方法涉及向细胞提供本文中所述的遗传构建体并在其中第一基因扰动盒(最接近启动子的基因扰动盒)被表达的条件下孵育细胞。在一些实施方案中,该条件允许基因元件也被表达。在其中编码基因元件的核酸在编码重组酶的核酸序列内的一些实施方案中,将细胞在其中基因元件从重组酶转录物中切除或切割的条件下孵育。例如,可使用常规的细胞培养方法培养(例如,维持在细胞培养物中)包含本公开内容的遗传构建体的细胞。例如,可在细胞培养箱中在合适的温度和气体混合物(例如,对于哺乳动物细胞,37℃、5%CO2)下培养并维持细胞。在一些实施方案中,可在特定的条件下孵育细胞以诱导期望的细胞状态,例如发育状态、激活或疾病状态。对每种细胞类型而言,培养条件可不同。例如,细胞生长培养基可在pH、葡萄糖浓度、生长因子和其他营养物的存在方面变化。用于补充培养基的生长因子通常来源于动物血液的血清,例如胎牛血清(fetal bovine serum,FBS)、小牛血清、马血清和/或猪血清。在一些实施方案中,如本文中提供使用的培养基可以是市售的和/或已充分描述的(参见例如Birch J.R.,R.G.Spier(Ed.)Encyclopedia of Cell Technology,Wiley.411-424,2000;Keen M.J.Cytotechnology 17:125-132,1995;Zang,等Bio/Technology.13:389-392,1995)。在一些实施方案中,使用化学限定的培养基。
可通过评估每个基因扰动盒的基因元件的输出来评价每个基因扰动盒的时间和依次诱导。在一些实施方案中,基因元件的输出包括评估基因元件的表达或活性。评估基因元件的表达的方法对本领域技术人员而言将是明显的,并且包括例如qRT-PCR、微阵列分析、Northern印迹和RNA-Seq。在一些实施方案中,基因元件是基因,并且通过量化基因产物的量来评价该基因的表达。作为替代或补充,可评估基因元件的活性,例如,通过测量由基因元件的活性产生的产物的量,和/或测量基因元件的靶标(例如靶基因)的表达。
本发明的应用不限于在说明书中阐述的或在附图中举例说明的组件的构造和布置的细节。本发明能够具有其他实施方案并且能够以多种方式实施或进行。此外,本文中所用的措辞和术语是为了描述的目的,并且不应被视为限制。本文中“包括”、“包含”或“具有”、“含有”、“涉及”及其变化形式的使用意在涵盖其后列出的项目及其等同物以及另外的项目。
通过以下实施例进一步举例说明本发明,这些实施例决不应被解释为进一步限制。在本申请通篇引用的所有参考文献(包括著作文献、授权专利、公开的专利申请和共同未决的专利申请)的全部内容在此通过引用明确地并入,特别是对于本文中引用的教导。
实施例
实施例1
当存在于宿主细胞中时,遗传构建体的第一基因扰动盒在位于该构建体的第一基因扰动盒上游的启动子的控制之下表达(图1A)。基因扰动盒的表达允许产生无活性的重组酶(无活性的Recl)和使用CRISPR-Cas转录因子对下游靶标发挥作用的gRNA基因元件。无活性的Rec1由诱导物1激活,导致第一基因扰动盒使用同源重组酶位点(R1)自切除。与重组酶识别位点对(R1)的重组允许去除第一基因扰动盒并且产生单个R1位点。在除去第一基因扰动盒之后,第二基因扰动盒最接近启动子,允许该盒的表达以及无活性重组酶2(Rec2)和gRNA2的产生(图1B)。gRNA2使用CRISPR-Cas转录因子调节下游靶标。诱导物2激活Rec2活性,其使用相应的重组酶识别位点(R2)自切除第二基因扰动盒,导致第三基因扰动盒变成最接近启动子的基因扰动盒。然后,第三基因扰动盒被表达,产生无活性的重组酶3(Rec3)和gRNA3(图1C)。gRNA3使用CRISPR-Cas转录因子调节下游靶标。诱导物1激活Rec3活性,其使用相应的重组酶识别位点(R3)自切除第三GPC。
评估gRNA的下游靶标的扰动(激活或抑制的程度)以确定基因表达的时机(timing)和顺序。
实施例2
根据图2中示出的一般示意图产生基因扰动盒。该盒包含表达为各自与结合结构域的一部分融合的N端部分(Split-N)和C端部分(Split-C)的断裂重组酶,所述结合结构域与诱导物(例如,赤霉素(GIB)或脱落酸(ABA))特异性结合。具体地,编码断裂Cre重组酶的基因扰动盒包含为全长Cre重组酶的75%的N端部分和为全长Cre重组酶的25%的C端部分。编码断裂FlpO重组酶的基因扰动盒包含为FlpO重组酶的95%的N端部分和是全长FlpO重组酶的5%的C端部分。
通常来说,在不存在诱导物的情况下,断裂重组酶的各部分和mCherry被表达。然而,在存在诱导物的情况下,断裂重组酶的各部分二聚化以重构并且激活重组酶。编码mCherry的基因扰动盒的切除允许表达编码蓝色荧光蛋白(BFP)的基因。
三个示例性基因扰动盒如下产生:FlpO表达为与与ABA相互作用的结合结构域融合的断裂重组酶;Cre表达为与与GIB相互作用的结合蛋白融合的断裂重组酶;并且FlpO表达为与与GIB相互作用的结合结构域融合的断裂重组酶。将293T细胞用示例性基因扰动盒瞬时转染并用载剂(乙醇)或诱导物(例如,重组酶二聚化药物:GIB或ABA)处理。通过流式细胞术分析在处理之后96小时评估mCherry和BFP的表达(图3A)。数据还表示为以BFP细胞/总细胞(BFP阳性或mCherry阳性)百分比计算的基因扰动盒切除(导致BFP表达)的频率(图3B)。
如图3A和3B中所示,用合适的诱导物处理细胞导致基因扰动盒的切除提高,导致下游基因BFP的表达。
实施例3
基因扰动盒的可扩展重组酶级联可用于建立其中癌症的因果突变依次累积的肿瘤发生模型。例如,结直肠癌的四步肿瘤发生由腺瘤性息肉病蛋白(AdenomatousPolyposis Coli,APC)、p53、KRAS和Smad4的突变限定,如图4A中所示。这可使用基因扰动盒进行建模,每个基因扰动盒编码可驱动致瘤性突变(例如APC、Smad4或p53突变)的gRNA,或表达突变癌基因,例如KRAS突变体。
如图4B中所示,第一基因扰动盒的表达导致诱导APC突变的一个或更多个gRNA的表达。与第一诱导物接触导致第一基因扰动盒的切除,允许第二基因扰动盒的表达。与第二诱导物接触导致第二基因扰动盒的切除,允许活性KRAS突变体和包含诱导Smad4突变的一个或更多个gRNA的第三基因扰动盒的表达。与第三诱导物接触导致第三扰动盒的切除,允许包含诱导p53突变的一个或更多个gRNA的第四基因扰动盒的表达。癌症的发生(例如,一种或更多种癌症标志物)可在与一种或更多种诱导物接触之前、期间和/或之后使用本领域中已知的方法进行评估。
实施例4
基因扰动盒的可扩展重组酶级联可用于建立高效的定向细胞分化。依次基因扰动可模拟具有治疗价值的特定细胞类型的自然发育过程。如图5A中所示,细胞分化涉及许多转录因子的协调表达,在该图中示出了所述转录因子的子集(来自Pagliuca和Melton,Development(2013)140(12):2472-83)。
使用编码以下gRNA的基因扰动盒可实现将祖细胞定向分化成产生胰岛素的胰腺β细胞,所述gRNA激活关键转录因子的表达,使得能够将细胞分化成定形内胚层、胰腺内胚层、内分泌祖细胞、以及随后的胰腺β细胞(图5B)。如图5B中所示,第一基因扰动盒的表达导致一个或更多个gRNA的表达,其激活参与将细胞分化成定形内胚层的一种或更多种转录因子的表达。与第一诱导物接触导致第一基因扰动盒的切除,允许包含一个或更多个gRNA的第二基因扰动盒的表达,所述gRNA激活参与将细胞分化成胰腺内胚层的一种或更多种转录因子的表达。与第二诱导物接触导致第二基因扰动盒的切除,允许包含一个或更多个gRNA的第三基因扰动盒的表达,所述gRNA激活参与将细胞分化成内分泌祖细胞的一种或更多种转录因子的表达。与第三诱导物接触导致第三扰动盒的切除,允许包含一个或更多个gRNA的第四基因扰动盒的表达,所述gRNA激活参与将细胞分化为胰腺β细胞的一种或更多种转录因子的表达。细胞分化或细胞状态(例如,一种或更多种细胞标志物)可在与一种或更多种诱导物接触之前、期间和/或之后使用本领域中已知的方法进行评估。
虽然已经如此描述了本发明的至少一个实施方案的数个方面,应理解,本领域技术人员将容易想到多种变化、修改和改进。这样的变化、修改和改进旨在成为本公开内容的一部分,并且旨在落入本发明的精神和范围内。因此,前面的描述和附图仅是示例性的。
等同方案
虽然本文中已描述并说明了本发明的数个实施方案,但是本领域普通技术人员将容易预见用于执行本文中所述的功能和/或获得本文中所述的结果和/或一个或更多个优点的多种其他手段和/或结构,并且每个这样的变化和/或修改被视为在本文中所述的本发明实施方案的范围之内。此外,如果这样的特征、系统、制品、材料、套件和/或方法不相互不一致,则两个或更多个这样的特征、系统、制品、材料、套件和/或方法的任意组合也包括在本公开内容的发明范围内。
本文公开的所有参考文献、专利和专利申请根据其各自被引用的主题通过引用并入,所述主题在一些情况下可涵盖整个文件。
除非明确指出相反,否则如本文中在说明书和权利要求书中使用的没有数量词修饰的名词应理解为意指“至少一个/种”。
如本文中在说明书和权利要求书中使用的短语“和/或”应被理解为是指如此连接的要素(即,在一些情况下联合存在而另一些情况下分开存在的要素)中的“任一或二者”。用“和/或”列出的多个要素应以相同的方式解释,即如此连接的要素中的“一个或更多个”。除通过由“和/或”子句所具体确定的要素之外,其他要素也可任选地存在,无论是否与具体确定的那些要素相关。因此,作为一个非限制性实例,当与开放式语言(例如“包含/包括”)联合使用时对“A和/或B”的提及在一个实施方案中可以指仅A(任选地包括除B之外的要素);在另一个实施方案中,可以指仅B(任选地包括除A之外的要素);在另一个实施方案中,可以指A和B二者(任选地包括其他要素);等。
如本文中在说明书和权利要求书中使用的“或/或者”应被理解为与如上所定义“和/或”具有相同的含义。例如,当分离列表中的项目时,“或/或者”或“和/或”应被解释为包括性的,即包括多个要素或要素列表中的至少一个,但是也包括多于一个,并且任选地包括另外的未列出项目。只有明确指出相反的术语(例如“仅之一”或“正好之一”,或者,在权利要求书中使用时,“由......组成”)才将指包括多个要素或要素列表中的恰好一个要素。一般而言,当之前有排他性的术语(例如“任一”、“之一”、“仅之一”或“恰好之一”)时,本文中所使用的术语“或/或者”应仅解释为表示排他性的替代选择(即,“一个或另一个但不是二者”)。当在权利要求书中使用时,“基本上由……组成”应具有其在专利法领域中所使用的通常含义。
如本文中在说明书和权利要求书中使用的,关于一个或更多个要素的列表的短语“至少一个”应理解为意指选自要素列表中任意一个或更多个要素中的至少一个要素,但是不一定包括要素列表内具体列出的各个要素和每个要素中的至少一个,并且不排除要素列表中要素的任意组合。该定义还允许可除短语“至少一个”所指在要素列表内明确指出的要素之外任选地存在其他要素,不论与那些明确指出的要素是否相关。因此,作为一个非限制性实例,“A和B中的至少一个”(或等同地,“A或B中的至少一个”,或等同地,“A和/或B中的至少一个”)在一个实施方案中可以指,至少一个A,任选地包括多于一个A,而不存在B(且任选地包括除B之外的要素);在另一个实施方案中,可以指至少一个B,任选地包括多于一个B,而不存在A(且任选地包括除A之外的要素);在另一个实施方案中,可以指至少一个A,任选地包括多于一个A,以及至少一个B,任选地包括多于一个B(且任选地包括其他要素);等。
还应理解,除非明确地指出相反,否则在包括多于一个步骤或动作的本文中所要求保护的任何方法中,该方法的步骤或动作的顺序不必限于该方法的步骤或动作被记载的顺序。本文中公开的所有参考文献、专利和专利申请根据其各自被引用的主题通过引用并入,所述主题在一些情况下可涵盖整个文件。
在权利要求书以及在上述说明书中,所有的连接词(例如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“容置”、“由…构成”等)应理解为是开放式的,即意指包括但不限于。仅连接词“由......组成”和“基本上由…组成”应分别是封闭式或半封闭式连接词,如美国专利局专利审查程序手册2111.03部分中所述。
序列表
<110> 麻省理工学院
<120> 可扩展的重组酶级联
<130> M0656.70381WO00
<140> 尚未转让
<141> 与此同时
<150> US 62/327,479
<151> 2016-04-26
<160> 5
<170> PatentIn version 3.5
<210> 1
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 1
gttcactgcc gtataggcag ctaagaaa 28
<210> 2
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 2
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 3
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 3
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 4
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 4
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 5
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 合成的多肽
<400> 5
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
Claims (35)
1.遗传构建体,其包含:
多个基因扰动盒,
其中所述多个基因扰动盒包含:
(a)第一类型的基因扰动盒,其包含编码以下的第一核酸:
重组酶活性由第一诱导物诱导的第一诱导型重组酶,
第一基因元件,
第一终止子,以及
在所述重组酶、所述第一基因元件和所述第一终止子侧翼的第一对重组酶识别位点,其中所述第一重组酶能够在该第一对重组识别位点的每个重组酶识别位点与所述第一核酸结合并对其进行切割;以及
(b)第二类型的基因扰动盒,其包含编码以下的第二核酸:
重组酶活性由第二诱导物诱导的第二诱导型重组酶,
第二基因元件,
第二终止子,以及
在所述第二重组酶、所述第二基因元件和所述第二终止子侧翼的第二对重组酶识别位点,其中所述第二重组酶能够在该第二对重组识别位点的每个重组酶识别位点与所述第二核酸结合并对其进行切割。
2.权利要求1所述的遗传构建体,其还包含位于所述第一类型的基因扰动盒上游的启动子。
3.权利要求1或2所述的遗传构建体,其中编码所述第一基因元件的核酸位于编码所述第一诱导型重组酶的核酸的3’非翻译区内,和/或编码所述第二基因元件的核酸位于编码所述第二诱导型重组酶的核酸的3’非翻译区内。
4.权利要求1或2所述的遗传构建体,其中编码所述第一基因元件的核酸位于编码所述第一诱导型重组酶的核酸的内含子内,和/或编码所述第二基因元件的核酸位于编码所述第二诱导型重组酶的核酸的内含子内。
5.权利要求1至4中任一项所述的遗传构建体,其中所述基因元件是编码蛋白质的核酸、gRNA、miRNA或shRNA。
6.权利要求1至5中任一项所述的遗传构建体,其中所述第一诱导型重组酶和/或所述第二诱导型重组酶是酪氨酸重组酶。
7.权利要求1至5中任一项所述的遗传构建体,其中所述第一诱导型重组酶和/或所述第二诱导型重组酶是丝氨酸重组酶。
8.权利要求1至5中任一项所述的遗传构建体,其中所述第一诱导型重组酶和/或所述第二诱导型重组酶是断裂重组酶。
9.权利要求8所述的遗传构建体,其中所述断裂重组酶包含所述断裂重组酶的第一部分和第二部分。
10.权利要求1至9中任一项所述的遗传构建体,其中所述多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核酶序列。
11.权利要求1至10中任一项所述的遗传构建体,其中所述多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核糖核酸酶识别序列。
12.权利要求11所述的遗传构建体,其中所述一个或更多个核糖核酸酶识别序列是Cas6/Csy4识别序列。
13.权利要求1至12中任一项所述的遗传构建体,其中所述多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个自切割肽序列。
14.权利要求13所述的遗传构建体,其中所述一个或更多个自切割肽序列是P2A序列。
15.权利要求1至14中任一项所述的遗传构建体,其中所述多个基因扰动盒包含与一个或更多个所述第二类型的基因扰动盒交替的一个或更多个所述第一类型的基因扰动盒。
16.权利要求1至15中任一项所述的遗传构建体,其中所述多个基因扰动盒还包含(c)第三类型的基因扰动盒,其包含编码以下的第三核酸:
重组酶活性由第三诱导物诱导的第三诱导型重组酶,
第三基因元件,
第三终止子,以及
在所述重组酶、所述第三基因元件和所述第三终止子侧翼的第三对重组酶识别位点,其中所述第三重组酶能够在该第三对重组识别位点的每个重组酶识别位点与所述第三核酸结合并对其进行切割。
17.权利要求2至16中任一项所述的遗传构建体,其中所述启动子是细胞特异性启动子或细胞状态特异性启动子。
18.权利要求1至17中任一项所述的遗传构建体,其中所述第一和/或第二诱导物是小分子诱导物。
19.权利要求18所述的遗传构建体,其中所述小分子诱导物是激素。
20.权利要求19所述的遗传构建体,其中所述激素是赤霉素(GIB)或脱落酸(ABA)。
21.权利要求18所述的遗传构建体,其中所述小分子诱导物是抗生素。
22.权利要求21所述的遗传构建体,其中所述抗生素是甲氧苄啶。
23.权利要求19所述的遗传构建体,其中所述小分子诱导物是合成配体。
24.权利要求23所述的遗传构建体,其中所述合成配体是Shield-1或4-羟基他莫昔芬。
25.载体,其包含权利要求1至24中任一项所述的遗传构建体。
26.重组细胞,其包含权利要求1至24中任一项所述的遗传构建体或权利要求25所述的载体。
27.权利要求26所述的重组细胞,其还包含Cas6/Csy4核糖核酸酶。
28.权利要求26或27所述的重组细胞,其还包含Cas9内切核酸酶。
29.权利要求26至28中任一项所述的重组细胞,其中所述细胞是细菌细胞、真菌细胞、酵母细胞、昆虫细胞、植物细胞、动物细胞或人细胞。
30.权利要求29所述的重组细胞,其中所述细胞是干细胞。
31.权利要求30所述的重组细胞,其中所述干细胞是胚胎干细胞或诱导多能干细胞(iPS)。
32.转基因生物,其包含权利要求26至31中任一项所述的重组细胞。
33.用于评估细胞中基因表达的方法,其包括:
(i)向细胞提供包含多个基因扰动盒的遗传构建体,
其中所述多个基因扰动盒包含:
(a)第一类型的基因扰动盒,其包含编码以下的核酸:
重组酶活性由第一诱导物诱导的第一诱导型重组酶,
基因元件,
终止子,以及
在所述第一重组酶、所述第一基因元件和所述第一终止子侧翼的第一对重组酶识别位点,其中所述第一重组酶能够在该第一对重组识别位点的每个重组酶识别位点与所述核酸结合并对其进行切割;以及
(b)第二类型的基因扰动盒,其包含编码以下的核酸:
重组酶活性由第二诱导物诱导的第二诱导型重组酶,
第二基因元件,
第二终止子,以及
在所述第二重组酶、所述第二基因元件和所述第二终止子侧翼的第二对重组酶识别位点,其中所述第二重组酶能够在该第二对重组识别位点的每个重组酶识别位点与所述核酸结合并对其进行切割;
(ii)在其中第一基因扰动盒被表达并且所述基因元件从所述核酸上切割的条件下孵育(i)所述的细胞;以及
(iii)评估所述基因元件的一个或更多个靶标的输出。
34.权利要求33所述的方法,其中所述多个基因扰动盒还包含:
(c)第三类型的基因扰动盒,其包含编码以下的核酸:
重组酶活性由第一诱导物诱导的第三诱导型重组酶,
第三基因元件,
第三终止子,以及
在所述第三重组酶、所述第三基因元件和所述第三终止子侧翼的第三对重组酶识别位点,其中所述第三重组酶能够在该第三对重组识别位点的每个重组酶识别位点与所述核酸结合并对其进行切割。
35.权利要求33或34所述的方法,其中所述第一、第二和/或第三基因元件的一个或更多个靶标的所述输出包括评估所述一个或更多个靶标的表达。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662327479P | 2016-04-26 | 2016-04-26 | |
US62/327,479 | 2016-04-26 | ||
PCT/US2017/029572 WO2017189683A1 (en) | 2016-04-26 | 2017-04-26 | Extensible recombinase cascades |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109072233A true CN109072233A (zh) | 2018-12-21 |
Family
ID=58692607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780026091.8A Pending CN109072233A (zh) | 2016-04-26 | 2017-04-26 | 可扩展的重组酶级联 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10752904B2 (zh) |
EP (1) | EP3448996A1 (zh) |
JP (1) | JP2019514377A (zh) |
CN (1) | CN109072233A (zh) |
WO (1) | WO2017189683A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108884456A (zh) * | 2015-10-01 | 2018-11-23 | 麻省理工学院 | 生物状态机 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7234469B2 (ja) * | 2019-03-25 | 2023-03-08 | 国立大学法人東京農工大学 | RNAアプタマー、複合分子、pH判定方法、標識化RNA及び標識化RNAの製造方法 |
EP3889259A1 (en) * | 2020-03-30 | 2021-10-06 | IMBA-Institut für Molekulare Biotechnologie GmbH | Internal standard for crispr guide rna |
US20220154223A1 (en) | 2020-10-15 | 2022-05-19 | Hoffmann-La Roche Inc. | Nucleic acid constructs for simultaneous gene activation |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1134287A1 (en) * | 2000-03-08 | 2001-09-19 | Universite De Geneve | A system to control the expression of a given gene using another gene that encodes a polypeptide with recombinant activity |
EP1264891A1 (en) * | 2001-05-31 | 2002-12-11 | Plant Research International B.V. | Modification of plant genomes by inducible site-specific recombination of transgenes |
US20040231006A1 (en) * | 2000-04-12 | 2004-11-18 | Silver Daniel P. | Self-extinguishing recombinases, nucleic acids encoding them and methods of using the same |
CN101466839A (zh) * | 2006-04-21 | 2009-06-24 | 辛根塔参与股份公司 | 控制甜菜抽苔的转基因植株和方法 |
US20130034907A1 (en) * | 2009-11-30 | 2013-02-07 | Mfassachuetts Institute of Technology | Biological circuit chemotactic converters |
US8645115B2 (en) * | 2008-12-22 | 2014-02-04 | Trustees Of Boston University | Modular nucleic acid-based circuits for counters, binary operations, memory and logic |
CN104508130A (zh) * | 2012-06-29 | 2015-04-08 | 麻省理工学院 | 大规模并行组合遗传学 |
CN107429246A (zh) * | 2014-10-31 | 2017-12-01 | 麻省理工学院 | 用于crispr的大规模并行组合遗传学 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
WO2015153940A1 (en) | 2014-04-03 | 2015-10-08 | Massachusetts Institute Of Technology | Methods and compositions for the production of guide rna |
-
2017
- 2017-04-26 JP JP2018556291A patent/JP2019514377A/ja active Pending
- 2017-04-26 CN CN201780026091.8A patent/CN109072233A/zh active Pending
- 2017-04-26 WO PCT/US2017/029572 patent/WO2017189683A1/en unknown
- 2017-04-26 US US15/497,703 patent/US10752904B2/en active Active
- 2017-04-26 EP EP17722584.4A patent/EP3448996A1/en not_active Withdrawn
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1134287A1 (en) * | 2000-03-08 | 2001-09-19 | Universite De Geneve | A system to control the expression of a given gene using another gene that encodes a polypeptide with recombinant activity |
US20040231006A1 (en) * | 2000-04-12 | 2004-11-18 | Silver Daniel P. | Self-extinguishing recombinases, nucleic acids encoding them and methods of using the same |
EP1264891A1 (en) * | 2001-05-31 | 2002-12-11 | Plant Research International B.V. | Modification of plant genomes by inducible site-specific recombination of transgenes |
CN101466839A (zh) * | 2006-04-21 | 2009-06-24 | 辛根塔参与股份公司 | 控制甜菜抽苔的转基因植株和方法 |
US8645115B2 (en) * | 2008-12-22 | 2014-02-04 | Trustees Of Boston University | Modular nucleic acid-based circuits for counters, binary operations, memory and logic |
US20130034907A1 (en) * | 2009-11-30 | 2013-02-07 | Mfassachuetts Institute of Technology | Biological circuit chemotactic converters |
CN104508130A (zh) * | 2012-06-29 | 2015-04-08 | 麻省理工学院 | 大规模并行组合遗传学 |
CN107429246A (zh) * | 2014-10-31 | 2017-12-01 | 麻省理工学院 | 用于crispr的大规模并行组合遗传学 |
Non-Patent Citations (6)
Title |
---|
BROCARD J等: "A chimeric Cre recombinase inducible by synthetic,but not by natural ligands of the glucocorticoid receptor", 《NUCLEIC ACIDS RES》 * |
BUNTING M等: "Targeting genes for self-excision in the germ line", 《GENES DEV》 * |
FEIL R等: "Regulation of Cre recombinase activity by mutated estrogen receptor ligand-binding domains", 《BIOCHEM BIOPHYS RES COMMUN》 * |
INDRA AK等: "Temporally-controlled site-specific mutagenesis in the basal layer of the epidermis: comparison of the recombinase activity of the tamoxifen-inducible Cre-ER(T) and Cre-ER(T2) recombinases", 《NUCLEIC ACIDS RES》 * |
宁爱玲等: "GmAOC3基因转化载体构建及转化大豆的初步研究", 《大豆科学》 * |
王晓霞等: "CRISPR-Cas9植物基因编辑系统敲除拟南芥AG基因表达载体的构建", 《分子植物育种网络版》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108884456A (zh) * | 2015-10-01 | 2018-11-23 | 麻省理工学院 | 生物状态机 |
Also Published As
Publication number | Publication date |
---|---|
EP3448996A1 (en) | 2019-03-06 |
US20170306336A1 (en) | 2017-10-26 |
WO2017189683A1 (en) | 2017-11-02 |
JP2019514377A (ja) | 2019-06-06 |
US10752904B2 (en) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107794272B (zh) | 一种高特异性的crispr基因组编辑体系 | |
US20230042624A1 (en) | Crispr/cas transcriptional modulation | |
TWI716367B (zh) | 用於常間回文重複序列叢集(crispr)之大量平行組合性基因學 | |
AU2015308910B2 (en) | Methods for increasing Cas9-mediated engineering efficiency | |
Pinder et al. | Nuclear domain ‘knock-in’screen for the evaluation and identification of small molecule enhancers of CRISPR-based genome editing | |
Zhao et al. | CRISPR–Cas9-mediated functional dissection of 3′-UTRs | |
CN109415729B (zh) | 具有降低毒性的基因编辑试剂 | |
CN109072233A (zh) | 可扩展的重组酶级联 | |
JP7389135B2 (ja) | タウ凝集に関連する遺伝的脆弱性を明らかにするためのcrispr/casドロップアウトスクリーニングプラットフォーム | |
US10745717B2 (en) | Vectors and methods for targeted integration in loci comprising constitutively expressed genes | |
JP7461368B2 (ja) | タウの播種または凝集の遺伝的修飾因子を同定するためのcrispr/casスクリーニングプラットフォーム | |
Mehta et al. | Temporal resolution of gene derepression and proteome changes upon PROTAC-mediated degradation of BCL11A protein in erythroid cells | |
JP2024501892A (ja) | 新規の核酸誘導型ヌクレアーゼ | |
Bae et al. | CRISPR-Mediated Knockout of Long 3′ UTR mRNA Isoforms in mESC-Derived Neurons | |
JP6779513B2 (ja) | インビボクローニング可能な細胞株をスクリーニングするための方法、インビボクローニング可能な細胞株の製造方法、細胞株、インビボクローニング方法、及びインビボクローニングを行うためのキット | |
RU2819350C2 (ru) | Скрининговая платформа crispr/cas для идентификации генетических модификаторов засева или агрегации тау-белка | |
Sterckel | CRISPR-Cas genome engineering explained from A to T: Understanding CRISPR genome engineering via a rainbow human embryonic stem cell reporter line to identify pacemaker cells and a MEF2c construct production | |
Lopes | Easy embryonicStem cell: a new tool to manipulate gene expression in embryoid bodies | |
da Fonseca Lopes | Easy Embryonicstem Cell: A new Tool to Manipulate Gene Expression in Embryoid Bodies | |
Merle | Identification of miRNA pathway genes using a novel approach for identification of trans-factors acting on cis-regulatory elements in the 3′ UTR | |
JP2012080808A (ja) | Es細胞における相同組換え効率を改善する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181221 |