KR102512979B1 - Rna-가이드된 전사 조절 - Google Patents
Rna-가이드된 전사 조절 Download PDFInfo
- Publication number
- KR102512979B1 KR102512979B1 KR1020217023393A KR20217023393A KR102512979B1 KR 102512979 B1 KR102512979 B1 KR 102512979B1 KR 1020217023393 A KR1020217023393 A KR 1020217023393A KR 20217023393 A KR20217023393 A KR 20217023393A KR 102512979 B1 KR102512979 B1 KR 102512979B1
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- sequence
- rna
- nucleic acid
- target
- Prior art date
Links
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 title description 6
- 108020004414 DNA Proteins 0.000 claims abstract description 258
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 214
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 167
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 159
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 159
- 108091033409 CRISPR Proteins 0.000 claims abstract description 134
- 238000000034 method Methods 0.000 claims abstract description 60
- 230000000295 complement effect Effects 0.000 claims abstract description 18
- 108020005004 Guide RNA Proteins 0.000 claims description 141
- 210000004027 cell Anatomy 0.000 claims description 98
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 75
- 101710096438 DNA-binding protein Proteins 0.000 claims description 61
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 42
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 42
- 238000002744 homologous recombination Methods 0.000 claims description 27
- 230000006801 homologous recombination Effects 0.000 claims description 27
- 238000010354 CRISPR gene editing Methods 0.000 claims description 25
- 125000006850 spacer group Chemical group 0.000 claims description 25
- 239000002773 nucleotide Substances 0.000 claims description 23
- 125000003729 nucleotide group Chemical group 0.000 claims description 23
- 201000010099 disease Diseases 0.000 claims description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 16
- 230000004927 fusion Effects 0.000 claims description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 14
- 230000002411 adverse Effects 0.000 claims description 14
- 210000004102 animal cell Anatomy 0.000 claims description 8
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 8
- 108091029865 Exogenous DNA Proteins 0.000 claims description 7
- 108020005196 Mitochondrial DNA Proteins 0.000 claims description 7
- 108020005202 Viral DNA Proteins 0.000 claims description 7
- 210000005253 yeast cell Anatomy 0.000 claims description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 abstract description 57
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 abstract description 48
- 239000003795 chemical substances by application Substances 0.000 abstract 1
- 102000053602 DNA Human genes 0.000 description 247
- 101710163270 Nuclease Proteins 0.000 description 78
- 239000000523 sample Substances 0.000 description 73
- 108091034117 Oligonucleotide Proteins 0.000 description 72
- 108090000623 proteins and genes Proteins 0.000 description 69
- 230000000694 effects Effects 0.000 description 58
- 230000027455 binding Effects 0.000 description 57
- 238000003556 assay Methods 0.000 description 37
- 235000018102 proteins Nutrition 0.000 description 36
- 102000004169 proteins and genes Human genes 0.000 description 36
- 230000008685 targeting Effects 0.000 description 36
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 32
- 230000035772 mutation Effects 0.000 description 30
- 230000006780 non-homologous end joining Effects 0.000 description 26
- 238000009826 distribution Methods 0.000 description 18
- 230000002103 transcriptional effect Effects 0.000 description 17
- 230000001105 regulatory effect Effects 0.000 description 15
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 14
- 235000004279 alanine Nutrition 0.000 description 14
- 230000005782 double-strand break Effects 0.000 description 13
- 230000001404 mediated effect Effects 0.000 description 13
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 12
- 230000033228 biological regulation Effects 0.000 description 12
- 230000008045 co-localization Effects 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 11
- 108091027544 Subgenomic mRNA Proteins 0.000 description 11
- 229920002401 polyacrylamide Polymers 0.000 description 11
- 230000004913 activation Effects 0.000 description 10
- 239000012190 activator Substances 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 10
- 108090000765 processed proteins & peptides Proteins 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 230000004568 DNA-binding Effects 0.000 description 9
- 101000976622 Homo sapiens Zinc finger protein 42 homolog Proteins 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 239000013641 positive control Substances 0.000 description 9
- 108060003760 HNH nuclease Proteins 0.000 description 8
- 102000029812 HNH nuclease Human genes 0.000 description 8
- 230000004570 RNA-binding Effects 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 8
- 150000001413 amino acids Chemical class 0.000 description 8
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 8
- 230000001939 inductive effect Effects 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 108091006106 transcriptional activators Proteins 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 108091023037 Aptamer Proteins 0.000 description 6
- 239000005089 Luciferase Substances 0.000 description 6
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- 102100023550 Zinc finger protein 42 homolog Human genes 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 210000004962 mammalian cell Anatomy 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 6
- 241000589602 Francisella tularensis Species 0.000 description 5
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 5
- 108091028113 Trans-activating crRNA Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000001747 exhibiting effect Effects 0.000 description 5
- 229940118764 francisella tularensis Drugs 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 229910001425 magnesium ion Inorganic materials 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 4
- 206010020751 Hypersensitivity Diseases 0.000 description 4
- 108700008625 Reporter Genes Proteins 0.000 description 4
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 108091006104 gene-regulatory proteins Proteins 0.000 description 4
- 102000034356 gene-regulatory proteins Human genes 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 108091079001 CRISPR RNA Proteins 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 108050008753 HNH endonucleases Proteins 0.000 description 3
- 102000000310 HNH endonucleases Human genes 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- 201000009906 Meningitis Diseases 0.000 description 3
- 241000588653 Neisseria Species 0.000 description 3
- 108091081021 Sense strand Proteins 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 238000000692 Student's t-test Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000010166 immunofluorescence Methods 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 231100000219 mutagenic Toxicity 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000012353 t test Methods 0.000 description 3
- 230000003827 upregulation Effects 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108091032955 Bacterial small RNA Proteins 0.000 description 2
- 241000589875 Campylobacter jejuni Species 0.000 description 2
- 101710132601 Capsid protein Proteins 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 241000193155 Clostridium botulinum Species 0.000 description 2
- 101710094648 Coat protein Proteins 0.000 description 2
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 229940123611 Genome editing Drugs 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- 241000423296 Gluconacetobacter diazotrophicus PA1 5 Species 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 2
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 101710141454 Nucleoprotein Proteins 0.000 description 2
- 101150085710 OCT4 gene Proteins 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- 101710083689 Probable capsid protein Proteins 0.000 description 2
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- 102100022221 Y-box-binding protein 3 Human genes 0.000 description 2
- 101710100127 Y-box-binding protein 3 Proteins 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 239000000700 radioactive tracer Substances 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 241001041760 Acidothermus cellulolyticus 11B Species 0.000 description 1
- 241000417230 Actinobacillus succinogenes 130Z Species 0.000 description 1
- 241000778935 Akkermansia muciniphila ATCC BAA-835 Species 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000589941 Azospirillum Species 0.000 description 1
- 241000257169 Bacillus cereus ATCC 10987 Species 0.000 description 1
- 241000606124 Bacteroides fragilis Species 0.000 description 1
- 241000586987 Bifidobacterium dentium Bd1 Species 0.000 description 1
- 241001209261 Bifidobacterium longum DJO10A Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241001453247 Campylobacter jejuni subsp. doylei Species 0.000 description 1
- 241000941427 Campylobacter lari RM2100 Species 0.000 description 1
- 241001034636 Capnocytophaga ochracea DSM 7271 Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 241001112695 Clostridiales Species 0.000 description 1
- 241001509423 Clostridium botulinum B Species 0.000 description 1
- 241001509504 Clostridium botulinum F Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241001487058 Corynebacterium efficiens YS-314 Species 0.000 description 1
- 241000671338 Corynebacterium glutamicum R Species 0.000 description 1
- 241001525611 Corynebacterium kroppenstedtii DSM 44385 Species 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- 241001082278 Desulfovibrio salexigens DSM 2638 Species 0.000 description 1
- 241000688137 Diaphorobacter Species 0.000 description 1
- 241000933091 Dinoroseobacter shibae DFL 12 = DSM 16493 Species 0.000 description 1
- 241000448576 Elusimicrobium minutum Pei191 Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000608038 Fibrobacter succinogenes subsp. succinogenes S85 Species 0.000 description 1
- 241000359186 Finegoldia magna ATCC 29328 Species 0.000 description 1
- 241000382842 Flavobacterium psychrophilum Species 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 241001453258 Helicobacter hepaticus Species 0.000 description 1
- 101001057565 Heliocidaris crassispina Exogastrula-inducing polypeptide Proteins 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 102100024594 Histone-lysine N-methyltransferase PRDM16 Human genes 0.000 description 1
- 101000686942 Homo sapiens Histone-lysine N-methyltransferase PRDM16 Proteins 0.000 description 1
- 101001094700 Homo sapiens POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- 241000256602 Isoptera Species 0.000 description 1
- 241001596092 Kribbella flavida DSM 17836 Species 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 244000199866 Lactobacillus casei Species 0.000 description 1
- 235000013958 Lactobacillus casei Nutrition 0.000 description 1
- 241000917009 Lactobacillus rhamnosus GG Species 0.000 description 1
- 241001427851 Lactobacillus salivarius UCC118 Species 0.000 description 1
- 241001193656 Legionella pneumophila str. Paris Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 208000001145 Metabolic Syndrome Diseases 0.000 description 1
- 241001378931 Methanococcus maripaludis C7 Species 0.000 description 1
- 241000825684 Mycobacterium abscessus ATCC 19977 Species 0.000 description 1
- 241000204022 Mycoplasma gallisepticum Species 0.000 description 1
- 241000107400 Mycoplasma mobile 163K Species 0.000 description 1
- 241001135743 Mycoplasma penetrans Species 0.000 description 1
- 241000051161 Mycoplasma synoviae 53 Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 101150012532 NANOG gene Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241001648684 Nitrobacter hamburgensis X14 Species 0.000 description 1
- 241001037736 Nocardia farcinica IFM 10152 Species 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000601272 Parvibaculum lavamentivorans DS-1 Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 241000549884 Persephonella marina EX-H1 Species 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 241000773205 Pseudarthrobacter chlorophenolicus A6 Species 0.000 description 1
- 241000695265 Pseudoalteromonas atlantica T6c Species 0.000 description 1
- 101710086053 Putative endonuclease Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000647111 Rhodococcus erythropolis PR4 Species 0.000 description 1
- 241001459443 Rhodococcus jostii RHA1 Species 0.000 description 1
- 241001113889 Rhodococcus opacus B4 Species 0.000 description 1
- 241001303434 Rhodopseudomonas palustris BisB18 Species 0.000 description 1
- 241001303431 Rhodopseudomonas palustris BisB5 Species 0.000 description 1
- 241000134686 Rhodospirillum rubrum ATCC 11170 Species 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 241000516659 Roseiflexus Species 0.000 description 1
- 241000504328 Roseiflexus castenholzii DSM 13941 Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 241000933177 Shewanella pealeana ATCC 700345 Species 0.000 description 1
- 241001496704 Slackia heliotrinireducens DSM 20476 Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 101150037203 Sox2 gene Proteins 0.000 description 1
- 241000756832 Streptobacillus moniliformis DSM 12112 Species 0.000 description 1
- 241000193985 Streptococcus agalactiae Species 0.000 description 1
- 241001209210 Streptococcus agalactiae A909 Species 0.000 description 1
- 241001540742 Streptococcus agalactiae NEM316 Species 0.000 description 1
- 241000194042 Streptococcus dysgalactiae Species 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 241001167808 Streptococcus gallolyticus UCN34 Species 0.000 description 1
- 241001147754 Streptococcus gordonii str. Challis Species 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 241000672607 Streptococcus mutans NN2025 Species 0.000 description 1
- 241000320123 Streptococcus pyogenes M1 GAS Species 0.000 description 1
- 241000103155 Streptococcus pyogenes MGAS10270 Species 0.000 description 1
- 241000103160 Streptococcus pyogenes MGAS10750 Species 0.000 description 1
- 241000103154 Streptococcus pyogenes MGAS2096 Species 0.000 description 1
- 241001520169 Streptococcus pyogenes MGAS315 Species 0.000 description 1
- 241001148739 Streptococcus pyogenes MGAS5005 Species 0.000 description 1
- 241001332083 Streptococcus pyogenes MGAS6180 Species 0.000 description 1
- 241000103156 Streptococcus pyogenes MGAS9429 Species 0.000 description 1
- 241001496716 Streptococcus pyogenes NZ131 Species 0.000 description 1
- 241001455236 Streptococcus pyogenes SSI-1 Species 0.000 description 1
- 241000192593 Synechocystis sp. PCC 6803 Species 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 241001496699 Thermomonospora curvata DSM 43183 Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 241000322994 Tolumonas auensis DSM 9187 Species 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000999858 Treponema denticola ATCC 35405 Species 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- 241000847071 Verminephrobacter eiseniae EF01-2 Species 0.000 description 1
- 241000605939 Wolinella succinogenes Species 0.000 description 1
- 241000883281 [Clostridium] cellulolyticum H10 Species 0.000 description 1
- 241000714896 [Eubacterium] rectale ATCC 33656 Species 0.000 description 1
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 210000003486 adipose tissue brown Anatomy 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 229940017800 lactobacillus casei Drugs 0.000 description 1
- 229940059406 lactobacillus rhamnosus gg Drugs 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000023895 stem cell maintenance Effects 0.000 description 1
- 229940115920 streptococcus dysgalactiae Drugs 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/635—Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3513—Protein; Peptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Peptides Or Proteins (AREA)
- Saccharide Compounds (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Lubricants (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
표적 핵산을 포함하는 DNA에 상보적인 1개 이상의 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, DNA에 결합하며 1개 이상의 RNA에 의해 가이드되는 뉴클레아제-기능부재 Cas9 단백질을 코딩하는 제2 외래 핵산을 세포 내로 도입하고, 전사 조절 단백질 또는 도메인을 코딩하는 제3 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 1개 이상의 RNA, 뉴클레아제-기능부재 Cas9 단백질 및 전사 조절 단백질 또는 도메인이 발현되고, 여기서 1개 이상의 RNA, 뉴클레아제-기능부재 Cas9 단백질 및 전사 조절 단백질 또는 도메인이 DNA로 공동-국재화되고, 여기서 전사 조절 단백질 또는 도메인이 표적 핵산의 발현을 조절하는 것인, 세포에서 표적 핵산의 발현을 조절하는 방법이 제공된다.
Description
관련 출원 데이터
본원은 2013년 6월 4일에 출원된 미국 특허 가출원 번호 61/830,787을 우선권 주장하며, 이로써 상기 문헌은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
정부 권리의 진술
본 발명은 미국 국립 보건원으로부터의 승인 번호 P50 HG005550 및 미국 에너지국으로부터의 DE-FG02-02ER63445 하에 정부 지원으로 이루어졌다. 정부는 본 발명에서 특정 권리를 갖는다.
박테리아성 및 고세균성 CRISPR-Cas 시스템은 침입 외래 핵산 내에 존재하는 상보적 서열의 분해를 지시하는 Cas 단백질과 복합체화된 짧은 가이드 RNA에 의존한다. 문헌 [Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011); Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579-2586 (2012); Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012); Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282 (2011); 및 Bhaya, D., Davison, M. & Barrangou, R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual review of genetics 45, 273-297 (2011)]을 참조한다. 최근, 에스. 피오게네스(S. pyogenes) 유형 II CRISPR 시스템을 시험관내에서 재구성한 결과, 정상적으로 트랜스-코딩된 tracrRNA ("트랜스-활성화 CRISPR RNA")와 융합된 crRNA ("CRISPR RNA")가, crRNA와 매칭되는 표적 DNA 서열을 서열-특이적으로 절단하도록 Cas9 단백질을 지시하는데 충분한 것으로 입증되었다. 표적 부위에 상동성인 gRNA의 발현은 Cas9 동원 및 표적 DNA의 분해를 유도한다. 문헌 [H. Deveau et al., Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of Bacteriology 190, 1390 (Feb, 2008)]을 참조한다.
본 개시내용의 측면은 가이드 RNA, DNA 결합 단백질 및 이중 가닥 DNA 표적 서열의 복합체에 관한 것이다. 특정 측면에 따르면, 본 개시내용의 범위 내의 DNA 결합 단백질은, 가이드 RNA와 복합체를 형성하는 단백질을 포함하는데, 여기서 가이드 RNA는 상기 복합체를 이중 가닥 DNA 서열로 가이드하고 여기서 상기 복합체가 DNA 서열에 결합한다. 본 개시내용의 이러한 측면은 이중 가닥 DNA로의 또는 그와의 RNA 및 DNA 결합 단백질의 공동-국재화로서 지칭될 수 있다. 이러한 방식으로, DNA 결합 단백질-가이드 RNA 복합체는 표적 DNA의 발현을 조절하기 위해 표적 DNA에 전사 조절 단백질 또는 도메인을 국재화시키는데 사용될 수 있다.
특정 측면에 따르면, 표적 핵산을 포함하는 DNA (데옥시리보핵산)에 상보적인 1개 이상의 RNA (리보핵산)를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, DNA에 결합하며 1개 이상의 RNA에 의해 가이드되는, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질을 코딩하는 제2 외래 핵산을 세포 내로 도입하고, 전사 조절 단백질 또는 도메인을 코딩하는 제3 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 1개 이상의 RNA, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질 및 전사 조절 단백질 또는 도메인이 발현되고, 여기서 1개 이상의 RNA, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질 및 전사 조절 단백질 또는 도메인이 DNA로 공동-국재화되고, 여기서 전사 조절 단백질 또는 도메인이 표적 핵산의 발현을 조절하는 것인, 세포에서 표적 핵산의 발현을 조절하는 방법이 제공된다.
한 측면에 따르면, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질을 코딩하는 외래 핵산은 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질에 융합된 전사 조절 단백질 또는 도메인을 추가로 코딩한다. 한 측면에 따르면, 1개 이상의 RNA를 코딩하는 외래 핵산은 RNA-결합 도메인의 표적을 추가로 코딩하고, 전사 조절 단백질 또는 도메인을 코딩하는 외래 핵산은 전사 조절 단백질 또는 도메인에 융합된 RNA-결합 도메인을 추가로 코딩한다.
한 측면에 따르면, 세포는 진핵 세포이다. 한 측면에 따르면, 세포는 효모 세포, 식물 세포 또는 동물 세포이다. 한 측면에 따르면, 세포는 포유동물 세포이다.
한 측면에 따르면, RNA는 약 10 내지 약 500개의 뉴클레오티드이다. 한 측면에 따르면, RNA는 약 20 내지 약 100개의 뉴클레오티드이다.
한 측면에 따르면, 전사 조절 단백질 또는 도메인은 전사 활성인자이다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 질환 또는 유해 상태를 치료하기 위해 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 표적 핵산은 질환 또는 유해 상태와 연관된다.
한 측면에 따르면, 1개 이상의 RNA는 가이드 RNA이다. 한 측면에 따르면, 1개 이상의 RNA는 tracrRNA-crRNA 융합체이다. 한 측면에 따르면, 가이드 RNA는 스페이서 서열 및 트레이서 메이트 서열을 포함한다. 가이드 RNA는 또한, 일부가 tracr 메이트 서열에 혼성화되는 tracr 서열을 포함할 수 있다. 가이드 RNA는 또한, tracrRNA-crRNA 융합체를 생산하기 위해 트레이서 메이트 서열 및 tracr 서열을 연결하는 링커 핵산 서열을 포함할 수 있다. 스페이서 서열은, 예컨대 혼성화에 의해 표적 DNA에 결합한다.
한 측면에 따르면, 가이드 RNA는 말단절단된 스페이서 서열을 포함한다. 한 측면에 따르면, 가이드 RNA는 스페이서 서열의 5' 말단에 1개의 염기 말단절단을 갖는 말단절단된 스페이서 서열을 포함한다. 한 측면에 따르면, 가이드 RNA는 스페이서 서열의 5' 말단에 2개의 염기 말단절단을 갖는 말단절단된 스페이서 서열을 포함한다. 한 측면에 따르면, 가이드 RNA는 스페이서 서열의 5' 말단에 3개의 염기 말단절단을 갖는 말단절단된 스페이서 서열을 포함한다. 한 측면에 따르면, 가이드 RNA는 스페이서 서열의 5' 말단 에 4개의 염기 말단절단을 갖는 말단절단된 스페이서 서열을 포함한다. 따라서, 스페이서 서열은 스페이서 서열의 5' 말단에 1 내지 4개의 염기 말단절단을 가질 수 있다.
특정 실시양태에 따르면, 스페이서 서열은 표적 핵산 서열에 혼성화되는 약 16 내지 약 20개의 뉴클레오티드를 포함할 수 있다. 특정 실시양태에 따르면, 스페이서 서열은 표적 핵산 서열에 혼성화되는 약 20개의 뉴클레오티드를 포함할 수 있다.
특정 측면에 따르면, 링커 핵산 서열은 약 4 내지 약 6개의 핵산을 포함할 수 있다.
특정 측면에 따르면, tracr 서열은 약 60 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 64 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 65 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 66 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 67 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 68 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 69 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 70 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 80 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 90 내지 약 500개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 100 내지 약 500개의 핵산을 포함할 수 있다.
특정 측면에 따르면, tracr 서열은 약 60 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 64 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 65 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 66 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 67 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 68 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 69 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 70 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 80 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 90 내지 약 200개의 핵산을 포함할 수 있다. 특정 측면에 따르면, tracr 서열은 약 100 내지 약 200개의 핵산을 포함할 수 있다.
예시적인 가이드 RNA가 도 5b에 도시된다.
한 측면에 따르면, DNA는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA 또는 외인성 DNA이다.
특정 측면에 따르면, 표적 핵산을 포함하는 DNA (데옥시리보핵산)에 상보적인 1개 이상의 RNA (리보핵산)를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, DNA에 결합하며 1개 이상의 RNA에 의해 가이드되는 유형 II CRISPR 시스템의 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질을 코딩하는 제2 외래 핵산을 세포 내로 도입하고, 전사 조절 단백질 또는 도메인을 코딩하는 제3 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 1개 이상의 RNA, 유형 II CRISPR 시스템의 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질 및 전사 조절 단백질 또는 도메인이 발현되고, 여기서 1개 이상의 RNA, 유형 II CRISPR 시스템의 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질 및 전사 조절 단백질 또는 도메인이 DNA로 공동-국재화되고, 여기서 전사 조절 단백질 또는 도메인이 표적 핵산의 발현을 조절하는 것인, 세포에서 표적 핵산의 발현을 조절하는 방법이 제공된다.
한 측면에 따르면, 유형 II CRISPR 시스템의 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질을 코딩하는 외래 핵산은 유형 II CRISPR 시스템의 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질에 융합된 전사 조절 단백질 또는 도메인을 추가로 코딩한다. 한 측면에 따르면, 1개 이상의 RNA를 코딩하는 외래 핵산은 RNA-결합 도메인의 표적을 추가로 코딩하고, 전사 조절 단백질 또는 도메인을 코딩하는 외래 핵산은 전사 조절 단백질 또는 도메인에 융합된 RNA-결합 도메인을 추가로 코딩한다.
한 측면에 따르면, 세포는 진핵 세포이다. 한 측면에 따르면, 세포는 효모 세포, 식물 세포 또는 동물 세포이다. 한 측면에 따르면, 세포는 포유동물 세포이다.
한 측면에 따르면, RNA는 약 10 내지 약 500개의 뉴클레오티드이다. 한 측면에 따르면, RNA는 약 20 내지 약 100개의 뉴클레오티드이다.
한 측면에 따르면, 전사 조절 단백질 또는 도메인은 전사 활성인자이다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 질환 또는 유해 상태를 치료하기 위해 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 표적 핵산은 질환 또는 유해 상태와 연관된다.
한 측면에 따르면, 1개 이상의 RNA는 가이드 RNA이다. 한 측면에 따르면, 1개 이상의 RNA는 tracrRNA-crRNA 융합체이다.
한 측면에 따르면, DNA는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA 또는 외인성 DNA이다.
특정 측면에 따르면, 표적 핵산을 포함하는 DNA (데옥시리보핵산)에 상보적인 1개 이상의 RNA (리보핵산)를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, DNA에 결합하며 1개 이상의 RNA에 의해 가이드되는 뉴클레아제-기능부재 Cas9 단백질을 코딩하는 제2 외래 핵산을 세포 내로 도입하고, 전사 조절 단백질 또는 도메인을 코딩하는 제3 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 1개 이상의 RNA, 뉴클레아제-기능부재 Cas9 단백질 및 전사 조절 단백질 또는 도메인이 발현되고, 여기서 1개 이상의 RNA, 뉴클레아제-기능부재 Cas9 단백질 및 전사 조절 단백질 또는 도메인이 DNA로 공동-국재화되고, 여기서 전사 조절 단백질 또는 도메인이 표적 핵산의 발현을 조절하는 것인, 세포에서 표적 핵산의 발현을 조절하는 방법이 제공된다.
한 측면에 따르면, 뉴클레아제-기능부재 Cas9 단백질을 코딩하는 외래 핵산은 뉴클레아제-기능부재 Cas9 단백질에 융합된 전사 조절 단백질 또는 도메인을 추가로 코딩한다. 한 측면에 따르면, 1개 이상의 RNA를 코딩하는 외래 핵산은 RNA-결합 도메인의 표적을 추가로 코딩하고, 전사 조절 단백질 또는 도메인을 코딩하는 외래 핵산은 전사 조절 단백질 또는 도메인에 융합된 RNA-결합 도메인을 추가로 코딩한다.
한 측면에 따르면, 세포는 진핵 세포이다. 한 측면에 따르면, 세포는 효모 세포, 식물 세포 또는 동물 세포이다. 한 측면에 따르면, 세포는 포유동물 세포이다.
한 측면에 따르면, RNA는 약 10 내지 약 500개의 뉴클레오티드이다. 한 측면에 따르면, RNA는 약 20 내지 약 100개의 뉴클레오티드이다.
한 측면에 따르면, 전사 조절 단백질 또는 도메인은 전사 활성인자이다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 질환 또는 유해 상태를 치료하기 위해 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 표적 핵산은 질환 또는 유해 상태와 연관된다.
한 측면에 따르면, 1개 이상의 RNA는 가이드 RNA이다. 한 측면에 따르면, 1개 이상의 RNA는 tracrRNA-crRNA 융합체이다.
한 측면에 따르면, DNA는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA 또는 외인성 DNA이다.
한 측면에 따르면, 표적 핵산을 포함하는 DNA에 상보적인 1개 이상의 RNA를 코딩하는 제1 외래 핵산, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질을 코딩하는 제2 외래 핵산, 및 전사 조절 단백질 또는 도메인을 코딩하는 제3 외래 핵산을 포함하며, 여기서 1개 이상의 RNA, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질 및 전사 조절 단백질 또는 도메인이 표적 핵산에 대한 공동-국재화 복합체의 구성원인 세포가 제공된다.
한 측면에 따르면, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질을 코딩하는 외래 핵산은 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질에 융합된 전사 조절 단백질 또는 도메인을 추가로 코딩한다. 한 측면에 따르면, 1개 이상의 RNA를 코딩하는 외래 핵산은 RNA-결합 도메인의 표적을 추가로 코딩하고, 전사 조절 단백질 또는 도메인을 코딩하는 외래 핵산은 전사 조절 단백질 또는 도메인에 융합된 RNA-결합 도메인을 추가로 코딩한다.
한 측면에 따르면, 세포는 진핵 세포이다. 한 측면에 따르면, 세포는 효모 세포, 식물 세포 또는 동물 세포이다. 한 측면에 따르면, 세포는 포유동물 세포이다.
한 측면에 따르면, RNA는 약 10 내지 약 500개의 뉴클레오티드이다. 한 측면에 따르면, RNA는 약 20 내지 약 100개의 뉴클레오티드이다.
한 측면에 따르면, 전사 조절 단백질 또는 도메인은 전사 활성인자이다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 전사 조절 단백질 또는 도메인은 질환 또는 유해 상태를 치료하기 위해 표적 핵산의 발현을 상향조절한다. 한 측면에 따르면, 표적 핵산은 질환 또는 유해 상태와 연관된다.
한 측면에 따르면, 1개 이상의 RNA는 가이드 RNA이다. 한 측면에 따르면, 1개 이상의 RNA는 tracrRNA-crRNA 융합체이다.
한 측면에 따르면, DNA는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA 또는 외인성 DNA이다.
특정 측면에 따르면, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질은 유형 II CRISPR 시스템의 RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질이다. 특정 측면에 따르면, RNA 가이드된 뉴클레아제-기능부재 DNA 결합 단백질은 뉴클레아제-기능부재 Cas9 단백질이다.
한 측면에 따르면, 각각의 RNA가 DNA 표적 핵산 내의 인접 부위에 상보적인 2개 이상의 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, 2개 이상의 RNA에 의해 가이드되는 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제를 코딩하는 제2 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 2개 이상의 RNA 및 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 발현되고, 여기서 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 2개 이상의 RNA와 함께 DNA 표적 핵산으로 공동-국재화되고, DNA 표적 핵산을 닉킹하여 2개 이상의 인접 닉을 생성하는 것인, 세포에서 DNA 표적 핵산을 변경시키는 방법이 제공된다.
한 측면에 따르면, 각각의 RNA가 DNA 표적 핵산 내의 인접 부위에 상보적인 2개 이상의 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, 2개 이상의 RNA에 의해 가이드되는 유형 II CRISPR 시스템의 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제를 코딩하는 제2 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 2개 이상의 RNA 및 유형 II CRISPR 시스템의 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 발현되고, 여기서 유형 II CRISPR 시스템의 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 2개 이상의 RNA와 함께 DNA 표적 핵산으로 공동-국재화되고, DNA 표적 핵산을 닉킹하여 2개 이상의 인접 닉을 생성하는 것인, 세포에서 DNA 표적 핵산을 변경시키는 방법이 제공된다.
한 측면에 따르면, 각각의 RNA가 DNA 표적 핵산 내의 인접 부위에 상보적인 2개 이상의 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, 1개의 불활성 뉴클레아제 도메인을 가지며 2개 이상의 RNA에 의해 가이드되는 1개 이상의 Cas9 단백질 닉카제를 코딩하는 제2 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 2개 이상의 RNA 및 1개 이상의 Cas9 단백질 닉카제가 발현되고, 여기서 1개 이상의 Cas9 단백질 닉카제가 2개 이상의 RNA와 함께 DNA 표적 핵산으로 공동-국재화되고, DNA 표적 핵산을 닉킹하여 2개 이상의 인접 닉을 생성하는 것인, 세포에서 DNA 표적 핵산을 변경시키는 방법이 제공된다.
DNA 표적 핵산을 변경시키는 방법에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 동일한 가닥 상에 있다. 한 측면에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 동일한 가닥 상에 있고, 상동 재조합을 일으킨다. 한 측면에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 상이한 가닥 상에 있다. 한 측면에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 상이한 가닥 상에 있고, 이중 가닥 파괴를 생성한다. 한 측면에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 상이한 가닥 상에 있고, 비상동 말단 연결을 일으키는 이중 가닥 파괴를 생성한다. 한 측면에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 상이한 가닥 상에 있고, 서로에 대해 오프셋된다. 한 측면에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 상이한 가닥 상에 있고, 서로에 대해 오프셋되고, 이중 가닥 파괴를 생성한다. 한 측면에 따르면, 2개 이상의 인접 닉은 이중 가닥 DNA의 상이한 가닥 상에 있고, 서로에 대해 오프셋되고, 비상동 말단 연결을 일으키는 이중 가닥 파괴를 생성한다. 한 측면에 따르면, 방법은 공여자 핵산 서열을 코딩하는 제3 외래 핵산을 세포 내로 도입하는 것을 추가로 포함하며, 여기서 2개 이상의 닉은 표적 핵산과 공여자 핵산 서열의 상동 재조합을 일으킨다.
한 측면에 따르면, 각각의 RNA가 DNA 표적 핵산 내의 인접 부위에 상보적인 2개 이상의 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, 2개 이상의 RNA에 의해 가이드되는 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제를 코딩하는 제2 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 2개 이상의 RNA 및 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 발현되고, 여기서 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 2개 이상의 RNA와 함께 DNA 표적 핵산으로 공동-국재화되고, DNA 표적 핵산을 닉킹하여 2개 이상의 인접 닉을 생성하고, 여기서 2개 이상의 인접 닉이 이중 가닥 DNA의 상이한 가닥 상에 있고, 표적 핵산의 단편화를 일으키는 이중 가닥 파괴를 생성하여 표적 핵산의 발현을 방지하는 것인, 세포에서 DNA 표적 핵산을 변경시키는 방법이 제공된다.
한 측면에 따르면, 각각의 RNA가 DNA 표적 핵산 내의 인접 부위에 상보적인 2개 이상의 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, 2개 이상의 RNA에 의해 가이드되는 유형 II CRISPR 시스템의 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제를 코딩하는 제2 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 2개 이상의 RNA 및 유형 II CRISPR 시스템의 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 발현되고, 여기서 유형 II CRISPR 시스템의 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 2개 이상의 RNA와 함께 DNA 표적 핵산으로 공동-국재화되고, DNA 표적 핵산을 닉킹하여 2개 이상의 인접 닉을 생성하고, 여기서 2개 이상의 인접 닉이 이중 가닥 DNA의 상이한 가닥 상에 있고, 표적 핵산의 단편화를 일으키는 이중 가닥 파괴를 생성하여 표적 핵산의 발현을 방지하는 것인, 세포에서 DNA 표적 핵산을 변경시키는 방법이 제공된다.
한 측면에 따르면, 각각의 RNA가 DNA 표적 핵산 내의 인접 부위에 상보적인 2개 이상의 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하고, 1개의 불활성 뉴클레아제 도메인을 가지며 2개 이상의 RNA에 의해 가이드되는 1개 이상의 Cas9 단백질 닉카제를 코딩하는 제2 외래 핵산을 세포 내로 도입하는 것을 포함하며, 여기서 2개 이상의 RNA 및 1개 이상의 Cas9 단백질 닉카제가 발현되고, 여기서 1개 이상의 Cas9 단백질 닉카제가 2개 이상의 RNA와 함께 DNA 표적 핵산으로 공동-국재화되고, DNA 표적 핵산을 닉킹하여 2개 이상의 인접 닉을 생성하고, 여기서 2개 이상의 인접 닉이 이중 가닥 DNA의 상이한 가닥 상에 있고, 표적 핵산의 단편화를 일으키는 이중 가닥 파괴를 생성하여 표적 핵산의 발현을 방지하는 것인, 세포에서 DNA 표적 핵산을 변경시키는 방법이 제공된다.
한 측면에 따르면, 각각의 RNA가 DNA 표적 핵산 내의 인접 부위에 상보적인 2개 이상의 RNA를 코딩하는 제1 외래 핵산, 및 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제를 코딩하는 제2 외래 핵산을 포함하며, 여기서 2개 이상의 RNA 및 1개 이상의 RNA 가이드된 DNA 결합 단백질 닉카제가 DNA 표적 핵산에 대한 공동-국재화 복합체의 구성원인 세포가 제공된다.
한 측면에 따르면, RNA 가이드된 DNA 결합 단백질 닉카제는 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질 닉카제이다. 한 측면에 따르면, RNA 가이드된 DNA 결합 단백질 닉카제는 1개의 불활성 뉴클레아제 도메인을 갖는 Cas9 단백질 닉카제이다.
한 측면에 따르면, 세포는 진핵 세포이다. 한 측면에 따르면, 세포는 효모 세포, 식물 세포 또는 동물 세포이다. 한 측면에 따르면, 세포는 포유동물 세포이다.
한 측면에 따르면, RNA는 약 10 내지 약 500개의 뉴클레오티드를 포함한다. 한 측면에 따르면, RNA는 약 20 내지 약 100개의 뉴클레오티드를 포함한다.
한 측면에 따르면, 표적 핵산은 질환 또는 유해 상태와 연관된다.
한 측면에 따르면, 2개 이상의 RNA는 가이드 RNA이다. 한 측면에 따르면, 2개 이상의 RNA는 tracrRNA-crRNA 융합체이다.
한 측면에 따르면, DNA 표적 핵산은 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA 또는 외인성 DNA이다.
본 발명의 특정 실시양태의 추가의 특징 및 이점은 하기 실시양태의 설명 및 그의 도면, 및 청구범위로부터 보다 충분히 명백해질 것이다.
특허 또는 출원 파일은 컬러로 제작된 도면을 포함한다. 요청 및 필요한 요금의 지불시 사무국으로부터 컬러 도면을 포함하는 본 특허 또는 특허 출원 공개의 사본이 제공될 것이다. 본 발명의 상기 및 다른 특징 및 이점은 첨부된 도면과 함께 하기 예시적 실시양태의 상세한 설명으로부터 보다 충분히 이해될 것이다.
도 1a 및 도 1b는 RNA-가이드된 전사 활성화의 개략도이다. 도 1c는 리포터 구축물의 설계이다. 도 1d는 Cas9N-VP64 융합체가 형광-활성화 세포 분류 (FACS) 및 면역형광 검정 (IF) 둘 다에 의해 검정시에 RNA-가이드된 전사 활성화를 나타낸다는 것을 입증하는 데이터를 보여준다. 도 1e는 Cas9N, MS2-VP64, 및 적절한 MS2 압타머 결합 부위를 보유하는 gRNA의 존재 하에 리포터 구축물로부터의 gRNA 서열-특이적 전사 활성화를 입증하는, FACS 및 IF에 의한 검정 데이터를 보여준다. 도 1f는 개별 gRNA 및 다중 gRNA에 의한 전사 유도를 입증하는 데이터를 도시한다.
도 2a는 Cas9-gRNA 복합체 및 TALE에 의한 표적화의 랜드스케이프를 평가하기 위한 방법론을 도시한다. 도 2b는 Cas9-gRNA 복합체가 평균적으로 그의 표적 서열에서 1-3개의 돌연변이에 내성이 있다는 것을 입증하는 데이터를 도시한다. 도 2c는 Cas9-gRNA 복합체가, PAM 서열에 국재화된 것들을 제외하고는 주로 점 돌연변이에 비감수성이라는 것을 입증하는 데이터를 도시한다. 도 2d는 2개의 염기 미스매치의 도입이 Cas9-gRNA 복합체 활성을 유의하게 손상시킨다는 것을 입증하는 열 플롯 데이터를 도시한다. 도 2e는 18-량체 TALE가 평균적으로 그의 표적 서열에서 1-2개의 돌연변이에 내성을 나타낸다는 것을 입증하는 데이터를 도시한다. 도 2f는 18-량체 TALE가, 그의 표적에서 미스매치된 단일 염기에 주로 비감수성인 Cas9-gRNA 복합체와 유사하다는 것을 입증하는 데이터를 도시한다. 도 2g는 2개의 염기 미스매치의 도입이 18-량체 TALE 활성을 유의하게 손상시킨다는 것을 입증하는 열 플롯 데이터를 도시한다.
도 3a는 가이드 RNA 설계의 개략도를 도시한다. 도 3b는 5' 오버행으로 이어지는 오프셋 닉 및 3' 오버행으로 이어지는 오프셋 닉에 대한 비-상동 말단 연결의 백분율 비율을 보여주는 데이터를 도시한다. 도 3c는 5' 오버행으로 이어지는 오프셋 닉 및 3' 오버행으로 이어지는 오프셋 닉에 대한 표적화의 백분율 비율을 보여주는 데이터를 도시한다.
도 4a는 RuvC PDB ID: 4EP4 (청색) 위치 D7에서의 금속 배위 잔기의 개략도 (좌측), 배위된 Mg-이온 (회색 구체) 및 3M7K로부터의 DNA (자주색)를 포함하는 PDB ID: 3M7K (오렌지색) 및 4H9D (시안색)로부터의 HNH 엔도뉴클레아제 도메인의 개략도 (중앙) 및 분석된 돌연변이체의 목록 (우측)이다. 도 4b는 Cas9 돌연변이체 m3 및 m4 및 또한 VP64와의 이들 각각의 융합체에 대한 검출불가능한 뉴클레아제 활성을 보여주는 데이터를 도시한다. 도 4c는 도 4b에서의 데이터의 보다 고해상도 검사이다.
도 5a는 Cas9-gRNA 활성을 결정하기 위한 상동 재조합 검정의 개략도이다. 도 5b는 무작위 서열 삽입을 갖는 가이드 RNA 및 상동 재조합의 백분율 비율을 도시한다.
도 6a는 OCT4 유전자에 대한 가이드 RNA의 개략도이다. 도 6b는 프로모터-루시페라제 리포터 구축물에 대한 전사 활성화를 도시한다. 도 6c는 내인성 유전자의 qPCR을 통한 전사 활성화를 도시한다.
도 7a는 REX1 유전자에 대한 가이드 RNA의 개략도이다. 도 7b는 프로모터-루시페라제 리포터 구축물에 대한 전사 활성화를 도시한다. 도 7c는 내인성 유전자의 qPCR을 통한 전사 활성화를 도시한다.
도 8a는 정규화된 발현 수준의 계산을 위한 고수준 특이성 분석 프로세싱 흐름 개략도를 도시한다. 도 8b는 편재된 구축물 라이브러리 내에 생성된 미스매치의 수에 대한 결합 부위의 백분율의 분포의 데이터를 도시한다. 좌측: 이론적 분포. 우측: 실제 TALE 구축물 라이브러리로부터 관찰된 분포. 도 8c는 미스매치의 수에 대한 결합 부위에 대해 집계된 태그 카운트의 백분율의 분포의 데이터를 도시한다. 좌측: 양성 대조군 샘플로부터 관찰된 분포. 우측: 비-대조군 TALE가 유도된 샘플로부터 관찰된 분포.
도 9a는 그의 표적 서열에서 1-3개의 돌연변이에 내성을 보여주는 Cas9-gRNA 복합체의 표적화 랜드스캐이프의 분석에 대한 데이터를 도시한다. 도 9b는 PAM 서열에 국재된 것들을 제외하고는 점 돌연변이에 대해 비감수성을 보여주는 Cas9-gRNA 복합체의 표적화 랜드스케이프의 분석에 대한 데이터를 도시한다. 도 9c는 2개의 염기 미스매치의 도입이 활성을 유의하게 손상시킨다는 것을 보여주는 Cas9-gRNA 복합체의 표적화 랜드스케이프의 분석에 대한 열 플롯 데이터를 도시한다. 도 9d는 에스. 피오게네스 Cas9에 대한 추정 PAM이 NGG 및 또한 NAG임을 확인하는 뉴클레아제 매개 HR 검정으로부터의 데이터를 도시한다.
도 10a는 18-량체 TALE가 그의 표적 서열에서 다중 돌연변이를 허용한다는 것을 확인하는 뉴클레아제 매개 HR 검정으로부터의 데이터를 도시한다. 도 10b는 3가지 상이한 크기 (18-량체, 14-량체 및 10-량체)의 TALE의 표적화 랜드스케이프의 분석으로부터의 데이터를 도시한다. 도 10c는 근사 단일-염기 미스매치 해상도를 나타내는 10-량체 TALE에 대한 데이터를 도시한다. 도 10d는 근사 단일-염기 미스매치 해상도를 나타내는 10-량체 TALE에 대한 열 플롯 데이터를 도시한다.
도 11a는 설계된 가이드 RNA 도시한다. 도 11b는 다양한 가이드 RNA에 대한 비상동 말단 연결의 백분율 비율을 도시한다.
도 12a는 Sox2 유전자를 도시한다. 도 12b는 Nanog 유전자를 도시한다.
도 13a-13f는 2개의 추가의 Cas9-gRNA 복합체의 표적화 랜드스케이프를 도시한다.
도 14a는 2개의 gRNA (야생형(서열식별번호:88) 및 돌연변이체(서열식별번호:89-90))의 특이성 프로파일을 도시한다. 상이한 서열은 적색으로 강조 표시하였다. 도 14b 및 14c는 이 검정이 평가 대상 gRNA에 대해 특이적임을 도시한다 (데이터는 도 13d로부터 재플롯팅됨).
도 15a-15d는 스페이서 서열 대 표적에서 단일 또는 이중-염기 미스매치 (적색으로 강조 표시됨)를 보유하는 gRNA2 (도 15a-b) 및 gRNA3 (도 15c-d)을 도시한다. 서열은 서열식별번호:91-131에서 제시된 것과 같다.
도 16a-16d는 시험된 2개의 독립된 gRNA의 뉴클레아제 검정을 도시한다: 스페이서의 5' 말단에서 말단절단된 gRNA1 (도 16a-b) 및 gRNA3 (도 16c-d). 서열은 서열식별번호:66, 185-186 및 133-140에서 제시된 것과 같다.
도 17a-17b는 에스. 피오게네스 Cas9에 대한 PAM이 NGG이고, 또한 NAG임을 보여주는 뉴클레아제 매개 HR 검정을 도시한다. 서열은 서열식별번호:67-69 및 141에서 제시된 것과 같다.
도 18a-18b는 18량체 TALE가 그의 표적 서열에 다중 돌연변이를 허용한다는 것을 확인하는 뉴클레아제 매개 HR 검정을 도시한다. 서열은 서열식별번호:70-73에서 제시된 것과 같다.
도 19a-19c는 TALE 단량체 특이성 대 TALE 단백질 특이성의 비교를 도시한다. 서열은 서열식별번호:142-150에서 제시된 것과 같다.
도 20a-20b는 오프셋 닉킹과 관련된 데이터를 도시한다. 서열은 서열식별번호:151-158에서 제시된 것과 같다.
도 21a-21c는 오프셋 닉킹 및 NHEJ 프로파일을 도시한다. 서열은 서열식별번호:159-184 및 187에서 제시된 것과 같다.
도 1a 및 도 1b는 RNA-가이드된 전사 활성화의 개략도이다. 도 1c는 리포터 구축물의 설계이다. 도 1d는 Cas9N-VP64 융합체가 형광-활성화 세포 분류 (FACS) 및 면역형광 검정 (IF) 둘 다에 의해 검정시에 RNA-가이드된 전사 활성화를 나타낸다는 것을 입증하는 데이터를 보여준다. 도 1e는 Cas9N, MS2-VP64, 및 적절한 MS2 압타머 결합 부위를 보유하는 gRNA의 존재 하에 리포터 구축물로부터의 gRNA 서열-특이적 전사 활성화를 입증하는, FACS 및 IF에 의한 검정 데이터를 보여준다. 도 1f는 개별 gRNA 및 다중 gRNA에 의한 전사 유도를 입증하는 데이터를 도시한다.
도 2a는 Cas9-gRNA 복합체 및 TALE에 의한 표적화의 랜드스케이프를 평가하기 위한 방법론을 도시한다. 도 2b는 Cas9-gRNA 복합체가 평균적으로 그의 표적 서열에서 1-3개의 돌연변이에 내성이 있다는 것을 입증하는 데이터를 도시한다. 도 2c는 Cas9-gRNA 복합체가, PAM 서열에 국재화된 것들을 제외하고는 주로 점 돌연변이에 비감수성이라는 것을 입증하는 데이터를 도시한다. 도 2d는 2개의 염기 미스매치의 도입이 Cas9-gRNA 복합체 활성을 유의하게 손상시킨다는 것을 입증하는 열 플롯 데이터를 도시한다. 도 2e는 18-량체 TALE가 평균적으로 그의 표적 서열에서 1-2개의 돌연변이에 내성을 나타낸다는 것을 입증하는 데이터를 도시한다. 도 2f는 18-량체 TALE가, 그의 표적에서 미스매치된 단일 염기에 주로 비감수성인 Cas9-gRNA 복합체와 유사하다는 것을 입증하는 데이터를 도시한다. 도 2g는 2개의 염기 미스매치의 도입이 18-량체 TALE 활성을 유의하게 손상시킨다는 것을 입증하는 열 플롯 데이터를 도시한다.
도 3a는 가이드 RNA 설계의 개략도를 도시한다. 도 3b는 5' 오버행으로 이어지는 오프셋 닉 및 3' 오버행으로 이어지는 오프셋 닉에 대한 비-상동 말단 연결의 백분율 비율을 보여주는 데이터를 도시한다. 도 3c는 5' 오버행으로 이어지는 오프셋 닉 및 3' 오버행으로 이어지는 오프셋 닉에 대한 표적화의 백분율 비율을 보여주는 데이터를 도시한다.
도 4a는 RuvC PDB ID: 4EP4 (청색) 위치 D7에서의 금속 배위 잔기의 개략도 (좌측), 배위된 Mg-이온 (회색 구체) 및 3M7K로부터의 DNA (자주색)를 포함하는 PDB ID: 3M7K (오렌지색) 및 4H9D (시안색)로부터의 HNH 엔도뉴클레아제 도메인의 개략도 (중앙) 및 분석된 돌연변이체의 목록 (우측)이다. 도 4b는 Cas9 돌연변이체 m3 및 m4 및 또한 VP64와의 이들 각각의 융합체에 대한 검출불가능한 뉴클레아제 활성을 보여주는 데이터를 도시한다. 도 4c는 도 4b에서의 데이터의 보다 고해상도 검사이다.
도 5a는 Cas9-gRNA 활성을 결정하기 위한 상동 재조합 검정의 개략도이다. 도 5b는 무작위 서열 삽입을 갖는 가이드 RNA 및 상동 재조합의 백분율 비율을 도시한다.
도 6a는 OCT4 유전자에 대한 가이드 RNA의 개략도이다. 도 6b는 프로모터-루시페라제 리포터 구축물에 대한 전사 활성화를 도시한다. 도 6c는 내인성 유전자의 qPCR을 통한 전사 활성화를 도시한다.
도 7a는 REX1 유전자에 대한 가이드 RNA의 개략도이다. 도 7b는 프로모터-루시페라제 리포터 구축물에 대한 전사 활성화를 도시한다. 도 7c는 내인성 유전자의 qPCR을 통한 전사 활성화를 도시한다.
도 8a는 정규화된 발현 수준의 계산을 위한 고수준 특이성 분석 프로세싱 흐름 개략도를 도시한다. 도 8b는 편재된 구축물 라이브러리 내에 생성된 미스매치의 수에 대한 결합 부위의 백분율의 분포의 데이터를 도시한다. 좌측: 이론적 분포. 우측: 실제 TALE 구축물 라이브러리로부터 관찰된 분포. 도 8c는 미스매치의 수에 대한 결합 부위에 대해 집계된 태그 카운트의 백분율의 분포의 데이터를 도시한다. 좌측: 양성 대조군 샘플로부터 관찰된 분포. 우측: 비-대조군 TALE가 유도된 샘플로부터 관찰된 분포.
도 9a는 그의 표적 서열에서 1-3개의 돌연변이에 내성을 보여주는 Cas9-gRNA 복합체의 표적화 랜드스캐이프의 분석에 대한 데이터를 도시한다. 도 9b는 PAM 서열에 국재된 것들을 제외하고는 점 돌연변이에 대해 비감수성을 보여주는 Cas9-gRNA 복합체의 표적화 랜드스케이프의 분석에 대한 데이터를 도시한다. 도 9c는 2개의 염기 미스매치의 도입이 활성을 유의하게 손상시킨다는 것을 보여주는 Cas9-gRNA 복합체의 표적화 랜드스케이프의 분석에 대한 열 플롯 데이터를 도시한다. 도 9d는 에스. 피오게네스 Cas9에 대한 추정 PAM이 NGG 및 또한 NAG임을 확인하는 뉴클레아제 매개 HR 검정으로부터의 데이터를 도시한다.
도 10a는 18-량체 TALE가 그의 표적 서열에서 다중 돌연변이를 허용한다는 것을 확인하는 뉴클레아제 매개 HR 검정으로부터의 데이터를 도시한다. 도 10b는 3가지 상이한 크기 (18-량체, 14-량체 및 10-량체)의 TALE의 표적화 랜드스케이프의 분석으로부터의 데이터를 도시한다. 도 10c는 근사 단일-염기 미스매치 해상도를 나타내는 10-량체 TALE에 대한 데이터를 도시한다. 도 10d는 근사 단일-염기 미스매치 해상도를 나타내는 10-량체 TALE에 대한 열 플롯 데이터를 도시한다.
도 11a는 설계된 가이드 RNA 도시한다. 도 11b는 다양한 가이드 RNA에 대한 비상동 말단 연결의 백분율 비율을 도시한다.
도 12a는 Sox2 유전자를 도시한다. 도 12b는 Nanog 유전자를 도시한다.
도 13a-13f는 2개의 추가의 Cas9-gRNA 복합체의 표적화 랜드스케이프를 도시한다.
도 14a는 2개의 gRNA (야생형(서열식별번호:88) 및 돌연변이체(서열식별번호:89-90))의 특이성 프로파일을 도시한다. 상이한 서열은 적색으로 강조 표시하였다. 도 14b 및 14c는 이 검정이 평가 대상 gRNA에 대해 특이적임을 도시한다 (데이터는 도 13d로부터 재플롯팅됨).
도 15a-15d는 스페이서 서열 대 표적에서 단일 또는 이중-염기 미스매치 (적색으로 강조 표시됨)를 보유하는 gRNA2 (도 15a-b) 및 gRNA3 (도 15c-d)을 도시한다. 서열은 서열식별번호:91-131에서 제시된 것과 같다.
도 16a-16d는 시험된 2개의 독립된 gRNA의 뉴클레아제 검정을 도시한다: 스페이서의 5' 말단에서 말단절단된 gRNA1 (도 16a-b) 및 gRNA3 (도 16c-d). 서열은 서열식별번호:66, 185-186 및 133-140에서 제시된 것과 같다.
도 17a-17b는 에스. 피오게네스 Cas9에 대한 PAM이 NGG이고, 또한 NAG임을 보여주는 뉴클레아제 매개 HR 검정을 도시한다. 서열은 서열식별번호:67-69 및 141에서 제시된 것과 같다.
도 18a-18b는 18량체 TALE가 그의 표적 서열에 다중 돌연변이를 허용한다는 것을 확인하는 뉴클레아제 매개 HR 검정을 도시한다. 서열은 서열식별번호:70-73에서 제시된 것과 같다.
도 19a-19c는 TALE 단량체 특이성 대 TALE 단백질 특이성의 비교를 도시한다. 서열은 서열식별번호:142-150에서 제시된 것과 같다.
도 20a-20b는 오프셋 닉킹과 관련된 데이터를 도시한다. 서열은 서열식별번호:151-158에서 제시된 것과 같다.
도 21a-21c는 오프셋 닉킹 및 NHEJ 프로파일을 도시한다. 서열은 서열식별번호:159-184 및 187에서 제시된 것과 같다.
본 개시내용의 실시양태는 DNA에 전사 조절 단백질 또는 도메인을, 표적 핵산을 조절하는 방식으로 공동-국재화시키기 위한 DNA 결합 단백질의 사용에 기초한다. 다양한 목적을 위해 DNA에 결합하는 이러한 DNA 결합 단백질은 통상의 기술자에게 널리 공지되어 있다. 이러한 DNA 결합 단백질은 자연 발생의 것일 수 있다. 본 개시내용의 범위 내에 포함되는 DNA 결합 단백질은 본원에서 가이드 RNA로 지칭되는 RNA에 의해 가이드될 수 있는 것들을 포함한다. 이러한 측면에 따르면, 가이드 RNA와 RNA 가이드된 DNA 결합 단백질은 DNA에서 공동-국재화 복합체를 형성한다. 특정 측면에 따르면, DNA 결합 단백질은 뉴클레아제-기능부재 DNA 결합 단백질일 수 있다. 이러한 측면에 따르면, 뉴클레아제-기능부재 DNA 결합 단백질은 뉴클레아제 활성을 갖는 DNA 결합 단백질의 변경 또는 변형으로부터 생성될 수 있다. 뉴클레아제 활성을 갖는 이러한 DNA 결합 단백질은 통상의 기술자에게 공지되어 있고, 예를 들어 유형 II CRISPR 시스템으로 존재하는, Cas9 단백질과 같은, 뉴클레아제 활성을 갖는 자연 발생 DNA 결합 단백질을 포함한다. 이러한 Cas9 단백질 및 유형 II CRISPR 시스템은 관련 기술분야에 널리 문헌화되어 있다. 모든 보충 정보를 포함하여 문헌 [Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477]을 참조하며, 이는 그 전문이 본원에 참조로 포함된다.
뉴클레아제 활성을 갖는 예시적인 DNA 결합 단백질은 이중 가닥 DNA를 닉킹하거나 컷팅하는 기능을 한다. 이러한 뉴클레아제 활성은 뉴클레아제 활성을 나타내는 하나 이상의 폴리펩티드 서열을 갖는 DNA 결합 단백질로부터 생성될 수 있다. 이러한 예시적인 DNA 결합 단백질은, 각각 이중 가닥 DNA의 특정한 가닥을 컷팅 또는 닉킹하는 역할을 하는 2개의 별개의 뉴클레아제 도메인을 가질 수 있다. 뉴클레아제 활성을 갖는 예시적인 폴리펩티드 서열은 통상의 기술자에게 공지되어 있고, McrA-HNH 뉴클레아제 관련 도메인 및 RuvC-유사 뉴클레아제 도메인을 포함한다. 따라서, 예시적인 DNA 결합 단백질은 자연적으로 하나 이상의 McrA-HNH 뉴클레아제 관련 도메인 및 RuvC-유사 뉴클레아제 도메인을 함유하는 것들이다. 특정 측면에 따르면, DNA 결합 단백질은 뉴클레아제 활성이 불활성화되도록 변경되거나 달리 변형된다. 이러한 변경 또는 변형은 뉴클레아제 활성 또는 뉴클레아제 도메인을 불활성화시키기 위해 하나 이상의 아미노산을 변경시키는 것을 포함한다. 이러한 변형은 뉴클레아제 활성을 나타내는 폴리펩티드 서열 또는 폴리펩티드 서열들, 즉 뉴클레아제 도메인이 DNA 결합 단백질에 부재하도록, 뉴클레아제 활성을 나타내는 폴리펩티드 서열 또는 폴리펩티드 서열들, 즉 뉴클레아제 도메인을 제거하는 것을 포함한다. 뉴클레아제 활성을 불활성화시키기 위한 다른 변형은 본 개시내용을 기초로 하여 통상의 기술자에게 용이하게 명백할 것이다. 따라서, 뉴클레아제-기능부재 DNA 결합 단백질은 뉴클레아제 활성이 불활성화되도록 변형된 폴리펩티드 서열, 또는 뉴클레아제 활성을 불활성화시키기 위한 폴리펩티드 서열 또는 서열들의 제거를 포함한다. 뉴클레아제-기능부재 DNA 결합 단백질은 뉴클레아제 활성이 불활성화되었더라도 DNA에 결합하는 능력을 유지한다. 따라서, DNA 결합 단백질은 DNA 결합에 요구되는 폴리펩티드 서열 또는 서열들을 포함하지만, 뉴클레아제 활성을 나타내는 하나 이상의 또는 모든 뉴클레아제 서열이 결여될 수 있다. 따라서, DNA 결합 단백질은 DNA 결합에 요구되는 폴리펩티드 서열 또는 서열들을 포함하지만, 불활성화된 뉴클레아제 활성을 나타내는 하나 이상의 또는 모든 뉴클레아제 서열을 가질 수 있다.
한 측면에 따르면, 2개 이상의 뉴클레아제 도메인을 갖는 DNA 결합 단백질은 뉴클레아제 도메인 전부가 아닌 그 중 하나가 불활성화되도록 변형 또는 변경될 수 있다. 이러한 변형 또는 변경된 DNA 결합 단백질은, DNA 결합 단백질이 이중 가닥 DNA의 단 1개의 가닥만을 컷팅 또는 닉킹하는 정도까지, DNA 결합 단백질 닉카제로 지칭된다. RNA에 의해 DNA로 가이드되는 경우에, DNA 결합 단백질 닉카제는 RNA 가이드된 DNA 결합 단백질 닉카제로 지칭된다.
예시적인 DNA 결합 단백질은 뉴클레아제 활성이 결여된 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질이다. 예시적인 DNA 결합 단백질은 뉴클레아제-기능부재 Cas9 단백질이다. 예시적인 DNA 결합 단백질은 Cas9 단백질 닉카제다.
에스. 피오게네스에서, Cas9는 단백질에서 2개의 촉매 도메인 (DNA의 상보적 가닥을 절단하는 HNH 도메인 및 비-상보적 가닥을 절단하는 RuvC-유사 도메인)에 의해 매개되는 과정을 통해 프로토스페이서-인접 모티프 (PAM)의 3bp 상류에서 평활-말단 이중-가닥 파괴를 생성한다. 문헌 [Jinke et al., Science 337, 816-821 (2012)]을 참조하며, 이는 그 전문이 본원에 참조로 포함된다. Cas9 단백질은 문헌 [Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477]에 대한 보충 정보에서 확인되는 하기 것들을 비롯하여 다수의 유형 II CRISPR 시스템으로 존재하는 것으로 공지되어 있다: 메타노코쿠스 마리팔루디스(Methanococcus maripaludis) C7; 코리네박테리움 디프테라이에(Corynebacterium diphtheriae); 코리네박테리움 에피시엔스(Corynebacterium efficiens) YS-314; 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) ATCC 13032 키타사토(Kitasato); 코리네박테리움 글루타미쿰 ATCC 13032 빌레펠트(Bielefeld); 코리네박테리움 글루타미쿰 R; 코리네박테리움 크로펜스테티이(Corynebacterium kroppenstedtii) DSM 44385; 미코박테리움 압세수스(Mycobacterium abscessus) ATCC 19977; 노카르디아 파르시니카(Nocardia farcinica) IFM10152; 로도코쿠스 에리트로폴리스(Rhodococcus erythropolis) PR4; 로도코쿠스 조스티이(Rhodococcus jostii) RHA1; 로도코쿠스 오파쿠스(Rhodococcus opacus) B4 uid36573; 아시도테르무스 셀룰롤리티쿠스(Acidothermus cellulolyticus) 11B; 아르트로박터 클로로페놀리쿠스(Arthrobacter chlorophenolicus) A6; 크리벨라 플라비다(Kribbella flavida) DSM 17836 uid43465; 써모모노스포라 쿠르바타(Thermomonospora curvata) DSM 43183; 비피도박테리움 덴티움(Bifidobacterium dentium) Bd1; 비피도박테리움 롱굼(Bifidobacterium longum) DJO10A; 슬라키아 헬리오트리니레두센스(Slackia heliotrinireducens) DSM 20476; 페르세포넬라 마리나(Persephonella marina) EX H1; 박테리오데스 프라길리스(Bacteroides fragilis) NCTC 9434; 카프노시토파가 오크라세아(Capnocytophaga ochracea) DSM 7271; 플라보박테리움 사이크로필룸(Flavobacterium psychrophilum) JIP02 86; 악케르만시아 무시니필라(Akkermansia muciniphila) ATCC BAA 835; 로세이플렉수스 카스텐홀치이(Roseiflexus castenholzii) DSM 13941; 로세이플렉수스(Roseiflexus) RS1; 시네코시스티스(Synechocystis) PCC6803; 엘루시미크로비움 미누툼(Elusimicrobium minutum) Pei191; 비배양된 흰개미 군 1 박테리아 계통형 Rs D17; 피브로박터 숙시노게네스(Fibrobacter succinogenes) S85; 바실루스 세레우스(Bacillus cereus) ATCC 10987; 리스테리아 이노쿠아(Listeria innocua); 락토바실루스 카세이(Lactobacillus casei); 락토바실루스 람노수스(Lactobacillus rhamnosus) GG; 락토바실루스 살리바리우스(Lactobacillus salivarius) UCC118; 스트렙토코쿠스 아갈락티아에(Streptococcus agalactiae) A909; 스트렙토코쿠스 아갈락티아에 NEM316; 스트렙토코쿠스 아갈락티아에 2603; 스트렙토코쿠스 디스갈락티아에 에퀴시밀리스(Streptococcus dysgalactiae equisimilis) GGS 124; 스트렙토코쿠스 에퀴 주에피데미쿠스(Streptococcus equi zooepidemicus) MGCS10565; 스트렙토코쿠스 갈롤리티쿠스(Streptococcus gallolyticus) UCN34 uid46061; 스트렙토코쿠스 고르도니이 칼리스(Streptococcus gordonii Challis) subst CH1; 스트렙토코쿠스 뮤탄스(Streptococcus mutans) NN2025 uid46353; 스트렙토코쿠스 뮤탄스; 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) M1 GAS; 스트렙토코쿠스 피오게네스 MGAS5005; 스트렙토코쿠스 피오게네스 MGAS2096; 스트렙토코쿠스 피오게네스 MGAS9429; 스트렙토코쿠스 피오게네스 MGAS10270; 스트렙토코쿠스 피오게네스 MGAS6180; 스트렙토코쿠스 피오게네스 MGAS315; 스트렙토코쿠스 피오게네스 SSI-1; 스트렙토코쿠스 피오게네스 MGAS10750; 스트렙토코쿠스 피오게네스 NZ131; 스트렙토코쿠스 써모필레스(Streptococcus thermophiles) CNRZ1066; 스트렙토코쿠스 써모필레스 LMD-9; 스트렙토코쿠스 써모필레스 LMG 18311; 클로스트리디움 보툴리눔(Clostridium botulinum) A3 로크 마리(Loch Maree); 클로스트리디움 보툴리눔 B 에클룬드(Eklund) 17B; 클로스트리디움 보툴리눔 Ba4 657; 클로스트리디움 보툴리눔 F 랑겔란드(Langeland); 클로스트리디움 셀룰롤리티쿰(Clostridium cellulolyticum) H10; 피네골디아 마그나(Finegoldia magna) ATCC 29328; 유박테리움 렉탈레(Eubacterium rectale) ATCC 33656; 미코플라스마 갈리셉티쿰(Mycoplasma gallisepticum); 미코플라스마 모빌레(Mycoplasma mobile) 163K; 미코플라스마 페네트란스(Mycoplasma penetrans); 미코플라스마 시노비아에(Mycoplasma synoviae) 53; 스트렙토바실루스 모닐리포르미스(Streptobacillus moniliformis) DSM 12112; 브라디리조비움(Bradyrhizobium) BTAi1; 니트로박터 함부르겐시스(Nitrobacter hamburgensis) X14; 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris) BisB18; 로도슈도모나스 팔루스트리스 BisB5; 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans) DS-1; 디노로세오박터 쉬바에(Dinoroseobacter shibae) DFL 12; 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus) Pal 5 FAPERJ; 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus) Pal 5 JGI; 아조스피릴룸(Azospirillum) B510 uid46085; 로도스피릴룸 루브룸(Rhodospirillum rubrum) ATCC 11170; 디아포로박터(Diaphorobacter) TPSY uid29975; 베르미네프로박터 에이세니아에(Verminephrobacter eiseniae) EF01-2; 네이세리아 메닌기티데스(Neisseria meningitides) 053442; 네이세리아 메닌기티데스(Neisseria meningitides) 알파14; 네이세리아 메닌기티데스 Z2491; 데술포비브리오 살렉시겐스(Desulfovibrio salexigens) DSM 2638; 캄필로박터 제주니 도일레이(Campylobacter jejuni doylei) 269 97; 캄필로박터 제주니 81116; 캄필로박터 제주니; 캄필로박터 라리(Campylobacter lari) RM2100; 헬리코박터 헤파티쿠스(Helicobacter hepaticus); 월리넬라 숙시노게네스(Wolinella succinogenes); 톨루모나스 아우엔시스(Tolumonas auensis) DSM 9187; 슈도알테로모나스 아틀란티카(Pseudoalteromonas atlantica) T6c; 슈와넬라 페알레아나(Shewanella pealeana) ATCC 700345; 레지오넬라 뉴모필라 파리(Legionella pneumophila Paris); 악티노바실루스 숙시노게네스(Actinobacillus succinogenes) 130Z; 파스테우렐라 물토시다(Pasteurella multocida); 프란시셀라 툴라렌시스 노비시다(Francisella tularensis novicida) U112; 프란시셀라 툴라렌시스 홀라르크티카(Francisella tularensis holarctica); 프란시셀라 툴라렌시스 FSC 198; 프란시셀라 툴라렌시스 툴라렌시스; 프란시셀라 툴라렌시스 WY96-3418; 및 트레포네마 덴티콜라(Treponema denticola) ATCC 35405. 따라서, 본 개시내용의 측면은 본원에 기재된 바와 같이 뉴클레아제 기능부재된 또는 닉카제가 된 유형 II CRISPR 시스템으로 존재하는 Cas9 단백질에 관한 것이다.
Cas9 단백질은 통상의 기술자에 의해 문헌에서 Csn1로서 지칭될 수 있다. 본원에 기재된 실험의 대상인 에스. 피오게네스 Cas9 단백질 서열이 하기 제시된다. 문헌 [Deltcheva et al., Nature 471, 602-607 (2011)]을 참조하며, 이는 그 전문이 본원에 참조로 포함된다.
본원에 기재된 RNA-가이드된 게놈 조절의 방법의 특정 측면에 따르면, Cas9는 뉴클레아제 활성이 감소되거나, 실질적으로 감소되거나 또는 제거되도록 변경된다. 한 측면에 따르면, Cas9 뉴클레아제 활성은 RuvC 뉴클레아제 도메인 또는 HNH 뉴클레아제 도메인의 변경에 의해 감소되거나, 실질적으로 감소되거나 또는 제거된다. 한 측면에 따르면, RuvC 뉴클레아제 도메인은 불활성화된다. 한 측면에 따르면, HNH 뉴클레아제 도메인은 불활성화된다. 한 측면에 따르면, RuvC 뉴클레아제 도메인 및 HNH 뉴클레아제 도메인은 불활성화된다. 추가의 측면에 따르면, RuvC 뉴클레아제 도메인 및 HNH 뉴클레아제 도메인이 불활성화된 Cas9 단백질이 제공된다. 추가의 측면에 따르면, RuvC 뉴클레아제 도메인 및 HNH 뉴클레아제 도메인이 불활성화되어 있는 한, 뉴클레아제-기능부재 Cas9 단백질이 제공된다. 추가의 측면에 따르면, RuvC 뉴클레아제 도메인 또는 HNH 뉴클레아제 도메인 중 어느 하나가 불활성화되어 뉴클레아제 활성에 대한 뉴클레아제 도메인 활성이 유지되고 있는 Cas9 닉카제가 제공된다. 이러한 방식으로, 이중 가닥 DNA 중 단지 1개의 가닥만이 컷팅 또는 닉킹된다.
추가의 측면에 따르면, Cas9에서 1개 이상의 아미노산이 변경되거나 달리 제거되어 뉴클레아제-기능부재 Cas9 단백질을 제공하는, 뉴클레아제-기능부재 Cas9 단백질이 제공된다. 한 측면에 따르면, 아미노산은 D10 및 H840을 포함한다. 문헌 [Jinke et al., Science 337, 816-821 (2012)]을 참조한다. 추가의 측면에 따르면, 아미노산은 D839 및 N863을 포함한다. 한 측면에 따르면, D10, H840, D839 및 H863 중 1개 이상 또는 모두가 뉴클레아제 활성을 감소시키거나, 실질적으로 제거하거나 또는 제거하는 아미노산으로 치환된다. 한 측면에 따르면, D10, H840, D839 및 H863 중 1개 이상 또는 모두가 알라닌으로 치환된다. 한 측면에 따르면, D10, H840, D839 및 H863 중 1개 이상 또는 모두가 뉴클레아제 활성을 감소시키거나, 실질적으로 제거하거나 또는 제거하는 아미노산, 예컨대 알라닌으로 치환된 Cas9 단백질은 뉴클레아제-기능부재 Cas9 또는 Cas9N으로 지칭되고, 감소 또는 제거된 뉴클레아제 활성을 나타내거나, 또는 검출 수준 내에서 뉴클레아제 활성이 부재하거나 실질적으로 부재한다. 이러한 측면에 따르면, Cas9N에 대한 뉴클레아제 활성은 공지된 검정의 이용시에 검출불가능할 수 있으며, 즉 공지된 검정의 검출 수준 미만이다.
한 측면에 따르면, 뉴클레아제 기능부재 Cas9 단백질은, DNA에 결합하고 RNA에 의해 가이드되는 단백질의 능력을 유지하는 그의 상동체 및 오르토로그를 포함한다. 한 측면에 따르면, 뉴클레아제 기능부재 Cas9 단백질은 D10, H840, D839 및 H863 중 1개 이상 또는 모두가 알라닌으로 치환된, 에스. 피오게네스로부터의 자연 발생 Cas9에 대해 제시된 서열, 및 상기 서열에 대해 적어도 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98% 또는 99% 상동성을 갖는 단백질 서열을 포함하며, 이는 DNA 결합 단백질, 예컨대 RNA 가이드된 DNA 결합 단백질이다.
한 측면에 따르면, 뉴클레아제 기능부재 Cas9 단백질은 RuvC 뉴클레아제 도메인 및 HNH 뉴클레아제 도메인의 단백질 서열이 제외된 에스. 피오게네스로부터의 자연 발생 Cas9에 대해 제시된 서열, 및 또한 상기 서열에 대해 적어도 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98% 또는 99% 상동성을 갖는 단백질 서열을 포함하며, 이는 DNA 결합 단백질, 예컨대 RNA 가이드된 DNA 결합 단백질이다. 이러한 방식으로, 본 개시내용의 측면은, DNA 결합, 예를 들어 가이드 RNA와의 공동-국재화 및 DNA에 대한 결합의 역할을 하는 단백질 서열 및 그에 상동성인 단백질 서열을 포함하며, 뉴클레아제 기능부재 Cas9 단백질을 생산하기 위해 RuvC 뉴클레아제 도메인 및 HNH 뉴클레아제 도메인은 자연 발생 Cas9 단백질의 단백질 서열로부터 불활성화 또는 제거될 수 있기 때문에, 이들 도메인에 대한 단백질 서열을 포함할 필요는 없다 (DNA 결합에 필요하지 않은 정도까지).
본 개시내용의 목적을 위해, 도 4a는 Cas9에 대한 상동성을 갖는 공지된 단백질 구조에서의 금속 배위 잔기를 도시한다. 잔기는 Cas9 서열의 위치를 기초로 표지된다. 좌측: Cas9 서열에서 D10에 상응하는 RuvC 구조, PDB ID: 4EP4 (청색) 위치 D7은 Mg-이온 배위 위치가 강조되어 있다. 중앙: 배위된 Mg-이온 (회색 구체) 및 3M7K로부터의 DNA (자주색)를 포함하는 PDB ID: 3M7K (오렌지색) 및 4H9D (시안색)로부터의 HNH 엔도뉴클레아제 도메인의 구조. Cas9 아미노산 D839 및 N863에 대한 서열 상동성을 갖는 3M7K 및 4H9D 위치 D53 및 N77에서의 잔기 D92 및 N113을 막대로 나타내었다. 우측: 제조하여 뉴클레아제 활성에 대해 분석된 돌연변이체의 목록: Cas9 야생형; D10이 알라닌으로 치환된 Cas9m1; D10이 알라닌으로, H840이 알라닌으로 치환된 Cas9m2; D10이 알라닌으로, H840이 알라닌으로, D839가 알라닌으로 치환된 Cas9m3; 및 D10이 알라닌으로, H840이 알라닌으로, D839가 알라닌으로, N863이 알라닌으로 치환된 Cas9m4.
도 4b에 나타낸 바와 같이, Cas9 돌연변이체: m3 및 m4, 및 또한 VP64와의 그의 각각의 융합체는 표적화된 유전자좌에서 심층 서열분석시에 검출불가능한 뉴클레아제 활성을 나타내었다. 플롯은 게놈 위치에 대한 돌연변이 빈도를 보여주며, 여기서 적색 선은 gRNA 표적과의 경계이다. 도 4c는 도 4b에서의 데이터의 보다 고해상도 검사이고, 돌연변이 랜드스케이프가 비변형된 유전자좌와 대등한 프로파일을 보여준다는 것이 확인된다.
한 측면에 따르면, 뉴클레아제-기능부재 Cas9에 또는 가이드 RNA에 대한 전사 활성화 도메인의 테더링에 의해 인간 세포에서 RNA-가이드된 게놈 조절을 가능하게 하는 조작된 Cas9-gRNA 시스템이 제공된다. 본 개시내용의 한 측면에 따르면, 하나 이상의 전사 조절 단백질 또는 도메인 (상기 용어는 상호교환가능하게 사용됨)은 뉴클레아제-결핍 Cas9 또는 하나 이상의 가이드 RNA (gRNA)에 연결되거나 또는 달리 결합된다. 전사 조절 도메인은 표적화된 유전자좌에 상응한다. 따라서, 본 개시내용의 측면은 전사 조절 도메인을 Cas9N에 또는 gRNA에 융합, 결합 또는 연결시킴으로써 상기 도메인을 표적화된 유전자좌에 국재화시키기 위한 방법 및 물질을 포함한다.
한 측면에 따르면, 전사 활성화가 가능한 Cas9N-융합 단백질이 제공된다. 한 측면에 따르면, VP64 활성화 도메인 (전문이 본원에 참조로 포함되는 문헌 [Zhang et al., Nature Biotechnology 29, 149-153 (2011)] 참조)은 Cas9N의 C 말단에 연결, 융합, 결합 또는 달리 테더링된다. 한 방법에 따르면, 전사 조절 도메인은 Cas9N 단백질에 의해 표적 게놈 DNA의 부위에 제공된다. 한 방법에 따르면, 전사 조절 도메인에 융합된 Cas9N은 하나 이상의 가이드 RNA와 함께 세포 내에 제공된다. 전사 조절 도메인이 융합되어 있는 Cas9N은 표적 게놈 DNA에 또는 그 부근에 결합된다. 하나 이상의 가이드 RNA는 표적 게놈 DNA에 또는 그 부근에 결합된다. 전사 조절 도메인은 표적 유전자의 발현을 조절한다. 구체적 측면에 따르면, Cas9N-VP64 융합체는 프로모터 부근의 서열을 표적화하는 gRNA와의 조합시에 리포터 구축물의 전사를 활성화하여, RNA-가이드된 전사 활성화를 나타낸다.
한 측면에 따르면, 전사 활성화가 가능한 gRNA-융합 단백질이 제공된다. 한 측면에 따르면, VP64 활성화 도메인은 gRNA에 연결, 융합, 결합 또는 달리 테더링된다. 한 방법에 따르면, 전사 조절 도메인은 gRNA에 의해 표적 게놈 DNA의 부위에 제공된다. 한 방법에 따르면, 전사 조절 도메인에 융합된 gRNA는 Cas9N 단백질과 함께 세포 내에 제공된다. Cas9N은 표적 게놈 DNA에 또는 그 부근에 결합된다. 전사 조절 단백질 또는 도메인이 융합되어 있는 하나 이상의 가이드 RNA는 표적 게놈 DNA에 또는 그 부근에 결합된다. 전사 조절 도메인은 표적 유전자의 발현을 조절한다. 구체적 측면에 따르면, 전사 조절 도메인과 융합된 Cas9N 단백질 및 gRNA는 리포터 구축물의 전사를 활성화시켜, RNA-가이드된 전사 활성화를 나타낸다.
무작위 서열을 gRNA 내로 삽입하고 Cas9 기능에 대해 검정하여 gRNA의 어느 영역이 변형에 내성을 갖는지를 확인함으로써 전사 조절이 가능한 gRNA 테더를 구축하였다. 키메라 gRNA의 crRNA 부분의 5' 말단 또는 tracrRNA 부분의 3' 말단에 무작위 서열 삽입을 보유하는 gRNA는 기능성을 유지하는 반면, 키메라 gRNA의 tracrRNA 스캐폴드 부분 내로의 삽입은 기능 상실을 일으킨다. 무작위 염기 삽입에 대한 gRNA 유연성을 요약하는 도 5a-b를 참조한다. 도 5a는 Cas9-gRNA 활성을 결정하기 위한 상동 재조합 (HR) 검정의 개략도이다. 도 5b에 나타낸 바와 같이, 키메라 gRNA의 crRNA 부분의 5' 말단 또는 tracrRNA 부분의 3' 말단에 무작위 서열 삽입을 보유하는 gRNA는 기능성을 유지하는 반면, 키메라 gRNA의 tracrRNA 스캐폴드 부분 내로의 삽입은 기능 상실을 일으킨다. gRNA 서열 내의 삽입 지점은 적색 뉴클레오티드에 의해 표시된다. 과학 이론에 얽매이기를 원하지 않으면서, 5' 말단에서의 무작위 염기 삽입시에 증가된 활성은 보다 긴 gRNA의 증가된 반감기로 인한 것일 수 있다.
gRNA에 VP64를 부착시키기 위해, RNA 줄기-루프에 결합하는 MS2 박테리오파지 코트-단백질의 2개 카피를 gRNA의 3' 말단에 첨부하였다. 전문이 본원에 참조로 포함되는 문헌 [Fusco et al., Current Biology: CB13, 161-167 (2003)]을 참조한다. 이들 키메라 gRNA를 Cas9N 및 MS2-VP64 융합 단백질과 함께 발현시켰다. 리포터 구축물로부터의 서열-특이적 전사 활성화는 3가지 성분 모두의 존재 하에 관찰되었다.
도 1a는 RNA-가이드된 전사 활성화의 개략도이다. 도 1a에 나타낸 바와 같이, 전사 활성화가 가능한 Cas9N-융합 단백질을 생성하기 위해, VP64 활성화 도메인을 직접적으로 Cas9N의 C 말단에 테더링하였다. 도 1b에 나타낸 바와 같이, 전사 활성화가 가능한 gRNA 테더를 생성하기 위해, RNA 줄기-루프에 결합하는 MS2 박테리오파지 코트-단백질의 2개 카피를 gRNA의 3' 말단에 첨부하였다. 이들 키메라 gRNA를 Cas9N 및 MS2-VP64 융합 단백질과 함께 발현시켰다. 도 1c는 전사 활성화를 검정하는데 사용된 리포터 구축물의 설계를 보여준다. 2개의 리포터는 독특한 gRNA 표적 부위를 보유하고, 대조 TALE-TF 표적 부위를 공유한다. 도 1d에 나타낸 바와 같이, Cas9N-VP64 융합체는 형광-활성화 세포 분류 (FACS) 및 면역형광 검정 (IF) 둘 다에 의해 검정시에 RNA-가이드된 전사 활성화를 나타낸다. 구체적으로, 대조 TALE-TF는 리포터 둘 다를 활성화시킨 반면, Cas9N-VP64 융합체는 gRNA 서열 특이적 방식으로 리포터를 활성화시킨다. 도 1e에 나타낸 바와 같이, Cas9N, MS2-VP64 및 적절한 MS2 압타머 결합 부위를 보유하는 gRNA의 3개 성분 모두의 존재 하에서만 리포터 구축물로부터의 gRNA 서열-특이적 전사 활성화가 FACS 및 IF 둘 다에 의해 관찰되었다.
특정 측면에 따르면, Cas9N, 하나 이상의 gRNA 및 전사 조절 단백질 또는 도메인을 사용하여 내인성 유전자를 조절하는 방법이 제공된다. 한 측면에 따르면, 내인성 유전자는 표적 유전자로서 본원에 지칭되는 임의의 바람직한 유전자일 수 있다. 하나의 예시적인 측면에 따르면, 조절을 위한 유전자 표적은 ZFP42 (REX1) 및 POU5F1 (OCT4)을 포함하며, 이들은 둘 다 다능성의 유지에 관여하는 엄격하게 조절된 유전자이다. 도 1f에 나타낸 바와 같이, 전사 출발 부위의 DNA 상류의 ~5kb 스트레치를 표적화하는 10개의 gRNA (DNase 과민 부위를 녹색으로 강조함)를 REX1 유전자에 대해 설계하였다. 프로모터-루시페라제 리포터 구축물을 사용하여 (전문이 본원에 참조로 포함되는 문헌 [Takahashi et al., Cell 131 861-872 (2007)] 참조) 또는 내인성 유전자의 qPCR을 통해 직접적으로 전사 활성화를 검정하였다.
도 6a-c는 Cas9N-VP64를 사용한 RNA-가이드된 OCT4 조절에 관한 것이다. 도 6a에 나타낸 바와 같이, 전사 출발 부위의 DNA 상류의 ~5kb 스트레치를 표적화하는 21개의 gRNA를 OCT4 유전자에 대해 설계하였다. DNase 과민 부위는 녹색으로 강조된다. 도 6b는 프로모터-루시페라제 리포터 구축물을 사용한 전사 활성화를 보여준다. 도 6c는 내인성 유전자의 qPCR을 통한 직접적 전사 활성화를 보여준다. 개별 gRNA의 도입은 전사를 중간 정도로 자극하지만, 다중 gRNA는 상승작용적으로 작용하여 강건한 다중-배수 전사 활성화를 자극한다.
도 7a-c는 Cas9N, MS2-VP64 및 gRNA+2X-MS2 압타머를 사용한 RNA-가이드된 REX1 조절에 관한 것이다. 도 7a에 나타낸 바와 같이, 전사 출발 부위의 DNA 상류의 ~5kb 스트레치를 표적화하는 10개의 gRNA를 REX1 유전자에 대해 설계하였다. DNase 과민 부위는 녹색으로 강조된다. 도 7b는 프로모터-루시페라제 리포터 구축물을 사용한 전사 활성화를 보여준다. 도 7c는 내인성 유전자의 qPCR을 통한 직접적 전사 활성화를 보여준다. 개별 gRNA의 도입은 전사를 중간 정도로 자극하지만, 다중 gRNA는 상승작용적으로 작용하여 강건한 다중-배수 전사 활성화를 자극한다. 한 측면에서, gRNA에서의 2X-MS2 압타머의 부재는 전사 활성화를 일으키지 않는다. 각각의 전문이 본원에 참조로 포함되는 문헌 [Maeder et al., Nature Methods 10, 243-245 (2013) 및 Perez-Pinera et al., Nature Methods 10, 239-242 (2013)]을 참조한다.
따라서, 방법은 다중 가이드 RNA와 Cas9N 단백질 및 표적 유전자의 발현을 조절하기 위한 전사 조절 단백질 또는 도메인의 사용에 관련된다.
Cas9 및 gRNA 테더링 접근법은 둘 다 효과적이었고, 전자의 경우 ~1.5-2배 더 높은 효력을 나타내었다. 이러한 차이는 3-성분 복합체 어셈블리와 대조적으로 2-성분에 대한 요건으로 인한 것일 수 있다. 그러나, gRNA 테더링 접근법은 원칙적으로 각각의 gRNA가 상이한 RNA-단백질 상호작용 쌍을 사용하는 한 상이한 이펙터 도메인이 별개의 gRNA에 의해 동원되도록 할 수 있다. 전문이 본원에 참조로 포함되는 문헌 [Karyer-Bibens et al. Biology of the Cell / Under the Auspices of the European Cell Biology Organization 100, 125- 138 (2008)]을 참조한다. 본 개시내용의 한 측면에 따르면, 다양한 표적 유전자는 특이적 가이드 RNA 및 일반적 Cas9N 단백질, 즉 다양한 표적 유전자와 동일하거나 유사한 Cas9N 단백질을 사용하여 조절될 수 있다. 한 측면에 따르면, 멀티플렉스 유전자 조절의 방법은 동일하거나 유사한 Cas9N을 사용하여 제공된다.
본 개시내용의 방법은 또한 Cas9N 단백질 및 본원에 기재된 가이드 RNA를 사용하여 표적 유전자를 편집함으로써 인간 세포의 멀티플렉스 유전적 및 후성적 조작을 제공하는 것에 관한 것이다. Cas9-gRNA 표적화를 목표로 (전문이 본원에 참조로 포함되는 문헌 [Jiang et al., Nature Biotechnology 31, 233-239 (2013)] 참조), 표적 서열 변이의 매우 큰 공간에 대한 Cas9 친화도의 심층 조사를 위한 방법이 제공된다. 따라서, 본 개시내용의 측면은 dsDNA 절단 독성에 의해 도입된 복잡성 및 천연 뉴클레아제-활성 Cas9를 사용한 특이성 시험에 의해 초래된 돌연변이유발 복구를 회피하면서, 인간 세포에서의 Cas9 표적화의 직접적 고처리량 판독을 제공한다.
본 개시내용의 추가 측면은 일반적으로 표적 유전자의 전사 조절을 위한 DNA 결합 단백질 또는 시스템의 용도에 관한 것이다. 통상의 기술자는 본 개시내용을 기초로 예시적인 DNA 결합 시스템을 용이하게 확인할 것이다. 이러한 DNA 결합 시스템은 자연 발생 Cas9 단백질과 같이, 어떠한 뉴클레아제 활성도 가질 필요가 없다. 따라서, 이러한 DNA 결합 시스템은 뉴클레아제 활성을 불활성화시킬 필요가 없다. 하나의 예시적인 DNA 결합 시스템은 TALE이다. 게놈 편집 도구로서, 통상적으로 TALE-FokI 이량체가 사용되고, 게놈 조절을 위해 TAEL-VP64 융합체가 고도로 효과적인 것으로 밝혀졌다. 한 측면에 따르면, TALE 특이성을 도 2a에 나타낸 방법론을 이용하여 평가하였다. 라이브러리의 각각의 성분이 d토마토 형광 단백질을 유도하는 최소 프로모터를 포함하는 구축물 라이브러리를 설계한다. 전사 출발 부위 m의 하류에 24bp (A/C/G) 무작위 전사체 태그를 삽입하고, 2개의 TF 결합 부위를 프로모터의 상류에 위치시켰다: 하나는 모든 라이브러리 요소에 의해 공유되는 불변 DNA 서열이고, 두번째 것은 돌연변이의 많은 조합이 프로그램가능 DNA 표적화 복합체가 결합하도록 설계된 표적 서열로부터 떨어져 존재하는 서열의 다수의 집합을 포괄하도록 조작된 결합 부위의 '편재된' 라이브러리를 보유하는 가변 특징부이다. 이것은 표적 서열 뉴클레오티드가 79% 빈도로 나타나고 각각의 다른 뉴클레오티드가 7% 빈도로 발생하도록 각각의 위치에서의 뉴클레오티드 빈도를 보유하도록 조작된 축중성 올리고뉴클레오티드를 사용하여 달성된다. 전문이 본원에 참조로 포함되는 문헌 [Patwardhan et al., Nature Biotechnology 30, 265-270 (2012)]을 참조한다. 이어서, 리포터 라이브러리를 서열분석하여, 라이브러리 요소에서 24bp d토마토 전사체 태그와 그의 상응하는 '편재된' 표적 부위 사이의 회합을 밝혀냈다. 전사체 태그의 큰 다양성은 다양한 표적 사이의 태그의 공유가 극히 드물 것이라는 것을 보장하는 반면, 표적 서열의 편재된 구축은 소수의 돌연변이를 갖는 부위가 더 많은 돌연변이를 갖는 부위보다 더 많은 태그와 회합될 것이라는 것을 의미한다. 다음으로, d토마토 리포터 유전자의 전사가 공유된 DNA 부위에 결합하도록 조작된 대조-TF, 또는 표적 부위에 결합하도록 조작된 표적-TF로 자극된다. 각각의 발현된 전사체 태그의 존재비가 자극된 세포 상에서 RNAseq를 수행함으로써 각각의 샘플에서 측정되고, 이어서 보다 먼저 확립된 회합 표를 사용하여 그의 상응하는 결합 부위로 재맵핑한다. 대조-TF는 그의 결합 부위가 모든 라이브러리 요소에 걸쳐 공유되기 때문에 동등하게 모든 라이브러리 구성원을 여기시킬 것으로 예상되고, 반면에 표적-TF는 발현된 성분의 분포가 그에 의해 우선적으로 표적화되는 것들에 대해 치우칠 것으로 예상된다. 이러한 가정은 표적-TF에 대해 수득된 태그 카운트를 대조-TF에 대해 수득된 것들로 나눔으로써 각각의 결합 부위에 대한 정규화된 발현 수준을 계산하기 위해 단계 5에서 사용된다.
도 2b에 나타낸 바와 같이, Cas9-gRNA 복합체의 표적화 랜드스케이프는 그가 평균적으로 그의 표적 서열에서 1-3개의 돌연변이에 내성이 있다는 것을 나타낸다. 도 2c에 나타낸 바와 같이, Cas9-gRNA 복합체는 또한 PAM 서열에 국재화된 것들을 제외하고는 주로 점 돌연변이에 비감수성이다. 두드러지게, 이러한 데이터는 에스. 피오게네스 Cas9에 대한 추정 PAM이 NGG 뿐만 아니라 NAG임을 나타낸다. 도 2d에 나타낸 바와 같이, 2개의 염기 미스매치의 도입은 Cas9-gRNA 복합체 활성을 유의하게 손상시키지만, 단지 이들이 gRNA 표적 서열의 3' 말단에 보다 가까운 8-10개의 염기에 국재화된 경우에만 그러하다 (열 플롯에서 표적 서열 위치는 5' 말단으로부터 출발하여 1-23 표지됨).
또 다른 널리 사용되는 게놈 편집 도구인, TALE 도메인의 돌연변이 내성을 본원에 기재된 전사 특이성 검정을 이용하여 결정하였다. 도 2e에 나타낸 바와 같이, 18-량체 TALE에 대한 TALE 오프-표적화 데이터는 그가 평균적으로 그의 표적 서열에서 1-2개의 돌연변이에 내성일 수 있으며, 그의 표적에서 대다수의 3개의 염기 미스매치 변이체를 활성화하는데 실패한 것을 나타낸다. 도 2f에 나타낸 바와 같이, 18-량체 TALE는 그의 표적에서 미스매치된 단일 염기에 주로 비감수성인 Cas9-gRNA 복합체와 유사하다. 도 2g에 나타낸 바와 같이, 2개의 염기 미스매치의 도입은 18-량체 TALE 활성을 유의하게 손상시킨다. TALE 활성은 그의 표적 서열의 5' 말단에 보다 가까운 미스매치에 보다 감수성이다 (열 플롯에서 표적 서열 위치는 5' 말단으로부터 출발하여 1-18 표지됨).
결과를, 다양한 크기의 TALE에 의한 표적화의 랜드스케이프를 평가하는 것에 관련된 도 10a-c의 대상인 뉴클레아제 검정으로 표적화된 실험을 이용하여 확인하였다. 도 10a에 나타낸 바와 같이, 뉴클레아제 매개 HR 검정을 이용하여, 18-량체 TALE가 그의 표적 서열에서 다중 돌연변이를 허용한다는 것을 확인하였다. 도 10b에 나타낸 바와 같이, 도 2에서 기재된 접근법을 이용하여, 3가지 상이한 크기 (18-량체, 14-량체 및 10-량체)의 TALE의 표적화 랜드스케이프를 분석하였다. 보다 짧은 TALE (14-량체 및 10-량체)는 그의 표적화에서 점점 더 특이적이지만, 또한 거의 한 자릿수만큼 활성이 감소된다. 도 10c 및 10d에 나타낸 바와 같이, 10-량체 TALE는 근사 단일-염기 미스매치 해상도를 나타내며, 2개의 미스매치를 보유하는 표적에 대해 거의 모든 활성이 손실된다 (열 플롯에서 표적 서열 위치는 5' 말단에서 출발하여 1-10 표지됨). 종합하여, 이들 데이터는 보다 짧은 TALE를 조작하는 것이 게놈 조작 적용에서 보다 높은 특이성을 생성할 수 있는 반면에 TALE 뉴클레아제 적용에서의 FokI 이량체화에 대한 요건이 오프-표적 효과를 회피하는데 필수적이라는 것을 나타낸다. 각각의 전문이 본원에 참조로 포함되는 문헌 [Kim et al., Proceedings of the National Academy of Sciences of the United States of America 93, 1 156-1 160 (1996) 및 Pattanayak et al., Nature Methods 8, 765-770 (2011)]을 참조한다.
도 8a-c는 실험 데이터로부터의 예로 예시된 정규화된 발현 수준의 계산을 위한 고수준 특이성 분석 프로세싱 흐름에 관한 것이다. 도 8a에 나타낸 바와 같이, 구축물 라이브러리는 리포터 유전자 전사체 내로 혼입될 결합 부위 서열의 편재 분포 및 무작위 서열 24bp 태그를 갖도록 생성된다 (상단). 전사된 태그는 그들이 Cas9 또는 TALE 결합 서열에 다 대 일로 맵핑되어야 하도록 고도로 축중된다. 구축물 라이브러리를 서열분석하여 (제3 수준, 좌측) 태그가 결합 부위와 공동-발생한다는 것을 확립함으로써, 결합 부위 대 전사된 태그의 회합 표를 생성하였다 (제4 수준, 좌측). 라이브러리 바코드 (여기서 담청색 및 담황색에 의해 나타냄; 수준 1-4, 좌측)를 사용하여 다양한 결합 부위에 대해 구축된 다중 구축물 라이브러리를 한 번에 서열분석할 수 있다. 이어서, 구축물 라이브러리를 세포 집단 내로 형질감염시키고, 일련의 다양한 Cas9/gRNA 또는 TALE 전사 인자를 집단의 샘플에서 유도한다 (제2 수준, 우측). 하나의 샘플은 항상 구축물 내의 고정된 결합 부위 서열 (상단 수준, 녹색 박스)에 표적화된 고정된 TALE 활성인자에 의해 유도되고; 이러한 샘플은 양성 대조군 (녹색 샘플, 또한 + 부호로 나타냄)의 역할을 한다. 이어서, 유도된 샘플에서 리포터 mRNA 분자로부터 생성된 cDNA를 서열분석하고, 샘플에서 각각의 태그에 대한 태그 카운트를 얻기 위해 분석한다 (제3 및 제4 수준, 우측). 구축물 라이브러리 서열분석과 같이, 양성 대조군을 포함하는 다중 샘플을 서열분석하고, 샘플 바코드를 첨부함으로써 함께 분석하였다. 여기서 담적색은 서열분석되고 양성 대조군 (녹색)과 함께 분석된 하나의 비-대조 샘플을 나타낸다. 각각의 리드에 구축물 결합 부위가 아닌 전사된 태그만이 나타나기 때문에, 이어서, 구축물 라이브러리 서열분석으로부터 수득한 결합 부위 대 태그 회합 표를 사용하여 각각의 샘플에서 각각의 결합 부위로부터 발현된 태그의 총 카운트를 총계한다 (제5 수준). 이어서, 각각의 비-양성 대조군 샘플에 대한 총계를 양성 대조군 샘플에서 수득한 총계로 나눔으로써 이를 각각의 결합 부위에 대한 정규화된 발현 수준으로 변환한다. 미스매치의 수에 대한 정규화된 발현 수준의 플롯의 예가 도 2b 및 2e, 및 도 9a 및 도 10b에 제공된다. 잘못된 태그에 대한, 구축물 라이브러리와 회합될 수 없는 태그에 대한, 및 다중 결합 부위와 명백히 공유된 태그에 대한 필터링의 몇몇 수준이 상기 전반적인 공정 흐름에 포함되지 않는다. 도 8b는 편재된 구축물 라이브러리 내에 생성된 미스매치의 수에 대한 결합 부위의 백분율의 예시적 분포를 도시한다. 좌측: 이론적 분포. 우측: 실제 TALE 구축물 라이브러리로부터 관찰된 분포. 도 8c는 미스매치의 수에 대한 결합 부위에 대해 집계된 태그 카운트의 백분율의 예시적 분포를 도시한다. 좌측: 양성 대조군 샘플로부터 관찰된 분포. 우측: 비-대조 TALE가 유도된 샘플로부터 관찰된 분포. 양성 대조군 TALE가 구축물 내의 고정된 부위에 결합하기 때문에, 집계된 태그 카운트의 분포는 도 8b에서의 결합 부위의 분포를 밀접하게 반영하고, 반면에 더 적은 미스매치를 갖는 부위가 더 높은 발현 수준을 유도하기 때문에 분포는 비-대조 TALE 샘플의 경우에 좌측으로 치우친다. 하단: 표적-TF에 대해 수득된 태그 카운트를 대조-TF에 대해 수득된 것으로 나눔으로써 이들 사이의 상대적 풍부화를 계산하는 것은 표적 부위에서의 돌연변이의 수에 대한 평균 발현 수준을 나타낸다.
이들 결과는 다양한 Cas9-gRNA 복합체를 사용하여 생성된 특이성 데이터에 의해 추가로 재확인된다. 도 9a에 나타낸 바와 같이, 다양한 Cas9-gRNA 복합체는 그의 표적 서열에서 1-3개의 돌연변이에 내성이 있다. 도 9b에 나타낸 바와 같이, Cas9-gRNA 복합체는 또한 PAM 서열에 국재화된 것들을 제외하고는 주로 점 돌연변이에 대해 비감수성이다. 그러나, 도 9c에 나타낸 바와 같이, 2개의 염기 미스매치의 도입은 활성을 유의하게 손상시킨다 (열 플롯에서 표적 서열 위치는 5' 말단으로부터 출발하여 1-23 표지됨). 도 9d에 나타낸 바와 같이, 뉴클레아제 매개 HR 검정을 이용하여 에스. 피오게네스 Cas9에 대한 추정 PAM이 NGG 및 또한 NAG임을 확인하였다.
특정 측면에 따르면, 결합 특이성은 본원에 기재된 방법에 따라 증가된다. 다중 복합체 사이의 상승작용은 Cas9N-VP64에 의한 표적 유전자 활성화의 요인이기 때문에, 개별 오프-표적 결합 이벤트는 최소 효과를 가져야 하고, 따라서 Cas9N의 전사 조절 적용은 자연적으로 상당히 특이적이다. 한 측면에 따르면, 오프셋 닉은 게놈-편집의 방법에 사용된다. 대다수의 닉은 드물게 NHEJ 이벤트를 일으키고 (전문이 본원에 참조로 포함되는 문헌 [Certo et al., Nature Methods 8, 671-676 (2011)] 참조), 따라서 오프-표적 닉킹의 효과를 최소화한다. 대조적으로, 오프셋 닉을 유도하여 이중 가닥 파괴 (DSB)를 생성하는 것은 유전자 파괴를 유도하는데 있어서 고도로 효과적이다. 특정 측면에 따르면, 5' 오버행은 3' 오버행과는 대조적으로 보다 유의한 NHEJ 이벤트를 생성한다. 유사하게, 3' 오버행은 NHEJ 이벤트에 비해 HR을 선호하지만, HR 이벤트의 총 수는 5' 오버행이 생성하는 경우보다 유의하게 더 낮다. 따라서, 상동 재조합을 위해 닉을 사용하고, 오프-표적 Cas9-gRNA 활성의 효과가 최소화되도록 이중 가닥 파괴를 생성하기 위해 오프셋 닉을 사용하는 방법이 제공된다.
도 3a-c는 멀티플렉스 오프셋 닉킹 및 가이드 RNA와의 오프-표적 결합을 감소시키는 방법에 관한 것이다. 도 3a에 나타낸 바와 같이, 신호등 리포터를 사용하여 표적화된 닉 또는 파괴의 도입시의 HR 및 NHEJ 이벤트에 대해 동시에 검정하였다. HDR 경로를 통해 해상된 DNA 절단 이벤트는 GFP 서열을 복원하는 반면, 돌연변이유발 NHEJ는 GFP를 프레임 밖으로, 하류 m체리 서열을 프레임 내로 프레임시프트되게 한다. 검정을 위해, 센스 가닥을 표적화하는 7개 (U1-7) 및 안티센스 가닥을 표적화하는 7개 (D1-7)의, 200bp 스트레치의 DNA를 포함하는 14개의 gRNA를 설계하였다. 상보적 가닥을 닉킹하는 Cas9D 10A 돌연변이체를 사용하여, gRNA의 다양한 2-원 조합을 사용하여 다수의 프로그래밍된 5' 또는 3' 오버행을 유도하였다 (14개의 gRNA에 대한 닉킹 부위를 표시함). 도 3b에 나타낸 바와 같이, 오프셋 닉을 유도하여 이중 가닥 파괴 (DSB)를 생성하는 것은 유전자 파괴를 유도하는데 있어서 고도로 효과적이다. 두드러지게, 5' 오버행으로 이어지는 오프셋 닉은 3' 오버행과는 대조적으로 보다 많은 NHEJ 이벤트를 일으킨다. 도 3c에 나타낸 바와 같이, 3' 오버행의 생성은 또한 NHEJ 이벤트에 비해 HR의 비가 우세하지만, HR 이벤트의 총 수는 5' 오버행이 생성하는 경우보다 유의하게 더 낮다.
도 11a-b는 Cas9D10A 닉카제 매개 NHEJ에 관한 것이다. 도 11a에 나타낸 바와 같이, 신호등 리포터를 사용하여 표적화된 닉 또는 이중-가닥 파괴의 도입시의 NHEJ 이벤트를 검정하였다. 간략하게, DNA 절단 이벤트의 도입시에, 파괴가 돌연변이유발 NHEJ를 통해 진행되면, GFP는 프레임 밖으로 번역되고, 하류 m체리 서열은 프레임 내에서 적색 형광을 생성하게 된다. 센스 가닥을 표적화하는 7개 (U1-7) 및 안티센스 가닥을 표적화하는 7개 (D1-7)의, 200bp 스트레치의 DNA를 포함하는 14개의 gRNA를 설계하였다. 도 11b에 나타낸 바와 같이, 모든 표적에 걸쳐 DSB 및 강건한 NHEJ를 일으키는 야생형 Cas9와 달리, (Cas9D 10A 돌연변이체 사용시) 대부분의 닉이 드물게 NHEJ 이벤트를 일으키는 것으로 관찰되었다. 모든 14개의 부위는 DNA의 인접 200bp 스트레치 내에 위치하고, 표적화 효율에서 10배가 넘는 차이가 관찰되었다.
특정 측면에 따르면, 1개 이상, 2개 이상 또는 다수의 외래 핵산을 세포 내로 도입하는 것을 포함하는, 세포에서 표적 핵산의 발현을 조절하는 방법이 본원에 기재된다. 세포 내로 도입된 외래 핵산은 가이드 RNA 또는 가이드 RNA들, 뉴클레아제-기능부재 Cas9 단백질 또는 단백질들, 및 전사 조절 단백질 또는 도메인을 코딩한다. 함께, 가이드 RNA, 뉴클레아제-기능부재 Cas9 단백질 및 전사 조절 단백질 또는 도메인은 공동-국재화 복합체로서 지칭되며, 상기 용어는 가이드 RNA, 뉴클레아제-기능부재 Cas9 단백질 및 전사 조절 단백질 또는 도메인이 DNA에 결합하고 표적 핵산의 발현을 조절한다는 정도로 통상의 기술자에 의해 이해된다. 특정의 추가의 측면에 따르면, 세포 내로 도입된 외래 핵산은 가이드 RNA 또는 가이드 RNA들 및 Cas9 단백질 닉카제를 코딩한다. 함께, 가이드 RNA 및 Cas9 단백질 닉카제는 공동-국재화 복합체로서 지칭되며, 상기 용어는 가이드 RNA 및 Cas9 단백질 닉카제가 DNA에 결합하고 표적 핵산을 닉킹한다는 정도로 통상의 기술자에 의해 이해된다.
본 개시내용에 따른 세포는 외래 핵산이 본원에 기재된 바와 같이 도입되고 발현될 수 있는 임의의 세포를 포함한다. 본원에 기재된 본 개시내용의 기본 개념은 세포 유형에 제한되지 않는 것으로 이해되어야 한다. 본 개시내용에 따른 세포는 진핵 세포, 원핵 세포, 동물 세포, 식물 세포, 진균 세포, 고세균 세포, 유박테리아 세포 등을 포함한다. 세포는 진핵 세포, 예컨대 효모 세포, 식물 세포 및 동물 세포를 포함한다. 특정한 세포는 포유동물 세포를 포함한다. 또한, 세포는 표적 핵산을 조절하는데 유익하거나 바람직한 임의의 것을 포함한다. 이러한 세포는 질환 또는 유해 상태를 유발하는 특정한 단백질의 발현이 결핍된 것들을 포함할 수 있다. 이러한 질환 또는 유해 상태는 통상의 기술자에게 용이하게 공지되어 있다. 본 개시내용에 따르면, 특정한 단백질의 발현에 원인이 되는 핵산은, 표적 핵산 및 특정한 단백질의 상응하는 발현의 상향조절이 일어나도록 본원에 기재된 방법 및 전사 활성인자에 의해 표적화될 수 있다. 이러한 방식으로, 본원에 기재된 방법은 치유적 치료를 제공한다.
표적 핵산은, 본원에 기재된 바와 같은 공동-국재화 복합체가 조절 또는 닉킹에 유용할 수 있는 임의의 핵산 서열을 포함한다. 표적 핵산은 유전자를 포함한다. 본 개시내용의 목적을 위해, DNA, 예컨대 이중 가닥 DNA는 표적 핵산을 포함할 수 있고, 공동-국재화 복합체는 표적 핵산에서 또는 그에 인접하여 또는 그 부근에서 공동-국재화 복합체가 표적 핵산에 대해 바람직한 효과를 가질 수 있는 방식으로 DNA에 결합할 수 있거나, 또는 그와 달리 공동-국재화될 수 있다. 이러한 표적 핵산은 내인성 (또는 자연 발생) 핵산 및 외인성 (또는 외래) 핵산을 포함할 수 있다. 본 개시내용을 기초로 하여 통상의 기술자는 표적 핵산을 포함하는 DNA에 공동-국재화되는 가이드 RNA 및 Cas9 단백질을 용이하게 확인 또는 설계할 수 있을 것이다. 통상의 기술자는 또한, 마찬가지로 표적 핵산을 포함하는 DNA에 공동-국재화되는 전사 조절 단백질 또는 도메인을 확인할 수 있을 것이다. DNA는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA 또는 외인성 DNA를 포함한다.
외래 핵산 (즉, 세포의 천연 핵산 조성물의 부분이 아닌 것들)이, 이러한 도입에 대해 통상의 기술자에게 공지된 임의의 방법을 이용하여 세포 내로 도입될 수 있다. 이러한 방법은 형질감염, 형질도입, 바이러스 형질도입, 미세주사, 리포펙션, 뉴클레오펙션, 나노입자 포격, 형질전환, 접합 등을 포함한다. 통상의 기술자는 용이하게 확인가능한 문헌 공급원을 이용하여 이러한 방법을 용이하게 이해하고 적합화할 것이다.
전사 활성인자인 전사 조절 단백질 또는 도메인은 VP16 및 VP64, 및 본 개시내용을 기초로 하여 통상의 기술자에 의해 용이하게 확인가능한 다른 것들을 포함한다.
질환 및 유해 상태는 특정한 단백질의 발현의 비정상적 손실을 특징으로 하는 것들이다. 이러한 질환 또는 유해 상태는 특정한 단백질의 상향조절로 치료될 수 있다. 따라서, 본원에 기재된 바와 같은 공동-국재화 복합체가 표적 핵산을 포함하는 DNA에 회합 또는 달리 결합되고, 공동-국재화 복합체의 전사 활성인자가 표적 핵산의 발현을 상향조절하는 것인, 질환 또는 유해 상태를 치료하는 방법이 제공된다. 예를 들어, PRDM16 및 갈색 지방 분화를 촉진하고 대사 섭취를 증가시키는 다른 유전자의 상향조절이 대사 증후군 또는 비만을 치료하는데 사용될 수 있다. 항염증 유전자의 활성화는 자가면역 및 심혈관 질환에 유용하다. 종양 억제 유전자의 활성화는 암의 치료에 유용하다. 통상의 기술자는 본 개시내용을 기초로 하여 이러한 질환 및 유해 상태를 용이하게 확인할 것이다.
하기 실시예는 본 개시내용을 대표하는 것으로서 제시된다. 이들 실시양태 및 다른 등가의 실시양태가 본 개시내용, 도면 및 첨부된 청구범위의 관점에서 명백할 것이기 때문에, 이들 실시예는 본 개시내용의 범위를 제한하는 것으로 해석되어서는 안된다.
실시예 I
Cas9 돌연변이체
기지의 구조를 갖는 Cas9에 상동성인 서열을 검색하여, 그의 RuvC 및 HNH 도메인의 본래의 활성을 제거할 수 있는 Cas9에서의 후보 돌연변이를 확인하였다. HHpred (www.toolkit.tuebingen.mpg.de/hhpred)를 이용하여, Cas9의 전체 서열을 전체 단백질 데이터 뱅크(Protein Data Bank) (January 2013)와 대조하여 조회하였다. 다시, Cas9의 HNH 도메인에 대해 유의한 서열 상동성을 갖는 2종의 상이한 HNH 엔도뉴클레아제인 PacI 및 추정 엔도뉴클레아제 (각각 PDB ID: 3M7K 및 4H9D)를 검색하였다. 이들 단백질을, 마그네슘 이온 배위에 관여하는 잔기를 찾기 위해 조사하였다. 이어서, 상응하는 잔기를 Cas9에 대한 서열 정렬에서 확인하였다. Cas9의 동일한 아미노산 유형에 대해 정렬된 각각의 구조 내에서 2개의 Mg-배위 측쇄가 확인되었다. 이들은 3M7K D92 및 N113, 및 4H9D D53 및 N77이다. 이들 잔기는 Cas9 D839 및 N863에 상응하였다. 또한, PacI 잔기 D92 및 N113의 알라닌으로의 돌연변이가 뉴클레아제를 촉매작용이 결여되도록 만든다고 보고되었다. 이러한 분석에 기초하여 Cas9 돌연변이 D839A 및 N863A를 만들었다. 또한, HHpred는 Cas9와 써무스 써모필루스(Thermus thermophilus) RuvC (PDB ID: 4EP4)의 N-말단 사이의 상동성을 예측하기도 한다. 이러한 서열 정렬은 Cas9에서 RuvC 도메인의 기능을 제거한 이전의 보고된 돌연변이 D10A를 포함한다. 이것이 적절한 돌연변이인지 확인하기 위해, 금속 결합 잔기를 이전과 같이 결정하였다. 4EP4에서, D7은 마그네슘 이온의 배위를 돕는다. 이 위치가 Cas9 D10에 상응하는 서열 상동성을 가지므로, 이러한 돌연변이가 금속 결합의 제거를 도와, Cas9 RuvC 도메인으로부터의 촉매 활성을 제거한다는 것을 확인하였다.
실시예 II
플라스미드 구축
Cas9 돌연변이체를 퀵체인지(Quikchange) 키트 (애질런트 테크놀로지스(Agilent technologies))를 사용하여 제조하였다. 표적 gRNA 발현 구축물은 (1) IDT로부터 개별 지블록(gBlock)으로 직접 주문하여 pCR-BluntII-TOPO 벡터 (인비트로젠(Invitrogen))에 클로닝한 것이거나; 또는 (2) 진위즈(Genewiz)에 의해 주문 합성된 것이거나; 또는 (3) 올리고뉴클레오티드의 깁슨(Gibson) 어셈블리를 사용하여 gRNA 클로닝 벡터 (플라스미드 #41824)에 어셈블리된 것이다. 붕괴된 GFP가 수반되는 HR 리포터 검정에 사용하기 위한 벡터를, 정지 코돈을 보유하는 GFP 서열과 애드진(Addgene)으로부터의 EGIP 렌티벡터 (플라스미드 #26777)에 어셈블리된 적절한 단편의 융합 PCR 어셈블리에 의해 구축하였다. 이어서, 이러한 렌티벡터를 사용하여 GFP 리포터 안정한 라인을 확립하였다. 이 연구에서 사용되는 TALEN은 표준 프로토콜을 이용하여 구축하였다. 본원에 그 전문이 참조로 포함된 문헌 [Sanjana et al., Nature Protocols 7, 171-192 (2012)]을 참조한다. 표준 PCR 융합 프로토콜 절차를 이용하여 Cas9N과 MS2 VP64를 융합시켰다. OCT4 및 REX1에 대한 프로모터 루시페라제 구축물 (플라스미드 #17221 및 플라스미드 #17222)을 애드진으로부터 입수하였다.
실시예 III
세포 배양 및 형질감염
HEK 293T 세포를 10% 태아 소 혈청 (FBS, 인비트로젠), 페니실린/스트렙토마이신 (pen/strep, 인비트로젠), 및 비-필수 아미노산 (NEAA, 인비트로젠)이 보충된 둘베코 변형 이글 배지(Dulbecco's modified Eagle's medium) (DMEM, 인비트로젠) 고 글루코스에서 배양하였다. 세포를 가습 인큐베이터에서 37℃ 및 5% CO2에서 유지하였다.
뉴클레아제 검정에 수반되는 형질감염은 다음과 같다: 리포펙타민(Lipofectamine) 2000을 제조업체의 프로토콜에 따라 사용하여 0.4 x 106개 세포를 2μg Cas9 플라스미드, 2μg gRNA 및/또는 2μg DNA 공여자 플라스미드로 형질감염시켰다. 형질감염시키고 3일 후에 세포를 수거하여, FACS에 의해 분석하거나, 또는 게놈 절단물의 직접 검정을 위해 DNAeasy 키트 (퀴아젠(Qiagen))를 사용하여 ~1 X 106개 세포의 게놈 DNA를 추출하였다. 이러한 경우, 세포로부터 유래된 게놈 DNA로 PCR을 수행하여 표적화 영역을 증폭시키고, 앰플리콘을 MiSeq 퍼스널 시퀀서(MiSeq Personal Sequencer) (일루미나(Illumina))에 의해 유효범위 >200,000개 판독물로 심층 서열분석하였다. 이러한 서열분석 데이터를 분석하여 NHEJ 효율을 추정하였다.
전사 활성화 검정에 수반되는 형질감염의 경우: 0.4 x 106개 세포를 (1) 2μg Cas9N-VP64 플라스미드, 2μg gRNA 및/또는 0.25μg의 리포터 구축물; 또는 (2) 2μg Cas9N 플라스미드, 2μg MS2-VP64, 2μg gRNA-2XMS2압타머 및/또는 0.25μg의 리포터 구축물로 형질감염시켰다. 형질감염시키고 24-48시간 후에 세포를 수거하여, FACS 또는 면역형광 방법을 이용하여 검정하거나, 또는 그의 전체 RNA를 추출하고, 이후에 RT-PCR에 의해 분석하였다. 여기서 OCT4 및 REX1에 대한 표준 택맨(taqman) 프로브 (인비트로젠)가 사용되었으며, 각 샘플을 GAPDH에 대해 정규화하였다.
Cas9-gRNA 복합체 및 TALE의 특이성 프로파일에 대한 전사 활성화 검정에 수반되는 형질감염의 경우: 0.4 x 106개 세포를 (1) 2μg Cas9N-VP64 플라스미드, 2μg gRNA 및 0.25μg의 리포터 라이브러리; 또는 (2) 2μg TALE-TF 플라스미드 및 0.25μg의 리포터 라이브러리; 또는 (3) 2μg 대조-TF 플라스미드 및 0.25μg의 리포터 라이브러리로 형질감염시켰다. 형질감염시키고 24시간 후에 (리포터의 자극이 포화 모드가 되는 것을 피하기 위함) 세포를 수거하였다. RNAeasy-플러스 키트 (퀴아젠)를 사용하여 전체 RNA를 추출하고, 슈퍼스크립트(Superscript)-III (인비트로젠)을 사용하여 표준 RT-pcr을 수행하였다. 전사체-태그의 표적화된 pcr 증폭에 의해 차세대 서열분석을 위한 라이브러리가 생성되었다.
실시예 IV
Cas9-TF 및 TALE-TF 리포터 발현 수준의 계산을 위한 전산 및 서열 분석
이러한 과정을 위한 고수준 논리 흐름도가 도 8a에 도시되고, 추가의 세부사항이 여기에 제시된다. 구축물 라이브러리 조성에 대한 세부사항은, 도 8a (레벨 1) 및 8b를 참조한다.
서열분석: Cas9 실험의 경우, 구축물 라이브러리 (도 8a, 레벨 3, 좌측) 및 리포터 유전자 cDNA 서열 (도 8a, 레벨 3, 우측)을 일루미나 MiSeq 상에서 150bp 중첩 쌍형성된 말단 판독물로서 수득하고, TALE 실험의 경우, 상응하는 서열을 일루미나 HiSeq 상에서 51bp 비-중첩 쌍형성된 말단 판독물로서 수득하였다.
구축물 라이브러리 서열 처리: 정렬: Cas9 실험의 경우, 노보얼라인(novoalign) V2.07.17 (www.novocraft.com/main/index/php)을 이용하여, 8bp 라이브러리 바코드의 쌍에 의해 플랭킹된 234bp의 구축물에 상응하는 250bp 참조 서열의 세트에 대해 쌍형성된 판독물을 정렬시켰다 (도 8a, 제3 레벨, 좌측 참조). 노보얼라인에 제공된 참조 서열에는, 구축물 라이브러리 바코드가 명확하게 제시되면서 23bp 축중성 Cas9 결합 부위 영역 및 24bp 축중성 전사체 태그 영역 (도 8a, 제1 레벨 참조)이 N으로 명시되어 있다. TALE 실험의 경우, 참조 서열의 길이가 203bp이고, 축중성 결합 부위 영역의 길이가 18bp 대 23bp인 것을 제외하고 동일한 절차를 이용하였다. 유효성 검사: 각각의 판독물 쌍에 대한 좌측 및 우측 판독물이 참조 서열에 대해 개별적으로 정렬되도록 구성된 파일에 대한 노보얼라인 결과. 둘 모두가 참조 서열에 대해 특유하게 정렬된 판독물 쌍만이 추가의 유효성 조건에 적용되었으며, 이러한 모든 조건을 통과한 판독물 쌍만을 남겨두었다. 유효성 조건은 다음을 포함하였다:
(i) 2개의 구축물 라이브러리 바코드는 각각 참조 서열 바코드에 대해 적어도 4군데 위치에서 정렬되어야 하고, 2개의 바코드는 동일한 구축물 라이브러리에 대한 바코드 쌍에 대해 정렬되어야 한다.
(ii) 참조 서열의 N 영역에 대해 정렬된 모든 염기는 노보얼라인에 의해 A, C, G 또는 T로 지명되어야 한다. Cas9 실험 뿐만 아니라 TALE 실험에서도 좌측 및 우측 판독물이 참조 N 영역에서 중첩되지 않았으며, 이에 따라 이러한 N 염기가 노보얼라인에 의해 불분명하게 지명될 가능성이 발생하지 않았다는 점을 주목한다. (iii) 마찬가지로, 노보얼라인-지명된 삽입부 또는 결실부가 이들 영역에서 나타나지 않아야 한다. (iv) (이러한 무작위 서열은 오직 A, C, 및 G로부터 생성되므로) T가 전사체 태그 영역에서 나타나지 않아야 한다. 이러한 조건 중 어느 하나를 위반하는 판독물 쌍을 불합격 판독물 쌍 파일에 수집하였다. 이러한 유효성 검사를 주문형 perl 스크립트를 사용하여 시행하였다.
유도된 샘플 리포터 유전자 cDNA 서열 처리: 정렬: 먼저 SeqPrep (www.github.com/jstjohn/SeqPrep로부터 다운로드됨)을 사용하여 중첩 판독물 쌍을 79bp 공통 절편에 병합시킨 후에, 노보얼라인 (상기 버전)을 사용하여 이들 79bp 공통 절편들을, (구축물 라이브러리 서열분석의 경우) 샘플 바코드가 명확하게 제시되면서 24bp 축중성 전사체 태그가 N으로 명시된 참조 서열의 세트에 대해 쌍형성되지 않은 단일 판독물로서 정렬시켰다 (도 8a, 제3 레벨, 우측 참조). TALE 및 Cas9 cDNA 서열 영역은 둘 다 8bp 샘플 바코드 서열의 쌍에 의해 플랭킹된 cDNA의 동일한 63bp 영역에 상응하였다. 유효성 검사: 하기를 제외한 동일한 조건이 구축물 라이브러리 서열분석에 적용되었다 (상기 참조): (a) 여기서, 판독물 쌍의 이전의 SeqPrep 병합으로 인해, 유효성 처리는 판독물 쌍 내의 두 판독물의 특유한 정렬을 필터링하는 것이 아니라 오직 병합된 판독물의 특유한 정렬을 필터링해야 한다. (b) 유효성 처리가 오직 참조 서열의 전사체 태그 영역에만 적용되고, 별도의 결합 부위 영역에는 적용되지 않도록, 오직 전사체 태그만이 cDNA 서열 판독물에서 나타나야 한다.
결합 부위 대 전사체 태그 회합의 표의 어셈블리: 주문형 perl을 사용하여, 유효 구축물 라이브러리 서열로부터 상기 표를 작성하였다 (도 8a, 제4 레벨, 좌측). A, C, 및 G 염기로 구성된 24bp 태그 서열은 구축물 라이브러리의 전반에 걸쳐 본질적으로 특유해야 하지만 (공유 확률 = ~2.8e-11), 결합 부위 대 태그 회합의 초기 분석에서 태그 서열의 무시할 수 없는 분획이 실제로 다중 결합 서열에 의해 공유되는 것으로 밝혀졌으며, 이는 아마도 주로 결합 서열에서의 서열 오류, 또는 구축물 라이브러리를 생성하는데 사용되는 올리고에서의 올리고 합성 오류의 조합에 의해 유발된 것일 것이다. 태그 공유에 더하여, 유효 판독물 쌍에서 결합 부위와 회합되어 발견되는 태그는 바코드 미스매치로 인해 이들이 어느 구축물 라이브러리로부터 유래된 것인지 분명하지 않은 경우에 구축물 라이브러리 판독물 쌍 불합격 파일에서 발견될 수도 있을 것이다. 마지막으로, 태그 서열은 그 자체가 서열 오류를 함유할 수 있다. 이러한 에러의 근원을 처리하기 위해, 태그를 3가지 속성으로 분류하였다: (i) 안전 대 불안, 여기서 불안은 태그가 구축물 라이브러리 불합격 판독물 쌍 파일에서 발견될 수 있음을 의미한다; 공유 대 비공유, 여기서 공유는 태그가 다중 결합 부위 서열과 회합되어 발견되었다는 것을 의미한다; 및 2+ 대 1-유일, 여기서 2+는 태그가 유효 구축물 라이브러리 서열 가운데서 적어도 2회 나타나고, 이에 따라 서열 오류를 함유할 가능성이 더 작은 것으로 간주됨을 의미한다. 이러한 3가지 기준을 조합하여, 각 결합 부위와 회합된 태그의 8가지 클래스를 만들었다: 가장 많이 안전한 (그러나 가장 덜 풍부한) 클래스는 오직 안전, 비공유, 2+ 태그만을 포함하고, 가장 덜 안전한 (그러나 가장 많이 풍부한) 클래스는 안전성, 공유여부, 또는 발생 횟수에 관계없이 모든 태그를 포함한다.
정규화된 발현 수준의 계산: 주문형 perl 코드를 사용하여 도 8a, 레벨 5-6에 지시된 단계를 시행하였다. 먼저, 각각의 유도된 샘플에서 수득한 태그 수를, 구축물 라이브러리에 대하여 이전에 계산된 결합 부위 대 전사체 태그 표를 사용하여 각 결합 부위에 대해 집계하였다 (도 8c 참조). 이어서, 각 샘플에 대하여, 각 결합 부위에 대해 집계된 태그 수를 양성 대조군 샘플에 대해 집계된 태그 수로 나누어, 정규화된 발현 수준을 생성하였다. 이러한 계산과 관련된 추가의 고려사항은 다음을 포함한다:
1. 각 샘플에서, 유효성-검사된 cDNA 유전자 서열 가운데서 결합 부위 대 전사체 태그 회합 표에서 찾아볼 수 없었던 "신규" 태그의 하위세트가 발견되었다. 이러한 태그는 후속 계산에서 무시하였다.
2. 결합 부위 대 전사체 태그 회합 표에 상기 기재된 태그의 8개 클래스 각각에 대하여 상기 기재된 태그 수의 집계를 수행하였다. 구축물 라이브러리 내의 결합 부위가 중앙 서열에 유사한 서열은 빈번하게 생성하지만, 증가하는 개수의 미스매치를 갖는 서열은 점점 더 드물게 생성하는 편재성을 나타내기 때문에, 소수의 미스매치를 갖는 결합 부위는 일반적으로 태그의 큰 수로 집계되는 한편, 보다 많은 미스매치를 갖는 결합 부위는 보다 적은 수로 집계된다. 따라서, 일반적으로는 가장 안전한 태그 클래스의 사용이 바람직할 수 있으나, 2개 이상의 미스매치를 갖는 결합 부위의 평가는 결합 부위당 적은 수의 태그에 기초할 수 있을 것이며, 이로 인해 안전한 수 및 비는, 태그 그 자체는 보다 더 신뢰할만하더라도, 통계적으로 보다 덜 신뢰할만하게 되었다. 이러한 경우에, 모든 태그가 사용되었다. 이러한 고려사항은, n개 미스매칭 위치에 대해 별도로 집계된 태그 수의 개수가 미스매칭 위치의 조합의 개수 (= )에 따라 상승하여, n에 따라 현저하게 증가하고; 따라서 상이한 개수(n)의 미스매치에 대해 집계된 태그 수의 평균 (도 2b, 2e, 및 도 9a 및 10b에 제시됨)은 n≥2에 대해 집계된 태그 수의 통계적으로 매우 큰 세트에 기초한다는 사실에 의거하여 약간 보정된다.
3. 마지막으로, TALE 구축물 라이브러리에 구축된 결합 부위는 18bp였고, 태그 회합은 이들 18bp 서열에 기초하여 할당되었으나, 일부 실험은 18bp 구축물 결합 부위 영역 내의 중앙 14bp 또는 10bp 영역에 결합하도록 프로그램화된 TALE를 사용하여 수행하였다. 이러한 TALE에 대한 발현 수준의 계산에서, 태그를 회합 표 내의 18bp 결합 부위의 상응하는 영역에 기초하여 결합 부위에 집합시켜, 이러한 영역 외부의 결합 부위 미스매치는 무시하였다.
실시예 V
Cas9N-VP64를 사용하는 RNA-가이드된 SOX2 및 NANOG 조절
본원에 기재된 sgRNA (압타머-변형된 단일 가이드 RNA) 테더링 접근법은 상이한 이펙터 도메인이 별개의 sgRNA에 의해 동원되는 것을 허용하며, 다만, 각각의 sgRNA는 상이한 RNA-단백질 상호작용 쌍을 사용하고, 동일한 Cas9N-단백질을 사용하는 멀티플렉스 유전자 조절을 가능하게 하는 것이다. 도 12a SOX2 및 도 12b NANOG 유전자에 대하여, 전사 개시 부위의 상류 ~1kb DNA 스트레치를 표적화하는 10개의 gRNA를 설계하였다. DNase 과민성 부위는 녹색으로 강조 표시된다. 내인성 유전자의 qPCR을 통해 전사 활성화를 검정하였다. 두 경우에, 개별 gRNA의 도입은 전사를 중간 정도로 자극하였으나, 다중 gRNA는 수-배의 강한 전사 활성화를 상승작용적으로 자극하도록 작용하였다. 데이터는 평균 +/- SEM (N=3)이다. 도 12a-b에 도시된 바와 같이, 2개의 추가의 유전자, SOX2 및 NANOG는 프로모터 DNA의 상류 ~1kb 스트레치 이내를 표적화하는 sgRNA에 의해 조절되었다. 전사 개시 부위에 근접한 sgRNA가 강한 유전자 활성화를 발생시켰다.
실시예 VI
Cas9-gRNA 복합체에 의한 표적화의 랜드스케이프 평가
도 2에 기재된 접근법을 이용하여, 2개의 추가의 Cas9-gRNA 복합체 (도 13a-c) 및 (도 13d-f)의 표적화 랜드스케이프를 분석하였다. 2개의 gRNA는, gRNA2는 최대 2-3개의 미스매치를 허용하고 gRNA3은 최대 1개만을 허용하는 매우 상이한 특이성 프로파일을 갖는다. 이러한 측면은 1개의 염기 미스매치 (도 13b, 13e) 및 2개의 염기 미스매치 플롯 (도 13c, 13f) 둘 다에서 반영된다. 도 13c 및 13f에서, 데이터 디스플레이를 개선하기 위해 정규화된 발현 수준이 컬러 스케일(color scale)의 상한을 넘어서는 이상치인 미스매치 쌍을 별표 '*'가 함유된 황색 박스로 표시하면서, 정규화된 발현 수준을 계산하는데 이용가능한 데이터가 충분하지 않은 염기 미스매치 쌍을 'x'가 함유된 회색 박스로 표시한다. 통계적 유의성 기호는 다음과 같다: P<.0005/n에 대하여 ***, P<.005/n에 대하여 **, P<.05/n에 대하여 *, 및 P>=.05/n에 대하여 N.S. (비-유의함), 여기서 n은 비교물의 개수이다 (표 2 참조).
실시예 VII
확인, 리포터 검정의 특이성
도 14a-c에 도시된 바와 같이, 특이성 데이터가 2가지 상이한 sgRNA:Cas9 복합체를 사용하여 생성되었다. 상응하는 돌연변이체 sgRNA가 리포터 라이브러리를 자극하지 못하였으므로, 이 검정이 평가 대상 sgRNA에 대해 특이적임을 확인하였다. 도 14a: 2개의 gRNA (야생형 및 돌연변이체; 상이한 서열은 적색으로 강조 표시됨)의 특이성 프로파일을, 야생형 gRNA 표적 서열에 대해 설계된 리포터 라이브러리를 사용하여 평가하였다. 도 14b: 상응하는 돌연변이체 gRNA가 리포터 라이브러리를 자극하지 못하였으므로, 이 검정이 평가 대상 gRNA에 대해 특이적임을 확인하였다 (데이터는 도 13d로부터 재플롯팅됨). 통계적 유의성 기호는 다음과 같다: P<.0005/n에 대하여 ***, P<.005/n에 대하여 **, P<.05/n에 대하여 *, 및 P>=.05/n에 대하여 N.S. (비-유의함), 여기서 n은 비교물의 개수이다 (표 2 참조). 상이한 sgRNA는 상이한 특이성 프로파일을 가질 수 있으며 (도 13a, 13d), 구체적으로, sgRNA2는 최대 3개의 미스매치를 허용하고, sgRNA3은 최대 1개만을 허용한다. 다른 위치에서의 미스매치가 또한 활성에 영향을 미치는 것으로 관찰되었을지라도, 미스매치에 대한 최대의 감도는 스페이서의 3' 말단에 국한되었다.
실시예 VIII
확인, 단일 및 이중-염기 gRNA 미스매치
도 15a-d에 도시된 바와 같이, 표적화 실험에 의해, 검정된 sgRNA에서의 스페이서의 3' 말단의 12 bp 내의 단일-염기 미스매치는 검출가능한 표적화를 발생시킨다는 것을 확인하였다. 그러나, 이 영역에서의 2 bp 미스매치는 활성의 유의한 손실을 초래하였다. 뉴클레아제 검정을 이용하여, 2개의 독립된 gRNA를 시험하였다: 스페이서 서열 대 표적에서 단일 또는 이중-염기 미스매치 (적색으로 강조 표시됨)를 보유하는 gRNA2 (도 15a-b) 및 gRNA3 (도 15c-d). 검정된 gRNA에서의 스페이서의 3' 말단의 12bp 내의 단일-염기 미스매치는 검출가능한 표적화를 발생시키지만, 이 영역에서의 2bp 미스매치는 빠른 활성 손실을 초래한다는 것을 확인하였다. 이들 결과는 도 13의 결과와 일치하는, 상이한 gRNA 사이의 특이성 프로파일의 차이를 더 강조한다. 데이터는 평균 +/- SEM (N=3)이다.
실시예 IX
확인, 5' gRNA 말단절단
도 16a-d에 도시된 바와 같이, 스페이서의 5' 부분에서의 말단절단은 sgRNA 활성을 유지하였다. 뉴클레아제 검정을 이용하여, 2개의 독립된 gRNA를 시험하였다: 스페이서의 5' 말단에서 말단절단된 gRNA1 (도 16a-b) 및 gRNA3 (도 16c-d). 1-3 bp의 5' 말단절단은 잘 허용되지만, 보다 큰 결실은 활성의 손실을 초래하는 것으로 관찰되었다. 데이터는 평균 +/- SEM (N=3)이다.
실시예 X
확인, 에스. 피오게네스 PAM
도 17a-b에 도시된 바와 같이, 뉴클레아제 매개 HR 검정을 이용하여, 에스. 피오게네스 Cas9에 대한 PAM가 NGG이고, 또한 NAG임을 확인하였다. 데이터는 평균 +/- SEM (N=3)이다. 추가의 연구에 따르면, 표적화 서열의 마지막 13 nt를 공유하는 대안적 NGG 표적을 갖지 않는 인간 엑손에서 생성된 약 190K Cas9 표적의 세트를 대안적 NAG 부위의 존재 여부 또는 이전의 13 nt에 미스매치를 갖는 NGG 부위에 대해 스캐닝하였다. 단지 0.4%만이 이러한 대안적 표적을 갖지 않는 것으로 밝혀졌다.
실시예 XI
확인, TALE 돌연변이
뉴클레아제 매개 HR 검정을 이용하여 (도 18a-b), 18량체 TALE가 그의 표적 서열에 다중 돌연변이를 허용한다는 것을 확인하였다. 도 18a-b에 도시된 바와 같이, 표적의 중앙부에서의 특정 돌연변이는, 뉴클레아제 검정에서 표적화된 실험을 통해 결정된 바와 같이 보다 높은 TALE 활성을 발생시켰다.
실시예 XII
TALE 단량체 특이성 대 TALE 단백질 특이성
개개의 반복부-가변성 이잔기(diresidue) (RVD)의 역할을 분리시키기 위해, RVD의 선택이 염기 특이성에 기여하였으며, 또한 TALE 특이성이 전체적으로 단백질의 결합 에너지의 함수임을 확인하였다. 도 19a-c는 TALE 단량체 특이성 대 TALE 단백질 특이성의 비교를 보여준다. 도 19a: 도 2에 기재된 접근법의 변형을 이용하여, 6개의 NI 또는 6개의 NH 반복부의 인접한 세트를 보유하는 2가지 14량체 TALE-TF의 표적화 랜드스케이프를 분석하였다. 이러한 접근법에서, 중앙부에 축중성 6량체 서열을 보유하는 리포터의 축소된 라이브러리를 만들어, TALE-TF 특이성 검정에 사용하였다. 도 19b-c: 두 경우에, 예상된 표적 서열이 풍부화된 것을 주목하였다 (즉, NI 반복부의 경우 6개의 A를 보유하고, NH 반복부의 경우 6개의 G를 보유함). 이러한 TALE는 각각 여전히 중앙의 6량체 표적 서열에 1-2개의 미스매치를 허용한다. 단량체의 선택이 염기 특이성에 기여하며, 또한 TALE 특이성은 전체적으로 단백질의 결합 에너지의 함수이다. 한 측면에 따르면, 보다 짧은 조작된 TALE 또는 고친화도 및 저친화도 단량체의 조성물을 보유하는 TALE는 게놈 조작 응용에서 보다 높은 특이성을 일으키고, 뉴클레아제 응용에서의 FokI 이량체화는 보다 짧은 TALE를 사용하는 경우에 오프-표적 영향을 더 감소시킨다.
실시예 XIII
오프셋 닉킹, 천연 유전자좌
도 20a-b는 오프셋 닉킹과 관련된 데이터를 보여준다. 게놈-편집과 관련하여, 오프셋 닉을 만들어 DSB를 생성하였다. 대다수의 닉은 비-상동 말단 접합 (NHEJ) 매개 indel을 생성하지 않으며, 이에 따라 오프셋 닉을 유도하는 경우에, 오프-표적 단일 닉 사건은 아마도 매우 낮은 indel 비율을 생성할 것이다. 오프셋 닉을 유도하여 DSB를 생성하는 것은 통합된 리포터 유전자좌 및 천연 AAVS1 게놈 유전자좌 둘 다에서 유전자 파괴를 유도하는데 효과적이다. 도 20a: 200bp DNA 스트레치를 커버하는 8개의 gRNA (4개는 센스 가닥을 표적화하고 (s1-4), 4개는 안티센스 가닥을 표적화함 (as1-4))를 갖는 천연 AAVS1 유전자좌를 표적화하였다. 상보적 가닥에 닉이 생성된 Cas9D10A 돌연변이체를 사용하여, gRNA의 다양한 2-원 조합을 이용하여 소정 범위의 프로그램화된 5' 또는 3' 오버행을 유도하였다. 도 20b: 생어(Sanger) 서열분석 기반 검정을 이용하여, 단일 gRNA는 검출가능한 NHEJ 사건을 유도하지 않는 반면에, 오프셋 닉을 유도하여 DSB를 생성하는 것은 유전자 파괴를 유도하는데 매우 효과적이라는 것을 관찰하였다. 주목할만한게, 5' 오버행을 생성하는 오프셋 닉은 3' 오버행과는 대조적으로 보다 많은 NHEJ 사건을 발생시킨다. 생어 서열분석 클론의 개수가 막대 위에 강조 표시되고, 예측되는 오버행 길이가 상응하는 x-축 범례 아래 표시된다.
실시예 XIV
오프셋 닉킹, NHEJ 프로파일
도 21a-c는 오프셋 닉킹 및 NHEJ 프로파일에 관한 것이다. 3가지 상이한 오프셋 닉킹 조합의 대표적인 생어 서열분석 결과가 박스로 강조 표시된 표적화 gRNA의 위치와 함께 제시된다. 또한, 상동 재조합 (HR) 매개 복구를 위한 표준 모델과 일치하게, 오프셋 닉을 통한 5' 오버행의 조작은 3' 오버행보다 더 강한 NHEJ 사건을 발생시켰다 (도 3b). NHEJ의 자극에 더하여, 강한 HR 유도가 5' 오버행이 생성되었을 때 관찰되었다. 3' 오버행의 생성은 HR 비율을 개선시키지 않았다 (도 3c).
실시예 XV
표 1
내인성 유전자 조절을 위한 gRNA 표적
Cas9-gRNA 매개 활성화 실험에 사용되는 REX1, OCT4, SOX2 및 NANOG 프로모터 내의 표적이 열거된다.
실시예 XVI
표 2
Cas9-gRNA 및 TALE 특이성 데이터의 통계적 분석의 개요
표 2(a) 특정한 개수의 표적 부위 돌연변이를 갖는 표적 서열에 결합하는 TALE 또는 Cas9-VP64 활성화제의 정규화된 발현 수준의 비교에 대한 P-값. 정규화된 발현 수준을 도면 칼럼 내에 표시된 도면 내의 박스플롯으로 표시하였고, 여기서 박스는 표적 부위로부터의 미스매치의 개수에 대한 이들 수준의 분포를 나타낸다. P-값을 각각의 박스플롯 내의 미스매치의 각 연속적 쌍의 개수에 대한 t-테스트 (t-테스트는 1 샘플 또는 2 샘플 t-테스트임)를 이용하여 계산하였다 (방법 참조). 통계적 유의성을 본페로니(Bonferroni)-보정된 P-값 역치 (보정은 각각의 박스플롯 내의 비교물의 개수에 기초함)를 사용하여 평가하였다. 통계적 유의성 기호는 다음과 같다: P<.0005/n에 대하여 ***, P<.005/n에 대하여 **, P<.05/n에 대하여 *, 및 P>=.05/n에 대하여 N.S. (비-유의함), 여기서 n은 비교물의 개수이다. 표 2(b) 도 2d에서의 시드 영역의 통계적 특성화: 20bp 표적 부위의 3' 말단의 후보 시드 영역 내에서 돌연변이된 위치 쌍 대 모든 다른 위치 쌍에 대한, 2개의 돌연변이를 갖는 표적 서열에 결합하는 Cas9N VP64+gRNA에 대한 발현 값들 사이의 분리 정도를 나타내는 log10(P-값). 최대 -log10 (P-값) (위에 강조 표시됨)에 의해 지시되는 최대 분리가 표적 부위의 마지막 8-9bp에서 발견된다. 이들 위치는 이 표적 부위의 "시드" 영역이 시작되는 부분을 나타내는 것으로 해석될 수 있다. P-값을 계산하는 방법에 대한 정보에 대해 방법 내의 섹션 "시드 영역의 통계적 특성화"를 참조한다.
실시예 XVII
실시예에서의 단백질 및 RNA의 서열
A. m4 돌연변이체를 기초로 하는 Cas9N-VP64 활성인자 구축물의 서열을 하기 나타내었다. 3개 버전을 구축하였고 Cas9m4 VP64 및 Cas9m4 VP64N 융합 단백질 포맷이 가장 높은 활성을 보여주었다. m3 및 m2 돌연변이체에 상응하는 벡터 (도 4a)를 또한 구축하였다 ( 도메인을 강조함).
>Cas9m4 VP64
>Cas9m4 VP64N 서열
>Cas9m4 VP64C
B. MS2-활성인자 구축물의 서열, 및 2X MS2 압타머 도메인을 갖는 상응하는 gRNA 백본 벡터를 하기 제공하였다
>MS2VP64N
>MS2VP64C
>gRNA2XMS2
C. d토마토 형광 기반 전사 활성화 리포터 서열을 하기 열거하였다
>TF 리포터 1
>TF 리포터 2
D. TALE 및 Cas9-gRNA 특이성 검정에 사용된 리포터 라이브러리의 일반적 포맷을 하기 제공하였다
> 특이성 리포터 라이브러리
SEQUENCE LISTING
<110> President and Fellows of Harvard College
<120> RNA-Guided Transcriptional Regulation
<130> 010498.00503
<140> PCT/US14/040868
<141> 2014-06-04
<150> US 61/830787
<151> 2013-06-04
<160> 184
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 4332
<212> DNA
<213> Artificial
<220>
<223> VP64-activator construct
<400> 2
gccaccatgg acaagaagta ctccattggg ctcgctatcg gcacaaacag cgtcggctgg 60
gccgtcatta cggacgagta caaggtgccg agcaaaaaat tcaaagttct gggcaatacc 120
gatcgccaca gcataaagaa gaacctcatt ggcgccctcc tgttcgactc cggggagacg 180
gccgaagcca cgcggctcaa aagaacagca cggcgcagat atacccgcag aaagaatcgg 240
atctgctacc tgcaggagat ctttagtaat gagatggcta aggtggatga ctctttcttc 300
cataggctgg aggagtcctt tttggtggag gaggataaaa agcacgagcg ccacccaatc 360
tttggcaata tcgtggacga ggtggcgtac catgaaaagt acccaaccat atatcatctg 420
aggaagaagc ttgtagacag tactgataag gctgacttgc ggttgatcta tctcgcgctg 480
gcgcatatga tcaaatttcg gggacacttc ctcatcgagg gggacctgaa cccagacaac 540
agcgatgtcg acaaactctt tatccaactg gttcagactt acaatcagct tttcgaagag 600
aacccgatca acgcatccgg agttgacgcc aaagcaatcc tgagcgctag gctgtccaaa 660
tcccggcggc tcgaaaacct catcgcacag ctccctgggg agaagaagaa cggcctgttt 720
ggtaatctta tcgccctgtc actcgggctg acccccaact ttaaatctaa cttcgacctg 780
gccgaagatg ccaagcttca actgagcaaa gacacctacg atgatgatct cgacaatctg 840
ctggcccaga tcggcgacca gtacgcagac ctttttttgg cggcaaagaa cctgtcagac 900
gccattctgc tgagtgatat tctgcgagtg aacacggaga tcaccaaagc tccgctgagc 960
gctagtatga tcaagcgcta tgatgagcac caccaagact tgactttgct gaaggccctt 1020
gtcagacagc aactgcctga gaagtacaag gaaattttct tcgatcagtc taaaaatggc 1080
tacgccggat acattgacgg cggagcaagc caggaggaat tttacaaatt tattaagccc 1140
atcttggaaa aaatggacgg caccgaggag ctgctggtaa agcttaacag agaagatctg 1200
ttgcgcaaac agcgcacttt cgacaatgga agcatccccc accagattca cctgggcgaa 1260
ctgcacgcta tcctcaggcg gcaagaggat ttctacccct ttttgaaaga taacagggaa 1320
aagattgaga aaatcctcac atttcggata ccctactatg taggccccct cgcccgggga 1380
aattccagat tcgcgtggat gactcgcaaa tcagaagaga ccatcactcc ctggaacttc 1440
gaggaagtcg tggataaggg ggcctctgcc cagtccttca tcgaaaggat gactaacttt 1500
gataaaaatc tgcctaacga aaaggtgctt cctaaacact ctctgctgta cgagtacttc 1560
acagtttata acgagctcac caaggtcaaa tacgtcacag aagggatgag aaagccagca 1620
ttcctgtctg gagagcagaa gaaagctatc gtggacctcc tcttcaagac gaaccggaaa 1680
gttaccgtga aacagctcaa agaagactat ttcaaaaaga ttgaatgttt cgactctgtt 1740
gaaatcagcg gagtggagga tcgcttcaac gcatccctgg gaacgtatca cgatctcctg 1800
aaaatcatta aagacaagga cttcctggac aatgaggaga acgaggacat tcttgaggac 1860
attgtcctca cccttacgtt gtttgaagat agggagatga ttgaagaacg cttgaaaact 1920
tacgctcatc tcttcgacga caaagtcatg aaacagctca agaggcgccg atatacagga 1980
tgggggcggc tgtcaagaaa actgatcaat gggatccgag acaagcagag tggaaagaca 2040
atcctggatt ttcttaagtc cgatggattt gccaaccgga acttcatgca gttgatccat 2100
gatgactctc tcacctttaa ggaggacatc cagaaagcac aagtttctgg ccagggggac 2160
agtcttcacg agcacatcgc taatcttgca ggtagcccag ctatcaaaaa gggaatactg 2220
cagaccgtta aggtcgtgga tgaactcgtc aaagtaatgg gaaggcataa gcccgagaat 2280
atcgttatcg agatggcccg agagaaccaa actacccaga agggacagaa gaacagtagg 2340
gaaaggatga agaggattga agagggtata aaagaactgg ggtcccaaat ccttaaggaa 2400
cacccagttg aaaacaccca gcttcagaat gagaagctct acctgtacta cctgcagaac 2460
ggcagggaca tgtacgtgga tcaggaactg gacatcaatc ggctctccga ctacgacgtg 2520
gctgctatcg tgccccagtc ttttctcaaa gatgattcta ttgataataa agtgttgaca 2580
agatccgata aagctagagg gaagagtgat aacgtcccct cagaagaagt tgtcaagaaa 2640
atgaaaaatt attggcggca gctgctgaac gccaaactga tcacacaacg gaagttcgat 2700
aatctgacta aggctgaacg aggtggcctg tctgagttgg ataaagccgg cttcatcaaa 2760
aggcagcttg ttgagacacg ccagatcacc aagcacgtgg cccaaattct cgattcacgc 2820
atgaacacca agtacgatga aaatgacaaa ctgattcgag aggtgaaagt tattactctg 2880
aagtctaagc tggtctcaga tttcagaaag gactttcagt tttataaggt gagagagatc 2940
aacaattacc accatgcgca tgatgcctac ctgaatgcag tggtaggcac tgcacttatc 3000
aaaaaatatc ccaagcttga atctgaattt gtttacggag actataaagt gtacgatgtt 3060
aggaaaatga tcgcaaagtc tgagcaggaa ataggcaagg ccaccgctaa gtacttcttt 3120
tacagcaata ttatgaattt tttcaagacc gagattacac tggccaatgg agagattcgg 3180
aagcgaccac ttatcgaaac aaacggagaa acaggagaaa tcgtgtggga caagggtagg 3240
gatttcgcga cagtccggaa ggtcctgtcc atgccgcagg tgaacatcgt taaaaagacc 3300
gaagtacaga ccggaggctt ctccaaggaa agtatcctcc cgaaaaggaa cagcgacaag 3360
ctgatcgcac gcaaaaaaga ttgggacccc aagaaatacg gcggattcga ttctcctaca 3420
gtcgcttaca gtgtactggt tgtggccaaa gtggagaaag ggaagtctaa aaaactcaaa 3480
agcgtcaagg aactgctggg catcacaatc atggagcgat caagcttcga aaaaaacccc 3540
atcgactttc tcgaggcgaa aggatataaa gaggtcaaaa aagacctcat cattaagctt 3600
cccaagtact ctctctttga gcttgaaaac ggccggaaac gaatgctcgc tagtgcgggc 3660
gagctgcaga aaggtaacga gctggcactg ccctctaaat acgttaattt cttgtatctg 3720
gccagccact atgaaaagct caaagggtct cccgaagata atgagcagaa gcagctgttc 3780
gtggaacaac acaaacacta ccttgatgag atcatcgagc aaataagcga attctccaaa 3840
agagtgatcc tcgccgacgc taacctcgat aaggtgcttt ctgcttacaa taagcacagg 3900
gataagccca tcagggagca ggcagaaaac attatccact tgtttactct gaccaacttg 3960
ggcgcgcctg cagccttcaa gtacttcgac accaccatag acagaaagcg gtacacctct 4020
acaaaggagg tcctggacgc cacactgatt catcagtcaa ttacggggct ctatgaaaca 4080
agaatcgacc tctctcagct cggtggagac agcagggctg accccaagaa gaagaggaag 4140
gtggaggcca gcggttccgg acgggctgac gcattggacg attttgatct ggatatgctg 4200
ggaagtgacg ccctcgatga ttttgacctt gacatgcttg gttcggatgc ccttgatgac 4260
tttgacctcg acatgctcgg cagtgacgcc cttgatgatt tcgacctgga catgctgatt 4320
aactctagat ga 4332
<210> 3
<211> 4365
<212> DNA
<213> Artificial
<220>
<223> VP64-activator construct
<400> 3
gccaccatgc ccaagaagaa gaggaaggtg ggaaggggga tggacaagaa gtactccatt 60
gggctcgcta tcggcacaaa cagcgtcggc tgggccgtca ttacggacga gtacaaggtg 120
ccgagcaaaa aattcaaagt tctgggcaat accgatcgcc acagcataaa gaagaacctc 180
attggcgccc tcctgttcga ctccggggag acggccgaag ccacgcggct caaaagaaca 240
gcacggcgca gatatacccg cagaaagaat cggatctgct acctgcagga gatctttagt 300
aatgagatgg ctaaggtgga tgactctttc ttccataggc tggaggagtc ctttttggtg 360
gaggaggata aaaagcacga gcgccaccca atctttggca atatcgtgga cgaggtggcg 420
taccatgaaa agtacccaac catatatcat ctgaggaaga agcttgtaga cagtactgat 480
aaggctgact tgcggttgat ctatctcgcg ctggcgcata tgatcaaatt tcggggacac 540
ttcctcatcg agggggacct gaacccagac aacagcgatg tcgacaaact ctttatccaa 600
ctggttcaga cttacaatca gcttttcgaa gagaacccga tcaacgcatc cggagttgac 660
gccaaagcaa tcctgagcgc taggctgtcc aaatcccggc ggctcgaaaa cctcatcgca 720
cagctccctg gggagaagaa gaacggcctg tttggtaatc ttatcgccct gtcactcggg 780
ctgaccccca actttaaatc taacttcgac ctggccgaag atgccaagct tcaactgagc 840
aaagacacct acgatgatga tctcgacaat ctgctggccc agatcggcga ccagtacgca 900
gacctttttt tggcggcaaa gaacctgtca gacgccattc tgctgagtga tattctgcga 960
gtgaacacgg agatcaccaa agctccgctg agcgctagta tgatcaagcg ctatgatgag 1020
caccaccaag acttgacttt gctgaaggcc cttgtcagac agcaactgcc tgagaagtac 1080
aaggaaattt tcttcgatca gtctaaaaat ggctacgccg gatacattga cggcggagca 1140
agccaggagg aattttacaa atttattaag cccatcttgg aaaaaatgga cggcaccgag 1200
gagctgctgg taaagcttaa cagagaagat ctgttgcgca aacagcgcac tttcgacaat 1260
ggaagcatcc cccaccagat tcacctgggc gaactgcacg ctatcctcag gcggcaagag 1320
gatttctacc cctttttgaa agataacagg gaaaagattg agaaaatcct cacatttcgg 1380
ataccctact atgtaggccc cctcgcccgg ggaaattcca gattcgcgtg gatgactcgc 1440
aaatcagaag agaccatcac tccctggaac ttcgaggaag tcgtggataa gggggcctct 1500
gcccagtcct tcatcgaaag gatgactaac tttgataaaa atctgcctaa cgaaaaggtg 1560
cttcctaaac actctctgct gtacgagtac ttcacagttt ataacgagct caccaaggtc 1620
aaatacgtca cagaagggat gagaaagcca gcattcctgt ctggagagca gaagaaagct 1680
atcgtggacc tcctcttcaa gacgaaccgg aaagttaccg tgaaacagct caaagaagac 1740
tatttcaaaa agattgaatg tttcgactct gttgaaatca gcggagtgga ggatcgcttc 1800
aacgcatccc tgggaacgta tcacgatctc ctgaaaatca ttaaagacaa ggacttcctg 1860
gacaatgagg agaacgagga cattcttgag gacattgtcc tcacccttac gttgtttgaa 1920
gatagggaga tgattgaaga acgcttgaaa acttacgctc atctcttcga cgacaaagtc 1980
atgaaacagc tcaagaggcg ccgatataca ggatgggggc ggctgtcaag aaaactgatc 2040
aatgggatcc gagacaagca gagtggaaag acaatcctgg attttcttaa gtccgatgga 2100
tttgccaacc ggaacttcat gcagttgatc catgatgact ctctcacctt taaggaggac 2160
atccagaaag cacaagtttc tggccagggg gacagtcttc acgagcacat cgctaatctt 2220
gcaggtagcc cagctatcaa aaagggaata ctgcagaccg ttaaggtcgt ggatgaactc 2280
gtcaaagtaa tgggaaggca taagcccgag aatatcgtta tcgagatggc ccgagagaac 2340
caaactaccc agaagggaca gaagaacagt agggaaagga tgaagaggat tgaagagggt 2400
ataaaagaac tggggtccca aatccttaag gaacacccag ttgaaaacac ccagcttcag 2460
aatgagaagc tctacctgta ctacctgcag aacggcaggg acatgtacgt ggatcaggaa 2520
ctggacatca atcggctctc cgactacgac gtggctgcta tcgtgcccca gtcttttctc 2580
aaagatgatt ctattgataa taaagtgttg acaagatccg ataaagctag agggaagagt 2640
gataacgtcc cctcagaaga agttgtcaag aaaatgaaaa attattggcg gcagctgctg 2700
aacgccaaac tgatcacaca acggaagttc gataatctga ctaaggctga acgaggtggc 2760
ctgtctgagt tggataaagc cggcttcatc aaaaggcagc ttgttgagac acgccagatc 2820
accaagcacg tggcccaaat tctcgattca cgcatgaaca ccaagtacga tgaaaatgac 2880
aaactgattc gagaggtgaa agttattact ctgaagtcta agctggtctc agatttcaga 2940
aaggactttc agttttataa ggtgagagag atcaacaatt accaccatgc gcatgatgcc 3000
tacctgaatg cagtggtagg cactgcactt atcaaaaaat atcccaagct tgaatctgaa 3060
tttgtttacg gagactataa agtgtacgat gttaggaaaa tgatcgcaaa gtctgagcag 3120
gaaataggca aggccaccgc taagtacttc ttttacagca atattatgaa ttttttcaag 3180
accgagatta cactggccaa tggagagatt cggaagcgac cacttatcga aacaaacgga 3240
gaaacaggag aaatcgtgtg ggacaagggt agggatttcg cgacagtccg gaaggtcctg 3300
tccatgccgc aggtgaacat cgttaaaaag accgaagtac agaccggagg cttctccaag 3360
gaaagtatcc tcccgaaaag gaacagcgac aagctgatcg cacgcaaaaa agattgggac 3420
cccaagaaat acggcggatt cgattctcct acagtcgctt acagtgtact ggttgtggcc 3480
aaagtggaga aagggaagtc taaaaaactc aaaagcgtca aggaactgct gggcatcaca 3540
atcatggagc gatcaagctt cgaaaaaaac cccatcgact ttctcgaggc gaaaggatat 3600
aaagaggtca aaaaagacct catcattaag cttcccaagt actctctctt tgagcttgaa 3660
aacggccgga aacgaatgct cgctagtgcg ggcgagctgc agaaaggtaa cgagctggca 3720
ctgccctcta aatacgttaa tttcttgtat ctggccagcc actatgaaaa gctcaaaggg 3780
tctcccgaag ataatgagca gaagcagctg ttcgtggaac aacacaaaca ctaccttgat 3840
gagatcatcg agcaaataag cgaattctcc aaaagagtga tcctcgccga cgctaacctc 3900
gataaggtgc tttctgctta caataagcac agggataagc ccatcaggga gcaggcagaa 3960
aacattatcc acttgtttac tctgaccaac ttgggcgcgc ctgcagcctt caagtacttc 4020
gacaccacca tagacagaaa gcggtacacc tctacaaagg aggtcctgga cgccacactg 4080
attcatcagt caattacggg gctctatgaa acaagaatcg acctctctca gctcggtgga 4140
gacagcaggg ctgaccccaa gaagaagagg aaggtggagg ccagcggttc cggacgggct 4200
gacgcattgg acgattttga tctggatatg ctgggaagtg acgccctcga tgattttgac 4260
cttgacatgc ttggttcgga tgcccttgat gactttgacc tcgacatgct cggcagtgac 4320
gcccttgatg atttcgacct ggacatgctg attaactcta gatga 4365
<210> 4
<211> 4425
<212> DNA
<213> Artificial
<220>
<223> VP64-activator construct
<400> 4
gccaccatgg acaagaagta ctccattggg ctcgctatcg gcacaaacag cgtcggctgg 60
gccgtcatta cggacgagta caaggtgccg agcaaaaaat tcaaagttct gggcaatacc 120
gatcgccaca gcataaagaa gaacctcatt ggcgccctcc tgttcgactc cggggagacg 180
gccgaagcca cgcggctcaa aagaacagca cggcgcagat atacccgcag aaagaatcgg 240
atctgctacc tgcaggagat ctttagtaat gagatggcta aggtggatga ctctttcttc 300
cataggctgg aggagtcctt tttggtggag gaggataaaa agcacgagcg ccacccaatc 360
tttggcaata tcgtggacga ggtggcgtac catgaaaagt acccaaccat atatcatctg 420
aggaagaagc ttgtagacag tactgataag gctgacttgc ggttgatcta tctcgcgctg 480
gcgcatatga tcaaatttcg gggacacttc ctcatcgagg gggacctgaa cccagacaac 540
agcgatgtcg acaaactctt tatccaactg gttcagactt acaatcagct tttcgaagag 600
aacccgatca acgcatccgg agttgacgcc aaagcaatcc tgagcgctag gctgtccaaa 660
tcccggcggc tcgaaaacct catcgcacag ctccctgggg agaagaagaa cggcctgttt 720
ggtaatctta tcgccctgtc actcgggctg acccccaact ttaaatctaa cttcgacctg 780
gccgaagatg ccaagcttca actgagcaaa gacacctacg atgatgatct cgacaatctg 840
ctggcccaga tcggcgacca gtacgcagac ctttttttgg cggcaaagaa cctgtcagac 900
gccattctgc tgagtgatat tctgcgagtg aacacggaga tcaccaaagc tccgctgagc 960
gctagtatga tcaagcgcta tgatgagcac caccaagact tgactttgct gaaggccctt 1020
gtcagacagc aactgcctga gaagtacaag gaaattttct tcgatcagtc taaaaatggc 1080
tacgccggat acattgacgg cggagcaagc caggaggaat tttacaaatt tattaagccc 1140
atcttggaaa aaatggacgg caccgaggag ctgctggtaa agcttaacag agaagatctg 1200
ttgcgcaaac agcgcacttt cgacaatgga agcatccccc accagattca cctgggcgaa 1260
ctgcacgcta tcctcaggcg gcaagaggat ttctacccct ttttgaaaga taacagggaa 1320
aagattgaga aaatcctcac atttcggata ccctactatg taggccccct cgcccgggga 1380
aattccagat tcgcgtggat gactcgcaaa tcagaagaga ccatcactcc ctggaacttc 1440
gaggaagtcg tggataaggg ggcctctgcc cagtccttca tcgaaaggat gactaacttt 1500
gataaaaatc tgcctaacga aaaggtgctt cctaaacact ctctgctgta cgagtacttc 1560
acagtttata acgagctcac caaggtcaaa tacgtcacag aagggatgag aaagccagca 1620
ttcctgtctg gagagcagaa gaaagctatc gtggacctcc tcttcaagac gaaccggaaa 1680
gttaccgtga aacagctcaa agaagactat ttcaaaaaga ttgaatgttt cgactctgtt 1740
gaaatcagcg gagtggagga tcgcttcaac gcatccctgg gaacgtatca cgatctcctg 1800
aaaatcatta aagacaagga cttcctggac aatgaggaga acgaggacat tcttgaggac 1860
attgtcctca cccttacgtt gtttgaagat agggagatga ttgaagaacg cttgaaaact 1920
tacgctcatc tcttcgacga caaagtcatg aaacagctca agaggcgccg atatacagga 1980
tgggggcggc tgtcaagaaa actgatcaat gggatccgag acaagcagag tggaaagaca 2040
atcctggatt ttcttaagtc cgatggattt gccaaccgga acttcatgca gttgatccat 2100
gatgactctc tcacctttaa ggaggacatc cagaaagcac aagtttctgg ccagggggac 2160
agtcttcacg agcacatcgc taatcttgca ggtagcccag ctatcaaaaa gggaatactg 2220
cagaccgtta aggtcgtgga tgaactcgtc aaagtaatgg gaaggcataa gcccgagaat 2280
atcgttatcg agatggcccg agagaaccaa actacccaga agggacagaa gaacagtagg 2340
gaaaggatga agaggattga agagggtata aaagaactgg ggtcccaaat ccttaaggaa 2400
cacccagttg aaaacaccca gcttcagaat gagaagctct acctgtacta cctgcagaac 2460
ggcagggaca tgtacgtgga tcaggaactg gacatcaatc ggctctccga ctacgacgtg 2520
gctgctatcg tgccccagtc ttttctcaaa gatgattcta ttgataataa agtgttgaca 2580
agatccgata aagctagagg gaagagtgat aacgtcccct cagaagaagt tgtcaagaaa 2640
atgaaaaatt attggcggca gctgctgaac gccaaactga tcacacaacg gaagttcgat 2700
aatctgacta aggctgaacg aggtggcctg tctgagttgg ataaagccgg cttcatcaaa 2760
aggcagcttg ttgagacacg ccagatcacc aagcacgtgg cccaaattct cgattcacgc 2820
atgaacacca agtacgatga aaatgacaaa ctgattcgag aggtgaaagt tattactctg 2880
aagtctaagc tggtctcaga tttcagaaag gactttcagt tttataaggt gagagagatc 2940
aacaattacc accatgcgca tgatgcctac ctgaatgcag tggtaggcac tgcacttatc 3000
aaaaaatatc ccaagcttga atctgaattt gtttacggag actataaagt gtacgatgtt 3060
aggaaaatga tcgcaaagtc tgagcaggaa ataggcaagg ccaccgctaa gtacttcttt 3120
tacagcaata ttatgaattt tttcaagacc gagattacac tggccaatgg agagattcgg 3180
aagcgaccac ttatcgaaac aaacggagaa acaggagaaa tcgtgtggga caagggtagg 3240
gatttcgcga cagtccggaa ggtcctgtcc atgccgcagg tgaacatcgt taaaaagacc 3300
gaagtacaga ccggaggctt ctccaaggaa agtatcctcc cgaaaaggaa cagcgacaag 3360
ctgatcgcac gcaaaaaaga ttgggacccc aagaaatacg gcggattcga ttctcctaca 3420
gtcgcttaca gtgtactggt tgtggccaaa gtggagaaag ggaagtctaa aaaactcaaa 3480
agcgtcaagg aactgctggg catcacaatc atggagcgat caagcttcga aaaaaacccc 3540
atcgactttc tcgaggcgaa aggatataaa gaggtcaaaa aagacctcat cattaagctt 3600
cccaagtact ctctctttga gcttgaaaac ggccggaaac gaatgctcgc tagtgcgggc 3660
gagctgcaga aaggtaacga gctggcactg ccctctaaat acgttaattt cttgtatctg 3720
gccagccact atgaaaagct caaagggtct cccgaagata atgagcagaa gcagctgttc 3780
gtggaacaac acaaacacta ccttgatgag atcatcgagc aaataagcga attctccaaa 3840
agagtgatcc tcgccgacgc taacctcgat aaggtgcttt ctgcttacaa taagcacagg 3900
gataagccca tcagggagca ggcagaaaac attatccact tgtttactct gaccaacttg 3960
ggcgcgcctg cagccttcaa gtacttcgac accaccatag acagaaagcg gtacacctct 4020
acaaaggagg tcctggacgc cacactgatt catcagtcaa ttacggggct ctatgaaaca 4080
agaatcgacc tctctcagct cggtggagac agcagggctg accccaagaa gaagaggaag 4140
gtggaggcca gcggttccgg acgggctgac gcattggacg attttgatct ggatatgctg 4200
ggaagtgacg ccctcgatga ttttgacctt gacatgcttg gttcggatgc ccttgatgac 4260
tttgacctcg acatgctcgg cagtgacgcc cttgatgatt tcgacctgga catgctgatt 4320
aactctagag cggccgcaga tccaaaaaag aagagaaagg tagatccaaa aaagaagaga 4380
aaggtagatc caaaaaagaa gagaaaggta gatacggccg catag 4425
<210> 5
<211> 587
<212> DNA
<213> Artificial
<220>
<223> MS2-activator construct
<400> 5
ccaccatggg acctaagaaa aagaggaagg tggcggccgc ttctagaatg gcttctaact 60
ttactcagtt cgttctcgtc gacaatggcg gaactggcga cgtgactgtc gccccaagca 120
acttcgctaa cgggatcgct gaatggatca gctctaactc gcgttcacag gcttacaaag 180
taacctgtag cgttcgtcag agctctgcgc agaatcgcaa atacaccatc aaagtcgagg 240
tgcctaaagg cgcctggcgt tcgtacttaa atatggaact aaccattcca attttcgcca 300
cgaattccga ctgcgagctt attgttaagg caatgcaagg tctcctaaaa gatggaaacc 360
cgattccctc agcaatcgca gcaaactccg gcatctacga ggccagcggt tccggacggg 420
ctgacgcatt ggacgatttt gatctggata tgctgggaag tgacgccctc gatgattttg 480
accttgacat gcttggttcg gatgcccttg atgactttga cctcgacatg ctcggcagtg 540
acgcccttga tgatttcgac ctggacatgc tgattaactc tagatga 587
<210> 6
<211> 681
<212> DNA
<213> Artificial
<220>
<223> MS2-activator construct
<400> 6
gccaccatgg gacctaagaa aaagaggaag gtggcggccg cttctagaat ggcttctaac 60
tttactcagt tcgttctcgt cgacaatggc ggaactggcg acgtgactgt cgccccaagc 120
aacttcgcta acgggatcgc tgaatggatc agctctaact cgcgttcaca ggcttacaaa 180
gtaacctgta gcgttcgtca gagctctgcg cagaatcgca aatacaccat caaagtcgag 240
gtgcctaaag gcgcctggcg ttcgtactta aatatggaac taaccattcc aattttcgcc 300
acgaattccg actgcgagct tattgttaag gcaatgcaag gtctcctaaa agatggaaac 360
ccgattccct cagcaatcgc agcaaactcc ggcatctacg aggccagcgg ttccggacgg 420
gctgacgcat tggacgattt tgatctggat atgctgggaa gtgacgccct cgatgatttt 480
gaccttgaca tgcttggttc ggatgccctt gatgactttg acctcgacat gctcggcagt 540
gacgcccttg atgatttcga cctggacatg ctgattaact ctagagcggc cgcagatcca 600
aaaaagaaga gaaaggtaga tccaaaaaag aagagaaagg tagatccaaa aaagaagaga 660
aaggtagata cggccgcata g 681
<210> 7
<211> 557
<212> DNA
<213> Artificial
<220>
<223> MS2-activator construct
<220>
<221> misc_feature
<222> (320)..(339)
<223> wherein N is G, A, T or C
<400> 7
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgctctgc 420
aggtcgactc tagaaaacat gaggatcacc catgtctgca gtattcccgg gttcattaga 480
tcctaaggta cctaattgcc tagaaaacat gaggatcacc catgtctgca ggtcgactct 540
agaaattttt tctagac 557
<210> 8
<211> 882
<212> DNA
<213> Artificial
<220>
<223> Activation reporter construct
<400> 8
tagggataac agggtaatag tgtcccctcc accccacagt ggggcgaggt aggcgtgtac 60
ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120
gccaccatgg actacaagga tgacgacgat aaaacttccg gtggcggact gggttccacc 180
gtgagcaagg gcgaggaggt catcaaagag ttcatgcgct tcaaggtgcg catggagggc 240
tccatgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 300
acccagaccg ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 360
ctgtcccccc agttcatgta cggctccaag gcgtacgtga agcaccccgc cgacatcccc 420
gattacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 480
gacggcggtc tggtgaccgt gacccaggac tcctccctgc aggacggcac gctgatctac 540
aaggtgaaga tgcgcggcac caacttcccc cccgacggcc ccgtaatgca gaagaagacc 600
atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 660
atccaccagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagaccatc 720
tacatggcca agaagcccgt gcaactgccc ggctactact acgtggacac caagctggac 780
atcacctccc acaacgagga ctacaccatc gtggaacagt acgagcgctc cgagggccgc 840
caccacctgt tcctgtacgg catggacgag ctgtacaagt aa 882
<210> 9
<211> 882
<212> DNA
<213> Artificial
<220>
<223> Activation reporter construct
<400> 9
tagggataac agggtaatag tggggccact agggacagga ttggcgaggt aggcgtgtac 60
ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120
gccaccatgg actacaagga tgacgacgat aaaacttccg gtggcggact gggttccacc 180
gtgagcaagg gcgaggaggt catcaaagag ttcatgcgct tcaaggtgcg catggagggc 240
tccatgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 300
acccagaccg ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 360
ctgtcccccc agttcatgta cggctccaag gcgtacgtga agcaccccgc cgacatcccc 420
gattacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 480
gacggcggtc tggtgaccgt gacccaggac tcctccctgc aggacggcac gctgatctac 540
aaggtgaaga tgcgcggcac caacttcccc cccgacggcc ccgtaatgca gaagaagacc 600
atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 660
atccaccagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagaccatc 720
tacatggcca agaagcccgt gcaactgccc ggctactact acgtggacac caagctggac 780
atcacctccc acaacgagga ctacaccatc gtggaacagt acgagcgctc cgagggccgc 840
caccacctgt tcctgtacgg catggacgag ctgtacaagt aa 882
<210> 10
<211> 912
<212> DNA
<213> Artificial
<220>
<223> Specificity reporter library
<220>
<221> misc_feature
<222> (22)..(44)
<223> wherein N is G, A, T or C
<220>
<221> misc_feature
<222> (154)..(177)
<223> wherein N is G, A, T or C
<400> 10
tagggataac agggtaatag tnnnnnnnnn nnnnnnnnnn nnnncgaggt aggcgtgtac 60
ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120
gccaccatgg actacaagga tgacgacgat aaannnnnnn nnnnnnnnnn nnnnnnnact 180
tccggtggcg gactgggttc caccgtgagc aagggcgagg aggtcatcaa agagttcatg 240
cgcttcaagg tgcgcatgga gggctccatg aacggccacg agttcgagat cgagggcgag 300
ggcgagggcc gcccctacga gggcacccag accgccaagc tgaaggtgac caagggcggc 360
cccctgccct tcgcctggga catcctgtcc ccccagttca tgtacggctc caaggcgtac 420
gtgaagcacc ccgccgacat ccccgattac aagaagctgt ccttccccga gggcttcaag 480
tgggagcgcg tgatgaactt cgaggacggc ggtctggtga ccgtgaccca ggactcctcc 540
ctgcaggacg gcacgctgat ctacaaggtg aagatgcgcg gcaccaactt cccccccgac 600
ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct ccaccgagcg cctgtacccc 660
cgcgacggcg tgctgaaggg cgagatccac caggccctga agctgaagga cggcggccac 720
tacctggtgg agttcaagac catctacatg gccaagaagc ccgtgcaact gcccggctac 780
tactacgtgg acaccaagct ggacatcacc tcccacaacg aggactacac catcgtggaa 840
cagtacgagc gctccgaggg ccgccaccac ctgttcctgt acggcatgga cgagctgtac 900
aagtaagaat tc 912
<210> 11
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 11
ctggcggatc actcgcggtt agg 23
<210> 12
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 12
cctcggcctc caaaagtgct agg 23
<210> 13
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 13
acgctgattc ctgcagatca ggg 23
<210> 14
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 14
ccaggaatac gtatccacca ggg 23
<210> 15
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 15
gccacaccca agcgatcaaa tgg 23
<210> 16
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 16
aaataataca ttctaaggta agg 23
<210> 17
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 17
gctactgggg aggctgaggc agg 23
<210> 18
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 18
tagcaataca gtcacattaa tgg 23
<210> 19
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 19
ctcatgtgat ccccccgtct cgg 23
<210> 20
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 20
ccgggcagag agtgaacgcg cgg 23
<210> 21
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 21
ttccttccct ctcccgtgct tgg 23
<210> 22
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 22
tctctgcaaa gcccctggag agg 23
<210> 23
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 23
aatgcagttg ccgagtgcag tgg 23
<210> 24
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 24
cctcagcctc ctaaagtgct ggg 23
<210> 25
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 25
gagtccaaat cctctttact agg 23
<210> 26
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 26
gagtgtctgg atttgggata agg 23
<210> 27
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 27
cagcacctca tctcccagtg agg 23
<210> 28
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 28
tctaaaaccc agggaatcat ggg 23
<210> 29
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 29
cacaaggcag ccagggatcc agg 23
<210> 30
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 30
gatggcaagc tgagaaacac tgg 23
<210> 31
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 31
tgaaatgcac gcatacaatt agg 23
<210> 32
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 32
ccagtccaga cctggccttc tgg 23
<210> 33
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 33
cccagaaaaa cagaccctga agg 23
<210> 34
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 34
aagggttgag cacttgttta ggg 23
<210> 35
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 35
atgtctgagt tttggttgag agg 23
<210> 36
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 36
ggtcccttga aggggaagta ggg 23
<210> 37
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 37
tggcagtcta ctcttgaaga tgg 23
<210> 38
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 38
ggcacagtgc cagaggtctg tgg 23
<210> 39
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 39
taaaaataaa aaaactaaca ggg 23
<210> 40
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 40
tctgtggggg acctgcactg agg 23
<210> 41
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 41
ggccagaggt caaggctagt ggg 23
<210> 42
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 42
cacgaccgaa acccttctta cgg 23
<210> 43
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 43
gttgaatgaa gacagtctag tgg 23
<210> 44
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 44
taagaacaga gcaagttacg tgg 23
<210> 45
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 45
tgtaaggtaa gagaggagag cgg 23
<210> 46
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 46
tgacacacca actcctgcac tgg 23
<210> 47
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 47
tttacccact tccttcgaaa agg 23
<210> 48
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 48
gtggctggca ggctggctct ggg 23
<210> 49
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 49
ctcccccggc ctcccccgcg cgg 23
<210> 50
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 50
caaaacccgg cagcgaggct ggg 23
<210> 51
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 51
aggagccgcc gcgcgctgat tgg 23
<210> 52
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 52
cacacacacc cacacgagat ggg 23
<210> 53
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 53
gaagaagcta aagagccaga ggg 23
<210> 54
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 54
atgagaattt caataacctc agg 23
<210> 55
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 55
tcccgctctg ttgcccaggc tgg 23
<210> 56
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 56
cagacaccca ccaccatgcg tgg 23
<210> 57
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 57
tcccaattta ctgggattac agg 23
<210> 58
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 58
tgatttaaaa gttggaaacg tgg 23
<210> 59
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 59
tctagttccc cacctagtct ggg 23
<210> 60
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 60
gattaactga gaattcacaa ggg 23
<210> 61
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target probe
<400> 61
cgccaggagg ggtgggtcta agg 23
<210> 62
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Reporter construct
<400> 62
gtcccctcca ccccacagtg ggg 23
<210> 63
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Reporter construct
<400> 63
ggggccacta gggacaggat tgg 23
<210> 64
<211> 71
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 64
taatactttt atctgtcccc tccaccccac agtggggcca ctagggacag gattggtgac 60
agaaaagccc c 71
<210> 65
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 65
ggggccacta gggacaggat 20
<210> 66
<211> 80
<212> RNA
<213> Artificial
<220>
<223> Guide RNA
<400> 66
guuuuagagc uagaaauagc aaguuaaaau aaggcuagcu uguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu 80
<210> 67
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 67
gtcccctcca ccccacagtg cag 23
<210> 68
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 68
gtcccctcca ccccacagtg caa 23
<210> 69
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 69
gtcccctcca ccccacagtg cgg 23
<210> 70
<211> 52
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 70
tgtcccctcc accccacagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 71
<211> 52
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 71
tgtccccccc accccacagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 72
<211> 52
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 72
aaaaccctcc accccacagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 73
<211> 52
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 73
tgtcccctcc ttttttcagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 74
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 74
caccggggtg gtgcccatcc tgg 23
<210> 75
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 75
ggtgcccatc ctggtcgagc tgg 23
<210> 76
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 76
cccatcctgg tcgagctgga cgg 23
<210> 77
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 77
ggccacaagt tcagcgtgtc cgg 23
<210> 78
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 78
cgcaaataag agctcaccta cgg 23
<210> 79
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 79
ctgaagttca tctgcaccac cgg 23
<210> 80
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 80
ccggcaagct gcccgtgccc tgg 23
<210> 81
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 81
gaccaggatg ggcaccaccc cgg 23
<210> 82
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 82
gccgtccagc tcgaccagga tgg 23
<210> 83
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 83
ggccggacac gctgaacttg tgg 23
<210> 84
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 84
taacagggta atgtcgaggc cgg 23
<210> 85
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 85
aggtgagctc ttatttgcgt agg 23
<210> 86
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 86
cttcagggtc agcttgccgt agg 23
<210> 87
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 87
gggcacgggc agcttgccgg tgg 23
<210> 88
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 88
gagatgatcg ccccttcttc tgg 23
<210> 89
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 89
gagatgatcg ccccttcttc 20
<210> 90
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 90
gtgatgaccg gccgttcttc 20
<210> 91
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 91
gtcccctcca ccccacagtg ggg 23
<210> 92
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 92
gagatgatcg cccgttcttc tgg 23
<210> 93
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 93
guccccucca ccccacagug 20
<210> 94
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 94
guccccucca ccccacaguc 20
<210> 95
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 95
guccccucca ccccacagag 20
<210> 96
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 96
guccccucca ccccacacug 20
<210> 97
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 97
guccccucca ccccacugug 20
<210> 98
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 98
guccccucca ccccagagug 20
<210> 99
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 99
guccccucca ccccucagug 20
<210> 100
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 100
guccccucca cccgacagug 20
<210> 101
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 101
guccccucca ccgcacagug 20
<210> 102
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 102
guccccucca cgccacagug 20
<210> 103
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 103
guccccucca gcccacagug 20
<210> 104
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 104
guccccuccu ccccacagug 20
<210> 105
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 105
guccccucga ccccacagug 20
<210> 106
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 106
guccccucca ccccacagac 20
<210> 107
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 107
guccccucca ccccacucug 20
<210> 108
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 108
guccccucca ccccugagug 20
<210> 109
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 109
guccccucca ccggacagug 20
<210> 110
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 110
guccccucca ggccacagug 20
<210> 111
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 111
guccccucgu ccccacagug 20
<210> 112
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 112
ggggccacta gggacaggat ggg 23
<210> 113
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 113
gagaugaucg ccccuucuuc 20
<210> 114
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 114
gagaugaucg ccccuucuug 20
<210> 115
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 115
gagaugaucg ccccuucuac 20
<210> 116
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 116
gagaugaucg ccccuucauc 20
<210> 117
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 117
gagaugaucg ccccuuguuc 20
<210> 118
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 118
gagaugaucg ccccuacuuc 20
<210> 119
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 119
gagaugaucg ccccaucuuc 20
<210> 120
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 120
gagaugaucg cccguucuuc 20
<210> 121
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 121
gagaugaucg ccgcuucuuc 20
<210> 122
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 122
gagaugaucg cgccuucuuc 20
<210> 123
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 123
gagaugaucg gcccuucuuc 20
<210> 124
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 124
gagaugaucc ccccuucuuc 20
<210> 125
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 125
gagaugaugg ccccuucuuc 20
<210> 126
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 126
gagaugaucg ccccuucuag 20
<210> 127
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 127
gagaugaucg ccccuugauc 20
<210> 128
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 128
gagaugaucg ccccaacuuc 20
<210> 129
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 129
gagaugaucg ccgguucuuc 20
<210> 130
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 130
gagaugaucg ggccuucuuc 20
<210> 131
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 131
gagaugaugc ccccuucuuc 20
<210> 132
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 132
gagatgatcg ccccttcttc tgg 23
<210> 133
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 133
ggggccacua gggacaggau 20
<210> 134
<211> 19
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 134
gggccacuag ggacaggau 19
<210> 135
<211> 18
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 135
ggccacuagg gacaggau 18
<210> 136
<211> 17
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 136
gccacuaggg acaggau 17
<210> 137
<211> 20
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 137
gagaugaucg ccccuucuuc 20
<210> 138
<211> 18
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 138
gaugaucgcc ccuucuuc 18
<210> 139
<211> 15
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 139
gaucgccccu ucuuc 15
<210> 140
<211> 11
<212> RNA
<213> Artificial
<220>
<223> RNA target sequence
<400> 140
gccccuucuu c 11
<210> 141
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 141
gtcccctcca ccccacagtg c 21
<210> 142
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<220>
<221> misc_feature
<222> (5)..(10)
<223> wherein N id G, A, T or C
<400> 142
tgtcnnnnnn accc 14
<210> 143
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 143
tgtcaaaaaa accc 14
<210> 144
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 144
tgtcgggggg accc 14
<210> 145
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 145
tgtcaaaaaa accc 14
<210> 146
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 146
tgtcgggggg accc 14
<210> 147
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 147
tgtccccccc accc 14
<210> 148
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 148
tgtctttttt accc 14
<210> 149
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 149
tgtccccccc accc 14
<210> 150
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 150
tgtctttttt accc 14
<210> 151
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 151
ggatcctgtg tccccgagct ggg 23
<210> 152
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 152
gttaatgtgg ctctggttct ggg 23
<210> 153
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 153
ggggccacta gggacaggat tgg 23
<210> 154
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 154
cttcctagtc tcctgatatt ggg 23
<210> 155
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 155
tggtcccagc tcggggacac agg 23
<210> 156
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 156
agaaccagag ccacattaac cgg 23
<210> 157
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 157
gtcaccaatc ctgtccctag tgg 23
<210> 158
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 158
agacccaata tcaggagact agg 23
<210> 159
<211> 75
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 159
gggatcctgt gtccccgagc tgggaccacc ttatattccc agggccggtt aatgtggctc 60
tggttctggg tactt 75
<210> 160
<211> 69
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 160
gggatcctgt gtccccgagc tgggaccacc ttatattccc agggccggtt aatgtggttc 60
tgggtactt 69
<210> 161
<211> 113
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 161
gggatcctgt gtccccgagc tgggaccacc ttatattccc agggcagggc cggttggacc 60
accttatatt cccagggcag ggccggttaa tgtggctctg gttctgggta ctt 113
<210> 162
<211> 34
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 162
gggatcctgt gtccccgtct ggttctgggt actt 34
<210> 163
<211> 47
<212> DNA
<213> Artificial
<220>
<223> Target oligoncleotide sequence
<400> 163
gggatcctgt gtccccgagc tgggaccacc ttatattctg ggtactt 47
<210> 164
<211> 17
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 164
gggatcctgt ggtactt 17
<210> 165
<211> 93
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 165
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccacagt 60
ggggccacta gggacaggat tggtgacaga aaa 93
<210> 166
<211> 83
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 166
agggccggtt aatgaatgtg gctctggttc tgggtacttt tatctgtccc ctccacccca 60
cagtggggcc actagacaga aaa 83
<210> 167
<211> 76
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 167
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccccag tggggccact 60
gattggtgac agaaaa 76
<210> 168
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 168
agggccggtt caggattggt gacagaaaa 29
<210> 169
<211> 34
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 169
agggccggtt aatgtggcga ttggtgacag aaaa 34
<210> 170
<211> 63
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 170
agggccggtt aatgtggctc tggttctggg tacttttatc tgtccccgat tggtgacaga 60
aaa 63
<210> 171
<211> 84
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 171
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccacagt 60
ggggacagga ttggtgacag aaaa 84
<210> 172
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 172
agggccggtt aatgtggtga cagaaaa 27
<210> 173
<211> 105
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 173
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccagggg 60
acagtctgtc ccctccaccc cagggacagg attggtgaca gaaaa 105
<210> 174
<211> 80
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 174
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accactaggg 60
acaggattgg tgacagaaaa 80
<210> 175
<211> 53
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 175
cccacagtgg ggccactagg gacaggattg gtgacagaaa agccccatac ccc 53
<210> 176
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 176
cccacagtgg ggccactacc cc 22
<210> 177
<211> 96
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 177
cccacagtgg ggccactagt agaaaagccc catccttagg cctcccccat ccttaggcct 60
cctccttcct agtctcctga tattgggtct aacccc 96
<210> 178
<211> 94
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 178
cccacagtgg ggccactagg gacaggattg gtgacagaaa agccccatcc ttaggcctcc 60
tccttcctag tctcctgata ttgggtctaa cccc 94
<210> 179
<211> 62
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 179
cccacagtgg ggccaccctt aggcctcctc cttcctagtc tcctgatatt gggtctaacc 60
cc 62
<210> 180
<211> 38
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 180
cccacagtgg ggccactagt gatattgggt ctaacccc 38
<210> 181
<211> 94
<212> DNA
<213> Artificial
<220>
<223> target oligonucleotide sequence
<400> 181
cccacagtgg ggccactagg gacaggattg gtgacaaaaa agccccatcc ttacgcctcc 60
tccttcctag tctcctgata ttgggtctaa cccc 94
<210> 182
<211> 65
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 182
cccacagtgg ggccactagg gacaggcctc ctccttccta gtctcctgat attgggtcta 60
acccc 65
<210> 183
<211> 102
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 183
cccacagtgg ggccactagg gacaggggga caggattggt gacagaaaag ccccatcctt 60
aggcctcctc cttcctagtc tcctgatatt gggtctaacc cc 102
<210> 184
<211> 76
<212> DNA
<213> Artificial
<220>
<223> Target oligonucleotide sequence
<400> 184
cccacaggat tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga 60
tattgggtct aacccc 76
Claims (13)
- 각각의 가이드 RNA가 스페이서 서열, tracr 메이트(mate) 서열 및 tracr 서열을 갖고, tracr 서열의 일부가 tracr 메이트 서열에 혼성화되고, tracr 메이트 서열 및 tracr 서열이 링커 핵산 서열에 의해 연결되고, 각각의 스페이서 서열이 DNA 표적 핵산 내의 인접 부위에 상보적인, 2개의 가이드 RNA를 세포에 제공하고,
공여자 핵산 서열을 세포에 제공하고,
유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질 닉카제를 세포에 제공하는 것을 포함하며,
여기서 2개의 가이드 RNA 각각이 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질 닉카제와 DNA 표적 핵산으로 공동-국재화되어 5'-오버행을 갖는 오프셋 닉을 야기하고,
공여자 핵산 서열이 상동 재조합을 이용하여 오프셋 닉에서 DNA 표적 핵산으로 삽입되고,
단, 인간 체내에서 수행되는 것이 아닌,
상동 재조합을 이용하여 공여자 핵산 서열을 세포 내로 도입하는 방법. - 제1항에 있어서, 2개의 가이드 RNA가 2개의 가이드 RNA를 코딩하는 제1 외래 핵산을 세포 내로 도입하는 것에 의해 세포로 제공되고,
유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질 닉카제가 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질 닉카제를 코딩하는 제2 외래 핵산을 세포 내로 도입하는 것에 의해 세포로 제공되고,
2개의 가이드 RNA 및 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질 닉카제가 발현되는 것인 방법. - 제1항에 있어서, 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질 닉카제가 Cas9 단백질 닉카제인 방법.
- 제1항에 있어서, DNA 표적 핵산이 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA 또는 외인성 DNA인 방법.
- 제1항에 있어서, tracr 서열이 90 내지 500개의 뉴클레오티드인 방법.
- 제1항에 있어서, tracr 서열이 90 내지 200개의 뉴클레오티드인 방법.
- 제1항에 있어서, tracr 서열이 100 내지 200개의 뉴클레오티드인 방법.
- 제1항에 있어서, 세포가 진핵 세포인 방법.
- 제1항에 있어서, 세포가 효모 세포, 식물 세포 또는 동물 세포인 방법.
- 제1항에 있어서, 가이드 RNA가 10 내지 500개의 뉴클레오티드인 방법.
- 제1항에 있어서, 가이드 RNA가 20 내지 100개의 뉴클레오티드인 방법.
- 제1항에 있어서, DNA 표적 핵산이 질환 또는 유해 상태와 연관되는 것인 방법.
- 제1항에 있어서, 2개의 가이드 RNA가 tracrRNA-crRNA 융합체인 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020237009424A KR20230042154A (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361830787P | 2013-06-04 | 2013-06-04 | |
US61/830,787 | 2013-06-04 | ||
PCT/US2014/040868 WO2014197568A2 (en) | 2013-06-04 | 2014-06-04 | Rna-guideded transcriptional regulation |
KR1020157036892A KR102282990B1 (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157036892A Division KR102282990B1 (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237009424A Division KR20230042154A (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210095235A KR20210095235A (ko) | 2021-07-30 |
KR102512979B1 true KR102512979B1 (ko) | 2023-03-22 |
Family
ID=52008736
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217023393A KR102512979B1 (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
KR1020157036892A KR102282990B1 (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
KR1020237009424A KR20230042154A (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157036892A KR102282990B1 (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
KR1020237009424A KR20230042154A (ko) | 2013-06-04 | 2014-06-04 | Rna-가이드된 전사 조절 |
Country Status (15)
Country | Link |
---|---|
US (2) | US11981917B2 (ko) |
EP (3) | EP3003392B1 (ko) |
JP (5) | JP6621738B2 (ko) |
KR (3) | KR102512979B1 (ko) |
CN (2) | CN113846096A (ko) |
AU (4) | AU2014274939B2 (ko) |
BR (1) | BR112015030491A8 (ko) |
CA (2) | CA3176690A1 (ko) |
ES (1) | ES2930537T3 (ko) |
IL (3) | IL284773B2 (ko) |
MX (2) | MX2015016798A (ko) |
MY (2) | MY177814A (ko) |
RU (2) | RU2690935C2 (ko) |
SG (3) | SG10201710030QA (ko) |
WO (1) | WO2014197568A2 (ko) |
Families Citing this family (94)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US11021737B2 (en) | 2011-12-22 | 2021-06-01 | President And Fellows Of Harvard College | Compositions and methods for analyte detection |
US9637739B2 (en) * | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
ES2926021T3 (es) * | 2012-10-23 | 2022-10-21 | Toolgen Inc | Composición para escindir un ADN objetivo que comprende un ARN guía específico para el ADN objetivo y ácido nucleico codificador de proteína Cas o proteína Cas, y uso de la misma |
EP2931892B1 (en) | 2012-12-12 | 2018-09-12 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
BR112015013784A2 (pt) | 2012-12-12 | 2017-07-11 | Massachusetts Inst Technology | aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas |
RU2699523C2 (ru) * | 2012-12-17 | 2019-09-05 | Президент Энд Фэллоуз Оф Харвард Коллидж | Рнк-направляемая инженерия генома человека |
EP2971184B1 (en) | 2013-03-12 | 2019-04-17 | President and Fellows of Harvard College | Method of generating a three-dimensional nucleic acid containing matrix |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
EP3003392B1 (en) | 2013-06-04 | 2019-10-23 | President and Fellows of Harvard College | Rna-guideded transcriptional regulation |
US20140356956A1 (en) | 2013-06-04 | 2014-12-04 | President And Fellows Of Harvard College | RNA-Guided Transcriptional Regulation |
AU2014274840B2 (en) * | 2013-06-05 | 2020-03-12 | Duke University | RNA-guided gene editing and gene regulation |
CN105793425B (zh) | 2013-06-17 | 2021-10-26 | 布罗德研究所有限公司 | 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用 |
KR20160034901A (ko) * | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
WO2014204727A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
EP3011029B1 (en) | 2013-06-17 | 2019-12-11 | The Broad Institute, Inc. | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
CN107995927B (zh) | 2013-06-17 | 2021-07-30 | 布罗德研究所有限公司 | 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途 |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
DE202014010413U1 (de) | 2013-09-18 | 2015-12-08 | Kymab Limited | Zellen und Organismen |
JP2016536021A (ja) | 2013-11-07 | 2016-11-24 | エディタス・メディシン,インコーポレイテッド | CRISPR関連方法および支配gRNAのある組成物 |
CA2932472A1 (en) | 2013-12-12 | 2015-06-18 | Massachusetts Institute Of Technology | Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders |
US9068179B1 (en) | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
WO2015089486A2 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
KR20160089527A (ko) | 2013-12-12 | 2016-07-27 | 더 브로드 인스티튜트, 인코퍼레이티드 | 게놈 편집을 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료적 응용 |
US11028388B2 (en) | 2014-03-05 | 2021-06-08 | Editas Medicine, Inc. | CRISPR/Cas-related methods and compositions for treating Usher syndrome and retinitis pigmentosa |
US11141493B2 (en) | 2014-03-10 | 2021-10-12 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
US11339437B2 (en) | 2014-03-10 | 2022-05-24 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
ES2745769T3 (es) | 2014-03-10 | 2020-03-03 | Editas Medicine Inc | Procedimientos y composiciones relacionados con CRISPR/CAS para tratar la amaurosis congénita de Leber 10 (LCA10) |
WO2015139139A1 (en) * | 2014-03-20 | 2015-09-24 | UNIVERSITé LAVAL | Crispr-based methods and products for increasing frataxin levels and uses thereof |
US11242525B2 (en) | 2014-03-26 | 2022-02-08 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating sickle cell disease |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
CA2959070C (en) | 2014-08-27 | 2020-11-10 | Caribou Biosciences, Inc. | Methods for increasing cas9-mediated engineering efficiency |
AU2015342749B2 (en) | 2014-11-07 | 2022-01-27 | Editas Medicine, Inc. | Methods for improving CRISPR/Cas-mediated genome-editing |
CA2969619A1 (en) | 2014-12-03 | 2016-06-09 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
EP3985115A1 (en) | 2014-12-12 | 2022-04-20 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
WO2016094874A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Escorted and functionalized guides for crispr-cas systems |
CA2981715A1 (en) | 2015-04-06 | 2016-10-13 | The Board Of Trustees Of The Leland Stanford Junior University | Chemically modified guide rnas for crispr/cas-mediated gene regulation |
GB201506509D0 (en) | 2015-04-16 | 2015-06-03 | Univ Wageningen | Nuclease-mediated genome editing |
EP3286571B1 (en) | 2015-04-24 | 2021-08-18 | Editas Medicine, Inc. | Evaluation of cas9 molecule/guide rna molecule complexes |
US11390884B2 (en) | 2015-05-11 | 2022-07-19 | Editas Medicine, Inc. | Optimized CRISPR/cas9 systems and methods for gene editing in stem cells |
KR20180031671A (ko) | 2015-06-09 | 2018-03-28 | 에디타스 메디신, 인코포레이티드 | 이식의 개선을 위한 crispr/cas-관련 방법 및 조성물 |
MX2017016289A (es) | 2015-06-18 | 2018-08-15 | Broad Inst Inc | Mutaciones de la enzima crispr que reducen los efectos fuera del blanco. |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
US10648020B2 (en) | 2015-06-18 | 2020-05-12 | The Broad Institute, Inc. | CRISPR enzymes and systems |
WO2017053879A1 (en) | 2015-09-24 | 2017-03-30 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
AU2016349288A1 (en) | 2015-11-03 | 2018-05-31 | President And Fellows Of Harvard College | Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix |
WO2017106657A1 (en) | 2015-12-18 | 2017-06-22 | The Broad Institute Inc. | Novel crispr enzymes and systems |
JP6914274B2 (ja) * | 2016-01-22 | 2021-08-04 | ザ・ブロード・インスティテュート・インコーポレイテッド | Crisprcpf1の結晶構造 |
WO2017165862A1 (en) | 2016-03-25 | 2017-09-28 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency |
EP3433363A1 (en) | 2016-03-25 | 2019-01-30 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
US11236313B2 (en) | 2016-04-13 | 2022-02-01 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
CN116200465A (zh) | 2016-04-25 | 2023-06-02 | 哈佛学院董事及会员团体 | 用于原位分子检测的杂交链反应方法 |
GB2552861B (en) * | 2016-06-02 | 2019-05-15 | Sigma Aldrich Co Llc | Using programmable DNA binding proteins to enhance targeted genome modification |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
WO2017216771A2 (en) * | 2016-06-17 | 2017-12-21 | Genesis Technologies Limited | Crispr-cas system, materials and methods |
AU2017305404B2 (en) | 2016-08-02 | 2023-11-30 | Editas Medicine, Inc. | Compositions and methods for treating CEP290 associated disease |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
EP4095263A1 (en) | 2017-01-06 | 2022-11-30 | Editas Medicine, Inc. | Methods of assessing nuclease cleavage |
TW201839136A (zh) | 2017-02-06 | 2018-11-01 | 瑞士商諾華公司 | 治療血色素異常症之組合物及方法 |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
JP2020510439A (ja) | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
WO2018170184A1 (en) | 2017-03-14 | 2018-09-20 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
JPWO2018179578A1 (ja) * | 2017-03-30 | 2020-02-06 | 国立大学法人京都大学 | ゲノム編集によるエクソンスキッピング誘導方法 |
EP3612023A4 (en) | 2017-04-20 | 2021-05-12 | Egenesis, Inc. | GENETICALLY MODIFIED ANIMAL PRODUCTION PROCESSES |
EP3615672A1 (en) | 2017-04-28 | 2020-03-04 | Editas Medicine, Inc. | Methods and systems for analyzing guide rna molecules |
EP3622070A2 (en) | 2017-05-10 | 2020-03-18 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
CN110997908A (zh) | 2017-06-09 | 2020-04-10 | 爱迪塔斯医药公司 | 工程化的cas9核酸酶 |
CN107266583B (zh) * | 2017-06-27 | 2021-02-09 | 深圳大学 | 一种基于格氏嗜盐碱杆菌Argonaute靶向激活基因转录的方法 |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
JP2020534795A (ja) | 2017-07-28 | 2020-12-03 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
US11795443B2 (en) | 2017-10-16 | 2023-10-24 | The Broad Institute, Inc. | Uses of adenosine base editors |
AU2019236209A1 (en) | 2018-03-14 | 2020-10-01 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
CN111885915B (zh) | 2018-03-19 | 2023-04-28 | 瑞泽恩制药公司 | 使用crispr/cas系统对动物进行转录调制 |
GB201813011D0 (en) | 2018-08-10 | 2018-09-26 | Vib Vzw | Means and methods for drought tolerance in crops |
WO2020076976A1 (en) | 2018-10-10 | 2020-04-16 | Readcoor, Inc. | Three-dimensional spatial molecular indexing |
DE112020001342T5 (de) | 2019-03-19 | 2022-01-13 | President and Fellows of Harvard College | Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen |
JP7525140B2 (ja) * | 2020-01-31 | 2024-07-30 | 国立大学法人京都大学 | タンパク質翻訳の制御システム |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
KR20240055811A (ko) | 2021-09-10 | 2024-04-29 | 애질런트 테크놀로지스, 인크. | 프라임 편집을 위한 화학적 변형을 갖는 가이드 rna |
WO2024193739A1 (en) * | 2023-03-23 | 2024-09-26 | Ostravska Univerzita | Method for producing proteins in host cells |
Family Cites Families (161)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4123610A (en) | 1977-03-09 | 1978-10-31 | The United States Government | Nucleic acid crosslinking agent and affinity inactivation of nucleic acids therewith |
US5525464A (en) | 1987-04-01 | 1996-06-11 | Hyseq, Inc. | Method of sequencing by hybridization of oligonucleotide probes |
US4981985A (en) | 1987-10-20 | 1991-01-01 | Trustees Of The University Of Pennsylvania | Synthesis of photolabile chelators for multivalent cations |
US4844617A (en) | 1988-01-20 | 1989-07-04 | Tencor Instruments | Confocal measuring microscope with automatic focusing |
US5151189A (en) | 1990-09-17 | 1992-09-29 | Gelman Sciences, Inc. | Cationic charge modified microporous membrane |
ES2145044T3 (es) | 1992-02-13 | 2000-07-01 | Surmodics Inc | Inmovilizacion de especies quimicas en matrices reticuladas. |
US5594235A (en) | 1993-06-17 | 1997-01-14 | Ultrapointe Corporation | Automated surface acquisition for a confocal microscope |
US5578832A (en) | 1994-09-02 | 1996-11-26 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
SE9400522D0 (sv) | 1994-02-16 | 1994-02-16 | Ulf Landegren | Method and reagent for detecting specific nucleotide sequences |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US6284284B1 (en) | 1995-06-06 | 2001-09-04 | Advanced Tissue Sciences, Inc. | Compositions and methods for production and use of an injectable naturally secreted extracellular matrix |
US5830708A (en) | 1995-06-06 | 1998-11-03 | Advanced Tissue Sciences, Inc. | Methods for production of a naturally secreted extracellular matrix |
EP0923650B1 (en) | 1996-06-06 | 2007-03-07 | Solexa, Inc | Sequencing by ligation of encoded adaptors |
US5948617A (en) | 1997-06-13 | 1999-09-07 | Biospeparations, Inc. | Methods of in situ hybridization |
US6083726A (en) | 1998-02-03 | 2000-07-04 | Lucent Technologies, Inc. | Methods for polynucleotide synthesis and articles for polynucleotide hybridization |
US7060431B2 (en) | 1998-06-24 | 2006-06-13 | Illumina, Inc. | Method of making and decoding of array sensors with microspheres |
EP2177627B1 (en) | 1999-02-23 | 2012-05-02 | Caliper Life Sciences, Inc. | Manipulation of microparticles in microfluidic systems |
US6534266B1 (en) | 1999-04-22 | 2003-03-18 | Albert Einstein College Of Medicine Of Yeshiva University | Assay of transcription sites by multi-fluor fish |
US20020015952A1 (en) | 1999-07-30 | 2002-02-07 | Anderson Norman G. | Microarrays and their manufacture by slicing |
CA2386151A1 (en) | 1999-10-12 | 2001-04-19 | Marc Madou | Reactive polymeric valve, dispensing devices and methods using same |
WO2001037266A1 (en) | 1999-11-17 | 2001-05-25 | The Research Foundation Of State University Of New York | Three dimensional data storage device and method for reading |
WO2001068673A1 (en) | 2000-03-14 | 2001-09-20 | Active Motif | Oligonucleotide analogues, methods of synthesis and methods of use |
EP1287165B1 (en) | 2000-06-02 | 2007-06-13 | Bayer Corporation | Method for detection and localization of genes in situ using branched-DNA hybridisation |
DE60140317D1 (de) | 2000-12-14 | 2009-12-10 | Gen Probe Inc | Verfahren und kits zur verbesserung der hybridisierungsraten von polynukleotiden |
EP2801624B1 (en) | 2001-03-16 | 2019-03-06 | Singular Bio, Inc | Arrays and methods of use |
US7473767B2 (en) | 2001-07-03 | 2009-01-06 | The Institute For Systems Biology | Methods for detection and quantification of analytes in complex mixtures |
US20060248349A1 (en) | 2001-09-24 | 2006-11-02 | Rathjen Alicemarie G | Method for preparing and using personal and genetic profiles |
US20030148335A1 (en) | 2001-10-10 | 2003-08-07 | Li Shen | Detecting targets by unique identifier nucleotide tags |
GB2382137A (en) | 2001-11-20 | 2003-05-21 | Mats Gullberg | Nucleic acid enrichment |
US20090246879A1 (en) | 2002-12-20 | 2009-10-01 | Callida Genomics | Materials and Methods Relating to Nano-Tags and Nano-Brands |
DE602004036672C5 (de) | 2003-01-29 | 2012-11-29 | 454 Life Sciences Corporation | Nukleinsäureamplifikation auf Basis von Kügelchenemulsion |
CA2897376A1 (en) | 2003-02-26 | 2004-09-10 | Radoje T. Drmanac | Modular system and probes for dna analysis |
US7394592B2 (en) | 2003-05-20 | 2008-07-01 | Lucid, Inc. | Confocal microscope for imaging of selected locations of the body of a patient |
US7255994B2 (en) | 2003-06-10 | 2007-08-14 | Applera Corporation | Ligation assay |
US7193054B2 (en) | 2003-08-26 | 2007-03-20 | University Of Rochester | Nanofabrication using actin filaments |
US20080050718A1 (en) | 2003-11-14 | 2008-02-28 | Gesteland Raymond F | Methods, Articles, and Compositions for Identifying Oligonucleotides |
US7381529B2 (en) | 2003-12-31 | 2008-06-03 | Intel Corporation | Methods and compositions for detecting nucleic acids using scanning probe microscopy and nanocodes |
US20050191687A1 (en) | 2004-02-27 | 2005-09-01 | Tianxin Wang | Method for multiplexed analyte detection |
CA2557841A1 (en) | 2004-02-27 | 2005-09-09 | President And Fellows Of Harvard College | Polony fluorescent in situ sequencing beads |
WO2006076017A2 (en) | 2004-04-30 | 2006-07-20 | Applera Corporation | Methods and kits for identifying target nucleotides in mixed populations |
US20060024711A1 (en) | 2004-07-02 | 2006-02-02 | Helicos Biosciences Corporation | Methods for nucleic acid amplification and sequence determination |
US7253947B2 (en) | 2004-10-07 | 2007-08-07 | New York University | Portable automated confocal microscope |
DK1833840T3 (da) * | 2004-11-09 | 2010-10-18 | Santaris Pharma As | Micromirs |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
ITRM20050068A1 (it) | 2005-02-17 | 2006-08-18 | Istituto Naz Per Le Malattie I | Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine. |
US20060234261A1 (en) | 2005-03-08 | 2006-10-19 | Pierce Niles A | Colorimetric readout of hybridization chain reaction |
US7727721B2 (en) | 2005-03-08 | 2010-06-01 | California Institute Of Technology | Hybridization chain reaction amplification for in situ imaging |
US20070020650A1 (en) | 2005-04-01 | 2007-01-25 | Avak Kahvejian | Methods for detecting proteins |
MX2007012486A (es) | 2005-04-08 | 2007-12-13 | Mycosol Inc | Ensayos de investigacion sobre estilbazio. |
US7601499B2 (en) | 2005-06-06 | 2009-10-13 | 454 Life Sciences Corporation | Paired end sequencing |
US7842793B2 (en) | 2005-06-14 | 2010-11-30 | The California Institute Of Technology | Methods of making nucleic acid nanostructures |
CA2611671C (en) | 2005-06-15 | 2013-10-08 | Callida Genomics, Inc. | Single molecule arrays for genetic and chemical analysis |
EP3042963A1 (en) | 2005-06-20 | 2016-07-13 | Advanced Cell Diagnostics, Inc. | Methods of detecting nucleic acids in individual cells and of identifying rare cells from large heterogeneous cell populations |
US8486621B2 (en) | 2005-08-11 | 2013-07-16 | Cornell Research Foundation, Inc. | Nucleic acid-based matrixes |
CA2640385C (en) | 2005-12-23 | 2014-07-15 | Nanostring Technologies, Inc. | Nanoreporters and methods of manufacturing and use thereof |
US7864996B2 (en) | 2006-02-17 | 2011-01-04 | Lucid, Inc. | System for macroscopic and confocal imaging of tissue |
WO2007106402A2 (en) | 2006-03-10 | 2007-09-20 | President And Fellows Of Harvard College | Methods and apparatus for near field irradiation |
GB0605584D0 (en) | 2006-03-20 | 2006-04-26 | Olink Ab | Method for analyte detection using proximity probes |
WO2007111937A1 (en) | 2006-03-23 | 2007-10-04 | Applera Corporation | Directed enrichment of genomic dna for high-throughput sequencing |
US8975216B2 (en) | 2006-03-30 | 2015-03-10 | Pacific Biosciences Of California | Articles having localized molecules disposed thereon and methods of producing same |
CA2648149A1 (en) | 2006-03-31 | 2007-11-01 | Solexa, Inc. | Systems and devices for sequence by synthesis analysis |
JP2009538123A (ja) | 2006-04-19 | 2009-11-05 | アプライド バイオシステムズ, エルエルシー | ゲル非含有ビーズベースの配列決定のための試薬、方法およびライブラリー |
US7964347B2 (en) | 2006-06-15 | 2011-06-21 | Krassen Dimitrov | Labels for electronic detection of individual molecules and methods for their detection |
US20080038163A1 (en) | 2006-06-23 | 2008-02-14 | Applera Corporation | Systems and Methods for Cooling in Biological Analysis Instruments |
US7745129B1 (en) | 2006-07-12 | 2010-06-29 | Kenneth David Schatz | Methods for sequencing of a necleic acid |
WO2008033848A2 (en) | 2006-09-11 | 2008-03-20 | The Arizona Board Of Regents, A Body Corporate Of The State Of Arizona Acting For And On Behalf Of Arizona State University | Self-assembled combinatorial encoding nanoarrays for multiplexed biosensing |
US20090208965A1 (en) | 2006-10-25 | 2009-08-20 | Ikonisys, Inc. | Automated method for detecting cancers and high grade hyperplasias |
US9201063B2 (en) | 2006-11-16 | 2015-12-01 | General Electric Company | Sequential analysis of biological samples |
GB2457402B (en) | 2006-12-01 | 2011-10-19 | Univ Columbia | Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators |
US20080269068A1 (en) | 2007-02-06 | 2008-10-30 | President And Fellows Of Harvard College | Multiplex decoding of sequence tags in barcodes |
PL2126130T3 (pl) | 2007-03-02 | 2015-10-30 | Dupont Nutrition Biosci Aps | Hodowle o ulepszonej fagooporności |
US8145677B2 (en) | 2007-03-27 | 2012-03-27 | Faleh Jassem Al-Shameri | Automated generation of metadata for mining image and text data |
US9217151B2 (en) | 2007-05-16 | 2015-12-22 | California Institute Of Technology | Versatile nucleic acid hairpin motif for programming biomolecular self-assembly pathways |
AU2008265691B2 (en) | 2007-06-19 | 2014-04-24 | F. Hoffmann-La Roche Ag | High throughput nucleic acid sequencing by expansion |
US20110294135A1 (en) | 2007-08-02 | 2011-12-01 | BioDesic, LLC | Compositions and methods for analyte detection and quantitation |
US20090191553A1 (en) | 2007-10-01 | 2009-07-30 | Applied Biosystems Inc. | Chase Ligation Sequencing |
JP2010539991A (ja) | 2007-10-04 | 2010-12-24 | ハルシオン モレキュラー | 電子顕微鏡を用いた核酸ポリマーの配列決定 |
US20090139311A1 (en) | 2007-10-05 | 2009-06-04 | Applied Biosystems Inc. | Biological Analysis Systems, Devices, and Methods |
US20110020291A1 (en) | 2007-11-17 | 2011-01-27 | Debrabrata Banerjee | Use of stem cells for wound healing |
CN101586150B (zh) | 2008-05-23 | 2016-09-28 | 陕西佰美基因股份有限公司 | 检测探针、通用寡核苷酸芯片及核酸检测方法及其用途 |
WO2010011961A2 (en) | 2008-07-25 | 2010-01-28 | University Of Georgia Research Foundation, Inc. | Prokaryotic rnai-like system and methods of use |
CN102171234A (zh) | 2008-08-05 | 2011-08-31 | 康奈尔大学 | 光交联核酸水凝胶 |
JP5836803B2 (ja) | 2008-08-14 | 2015-12-24 | ナノストリング テクノロジーズ, インコーポレイテッド | 安定したナノレポーター |
US9156010B2 (en) | 2008-09-23 | 2015-10-13 | Bio-Rad Laboratories, Inc. | Droplet-based assay system |
US20100076057A1 (en) * | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
US20100087325A1 (en) | 2008-10-07 | 2010-04-08 | Illumina, Inc. | Biological sample temperature control system and method |
US9404098B2 (en) | 2008-11-06 | 2016-08-02 | University Of Georgia Research Foundation, Inc. | Method for cleaving a target RNA using a Cas6 polypeptide |
US8309306B2 (en) | 2008-11-12 | 2012-11-13 | Nodality, Inc. | Detection composition |
EP3150724A1 (en) | 2008-12-19 | 2017-04-05 | President and Fellows of Harvard College | Particle-assisted nucleic acid sequencing |
JP4528345B2 (ja) | 2009-01-28 | 2010-08-18 | シャープ株式会社 | 動画再生装置、動画再生方法、動画再生方法をコンピュータで実現するためのプログラム及びそのプログラムを記録した記録媒体 |
FR2948475A1 (fr) | 2009-07-24 | 2011-01-28 | Bionext | Procede de caracterisation d'objets tridimensionnels |
US8431151B2 (en) | 2009-08-06 | 2013-04-30 | Syracuse University | Antimicrobial nanostructured hydrogel web containing silver |
JP5954876B2 (ja) | 2009-10-13 | 2016-07-20 | ナノストリング テクノロジーズ, インコーポレイテッド | ナノレポーターによるタンパク質の検出 |
AU2010315303B2 (en) | 2009-11-03 | 2015-08-06 | Htg Molecular Diagnostics, Inc. | Quantitative Nuclease Protection Sequencing (qNPS) |
US9089512B2 (en) | 2009-12-18 | 2015-07-28 | President And Fellows Of Harvard College | Active scaffolds for on-demand drug and cell delivery |
US20110257031A1 (en) | 2010-02-12 | 2011-10-20 | Life Technologies Corporation | Nucleic acid, biomolecule and polymer identifier codes |
WO2011112634A2 (en) | 2010-03-08 | 2011-09-15 | California Institute Of Technology | Molecular indicia of cellular constituents and resolving the same by super-resolution technologies in single cells |
US10087431B2 (en) | 2010-03-10 | 2018-10-02 | The Regents Of The University Of California | Methods of generating nucleic acid fragments |
GB201004292D0 (en) | 2010-03-15 | 2010-04-28 | Olink Ab | Assay for localised detection of analytes |
KR101866401B1 (ko) | 2010-04-05 | 2018-06-11 | 프로그노시스 바이오사이언스, 인코포레이티드 | 공간적으로 엔코딩된 생물학적 검정 |
SG185481A1 (en) | 2010-05-10 | 2012-12-28 | Univ California | Endoribonuclease compositions and methods of use thereof |
US20130059741A1 (en) | 2010-05-13 | 2013-03-07 | Illumina, Inc. | Binding assays for markers |
EP4063518A1 (en) | 2010-07-09 | 2022-09-28 | Cergentis B.V. | V3-d genomic region of interest sequencing strategies |
WO2012056440A1 (en) | 2010-10-28 | 2012-05-03 | Nanodoc Ltd. | COMPOSITIONS AND METHODS FOR ACTIVATING EXPRESSION BY A SPECIFIC ENDOGENOUS miRNA |
WO2012058638A2 (en) | 2010-10-29 | 2012-05-03 | President And Fellows Of Harvard College | Nucleic acid nanostructure barcode probes |
JP5998148B2 (ja) | 2010-11-16 | 2016-09-28 | ナブシス 2.0 エルエルシー | ハイブリダイズされたプローブの相対位置を検出することによる生体分子のシークエンシングのための方法 |
US8551708B2 (en) | 2011-02-15 | 2013-10-08 | Leica Biosystems Newcastle Ltd. | Methods for localized in situ detection of mRNA |
JP5687514B2 (ja) | 2011-02-17 | 2015-03-18 | 株式会社日立ハイテクノロジーズ | 核酸配列解析装置 |
DK2500436T3 (en) | 2011-03-17 | 2016-08-29 | Pasteur Institut | A method, probe and kit for in situ hybridization of DNA and use thereof |
EP2705161A1 (de) | 2011-05-04 | 2014-03-12 | Genovoxx GmbH | Nukleosid-triphosphat-konjugate und methoden zu deren anwendung |
US9617598B2 (en) | 2011-05-27 | 2017-04-11 | President And Fellows Of Harvard College | Methods of amplifying whole genome of a single cell |
US20140113376A1 (en) | 2011-06-01 | 2014-04-24 | Rotem Sorek | Compositions and methods for downregulating prokaryotic genes |
PL222511B1 (pl) | 2011-06-08 | 2016-08-31 | Międzynarodowy Inst Biologii Molekularnej I Komórkowej W Warszawie | Endorybonukleazy dsRNA |
EP3604555A1 (en) | 2011-10-14 | 2020-02-05 | President and Fellows of Harvard College | Sequencing by structure assembly |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
IN2014DN07853A (ko) | 2012-02-24 | 2015-04-24 | Hutchinson Fred Cancer Res | |
CN104364392B (zh) | 2012-02-27 | 2018-05-25 | 赛卢拉研究公司 | 用于分子计数的组合物和试剂盒 |
KR102084539B1 (ko) | 2012-02-29 | 2020-03-04 | 상가모 테라퓨틱스, 인코포레이티드 | 헌팅턴병을 치료하기 위한 방법 및 조성물 |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
DE202013012241U1 (de) * | 2012-05-25 | 2016-01-18 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
SG196730A1 (en) | 2012-07-16 | 2014-02-13 | Agency Science Tech & Res | Methods for reading data from a storage medium using a reader and storage devices |
CN104640984B (zh) | 2012-07-20 | 2020-05-05 | 美迪恩斯生命科技株式会社 | 使用含有光响应性核苷酸类的探针进行光偶联的方法 |
EP2880171B1 (en) | 2012-08-03 | 2018-10-03 | The Regents of The University of California | Methods and compositions for controlling gene expression by rna processing |
AU2013302966B2 (en) | 2012-08-15 | 2017-06-08 | Lucid, Inc. | Systems and methods for imaging tissue |
CN102908119A (zh) | 2012-09-26 | 2013-02-06 | 温州医学院眼视光研究院 | 一种共焦扫描成像系统及其像差控制方法 |
ES2926021T3 (es) * | 2012-10-23 | 2022-10-21 | Toolgen Inc | Composición para escindir un ADN objetivo que comprende un ARN guía específico para el ADN objetivo y ácido nucleico codificador de proteína Cas o proteína Cas, y uso de la misma |
PL2928496T3 (pl) * | 2012-12-06 | 2020-04-30 | Sigma-Aldrich Co. Llc | Modyfikacja i regulacja genomu w oparciu o CRISPR |
EP2825654B1 (en) * | 2012-12-12 | 2017-04-26 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
MX2015007549A (es) | 2012-12-12 | 2017-01-20 | Broad Inst Inc | Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias. |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
BR112015013784A2 (pt) * | 2012-12-12 | 2017-07-11 | Massachusetts Inst Technology | aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas |
RU2699523C2 (ru) | 2012-12-17 | 2019-09-05 | Президент Энд Фэллоуз Оф Харвард Коллидж | Рнк-направляемая инженерия генома человека |
EP3919505B1 (en) | 2013-01-16 | 2023-08-30 | Emory University | Uses of cas9-nucleic acid complexes |
US9411930B2 (en) | 2013-02-01 | 2016-08-09 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
EP2971184B1 (en) | 2013-03-12 | 2019-04-17 | President and Fellows of Harvard College | Method of generating a three-dimensional nucleic acid containing matrix |
NZ712727A (en) | 2013-03-14 | 2017-05-26 | Caribou Biosciences Inc | Compositions and methods of nucleic acid-targeting nucleic acids |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
US20140273230A1 (en) | 2013-03-15 | 2014-09-18 | Sigma-Aldrich Co., Llc | Crispr-based genome modification and regulation |
KR102210322B1 (ko) | 2013-03-15 | 2021-02-01 | 더 제너럴 하스피탈 코포레이션 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
US9330295B2 (en) | 2013-03-15 | 2016-05-03 | Brown University | Spatial sequencing/gene expression camera |
KR102368591B1 (ko) | 2013-04-30 | 2022-02-25 | 캘리포니아 인스티튜트 오브 테크놀로지 | 순차적 하이브리드화 바코딩에 의한 분자의 멀티플렉스 표지화 |
US10510435B2 (en) | 2013-04-30 | 2019-12-17 | California Institute Of Technology | Error correction of multiplex imaging analysis by sequential hybridization |
WO2014191518A1 (en) * | 2013-05-29 | 2014-12-04 | Cellectis | A method for producing precise dna cleavage using cas9 nickase activity |
US20140356956A1 (en) * | 2013-06-04 | 2014-12-04 | President And Fellows Of Harvard College | RNA-Guided Transcriptional Regulation |
EP3003392B1 (en) | 2013-06-04 | 2019-10-23 | President and Fellows of Harvard College | Rna-guideded transcriptional regulation |
KR20160034901A (ko) | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
EP3058091B1 (en) | 2013-10-18 | 2020-03-25 | The Broad Institute, Inc. | Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing |
EP3080259B1 (en) | 2013-12-12 | 2023-02-01 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation |
GB201401885D0 (en) | 2014-02-04 | 2014-03-19 | Olink Ab | Proximity assay with detection based on hybridisation chain reaction (HCR) |
JP6456969B2 (ja) | 2014-02-21 | 2019-01-23 | マサチューセッツ インスティテュート オブ テクノロジー | 膨張顕微鏡法 |
KR102105236B1 (ko) | 2014-11-21 | 2020-04-28 | 나노스트링 테크놀로지스, 인크. | 무효소 및 무증폭 시퀀싱 |
EP3262192B1 (en) | 2015-02-27 | 2020-09-16 | Becton, Dickinson and Company | Spatially addressable molecular barcoding |
US11535882B2 (en) | 2015-03-30 | 2022-12-27 | Becton, Dickinson And Company | Methods and compositions for combinatorial barcoding |
AU2016349288A1 (en) | 2015-11-03 | 2018-05-31 | President And Fellows Of Harvard College | Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix |
CN108700460B (zh) | 2015-12-21 | 2020-11-03 | 威里利生命科学有限责任公司 | 成像系统和成像方法 |
WO2017161251A1 (en) | 2016-03-17 | 2017-09-21 | President And Fellows Of Harvard College | Methods for detecting and identifying genomic nucleic acids |
AU2017291727B2 (en) | 2016-07-05 | 2021-07-08 | California Institute Of Technology | Fractional initiator hybridization chain reaction |
CN117551741A (zh) | 2017-03-31 | 2024-02-13 | 乌尔蒂维尤股份有限公司 | Dna-抗原交换和扩增 |
-
2014
- 2014-06-04 EP EP14807194.7A patent/EP3003392B1/en active Active
- 2014-06-04 JP JP2016517954A patent/JP6621738B2/ja active Active
- 2014-06-04 AU AU2014274939A patent/AU2014274939B2/en active Active
- 2014-06-04 SG SG10201710030QA patent/SG10201710030QA/en unknown
- 2014-06-04 CN CN202110830978.0A patent/CN113846096A/zh active Pending
- 2014-06-04 KR KR1020217023393A patent/KR102512979B1/ko active IP Right Grant
- 2014-06-04 MY MYPI2015002877A patent/MY177814A/en unknown
- 2014-06-04 CA CA3176690A patent/CA3176690A1/en active Pending
- 2014-06-04 MX MX2015016798A patent/MX2015016798A/es unknown
- 2014-06-04 ES ES19197844T patent/ES2930537T3/es active Active
- 2014-06-04 KR KR1020157036892A patent/KR102282990B1/ko active IP Right Grant
- 2014-06-04 KR KR1020237009424A patent/KR20230042154A/ko not_active Application Discontinuation
- 2014-06-04 IL IL284773A patent/IL284773B2/en unknown
- 2014-06-04 SG SG11201509962QA patent/SG11201509962QA/en unknown
- 2014-06-04 SG SG10201913068PA patent/SG10201913068PA/en unknown
- 2014-06-04 BR BR112015030491A patent/BR112015030491A8/pt active Search and Examination
- 2014-06-04 EP EP19197844.4A patent/EP3603679B1/en active Active
- 2014-06-04 WO PCT/US2014/040868 patent/WO2014197568A2/en active Application Filing
- 2014-06-04 EP EP22189419.9A patent/EP4159243A1/en active Pending
- 2014-06-04 CN CN201480043971.2A patent/CN105451778B/zh active Active
- 2014-06-04 CA CA2914638A patent/CA2914638A1/en active Pending
- 2014-06-04 RU RU2015156198A patent/RU2690935C2/ru active
- 2014-06-04 RU RU2019114706A patent/RU2756865C2/ru active
- 2014-06-04 MY MYPI2019003198A patent/MY197877A/en unknown
- 2014-06-04 IL IL302205A patent/IL302205A/en unknown
-
2015
- 2015-12-04 MX MX2021009672A patent/MX2021009672A/es unknown
- 2015-12-06 IL IL242959A patent/IL242959B/en unknown
-
2019
- 2019-03-04 JP JP2019039027A patent/JP7036511B2/ja active Active
-
2020
- 2020-06-15 AU AU2020203977A patent/AU2020203977B2/en active Active
- 2020-12-02 JP JP2020200649A patent/JP7119055B2/ja active Active
-
2021
- 2021-08-24 AU AU2021221488A patent/AU2021221488B2/en active Active
-
2022
- 2022-08-03 JP JP2022124144A patent/JP7376650B2/ja active Active
- 2022-10-25 US US17/972,885 patent/US11981917B2/en active Active
-
2023
- 2023-10-26 JP JP2023183980A patent/JP2024012387A/ja active Pending
-
2024
- 2024-01-29 US US18/425,219 patent/US20240175057A1/en active Pending
- 2024-06-28 AU AU2024204479A patent/AU2024204479A1/en active Pending
Non-Patent Citations (4)
Title |
---|
Cell.,152(5):1173-1183(2013.2.28.)* |
Nat Methods.,10(3):239-242(2013.2.3.)* |
SCIENCE.,337:816-821(2012.6.28.)* |
SCIENCE.,339:823-826(2013.2.15.)* |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102512979B1 (ko) | Rna-가이드된 전사 조절 | |
US10767194B2 (en) | RNA-guided transcriptional regulation | |
KR102481330B1 (ko) | Rna-가이드된 유전자 조절 및 편집을 위한 직교 cas9 단백질 | |
NZ753950B2 (en) | Rna-guided transcriptional regulation | |
NZ753951B2 (en) | Rna-guided transcriptional regulation | |
NZ715280B2 (en) | Rna-guided transcriptional regulation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |