KR20150105633A - 서열 조작을 위한 시스템, 방법 및 최적화된 가이드 조성물의 조작 - Google Patents
서열 조작을 위한 시스템, 방법 및 최적화된 가이드 조성물의 조작 Download PDFInfo
- Publication number
- KR20150105633A KR20150105633A KR1020157018614A KR20157018614A KR20150105633A KR 20150105633 A KR20150105633 A KR 20150105633A KR 1020157018614 A KR1020157018614 A KR 1020157018614A KR 20157018614 A KR20157018614 A KR 20157018614A KR 20150105633 A KR20150105633 A KR 20150105633A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- lys
- crispr
- leu
- glu
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 239000000203 mixture Substances 0.000 title claims abstract description 20
- 108091033409 CRISPR Proteins 0.000 claims abstract description 204
- 210000004027 cell Anatomy 0.000 claims abstract description 132
- 239000013598 vector Substances 0.000 claims abstract description 111
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 67
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract 12
- 102000004190 Enzymes Human genes 0.000 claims description 167
- 108090000790 Enzymes Proteins 0.000 claims description 167
- 102000040430 polynucleotide Human genes 0.000 claims description 120
- 108091033319 polynucleotide Proteins 0.000 claims description 120
- 239000002157 polynucleotide Substances 0.000 claims description 120
- 108091092236 Chimeric RNA Proteins 0.000 claims description 112
- 125000003729 nucleotide group Chemical group 0.000 claims description 98
- 230000014509 gene expression Effects 0.000 claims description 81
- 239000002773 nucleotide Substances 0.000 claims description 75
- 230000001105 regulatory effect Effects 0.000 claims description 67
- 238000003776 cleavage reaction Methods 0.000 claims description 58
- 230000007017 scission Effects 0.000 claims description 58
- 230000004048 modification Effects 0.000 claims description 56
- 238000012986 modification Methods 0.000 claims description 56
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 54
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 38
- 150000001413 amino acids Chemical class 0.000 claims description 25
- 230000030648 nucleus localization Effects 0.000 claims description 22
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 19
- 238000005457 optimization Methods 0.000 claims description 17
- 241000194017 Streptococcus Species 0.000 claims description 16
- 230000009870 specific binding Effects 0.000 claims description 16
- 101710163270 Nuclease Proteins 0.000 claims description 12
- 238000009396 hybridization Methods 0.000 claims description 12
- 230000035897 transcription Effects 0.000 claims description 11
- 238000013518 transcription Methods 0.000 claims description 11
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims description 8
- 230000002829 reductive effect Effects 0.000 claims description 8
- 241000589876 Campylobacter Species 0.000 claims description 7
- 108091026890 Coding region Proteins 0.000 claims description 7
- 230000006641 stabilisation Effects 0.000 claims description 7
- 238000011105 stabilization Methods 0.000 claims description 7
- 238000004132 cross linking Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 claims description 5
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 claims description 5
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 claims description 5
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 claims description 5
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 claims description 5
- 229930010555 Inosine Natural products 0.000 claims description 5
- 241000186660 Lactobacillus Species 0.000 claims description 5
- 229910019142 PO4 Inorganic materials 0.000 claims description 5
- 229930185560 Pseudouridine Natural products 0.000 claims description 5
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 claims description 5
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 claims description 5
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 claims description 5
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 claims description 5
- 229960003786 inosine Drugs 0.000 claims description 5
- 229940039696 lactobacillus Drugs 0.000 claims description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 5
- 239000010452 phosphate Substances 0.000 claims description 5
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 claims description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 4
- 241000191940 Staphylococcus Species 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 241000949716 Sphaerochaeta Species 0.000 claims description 3
- 241000589941 Azospirillum Species 0.000 claims description 2
- 241000032681 Gluconacetobacter Species 0.000 claims description 2
- 241000588653 Neisseria Species 0.000 claims description 2
- 241000135938 Nitratifractor Species 0.000 claims description 2
- 241001386753 Parvibaculum Species 0.000 claims description 2
- 241000605947 Roseburia Species 0.000 claims description 2
- 239000000700 radioactive tracer Substances 0.000 claims description 2
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 claims 1
- CETPSERCERDGAM-UHFFFAOYSA-N ceric oxide Chemical compound O=[Ce]=O CETPSERCERDGAM-UHFFFAOYSA-N 0.000 claims 1
- 229910000422 cerium(IV) oxide Inorganic materials 0.000 claims 1
- 229940050410 gluconate Drugs 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 50
- 230000035772 mutation Effects 0.000 abstract description 39
- 230000001939 inductive effect Effects 0.000 abstract description 10
- 230000009918 complex formation Effects 0.000 abstract description 4
- 229940088598 enzyme Drugs 0.000 description 164
- 108090000623 proteins and genes Proteins 0.000 description 129
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 83
- 108020004414 DNA Proteins 0.000 description 61
- 102000004169 proteins and genes Human genes 0.000 description 61
- 235000018102 proteins Nutrition 0.000 description 58
- 201000010099 disease Diseases 0.000 description 55
- 150000007523 nucleic acids Chemical class 0.000 description 53
- 102000039446 nucleic acids Human genes 0.000 description 42
- 108020004707 nucleic acids Proteins 0.000 description 42
- 241000282414 Homo sapiens Species 0.000 description 35
- 108020005004 Guide RNA Proteins 0.000 description 32
- 108010034529 leucyl-lysine Proteins 0.000 description 32
- 125000006850 spacer group Chemical group 0.000 description 31
- 238000003780 insertion Methods 0.000 description 30
- 230000037431 insertion Effects 0.000 description 30
- 206010057190 Respiratory tract infections Diseases 0.000 description 29
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 29
- 208000035475 disorder Diseases 0.000 description 28
- 241000196324 Embryophyta Species 0.000 description 25
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 24
- 239000013604 expression vector Substances 0.000 description 24
- 108010054155 lysyllysine Proteins 0.000 description 23
- 108010050848 glycylleucine Proteins 0.000 description 21
- 238000003556 assay Methods 0.000 description 20
- 238000012217 deletion Methods 0.000 description 20
- 239000000047 product Substances 0.000 description 20
- 235000001014 amino acid Nutrition 0.000 description 19
- 229940024606 amino acid Drugs 0.000 description 19
- 230000000875 corresponding effect Effects 0.000 description 19
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 19
- 210000004940 nucleus Anatomy 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 108010073969 valyllysine Proteins 0.000 description 19
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 18
- 208000011580 syndromic disease Diseases 0.000 description 18
- 108010062796 arginyllysine Proteins 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 16
- 230000000295 complement effect Effects 0.000 description 16
- 238000000338 in vitro Methods 0.000 description 16
- 210000001519 tissue Anatomy 0.000 description 16
- 241000700605 Viruses Species 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 15
- 238000002744 homologous recombination Methods 0.000 description 15
- 230000006801 homologous recombination Effects 0.000 description 15
- 210000004962 mammalian cell Anatomy 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 230000027455 binding Effects 0.000 description 14
- 230000001404 mediated effect Effects 0.000 description 14
- 239000013612 plasmid Substances 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- 230000008685 targeting Effects 0.000 description 14
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 13
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 13
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 13
- 108091034117 Oligonucleotide Proteins 0.000 description 13
- 241000320123 Streptococcus pyogenes M1 GAS Species 0.000 description 13
- 108010047495 alanylglycine Proteins 0.000 description 13
- 230000004927 fusion Effects 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 12
- 108010057821 leucylproline Proteins 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 11
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 11
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 241001633172 Streptococcus thermophilus LMD-9 Species 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 11
- 108010013835 arginine glutamate Proteins 0.000 description 11
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 11
- 230000002068 genetic effect Effects 0.000 description 11
- 108010025306 histidylleucine Proteins 0.000 description 11
- 108010064235 lysylglycine Proteins 0.000 description 11
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- 230000009261 transgenic effect Effects 0.000 description 11
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 10
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 10
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 10
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 10
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 10
- 230000007018 DNA scission Effects 0.000 description 10
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 10
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 10
- 241001465754 Metazoa Species 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 10
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 10
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 10
- 238000009825 accumulation Methods 0.000 description 10
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 10
- 230000005782 double-strand break Effects 0.000 description 10
- 108010025678 empty spiracles homeobox proteins Proteins 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 108010089804 glycyl-threonine Proteins 0.000 description 10
- 108010009298 lysylglutamic acid Proteins 0.000 description 10
- 238000004806 packaging method and process Methods 0.000 description 10
- 241000701161 unidentified adenovirus Species 0.000 description 10
- 230000003612 virological effect Effects 0.000 description 10
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 9
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 9
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 9
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 9
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 9
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 9
- 241000702421 Dependoparvovirus Species 0.000 description 9
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 9
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 9
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 9
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 9
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 9
- 238000000636 Northern blotting Methods 0.000 description 9
- 108010041407 alanylaspartic acid Proteins 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000001890 transfection Methods 0.000 description 9
- 239000013603 viral vector Substances 0.000 description 9
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 8
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 8
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 8
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 8
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 8
- 101000706121 Homo sapiens Parvalbumin alpha Proteins 0.000 description 8
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 8
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 8
- 102100030856 Myoglobin Human genes 0.000 description 8
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 8
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 8
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 108010047857 aspartylglycine Proteins 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 8
- -1 e. G. Chemical group 0.000 description 8
- 238000001727 in vivo Methods 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 7
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 7
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 7
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 7
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 7
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 7
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 7
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 7
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 7
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 7
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 7
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 7
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 7
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 7
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 7
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 7
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 7
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 7
- 108010044940 alanylglutamine Proteins 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 108020001507 fusion proteins Proteins 0.000 description 7
- 238000001415 gene therapy Methods 0.000 description 7
- 108010018006 histidylserine Proteins 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 108010017391 lysylvaline Proteins 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 244000052769 pathogen Species 0.000 description 7
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 7
- 210000001236 prokaryotic cell Anatomy 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 6
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 6
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 6
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 6
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 6
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 6
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 6
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 6
- 102100021277 Beta-secretase 2 Human genes 0.000 description 6
- 101710150190 Beta-secretase 2 Proteins 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 6
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 6
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 6
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 6
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 6
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 6
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 6
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 6
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 6
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 6
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 6
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 6
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 6
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 6
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 6
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 6
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 6
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 6
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 6
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 6
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 6
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 6
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- 108010047562 NGR peptide Proteins 0.000 description 6
- 241000194020 Streptococcus thermophilus Species 0.000 description 6
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 6
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 6
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 6
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 6
- 108010070783 alanyltyrosine Proteins 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000007812 deficiency Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 230000001177 retroviral effect Effects 0.000 description 6
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 6
- 241000894007 species Species 0.000 description 6
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 5
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 5
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 5
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 5
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 5
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 5
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 5
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 5
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 5
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 5
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 5
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 5
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 5
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 5
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 5
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 5
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 5
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 5
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 5
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 5
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 5
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 5
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 5
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 5
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 5
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 5
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 5
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 5
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 5
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 5
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 5
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 5
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 5
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 5
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 5
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 5
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 5
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 5
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 5
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 5
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 5
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 5
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 5
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 5
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 5
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 5
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 5
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 5
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 5
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 5
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 5
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 5
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 5
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 5
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 5
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 5
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 5
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 5
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 5
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 5
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 5
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 5
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 5
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 5
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 5
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 5
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 5
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 5
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 5
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 5
- 101000635854 Homo sapiens Myoglobin Proteins 0.000 description 5
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 5
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 5
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 5
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 5
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 5
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 5
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 5
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 5
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 5
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 5
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 5
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 5
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 5
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 5
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 5
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 5
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 5
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 5
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 5
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 5
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 5
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 5
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 5
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 5
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 5
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 5
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 5
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 5
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 5
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 5
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 5
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 5
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 5
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 5
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 5
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 5
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 5
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 5
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 5
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 5
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 5
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 5
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 5
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 5
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 5
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 5
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 5
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 5
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 5
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 5
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 5
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 5
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 5
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 5
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 5
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 5
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 5
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 5
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 5
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 5
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 5
- 108010003201 RGH 0205 Proteins 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 5
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 5
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 5
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 5
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 5
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 5
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 5
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 5
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 5
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 5
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 5
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 5
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 5
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 5
- 241000193998 Streptococcus pneumoniae Species 0.000 description 5
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 5
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 5
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 5
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 5
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 5
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 5
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 5
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 5
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 5
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 5
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 5
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 5
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 5
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 5
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 5
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 5
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 5
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 5
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 5
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 5
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 5
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 5
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 5
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 5
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 5
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 5
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 5
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 5
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 5
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 5
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 5
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 5
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 5
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 5
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 5
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 5
- 108010077515 glycylproline Proteins 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 108010028295 histidylhistidine Proteins 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 230000005847 immunogenicity Effects 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 5
- 108010012058 leucyltyrosine Proteins 0.000 description 5
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 5
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 108010005942 methionylglycine Proteins 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 108010031719 prolyl-serine Proteins 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 5
- 230000005030 transcription termination Effects 0.000 description 5
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 4
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 4
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 4
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 4
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 4
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 4
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 4
- 102100033312 Alpha-2-macroglobulin Human genes 0.000 description 4
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 4
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 4
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 4
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 4
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 4
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 4
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 4
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 4
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 4
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 4
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 4
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 4
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 4
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 4
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 4
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 4
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 4
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 4
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 4
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 4
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 4
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 4
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 4
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 4
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 4
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 4
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 4
- 206010003591 Ataxia Diseases 0.000 description 4
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 4
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 4
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 4
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 4
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 4
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 4
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 4
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 4
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 4
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 4
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 4
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 4
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 4
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 4
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 4
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 4
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 4
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 4
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 4
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 4
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 4
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 4
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 4
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 4
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 4
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 4
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 4
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 4
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 4
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 4
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 4
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 4
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 4
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 4
- 101000891092 Homo sapiens TAR DNA-binding protein 43 Proteins 0.000 description 4
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 4
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 4
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 4
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 4
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 4
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 4
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 4
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 4
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 4
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 4
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 4
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 4
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 4
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 4
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 4
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 4
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 4
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 4
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 4
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 4
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 4
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 4
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 4
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 4
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 4
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 4
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 4
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 4
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 4
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 4
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 4
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 4
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 4
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 4
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 4
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 4
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 4
- MUDYEFAKNSTFAI-JYJNAYRXSA-N Met-Tyr-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O MUDYEFAKNSTFAI-JYJNAYRXSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 102000002488 Nucleoplasmin Human genes 0.000 description 4
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 4
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 4
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 4
- UEEVBGHEGJMDDV-AVGNSLFASA-N Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEEVBGHEGJMDDV-AVGNSLFASA-N 0.000 description 4
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 4
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 4
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 4
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 4
- 108010015078 Pregnancy-Associated alpha 2-Macroglobulins Proteins 0.000 description 4
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 4
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 4
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 4
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 4
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 4
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 4
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 4
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 4
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 4
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 4
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 4
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 4
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 4
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 4
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 4
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 4
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 4
- 102100030547 Serotonin N-acetyltransferase Human genes 0.000 description 4
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 4
- 108010021188 Superoxide Dismutase-1 Proteins 0.000 description 4
- 102100038836 Superoxide dismutase [Cu-Zn] Human genes 0.000 description 4
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 4
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 4
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 4
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 4
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 4
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 4
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 4
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 4
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 4
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- RSUXQZNWAOTBQF-XIRDDKMYSA-N Trp-Arg-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RSUXQZNWAOTBQF-XIRDDKMYSA-N 0.000 description 4
- MICFJCRQBFSKPA-UMPQAUOISA-N Trp-Met-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 MICFJCRQBFSKPA-UMPQAUOISA-N 0.000 description 4
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 4
- NJLQMKZSXYQRTO-FHWLQOOXSA-N Tyr-Glu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NJLQMKZSXYQRTO-FHWLQOOXSA-N 0.000 description 4
- GFJXBLSZOFWHAW-JYJNAYRXSA-N Tyr-His-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GFJXBLSZOFWHAW-JYJNAYRXSA-N 0.000 description 4
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 4
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 4
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 4
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 4
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 4
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 4
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 4
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 4
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 4
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 4
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 4
- 108010073925 Vascular Endothelial Growth Factor B Proteins 0.000 description 4
- 102000009520 Vascular Endothelial Growth Factor C Human genes 0.000 description 4
- 108010073923 Vascular Endothelial Growth Factor C Proteins 0.000 description 4
- 102100038217 Vascular endothelial growth factor B Human genes 0.000 description 4
- 201000008266 amyotrophic lateral sclerosis type 2 Diseases 0.000 description 4
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 230000008238 biochemical pathway Effects 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 201000006815 congenital muscular dystrophy Diseases 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 206010015037 epilepsy Diseases 0.000 description 4
- 238000001476 gene delivery Methods 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 208000032799 juvenile amyotrophic lateral sclerosis type 2 Diseases 0.000 description 4
- 208000032839 leukemia Diseases 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 4
- 108060005597 nucleoplasmin Proteins 0.000 description 4
- 108010084572 phenylalanyl-valine Proteins 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 4
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 3
- 239000013607 AAV vector Substances 0.000 description 3
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 3
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 3
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 3
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 3
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 3
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 3
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 3
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 3
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 3
- LNENWJXDHCFVOF-DCAQKATOSA-N Asp-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LNENWJXDHCFVOF-DCAQKATOSA-N 0.000 description 3
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 3
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 3
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 3
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 3
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 3
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 3
- 241000252212 Danio rerio Species 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 241000223221 Fusarium oxysporum Species 0.000 description 3
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 3
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 3
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 3
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 3
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 3
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 3
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 3
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 3
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 3
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 3
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 3
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 3
- WYSJPCTWSBJFCO-AVGNSLFASA-N His-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N WYSJPCTWSBJFCO-AVGNSLFASA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 3
- 208000026350 Inborn Genetic disease Diseases 0.000 description 3
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 3
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 3
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 3
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 3
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 3
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 3
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 3
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 3
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 3
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 3
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 201000004458 Myoma Diseases 0.000 description 3
- 108700019961 Neoplasm Genes Proteins 0.000 description 3
- 102000048850 Neoplasm Genes Human genes 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 3
- RGZYXNFHYRFNNS-MXAVVETBSA-N Phe-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGZYXNFHYRFNNS-MXAVVETBSA-N 0.000 description 3
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 3
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 3
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- 241000714474 Rous sarcoma virus Species 0.000 description 3
- 108010005173 SERPIN-B5 Proteins 0.000 description 3
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 3
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 3
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 3
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 3
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 3
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 3
- HFJJDMOFTCQGEI-STECZYCISA-N Tyr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HFJJDMOFTCQGEI-STECZYCISA-N 0.000 description 3
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 3
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 3
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 3
- NSUUANXHLKKHQB-BZSNNMDCSA-N Val-Pro-Trp Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 NSUUANXHLKKHQB-BZSNNMDCSA-N 0.000 description 3
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000005754 cellular signaling Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 108010082025 cyan fluorescent protein Proteins 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 208000016361 genetic disease Diseases 0.000 description 3
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 3
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 210000002443 helper t lymphocyte Anatomy 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000004770 neurodegeneration Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 108020001580 protein domains Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 108700004896 tripeptide FEG Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 102100035923 4-aminobutyrate aminotransferase, mitochondrial Human genes 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 102100024401 Alpha-1D adrenergic receptor Human genes 0.000 description 2
- 102100022815 Alpha-2A adrenergic receptor Human genes 0.000 description 2
- 102100025983 Alpha-2C adrenergic receptor Human genes 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- 108010043324 Amyloid Precursor Protein Secretases Proteins 0.000 description 2
- 102000002659 Amyloid Precursor Protein Secretases Human genes 0.000 description 2
- 102100032187 Androgen receptor Human genes 0.000 description 2
- 102100029470 Apolipoprotein E Human genes 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- YLVGUOGAFAJMKP-JYJNAYRXSA-N Arg-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YLVGUOGAFAJMKP-JYJNAYRXSA-N 0.000 description 2
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 2
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 2
- 108010074515 Arylalkylamine N-Acetyltransferase Proteins 0.000 description 2
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- 108010083946 Asp-Tyr-Leu-Lys Proteins 0.000 description 2
- 102000007370 Ataxin2 Human genes 0.000 description 2
- 108010032951 Ataxin2 Proteins 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102100021257 Beta-secretase 1 Human genes 0.000 description 2
- 101710150192 Beta-secretase 1 Proteins 0.000 description 2
- 208000014644 Brain disease Diseases 0.000 description 2
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 2
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 2
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 102100021633 Cathepsin B Human genes 0.000 description 2
- 102000000018 Chemokine CCL2 Human genes 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 241000588881 Chromobacterium Species 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 206010010904 Convulsion Diseases 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- HKALUUKHYNEDRS-GUBZILKMSA-N Cys-Leu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HKALUUKHYNEDRS-GUBZILKMSA-N 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 206010058314 Dysplasia Diseases 0.000 description 2
- 241000588698 Erwinia Species 0.000 description 2
- 241000186394 Eubacterium Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000605909 Fusobacterium Species 0.000 description 2
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 2
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 2
- WIMVKDYAKRAUCG-IHRRRGAJSA-N Gln-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WIMVKDYAKRAUCG-IHRRRGAJSA-N 0.000 description 2
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 2
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 2
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 108091027305 Heteroduplex Proteins 0.000 description 2
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 2
- 101001000686 Homo sapiens 4-aminobutyrate aminotransferase, mitochondrial Proteins 0.000 description 2
- 101000756842 Homo sapiens Alpha-2A adrenergic receptor Proteins 0.000 description 2
- 101000720032 Homo sapiens Alpha-2C adrenergic receptor Proteins 0.000 description 2
- 101000891579 Homo sapiens Microtubule-associated protein tau Proteins 0.000 description 2
- 101000652292 Homo sapiens Serotonin N-acetyltransferase Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 208000029462 Immunodeficiency disease Diseases 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 102000004388 Interleukin-4 Human genes 0.000 description 2
- 108090000978 Interleukin-4 Proteins 0.000 description 2
- 102100036600 Kynurenine/alpha-aminoadipate aminotransferase, mitochondrial Human genes 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 208000005870 Lafora disease Diseases 0.000 description 2
- 208000014161 Lafora myoclonic epilepsy Diseases 0.000 description 2
- 102100022745 Laminin subunit alpha-2 Human genes 0.000 description 2
- 101710128836 Large T antigen Proteins 0.000 description 2
- 241000589248 Legionella Species 0.000 description 2
- 208000007764 Legionnaires' Disease Diseases 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- 241000186781 Listeria Species 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 2
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 2
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241001599018 Melanogaster Species 0.000 description 2
- 208000036626 Mental retardation Diseases 0.000 description 2
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 2
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 2
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 2
- 241000202974 Methanobacterium Species 0.000 description 2
- 241000205276 Methanosarcina Species 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 102100040243 Microtubule-associated protein tau Human genes 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 101100101250 Mus musculus Th gene Proteins 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- 208000012902 Nervous system disease Diseases 0.000 description 2
- 108010040718 Neurokinin-1 Receptors Proteins 0.000 description 2
- 208000025966 Neurological disease Diseases 0.000 description 2
- 102100022397 Nitric oxide synthase, brain Human genes 0.000 description 2
- 241000605122 Nitrosomonas Species 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 208000018737 Parkinson disease Diseases 0.000 description 2
- 241000606860 Pasteurella Species 0.000 description 2
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 2
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 2
- 241000607568 Photobacterium Species 0.000 description 2
- 241000605894 Porphyromonas Species 0.000 description 2
- 102100022033 Presenilin-1 Human genes 0.000 description 2
- 102000029797 Prion Human genes 0.000 description 2
- 108091000054 Prion Proteins 0.000 description 2
- 208000024777 Prion disease Diseases 0.000 description 2
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 2
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 102000003661 Ribonuclease III Human genes 0.000 description 2
- 108010057163 Ribonuclease III Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 2
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 2
- 102100030333 Serpin B5 Human genes 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 102000005157 Somatostatin Human genes 0.000 description 2
- 108010056088 Somatostatin Proteins 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 102100037346 Substance-P receptor Human genes 0.000 description 2
- 241000204667 Thermoplasma Species 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 2
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 241000589886 Treponema Species 0.000 description 2
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 2
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 2
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 2
- 108010091383 Xanthine dehydrogenase Proteins 0.000 description 2
- 102000005773 Xanthine dehydrogenase Human genes 0.000 description 2
- 108010093894 Xanthine oxidase Proteins 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- 201000004525 Zellweger Syndrome Diseases 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 2
- 108010080146 androgen receptors Proteins 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 239000002551 biofuel Substances 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 239000006172 buffering agent Substances 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007123 defense Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- KAQKFAOMNZTLHT-VVUHWYTRSA-N epoprostenol Chemical compound O1C(=CCCCC(O)=O)C[C@@H]2[C@@H](/C=C/[C@@H](O)CCCCC)[C@H](O)C[C@@H]21 KAQKFAOMNZTLHT-VVUHWYTRSA-N 0.000 description 2
- 229960001123 epoprostenol Drugs 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000007813 immunodeficiency Effects 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229940028885 interleukin-4 Drugs 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 208000002780 macular degeneration Diseases 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 208000001749 optic atrophy Diseases 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 244000144977 poultry Species 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 201000000980 schizophrenia Diseases 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 2
- 229960000553 somatostatin Drugs 0.000 description 2
- 210000000278 spinal cord Anatomy 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- WWJZWCUNLNYYAU-UHFFFAOYSA-N temephos Chemical compound C1=CC(OP(=S)(OC)OC)=CC=C1SC1=CC=C(OP(=S)(OC)OC)C=C1 WWJZWCUNLNYYAU-UHFFFAOYSA-N 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- 230000000304 vasodilatating effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- OPCHFPHZPIURNA-MFERNQICSA-N (2s)-2,5-bis(3-aminopropylamino)-n-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 102100024959 5-hydroxytryptamine receptor 2C Human genes 0.000 description 1
- 102100037991 85/88 kDa calcium-independent phospholipase A2 Human genes 0.000 description 1
- 101150020052 AADAT gene Proteins 0.000 description 1
- 101150092476 ABCA1 gene Proteins 0.000 description 1
- 108091022885 ADAM Proteins 0.000 description 1
- 102100024378 AF4/FMR2 family member 2 Human genes 0.000 description 1
- 101150037123 APOE gene Proteins 0.000 description 1
- 108700005241 ATP Binding Cassette Transporter 1 Proteins 0.000 description 1
- 102100036618 ATP-binding cassette sub-family A member 13 Human genes 0.000 description 1
- 102100033618 ATP-binding cassette sub-family A member 2 Human genes 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 208000010444 Acidosis Diseases 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 102100036732 Actin, aortic smooth muscle Human genes 0.000 description 1
- 102000008161 Adenosine A3 Receptor Human genes 0.000 description 1
- 108010060261 Adenosine A3 Receptor Proteins 0.000 description 1
- 102100036664 Adenosine deaminase Human genes 0.000 description 1
- 102100036006 Adenosine receptor A3 Human genes 0.000 description 1
- 241000567147 Aeropyrum Species 0.000 description 1
- 101150029691 Aff2 gene Proteins 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 208000033237 Aicardi-Goutières syndrome Diseases 0.000 description 1
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 208000011403 Alexander disease Diseases 0.000 description 1
- 208000023434 Alpers-Huttenlocher syndrome Diseases 0.000 description 1
- 108050000241 Alpha 1D adrenoceptor Proteins 0.000 description 1
- 208000029602 Alpha-N-acetylgalactosaminidase deficiency Diseases 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 206010068783 Alstroem syndrome Diseases 0.000 description 1
- 201000005932 Alstrom Syndrome Diseases 0.000 description 1
- 208000031277 Amaurotic familial idiocy Diseases 0.000 description 1
- 102100022704 Amyloid-beta precursor protein Human genes 0.000 description 1
- 101710151993 Amyloid-beta precursor protein Proteins 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 101000939676 Androctonus crassicauda Toxin a Proteins 0.000 description 1
- 108010048154 Angiopoietin-1 Proteins 0.000 description 1
- 102000009088 Angiopoietin-1 Human genes 0.000 description 1
- 102100034594 Angiopoietin-1 Human genes 0.000 description 1
- 101710095339 Apolipoprotein E Proteins 0.000 description 1
- 241000207208 Aquifex Species 0.000 description 1
- 241000205046 Archaeoglobus Species 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000238421 Arthropoda Species 0.000 description 1
- 102100022146 Arylsulfatase A Human genes 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- OGMDXNFGPOPZTK-GUBZILKMSA-N Asn-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N OGMDXNFGPOPZTK-GUBZILKMSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 201000005943 Barth syndrome Diseases 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 1
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 1
- 208000010482 CADASIL Diseases 0.000 description 1
- 108091008927 CC chemokine receptors Proteins 0.000 description 1
- 101150052909 CCL2 gene Proteins 0.000 description 1
- 102000005674 CCR Receptors Human genes 0.000 description 1
- 101150083327 CCR2 gene Proteins 0.000 description 1
- 101150017501 CCR5 gene Proteins 0.000 description 1
- 238000010446 CRISPR interference Methods 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101150023944 CXCR5 gene Proteins 0.000 description 1
- 235000007627 Caesalpinia Nutrition 0.000 description 1
- 241000522234 Caesalpinia Species 0.000 description 1
- 240000001432 Calendula officinalis Species 0.000 description 1
- 235000005881 Calendula officinalis Nutrition 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000218236 Cannabis Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 108090000712 Cathepsin B Proteins 0.000 description 1
- 102100024940 Cathepsin K Human genes 0.000 description 1
- 206010050389 Cerebral ataxia Diseases 0.000 description 1
- 208000033221 Cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy Diseases 0.000 description 1
- 208000033935 Cerebral autosomal dominant arteriopathy-subcortical infarcts-leukoencephalopathy Diseases 0.000 description 1
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 241000254173 Coleoptera Species 0.000 description 1
- 102000002734 Collagen Type VI Human genes 0.000 description 1
- 108010043741 Collagen Type VI Proteins 0.000 description 1
- 102100033601 Collagen alpha-1(I) chain Human genes 0.000 description 1
- 102000020856 Copper Transport Proteins Human genes 0.000 description 1
- 108091004554 Copper Transport Proteins Proteins 0.000 description 1
- 102000012437 Copper-Transporting ATPases Human genes 0.000 description 1
- 108010022637 Copper-Transporting ATPases Proteins 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 102100036951 DNA polymerase subunit gamma-1 Human genes 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 241001533413 Deltavirus Species 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 206010012335 Dependence Diseases 0.000 description 1
- 241000605716 Desulfovibrio Species 0.000 description 1
- 208000004986 Diffuse Cerebral Sclerosis of Schilder Diseases 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102100022825 Disintegrin and metalloproteinase domain-containing protein 22 Human genes 0.000 description 1
- 201000007547 Dravet syndrome Diseases 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241001462977 Elina Species 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 206010053177 Epidermolysis Diseases 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101150107205 FCGR2 gene Proteins 0.000 description 1
- 101150061264 FXR1 gene Proteins 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 101150114401 Fcer1g gene Proteins 0.000 description 1
- 102100036334 Fragile X mental retardation syndrome-related protein 1 Human genes 0.000 description 1
- 102100036336 Fragile X mental retardation syndrome-related protein 2 Human genes 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 102100033713 Gamma-secretase subunit APH-1B Human genes 0.000 description 1
- 102100028260 Gamma-secretase subunit PEN-2 Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 208000010412 Glaucoma Diseases 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- GJLXZITZLUUXMJ-NHCYSSNCSA-N Gln-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GJLXZITZLUUXMJ-NHCYSSNCSA-N 0.000 description 1
- 208000010055 Globoid Cell Leukodystrophy Diseases 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- NIOPEYHPOBWLQO-KBPBESRZSA-N Gly-Trp-Glu Chemical compound NCC(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOPEYHPOBWLQO-KBPBESRZSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 108010051975 Glycogen Synthase Kinase 3 beta Proteins 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 102100022975 Glycogen synthase kinase-3 alpha Human genes 0.000 description 1
- 102100038104 Glycogen synthase kinase-3 beta Human genes 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 241000288105 Grus Species 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- WEIYKCOEVBUJQC-JYJNAYRXSA-N His-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WEIYKCOEVBUJQC-JYJNAYRXSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 1
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000761348 Homo sapiens 5-hydroxytryptamine receptor 2C Proteins 0.000 description 1
- 101000833172 Homo sapiens AF4/FMR2 family member 2 Proteins 0.000 description 1
- 101000929660 Homo sapiens ATP-binding cassette sub-family A member 13 Proteins 0.000 description 1
- 101000801645 Homo sapiens ATP-binding cassette sub-family A member 2 Proteins 0.000 description 1
- 101000929319 Homo sapiens Actin, aortic smooth muscle Proteins 0.000 description 1
- 101000783645 Homo sapiens Adenosine receptor A3 Proteins 0.000 description 1
- 101000775498 Homo sapiens Adenylate cyclase type 10 Proteins 0.000 description 1
- 101000924552 Homo sapiens Angiopoietin-1 Proteins 0.000 description 1
- 101000897480 Homo sapiens C-C motif chemokine 2 Proteins 0.000 description 1
- 101000898449 Homo sapiens Cathepsin B Proteins 0.000 description 1
- 101000761509 Homo sapiens Cathepsin K Proteins 0.000 description 1
- 101000804964 Homo sapiens DNA polymerase subunit gamma-1 Proteins 0.000 description 1
- 101000756722 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 22 Proteins 0.000 description 1
- 101000619542 Homo sapiens E3 ubiquitin-protein ligase parkin Proteins 0.000 description 1
- 101000938351 Homo sapiens Ephrin type-A receptor 3 Proteins 0.000 description 1
- 101100335685 Homo sapiens FXR2 gene Proteins 0.000 description 1
- 101000930945 Homo sapiens Fragile X mental retardation syndrome-related protein 1 Proteins 0.000 description 1
- 101000930952 Homo sapiens Fragile X mental retardation syndrome-related protein 2 Proteins 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 101000733778 Homo sapiens Gamma-secretase subunit APH-1B Proteins 0.000 description 1
- 101000579663 Homo sapiens Gamma-secretase subunit PEN-2 Proteins 0.000 description 1
- 101000903717 Homo sapiens Glycogen synthase kinase-3 alpha Proteins 0.000 description 1
- 101000843809 Homo sapiens Hydroxycarboxylic acid receptor 2 Proteins 0.000 description 1
- 101000929733 Homo sapiens Kynurenine/alpha-aminoadipate aminotransferase, mitochondrial Proteins 0.000 description 1
- 101000972491 Homo sapiens Laminin subunit alpha-2 Proteins 0.000 description 1
- 101000917826 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor II-a Proteins 0.000 description 1
- 101000917824 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor II-b Proteins 0.000 description 1
- 101001057159 Homo sapiens Melanoma-associated antigen C3 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000982010 Homo sapiens Myelin proteolipid protein Proteins 0.000 description 1
- 101000837517 Homo sapiens NEDD8-activating enzyme E1 catalytic subunit Proteins 0.000 description 1
- 101000974009 Homo sapiens Nitric oxide synthase, brain Proteins 0.000 description 1
- 101001109698 Homo sapiens Nuclear receptor subfamily 4 group A member 2 Proteins 0.000 description 1
- 101000595929 Homo sapiens POLG alternative reading frame Proteins 0.000 description 1
- 101000801640 Homo sapiens Phospholipid-transporting ATPase ABCA3 Proteins 0.000 description 1
- 101001064282 Homo sapiens Platelet-activating factor acetylhydrolase IB subunit beta Proteins 0.000 description 1
- 101000617536 Homo sapiens Presenilin-1 Proteins 0.000 description 1
- 101000617546 Homo sapiens Presenilin-2 Proteins 0.000 description 1
- 101001135385 Homo sapiens Prostacyclin synthase Proteins 0.000 description 1
- 101001001272 Homo sapiens Prostatic acid phosphatase Proteins 0.000 description 1
- 101000845206 Homo sapiens Putative peripheral benzodiazepine receptor-related protein Proteins 0.000 description 1
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 1
- 101000665449 Homo sapiens RNA binding protein fox-1 homolog 1 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 1
- 101000605835 Homo sapiens Serine/threonine-protein kinase PINK1, mitochondrial Proteins 0.000 description 1
- 101000845233 Homo sapiens Translocator protein Proteins 0.000 description 1
- 101000892398 Homo sapiens Tryptophan 2,3-dioxygenase Proteins 0.000 description 1
- 101000851865 Homo sapiens Tryptophan 5-hydroxylase 2 Proteins 0.000 description 1
- 101000666934 Homo sapiens Very low-density lipoprotein receptor Proteins 0.000 description 1
- 101001074035 Homo sapiens Zinc finger protein GLI2 Proteins 0.000 description 1
- 206010020460 Human T-cell lymphotropic virus type I infection Diseases 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 102100030643 Hydroxycarboxylic acid receptor 2 Human genes 0.000 description 1
- 108010073807 IgG Receptors Proteins 0.000 description 1
- 102000009490 IgG Receptors Human genes 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000000589 Interleukin-1 Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 206010022971 Iron Deficiencies Diseases 0.000 description 1
- 208000028226 Krabbe disease Diseases 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010020246 Leucine-Rich Repeat Serine-Threonine Protein Kinase-2 Proteins 0.000 description 1
- 102100032693 Leucine-rich repeat serine/threonine-protein kinase 2 Human genes 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 102100029204 Low affinity immunoglobulin gamma Fc region receptor II-a Human genes 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 1
- 208000024889 MECP2 duplication syndrome Diseases 0.000 description 1
- 101150083522 MECP2 gene Proteins 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 101001129124 Mannheimia haemolytica Outer membrane lipoprotein 1 Proteins 0.000 description 1
- 208000008948 Menkes Kinky Hair Syndrome Diseases 0.000 description 1
- 208000012583 Menkes disease Diseases 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 1
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- CULGJGUDIJATIP-STQMWFEESA-N Met-Tyr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 CULGJGUDIJATIP-STQMWFEESA-N 0.000 description 1
- 241000203353 Methanococcus Species 0.000 description 1
- 241000204675 Methanopyrus Species 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 1
- 241000589345 Methylococcus Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 206010051403 Mitochondrial DNA deletion Diseases 0.000 description 1
- 208000034819 Mobility Limitation Diseases 0.000 description 1
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 101100144701 Mus musculus Drosha gene Proteins 0.000 description 1
- 101100445099 Mus musculus Emx1 gene Proteins 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 101100494762 Mus musculus Nedd9 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000007101 Muscle Cramp Diseases 0.000 description 1
- 208000021642 Muscular disease Diseases 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 102100026784 Myelin proteolipid protein Human genes 0.000 description 1
- 208000036572 Myoclonic epilepsy Diseases 0.000 description 1
- 108010062374 Myoglobin Proteins 0.000 description 1
- 201000009623 Myopathy Diseases 0.000 description 1
- 201000002481 Myositis Diseases 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 102100031911 NEDD8 Human genes 0.000 description 1
- 108700004934 NEDD8 Proteins 0.000 description 1
- 101150107958 NEDD8 gene Proteins 0.000 description 1
- 102100028719 NEDD8-activating enzyme E1 catalytic subunit Human genes 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 208000002537 Neuronal Ceroid-Lipofuscinoses Diseases 0.000 description 1
- 101100058191 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) bcp-1 gene Proteins 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 108010008858 Nitric Oxide Synthase Type I Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 208000035544 Nonketotic hyperglycinaemia Diseases 0.000 description 1
- 102100022676 Nuclear receptor subfamily 4 group A member 2 Human genes 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 101000761187 Odontomachus monticola U-poneritoxin(01)-Om1a Proteins 0.000 description 1
- 101100532088 Oryza sativa subsp. japonica RUB2 gene Proteins 0.000 description 1
- 101100532090 Oryza sativa subsp. japonica RUB3 gene Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 101710125553 PLA2G6 Proteins 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102100037499 Parkinson disease protein 7 Human genes 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 201000004316 Perry syndrome Diseases 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- WZEWCHQHNCMBEN-PMVMPFDFSA-N Phe-Lys-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N WZEWCHQHNCMBEN-PMVMPFDFSA-N 0.000 description 1
- YVIVIQWMNCWUFS-UFYCRDLUSA-N Phe-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N YVIVIQWMNCWUFS-UFYCRDLUSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 1
- 102100033616 Phospholipid-transporting ATPase ABCA1 Human genes 0.000 description 1
- 102100033623 Phospholipid-transporting ATPase ABCA3 Human genes 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 208000024571 Pick disease Diseases 0.000 description 1
- 241000204826 Picrophilus Species 0.000 description 1
- 102100030655 Platelet-activating factor acetylhydrolase IB subunit beta Human genes 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 108010036933 Presenilin-1 Proteins 0.000 description 1
- 102100022036 Presenilin-2 Human genes 0.000 description 1
- 108010050254 Presenilins Proteins 0.000 description 1
- 102000015499 Presenilins Human genes 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 102100033075 Prostacyclin synthase Human genes 0.000 description 1
- 102100035703 Prostatic acid phosphatase Human genes 0.000 description 1
- 108010032428 Protein Deglycase DJ-1 Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 208000033876 Proximal Xq28 duplication syndrome Diseases 0.000 description 1
- 241000221301 Puccinia graminis Species 0.000 description 1
- 102100031269 Putative peripheral benzodiazepine receptor-related protein Human genes 0.000 description 1
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 1
- 241000205226 Pyrobaculum Species 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 102100038188 RNA binding protein fox-1 homolog 1 Human genes 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 101100240886 Rattus norvegicus Nptx2 gene Proteins 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 101710100969 Receptor tyrosine-protein kinase erbB-3 Proteins 0.000 description 1
- 102100029986 Receptor tyrosine-protein kinase erbB-3 Human genes 0.000 description 1
- 102100029981 Receptor tyrosine-protein kinase erbB-4 Human genes 0.000 description 1
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 101100170553 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DLD2 gene Proteins 0.000 description 1
- 101100023124 Schizosaccharomyces pombe (strain 972 / ATCC 24843) mfr2 gene Proteins 0.000 description 1
- 208000034189 Sclerosis Diseases 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- 102100038376 Serine/threonine-protein kinase PINK1, mitochondrial Human genes 0.000 description 1
- 206010073677 Severe myoclonic epilepsy of infancy Diseases 0.000 description 1
- 208000005392 Spasm Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000205101 Sulfolobus Species 0.000 description 1
- 102100021997 Synphilin-1 Human genes 0.000 description 1
- 101710140334 Synphilin-1 Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241000186339 Thermoanaerobacter Species 0.000 description 1
- 241000204652 Thermotoga Species 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 229910052776 Thorium Inorganic materials 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 1
- 102100040653 Tryptophan 2,3-dioxygenase Human genes 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 1
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 108091026822 U6 spliceosomal RNA Proteins 0.000 description 1
- 101150044377 UBA1 gene Proteins 0.000 description 1
- 101150035006 UBA3 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108010005656 Ubiquitin Thiolesterase Proteins 0.000 description 1
- 102000005918 Ubiquitin Thiolesterase Human genes 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- HLBHFAWNMAQGNO-AVGNSLFASA-N Val-His-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N HLBHFAWNMAQGNO-AVGNSLFASA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 102100039066 Very low-density lipoprotein receptor Human genes 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 101150115477 Vldlr gene Proteins 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 201000006793 Walker-Warburg syndrome Diseases 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 208000006254 Wolf-Hirschhorn Syndrome Diseases 0.000 description 1
- 241000605941 Wolinella Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 101000678336 Xenopus laevis Actin, alpha skeletal muscle 2 Proteins 0.000 description 1
- 101000678338 Xenopus tropicalis Actin, alpha cardiac muscle 2 Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 102100035558 Zinc finger protein GLI2 Human genes 0.000 description 1
- 244000273928 Zingiber officinale Species 0.000 description 1
- 235000006886 Zingiber officinale Nutrition 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000007950 acidosis Effects 0.000 description 1
- 208000026545 acidosis disease Diseases 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229940062327 aciphex Drugs 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 150000001294 alanine derivatives Chemical class 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 108010029483 alpha 1 Chain Collagen Type I Proteins 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- 108020004102 alpha-1 Adrenergic Receptor Proteins 0.000 description 1
- 108090000185 alpha-Synuclein Proteins 0.000 description 1
- 201000008333 alpha-mannosidosis Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 206010002022 amyloidosis Diseases 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 210000000709 aorta Anatomy 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010057412 arginyl-glycyl-aspartyl-phenylalanine Proteins 0.000 description 1
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 208000029560 autism spectrum disease Diseases 0.000 description 1
- 208000005980 beta thalassemia Diseases 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 208000022806 beta-thalassemia major Diseases 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 208000025434 cerebellar degeneration Diseases 0.000 description 1
- 208000016886 cerebral arteriopathy with subcortical infarcts and leukoencephalopathy Diseases 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 206010008129 cerebral palsy Diseases 0.000 description 1
- 208000003131 cerebrooculofacioskeletal syndrome 1 Diseases 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000008504 concentrate Nutrition 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 206010013663 drug dependence Diseases 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 208000025688 early-onset autosomal dominant Alzheimer disease Diseases 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 230000008472 epithelial growth Effects 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 208000015756 familial Alzheimer disease Diseases 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000005861 gene abnormality Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 235000008397 ginger Nutrition 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 201000011205 glycine encephalopathy Diseases 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000003258 hemophagocytic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 210000004394 hip joint Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 201000008298 histiocytosis Diseases 0.000 description 1
- 102000057382 human EPHA3 Human genes 0.000 description 1
- 102000049240 human PVALB Human genes 0.000 description 1
- 210000005119 human aortic smooth muscle cell Anatomy 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 239000012133 immunoprecipitate Substances 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 208000036546 leukodystrophy Diseases 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004705 lumbosacral region Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000000415 mammalian chromosome Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 201000011540 mitochondrial DNA depletion syndrome 4a Diseases 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 208000025855 muscular dystrophy-dystroglycanopathy (congenital with brain and eye anomalies), type A, 4 Diseases 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000009826 neoplastic cell growth Effects 0.000 description 1
- 210000004126 nerve fiber Anatomy 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000007472 neurodevelopment Effects 0.000 description 1
- 201000008051 neuronal ceroid lipofuscinosis Diseases 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000011164 ossification Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 102000045222 parkin Human genes 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 108010091617 pentalysine Proteins 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 208000023269 peroxisome biogenesis disease Diseases 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000013081 phylogenetic analysis Methods 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000003946 protein process Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- YREYEVIYCVEVJK-UHFFFAOYSA-N rabeprazole Chemical compound COCCCOC1=CC=NC(CS(=O)C=2NC3=CC=CC=C3N=2)=C1C YREYEVIYCVEVJK-UHFFFAOYSA-N 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 101150024074 rub1 gene Proteins 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000005062 synaptic transmission Effects 0.000 description 1
- 206010042772 syncope Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000010809 targeting technique Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 230000004143 urea cycle Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 229940124549 vasodilator Drugs 0.000 description 1
- 239000003071 vasodilator agent Substances 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/01—Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/12—Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
- C12N2310/122—Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/10—Applications; Uses in screening processes
- C12N2320/11—Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2810/00—Vectors comprising a targeting moiety
- C12N2810/50—Vectors comprising as targeting moiety peptide derived from defined protein
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Virology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 표적 서열의 서열 및/또는 활성의 조작을 위한 시스템, 방법 및 조성물을 제공한다. 일부가 CRISPR 복합체의 하나 이상의 성분을 인코딩하는 벡터 및 벡터 시스템, 및 이러한 벡터의 설계 및 사용 방법이 제공된다. 또한, 진핵 세포에서 CRISPR 복합체 형성의 유도 방법 및 CRISPR-Cas 시스템을 사용하여 정밀한 돌연변이를 도입함에 의한 특정 세포의 선택 방법이 제공된다.
Description
관련 출원 및 참조에 의한 포함
본 출원은 2013년 6월 17일에 출원되고, 명칭이 "ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED COMPOSITIONS FOR SEQUENCE MANIPULATION"인 미국 가출원 제61/836,127호에 대한 우선권을 주장한다. 또한, 본 출원은 각각 2013년 1월 30일; 2013년 2월 25일; 2013년 3월 15일; 2013년 3월 28일; 2013년 4월 20일; 2013년 5월 6일; 및 2013년 5월 28일에 출원되고, 각각의 명칭이 "ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION"인 미국 가출원 제61/758,468호; 제61/769,046호; 제61/802,174호; 제61/806,375호; 제61/814,263호; 제61/819,803호 및 제61/828,130호에 대한 우선권을 주장한다. 또한, 각각 2012년 12월 12일 및 2013년 1월 2일에 출원되고, 둘 모두 명칭이 "SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION"인 미국 가출원 제61/736,527호 및 제61/748,427호에 대한 우선권을 주장한다. 또한, 각각 2013년 3월 15일 및 2013년 6월 17일에 출원되고, 둘 모두 명칭이 BI-2011/008/44790.02.2003 및 BI-2011/008/44790.03.2003인 미국 가출원 제61/791,409호 및 제61/835,931호에 대한 우선권을 주장한다.
또한, 각각 2013년 6월 17일에 출원된 미국 가출원 제61/835,936호, 제61/836,101호, 제61/836,080호, 제61/836,123호 및 제61/835,973호를 참조한다.
전술한 출원, 및 상기 출원에 또는 상기 출원의 절차 중에 인용된 모든 문헌("출원 인용 문헌") 및 상기 출원 인용 문헌에 인용되거나 참고된 모든 문헌, 및 본원에서 인용되거나 참고된 모든 문헌("본원 인용 문헌") 및 본원 인용 문헌에 인용되거나 참고된 모든 문헌은, 본원에 언급되거나 본원에 참고로 포함된 임의의 문헌에 언급된 임의의 제품에 대한 임의의 제조사의 지침서, 설명서, 제품 명세서 및 제품 시트(sheet)와 함께, 본원에 참고로 포함되어 있으며, 그리고 본 발명의 실시에 사용될 수 있다. 더욱 구체적으로, 모든 참조된 문헌은 마치 각각의 개별 문헌을 참고로 포함하는 것으로 특정적으로 그리고 개별적으로 나타내는 것과 동일한 정도로 참고로 포함된다.
기술 분야
본 발명은 일반적으로 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats; CRISPR) 및 그의 성분과 관련된 벡터 시스템을 사용할 수 있는 게놈 변동(genomic perturbation) 또는 유전자-교정(gene-editing)과 같이 서열 표적화를 수반하는 유전자 발현의 제어를 위해 사용되는 시스템, 방법 및 조성물에 관한 것이다.
연방 정부가 후원하는 연구에 대한 성명
본 발명은 미국 국립 보건원(National Institutes of Health)에 의해 지급된 정부 지원, NIH 파이오니어 어워드(Pioneer Award) DP1MH100706으로 수행되었다. 정부는 본 발명에 소정의 권리를 갖는다.
게놈 시퀀싱(sequencing) 기술 및 분석 방법의 최근의 진전에 의해, 다양한 생물학적 기능 및 질병(disease)과 관련된 유전적 요인을 분류하고 발견하는 능력이 상당히 가속화되었다. 개별 유전 요소의 선택적 변동을 가능하게 함으로써 원인이 되는 유전 변이의 체계적인 역의 조작을 가능하게 할 뿐 아니라, 합성 생물학, 생명공학 및 의학 응용을 진전시키기 위하여, 정밀한 게놈 표적화 기술이 필요하다. 게놈-교정 기술, 예를 들어, 디자이너 징크 핑거, 전사 활성화제-유사 이펙터(effector)(TALE) 또는 귀소 메가뉴클레아제(homing meganuclease)가 표적화된 게놈 변동을 생성하는데 이용가능하지만, 가격이 알맞고, 설립하기 용이하며, 확대가능하고, 진핵 게놈 내의 다수의 위치를 표적화하는데 부합되는 새로운 게놈 조작 기술이 필요하다.
발명의 요약
다수의 응용에서 대안의 강력한 서열 표적화 시스템 및 기술이 긴급하게 필요하다. 본 발명은 이러한 요구를 다루며, 관련 이점을 제공한다. CRISPR/Cas 또는 CRISPR-Cas 시스템(두 용어 모두는 본 출원에서 상호교환가능하게 사용된다)은 특정 서열을 표적화하기 위해 맞춤형 단백질의 생성을 필요로 하지 않고, 오히려, 단일의 Cas 효소가 짧은 RNA 분자에 의해 프로그램화되어, 특정 DNA 표적을 인식할 수 있으며, 다시 말하면, Cas 효소는 상기 짧은 RNA 분자를 사용하여 특정 DNA 표적에 동원될 수 있다. 게놈 시퀀싱(sequencing) 기술 및 분석 방법의 레퍼토리에 CRISPR-Cas 시스템을 부가하면, 방법을 상당히 단순화시킬 수 있으며, 다양한 생물학적 기능 및 질병과 관련된 유전적 요인을 분류하고 발견하는 능력을 가속화시킬 수 있다. 유해 영향 없이 게놈 교정을 위해 효율적으로 CRISPR-Cas 시스템을 사용하기 위하여, 조작의 양태, 및 청구된 발명의 양태인 이들 게놈 조작 도구의 최적화를 이해하는 것이 중요하다.
일 양태에서, 본 발명은 하나 이상의 벡터를 포함하는 벡터 시스템을 제공한다. 일부 구현예에서, 시스템은 (a) tracr 메이트(mate) 서열, 및 tracr 메이트 서열의 상류에 하나 이상의 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동가능하게 연결된 제1 조절 요소로서, 상기 가이드 서열은 발현되는 경우, 세포, 예를 들어, 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하고, 상기 CRISPR 복합체는 (1) 상기 표적 서열에 혼성화되는 가이드 서열, 및 (2) 상기 tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화된 CRISPR 효소를 포함하는 제1 조절 요소; 및 (b) 핵 국소화 서열을 포함하는 상기 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함하며; 성분 (a) 및 (b)는 상기 시스템의 동일한 또는 상이한 벡터에 위치한다. 일부 구현예에서, 성분 (a)는 제1 조절 요소의 제어 하에 tracr 메이트 서열의 하류의 tracr 서열을 더 포함한다. 일부 구현예에서, 성분 (a)는 제1 조절 요소에 작동가능하게 연결된 2개 이상의 가이드 서열을 더 포함하며, 2개 이상의 가이드 서열의 각각은 발현되는 경우, 진핵 세포 내의 상이한 표적 서열로의 CRISPR 복합체의 서열 특이적 결합을 지시한다. 일부 구현예에서, 상기 시스템은 제3 조절 요소, 예를 들어, 중합효소 III 프로모터의 제어 하에 tracr 서열을 포함한다. 일부 구현예에서, tracr 서열은 최적으로 정렬되는 경우, tracr 메이트 서열의 길이를 따라 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 99%의 서열 상보성을 나타낸다. 일부 구현예에서, CRISPR 복합체는 진핵 세포의 핵에서 검출가능한 양으로 상기 CRISPR 복합체의 축적을 유도하기에 충분한 세기의 하나 이상의 핵 국소화 서열을 포함한다. 이론에 구속되지 않으면서, 핵 국소화 서열은 진핵생물에서 CRISPR 복합체 활성에 필요하지 않지만, 이러한 서열을 포함하여, 시스템의 활성을 증진시켜, 특히 핵 내의 핵산 분자를 표적화하는 것으로 여겨진다. 일부 구현예에서, CRISPR 효소는 II형 CRISPR 시스템 효소이다. 일부 구현예에서, CRISPR 효소는 Cas9 효소이다. 일부 구현예에서, Cas9 효소는 사카로마이세스 뉴모니애(S. pneumoniae), 스트렙토코커스 피오게네스(S. pyogenes) 또는 스트렙토코커스 써모필러스(S. thermophilus) Cas9이며, 이들 유기체로부터 유래된 돌연변이된 Cas9를 포함할 수 있다. 효소는 Cas9 상동체 또는 오솔로그(ortholog)일 수 있다. 일부 구현예에서, CRISPR 효소는 진핵 세포에서의 발현을 위해 코돈-최적화된다. 일부 구현예에서, CRISPR 효소는 표적 서열의 위치에서 1개 또는 2개 가닥의 절단을 유도한다. 일부 구현예에서, CRISPR 효소에는 DNA 가닥 절단 활성이 결여된다. 일부 구현예에서, 제1 조절 요소는 중합효소 III 프로모터이다. 일부 구현예에서, 제2 조절 요소는 중합효소 II 프로모터이다. 일부 구현예에서, 가이드 서열은 적어도 15, 16, 17, 18, 19, 20, 25개 뉴클레오티드 또는 10 내지 30개 또는 15 내지 25개 또는 15 내지 20개 뉴클레오티드 길이이다. 일반적으로, 그리고 본원에서, 용어 "벡터"는 그것이 연결된 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터는 단일-가닥, 이중-가닥 또는 부분 이중-가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하거나, 자유 말단을 포함하지 않는(예를 들어, 환형) 핵산 분자; DNA, RNA 또는 둘 모두를 포함하는 핵산 분자; 및 당업계에 공지되어 있는 다른 종류의 폴리뉴클레오티드를 포함하나 이들에 한정되지 않는다. 하나의 유형의 벡터는 "플라스미드"이며, 이는 추가의 DNA 세그먼트가 예를 들어, 표준 분자 클로닝 기술에 의해 삽입될 수 있는 환형 이중 가닥 DNA 루프를 지칭한다. 다른 유형의 벡터는 바이러스 벡터이며, 여기서, 바이러스-유래 DNA 또는 RNA 서열은 바이러스(예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스 및 아데노-관련 바이러스)로의 패키징을 위한 벡터에 존재한다. 또한, 바이러스 벡터는 숙주 세포로의 트랜스펙션(transfection)을 위해 바이러스가 지니는 폴리뉴클레오티드도 포함한다. 특정 벡터(예를 들어, 박테리아 복제 원점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터)는 그들이 도입되는 숙주 세포에서 자가 복제할 수 있다. 기타 벡터(예를 들어, 비-에피솜 포유동물 벡터)는 숙주 세포로의 도입시에 숙주 세포의 게놈으로 통합되며, 이에 의해, 숙주 게놈과 함께 복제된다. 게다가, 특정 벡터는 그들이 작동가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터는 본원에서 "발현 벡터"로 지칭된다. 재조합 DNA 기술에 유용한 통상적인 발현 벡터는 종종 플라스미드의 형태로 존재한다.
재조합 발현 벡터는 숙주 세포에서의 핵산의 발현에 적절한 형태의 본 발명의 핵산을 포함할 수 있으며, 이는 재조합 발현 벡터가, 발현을 위해 사용될 숙주 세포에 기초하여 선택될 수 있는, 발현될 핵산 서열에 작동가능하게 연결된 하나 이상의 조절 요소를 포함하는 것을 의미한다. 재조합 발현 벡터 내에서, "작동가능하게 연결된"은 대상 뉴클레오티드 서열이 (예를 들어, 시험관내 전사/번역 시스템 내에서, 또는 벡터가 숙주 세포 내로 도입되는 경우 숙주 세포 내에서) 뉴클레오티드 서열의 발현을 가능하게 하는 방식으로 조절 요소(들)에 연결된 것을 의미하는 의도이다.
용어 "조절 요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위(internal ribosomal entry site; IRES) 및 기타 발현 제어 요소(예를 들어, 전사 종결 신호, 예를 들어, 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 의도이다. 이러한 조절 요소는 예를 들어, 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 기술되어 있다. 조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 유도하는 조절 요소 및 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 유도하는 조절 요소(예를 들어, 조직-특이적 조절 서열)를 포함한다. 조직-특이적 프로모터는 요망되는 대상 조직, 예를 들어, 근육, 뉴런, 뼈, 피부, 혈액, 특정 기관(예를 들어, 간, 췌장) 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 유도할 수 있다. 또한, 조절 요소는 시간-의존적 방식으로, 예를 들어, 세포-주기 의존적 또는 발생 단계-의존적 방식으로 발현을 유도할 수 있으며, 이는 조직 또는 세포-유형에 특이적이거나 그렇지 않을 수 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터(예를 들어, 1, 2, 3, 4, 5개 또는 그 이상의 pol III 프로모터), 하나 이상의 pol II 프로모터(예를 들어, 1, 2, 3, 4, 5개 또는 그 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터(예를 들어, 1, 2, 3, 4, 5개 또는 그 이상의 pol I 프로모터) 또는 그들의 조합을 포함한다. pol III 프로모터의 예에는 U6 및 H1 프로모터가 포함되나 이들에 한정되지 않는다. pol II 프로모터의 예에는 레트로바이러스 라우스 육종 바이러스(RSV) LTR 프로모터(선택적으로 RSV 인핸서가 존재), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서가 존재)[예를 들어, 문헌(Boshart et al, Cell, 41:521-530 (1985)) 참조], SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK) 프로모터 및 EF1α 프로모터가 포함되나 이들에 한정되지 않는다. 또한, 용어 "조절 요소"에는 인핸서 요소, 예를 들어, WPRE; CMV 인핸서; HTLV-I의 LTR 내의 R-U5' 세그먼트(문헌[Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988]); SV40 인핸서; 및 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열(문헌[Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981])이 포함된다. 발현 벡터의 설계가 형질전환될 숙주 세포의 선택, 요망되는 발현 수준 등과 같은 인자에 따라 달라질 수 있음이 당업자에 의해 인식될 것이다. 벡터를 숙주 세포로 도입하여, 전사물, 본원에 기술된 바와 같은 핵산에 의해 인코딩된 융합 단백질 또는 펩티드를 포함하는 단백질 또는 펩티드(예를 들어, 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR) 전사물, 단백질, 효소, 그의 돌연변이체 형태, 그의 융합 단백질 등)를 생성할 수 있다.
유리한 벡터는 렌티바이러스 및 아데노-관련 바이러스를 포함하며, 또한, 이러한 벡터의 유형은 특정 세포 유형을 표적화하기 위해 선택될 수 있다.
일 양태에서, 본 발명은 하나 이상의 핵 국소화 서열을 포함하는, CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 조절 요소를 포함하는 벡터를 제공한다. 일부 구현예에서, 상기 조절 요소는 상기 CRISPR 효소가 진핵 세포의 핵에서 검출가능한 양으로 축적되도록 진핵 세포에서 CRISPR 효소의 전사를 유도한다. 일부 구현예에서, 조절 요소는 중합효소 II 프로모터이다. 일부 구현예에서, CRISPR 효소는 II형 CRISPR 시스템 효소이다. 일부 구현예에서, CRISPR 효소는 Cas9 효소이다. 일부 구현예에서, Cas9 효소는 스트렙토코커스 뉴모니애, 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스 Cas9이며, 이들 유기체로부터 유래된 돌연변이된 Cas9를 포함할 수 있다. 일부 구현예에서, CRISPR 효소는 진핵 세포에서의 발현을 위해 코돈-최적화된다. 일부 구현예에서, CRISPR 효소는 표적 서열의 위치에서 1개 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, CRISPR 효소는 DNA 가닥 절단 활성이 결여된다.
일 양태에서, 본 발명은 진핵 세포의 핵에서 검출가능한 양의 상기 CRISPR 효소의 축적을 유도하기에 충분한 세기의 하나 이상의 핵 국소화 서열을 포함하는 CRISPR 효소를 제공한다. 일부 구현예에서, CRISPR 효소는 II형 CRISPR 시스템 효소이다. 일부 구현예에서, CRISPR 효소는 Cas9 효소이다. 일부 구현예에서, Cas9 효소는 스트렙토코커스 뉴모니애, 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스 Cas9이며, 이들 유기체로부터 유래된 돌연변이된 Cas9를 포함할 수 있다. 효소는 Cas9 상동체 또는 오솔로그일 수 있다. 일부 구현예에서, CRISPR 효소는 그것이 결합하는 표적 서열의 1개 이상의 가닥을 절단하는 능력이 결여된다.
일 양태에서, 본 발명은 (a) tracr 메이트 서열, 및 tracr 메이트 서열의 상류에 하나 이상의 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동가능하게 연결된 제1 조절 요소로서, 상기 가이드 서열은 발현되는 경우, 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하고, 상기 CRISPR 복합체는 (1) 상기 표적 서열에 혼성화되는 가이드 서열, 및 (2) 상기 tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화된 CRISPR 효소를 포함하는 제1 조절 요소; 및/또는 (b) 핵 국소화 서열을 포함하는 상기 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함하는 진핵 숙주 세포를 제공한다. 일부 구현예에서, 숙주 세포는 성분 (a) 및 (b)를 포함한다. 일부 구현예에서, 성분 (a), 성분 (b) 또는 성분 (a) 및 (b)는 숙주 진핵 세포의 게놈 내로 안정적으로 통합된다. 일부 구현예에서, 성분 (a)는 제1 조절 요소의 제어 하에 tracr 메이트 서열의 하류의 tracr 서열을 더 포함한다. 일부 구현예에서, 성분 (a)는 제1 조절 요소에 작동가능하게 연결된 2개 이상의 가이드 서열을 더 포함하며, 2개 이상의 가이드 서열의 각각은 발현되는 경우, 진핵 세포 내의 상이한 표적 서열로의 CRISPR 복합체의 서열 특이적 결합을 유도한다. 일부 구현예에서, 진핵 숙주 세포는 상기 tracr 서열에 작동가능하게 연결된 제3 조절 요소, 예를 들어, 중합효소 III 프로모터를 더 포함한다. 일부 구현예에서, tracr 서열은 최적으로 정렬되는 경우 tracr 메이트 서열의 길이를 따라 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 99%의 서열 상보성을 나타낸다. 일부 구현예에서, CRISPR 효소는 진핵 세포의 핵에서 검출가능한 양의 상기 CRISPR 효소의 축적을 유도하기에 충분한 세기의 하나 이상의 핵 국소화 서열을 하나 이상 포함한다. 일부 구현예에서, CRISPR 효소는 II형 CRISPR 시스템 효소이다. 일부 구현예에서, CRISPR 효소는 Cas9 효소이다. 일부 구현예에서, Cas9 효소는 스트렙토코커스 뉴모니애, 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스 Cas9이며, 이들 유기체로부터 유래된 돌연변이된 Cas9를 포함할 수 있다. 효소는 Cas9 상동체 또는 오솔로그일 수 있다. 일부 구현예에서, CRISPR 효소는 진핵 세포에서의 발현을 위해 코돈-최적화된다. 일부 구현예에서, CRISPR 효소는 표적 서열의 위치에서 1개 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, CRISPR 효소는 DNA 가닥 절단 활성이 결여된다. 일부 구현예에서, 제1 조절 요소는 중합효소 III 프로모터이다. 일부 구현예에서, 제2 조절 요소는 중합효소 II 프로모터이다. 일부 구현예에서, 가이드 서열은 적어도 15, 16, 17, 18, 19, 20, 25개 뉴클레오티드 또는 10 내지 30개 또는 15 내지 25개 또는 15 내지 20개 뉴클레오티드 길이이다. 일 양태에서, 본 발명은 기술된 구현예 중 임의의 것에 따른 진핵 숙주 세포를 포함하는 비-인간 진핵 유기체; 바람직하게는 다세포 진핵 유기체를 제공한다. 다른 양태에서, 본 발명은 기술된 구현예 중 임의의 것에 따른 진핵 숙주 세포를 포함하는 진핵 유기체; 바람직하게는 다세포 진핵 유기체를 제공한다. 이들 양태의 일부 구현예에서 유기체는 동물; 예를 들어, 포유동물일 수 있다. 또한, 유기체는 절지동물, 예를 들어, 곤충일 수 있다. 또한, 유기체는 식물일 수도 있다. 추가로, 유기체는 진균일 수 있다.
일 양태에서, 본 발명은 본원에 기술된 성분 중 하나 이상을 포함하는 키트를 제공한다. 일부 구현예에서, 키트는 벡터 시스템 및 키트 사용 지침서를 포함한다. 일부 구현예에서, 벡터 시스템은 (a) tracr 메이트 서열, 및 tracr 메이트 서열의 상류에 하나 이상의 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동가능하게 연결된 제1 조절 요소로서, 상기 가이드 서열은 발현되는 경우, 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하고, 상기 CRISPR 복합체는 (1) 상기 표적 서열에 혼성화되는 가이드 서열, 및 (2) 상기 tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화된 CRISPR 효소를 포함하는 제1 조절 요소; 및/또는 (b) 핵 국소화 서열을 포함하는 상기 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함한다. 일부 구현예에서, 키트는 시스템의 동일한 또는 상이한 벡터에 위치한 성분 (a) 및 (b)를 포함한다. 일부 구현예에서, 성분 (a)는 제1 조절 요소의 제어 하에 tracr 메이트 서열의 하류의 tracr 서열을 더 포함한다. 일부 구현예에서, 성분 (a)는 제1 조절 요소에 작동가능하게 연결된 2개 이상의 가이드 서열을 더 포함하며, 2개 이상의 가이드 서열의 각각은 발현되는 경우, 진핵 세포 내의 상이한 표적 서열로의 CRISPR 복합체의 서열 특이적 결합을 유도한다. 일부 구현예에서, 시스템은 상기 tracr 서열에 작동가능하게 연결된 제3 조절 요소, 예를 들어, 중합효소 III 프로모터를 더 포함한다. 일부 구현예에서, tracr 서열은 최적으로 정렬되는 경우 tracr 메이트 서열의 길이를 따라 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 99%의 서열 상보성을 나타낸다. 일부 구현예에서, CRISPR 효소는 진핵 세포의 핵에서 검출가능한 양의 상기 CRISPR 효소의 축적을 유도하기에 충분한 세기의 하나 이상의 핵 국소화 서열을 포함한다. 일부 구현예에서, CRISPR 효소는 II형 CRISPR 시스템 효소이다. 일부 구현예에서, CRISPR 효소는 Cas9 효소이다. 일부 구현예에서, Cas9 효소는 스트렙토코커스 뉴모니애, 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스 Cas9이며, 이들 유기체로부터 유래된 돌연변이된 Cas9를 포함할 수 있다. 효소는 Cas9 상동체 또는 오솔로그일 수 있다. 일부 구현예에서, CRISPR 효소는 진핵 세포에서의 발현을 위해 코돈-최적화된다. 일부 구현예에서, CRISPR 효소는 표적 서열의 위치에서 1개 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, CRISPR 효소는 DNA 가닥 절단 활성이 결여된다. 일부 구현예에서, 제1 조절 요소는 중합효소 III 프로모터이다. 일부 구현예에서, 제2 조절 요소는 중합효소 II 프로모터이다. 일부 구현예에서, 가이드 서열은 적어도 15, 16, 17, 18, 19, 20, 25개 뉴클레오티드 또는 10 내지 30개 또는 15 내지 25개 또는 15 내지 20개 뉴클레오티드 길이이다.
일 양태에서, 본 발명은 진핵 세포에서의 표적 폴리뉴클레오티드의 변경 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하게 하여, 상기 표적 폴리뉴클레오티드의 절단을 초래하여, 표적 폴리뉴클레오티드를 변경시키는 단계를 포함하며, 여기서, CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화된 CRISPR 효소를 포함하며, 상기 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다. 일부 구현예에서, 상기 절단은 상기 CRISPR 효소에 의한, 표적 서열의 위치에서의 1개 또는 2개의 가닥의 절단을 포함한다. 일부 구현예에서, 상기 절단은 감소된 표적 유전자의 전사를 야기한다. 일부 구현예에서, 상기 방법은 외인성 주형 폴리뉴클레오티드와의 상동성 재조합에 의해 상기 절단된 표적 폴리뉴클레오티드를 수복하는 단계를 더 포함하며, 상기 수복은 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 야기한다. 일부 구현예에서, 상기 돌연변이는 표적 서열을 포함하는 유전자로부터 발현되는 단백질의 하나 이상의 아미노산 변화를 야기한다. 일부 구현예에서, 상기 방법은 하나 이상의 벡터를 상기 진핵 세포로 전달하는 단계를 더 포함하며, 하나 이상의 벡터는 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열 및 tracr 서열 중 하나 이상의 발현을 유도한다. 일부 구현예에서, 상기 벡터는 대상체 내의 진핵 세포로 전달된다. 일부 구현예에서, 상기 변경은 세포 배양물 중의 상기 진핵 세포에서 발생한다. 일부 구현예에서, 상기 방법은 상기 변경 전에 상기 진핵 세포를 대상체로부터 분리하는 단계를 더 포함한다. 일부 구현예에서, 상기 방법은 상기 진핵 세포 및/또는 그로부터 유래된 세포를 상기 대상체로 복귀시키는 단계를 더 포함한다.
일 양태에서, 본 발명은 진핵 세포에서의 폴리뉴클레오티드의 발현의 변경 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 폴리뉴클레오티드에 결합하게 하여, 상기 결합이 상기 폴리뉴클레오티드의 증가되거나 감소된 발현을 야기하도록 하는 단계를 포함하며; 여기서, CRISPR 복합체는 상기 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화된 CRISPR 효소를 포함하고, 상기 가이드 서열은 tracr 메이트 서열에 연결되고, tracr 메이트 서열은 차례로 tracr 서열로 혼성화된다. 일부 구현예에서, 상기 방법은 하나 이상의 벡터를 상기 진핵 세포로 전달하는 단계를 더 포함하며, 여기서, 하나 이상의 벡터는 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열 및 tracr 서열 중 하나 이상의 발현을 유도한다.
일 양태에서, 본 발명은 돌연변이된 질병 유전자를 포함하는 모델 진핵 세포의 생성 방법을 제공한다. 일부 구현예에서, 질병 유전자는 질병을 갖거나 질병이 발생할 위험의 증가와 관련된 임의의 유전자이다. 일부 구현예에서, 상기 방법은 (a) 하나 이상의 벡터를 진핵 세포로 도입하는 단계로서, 하나 이상의 벡터는 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열 및 tracr 서열 중 하나 이상의 발현을 유도하는 단계; 및 (b) CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하게 하여, 상기 질병 유전자 내의 표적 폴리뉴클레오티드의 절단을 야기하여, 돌연변이된 질병 유전자를 포함하는 모델 진핵 세포를 생성하는 단계로서, CRISPR 복합체가 (1) 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열, 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하는 단계를 포함한다. 일부 구현예에서, 상기 절단은 상기 CRISPR 효소에 의한, 표적 서열의 위치에서의 1개 또는 2개의 가닥의 절단을 포함한다. 일부 구현예에서, 상기 절단은 표적 유전자의 감소된 전사를 야기한다. 일부 구현예에서, 상기 방법은 외인성 주형 폴리뉴클레오티드와의 상동성 재조합에 의해 상기 절단된 표적 폴리뉴클레오티드를 수복하는 단계를 더 포함하며, 상기 수복은 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 야기한다. 일부 구현예에서, 상기 돌연변이는 표적 서열을 포함하는 유전자로부터의 단백질 발현의 하나 이상의 아미노산 변화를 야기한다.
일 양태에서, 본 발명은 질병 유전자와 관련된 세포 신호전달 사건을 조절하는 생물학적 활성 작용제의 개발 방법을 제공한다. 일부 구현예에서, 질병 유전자는 질병을 갖거나 질병이 발생할 위험의 증가와 관련된 임의의 유전자이다. 일부 구현예에서, 상기 방법은 (a) 시험 화합물을 기술된 구현예 중 임의의 것의 모델 세포와 접촉시키는 단계; 및 (b) 상기 질병 유전자의 상기 돌연변이와 관련된 세포 신호전달 사건의 감소 또는 증가를 나타내는 판독치의 변화를 검출하여, 상기 질병 유전자와 관련된 상기 세포 신호전달 사건을 조절하는 상기 생물학적 활성 작용제를 개발하는 단계를 포함한다.
일 양태에서, 본 발명은 tracr 메이트 서열의 상류에 가이드 서열을 포함하는 재조합 폴리뉴클레오티드를 제공하며, 가이드 서열은 발현되는 경우, 진핵 세포에 존재하는 상응하는 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도한다. 일부 구현예에서, 표적 서열은 진핵 세포에 존재하는 바이러스 서열이다. 일부 구현예에서, 표적 서열은 원암유전자(proto-oncogene) 또는 암유전자이다.
일 양태에서, 본 발명은 하나 이상의 돌연변이를 하나 이상의 원핵 세포(들) 내의 유전자에 도입함에 의한 하나 이상의 원핵 세포(들)의 선택 방법을 제공하며, 상기 방법은 하나 이상의 벡터를 원핵 세포(들)로 도입하는 단계로서, 하나 이상의 벡터가 CRISPR 효소, tracr 메이트 서열에 연결된 가이드 서열, tracr 서열 및 교정 주형 중 하나 이상의 발현을 유도하고; 교정 주형이 CRISPR 효소 절단을 없애는 하나 이상의 돌연변이를 포함하는 단계; 선택될 세포(들)에서 교정 주형과 표적 폴리뉴클레오티드의 상동성 재조합을 가능하게 하는 단계; CRISPR 복합체가 표적 폴리뉴클레오티드에 결합되게 하여, 상기 유전자 내의 표적 폴리뉴클레오티드의 절단을 초래하는 단계로서, CRISPR 복합체는 (1) 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하고, 표적 폴리뉴클레오티드로의 CRISPR 복합체의 결합이 세포사를 유도하여, 하나 이상의 돌연변이가 도입된 하나 이상의 원핵 세포(들)가 선택되게 하는 단계를 포함한다. 바람직한 구현예에서, CRISPR 효소는 Cas9이다. 본 발명의 다른 양태에서, 선택될 세포는 진핵 세포일 수 있다. 본 발명의 양태는 선택 마커 또는 반대-선택 시스템을 포함할 수 있는 2-단계 과정을 필요로 하지 않고 특정 세포의 선택을 가능하게 한다.
일부 양태에서, 본 발명은 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열로서, 폴리뉴클레오티드 서열이 (a) 진핵 세포 내의 표적 서열에 혼성화할 수 있는 가이드 서열, (b) tracr 메이트 서열, 및 (c) tracr 서열을 포함하고, (a), (b) 및 (c)가 5'에서 3' 배향으로 배열되고, 전사되는 경우, tracr 메이트 서열이 tracr 서열에 혼성화되고, 가이드 서열이 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며, CRISPR 복합체가 (1) 표적 서열에 혼성화되는 가이드 서열, 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하는 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열,
또는
CRISPR 효소 시스템으로서, 시스템이 I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열에 작동가능하게 연결된 제1 조절 요소로서, 폴리뉴클레오티드 서열이 (a) 진핵 세포 내의 하나 이상의 표적 서열에 혼성화할 수 있는 하나 이상의 가이드 서열, (b) tracr 메이트 서열, 및 (c) 하나 이상의 tracr 서열을 포함하는 제1 조절 요소, 및 II. 적어도 하나 이상의 핵 국소화 서열을 포함하는 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함하는 하나 이상의 벡터를 포함하는 벡터 시스템에 의해 인코딩되고, 여기서, (a), (b) 및 (c)가 5'에서 3' 배향으로 배열되고, 성분 I 및 II가 시스템의 동일한 또는 상이한 벡터에 배치되며, 전사되는 경우, tracr 메이트 서열이 tracr 서열에 혼성화되고, 가이드 서열이 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며, CRISPR 복합체가 (1) 표적 서열에 혼성화되는 가이드 서열, 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하는 CRISPR 효소 시스템, 또는 다중화 CRISPR 효소 시스템으로서, 시스템이 I. (a) 세포 내의 표적 서열에 혼성화할 수 있는 하나 이상의 가이드 서열, 및 (b) 적어도 하나 이상의 tracr 메이트 서열에 작동가능하게 연결된 제1 조절 요소, II. CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소, 및 III. tracr 서열에 작동가능하게 연결된 제3 조절 요소를 포함하는 하나 이상의 벡터를 포함하는 벡터 시스템에 의해 인코딩되고, 성분 I, II 및 III이 시스템의 동일한 또는 상이한 벡터에 배치되고, 전사되는 경우, tracr 메이트 서열이 tracr 서열에 혼성화되고, 가이드 서열이 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며, CRISPR 복합체가 (1) 표적 서열에 혼성화되는 가이드 서열, 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하고, 다중화 시스템에서, 다중의 가이드 서열 및 단일의 tracr 서열이 사용되며, 가이드, tracr 및 tracr 메이트 서열 중 하나 이상을 변형시켜 안정성을 향상시킨 다중화 CRISPR 효소 시스템을 포함하는 비-천연 발생 또는 조작된 조성물을 제공한다.
본 발명의 양태에서, 변형은 조작된 2차 구조를 포함한다. 예를 들어, 변형은 tracr 메이트 서열과 tracr 서열 사이의 혼성화 영역의 감소를 포함할 수 있다. 예를 들어, 변형은 인공 루프를 통해 tracr 메이트 서열과 tracr 서열을 융합시키는 것을 포함할 수도 있다. 변형은 40 내지 120 bp의 길이를 갖는 tracr 서열을 포함할 수 있다. 본 발명의 구현예들에 있어서, tracr 서열은 40 bp 내지 전장의 tracr이다. 특정 구현예에서, tracRNA의 길이는 적어도 뉴클레오티드 1 내지 67, 일부 구현예에서, 적어도 야생형 tracRNA의 뉴클레오티드 1 내지 85를 포함한다. 일부 구현예에서, 적어도 야생형 스트렙토코커스 피오게네스 Cas9 tracRNA의 뉴클레오티드 1 내지 67 또는 1 내지 85에 상응하는 뉴클레오티드가 사용될 수 있다. CRISPR 시스템이 Cas9 이외의 또는 SpCas9 이외의 효소를 사용하는 경우, 관련 야생형 tracRNA에 상응하는 뉴클레오티드가 존재할 수 있다. 일부 구현예에서, tracRNA의 길이는 야생형 tracRNA의 뉴클레오티드 1 내지 67 또는 1 내지 85 이하를 포함한다. 변형은 서열 최적화를 포함할 수 있다. 특정 양태에서, 서열 최적화는 tracr 및/또는 tracr 메이트 서열 내의 폴리T 서열의 발생의 감소를 포함할 수 있다. 서열 최적화는 tracr 메이트 서열과 tracr 서열 사이의 혼성화의 영역의 감소; 예를 들어, 감소된 길이의 tracr 서열과 조합될 수 있다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 tracr 및/또는 tracr 메이트 서열 내의 폴리T 서열의 감소를 포함한다. 본 발명의 일부 양태에서, 관련 야생형 서열의 폴리-T 서열에 존재하는 하나 이상의 T(즉, 3, 4, 5, 6개 이상의 연속 T 염기의 스트레치; 일부 구현예에서, 10, 9, 8, 7, 6개 이하의 연속 T 염기의 스트레치)는 비-T 뉴클레오티드, 예를 들어, A로 치환되어, 스트링이 더 작은 T의 스트레치로 파단되고, 각 스트레치가 4개 또는 4개 미만(예를 들어, 3 또는 2개)의 연속 T를 갖게 할 수 있다. A 이외의 염기, 예를 들어, C 또는 G, 또는 비-천연 발생 뉴클레오티드 또는 변형된 뉴클레오티드가 치환을 위해 사용될 수 있다. T의 스트링이 헤어핀(또는 스템 루프)의 형성에 수반된다면, 비-T 염기에 상보적인 염기가 비-T 뉴클레오티드에 상보적이도록 변경되는 것이 유리하다. 예를 들어, 비-T 염기가 A라면, 예를 들어, 2차 구조를 보존하거나 그의 보존을 돕기 위하여 그의 상보물은 T로 변경될 수 있다. 예를 들어, 5'-TTTTT는 5'-TTTAT가 되도록 변경될 수 있고, 상보적인 5'-AAAAA는 5'-ATAAA로 변경될 수 있다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 폴리T 종결자 서열을 부가하는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 tracr 및/또는 tracr 메이트 서열에 폴리T 종결자 서열을 부가하는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 가이드 서열에 폴리T 종결자 서열을 부가하는 것을 포함한다. 폴리T 종결자 서열은 5개, 또는 5개 초과의 연속 T 염기를 포함할 수 있다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 루프 및/또는 헤어핀을 변경시키는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 가이드 서열에 최소 2개의 헤어핀을 제공하는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 tracr과 tracr 메이트(직접 반복부) 서열 간의 상보성에 의해 형성되는 헤어핀을 제공하는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 tracrRNA 서열의 3' 말단에서 또는 그를 향하여 하나 이상의 추가의 헤어핀(들)을 제공하는 것을 포함한다. 예를 들어, 헤어핀은 루프에 의해 연결된 tracRNA 서열 내에 자기 상보적 서열을 제공하여 자기 폴딩으로 헤어핀이 형성되게 함으로써 형성될 수 있다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 가이드 서열의 3'에 부가되는 추가의 헤어핀을 제공하는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 가이드 서열의 5' 말단을 연장시키는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 가이드 서열의 5' 말단에 하나 이상의 헤어핀을 제공하는 것을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 가이드 서열의 5' 말단에 서열(5'-AGGACGAAGTCCTAA)을 부착하는 것을 포함한다. 헤어핀을 형성하는데 적절한 다른 서열은 당업자에게 공지되어 있을 것이며, 본 발명의 특정 양태에서 사용될 수 있다. 본 발명의 일부 양태에서, 적어도 2, 3, 4, 5개 이상의 추가의 헤어핀이 제공된다. 본 발명의 일부 양태에서, 10, 9, 8, 7, 6개 이하의 추가의 헤어핀이 제공된다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 2개의 헤어핀을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 3개의 헤어핀을 포함한다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 최대 5개의 헤어핀을 포함한다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 가교를 제공하는 것 또는 폴리뉴클레오티드 서열에 하나 이상의 변형된 뉴클레오티드를 제공하는 것을 포함한다. 변형된 뉴클레오티드 및/또는 가교는 tracr, tracr 메이트 및/또는 가이드 서열 중 임의의 것 또는 모두에, 및/또는 효소 코딩 서열에 및/또는 벡터 서열에 제공될 수 있다. 변형은 적어도 하나의 비천연 발생 뉴클레오티드 또는 변형된 뉴클레오티드 또는 그의 유사체의 함유를 포함할 수 있다. 변형된 뉴클레오티드는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 변형된 뉴클레오티드는 2'-O-메틸 유사체, 2'-데옥시 유사체 또는 2'-플루오로 유사체를 포함할 수 있다. 핵산 백본이 변형될 수 있으며, 예를 들어, 포스포로티오에이트 백본이 사용될 수 있다. 잠금 핵산(LNA) 또는 브리지드 핵산(BNA)의 사용도 또한 가능할 수 있다. 변형된 염기의 추가의 예에는 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘, 이노신, 7-메틸구아노신이 포함되나 이들에 한정되지 않는다.
상기 변형 중 임의의 것 또는 모두가 별개로, 또는 주어진 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템과 조합하여 제공될 수 있음이 이해될 것이다. 이러한 시스템은 상기 변형 중 1개, 2개, 3개, 4개, 5개 이상을 포함할 수 있다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, CRISPR 효소는 II형 CRISPR 시스템 효소, 예를 들어, Cas9 효소이다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, CRISPR 효소는 1000개 미만의 아미노산 또는 4000개 미만의 아미노산으로 이루어진다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, Cas9 효소는 StCas9 또는 St1Cas9이거나, Cas9 효소는 스트렙토코커스, 캄필로박터(Campylobacter), 니트라티프랙터(Nitratifractor), 스타필로코커스(Staphylococcus), 파비바쿨룸(Parvibaculum), 로세부리아(Roseburia), 네이세리아(Neisseria), 글루코나세토박터(Gluconacetobacter), 아조스피릴룸(Azospirillum), 스파에로카에타(Sphaerochaeta), 락토바실러스(Lactobacillus), 유박테리움(Eubacterium) 또는 코리네박터(Corynebacter) 속으로 이루어진 군으로부터 선택되는 유기체 유래의 Cas9 효소이다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, CRISPR 효소는 표적 서열의 위치에서 둘 모두의 가닥의 절단을 유도하는 뉴클레아제이다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 제1 조절 요소는 중합효소 III 프로모터이다. 일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 제2 조절 요소는 중합효소 II 프로모터이다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 가이드 서열은 적어도 15개의 뉴클레오티드를 포함한다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, 변형은 최적화된 tracr 서열 및/또는 최적화된 가이드 서열 RNA 및/또는 tracr 서열 및/또는 tracr 메이트 서열(들)의 동시-폴드(co-fold) 구조 및/또는 tracr 서열의 2차 구조의 안정화 및/또는 염기-쌍형성의 영역이 감소된 tracr 서열 및/또는 tracr 서열 융합 RNA 요소를 포함하고/거나; 다중화 시스템에서, 하나의 tracer을 포함하고, 복수의 가이드를 포함하는 2개의 RNA, 또는 복수의 키메라를 포함하는 하나의 RNA가 존재한다.
본 발명의 양태에서, 키메라 RNA 구조는 돌연변이유발 연구의 결과에 따라 추가로 최적화된다. 2개 이상의 헤어핀이 있는 키메라 RNA에서, 헤어핀을 안정화시키기 위한 근위 직접 반복부 내의 돌연변이는 CRISPR 복합체 활성의 제거를 야기할 수 있다. 헤어핀을 단축시키거나 안정화시키기 위한 원위 직접 반복부 내의 돌연변이는 CRISPR 복합체 활성에 영향을 미치지 않을 수 있다. 근위 및 원위 반복부 사이의 벌지(bulge) 영역 내의 서열 무작위화는 CRISPR 복합체 활성을 상당히 감소시킬 수 있다. 헤어핀 사이의 링커 영역 내의 단일의 염기 쌍 변화 또는 서열 무작위화는 CRISPR 복합체 활성의 완전한 소실을 야기할 수 있다. 가이드 서열 이후의 제1 헤어핀 뒤에 오는 원위 헤어핀의 헤어핀 안정화는 CRISPR 복합체 활성의 유지 또는 향상을 야기할 수 있다. 따라서, 본 발명의 바람직한 구현예에서, 키메라 RNA 구조는 치료적 전달 옵션 및 다른 용도에 유리할 수 있는 보다 작은 키메라 RNA를 생성함으로써 추가로 최적화될 수 있으며, 이는 원위 직접 반복부를 변경시켜, 헤어핀을 단축시키거나 안정화되게 함으로써 달성될 수 있다. 본 발명의 추가의 바람직한 구현예에서, 키메라 RNA 구조는 원위 헤어핀 중 하나 이상을 안정화시킴으로써 추가로 최적화될 수 있다. 헤어핀의 안정화는 헤어핀을 형성하는데 적절한 서열을 변형시키는 것을 포함할 수 있다. 본 발명의 일부 양태에서, 적어도 2, 3, 4, 5개 이상의 추가의 헤어핀이 제공된다. 본 발명의 일부 양태에서, 10, 9, 8, 7, 6개 이하의 추가의 헤어핀이 제공된다. 본 발명의 일부 양태에서, 안정화는 가교 및 다른 변형일 수 있다. 변형은 적어도 하나의 비천연 발생 뉴클레오티드 또는 변형된 뉴클레오티드 또는 그의 유사체의 함유를 포함할 수 있다. 변형된 뉴클레오티드는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 변형된 뉴클레오티드는 2'-O-메틸 유사체, 2'-데옥시 유사체, 또는 2'-플루오로 유사체를 포함할 수 있다. 핵산 백본이 변형될 수 있으며, 예를 들어, 포스포로티오에이트 백본이 사용될 수 있다. 잠금 핵산(LNA) 또는 브리지드 핵산(BNA)의 사용도 또한 가능할 수 있다. 변형된 염기의 추가의 예는 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘, 이노신, 7-메틸구아노신을 포함하나 이들에 한정되지 않는다.
일 양태에서, 본 발명은 CRISPR-Cas 시스템 또는 CRISPR 효소 시스템을 제공하며, 여기서, CRISPR 효소는 진핵 세포에서의 발현을 위해 코돈-최적화된다.
따라서, 본 발명의 일부 양태에서, 본 발명의 작제물, 예를 들어, 키메라 작제물에 필요한 tracRNA의 길이는 본질적으로 고정될 필요는 없고, 본 발명의 일부 양태에서, 그것은 40 내지 120 bp, 본 발명의 일부 양태에서, 최대 전장의 tracr, 예를 들어, 본 발명의 일부 양태에서, 박테리아 게놈 내의 전사 종결 신호에 의해 단속되는 tracr의 3' 말단까지 일 수 있다. 특정 구현예에서, tracRNA의 길이는 적어도 야생형 tracRNA의 뉴클레오티드 1 내지 67, 일부 구현예에서, 적어도 뉴클레오티드 1 내지 85를 포함한다. 일부 구현예에서, 적어도 야생형 스트렙토코커스 피오게네스 Cas9 tracRNA의 뉴클레오티드 1 내지 67 또는 1 내지 85에 상응하는 뉴클레오티드가 사용될 수 있다. CRISPR 시스템이 Cas9 이외의 또는 SpCas9 이외의 효소를 사용하는 경우, 관련 야생형 tracRNA 내에 상응하는 뉴클레오티드가 존재할 수 있다. 일부 구현예에서, tracRNA의 길이는 야생형 tracRNA의 뉴클레오티드 1 내지 67 또는 1 내지 85 이하를 포함한다. 서열 최적화(예를 들어, 폴리T 서열의 감소)에 관하여, 예를 들어, tracr 메이트(직접 반복부) 또는 tracrRNA 내부의 T의 스트링에 관하여, 본 발명의 일부 양태에서, 관련 야생형 서열의 폴리-T 서열에 존재하는 하나 이상의 T(즉, 3, 4, 5, 6개 이상의 연속 T 염기의 스트레치; 일부 구현예에서, 10, 9, 8, 7, 6개 이하의 연속 T 염기의 스트레치)는 비-T 뉴클레오티드, 예를 들어, A로 치환되어, 스트링이 보다 적은 T의 스트레치로 파단되고, 각 스트레치가 4개 또는 4개 미만(예를 들어, 3 또는 2개)의 연속 T를 갖게 할 수 있다. T의 스트링이 헤어핀(또는 스템 루프)의 형성에 수반된다면, 비-T 염기에 상보적인 염기가 비-T 뉴클레오티드에 상보적이도록 변경되는 것이 유리하다. 예를 들어, 비-T 염기가 A라면, 예를 들어, 2차 구조를 보존하거나 그의 보존을 돕기 위하여 그의 상보물은 T로 변경될 수 있다. 예를 들어, 5'-TTTTT는 5'-TTTAT가 되도록 변경될 수 있고, 상보적인 5'-AAAAA는 5'-ATAAA로 변경될 수 있다. tracr + tracr 메이트 전사물 내의 폴리T 종결자 서열, 예를 들어, 폴리T 종결자(TTTTT 이상)의 존재에 관하여, 본 발명의 일부 양태에서, 그것이 2개의 RNA(tracr 및 tracr 메이트)에 존재하든지 또는 단일의 가이드 RNA 형태에 존재하든지, 전사물의 말단에 부가되는 것이 유리하다. tracr 및 tracr 메이트 전사물 내의 루프 및 헤어핀에 관하여, 본 발명의 일부 양태에서, 최소 2개의 헤어핀이 키메라 가이드 RNA에 존재하는 것이 유리하다. 제1 헤어핀은 tracr 및 tracr 메이트(직접 반복부) 서열 사이의 상보성에 의해 형성되는 헤어핀일 수 있다. 제2 헤어핀은 tracrRNA 서열의 3' 말단에 존재할 수 있으며, 이는 Cas9와의 상호작용을 위한 2차 구조를 제공할 수 있다. 예를 들어, 본 발명의 일부 양태에서, 가이드 RNA의 안정성을 증가시키기 위하여, 추가의 헤어핀이 가이드 RNA의 3'에 부가될 수 있다. 또한, 본 발명의 일부 양태에서, 가이드 RNA의 5' 말단이 연장될 수 있다. 본 발명의 일부 양태에서, 5' 말단 내의 20 bp를 가이드 서열로 고려할 수 있다. 5' 부분은 연장될 수 있다. 하나 이상의 헤어핀은 5' 부분에 제공될 수 있으며, 예를 들어, 본 발명의 일부 양태에서, 이것은 가이드 RNA의 안정성을 향상시킬 수도 있다. 본 발명의 일부 양태에서, 서열 (5'-AGGACGAAGTCCTAA)을 가이드 서열의 5' 말단에 부착함으로써 특정 헤어핀이 제공될 수 있으며, 본 발명의 일부 양태에서, 이는 안정성의 향상에 도움을 줄 수 있다. 헤어핀을 형성하기에 적절한 다른 서열은 당업자에게 공지되어 있을 것이며, 본 발명의 특정 양태에서 사용될 수 있다. 본 발명의 일부 양태에서, 적어도 2, 3, 4, 5개 이상의 추가의 헤어핀이 제공된다. 본 발명의 일부 양태에서, 10, 9, 8, 7, 6개 이하의 추가의 헤어핀이 제공된다. 또한, 전술한 것은 가이드 서열에 2차 구조를 포함하는 본 발명의 양태를 제공한다. 본 발명의 일부 양태에서, 예를 들어, 안정성을 향상시키기 위한 가교 및 다른 변형이 존재할 수 있다. 변형은 적어도 하나의 비천연 발생 뉴클레오티드 또는 변형된 뉴클레오티드 또는 그의 유사체의 함유를 포함할 수 있다. 변형된 뉴클레오티드는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 변형된 뉴클레오티드는 2'-O-메틸 유사체, 2'-데옥시 유사체 또는 2'-플루오로 유사체를 포함할 수 있다. 핵산 백본이 변형될 수 있으며, 예를 들어, 포스포로티오에이트 백본이 사용될 수 있다. 잠금 핵산(LNA) 또는 브리지드 핵산(BNA)의 사용도 또한 가능할 수 있다. 변형된 염기의 추가의 예에는 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘, 이노신, 7-메틸구아노신이 포함되나 이들에 한정되지 않는다. 이러한 변형 또는 가교는 가이드 서열, 또는 가이드 서열에 인접한 다른 서열에 존재할 수 있다.
따라서, 본 발명의 목적은 발명 내에 해당 출원인이 권리를 보유하고 있는 임의의 선행기술에서 공지된 제품, 그 제품의 제조 절차 또는 그 제품의 사용 방법을 포함하지 않으며, 이로써 임의의 선행기술에서 공지된 제품, 절차 및 방법에 대해서는 권리포기를 개시한다. 또한, 본 발명은 본 발명의 범위 내에 USPTO(35 U.S.C. § 112, 제1 단락) 또는 EPO(EPC의 제83조)의 기재된 사항 및 구현 요건을 충족하지 않는 임의의 제품, 절차 또는 그 제품의 제조 또는 그 제품의 사용 방법을 포함하지 않는 것을 의도로 하며, 이로써 해당 출원인이 권리를 유지하고 있는 임의의 선행기술에서 기재된 제품, 그 제품의 제조 방법 또는 그 제품의 사용 방법에 대한 권리 포기를 개시하는 것을 추가로 언급한다.
본 개시내용 및 특히 청구범위 및/또는 단락에서, "함유한다", "함유된", "함유하는" 등과 같은 용어가 미국 특허법에 귀속되는 의미를 가질 수 있고; 예를 들어, "포함한다", "포함된", "포함하는" 등을 의미할 수 있으며; "본질적으로 이루어지는" 및 "본질적으로 이루어진다"와 같은 용어가 미국 특허법에 귀속되는 의미를 갖고, 예를 들어, 명백하게 열거되지 않는 구성요소를 허용하지만, 선행 기술에서 발견되거나 본 발명의 기본적인 또는 새로운 특징에 영향을 미치는 구성요소를 배제함이 주목된다. 상기 및 기타 구현예는 하기 상세한 설명으로부터 개시되거나, 그로부터 명백하고 그에 의해 포함된다.
본 발명의 신규의 특징은 특히 첨부된 청구범위에 개시되어 있다. 본 발명의 원리가 이용된 예시적인 구현예에 기재되어 있는 하기의 상세한 설명을 참조함으로써 본 발명의 특징 및 장점을 더욱 잘 이해할 것이며, 첨부된 도면은 다음과 같다:
도 1은 CRISPR 시스템의 개략적 모델을 보여준다. 스트렙토코커스 피오게네스 유래의 Cas9 뉴클레아제(황색)는 20-nt 가이드 서열(청색) 및 스캐폴드(적색)로 이루어진 합성 가이드 RNA(sgRNA)에 의해 게놈 DNA에 표적화된다. 가이드 서열은 필수 5'-NGG 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM; 진홍색)의 인접 상류의 DNA 표적(청색)과 염기쌍을 형성하며, Cas9는 PAM의 약 3 bp 상류(적색 삼각형)에서 이중 가닥 파단(DSB)을 매개한다.
도 2a 내지 도 2f는 예시적인 CRISPR 시스템, 가능한 작용 메카니즘, 진핵 세포에서의 발현을 위한 예시적인 적합화, 및 핵 국소화 및 CRISPR 활성을 평가하는 시험의 결과를 예시한다.
도 3A 내지 도 3C는 진핵 세포에서의 CRISPR 시스템 요소의 발현을 위한 예시적인 발현 카세트, 예시적인 가이드 서열의 예측된 구조, 및 진핵 및 원핵 세포에서 측정시 CRISPR 시스템 활성을 예시한다.
도 4a 내지 도 4d는 예시적인 대상체에 대한 SpCas9 특이성의 평가의 결과를 예시한다.
도 5a 내지 도 5g는 예시적인 벡터 시스템 및 진핵 세포에서 상동성 재조합의 유도에서의 그의 사용에 대한 결과를 예시한다.
도 6a 내지 도 6c는 Cas9-매개의 유전자 표적화를 위한 상이한 tracrRNA 전사물의 비교를 예시한다.
도 7a 내지 도 7d는 예시적인 CRISPR 시스템, 진핵 세포에서의 발현을 위한 예시적인 적합화 및 CRISPR 활성을 평가하는 시험의 결과를 예시한다.
도 8A 내지 도 8C는 포유동물 세포 내의 게놈 유전자좌의 표적화를 위한 CRISPR 시스템의 예시적인 조작을 예시한다.
도 9A 및 도 9B는 포유동물 세포에서 crRNA 가공의 노던 블롯(Northern blot) 분석의 결과를 예시한다.
도 10a 내지 도 10c는 키메라 RNA의 개략적 표현 및 진핵 세포에서의 CRISPR 시스템 활성에 대한 서베이어(SURVEYOR) 검정의 결과를 예시한다.
도 11a 및 도 11b는 진핵 세포에서 CRISPR 시스템 활성에 대한 서베이어 검정의 결과의 그래프 표현을 예시한다.
도 12는 가이드 서열, tracr 메이트 서열 및 tracr 서열을 포함하는 예시적인 키메라 RNA에 대한 예측된 2차 구조를 예시한다.
도 13은 Cas 유전자의 계통수이다.
도 14a 내지 도 14f는 3개 그룹의 큰 Cas9(약 1400개 아미노산) 및 2개 그룹의 작은 Cas9(약 1100개 아미노산)를 포함하는 5개 과의 Cas9를 보여주는 계통 분석을 보여준다.
도 15는 상이한 최적화된 가이드 RNA의 기능을 도시하는 그래프를 보여준다.
도 16은 상이한 가이드 키메라 RNA의 서열 및 구조를 보여준다.
도 17은 tracrRNA 및 직접 반복부의 동시-폴드 구조를 보여준다.
도 18a 및 도 18b는 시험관내 St1Cas9 키메라 가이드 RNA 최적화로부터의 데이터를 보여준다.
도 19a 및 도 19b는 SpCas9 세포 용해물에 의한 비메틸화 또는 메틸화 표적 중 어느 하나의 절단을 보여준다.
도 20a 내지 도 20g는 SpCas9-매개의 포유동물 게놈 교정을 위한 가이드 RNA 구조의 최적화를 보여준다. (a) 모든 이후의 실험을 위해 사용된 U6 프로모터-유도 단일의 가이드 RNA(sgRNA) 및 CBh 프로모터-유도 인간 코돈-최적화 스트렙토코커스 피오게네스 Cas9(hSpCas9)에 대한 비시스트로닉 발현 벡터(PX330)의 개략도. sgRNA는 표기된 다양한 위치에서 절단된 20-nt 가이드 서열(청색) 및 스캐폴드(적색)로 이루어진다. (b) 인간 EMX1 및 PVALB 유전자좌에서의 SpCas9-매개의 삽입-결실에 대한 서베이어 검정. 화살표는 예상되는 서베이어 단편을 나타낸다(n = 3). (c) 로딩 대조군으로서 U1과 함께, 4개의 sgRNA 절단 구조에 대한 노던 블롯 분석. (d) SpCas9의 야생형(wt) 또는 닉카아제 돌연변이체(D10A) 둘 모두는 인간 EMX1 유전자로의 HindIII 부위의 삽입을 증진시켰다. 게놈 서열과 비교하여 센스 또는 안티센스 방향 중 어느 하나로 배향된 단일 가닥 올리고뉴클레오티드(ssODN)를 상동성 재조합 주형으로 사용하였다. (e) 인간 SERPINB5 유전자좌의 개략도. sgRNA 및 PAM은 서열 위의 유색 막대에 의해 표기되며; 메틸시토신(Me)은 강조표시되어 있으며(분홍색) 및 전사 시작 부위(TSS, +1)와 비교하여 넘버링된다. (f) 16개 클론의 비설피트 시퀀싱에 의해 검정되는 SERPINB5의 메틸화 상태. 흑색 원, 메틸화된 CpG; 백색 원, 비메틸화된 CpG. (g) 딥 시퀀싱에 의해 검정되는, SERPINB5의 메틸화 영역을 표적화하는 3개의 sgRNA에 의한 변형 효율(n = 2). 오차 막대는 윌슨(Wilson) 간격을 나타낸다(온라인 방법).
도 21a 및 도 21b는 CRISPR-Cas sgRNA 구조의 추가의 최적화를 보여준다. (a) 4개의 추가의 sgRNA 구조, I-IV의 개략도. 각각은 tracrRNA(적색)에 혼성화되는 직접 반복부(DR, 회색)에 연결된 20-nt 가이드 서열(청색)로 이루어진다. 인공 GAAA 스템 루프가 있는 DR-tracrRNA 하이브리드는 표시된 바와 같이 +12 또는 +22에서 절단된다. tracrRNA 절단 위치는 tracrRNA에 대한 이전에 보고된 전사 시작 부위에 따라 넘버링된다. sgRNA 구조 II 및 IV는 그들의 폴리-U 트랙트(tract) 내에 돌연변이를 지니며, 이는 조기성숙 전사 종결자로 사용될 수 있다. (b) 표적 부위 1 내지 3에 대한 인간 EMX1 유전자좌에서의 SpCas9-매개의 삽입-결실에 대한 서베이어 검정. 화살표는 예상되는 서베이어 단편을 나타낸다(n = 3).
도 22는 인간 게놈 내의 일부 표적 부위의 가시화를 예시한다.
도 23A 및 도 23B는 (A) sgRNA의 개략도 및 (B) 절단 효율이 가장 높은 최적으로 절단된 구조에 대한 SaCas9에 대한 5개의 sgRNA 변이체의 서베이어 분석을 보여준다.
본원에서 도면은 오직 예시의 목적을 위한 것이며, 반드시 척도에 따라 도시된 것은 아니다.
상세한 설명
용어 "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", "핵산" 및 "올리고뉴클레오티드"는 상호교환가능하게 사용된다. 그것들은 임의의 길이의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중 어느 하나, 또는 그의 유사체의 중합체 형태를 말한다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 다음은 폴리뉴클레오티드의 비제한적인 예이다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 전령 RNA(mRNA), 운반 RNA, 리보솜 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 분리된 DNA, 임의의 서열의 분리된 RNA, 핵산 프로브 및 프라이머. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드, 예를 들어, 메틸화 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 단속될 수 있다. 폴리뉴클레오티드는 중합화 후에, 예를 들어, 표지화 성분과의 컨쥬게이션에 의해 추가로 변형될 수 있다.
본 발명의 양태에서, 용어 "키메라 RNA", "키메라 가이드 RNA", "가이드 RNA", "단일의 가이드 RNA" 및 "합성 가이드 RNA"는 상호교환가능하게 사용되며, 가이드 서열, tracr 서열 및 tracr 메이트 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 용어 "가이드 서열"은 표적 부위를 지정하는 가이드 RNA 내의 약 20bp 서열을 지칭하며, 용어 "가이드" 또는 "스페이서"와 상호교환가능하게 사용될 수 있다. 또한, 용어 "tracr 메이트 서열"은 용어 "직접 반복부(들)"와 상호교환가능하게 사용될 수 있다.
본원에 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 해당 분야의 용어이며, 그것이 돌연변이체 또는 변이체로부터 구별되는 정도로 천연에서 발생하는 것과 같은 전형적인 형태의 유기체, 균주, 유전자 또는 특징을 의미한다.
본원에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특성의 표현을 의미하는 것으로 이해해야 한다.
용어 "비-천연 발생" 또는 "조작된"은 상호교환가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 언급되는 경우, 핵산 분자 또는 폴리펩티드에 천연에서 천연적으로 관련되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다.
"상보성"은 통상의 왓슨-크릭(Watson-Crick) 염기-쌍형성 또는 기타 비-통상적 유형에 의해 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 상보성 백분율은 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기 쌍형성)을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다(예를 들어, 10개 중 5, 6, 7, 8, 9, 10개는 50%, 60%, 70%, 80%, 90% 및 100% 상보성임). "완전한 상보성"은 핵산 서열의 모든 연속 잔기가 동일한 수의 제2 핵산 서열 내의 연속 잔기와 수소 결합할 것임을 의미한다. 본원에 사용되는 바와 같이, "실질적인 상보성"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50개 이상의 뉴클레오티드의 영역에 걸쳐 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%인 상보성 정도를 지칭하거나, 엄격한 조건 하에서 혼성화하는 2개의 핵산을 지칭한다.
본원에 사용되는 바와 같이, 혼성화를 위한 "엄격한 조건"은 표적 서열에 대하여 상보성을 갖는 핵산 서열이 대개 표적 서열과 혼성화하며, 비-표적 서열에는 실질적으로 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열-의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록, 서열이 그의 표적 서열에 특이적으로 혼성화하는 온도가 더 높아진다. 엄격한 조건의 비제한적인 예는 문헌[Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y.]에 상세히 기재되어 있다.
"혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다. 수소 결합은 왓슨 크릭 염기 쌍형성, 후그스타인(Hoogstein) 결합 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 복합체는 듀플렉스 구조를 형성하는 2개의 가닥, 다중 가닥 복합체를 형성하는 3개 이상의 가닥, 단일의 자가 혼성화 가닥 또는 이들의 임의의 조합을 포함할 수 있다. 혼성화 반응은 PCR의 개시 또는 효소에 의한 폴리뉴클레오티드의 절단과 같은 보다 광범위한 과정에서 하나의 단계를 이룰 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "상보물"로 지칭된다.
CRISPR 시스템의 성분에 관하여, 본원에 사용되는 바와 같은 "안정화" 또는 "안정성의 증가"는 분자의 구조를 보호하거나 안정시키는 것에 관한 것이다. 이는 단일의 또는 다중의 염기 쌍 변화, 헤어핀 수의 증가, 가교, 특정 뉴클레오티드의 스트레치의 파단 및 다른 변형을 포함하는 하나의 돌연변이 또는 돌연변이들의 도입에 의해 달성될 수 있다. 변형은 적어도 하나의 비천연 발생 뉴클레오티드 또는 변형된 뉴클레오티드 또는 그의 유사체의 함유를 포함할 수 있다. 변형된 뉴클레오티드는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 변형된 뉴클레오티드는 2'-O-메틸 유사체, 2'-데옥시 유사체, 또는 2'-플루오로 유사체를 포함할 수 있다. 핵산 백본이 변형될 수 있으며, 예를 들어, 포스포로티오에이트 백본이 사용될 수 있다. 잠금 핵산(LNA) 또는 브리지드 핵산(BNA)의 사용도 또한 가능할 수 있다. 변형된 염기의 추가의 예는 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘, 이노신, 7-메틸구아노신을 포함하나 이들에 한정되지 않는다. 이들 변형은 CRISPR 시스템의 임의의 성분에 적용될 수 있다. 바람직한 구현예에서, 이들 변형은 RNA 성분, 예를 들어, 가이드 RNA 또는 키메라 폴리뉴클레오티드 서열에 이루어진다.
본원에 사용되는 바와 같이, "발현"은 폴리뉴클레오티드가 DNA 주형으로부터 (예를 들어, mRNA 또는 기타 RNA 전사물로) 전사되는 과정 및/또는 이후에 전사된 mRNA가 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 지칭한다. 전사물 및 인코딩된 폴리펩티드는 집합적으로 "유전자 산물"로 지칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된다면, 발현은 진핵 세포에서의 mRNA의 스플라이싱을 포함할 수 있다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 본원에서 임의의 길이의 아미노산의 중합체를 지칭하기 위해 상호교환가능하게 사용된다. 중합체는 선형 또는 분지형일 수 있으며, 그것은 변형된 아미노산을 포함할 수 있고, 그것은 비-아미노산에 의해 단속될 수 있다. 또한, 상기 용어는 변형된 아미노산 중합체, 예를 들어, 이황화 결합 형성, 글리코실화, 지질화(lipidation), 아세틸화, 인산화 또는 임의의 기타 조작, 예를 들어, 표지화 성분과의 컨쥬게이션을 포함한다. 본원에 사용되는 바와 같이, 용어 "아미노산"은 글리신 및 D 또는 L 광학 이성질체 및 아미노산 유사체 및 펩티도미메틱을 포함하는 천연 및/또는 비천연 또는 합성 아미노산을 포함한다.
용어 "대상체", "개체" 및 "환자"는 척추동물, 바람직하게는 포유동물, 더욱 바람직하게는 인간을 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 포유동물은 쥣과, 원숭이, 인간, 농장 동물, 스포츠 동물 및 애완동물을 포함하나 이들에 한정되지 않는다. 생체내에서 수득되거나 시험관내에서 배양된 생물학적 엔티티(entity)의 조직, 세포 및 그들의 자손도 또한 포함된다. 일부 구현예에서, 대상체는 무척추 동물, 예를 들어, 곤충 또는 선충일 수 있는 한편; 다른 경우에, 대상체는 식물 또는 진균일 수 있다.
용어 "치료제", "치료가능한 작용제" 또는 "치료 작용제"는 상호교환가능하게 사용되며, 대상체로의 투여 시에 몇몇 유리한 효과를 부여하는 분자 또는 화합물을 지칭한다. 유리한 효과는 진단적 결정을 가능하게 하는 것; 질병, 증상, 장애 또는 병태의 개선; 질병, 증상, 장애 또는 질환의 발병의 감소 또는 예방; 및 일반적으로 질병, 증상, 장애 또는 병태의 대응을 포함한다.
본원에 사용되는 바와 같이, "치료" 또는 "치료하는" 또는 "완화하는" 또는 "개선하는"은 상호교환가능하게 사용된다. 이들 용어는 치료 이익 및/또는 예방 이익을 포함하나 이들에 한정되지 않는 유리한 또는 요망되는 결과를 수득하는 방법을 지칭한다. 치료 이익은 치료 하의 하나 이상의 질병, 질환 또는 증상의 임의의 치료적으로 유의미한 개선 또는 그에 대한 효과를 의미한다. 예방 이익에 있어서, 조성물은 특정 질병, 질환 또는 증상이 발생할 위험이 있는 대상체에게 또는 질병, 질환 또는 증상이 아직 나타나지 않을지라도, 질병의 하나 이상의 생리학적 증상을 보고하는 대상체에게 투여될 수 있다.
용어 "유효량" 또는 "치료적 유효량"은 유리한 또는 요망되는 결과를 야기하기에 충분한 작용제의 양을 지칭한다. 치료적 유효량은 치료되는 대상체 및 병태, 대상체의 체중 및 연령, 병태의 중증도, 투여 방식 등 중 하나 이상에 따라 달라질 수 있으며, 이는 당업자에 의해 용이하게 결정될 수 있다. 또한, 상기 용어는 본원에 기술된 영상화 방법 중 임의의 것에 의한 검출을 위한 이미지를 제공할 용량에 적용된다. 특정 용량은 선택된 특정 작용제, 뒤따르는 투여 요법, 그것이 다른 화합물과 병용하여 투여되는지 여부, 투여 시기, 영상화되는 조직 및 그것을 운반하는 신체 전달 시스템 중 하나 이상에 따라 달라질 수 있다.
본 발명의 실시는 달리 나타내지 않는 한, 당업계의 기술 내에 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상의 기술을 사용한다. 문헌[Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989)]; 문헌[CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987))]; 시리즈 문헌[METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987))]을 참조한다.
본 발명의 몇몇 양태는 하나 이상의 벡터를 포함하는 벡터 시스템 또는 그와 같은 벡터에 관한 것이다. 벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예를 들어, 에스케리키아 콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포 또는 포유동물 세포에서 발현될 수 있다. 적절한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는 예를 들어, T7 프로모터 조절 서열 및 T7 중합효소를 사용하여 시험관내에서 전사되고 번역될 수 있다.
벡터는 원핵생물에 도입되고, 그에서 증식될 수 있다. 일부 구현예에서, 원핵생물은 진핵 세포로 도입되거나 또는 진핵 세포로 도입되는 벡터의 생성에서 중간체 벡터(예를 들어, 바이러스 벡터 패키징 시스템의 일부로서 플라스미드 증폭)로서 벡터의 카피를 증폭시키기 위해서 사용될 수 있다. 일부 구현예에서, 원핵생물은 벡터의 카피를 증폭시키고, 하나 이상의 핵산을 발현하기 위해, 예를 들어, 숙주 세포 또는 숙주 유기체로의 전달을 위한 하나 이상의 단백질의 공급원을 제공하기 위해 사용된다. 원핵생물에서의 단백질의 발현은 자주 융합 또는 비-융합 단백질 중 어느 하나의 발현을 유도하는 구성성 또는 유도성 프로모터를 함유하는 벡터를 사용하여 에스케리키아 콜라이에서 수행된다. 융합 벡터는 거기에 인코딩된 단백질로, 예를 들어, 재조합 단백질의 아미노 말단으로 수많은 아미노산을 부가한다. 이러한 융합 벡터는 다음과 같은 하나 이상의 목적을 제공할 수 있다: (i) 재조합 단백질의 발현의 증가; (ii) 재조합 단백질의 용해도의 증가; 및 (iii) 친화성 정제에서 리간드로 작용함으로써 재조합 단백질의 정제의 보조. 종종, 융합 발현 벡터에서, 단백질분해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부에 도입되어, 융합 단백질의 정제 이후에 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 한다. 이러한 효소 및 그들의 동족 인식 서열은 인자 Xa, 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX(파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌[Smith and Johnson, 1988. Gene 67: 31-40]), pMAL(미국 매사추세츠주 비벌리 소재의 뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 pRIT5(미국 뉴저지주 피스카타웨이 소재의 파마시아(Pharmacia))를 포함하며, 이는 각각 글루타티온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질 또는 단백질 A를 표적 재조합 단백질에 융합시킨다.
적절한 유도성 비-융합 에스케리키아 콜라이 발현 벡터의 예는 pTrc(문헌[Amrann et al., (1988) Gene 69:301-315]) 및 pET 11d(문헌[Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89])를 포함한다.
일부 구현예에서, 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비지애에서의 발현을 위한 벡터의 예에는 pYepSec1(문헌[Baldari, et al., 1987. EMBO J. 6: 229-234]), pMFa(문헌[Kuijan and Herskowitz, 1982. Cell 30: 933-943]), pJRY88(문헌[Schultz et al., 1987. Gene 54: 113-123]), pYES2(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션) 및 picZ(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션)가 포함된다.
일부 구현예에서, 벡터는 배큘로바이러스 발현 벡터를 사용하여 곤충 세포에서 단백질 발현을 유도한다. 배양된 곤충 세포(예를 들어, SF9 세포)에서 단백질의 발현에 이용가능한 배큘로바이러스 벡터는 pAc 시리즈(문헌[Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165]) 및 pVL 시리즈(문헌[Lucklow and Summers, 1989. Virology 170: 31-39])를 포함한다.
일부 구현예에서, 벡터는 포유동물 발현 벡터를 사용하여 포유동물 세포에서 하나 이상의 서열의 발현을 유도할 수 있다. 포유동물 발현 벡터의 예는 pCDM8(문헌[Seed, 1987. Nature 329: 840]) 및 pMT2PC(문헌[Kaufman, et al., 1987. EMBO J. 6: 187-195])를 포함한다. 포유동물 세포에서 사용되는 경우, 발현 벡터의 조절 기능은 전형적으로 하나 이상의 조절 요소에 의해 제공된다. 예를 들어, 통상적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스, 유인원 바이러스 40 및 본원에 개시되고 당업계에 공지되어 있는 기타의 것으로부터 유래된다. 원핵 및 진핵 세포 둘 모두를 위한 다른 적절한 발현 시스템에 대하여, 예를 들어, 문헌[Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]의 16 및 17장을 참조한다.
일부 구현예에서, 재조합 포유동물 발현 벡터는 특정 세포 유형에서 우선적으로 핵산의 발현을 유도할 수 있다(예를 들어, 핵산을 발현하기 위하여 조직-특이적 조절 요소가 사용됨). 조직-특이적 조절 요소가 해당 분야에 공지되어 있다. 적절한 조직-특이적 프로모터의 비제한적인 예에는 알부민 프로모터(간-특이적; 문헌[Pinkert, et al., 1987. Genes Dev. 1: 268-277]), 림프-특이적 프로모터(문헌[Calame and Eaton, 1988. Adv. Immunol. 43: 235-275]), 특히, T 세포 수용체(문헌[Winoto and Baltimore, 1989. EMBO J. 8: 729-733]) 및 면역글로불린의 프로모터(문헌[Baneiji, et al., 1983. Cell 33: 729-740]; 문헌[Queen and Baltimore, 1983. Cell 33: 741-748]), 뉴런-특이적 프로모터(예를 들어, 신경섬유 프로모터; 문헌[Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477]), 췌장-특이적 프로모터(문헌[Edlund, et al., 1985. Science 230: 912-916]) 및 유선-특이적 프로모터(예를 들어, 유장(milk whey) 프로모터; 미국 특허 제4,873,316호 및 유럽 출원 공개 제264,166호)가 포함된다. 발생-조절 프로모터, 예를 들어, 쥣과 hox 프로모터(문헌[Kessel and Gruss, 1990. Science 249: 374-379]) 및 α-태아단백질 프로모터(문헌[Campes and Tilghman, 1989. Genes Dev. 3: 537-546])도 또한 포함된다.
일부 구현예에서, 조절 요소는 CRISPR 시스템의 하나 이상의 요소에 작동가능하게 연결되어 CRISPR 시스템의 하나 이상의 요소의 발현을 유도한다. 일반적으로, SPIDR(스페이서 산재 직접 반복부)로도 공지되어 있는 CRISPR(클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부)은 통상 특정 박테리아 종에 특이적인 DNA 유전자좌의 과를 구성한다. CRISPR 유전자좌는 에스케리키아 콜라이에서 인식되는 별개의 부류의 산재된 짧은 서열 반복부(SSR) 및 관련 유전자를 포함한다(문헌[Ishino et al., J. Bacteriol., 169:5429-5433 [1987]]; 및 문헌[Nakata et al., J. Bacteriol., 171:3553-3556 [1989]]). 유사한 산재된 SSR이 할로페락스 메디테라네이(Haloferax mediterranei), 스트렙토코커스 피오게네스, 아나바에나(Anabaena) 및 마이코박테리움 튜베르큘로시스(Mycobacterium tuberculosis)에서 확인되었다(문헌[Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]]; 문헌[Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]]; 문헌[Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]]; 및 문헌[Mojica et al., Mol. Microbiol., 17:85-93 [1995]] 참조). CRISPR 유전자좌는 전형적으로 SRSR(규칙적으로 산재된 짧은 반복부(short regularly spaced repeats))로 명명된 반복부의 구조가 다른 SSR과 상이하다(문헌[Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]]; 및 문헌[Mojica et al., Mol. Microbiol., 36:244-246 [2000]]). 일반적으로, 반복부는 실질적으로 고정된 길이를 갖는 독특한 개재 서열에 의해 규칙적으로 산재된 클러스터에 존재하는 짧은 요소이다(상기 문헌[Mojica et al., [2000]]). 반복 서열이 균주들 간에 고도로 보존되어 있지만, 산재된 반복부의 수와 스페이서 영역의 서열은 전형적으로 균주마다 상이하다(문헌[van Embden et al., J. Bacteriol., 182:2393-2401 [2000]]). CRISPR 유전자좌는 아에로피룸(Aeropyrum), 피로바쿨룸(Pyrobaculum), 술폴로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로카르쿨라(Halocarcula), 메타노박테리움(Methanobacterium), 메타노코커스(Methanococcus), 메타노사르시나(Methanosarcina), 메타노피러스(Methanopyrus), 피로코커스(Pyrococcus), 피크로필러스(Picrophilus), 써모플라스마(Thermoplasma), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobacterium), 스트렙토마이세스(Streptomyces), 아퀴펙스(Aquifex), 포르피로모나스(Porphyromonas), 클로로비움(Chlorobium), 써머스(Thermus), 바실러스(Bacillus), 리스테리아(Listeria), 스타필로코커스(Staphylococcus), 클로스트리디움(Clostridium), 써모아나에로박터(Thermoanaerobacter), 마이코플라스마(Mycoplasma), 푸소박테리움(Fusobacterium), 아자쿠스(Azarcus), 크로모박테리움(Chromobacterium), 네이세리아(Neisseria), 니트로소모나스(Nitrosomonas), 데설포비브리오(Desulfovibrio), 게오박터(Geobacter), 믹소코커스(Myxococcus), 캄필로박터, 볼리넬라(Wolinella), 아시네토박터(Acinetobacter), 에르위니아(Erwinia), 에스케리키아, 레지오넬라(Legionella), 메틸로코커스(Methylococcus), 파스퇴렐라(Pasteurella), 포토박테리움(Photobacterium), 살모넬라(Salmonella), 잔토모나스(Xanthomonas), 예르시니아(Yersinia), 트레포네마(Treponema) 및 써모토가(Thermotoga)를 포함하나 이들에 한정되지 않는 40개 초과의 원핵생물에서 확인되었다(예를 들어, 문헌[Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]]; 및 문헌[Mojica et al., [2005]] 참조).
일반적으로, "CRISPR 시스템"은 집합적으로 Cas 유전자를 인코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복부" 및 tracrRNA-가공 부분 직접 반복부 포함), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭) 또는 CRISPR 유전자좌로부터의 기타 서열 및 전사물을 포함하는 CRISPR-관련("Cas") 유전자의 발현에 수반되거나, 그의 활성을 유도하는 전사물 및 다른 요소를 지칭한다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 I형, II형 또는 III형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 내인성 CRISPR 시스템을 포함하는 특정 유기체, 예를 들어, 스트렙토코커스 피오게네스로부터 유래된다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 증진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서로도 지칭)를 특징으로 한다. CRISPR 복합체의 형성의 맥락에서, "표적 서열"은 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 증진시킨다. 본질적으로 완전한 상보성이 필요하지 않지만, 혼성화를 야기하고, CRISPR 복합체의 형성을 증진시키는 충분한 상보성이 존재한다. 표적 서열은 임의의 폴리뉴클레오티드, 예를 들어, DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치한다. 일부 구현예에서, 표적 서열은 진핵 세포의 세포기관, 예를 들어, 미토콘드리아 또는 엽록체 내에 존재할 수 있다. 표적 서열을 포함하는 표적화된 유전자좌로의 재조합을 위해 사용될 수 있는 서열 또는 주형은 "교정 주형" 또는 "교정 폴리뉴클레오티드" 또는 "교정 서열"로 지칭된다. 본 발명의 양태에서, 외인성 주형 폴리뉴클레오티드는 교정 주형으로 지칭될 수 있다. 본 발명의 일 양태에서, 재조합은 상동성 재조합이다.
전형적으로, 내인성 CRISPR 시스템의 맥락에서, CRISPR 복합체(표적 서열에 혼성화되고, 하나 이상의 Cas 단백질과 복합체화되는 가이드 서열을 포함)의 형성은 표적 서열 내의 또는 그 근처의(예를 들어, 그로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50개 이상의 염기쌍 내의) 하나의 또는 둘 모두의 가닥의 절단을 야기한다. 이론에 구속되지 않으면서, 야생형 tracr 서열의 전부 또는 그의 일부(예를 들어, 야생형 tracr 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85개 이상의 뉴클레오티드)를 포함하거나 그로 이루어질 수 있는 tracr 서열은 또한, 가이드 서열에 작동가능하게 연결된 tracr 메이트 서열의 전부 또는 일부로의 tracr 서열의 적어도 일부분에 따른 혼성화에 의해서와 같이 CRISPR 복합체의 일부를 형성할 수 있다. 일부 구현예에서, tracr 서열은 혼성화하고, CRISPR 복합체의 형성에 참여하기에 충분한, tracr 메이트 서열에 대한 상보성을 갖는다. 표적 서열과 마찬가지로, 완전한 상보성이 필요하지 않지만, 작용성이기에 충분한 상보성이 존재하는 것으로 여겨진다. 일부 구현예에서, tracr 서열은 최적으로 정렬되는 경우 tracr 메이트 서열의 길이를 따라 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 99%의 서열 상보성을 갖는다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소의 발현을 유도하는 하나 이상의 벡터는 CRISPR 시스템의 요소의 발현이 하나 이상의 표적 부위에서 CRISPR 복합체의 형성을 유도하도록 숙주 세포 내로 도입된다. 예를 들어, Cas 효소, tracr-메이트 서열에 연결된 가이드 서열 및 tracr 서열은 각각 개별 벡터 상의 개별 조절 요소에 작동가능하게 연결될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현되는 요소 중 둘 이상은 단일의 벡터에서 조합될 수 있으며, 하나 이상의 추가의 벡터는 제1 벡터에 포함되지 않은 CRISPR 시스템의 임의의 성분을 제공한다. 단일의 벡터에서 조합되는 CRISPR 시스템 요소는 임의의 적절한 배향으로 배열될 수 있으며, 예를 들어, 하나의 요소는 제2 요소에 대하여 5'에(그의 "상류"에) 위치하거나 그에 대하여 3'에(그의 "하류"에) 위치한다. 하나의 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일한 가닥 또는 반대 가닥에 위치할 수 있으며, 동일하거나 반대 방향으로 배향될 수 있다. 일부 구현예에서, 단일의 프로모터는 CRISPR 효소를 인코딩하는 전사물 및 하나 이상의 인트론 서열 내에(예를 들어, 각각이 상이한 인트론 내에, 2개 이상이 적어도 하나의 인트론 내에 또는 전부가 단일의 인트론 내에) 매립된 가이드 서열, tracr 메이트 서열(선택적으로 가이드 서열에 작동가능하게 연결), 및 tracr 서열 중 하나 이상의 발현을 유도한다. 일부 구현예에서, CRISPR 효소, 가이드 서열, tracr 메이트 서열 및 tracr 서열이 동일한 프로모터에 작동가능하게 연결되고, 그로부터 발현된다.
일부 구현예에서, 벡터는 하나 이상의 삽입 부위, 예를 들어, 제한 엔도뉴클레아제 인식 서열("클로닝 부위"로도 지칭)을 포함한다. 일부 구현예에서, 하나 이상의 삽입 부위(예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 삽입 부위)는 하나 이상의 벡터의 하나 이상의 서열 요소의 상류 및/또는 하류에 위치한다. 일부 구현예에서, 벡터는 tracr 메이트 서열의 상류에 있고, 선택적으로 tracr 메이트 서열에 작동가능하게 연결된 조절 요소의 하류에 있는 삽입 부위를 포함하여, 삽입 부위로의 가이드 서열의 삽입 후에, 그리고 발현 시에, 가이드 서열이 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하게 한다. 일부 구현예에서, 벡터는 2개 이상의 삽입 부위를 포함하며, 각각의 삽입 부위는 2개의 tracr 메이트 서열 사이에 위치하여, 각 부위에서 가이드 서열의 삽입을 가능하게 한다. 이러한 배열에서, 2개 이상의 가이드 서열은 단일의 가이드 서열의 2개 이상의 카피, 2개 이상의 상이한 가이드 서열 또는 이들의 조합을 포함할 수 있다. 다중의 상이한 가이드 서열이 사용되는 경우, 단일의 발현 작제물을 사용하여 세포 내의 다중의 상이한 상응하는 표적 서열에 CRISPR 활성을 표적화할 수 있다. 예를 들어, 단일의 벡터는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20개 이상의 가이드 서열을 포함할 수 있다. 일부 구현예에서, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 이러한 가이드-서열-함유 벡터가 제공될 수 있으며, 선택적으로 세포로 전달될 수 있다.
일부 구현예에서, 벡터는 CRISPR 효소, 예를 들어, Cas 단백질을 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 조절 요소를 포함한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 이들 효소가 알려져 있으며; 예를 들어, 스트렙토코커스 피오게네스 Cas9 단백질의 아미노산 서열은 수탁 번호 Q99ZW2 하에 스위스프로트(SwissProt) 데이터베이스에서 관찰될 수 있다. 일부 구현예에서, 비변형 CRISPR 효소, 예를 들어, Cas9는 DNA 절단 활성을 갖는다. 일부 구현예에서, CRISPR 효소는 Cas9이며, 스트렙토코커스 피오게네스 또는 스트렙토코커스 뉴모니애로부터의 Cas9일 수 있다. 일부 구현예에서, CRISPR 효소는 표적 서열 내 및/또는 표적 서열의 상보물 내에서와 같은 표적 서열의 위치에서 1개 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, CRISPR 효소는 표적 서열의 처음 또는 마지막 뉴클레오티드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500개 이상의 염기쌍에서 1개 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, 벡터는 상응하는 야생형 효소에 대하여 돌연변이되어, 돌연변이된 CRISPR 효소에 표적 서열을 함유하는 표적 폴리뉴클레오티드의 1개 또는 2개 모두의 가닥의 절단 능력이 결여되게 한 CRISPR 효소를 인코딩한다. 예를 들어, 스트렙토코커스 피오게네스로부터의 Cas9의 RuvC I 촉매 도메인 내에서의 아스파르트산에서 알라닌으로의 치환(D10A)은 Cas9를 둘 모두의 가닥을 절단하는 뉴클레아제에서 닉카아제(단일 가닥 절단)로 전환시킨다. Cas9가 닉카아제가 되게 하는 돌연변이의 다른 예는 제한 없이, H840A, N854A 및 N863A를 포함한다. 일부 구현예에서, Cas9 닉카아제는 가이드 서열(들), 예를 들어, 각각 DNA 표적의 센스 및 안티센스 가닥을 표적화하는 2개의 가이드 서열과 병용하여 사용될 수 있다. 이러한 조합은 둘 모두의 가닥에 닉(nick)이 생기게 하고, NHEJ를 유도하는데 사용되게 한다. 본 발명자들은 돌연변이유발 NHEJ의 유도에서 2개의 닉카아제 표적(즉, DNA의 동일한 위치에, 그러나, 상이한 가닥에 표적화된 sgRNA)의 효능을 입증하였다(데이터 미도시). 단일의 닉카아제(단일의 sgRNA가 있는 Cas9-D10A)는 NHEJ를 유도하고, 삽입-결실을 생성할 수 없지만, 본 발명자들은 이중 닉카아제(Cas9-D10A 및 동일한 위치에서 상이한 가닥에 표적화된 2개의 sgRNA)가 인간 배아 줄기 세포(hESC)에서 그럴 수 있음을 보였다. 효율은 hESC에서 뉴클레아제(즉, D10 돌연변이가 없는 보통의 Cas9)의 약 50%이다.
추가의 예로서, Cas9의 2개 이상의 촉매 도메인(RuvC I, RuvC II 및 RuvC III)을 돌연변이시켜, 모든 DNA 절단 활성이 실질적으로 결여된 돌연변이된 Cas9를 생성할 수 있다. 일부 구현예에서, D10A 돌연변이를 H840A, N854A 또는 N863A 돌연변이 중 하나 이상과 조합하여, 모든 DNA 절단 활성이 실질적으로 결여된 Cas9 효소를 생성한다. 일부 구현예에서, CRISPR 효소는 돌연변이된 효소의 DNA 절단 활성이 비-돌연변이 형태에 대하여 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하인 경우 모든 DNA 절단 활성이 실질적으로 결여된 것으로 여겨진다. 다른 돌연변이가 유용할 수 있으며; 여기서, Cas9 또는 다른 CRISPR 효소는 스트렙토코커스 피오게네스 이외의 종으로부터의 것이며, 유사한 효과를 달성하기 위하여 상응하는 아미노산의 돌연변이가 이루어질 수 있다.
일부 구현예에서, CRISPR 효소를 인코딩하는 효소 코딩 서열은 특정 세포, 예를 들어, 진핵 세포에서의 발현을 위해 코돈 최적화된다. 진핵 세포는 인간, 마우스, 랫트, 토끼, 개 또는 비인간 영장류를 포함하나 이들에 한정되지 않는 특정 유기체, 예를 들어, 포유동물의 것이거나 그로부터 유래될 수 있다. 일반적으로, 코돈 최적화는 고유 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노산 서열을 유지함으로써 대상 숙주 세포에서의 발현의 증진을 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 나타낸다. 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 전령 RNA(mRNA)의 번역의 효율과 상호관련되며, 이는 차례로, 다른 것들 중에, 번역되는 코돈의 특성 및 특정 운반 RNA(tRNA) 분자의 이용가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는 예를 들어, "코돈 사용 데이터베이스"에서 용이하게 이용가능하며, 이들 표는 다수의 방식으로 적합하게 될 수 있다. 문헌[Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)]을 참조한다. 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘도 또한 이용가능하며, 예를 들어, 진 포르지(Gene Forge)(압타젠(Aptagen); 미국 펜실베니아주 야코부스)도 또한 이용가능하다. 일부 구현예에서, CRISPR 효소를 인코딩하는 효소 내의 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상 또는 모든 코돈)은 특정 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 상응한다.
일부 구현예에서, 벡터는 하나 이상의 핵 국소화 서열(NLS), 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS를 포함하는 CRISPR 효소를 인코딩한다. 일부 구현예에서, CRISPR 효소는 아미노-말단에 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS, 카르복시-말단에 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS, 또는 이들의 조합(예를 들어, 아미노 말단에 하나 이상의 NLS 및 카르복시 말단에 하나 이상의 NLS)을 포함한다. 1개 초과의 NLS가 존재하는 경우, 각각은 단일의 NLS가 1개 초과의 카피로 존재하고/거나 1개 이상의 카피로 존재하는 하나 이상의 다른 NLS와 함께 존재할 수 있도록 다른 것들로부터 독립적으로 선택될 수 있다. 본 발명의 바람직한 구현예에서, CRISPR 효소는 최대 6개의 NLS를 포함한다. 일부 구현예에서, NLS는 NLS의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 쇄를 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50개 이상의 아미노산 내에 존재하는 경우 N- 또는 C-말단 근처에 있는 것으로 여겨진다. 전형적으로, NLS는 단백질 표면에 노출된 양으로 하전된 라이신 또는 아르기닌이 있는 하나 이상의 짧은 서열로 이루어지나, 다른 유형의 NLS이 알려져 있다. NLS의 비제한적인 예는 하기로부터 유래된 NLS 서열을 포함한다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK.
일반적으로, 하나 이상의 NLS는 진핵 세포의 핵에서 검출가능한 양의 CRISPR 효소의 축적을 유도하기에 충분한 세기의 것이다. 일반적으로, 핵 국소화 활성의 세기는 CRISPR 효소 내의 NLS의 수, 사용되는 특정 NLS(들) 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵에서의 축적의 검출은 임의의 적절한 기술에 의해 수행될 수 있다. 예를 들어, 검출가능한 마커는 예를 들어, 핵의 위치를 검출하기 위한 수단(예를 들어, 핵에 특이적인 염색제, 예를 들어, DAPI)과 함께 세포 내의 위치가 가시화될 수 있도록 CRISPR 효소에 융합될 수 있다. 검출가능한 마커의 예는 형광 단백질(예를 들어, 녹색 형광 단백질 또는 GFP; RFP; CFP) 및 에피토프 태그(HA 태그, flag 태그, SNAP 태그)를 포함한다. 또한, 세포 핵을 세포로부터 분리할 수 있으며, 그 다음, 그의 내용물을 단백질을 검출하기 위한 임의의 적절한 과정, 예를 들어, 면역조직화학, 웨스턴 블롯 또는 효소 활성 검정에 의해 분석할 수 있다. 또한, 핵에서의 축적은 예를 들어, CRISPR 효소 또는 복합체에 노출되지 않거나, 하나 이상의 NLS가 결여된 CRISPR 효소에 노출된 대조군과 비교하여, 간접적으로, 예를 들어, CRISPR 복합체 형성의 영향에 대한 검정(예를 들어, 표적 서열에서의 DNA 절단 또는 돌연변이에 대한 검정, 또는 CRISPR 복합체 형성 및/또는 CRISPR 효소 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 검정)에 의해 결정될 수 있다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기에 충분한, 표적 폴리뉴클레오티드 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 버로우즈-휠러 트랜스폼(Burrows-Wheeler Transform)에 기초한 알고리즘(예를 들어, 버로우즈 휠러 얼라이너(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, 노보얼라인(Novoalign)(노보크라프트 테크놀로지즈(Novocraft Technologies), ELAND(일루미나(Illumina), 미국 캘리포니아주 샌 디에고), SOAP(soap.genomics.org.cn에서 이용가능) 및 Maq(maq.sourceforge.net에서 이용가능)를 포함한다. 일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이이다. 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적절한 검정에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은 예를 들어, CRISPR 서열의 성분을 인코딩하는 벡터로의 트랜스펙션 후에, 예를 들어, 본원에 기술된 바와 같은 서베이어 검정에 의한 표적 서열 내의 우선적인 절단의 평가에 의해서와 같이, 상응하는 표적 서열을 갖는 숙주 세포로 제공될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 비율을 비교함으로써 시험관에서 평가될 수 있다. 다른 검정이 가능하며, 당업자에게 떠오를 것이다.
가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내의 서열이다. 예시적인 표적 서열은 표적 게놈에서 독특한 것들을 포함한다. 예를 들어, 스트렙토코커스 피오게네스 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGG(N은 A, G, T 또는 C이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGG(N은 A, G, T 또는 C이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 써모필러스 CRISPR1 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXXAGAAW의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXXAGAAW(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXXAGAAW의 스트렙토코커스 써모필러스 CRISPR1 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXXAGAAW(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 피오게네스 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGGXG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGGXG(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGGXG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGGXG(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 이들 서열 각각에서, "M"은 A, G, T 또는 C일 수 있으며, 서열을 독특한 것으로 확인하는데 고려될 필요는 없다.
일부 구현예에서, 가이드 서열은 가이드 서열 내의 2차 구조의 정도를 감소시키기 위해 선택된다. 2차 구조는 임의의 적절한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스(Gibbs) 자유 에너지의 계산에 기초한다. 이러한 알고리즘의 일 예는 문헌[Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148)]에 기술된 바와 같은 mFold이다. 다른 예시적인 폴딩 알고리즘은 센트로이드 구조 예측 알고리즘(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 문헌[PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조)을 사용하는 비엔나 대학의 이론 화학 기관에서 개발된 온라인 웹서버 RNAfold이다. 추가의 알고리즘은 본원에 참조로 포함되는 미국 출원 번호 TBA(브로드 참조번호 BI-2012/084 44790.11.2022)에서 찾을 수 있다.
일반적으로, tracr 메이트 서열은 다음 중 하나 이상을 증진시키기에 충분한, tracr 서열과의 상보성을 갖는 임의의 서열을 포함한다: (1) 상응하는 tracr 서열을 함유하는 세포에서 tracr 메이트 서열이 측부 배치된 가이드 서열의 절제; 및 (2) 표적 서열에서의 CRISPR 복합체의 형성으로서, CRISPR 복합체가 tracr 서열에 혼성화되는 tracr 메이트 서열을 포함하는 표적 서열에서의 CRISPR 복합체의 형성. 일반적으로, 상보성의 정도는 2개의 서열 중 더 짧은 서열의 길이에 따른 tracr 메이트 서열과 tracr 서열의 최적의 정렬을 참조한다. 최적의 정렬은 임의의 적절한 정렬 알고리즘에 의해 결정될 수 있으며, tracr 서열 또는 tracr 메이트 서열 중 어느 하나에서의 자가-상보성과 같이 2차 구조를 추가로 설명할 수 있다. 일부 구현예에서, 2개 중 보다 짧은 것의 길이를 따른 tracr 서열과 tracr 메이트 서열 간의 상보성의 정도는 최적으로 정렬되는 경우, 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 이상이다. tracr 서열과 tracr 메이트 서열 간의 최적의 정렬의 예시는 도 12b 및 도 13b에 제공되어 있다. 일부 구현예에서, tracr 서열은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, tracr 서열 및 tracr 메이트 서열은 2개 간의 혼성화가 헤어핀과 같은 2차 구조를 갖는 전사물을 생성하도록 단일의 전사물 내에 함유된다. 헤어핀 구조에 사용하기에 바람직한 루프 형성 서열은 4개 뉴클레오티드 길이이며, 바람직하게는 서열 GAAA를 갖는다. 그러나, 대안적인 서열과 같이 더 길거나 더 짧은 루프 서열이 사용될 수 있다. 서열은 바람직하게는 뉴클레오티드 트리플렛(예를 들어, AAA) 및 추가의 뉴클레오티드(예를 들어, C 또는 G)를 포함한다. 루프 형성 서열의 예는 CAAA 및 AAAG를 포함한다. 본 발명의 일 구현예에서, 전사물 또는 전사된 폴리뉴클레오티드 서열은 적어도 2개 이상의 헤어핀을 갖는다. 바람직한 구현예에서, 전사물은 2, 3, 4 또는 5개의 헤어핀을 갖는다. 본 발명의 추가의 구현예에서, 전사물은 최대 5개의 헤어핀을 갖는다. 일부 구현예에서, 단일의 전사물은 전사 종결 서열을 더 포함하며; 바람직하게는 이것은 폴리T 서열, 예를 들어, 6개의 T 뉴클레오티드이다. 이러한 헤어핀 구조의 예는 도 13b의 하부에 제공되며, 여기서, 루프의 상류 및 마지막 "N"의 5' 서열의 부분은 tracr 메이트 서열에 상응하며, 루프의 3' 서열의 부분은 tracr 서열에 상응한다. 가이드 서열, tracr 메이트 서열 및 tracr 서열을 포함하는 단일의 폴리뉴클레오티드의 추가의 비제한적인 예는 하기와 같으며(5'에서 3'으로 표기), 여기서, "N"은 가이드 서열의 염기를 나타내고, 소문자의 제1 블록은 tracr 메이트 서열을 나타내며, 소문자의 제2 블록은 tracr 서열을 나타내고, 마지막 폴리-T 서열은 전사 종결자를 나타낸다:
일부 구현예에서, 서열 (1) 내지 (3)은 스트렙토코커스 써모필러스 CRISPR1 유래의 Cas9와 함께 사용된다. 일부 구현예에서, 서열 (4) 내지 (6)은 스트렙토코커스 피오게네스 유래의 Cas9와 함께 사용된다. 일부 구현예에서, tracr 서열은 tracr 메이트 서열을 포함하는 전사물과 별개의 전사물이다(예를 들어, 도 13b의 상부에 예시).
일부 구현예에서, 재조합 주형도 또한 제공된다. 재조합 주형은 개별 벡터에 포함되거나, 개별 폴리뉴클레오티드로서 제공되는 본원에 기술된 바와 같은 다른 벡터의 성분일 수 있다. 일부 구현예에서, 재조합 주형은 상동성 재조합에서, 예를 들어, CRISPR 복합체의 일부로서 CRISPR 효소에 의해 닉이 생기거나 절단되는 표적 서열 내 또는 그 근처에서 주형으로 소용되도록 설계된다. 주형 폴리뉴클레오티드는 임의의 적절한 길이, 예를 들어, 약 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000개 이상의 뉴클레오티드 길이의 것일 수 있다. 일부 구현예에서, 주형 폴리뉴클레오티드는 표적 서열을 포함하는 폴리뉴클레오티드의 부분에 상보적이다. 최적으로 정렬되는 경우, 주형 폴리뉴클레오티드는 표적 서열의 하나 이상의 뉴클레오티드(예를 들어, 약 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개 이상의 뉴클레오티드)와 중첩할 수 있다. 일부 구현예에서, 주형 서열 및 표적 서열을 포함하는 폴리뉴클레오티드가 최적으로 정렬되는 경우, 주형 폴리뉴클레오티드의 가장 가까운 뉴클레오티드는 표적 서열로부터 약 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000개 이상의 뉴클레오티드 이내이다.
일부 구현예에서, CRISPR 효소는 하나 이상의 이종 단백질 도메인(예를 들어, CRISPR 효소에 더하여 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 도메인)을 포함하는 융합 단백질의 부분이다. CRISPR 효소 융합 단백질은 임의의 추가의 단백질 서열 및 선택적으로 임의의 2개 도메인 사이의 링커 서열을 포함할 수 있다. CRISPR 효소에 융합될 수 있는 단백질 도메인의 예는 비제한적으로 에피토프 태그, 리포터 유전자 서열 및 하기의 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다: 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는 글루타티온-S-트랜스퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나 이들에 한정되지 않는다. CRISPR 효소는 DNA 분자에 결합하거나, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합체, GAL4 DNA 결합 도메인 융합체 및 단순 포진 바이러스(HSV) BP16 단백질 융합체를 포함하나 이들에 한정되지 않는 다른 세포 분자에 결합하는 단백질 또는 단백질의 단편을 인코딩하는 유전자 서열에 융합될 수 있다. CRISPR 효소를 포함하는 융합 단백질의 부분을 형성할 수 있는 추가의 도메인은 본원에 참조로 포함되는 US20110059502호에 기술되어 있다. 일부 구현예에서, 태그가 부착된 CRISPR 효소를 사용하여 표적 서열의 위치를 확인한다.
일부 양태에서, 본 발명은 하나 이상의 폴리뉴클레오티드, 예를 들어, 본원에 기술된 바와 같은 하나 이상의 벡터, 그의 하나 이상의 전사물 및/또는 그로부터 전사된 하나의 단백질 또는 단백질들을 숙주 세포에 전달하는 단계를 포함한다. 일부 양태에서, 본 발명은 이러한 방법에 의해 생성된 세포, 및 이러한 세포를 포함하거나 이로부터 생성된 유기체(예를 들어, 동물, 식물 또는 진균)를 추가로 제공한다. 일부 구현예에서, 가이드 서열과 조합된(선택적으로 복합체화된) CRISPR 효소는 세포로 전달된다. 통상의 바이러스 및 비-바이러스 기반의 유전자 운반 방법을 사용하여 핵산을 포유동물 세포 또는 표적 조직에 도입할 수 있다. 이러한 방법을 사용하여 CRISPR 시스템의 성분을 인코딩하는 핵산을 배양물 중의 또는 숙주 유기체 내의 세포로 투여할 수 있다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들어, 본원에 기술된 벡터의 전사물), 네이키드(naked) 핵산 및 전달 비히클, 예를 들어, 리포솜과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이는 세포로의 전달 후에 에피솜 또는 통합된 게놈을 갖는다. 유전자 치료법 절차의 개요에 대해서는 문헌[Anderson, Science 256:808-813 (1992)]; 문헌[Nabel & Felgner, TIBTECH 11:211-217 (1993)]; 문헌[Mitani & Caskey, TIBTECH 11:162-166 (1993)]; 문헌[Dillon, TIBTECH 11:167-175 (1993)]; 문헌[Miller, Nature 357:455-460 (1992)]; 문헌[Van Brunt, Biotechnology 6(10):1149-1154 (1988)]; 문헌[Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995)]; 문헌[Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995)]; 문헌[Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Boehm (eds) (1995)]; 및 문헌[Yu et al., Gene Therapy 1:13-26 (1994)]을 참조한다.
핵산의 비-바이러스 전달 방법은 리포펙션(lipofection), 뉴클레오펙션(nucleofection), 미세주입, 비올리스틱스(biolistics), 비로좀(virosome), 리포솜, 면역리포솜, 다가양이온 또는 지질:핵산 컨쥬게이트, 네이키드 DNA, 인공 비리온 및 작용제-증진된 DNA의 흡수를 포함한다. 리포펙션은 예를 들어, 미국 특허 제5,049,386호, 제4,946,787호; 및 제4,897,355호에 기술되어 있으며, 리포펙션 시약은 상업적으로 시판된다(예를 들어, 트랜스펙탐(Transfectam)™ 및 리포펙틴(Lipofectin)™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 적절한 양이온 및 중성 지질은 펠그너(Felgner)의 WO 91/17424호; WO 91/16024호의 것들을 포함한다. 전달은 세포로(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직으로(예를 들어, 생체내 투여) 이루어질 수 있다.
표적화된 리포솜, 예를 들어, 면역지질 복합체를 포함하는 지질:핵산 복합체의 제제는 당업자에게 널리 공지되어 있다(예를 들어, 문헌[Crystal, Science 270:404-410 (1995)]; 문헌[Blaese et al., Cancer Gene Ther. 2:291-297 (1995)]; 문헌[Behr et al., Bioconjugate Chem. 5:382-389 (1994)]; 문헌[Remy et al., Bioconjugate Chem. 5:647-654 (1994)]; 문헌[Gao et al., Gene Therapy 2:710-722 (1995)]; 문헌[Ahmad et al., Cancer Res. 52:4817-4820 (1992)]; 미국 특허 제4,186,183호, 제4,217,344호, 제4,235,871호, 제4,261,975호, 제4,485,054호, 제4,501,728호, 제4,774,085호, 제4,837,028호 및 제4,946,787호 참조).
핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반의 시스템의 사용은 바이러스를 체내의 특정 세포에 표적화하고, 바이러스 페이로드(payload)를 핵에 수송하기 위한 고도로 발달된 과정을 이용한다. 바이러스 벡터를 환자에게 직접 투여하거나(생체내), 그들을 사용하여 시험관내에서 세포를 처리할 수 있으며, 변형된 세포가 선택적으로 환자에게 투여될 수 있다(생체외). 통상의 바이러스 기반의 시스템에는 유전자 운반을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 및 단순 포진 바이러스 벡터가 포함될 수 있다. 레트로바이러스, 렌티바이러스 및 아데노-관련 바이러스 유전자 운반 방법을 사용하여 숙주 게놈으로의 통합이 가능하며, 종종 삽입된 트랜스유전자의 장기간 발현을 야기한다. 또한, 높은 형질도입 효율이 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 편향성은 외래 외피 단백질을 혼입시키고, 잠재적 표적 집단의 표적 세포를 증식시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분열 세포에 형질도입할 수 있거나, 그를 감염시킬 수 있으며, 전형적으로 높은 바이러스 역가를 생성하는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 운반 시스템의 선택은 표적 조직에 따라 달라질 것이다. 레트로바이러스 벡터는 최대 6 내지 10kb의 외래 서열에 대하여 패키징 능력을 갖는 시스-작용성 긴 말단 반복부로 이루어진다. 최소 시스-작용성 LTR은 벡터의 복제 및 패키징에 충분하며, 이는 이어서, 치료적 유전자를 표적 세포로 통합시켜, 영구적인 트랜스유전자 발현을 제공하는데 사용된다. 널리 사용되는 레트로바이러스 벡터는 쥣과 백혈병 바이러스(MuLV), 긴팔원숭이 유인원 백혈병 바이러스(GaLV), 원숭이 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV) 및 그들의 조합에 기초한 것들을 포함한다(예를 들어, 문헌[Buchscher et al., J. Virol. 66:2731-2739 (1992)]; 문헌[Johann et al., J. Virol. 66:1635-1640 (1992)]; 문헌[Sommnerfelt et al., Virol. 176:58-59 (1990)]; 문헌[Wilson et al., J. Virol. 63:2374-2378 (1989)]; 문헌[Miller et al., J. Virol. 65:2220-2224 (1991)]; PCT/US94/05700호 참조).
일시적 발현이 바람직한 출원에서, 아데노바이러스 기반의 시스템이 사용될 수 있다. 아데노바이러스 기반의 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있으며, 세포 분열을 필요로 하지 않는다. 이러한 벡터를 사용하여, 높은 역가 및 발현 수준이 수득된다. 이러한 벡터는 비교적 간단한 시스템에서 대량 생성될 수 있다. 예를 들어, 핵산 및 펩티드의 시험관내 생성에서, 그리고 생체내 및 생체외 유전자 치료법 절차를 위하여, 아데노-관련 바이러스("AAV") 벡터를 사용하여, 표적 핵산으로 세포를 형질도입시킬 수도 있다(예를 들어, 문헌[West et al., Virology 160:38-47 (1987)]; 미국 특허 제4,797,368호; WO 93/24641호; 문헌[Kotin, Human Gene Therapy 5:793-801 (1994)]; 문헌[Muzyczka, J. Clin. Invest. 94:1351 (1994)] 참조). 재조합 AAV 벡터의 작제는 미국 특허 제5,173,414호; 문헌[Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985)]; 문헌[Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984)]; 문헌[Hermonat & Muzyczka, PNAS 81:6466-6470 (1984)]; 및 문헌[Samulski et al., J. Virol. 63:03822-3828 (1989)]을 포함하는 수많은 간행물에 기술되어 있다.
패키징 세포는 전형적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하기 위해 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에 사용되는 바이러스 벡터는 통상적으로 핵산 벡터를 바이러스 입자로 패키징하는 세포주를 생성함으로써 생성된다. 벡터는 전형적으로 패키징 및 이후의 숙주로의 통합에 필요한 최소 바이러스 서열을 함유하며, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 대한 발현 카세트로 대체된다. 소실 바이러스 기능은 전형적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에 사용되는 AAV 벡터는 전형적으로 패키징 및 숙주 게놈으로의 통합에 필요한 AAV 게놈 유래의 ITR 서열만을 갖는다. 바이러스 DNA는 다른 AAV 유전자, 즉, rep 및 cap을 인코딩하나 ITR 서열이 결여된 헬퍼 플라스미드를 함유하는 세포주에서 패키징된다. 또한, 세포주는 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인해 충분한 양으로 패키징되지 않는다. 아데노바이러스로의 오염은 예를 들어, 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다. 세포로의 핵산의 전달을 위한 추가의 방법은 당업자에게 공지되어 있다. 예를 들어, 본원에 참조로 포함되는 US20030087817호를 참조한다.
일부 구현예에서, 숙주 세포는 본원에 기술된 하나 이상의 벡터로 일시적으로 또는 비-일시적으로 트랜스펙션된다. 일부 구현예에서, 세포는 그것이 대상체에서 천연적으로 발생한 대로 트랜스펙션된다. 일부 구현예에서, 트랜스펙션되는 세포는 대상체로부터 취해진다. 일부 구현예에서, 세포는 세포주와 같이 대상체로부터 취해진 세포로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 공지되어 있다. 세포주의 예는 C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피, BALB/3T3 마우스 배아 섬유아세포, 3T3 Swiss, 3T3-L1, 132-d5 인간 태아 섬유아세포; 10.1 마우스 섬유아세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY 세포, K562 세포, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN / OPCT 세포주, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THP1 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR 및 그의 트랜스제닉 변이형을 포함하나 이들에 한정되지 않는다. 세포주는 당업자에게 공지되어 있는 다양한 공급원으로부터 입수가능하다(예를 들어, 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; ATCC)(미국 버지니아주 머내서스 소재) 참조). 일부 구현예에서, 본원에 기술된 하나 이상의 벡터로 트랜스펙션된 세포를 사용하여 하나 이상의 벡터-유래 서열을 포함하는 신규 세포주를 확립한다. 일부 구현예에서, 본원에 기술된 바와 같은 CRISPR 시스템의 성분이 일시적으로 트랜스펙션되고(예를 들어, 하나 이상의 벡터의 일시적 트랜스펙션 또는 RNA로의 트랜스펙션에 의해), CRISPR 복합체의 활성을 통해 변형된 세포를 사용하여, 변형을 포함하나 임의의 다른 외인성 서열이 결여된 세포를 포함하는 신규 세포주를 확립한다. 일부 구현예에서, 일시적으로 또는 비-일시적으로 본원에 기술된 하나 이상의 벡터로 트랜스펙션된 세포 또는 이러한 세포로부터 유래된 세포주가 하나 이상의 시험 화합물의 평가에서 사용된다.
일부 구현예에서, 본원에 기술된 하나 이상의 벡터를 사용하여 비-인간 트랜스제닉 동물 또는 트랜스제닉 식물을 생성한다. 일부 구현예에서, 트랜스제닉 동물은 포유동물, 예를 들어, 마우스, 랫트 또는 토끼이다. 특정 구현예에서, 유기체 또는 대상체는 식물이다. 특정 구현예에서, 유기체 또는 대상체 또는 식물은 조류이다. 트랜스제닉 식물 및 동물의 생성 방법은 당업계에 공지되어 있으며, 일반적으로 본원에 기술된 바와 같은 세포 트랜스펙션 방법으로 시작한다. 또한, 트랜스제닉 식물, 특히 농작물 및 조류와 같이, 트랜스제닉 동물도 제공된다. 트랜스제닉 동물 또는 식물은 질병 모델을 제공하는 것 이외의 응용에 유용할 수 있다. 이들은 예를 들어, 보통 야생형에서 관찰될 것보다 높은 수준의 단백질, 탄수화물, 영양소 또는 비타민의 발현을 통한 식품 또는 사료 생성을 포함할 수 있다. 이와 관련하여, 트랜스제닉 식물, 특히, 두류 및 덩이줄기, 및 동물, 특히, 포유동물, 예를 들어, 가축(소, 양, 염소 및 돼지)뿐 아니라 가금류 및 식용 곤충도 바람직하다.
트랜스제닉 조류 또는 다른 식물, 예를 들어, 유채가 예를 들어, 식물유 또는 바이오연료, 예를 들어, 알코올(특히, 메탄올 및 에탄올)의 생성에 특히 유용할 수 있다. 이들은 오일 또는 바이오연료 산업에 사용하기 위한 높은 수준의 오일 또는 알코올을 발현하거나 과발현하도록 조작될 수 있다.
일 양태에서, 본 발명은 진핵 세포에서의 표적 폴리뉴클레오티드의 변형 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하게 하여, 상기 표적 폴리뉴클레오티드의 절단을 초래하여, 표적 폴리뉴클레오티드를 변형시키는 단계를 포함하며, 여기서, CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함하고, 상기 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다.
일 양태에서, 본 발명은 진핵 세포에서의 표적 폴리뉴클레오티드의 발현의 변경 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 폴리뉴클레오티드에 결합하여, 상기 결합이 상기 폴리뉴클레오티드의 발현 증가 또는 감소를 야기하도록 하는 단계를 포함하며; 여기서, CRISPR 복합체는 상기 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화된 CRISPR 효소를 포함하며, 상기 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다.
작물 유전체학의 최근의 진전으로, 효율적이며 비용 효율이 높은 유전자 교정 및 조작을 수행하기 위한 CRISPR-Cas 시스템의 사용 능력은 단일 및 다중 유전자 조작의 신속한 선택과 비교를 가능하게 하여, 향상된 생성 및 증진된 특성을 위해 이러한 게놈을 형질전환시킬 것이다. 이와 관련하여, 다음의 미국 특허 및 간행물을 참조한다: 각각의 모든 내용 및 개시내용이 본원에 참조로 포함되는 미국 특허 제6,603,061호(Agrobacterium-Mediated Plant Transformation Method); 미국 특허 제7,868,149호(Plant Genome Sequences and Uses Thereof) 및 US 2009/0100536호(Transgenic Plants with Enhanced Agronomic Traits). 본 발명의 실시에 있어서, 문헌[Morrell et al "Crop genomics:advances and applications" Nat Rev Genet. 2011 Dec 29;13(2):85-96]의 내용 및 개시내용도 또한 그들 전문이 본원에 참조로 포함된다. 본 발명의 유리한 구현예에서, CRISPR/Cas9 시스템을 사용하여, 미세조류를 조작한다(실시예 14). 따라서, 본원에서 동물 세포에 대한 참고내용은 다르게 명백하지 않은 한, 필요한 부분만 약간 수정하여 식물 세포에도 적용할 수 있다.
일 양태에서, 본 발명은 생체내, 생체외 또는 시험관내에서 이루어질 수 있는 진핵 세포에서의 표적 폴리뉴클레오티드의 변형 방법을 제공한다. 일부 구현예에서, 상기 방법은 인간 또는 비-인간 동물 또는 식물(미세조류 포함)로부터 세포 또는 세포 집단을 샘플링하는 단계 및 세포 또는 세포들을 변형시키는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비-인간 동물 또는 식물(미세조류 포함)로 재도입될 수 있다.
일 양태에서, 본 발명은 상기 방법 및 조성물에 개시된 임의의 하나 이상의 요소를 함유하는 키트를 제공한다. 일부 구현예에서, 키트는 벡터 시스템 및 키트의 사용을 위한 지침서를 포함한다. 일부 구현예에서, 벡터 시스템은 (a) tracr 메이트 서열, 및 tracr 메이트 서열의 상류에 하나 이상의 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동가능하게 연결된 제1 조절 요소로서, 가이드 서열은 발현되는 경우, 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하고, CRISPR 복합체는 (1) 표적 서열에 혼성화되는 가이드 서열, 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화된 CRISPR 효소를 포함하는 제1 조절 요소; 및/또는 (b) 핵 국소화 서열을 포함하는 상기 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함한다. 요소는 개별적으로 또는 조합하여 제공될 수 있으며, 임의의 적절한 용기, 예를 들어, 바이얼, 병 또는 튜브에 제공될 수 있다. 일부 구현예에서, 키트는 1가지 이상의 언어, 예를 들어, 1가지 초과의 언어의 지침서를 포함한다.
일부 구현예에서, 키트는 본원에 기술된 요소 중 하나 이상을 사용하는 과정에 사용하기 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적절한 용기에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 저장 완충제를 제공할 수 있다. 시약은 특정 검정에 사용가능한 형태 또는 사용 전에 하나 이상의 다른 성분의 첨가를 필요로 하는 형태(예를 들어, 농축물 또는 동결건조 형태)로 제공될 수 있다. 완충제는 탄산나트륨 완충제, 중탄산나트륨 완충제, 붕산염 완충제, 트리스(Tris) 완충제, MOPS 완충제, HEPES 완충제 및 그들의 조합을 포함하나 이들에 한정되지 않는 임의의 완충제일 수 있다. 일부 구현예에서, 완충제는 알칼리성이다. 일부 구현예에서, 완충제는 약 7 내지 약 10의 pH를 갖는다. 일부 구현예에서, 키트는 가이드 서열과 조절 요소를 작동가능하게 연결하도록, 벡터에 삽입하기 위한 가이드 서열에 상응하는 하나 이상의 올리고뉴클레오티드를 포함한다. 일부 구현예에서, 키트는 상동성 재조합 주형 폴리뉴클레오티드를 포함한다.
일 양태에서, 본 발명은 CRISPR 시스템의 하나 이상의 요소의 사용 방법을 제공한다. 본 발명의 CRISPR 복합체는 효율적인 표적 폴리뉴클레오티드의 변형 수단을 제공한다. 본 발명의 CRISPR 복합체는 다수의 세포 유형에서 표적 폴리뉴클레오티드를 변형시키는(예를 들어, 결실시키는, 삽입하는, 전위시키는, 불활성화시키는, 활성화시키는) 것을 포함하는 매우 다양한 유용성을 갖는다. 이와 같이, 본 발명의 CRISPR 복합체는 예를 들어, 유전자 치료법, 약물 스크리닝, 질병 진단 및 예후에서 넓은 스펙트럼의 응용을 갖는다. 예시적인 CRISPR 복합체는 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화되는 CRISPR 효소를 포함한다. 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내인성이거나 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 산물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크(junk) DNA)일 수 있다. 이론에 구속되지 않으면서, 표적 서열이 PAM(프로토스페이서 인접 모티프); 즉, CRISPR 복합체에 의해 인식되는 짧은 서열과 회합되어야 하는 것으로 여겨진다. PAM에 대한 정밀한 서열 및 길이 요건은 사용되는 CRISPR 효소에 따라 달라지지만, PAM은 전형적으로 프로토스페이서(즉, 표적 서열)에 인접한 2 내지 5개 염기쌍 서열이다. PAM 서열의 예는 하기 실시예 섹션에 제공되어 있으며, 당업자는 주어진 CRISPR 효소와 함께 사용하기 위한 추가의 PAM 서열을 확인할 수 있을 것이다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 모두의 내용이 본원에 참조로 포함되는, 각각 브로드 참조번호 BI-2011/008/WSGR 사건 번호 44063-701.101 및 BI-2011/008/WSGR 사건 번호 44063-701.102를 갖고, 둘 모두 명칭이 SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION이고, 각각 2012년 12월 12일 및 2013년 1월 2일에 출원된 미국 가출원 제61/736,527호 및 제61/748,427호에 열거된 바와 같은 다수의 질병-관련 유전자 및 폴리뉴클레오티드, 및 신호전달 생화학 경로-관련 유전자 및 폴리뉴클레오티드를 포함할 수 있다.
표적 폴리뉴클레오티드의 예는 신호전달 생화학 경로와 관련된 서열, 예를 들어, 신호전달 생화학적 경로-관련 유전자 또는 폴리뉴클레오티드를 포함한다. 표적 폴리뉴클레오티드의 예는 질병 관련 유전자 또는 폴리뉴클레오티드를 포함한다. "질병-관련" 유전자 또는 폴리뉴클레오티드는 질병이 없는 대조군의 조직 또는 세포와 비교하여, 질병-발생 조직으로부터 유래된 세포에서 비정상적인 수준 또는 비정상적인 형태로 전사 또는 번역 산물을 생성하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자일 수 있으며; 그것은 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있고, 여기서, 변경된 발현은 질병의 발생 및/또는 진행과 관련이 있다. 또한, 질병-관련 유전자는 질병의 병인에 직접적인 원인이 있거나, 그에 원인이 있는 유전자(들)와 연관 불균형이 있는 돌연변이(들) 또는 유전적 변이를 갖는 유전자를 지칭한다. 전사 또는 번역된 산물은 공지된 것이거나 미공지된 것일 수 있으며, 정상 또는 비정상 수준으로 존재할 수 있다.
질병-관련 유전자 및 폴리뉴클레오티드의 예는 맥쿠식-네이선스 유전의학연구소(McKusick-Nathans Institute of Genetic Medicine), 존스 홉킨스 대학(Johns Hopkins University)(미국 메릴랜드주 볼티모어) 및 미국 국립생물공학정보센터(National Center for Biotechnology Information), 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용가능하며, 월드 와이드 웹에서 이용가능하다.
질병-관련 유전자 및 폴리뉴클레오티드의 예는 표 A 및 B에 열거되어 있다. 질병 특이적 정보는 맥쿠식-네이선스 유전의학연구소, 존스 홉킨스 대학(미국 메릴랜드주 볼티모어) 및 미국 국립생물공학정보센터, 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용가능하며, 월드 와이드 웹에서 이용가능하다. 신호전달 생화학 경로-관련 유전자 및 폴리뉴클레오티드의 예는 표 C에 열거되어 있다.
이들 유전자 및 경로의 돌연변이는 기능에 영향을 미치는 부적절한 단백질 또는 부적절한 양의 단백질의 생성을 야기할 수 있다. 유전자, 질병 및 단백질의 추가의 예는 미국 가출원 제61/736,527호 및 제61/748,427호로부터 본원에 참고로 포함된다. 이러한 유전자, 단백질 및 경로는 CRISPR 복합체의 표적 폴리뉴클레오티드일 수 있다.
표 A
표 B:
표 C:
또한, 본 발명의 구현예는 유전자의 녹아웃, 유전자의 증폭 및 DNA 반복부 불안정성 및 신경계 장애와 관련된 특정 돌연변이의 수복에 관한 방법 및 조성물에 관한 것이다(문헌[Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical]). 연쇄 반복(tandem repeat) 서열의 특정 양태는 20개 초과의 인간 질병의 원인이 되는 것으로 관찰되었다(반복부 불안정성의 새로운 이해: RNA·DNA 하이브리드의 역할. 문헌[McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8]). CRISPR-Cas 시스템은 이들 게놈 불안정성의 결함을 교정하도록 이용될 수 있다.
본 발명의 추가의 양태는 라포라 질병(Lafora disease)과 관련이 있는 것으로 확인된 EMP2A 및 EMP2B 유전자의 결함을 교정하기 위하여 CRISPR-Cas 시스템을 사용하는 것에 관한 것이다. 라포라 질병은 청소년기에 간질성 발작으로 시작할 수 있는 진행성 간대성근경련 간질을 특징으로 하는 상염색체 열성 질환이다. 소수의 경우의 질병이 아직 확인되지 않은 유전자의 돌연변이에 의해 유발될 수 있다. 질병은 발작, 근육연축, 보행곤란, 치매 및 결국에는 사망을 야기한다. 질병 진행에 대하여 효율적인 것으로 입증된 치료법이 현재 존재하지 않는다. 또한, 간질과 관련된 다른 유전자 이상은 CRISPR-Cas 시스템에 의해 표적화될 수 있으며, 근본이 되는 유전학은 문헌[Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009]에 추가로 기술되어 있다.
본 발명의 또 다른 양태에서, CRISPR-Cas 시스템을 사용하여 문헌[Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012]에 추가로 기술된 몇몇 유전자 돌연변이로부터 야기되는 안구 결함을 교정할 수 있다.
본 발명의 몇몇 추가의 양태는 토픽 세부항목 유전 장애하에 국립보건원의 웹사이트에 추가로 기술된 매우 다양한 유전 질병과 관련된 결함을 교정하는 것에 관한 것이다. 유전적 뇌 질병은 부신백질이영양증, 뇌들보 무발생, 에카르디 증후군, 알퍼스병, 알츠하이머병, 바르트 증후군, 배튼병, CADASIL, 소뇌변성, 파브리병, 게르스트만 슈투로이슬러 샤잉커 병, 헌팅톤병 및 기타 3중 반복 장애, 라이병, 레슈-니한 증후군, 멘케스 질병, 사립체성 근병증 및 NINDS 거대후두각을 포함할 수 있으나 이들에 한정되지 않는다. 이들 질병은 세부항목 유전 뇌 장애하에 국립보건원의 웹사이트에 추가로 기술되어 있다.
일부 구현예에서, 질환은 신생물일 수 있다. 일부 구현예에서, 질환이 신생물인 경우, 표적화될 유전자는 표 A에 열거된 것들 중 임의의 것이다(이러한 경우에, PTEN 등). 일부 구현예에서, 질환은 연령-관련 황반 변성일 수 있다. 일부 구현예에서, 질환은 정신분열 장애일 수 있다. 일부 구현예에서, 질환은 트리뉴클레오티드 반복 장애일 수 있다. 일부 구현예에서, 질환은 유약 X 증후군일 수 있다. 일부 구현예에서, 질환은 세크레타제 관련 장애일 수 있다. 일부 구현예에서, 질환은 프리온-관련 장애일 수 있다. 일부 구현예에서, 질환은 ALS일 수 있다. 일부 구현예에서, 질환은 약물 중독일 수 있다. 일부 구현예에서, 질환은 자폐증일 수 있다. 일부 구현예에서, 질환은 알츠하이머병일 수 있다. 일부 구현예에서, 질환은 염증일 수 있다. 일부 구현예에서, 질환은 파킨슨병일 수 있다.
파킨슨병과 관련된 단백질의 예는 α-시누클레인, DJ-1, LRRK2, PINK1, Parkin, UCHL1, 신필린(Synphilin)-1 및 NURR1을 포함하나 이들에 한정되지 않는다.
중독 관련 단백질의 예는 예를 들어, ABAT를 포함할 수 있다.
염증-관련 단백질의 예는 예를 들어, Ccr2 유전자에 의해 인코딩된 단핵구 화학주성 단백질-1(MCP1), Ccr5 유전자에 의해 인코딩된 C-C 케모카인 수용체 5형(CCR5), Fcgr2b 유전자에 의해 인코딩된 IgG 수용체 IIB(FCGR2b, CD32로도 명명) 또는 Fcer1g 유전자에 의해 인코딩된 Fc 엡실론(epsilon) R1g(FCER1g) 단백질을 포함할 수 있다.
심혈관 질병 관련 단백질의 예는 예를 들어, IL1B(인터류킨 1, 베타), XDH(잔틴 데하이드로게나제), TP53(종양 단백질 p53), PTGIS(프로스타글란딘 I2(프로스타사이클린(prostacyclin)) 신타제), MB(미오글로빈), IL4(인터류킨 4), ANGPT1(안지오포이에틴 1), ABCG8(ATP-결합 카세트, 하위-과 G(WHITE), 구성원 8) 또는 CTSK(카텝신 K)를 포함할 수 있다.
알츠하이머병 관련 단백질의 예는 예를 들어, VLDLR 유전자에 의해 인코딩되는 극저밀도 리포단백질 수용체 단백질(VLDLR), UBA1 유전자에 의해 인코딩되는 유비퀴틴-유사 변형 활성화 효소(UBA1) 또는 UBA3 유전자에 의해 인코딩되는 NEDD8-활성화 효소 E1 촉매 서브유닛 단백질(UBE1C)을 포함할 수 있다.
자폐 스펙트럼 장애와 관련된 단백질의 예는 예를 들어, BZRAP1 유전자에 의해 인코딩되는 벤조디아자핀 수용체(주변) 관련 단백질 1(BZRAP1), AFF2 유전자(MFR2로도 명명)에 의해 인코딩되는 AF4/FMR2 과 구성원 2 단백질(AFF2), FXR1 유전자에 의해 인코딩되는 유약 X 정신 지체 상염색체 상동체 1 단백질(FXR1) 또는 FXR2 유전자에 의해 인코딩되는 유약 X 정신 지체 상염색체 상동체 2 단백질(FXR2)을 포함할 수 있다.
황반 변성과 관련된 단백질의 예는 예를 들어, ABCR 유전자에 의해 인코딩되는 ATP-결합 카세트, 하위과 A(ABC1) 구성원 4 단백질(ABCA4), APOE 유전자에 의해 인코딩되는 아포리포단백질 E 단백질(APOE) 또는 CCL2 유전자에 의해 인코딩되는 케모카인(C-C 모티프) 리간드 2 단백질(CCL2)을 포함할 수 있다.
정신분열증과 관련된 단백질의 예는 NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B 및 그들의 조합을 포함할 수 있다.
종양 저해에 수반되는 단백질의 예는 예를 들어, ATM(돌연변이된 혈관확장성 운동실조증), ATR(혈관확장성 운동실조증 및 Rad3 관련), EGFR(상피 성장 인자 수용체), ERBB2(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 2), ERBB3(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 3), ERBB4(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 4), Notch 1, Notch2, Notch 3 또는 Notch 4를 포함할 수 있다.
세크레타제 장애와 관련된 단백질의 예는 예를 들어, PSENEN(프레세닐린 인핸서 2 상동체(C. 엘레간스(C. elegans)), CTSB(카텝신 B), PSEN1(프레세닐린 1), APP(아밀로이드 베타(A4) 전구체 단백질), APH1B(앞인두 결함 1 상동체 B(C. 엘레간스)), PSEN2(프레세닐린 2(알츠하이머병 4)) 또는 BACE1(베타-부위 APP-절단 효소 1)을 포함할 수 있다.
근위축성 측삭 경화증과 관련된 단백질의 예는 SOD1(슈퍼옥시드 디스뮤타제(dismutase) 1), ALS2(근위축성 측삭 경화증 2), FUS(육종에서 융합), TARDBP(TAR DNA 결합 단백질), VAGFA(혈관 내피 성장 인자 A), VAGFB(혈관 내피 성장 인자 B) 및 VAGFC(혈관 내피 성장 인자 C) 및 그들의 임의의 조합을 포함할 수 있다.
프리온 질병과 관련된 단백질의 예는 SOD1(슈퍼옥시드 디스뮤타제 1), ALS2(근위축성 측삭 경화증 2), FUS(육종에서 융합), TARDBP(TAR DNA 결합 단백질), VAGFA(혈관 내피 성장 인자 A), VAGFB(혈관 내피 성장 인자 B) 및 VAGFC(혈관 내피 성장 인자 C) 및 그들의 임의의 조합을 포함할 수 있다.
프리온 장애에서의 신경변성 질환과 관련된 단백질의 예는 예를 들어, A2M(알파-2-마크로글로불린), AATF(아폽토시스 길항작용 전사 인자), ACPP(전립선 산 포스파타제), ACTA2(액틴 알파 2 평활근 대동맥), ADAM22(ADAM 메탈로펩티다제 도메인), ADORA3(아데노신 A3 수용체) 또는 ADRA1D(알파-1D 아드레노수용체에 대한 알파-1D 아드레날린 작용성 수용체)를 포함할 수 있다.
면역결핍과 관련된 단백질의 예는 예를 들어, A2M[알파-2-마크로글로불린]; AANAT[아릴알킬아민 N-아세틸트랜스퍼라제]; ABCA1[ATP-결합 카세트, 하위과 A(ABC1), 구성원 1]; ABCA2[ATP-결합 카세트, 하위과 A(ABC1), 구성원 2]; 또는 ABCA3[ATP-결합 카세트, 하위과 A(ABC1), 구성원 3];을 포함할 수 있다.
트리뉴클레오티드 반복 장애와 관련된 단백질의 예는 예를 들어, AR(안드로겐 수용체), FMR1(유약 X 정신 지체 1), HTT(헌팅틴) 또는 DMPK(근긴장성 이영양증-단백질 키나제), FXN(프라탁신(frataxin)), ATXN2(아탁신(ataxin) 2)를 포함한다.
신경전달 장애와 관련된 단백질의 예는 예를 들어, SST(소마토스타틴), NOS1(산화질소 신타제 1(뉴런)), ADRA2A(아드레날린 작용성, 알파-2A-, 수용체), ADRA2C(아드레날린 작용성, 알파-2C-, 수용체), TACR1(타키키닌 수용체 1) 또는 HTR2c(5-하이드록시트립타민(세로토닌) 수용체 2C)를 포함한다.
신경발달-관련 서열의 예는 예를 들어, A2BP1[아탁신 2-결합 단백질 1], AADAT[아미노아디페이트 아미노트랜스퍼라제], AANAT[아릴알킬아민 N-아세틸트랜스퍼라제], ABAT[4-아미노부티레이트 아미노트랜스퍼라제], ABCA1[ATP-결합 카세트, 하위과 A(ABC1), 구성원 1] 또는 ABCA13[ATP-결합 카세트, 하위과 A(ABC1), 구성원 13]을 포함한다.
본 발명의 시스템으로 치료가능한 바람직한 질환의 추가의 예는 에카르디 고우티에레스(Aicardi-Goutieres) 증후군; 알렉산더병; 알란-헌든-두들리(Allan-Herndon-Dudley) 증후군; POLG-관련 장애; 알파-만노시도시스(Alpha-Mannosidosis)(II 및 III형); 알스트스트롬(Alstrom) 증후군; 안젤만(Angelman); 증후군; 혈관확장성 운동실조증; 신경 세로이드 리포푸신증; 베타-지중해빈혈; 양쪽성 시신경위축 및 (영아) 1형 시신경위축; 망막모세포종(양쪽성); 캐너번병; 뇌-눈-얼굴-골격 증후군 1[COFS1]; 뇌힘줄황색종증; 코넬리아디란지 증후군; MAPT-관련 장애; 유전적 프리온 질병; 드라벳 증후군; 조기-발병 가족성 알츠하이머병; 프리드리히 운동실조[FRDA]; 프린스 증후군; 푸코시드 축적증; 후쿠야마형 선천성 근이영양증; 갈락토시알리도시스; 고셰병; 유기 산혈증; 혈구탐식성 림프조직구증; 허친슨-길포오드 조로증 증후군; II형 뮤코리피드증; 유아 유리 시알산 축적병; PLA2G6-관련 신경변성; 제벨 랑쥐-닐슨 증후군; 연접부 수포성 표피박리증; 헌팅톤병; 크라베병(유아); 미토콘드리아 DNA-관련 레이 증후군 및 NARP; 레슈-니한 증후군; LIS1-관련 뇌회결손; 로우 증후군; 단풍시럽뇨병; MECP2 중복 증후군; ATP7A-관련 구리 수송 장애; LAMA2-관련 근이영양증; 아릴설파타제 A 결핍; I, II 또는 III형 점액다당류증; 퍼옥시좀 생물발생 장애; 젤웨거 증후군 스펙트럼; 뇌 철 축적 장애가 있는 신경변성; 산 스핑고미엘리나제 결핍; C형 니만 픽병; 글리신 뇌병증; ARX-관련 장애; 요소 사이클 장애; COL1A1/2-관련 불완전골형성; 미토콘드리아 DNA 결실 증후군; PLP1-관련 장애; 페리(Perry) 증후군; 펠란-맥더미드 증후군; II형 글리코겐 축적병(폼페병)(유아); MAPT-관련 장애; MECP2-관련 장애; 1형 어깨엉덩관절 점상 연골형성이상; 로버츠 증후군; 샌드호프병; 쉰들러병 - 1형; 아데노신 탈아미노효소 결핍; 스미스-렘리-오피츠 증후군; 척수성 근위축; 유아-발병 척수소뇌성 실조증; 헥소사미니다제 A 결핍; 1형 치사성 이형성증; VI형 콜라겐-관련 장애; I형 어셔 증후군; 선천성 근이영양증; 울프-허쉬호른 증후군; 리소좀산 리파제 결핍; 및 색소성 건피증으로부터 선택될 수 있다.
단백질 치료제의 만성적 투여는 특정 단백질에 대한 허용가능하지 않은 면역 반응을 야기할 수 있다. 단백질 약물의 면역원성은 소수의 면역우성 헬퍼 T 림프구(HTL) 에피토프의 결과일 수 있다. 이들 단백질에 함유된 이들 HTL 에피토프의 MHC 결합 친화성의 감소에 의해, 면역원성이 더 낮은 약물이 생성될 수 있다(문헌[Tangri S, et al. ("Rationally engineered therapeutic proteins with reduced immunogenicity" J Immunol. 2005 Mar 15;174(6):3187-96)]. 본 발명에서, 특히, CRISPR 효소의 면역원성은 에리트로포이에틴에 관하여 탄그리(Tangri) 등에서 먼저 시작되고, 이후에 개발된 방법에 따라 감소될 수 있다. 따라서, 유도 진화(directed evolution) 또는 합리적 설계를 사용하여 숙주 종(인간 또는 다른 종)에서 CRISPR 효소(예를 들어, Cas9)의 면역원성을 감소시킬 수 있다.
식물에서, 병원체는 종종 숙주-특이적이다. 예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum) f. sp. 리코페르시시(lycopersici)는 토마토 시듦을 야기하나 오직 토마토만을 공격하고, 푸사리움 옥시스포룸 f. 디안티이 푸키니아 그라미니스(dianthii Puccinia graminis) f. sp. 트리티시(tritici)는 오직 밀만을 공격한다. 식물은 대부분의 병원체에 저항하는 기존의 방어 및 유도된 방어를 갖는다. 식물 세대에 걸친 돌연변이 및 재조합 사건은 유전적 변이를 야기하며, 이는 특히 병원체가 식물보다 더 많은 빈도로 재생되기 때문에, 감수성이 생기게 한다. 식물에서는 비-숙주 저항성이 존재할 수 있는데, 예를 들어 숙주 및 병원체는 양립불가능하다. 또한, 수평 저항성, 예를 들어, 통상적으로 많은 유전자에 의해 제어되는 모든 종류의 병원체에 대한 불완전한 저항성, 및 수직 저항성, 예를 들어, 통상 소수의 유전자에 의해 제어되는 일부 종류의 병원체에 대해서는 완전하지만 다른 종류에 대해서는 그렇지 않은 저항성이 존재할 수 있다. 유전자 대 유전자(Gene-for-Gene) 수준에 있어서, 식물 및 병원체는 함께 진화하며, 하나의 균형의 유전적 변화는 다른 것을 변화시킨다. 따라서, 천연 가변성을 사용하여, 육종자는 수율, 품질, 균일성, 내한성, 저항성에 대해 가장 유용한 유전자를 조합한다. 저항성 유전자의 공급원은 고유 또는 외래 품종, 토종(Heirloom) 품종, 야생 식물 동류 및 유도된 돌연변이, 예를 들어 돌연변이유발 작용제로 식물 물질을 처리하는 것을 포함한다. 본 발명을 사용하여, 식물 육종자에게 돌연변이를 유도하는 신규 도구가 제공된다. 따라서, 당업자는 저항성 유전자 공급원의 게놈을 분석할 수 있으며, 요망되는 특징 또는 특성을 갖는 품종에서 본 발명을 이용하여 이전의 돌연변이유발 작용제보다 더 큰 정밀도로 저항성 유전자의 발생을 유도하여, 이에 따라 식물 육종 프로그램을 가속화시키고 향상시킬 수 있다.
명백한 바와 같이, 본 발명의 시스템이 임의의 대상 폴리뉴클레오티드 서열을 표적화하기 위해 사용될 수 있음이 예상된다. 본 발명의 시스템을 사용하여 유용하게 치료될 수 있는 질환 또는 질병의 일부 예는 상기 표에 포함되어 있으며, 그들 질환과 현재 관련되어 있는 유전자의 예도 또한 거기에 제공된다. 그러나, 예시된 유전자는 배타적인 것은 아니다.
실시예
하기의 실시예는 본 발명의 다양한 구현예를 예시할 목적으로 제공되며, 어떠한 방식으로든 본 발명을 제한하고자 하지 않는다. 본원에 기술된 방법과 함께 본 발명의 실시예는 본원에서 바람직한 구현예를 대표하는 것이며, 예시적이고, 본 발명의 범주에 대한 제한으로 의도되지 않는다. 거기에서의 변화 및 다른 용도는 청구범위의 범주에 의해 정의되는 바와 같은 본 발명의 목적에 포함되며, 당업자에게 수행될 것이다.
실시예 1: 진핵 세포의 핵에서의 CRISPR 복합체 활성
예시적인 II형 CRISPR 시스템은 스트렙토코커스 피오게네스 SF370 유래의 II형 CRISPR 유전자좌이며, 이는 4개 유전자, Cas9, Casl, Cas2 및 Csn1의 클러스터 뿐 아니라 2개의 비-코딩 RNA 요소, tracrRNA, 및 비-반복 서열의 짧은 스트레치(스페이서, 각각 30bp)에 의해 산재된 반복 서열의 특징적 어레이(직접 반복부)를 포함한다. 이러한 시스템에서, 표적화된 DNA 이중-가닥 파단(DSB)은 4개의 순차적 단계로 생성된다(도 2a). 먼저, 2개의 비-코딩 RNA, pre-crRNA 어레이 및 tracrRNA를 CRISPR 유전자좌로부터 전사시킨다. 두번째로, tracrRNA를 pre-crRNA 의 직접 반복부에 혼성화시키고, 이어서 개별 스페이서 서열을 함유하는 성숙 crRNA로 가공한다. 세 번째로, 성숙 crRNA:tracrRNA 복합체는 crRNA의 스페이서 영역과 프로토스페이서 DNA 사이의 헤테로듀플렉스 형성을 통해 Cas9를 프로토스페이서 및 상응하는 PAM으로 구성된 DNA 표적으로 유도한다. 마지막으로, Cas9는 PAM의 상류의 표적 DNA의 절단을 매개하여 프로토스페이서 내에 DSB를 생성한다(도 2a). 이러한 실시예는 진핵 세포의 핵에서 CRISPR 복합체 활성을 유도하기 위해 이러한 RNA-프로그램화가능 뉴클레아제 시스템을 조정하는 예시적인 과정을 기술한다.
포유동물 세포에서의 CRISPR 성분의 발현을 향상시키기 위하여, 스트렙토코커스 피오게네스(S. 피오게네스)의 SF370 유전자좌 1 유래의 2개의 유전자, Cas9(SpCas9) 및 RNase III(SpRNase III)를 코돈-최적화시켰다. 핵 국소화를 용이하게 하기 위하여, 핵 국소화 신호(NLS)를 SpCas9 및 SpRNase III 둘 모두의 아미노(N)- 또는 카르복실(C)-말단에 포함시켰다(도 2b). 또한, 단백질 발현의 가시화를 용이하게 하기 위하여, 형광 단백질 마커도 또한 단백질 둘 모두의 N- 또는 C-말단에 포함시켰다(도 2b). NLS가 N- 및 C-말단 둘 모두에 부착된 SpCas9의 버전(2xNLS-SpCas9)도 또한 생성하였다. NLS-융합 SpCas9 및 SpRNase III를 함유하는 작제물을 293FT 인간 배아 신장(HEK) 세포 내로 트랜스펙션시키고, SpCas9 및 SpRNase III에 대한 NLS의 상대적 위치지정이 그들의 핵 국소화 효율에 영향을 미치는 것으로 관찰되었다. C-말단 NLS는 SpRNase III를 핵에 표적화시키는데 충분하였지만, 단일의 카피의 이들 특정 NLS를 SpCas9의 N- 또는 C-말단 중 어느 하나로 부착하면, 이러한 시스템에서 적당한 핵 국소화를 달성할 수 없었다. 이러한 실시예에서, C-말단 NLS는 뉴클레오플라스민의 것이었으며(KRPAATKKAGQAKKKK), C-말단 NLS는 SV40 대형 T-항원의 것이었다(PKKKRKV). 시험한 SpCas9의 버전 중에, 오직 2xNLS-SpCas9만이 핵 국소화를 나타내었다(도 2b).
스트렙토코커스 피오게네스 SF370의 CRISPR 유전자좌로부터의 tracrRNA은 2개의 전사 시작 부위를 가져, 89-뉴클레오티드(nt) 및 171 nt의 2개의 전사물을 야기하며, 이는 이후에 동일한 75 nt 성숙 tracrRNA로 가공된다. 보다 짧은 89 nt tracrRNA를 포유동물 세포에서의 발현을 위해 선택하였다(도 6b에 나타낸 서베이어 검정의 결과에 의해 결정시 작용성이 있는 도 6에 예시된 발현 작제물). 전사 시작 부위는 +1로 표시되며, 전사 종결자 및 노던 블롯에 의해 프로빙되는 서열도 또한 표시되어 있다. 가공된 tracrRNA의 발현도 또한 노던 블롯에 의해 확인하였다. 도 7c는 긴 또는 짧은 tracrRNA, 및 SpCas9 및 DR-EMX1(1)-DR을 지니는 U6 발현 작제물이 트랜스펙션된 293FT 세포로부터 추출된 전체 RNA의 노던 블롯 분석의 결과를 보여준다. 좌측 및 우측 패널은 각각 SpRNase III의 부재 또는 존재 하에 트랜스펙션된 293FT 세포로부터의 것이다. U6은 인간 U6 snRNA를 표적화하는 프로브로 블롯팅된 로딩 대조군을 나타낸다. 짧은 tracrRNA 발현 작제물의 트랜스펙션은 풍부한 수준의 tracrRNA의 가공된 형태를 야기한다(약 75 bp). 매우 소량의 긴 tracrRNA가 노던 블롯에서 검출된다.
정밀한 전사 개시를 촉진시키기 위하여 RNA 중합효소 III 기반의 U6 프로모터를 선택하여, tracrRNA의 발현을 유도하였다(도 2c). 유사하게, U6 프로모터 기반의 작제물을 2개의 직접 반복부(DR, 또한 용어 "tracr-메이트 서열"에 포함; 도 2c)가 측부 배치된 단일의 스페이서로 구성된 pre-crRNA 어레이를 발현하도록 발생시켰다. 초기 스페이서를 대뇌 피질의 발생의 주요 유전자인 인간 EMX1 유전자좌 내의 33-염기-쌍(bp) 표적 부위(30-bp 프로토스페이서 + Cas9의 NGG 인식 모티프를 만족시키는 3-bp CRISPR 모티프(PAM) 서열)를 표적화하도록 설계하였다(도 2c).
포유동물 세포에서 CRISPR 시스템(SpCas9, SpRNase III, tracrRNA 및 pre-crRNA)의 이종 발현이 포유동물 염색체의 표적화된 절단을 달성할 수 있는지를 시험하기 위하여, HEK 293FT 세포를 CRISPR 성분의 조합으로 트랜스펙션시켰다. 포유동물 핵에서 DSB가 삽입-결실의 형성을 야기하는 비-상동 말단 연결(NHEJ) 경로에 의해 부분적으로 수복되기 때문에, 서베이어 검정을 사용하여, 표적 EMX1 유전자좌에서 잠재적인 절단 활성을 검출하였다(예를 들어, 문헌[Guschin et al., 2010, Methods Mol Biol 649: 247] 참조). 모든 4개의 CRISPR 성분의 동시-트랜스펙션은 프로토스페이서 최대 5.0% 절단을 유도할 수 있었다(도 2d 참조). 또한, SpRNase III을 제한 모든 CRISPR 성분의 동시-트랜스펙션에 의해, 프로토스페이서에서 최대 4.7% 삽입-결실이 유도되었으며, 이는 crRNA 성숙을 보조할 수 있는 내인성 포유동물 RNase, 예를 들어, 관련 Dicer 및 Drosha 효소가 존재할 수 있음을 시사한다. 남아 있는 3개 성분 중 임의의 것의 제거에 의해, CRISPR 시스템의 게놈 절단 활성이 없어졌다(도 2d). 표적 유전자좌를 함유하는 앰플리콘(amplicon)의 생거(Sanger) 시퀀싱에 의해, 절단 활성이 입증되었으며: 43개의 시퀀싱된 클론 중에, 5개의 돌연변이된 대립형질(11.6%)이 관찰되었다. 다양한 가이드 서열을 사용하는 유사한 실험에 의해, 29%만큼 높은 삽입-결실 백분율을 생성하였다(도 4 내지 8, 10 및 11 참조). 이들 결과는 포유동물 세포에서의 효율적인 CRISPR-매개의 게놈 변형을 위한 3-성분 시스템을 정의한다.
절단 효율을 최적화시키기 위하여, 본 발명자들은 또한 상이한 아이소형의 tracrRNA가 절단 효율에 영향을 미치는지를 시험하였으며, 이러한 예시적인 시스템에서, 오직 짧은(89-bp) 전사물 형태만이 인간 EMX1 게놈 유전자좌의 절단을 매개할 수 있는 것이 관찰되었다. 도 9는 포유동물 세포에서의 crRNA 가공의 추가의 노던 블롯 분석을 제공한다. 도 9A는 2개의 직접 반복부가 측부 배치된 단일의 스페이서(DR-EMX1(1)-DR)에 대한 발현 벡터를 보여주는 개략도를 예시한다. 인간 EMX1 유전자좌 프로토스페이서 1을 표적화하는 30 bp 스페이서 및 직접 반복부 서열은 도 9A 아래의 서열에 나타나 있다. 선은 역-상보 서열을 사용하여 EMX1(1) crRNA 검출을 위한 노던 블롯 프로브를 생성한 영역을 나타낸다. 도 9B는 DR-EMX1(1)-DR을 지니는 U6 발현 작제물로 트랜스펙션된 293FT 세포로부터 추출된 전체 RNA의 노던 블롯 분석을 보여준다. 좌측 및 우측 패널은 각각 SpRNase III의 부재 또는 존재 하에 트랜스펙션된 293FT 세포로부터의 것이다. DR-EMX1(1)-DR은 SpCas9 및 짧은 tracrRNA의 존재 하에서만 성숙 crRNA로 처리되었고, SpRNase III의 존재에 따라 달라지지 않았다. 트랜스펙션된 293FT 전체 RNA로부터 검출된 성숙 crRNA는 약 33 bp이며, 스트렙토코커스 피오게네스로부터의 39 내지 42 bp 성숙 crRNA보다 더 짧다. 이들 결과는 CRISPR 시스템이 진핵 세포로 이식될 수 있으며, 내인성 포유동물 표적 폴리뉴클레오티드의 절단을 용이하게 하도록 재프로그램화될 수 있음을 보여준다.
도 2는 이러한 실시예에 기술된 박테리아 CRISPR 시스템을 예시한다. 도 2a는 스트렙토코커스 피오게네스 SF370으로부터의 CRISPR 유전자좌 1 및 이러한 시스템에 의한 제안된 CRISPR-매개의 DNA 절단의 메카니즘을 보여주는 개략도를 예시한다. 직접 반복부-스페이서 어레이로부터 가공된 성숙 crRNA는 Cas9를 상보성 프로토스페이서 및 프로토스페이서-인접 모티프(PAM)로 구성된 게놈 표적에 지향시킨다. 표적-스페이서 염기 쌍형성 시에, Cas9는 표적 DNA에서 이중 가닥 파단을 매개한다. 도 2b는 포유동물 핵으로의 유입을 가능하게 하는 핵 국소화 신호(NLS)가 있는 스트렙토코커스 피오게네스 Cas9(SpCas9) 및 RNase III(SpRNase III)의 조작을 예시한다. 도 2c는 정밀한 전사 개시 및 종결을 촉진하기 위한 구성성 EF1a 프로모터에 의해 유도되는 SpCas9 및 SpRNase III 및 RNA Pol3 프로모터 U6에 의해 유도되는 tracrRNA 및 pre-crRNA 어레이(DR-스페이서-DR)의 포유동물 발현을 예시한다. 만족스러운 PAM 서열이 있는 인간 EMX1 유전자좌로부터의 프로토스페이서는 pre-crRNA 검정에서 스페이서로 사용된다. 도 2d는 SpCas9-매개의 최소 삽입 및 결실을 위한 서베이어 뉴클레아제 검정을 예시한다. SpRNase III, tracrRNA 및 EMX1-표적 스페이서를 지니는 pre-crRNA 어레이의 존재 및 부재 하에 SpCas9를 발현시켰다. 도 2e는 표적 유전자좌와 EMX1-표적화 crRNA 사이의 염기 쌍형성의 개략적 표현, 및 SpCas9 절단 부위에 인접한 마이크로 결실을 보이는 예시적인 크로마토그램을 예시한다. 도 2f는 다양한 마이크로 삽입 및 결실을 보이는 43개의 클론 앰플리콘의 시퀀싱 분석으로부터 확인된 돌연변이된 대립형질을 예시한다. 줄표는 결실된 염기를 나타내며, 비-정렬 또는 미스매치된 염기는 삽입 또는 돌연변이를 나타낸다. 스케일 바(scale bar) = 10 ㎛.
3-성분 시스템을 더욱 단순화시키기 위하여, 키메라 crRNA-tracrRNA 하이브리드 설계를 조정하였으며, 여기서, 성숙 crRNA(가이드 서열 포함)는 스템-루프를 통해 부분 tracrRNA에 융합되어, 천연 crRNA:tracrRNA 듀플렉스를 모방한다(도 3A).
가이드 서열은 어닐링된 올리고뉴클레오티드를 사용하여 BbsI 부위 사이에 삽입될 수 있다. 센스 및 안티-센스 가닥 상의 프로토스페이서는 각각 DNA 서열 상측 및 하측에 표기되어 있다. 인간 PVALB 및 마우스 Th 유전자좌 각각에 대하여 6.3% 및 0.75%의 변형률이 달성되었으며, 이는 다수의 유기체에 걸쳐 상이한 유전자좌의 변형에서의 CRISPR 시스템의 넓은 응용가능성을 입증한다. 키메라 작제물을 사용하여 각 유전자좌에 대하여 3개의 스페이서 중 1개에서만 절단이 검출되었지만, 동시-발현되는 pre-crRNA 배열을 사용하는 경우 27%에 미치는 삽입-결실 생성 효율로, 모든 표적 서열이 절단되었다(도 4 및 5).
도 5는 SpCas9가 포유동물 세포에서 다수의 게놈 유전자좌를 표적화하도록 재프로그램화될 수 있다는 추가의 예시를 제공한다. 도 5a는 5개의 프로토스페이서의 위치를 밑줄이 있는 서열로 나타내어 보여주는 인간 EMX1 유전자좌의 개략도를 제공한다. 도 5b는 pre-crRNA의 직접 반복부 영역과 tracrRNA 간의 혼성화를 보여주는 pre-crRNA/trcrRNA 복합체의 개략도(상측) 및 20 bp 가이드 서열, 및 헤어핀 구조로 혼성화되는 부분 직접 반복부 및 tracrRNA 서열로 구성된 tracr 메이트 서열 및 tracr 서열을 포함하는 키메라 RNA 설계의 개략도(하측)를 제공한다. 인간 EMX1 유전자좌 내의 5개의 프로토스페이서에서의 Cas9-매개의 절단의 효능을 비교하는 서베이어 검정의 결과는 도 5c에 예시되어 있다. 각각의 프로토스페이서는 가공된 pre-crRNA/tracrRNA 복합체(crRNA) 또는 키메라 RNA(chiRNA)를 사용하여 표적화된다.
RNA의 2차 구조가 분자간 상호작용에 결정적일 수 있기 때문에, 최소 자유 에너지 및 볼쯔만(Boltzmann)-가중 구조 앙상블에 기초한 구조 예측 알고리즘을 사용하여 본 발명자들의 게놈 표적화 실험에 사용되는 모든 가이드 서열의 추정상 2차 구조를 비교하였다(도 3B)(예를 들어, 문헌[Gruber et al., 2008, Nucleic Acids Research, 36: W70] 참조). 분석에 의해, 대부분의 경우에, 키메라 crRNA 맥락에서 효율적인 가이드 서열에 2차 구조 모티프가 실질적으로 없지만, 비효율적인 가이드 서열은 표적 프로토스페이서 DNA와의 염기 쌍형성을 막을 수 있는 내부 2차 구조를 형성할 가능성이 더 큰 것으로 드러났다. 따라서, 키메라 crRNA를 사용하는 경우, 스페이서 2차 구조의 가변성이 CRISPR-매개 간섭의 효율에 영향을 미칠 수 있다.
도 3은 예시적인 발현 벡터를 예시한다. 도 3A는 합성 crRNA-tracrRNA 키메라(키메라 RNA), 및 SpCas9의 발현을 유도하기 위한 비-시스트로닉 벡터의 개략도를 제공한다. 키메라 가이드 RNA는 게놈 표적 부위 내의 프로토스페이서에 상응하는 20-bp 가이드 서열을 함유한다. 도 3B는 인간 EMX1, PVALB, 및 마우스 Th 유전자좌를 표적화하는 가이드 서열, 및 그들의 예측된 2차 구조를 보여주는 개략도를 제공한다. 각 표적 부위에서의 변형 효율은 RNA 2차 구조 도면 아래에 표기되어 있다(EMX1, n = 216개 앰플리콘 시퀀싱 판독치; PVALB, n = 224개 판독치; Th, n = 265개 판독치). 폴딩 알고리즘에 의해, 레인보우 스케일로 표기시 각 염기가 예측되는 2차 구조의 그의 추정 확률에 따라 채색된 결과가 생성되었으며, 이는 도 3B에 그레이 스케일로 재현된다. 가이드 올리고에 대한 삽입 부위에 연결된 U6 프로모터 및 SpCas9 코딩 서열에 연결된 Cbh 프로모터를 혼입한 단일의 발현 벡터를 포함하는 SpCas9에 대한 추가의 벡터 설계는 도 3A에 나타나 있다.
천연적으로 CRISPR이 작동되는 원핵 세포에서 2차 구조를 함유하는 스페이서가 기능할 수 있는지를 시험하기 위하여, 프로토스페이서를 지니는 플라스미드의 형질전환 간섭을, 스트렙토코커스 피오게네스 SF370 CRISPR 유전자좌 1을 이종 발현하는 에스케리키아 콜라이 균주에서 시험하였다(도 3C). CRISPR 유전자좌를 저-카피 에스케리키아 콜라이 발현 벡터로 클로닝하고, crRNA 어레이를 DR의 쌍이 측부 배치된 단일의 스페이서로 대체하였다(pCRISPR). 상이한 pCRISPR 플라스미드를 지니는 에스케리키아 콜라이 균주를, 상응하는 프로토스페이서 및 PAM 서열을 함유하는 챌린지 플라스미드로 형질전환시켰다(도 3C). 박테리아 검정에서, 모든 스페이서는 효율적인 CRISPR 간섭을 촉진시켰다(도 3C). 이들 결과는 포유동물 세포에서 CRISPR 활성의 효율에 영향을 미치는 추가의 인자가 존재함을 시사한다.
CRISPR-매개의 절단의 특이성을 조사하기 위하여, 포유동물 게놈에서 프로토스페이서 절단에 대한 가이드 서열 내의 단일-뉴클레오티드 돌연변이의 영향을, 단일의 점 돌연변이가 있는 일련의 EMX1-표적화 키메라 crRNA를 사용하여 분석하였다(도 4a). 도 4b는 상이한 돌연변이 키메라 RNA와 쌍을 형성하는 경우, Cas9의 절단 효율을 비교하는 서베이어 뉴클레아제 검정의 결과를 예시한다. PAM의 최대 12-bp 5'의 단일-염기 미스매치는 SpCas9에 의한 게놈 절단을 없애는 한편, 더 먼 상류 위치에 돌연변이가 있는 스페이서는 원래의 프로토스페이서 표적에 대한 활성을 보유하였다(도 4b). PAM에 더하여, SpCas9는 마지막 12-bp의 스페이서 내에 단일-염기 특이성을 갖는다. 또한, CRISPR은 동일한 EMX1 프로토스페이서를 표적화하는 TALE 뉴클레아제(TALEN)의 쌍만큼 효율적으로 게놈 절단을 매개할 수 있다. 도 4c는 EMX1을 표적화하는 TALEN의 설계를 보여주는 개략도를 제공하며, 도 4d는 TALEN 및 Cas9의 효율을 비교하는 서베이어 겔을 보여준다(n=3).
오류-유발 NHEJ 메카니즘을 통해 포유동물 세포에서 CRISPR-매개의 유전자 교정을 달성하기 위한 성분의 세트를 확립하면, 상동성 재조합(HR), 게놈에서 정밀한 교정을 이루기 위한 고충실도 유전자 수복 경로를 자극하는 CRISPR의 능력을 시험하였다. 야생형 SpCas9는 부위-특이적 DSB를 매개할 수 있는데, 이는 NHEJ 및 HR 둘 모두를 통해 수복될 수 있다. 또한, SpCas9의 RuvC I 촉매 도메인에서의 아스파르트산염에서 알라닌으로의 치환(D10A)을 조작하여 뉴클레아제를 닉카아제로 전환시켜(SpCas9n; 도 5a에 예시)(예를 들어, 문헌[Sapranausaks et al., 2011, Cucleic Acis Research, 39: 9275]; 문헌[Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109:E2579] 참조), 닉이 있는 게놈 DNA가 고-충실도 상동성-유도 수복(HDR)을 겪게 하였다. 서베이어 검정에 의해, SpCas9n이 EMX1 프로토스페이서 표적에서 삽입-결실을 생성하지 않음이 확인되었다. 도 5b에 예시된 바와 같이, EMX1-표적화 키메라 crRNA와 SpCas9의 동시-발현에 의해, 표적 부위에서 삽입-결실이 생성되는 한편, SpCas9n과의 동시-발현은 그렇지 않았다(n=3). 또한, 327개 앰플리콘의 시퀀싱에 의해, SpCas9n에 의해 유도되는 임의의 삽입-결실이 검출되지 않았다. 동일한 유전자좌를 선택하여, HEK 293FT 세포를 EMX1, hSpCas9 또는 hSpCas9n을 표적화하는 키메라 RNA, 및 프로토스페이서 근처에 제한 부위(HindIII 및 NheI)의 쌍을 도입하기 위한 HR 주형으로 동시-트랜스펙션시킴으로써 CRISPR-매개의 HR을 시험하였다. 도 5c는 재조합 지점 및 프라이머 어닐링 서열(화살표)의 상대적 위치와 함께, HR 전략의 개략적 예시를 제공한다. SpCas9 및 SpCas9n은 실제로 HR 주형이 EMX1 유전자좌로 통합되는 것을 촉매작용시킨다. 표적 영역의 PCR 증폭 후에, HindIII를 사용한 제한 분해에 의해, 예상되는 단편 크기(도 5d에 나타낸 제한 단편 길이 다형성 겔 분석에서 화살표)에 상응하는 절단 산물이 나타났으며, SpCas9 및 SpCas9n은 유사한 수준의 HR 효율을 매개한다. 본 발명자들은 게놈 앰플리콘의 생거 시퀀싱을 사용하여 HR을 추가로 입증하였다(도 5e). 이들 결과는 포유동물 게놈 내로의 표적화된 유전자 삽입을 촉진시키기 위한 CRISPR의 유용성을 입증한다. 야생형 SpCas9의 14-bp(스페이서로부터 12-bp 및 PAM으로부터 2-bp) 표적 특이성을 고려하여, 단일 가닥 파단이 오류-유발 NHEJ 경로에 대한 기질이 아니기 때문에, 닉카아제의 이용가능성은 표적외 변형 가능성을 상당히 감소시킬 수 있다.
배열된 스페이서가 있는 CRISPR 유전자좌의 천연 구조를 모방하는 발현 작제물(도 2a)을 작제하여, 다중 서열 표적화의 가능성을 시험하였다. EMX1- 및 PVALB-표적화 스페이서의 쌍을 인코딩하는 단일의 CRISPR 어레이를 사용하여, 둘 모두의 유전자좌에서의 효율적인 절단이 검출되었다(도 4f, crRNA 어레이의 개략적 설계 및 효율적인 절단의 매개를 보여주는 서베이어 블롯을 보여줌). 119 bp 만큼 이격된 EMX1 내의 2개의 표적에 대한 스페이서를 사용하여 동시 발생 DSB을 통한 보다 큰 게놈 영역의 표적화된 결실도 또한 시험하고, 1.6% 결실 효능(182개 앰플리콘 중 3개; 도 5g)을 검출하였다. 이는 CRISPR 시스템이 단일의 게놈 내에서 다중화 교정을 매개할 수 있음을 나타낸다.
실시예 2: CRISPR 시스템 변형 및 대안
서열-특이적 DNA 절단을 프로그램화시키기 위하여 RNA를 사용하는 능력은 다양한 연구 및 산업 응용을 위한 신규한 부류의 게놈 조작 도구를 정한다. CRISPR 시스템의 몇몇 양태를 추가로 향상시켜, CRISPR 표적화의 효율 및 다능성을 증가시킬 수 있다. 최적의 Cas9 활성은 포유동물 핵에 존재하는 것보다 더 높은 수준의 유리 Mg2 +의 이용가능성에 따라 달라질 수 있으며(예를 들어, 문헌[Jinek et al., 2012, Science, 337:816] 참조), 프로토스페이서의 인접 하류 NGG 모티프에 대한 선호는 인간 게놈에서 평균하여 12-bp 마다를 표적화하는 능력을 제한한다. 이들 제약 중 일부는 미생물 메타게놈에 걸친 CRISPR 유전자좌의 다양성을 연구함으로써 극복될 수 있다(예를 들어, 문헌[Makarova et al., 2011, Nat Rev Microbiol, 9:467] 참조). 다른 CRISPR 유전자좌는 실시예 1에 기술된 것과 유사한 과정에 의해 포유동물 세포 환경으로 이식될 수 있다. 각 표적 부위에서의 변형 효율은 RNA 2차 구조 아래에 표기되어 있다. 구조를 생성하는 알고리즘은 예측되는 2차 구조의 그의 추정 확률에 따라 각 염기를 채색한다. RNA 가이드 스페이서 1 및 2는 각각 14% 및 6.4%를 유도하였다. 이들 2개의 프로토스페이서 부위에서의 생물학적 반복 검증에 걸친 절단 활성의 통계적 분석도 또한 도 7에 제공된다.
실시예 3: 샘플 표적 서열 선택 알고리즘
소프트웨어 프로그램을 설계하여, 특정 CRISPR 효소에 대하여 요망되는 가이드 서열 길이 및 CRISPR 모티프 서열(PAM)에 기초하여 투입 DNA 서열의 둘 모두의 가닥에서 후보 CRISPR 표적 서열을 확인한다. 예를 들어, PAM 서열 NGG가 있는 스트렙토코커스 피오게네스 유래의 Cas9에 대한 표적 부위는 투입 서열, 및 투입 서열의 역-상보물 둘 모두에서 5'-Nx-NGG-3'을 검색함으로써 확인될 수 있다. 마찬가지로, PAM 서열 NNAGAAW가 있는 스트렙토코커스 써모필러스 CRISPR1의 Cas9에 대한 표적 부위는 투입 서열, 및 투입 서열의 역-상보물 둘 모두에서 5'-Nx-NNAGAAW-3'을 검색함으로써 확인될 수 있다. 마찬가지로, PAM 서열 NGGNG가 있는 스트렙토코커스 써모필러스 CRISPR3의 Cas9에 대한 표적 부위는 투입 서열, 및 투입 서열의 역-상보물 둘 모두에서 5'-Nx-NGGNG-3'을 검색함으로써 확인될 수 있다. Nx에서 값 "x"는 프로그램에 의해 고정되거나, 사용자에 의해 지정될 수 있으며, 예를 들어, 20일 수 있다.
게놈에서의 DNA 표적 부위의 다수의 존재가 비특이적인 게놈 교정을 야기할 수 있기 때문에, 모든 가능한 부위를 확인한 후에, 프로그램은 그들이 관련 참조 게놈에 나타나는 횟수에 기초하여 서열을 필터링한다. 서열 특이성이 '씨드(seed)' 서열, 예를 들어, PAM 서열 그 자체를 포함하여 PAM 서열로부터 5'의 11 내지 12 bp에 의해 결정되는 CRISPR 효소에 있어서, 필터링 단계는 씨드 서열에 기초하여 이루어질 수 있다. 따라서, 추가의 게놈 유전자좌에서 교정을 피하기 위하여, 결과는 관련 게놈에서의 씨드:PAM 서열의 발생 수에 기초하여 필터링된다. 사용자가 씨드 서열의 길이를 선택하게 할 수 있다. 또한, 필터를 통과시키기 위하여, 사용자가 게놈 내의 씨드:PAM 서열의 발생 수를 지정하게 할 수 있다. 디폴트는 독특한 서열에 대하여 스크리닝하는 것이다. 여과 수준은 씨드 서열의 길이와 게놈에서의 서열의 발생 수 둘 모두를 변화시킴으로써 변경된다. 프로그램은 추가로 또는 대안적으로, 확인된 표적 서열(들)의 역 상보물을 제공함으로써 보고된 표적 서열(들)에 상보적인 가이드 서열의 서열을 제공할 수 있다.
서열 선택을 최적화시키기 위한 방법 및 알고리즘의 추가의 상세사항은 본원에 참조로 포함되는 미국 출원 TBA(브로드 참조번호 BI-2012/084 44790.11.2022)에서 찾을 수 있다.
실시예 4: 다중 키메라 crRNA - tracrRNA 하이브리드의 평가
본 실시예는 상이한 길이의 야생형 tracrRNA 서열이 혼입된 tracr 서열을 갖는 키메라 RNA(chiRNA; 단일의 전사물에 가이드 서열, tracr 메이트 서열 및 tracr 서열을 포함)에 대해 수득된 결과를 기술한다. 도 18a는 키메라 RNA 및 Cas9에 대한 비시스트로닉 발현 벡터의 개략도를 예시한다. Cas9는 CBh 프로모터에 의해 유도되며, 키메라 RNA는 U6 프로모터에 의해 유도된다. 키메라 가이드 RNA는 표기된 바와 같은 다양한 위치에서 절단되는 tracr 서열(하부 가닥의 처음 "U"에서 전사물의 마지막까지 계속)에 연결된 20 bp 가이드 서열(N)로 구성된다. 가이드 및 tracr 서열은 tracr-메이트 서열 GUUUUAGAGCUA에 이어서 루프 서열 GAAA에 의해 분리된다. 인간 EMX1 및 PVALB 유전자좌에서의 Cas9-매개의 삽입-결실에 대한 서베이어 검정의 결과는 각각 도 18b 및 도 18c에 예시되어 있다. 화살표는 예상된 서베이어 단편을 나타낸다. chiRNA는 그들의 "+n" 표기로 표시되며, crRNA는 가이드 및 tracr 서열이 개별 전사물로서 발현되는 하이브리드 RNA를 지칭한다. 3벌로 수행되는 이들 결과의 정량화는 각각 도 10b 및 도 10c에 상응하는 도 11a 및 도 11b의 히스토그램에 의해 예시되어 있다("N.D."는 삽입-결실이 검출되지 않음을 나타낸다). 프로토스페이서 ID 및 그들의 상응하는 게놈 표적, 프로토스페이서 서열, PAM 서열 및 가닥 위치는 표 D에 제공되어 있다. 하이브리드 시스템에서 개별 전사물의 경우에는 전체 프로토스페이서 서열에 상보적이거나, 키메라 RNA의 경우에는 밑줄이 있는 부분에만 상보성이도록 가이드 서열을 설계하였다.
세포 배양 및 트랜스펙션 .
인간 배아 신장(HEK) 세포주 293FT(라이프 테크놀로지즈)를 10% 우태아혈청(하이클론), 2mM GlutaMAX(라이프 테크놀로지즈), 100U/㎖ 페니실린 및 100㎍/㎖ 스트렙토마이신이 보충된 둘베코 개질 이글스 배지(DMEM)에서 37℃에서 5% C02 인큐베이션시키면서 유지시켰다. 293FT 세포를 웰마다 150,000개 세포의 밀도로 트랜스펙션 24시간 전에 24-웰 플레이트(코닝)에 씨딩하였다. 세포를 제조사의 권고된 프로토콜에 따라 리포펙타민 2000(라이프 테크놀로지즈)을 사용하여 트랜스펙션시켰다. 24-웰 플레이트의 각 웰에 대하여 총 500 ng의 플라스미드를 사용하였다.
게놈 변형에 대한 서베이어 검정
293FT 세포를 상기 기재한 바와 같이 플라스미드 DNA로 트랜스펙션하였다. 게놈 DNA 추출 전에, 트랜스펙션 후 72시간 동안 37℃에서 세포를 인큐베이션하였다. 게놈 DNA를 제조사의 프로토콜에 따라 퀵익스트랙트 DNA 추출 용액(에피센트레)을 사용하여 추출하였다. 간략하게, 펠렛화된 세포를 퀵익스트랙트 용액에 재현탁화시키고, 65℃에서 15분 동안 및 98℃에서 10분 동안 인큐베이션하였다. 각 유전자에 대한 CRISPR 표적 부위의 측부에 배치된 게놈 부위를 PCR 증폭시키고(표 E에 열거된 프라이머), 산물을 제조사의 프로토콜에 따라 퀴아퀵 스핀 컬럼(퀴아젠)을 사용하여 정제하였다. 총 400 ng의 정제된 PCR 산물을 2㎕ 10X Taq DNA 중합효소 PCR 완충제(엔자이머틱스) 및 초순수와 총 20 ㎕ 부피로 혼합하고, 재어닐링 과정을 거치게 하여 헤테로듀플렉스가 형성되게 하였다: 95℃에서 10분, 95℃에서 85℃(-2℃/초로 램핑), 85℃에서 25℃(-0.25℃/초), 및 25℃에서 1분 유지. 재어닐링 후, 산물을 제조사의 권고 프로토콜에 따라 서베이어 뉴클레아제 및 서베이어 인핸서 S(트랜스게노믹스)로 처리하고, 4 내지 20% 노벡스 TBE 폴리-아크릴아미드 겔(라이프 테크놀로지즈)에서 분석하였다. 겔을 SYBR 골드 DNA 염색제(라이프 테크놀로지즈)로 30분 동안 염색하고, Gel Doc 겔 영상화 시스템(바이오-라드)으로 영상화하였다. 정량화는 상대적 밴드 세기를 기반으로 하였다.
독특한 CRISPR 표적 부위의 컴퓨터에 의한 확인
인간, 마우스, 랫트, 제브라피시, 초파리 및 C. 엘레간스 게놈에서 스트렙토코커스 피오게네스 SF370 Cas9(SpCas9) 효소에 대한 독특한 표적 부위를 확인하기 위하여, 본 발명자들은 DNA 서열의 둘 모두의 가닥을 스캐닝하고, 모든 가능한 SpCas9 표적 부위를 확인하기 위한 소프트웨어 패키지를 개발하였다. 이러한 실시예에 있어서, 각각의 SpCas9 표적 부위는 작용에 있어서 NGG 프로토스페이서 인접 모티프(PAM) 서열이 뒤에 오는 20 bp 서열로서 정의되며, 본 발명자들은 모든 염색체에서 이러한 5'-N20-NGG-3' 정의를 만족시키는 모든 서열을 확인하였다. 비-특이적인 게놈 교정을 방지하기 위하여, 모든 잠재적인 부위를 확인한 후에, 모든 표적 부위를 그들이 관련 참조 게놈에 나타나는 횟수에 기초하여 필터링하였다. 예를 들어, PAM 서열로부터 5'의 대략 11 내지 12 bp 서열일 수 있는 '씨드' 서열에 의해 부여되는 Cas9 활성의 서열 특이성을 이용하기 위하여, 5'-NNNNNNNNNN-NGG-3' 서열이 관련 게놈에서 독특한 것으로 선택되었다. 모든 게놈 서열을 UCSC 게놈 브라우저(Genome Browser)(인간 게놈 hg19, 마우스 게놈 mm9, 랫트 게놈 rn5, 제브라피시 게놈 danRer7, 드로소필라 멜라노개스터(D. melanogaster) 게놈 dm4 및 C. 엘레간스 게놈 ce10)로부터 다운로드하였다. UCSC 게놈 브라우저 정보를 사용하여 브라우징하기 위하여 전체 검색 결과가 이용가능하다. 인간 게놈 내의 몇몇 표적 부위의 예시적인 가시화가 도 22에 제공되어 있다.
먼저, 인간 HEK 293FT 세포에서 EMX1 유전자좌 내의 3개의 부위를 표적화시켰다. 각 chiRNA의 게놈 변형 효율을 서베이어 뉴클레아제 검정을 사용하여 평가하였으며, 이 검정은 DNA 이중-가닥 파단(DSB) 및 비-상동성 말단 연결(NHEJ) DNA 손상 수복 경로에 의한 그들의 이후의 수복으로부터 야기되는 돌연변이를 검출한다. chiRNA(+n)로 표기된 작제물은 야생형 tracrRNA의 최대 +n 뉴클레오티드가 키메라 RNA 작제물에 포함되는 것을 나타내며, 48, 54, 67 및 85의 값이 n에 대해 사용된다. 보다 긴 야생형 tracrRNA의 단편을 함유하는 키메라 RNA(chiRNA(+67) 및 chiRNA(+85))는 모든 3개의 EMX1 표적 부위에서 DNA 절단을 매개하며, chiRNA(+85)는 특히 개별 전사물에서 가이드 및 tracr 서열을 발현하는 상응하는 crRNA/tracrRNA 하이브리드보다 상당히 더 높은 수준의 DNA 절단을 나타낸다(도 10b 및 도 10a). 또한, 하이브리드 시스템(개별 전사물로 발현되는 가이드 서열 및 tracr 서열)을 사용하여 검출가능한 절단을 제공하지 않는 PVALB 유전자좌 내의 2개의 부위를 chiRNA를 사용하여 표적화하였다. chiRNA(+67) 및 chiRNA(+85)는 2개의 PVALB 프로토스페이서에서 상당한 절단을 매개할 수 있었다(도 10c 및 도 10b).
EMX1 및 PVALB 유전자좌 내의 모든 5개의 표적에 있어서, tracr 서열 길이의 증가와 일치하는 게놈 변형 효율의 증가가 관찰되었다. 임의의 이론에 구속되지 않고, tracrRNA의 3' 말단에 의해 형성되는 2차 구조는 CRISPR 복합체 형성 비율을 향상시키는데 역할을 수행할 수 있다. 본 실시예에 사용되는 키메라 RNA의 각각에 대하여 예측된 2차 구조의 예시는 도 21에 제공되어 있다. 2차 구조를 최소 자유 에너지 및 분배 함수 알고리즘을 사용하는 RNAfold(http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi)를 사용하여 예측하였다. 각 염기에 대한 의사 색채(pseudocolor)(그레이 스케일로 재현)는 쌍형성 가능성을 나타낸다. 보다 긴 tracr 서열을 갖는 chiRNA가 고유 CRISPR crRNA/tracrRNA 하이브리드에 의해 절단될 수 없었던 표적을 절단할 수 있기 때문에, 키메라 RNA가 그의 고유 하이브리드 대응물보다 더욱 효율적으로 Cas9에 로딩될 수 있다. 진핵 세포 및 유기체에서 부위-특이적 게놈 교정을 위한 Cas9의 응용을 용이하게 하기 위하여, 스트렙토코커스 피오게네스 Cas9에 대한 모든 예측된 독특한 표적 부위를 인간, 마우스, 랫트, 지브라피시, C. 엘레간스 및 드로소필라 멜라노개스터 게놈에서 컴퓨터로 확인하였다. 키메라 RNA를 다른 미생물 유래의 Cas9 효소를 위해 설계하여, CRISPR RNA-프로그램화가능한 뉴클레아제의 표적 공간을 확대할 수 있다.
도 11 및 도 21은 야생형 tracr RNA 서열의 최대 +85 뉴클레오티드 및 핵 국소화 서열이 있는 SpCas9를 포함하는 키메라 RNA의 발현을 위한 예시적인 비시스트로닉 발현 벡터를 예시한다. SpCas9는 CBh 프로모터로부터 발현되며, bGH 폴리A 신호(bGH pA)로 종결된다. 개략도 바로 아래에 예시되어 있는 확대된 서열은 가이드 서열 삽입 부위 주위의 영역에 상응하며, 5'에서 3'으로, U6 프로모터의 3'-부분(제1 음영 영역), BbsI 절단 부위(화살표), 부분 직접 반복부(tracr 메이트 서열 GTTTTAGAGCTA, 밑줄), 루프 서열 GAAA, 및 +85 tracr 서열(루프 서열 뒤의 밑줄이 있는 서열)을 포함한다. 예시적인 가이드 서열 삽입물은 가이드 서열 삽입 부위 아래에 예시되어 있으며, 선택된 표적에 대한 가이드 서열의 뉴클레오티드는 "N"으로 표시된다.
상기 실시예에 기술된 서열은 하기와 같다(폴리뉴클레오티드 서열은 5'에서 3'이다):
U6-짧은 tracrRNA(스트렙토코커스 피오게네스 SF370):
U6-긴 tracrRNA(스트렙토코커스 피오게네스 SF370):
U6-DR-BbsI 백본-DR(스트렙토코커스 피오게네스 SF370):
U6-키메라 RNA-BbsI 백본(스트렙토코커스 피오게네스 SF370)
NLS-SpCas9-EGFP:
SpCas9-EGFP-NLS:
NLS-SpCas9-EGFP-NLS:
NLS-SpCas9-NLS:
NLS-mCherry-SpRNase3:
SpRNase3-mCherry-NLS:
NLS-SpCas9n-NLS(D10A 닉카아제 돌연변이는 소문자임):
hEMX1-HR 주형-HindII-NheI:
NLS-StCsn1-NLS:
U6-St_tracrRNA(7-97):
U6-DR-스페이서-DR(스트렙토코커스 피오게네스 SF370)
+48 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
+54 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
+67 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
+85 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
CBh-NLS-SpCas9-NLS
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR3 Cas9에 대한 예시적인 키메라 RNA(NGGNG의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR3 유전자좌 유래의 Cas9의 코돈-최적화 버전(5' 및 3' 말단 둘 모두에 NLS 존재)
실시예 5: 스트렙토코커스 피오게네스 Cas9(SpCas9로 지칭)에 대한 가이드 RNA의 최적화
본 발명자들은 세포에서 RNA를 증가시키기 위하여 tracrRNA 및 직접 반복부 서열을 돌연변이시키거나 키메라 가이드 RNA를 돌연변이시켰다.
최적화는 tracrRNA 및 가이드 RNA 내에 티민(T)의 스트레치가 존재한다는 관찰을 기초로 한 것이며, 이는 pol 3 프로모터에 의한 조기 전사 종결을 야기할 수 있다. 따라서, 본 발명자들은 하기의 최적화된 서열을 생성하였다. 최적화된 tracrRNA 및 상응하는 최적화된 직접 반복부가 쌍으로 제시되어 있다.
최적화된 tracrRNA 1(돌연변이는 밑줄):
최적화된 직접 반복부 1(돌연변이는 밑줄):
최적화된 tracrRNA 2(돌연변이는 밑줄):
최적화된 직접 반복부 2(돌연변이는 밑줄):
또한, 본 발명자들은 진핵 세포에서의 최적의 활성을 위해 키메라 가이드 RNA를 최적화시켰다.
원래 가이드 RNA:
최적화된 키메라 가이드 RNA 서열 1:
최적화된 키메라 가이드 RNA 서열 2:
최적화된 키메라 가이드 RNA 서열 3:
본 발명자들은 최적화된 키메라 가이드 RNA가 도 9에 나타낸 바와 같이 더 잘 작동하는 것을 보여주었다. 293FT 세포를 Cas9 및 U6-가이드 RNA DNA 카세트로 동시-트랜스펙션시켜, 상기 나타낸 4개의 RNA 형태 중 하나를 발현함으로써 실험을 행하였다. 가이드 RNA의 표적은 인간 Emx1 유전자좌 내의 동일한 표적 부위이다: "GTCACCTCCAATGACTAGGG".
실시예 6: 스트렙토코커스 써모필러스 LMD -9 CRISPR1 Cas9(St1Cas9로 지칭)의 최적화
본 발명자들은 도 12에 나타낸 바와 같이 가이드 키메라 RNA를 설계하였다.
St1Cas9 가이드 RNA는 폴리 티민(T)의 스트레치를 파단시킴으로써, SpCas9 가이드 RNA에 대해서와 동일한 유형의 최적화를 겪을 수 있다.
실시예 7: 생체내 응용을 위한 Cas9 시스템의 향상
본 발명자들은 분자량이 작은 Cas9에 대한 메타게놈 검색을 행하였다. 대부분의 Cas9 상동체는 상당히 크다. 예를 들어, SpCas9는 대략 1368aa 길이이며, 이는 전달을 위해 바이러스 벡터로 용이하게 패키징되기에 너무 크다. 서열 중 일부는 잘못 주석 추가(mis-annotated)될 수 있으며, 이에 따라, 각 길이에 대한 정밀한 빈도는 본질적으로 정확하지 않을 수 있다. 그럼에도 불구하고, 그것은 Cas9 단백질의 분포의 일별을 제공하며, 보다 짧은 Cas9 상동체가 존재하는 것을 시사한다.
전산 분석을 통하여, 본 발명자들은 박테리아 균주 캄필로박터에서, 1000개 미만의 아미노산이 있는 2개의 Cas9 단백질이 존재하는 것을 관찰하였다. 캄필로박터 제주니(Campylobacter jejuni)로부터의 하나의 Cas9의 서열이 하기에 제시되어 있다. 이러한 길이에서, CjCas9는 일차 세포, 및 동물 모델에서 생체내로의 강력한 전달을 위해 AAV, 렌티바이러스, 아데노바이러스 및 다른 바이러스 벡터로 용이하게 패키징될 수 있다.
>캄필로박터 제주니 Cas9(CjCas9)
이러한 CjCas9에 대한 추정의 tracrRNA 요소는 하기와 같다:
직접 반복부 서열은 하기와 같다:
tracrRNA 및 직접 반복부의 동시-폴드 구조는 도 6에 제공되어 있다.
CjCas9에 대한 키메라 가이드RNA의 예는 하기와 같다:
또한, 본 발명자들은 시험관내 방법을 사용하여 Cas9 가이드 RNA를 최적화시켰다. 도 18은 시험관내 St1Cas9 키메라 가이드 RNA 최적화로부터의 데이터를 보여준다.
본 발명의 바람직한 구현예가 본원에 나타나고 기술되어 있지만, 이러한 구현예가 오직 예시로만 제공되는 것이 당업자에게 명백할 것이다. 수많은 변이, 변화 및 치환이 이제 본 발명으로부터 벗어남 없이, 당업자에게 일어날 것이다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 하기의 청구범위가 본 발명의 범주를 한정하며, 이들 청구범위의 범주 내의 방법 및 구조, 및 그들의 등가물이 그에 의해 커버되는 것으로 의도된다.
실시예 8: Sa sgRNA 최적화
본 발명자들은 가장 높은 절단 효능이 있는 최적의 절단 구조를 위해, SaCas9에 대한 5개의 sgRNA 변이체를 설계하였다. 또한, 고유 직접 반복부:tracr 듀플렉스 시스템을 sgRNA와 함께 시험하였다. 표기된 길이가 있는 가이드를 SaCas9와 동시에 트랜스펙션시키고, 활성에 대하여 HEK 293FT 세포에서 시험하였다. 총 100ng의 sgRNA U6-PCR 앰플리콘(또는 50ng의 직접 반복부 및 50ng의 tracrRNA) 및 400ng의 SaCas9 플라스미드를 200,000개의 Hepa1-6 마우스 간세포로 동시-트랜스펙션시키고, DNA를 서베이어 분석을 위해 트랜스펙션후 72시간에 수집하였다. 결과는 도 23에 나타나 있다.
참조문헌
본 발명의 바람직한 구현예가 본원에 나타나고 기술되어 있지만, 이러한 구현예가 오직 예시로만 제공되는 것이 당업자에게 명백할 것이다. 수많은 변이, 변화 및 치환이 이제 본 발명으로부터 벗어남 없이, 당업자에게 일어날 것이다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다.
도 1은 CRISPR 시스템의 개략적 모델을 보여준다. 스트렙토코커스 피오게네스 유래의 Cas9 뉴클레아제(황색)는 20-nt 가이드 서열(청색) 및 스캐폴드(적색)로 이루어진 합성 가이드 RNA(sgRNA)에 의해 게놈 DNA에 표적화된다. 가이드 서열은 필수 5'-NGG 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM; 진홍색)의 인접 상류의 DNA 표적(청색)과 염기쌍을 형성하며, Cas9는 PAM의 약 3 bp 상류(적색 삼각형)에서 이중 가닥 파단(DSB)을 매개한다.
도 2a 내지 도 2f는 예시적인 CRISPR 시스템, 가능한 작용 메카니즘, 진핵 세포에서의 발현을 위한 예시적인 적합화, 및 핵 국소화 및 CRISPR 활성을 평가하는 시험의 결과를 예시한다.
도 3A 내지 도 3C는 진핵 세포에서의 CRISPR 시스템 요소의 발현을 위한 예시적인 발현 카세트, 예시적인 가이드 서열의 예측된 구조, 및 진핵 및 원핵 세포에서 측정시 CRISPR 시스템 활성을 예시한다.
도 4a 내지 도 4d는 예시적인 대상체에 대한 SpCas9 특이성의 평가의 결과를 예시한다.
도 5a 내지 도 5g는 예시적인 벡터 시스템 및 진핵 세포에서 상동성 재조합의 유도에서의 그의 사용에 대한 결과를 예시한다.
도 6a 내지 도 6c는 Cas9-매개의 유전자 표적화를 위한 상이한 tracrRNA 전사물의 비교를 예시한다.
도 7a 내지 도 7d는 예시적인 CRISPR 시스템, 진핵 세포에서의 발현을 위한 예시적인 적합화 및 CRISPR 활성을 평가하는 시험의 결과를 예시한다.
도 8A 내지 도 8C는 포유동물 세포 내의 게놈 유전자좌의 표적화를 위한 CRISPR 시스템의 예시적인 조작을 예시한다.
도 9A 및 도 9B는 포유동물 세포에서 crRNA 가공의 노던 블롯(Northern blot) 분석의 결과를 예시한다.
도 10a 내지 도 10c는 키메라 RNA의 개략적 표현 및 진핵 세포에서의 CRISPR 시스템 활성에 대한 서베이어(SURVEYOR) 검정의 결과를 예시한다.
도 11a 및 도 11b는 진핵 세포에서 CRISPR 시스템 활성에 대한 서베이어 검정의 결과의 그래프 표현을 예시한다.
도 12는 가이드 서열, tracr 메이트 서열 및 tracr 서열을 포함하는 예시적인 키메라 RNA에 대한 예측된 2차 구조를 예시한다.
도 13은 Cas 유전자의 계통수이다.
도 14a 내지 도 14f는 3개 그룹의 큰 Cas9(약 1400개 아미노산) 및 2개 그룹의 작은 Cas9(약 1100개 아미노산)를 포함하는 5개 과의 Cas9를 보여주는 계통 분석을 보여준다.
도 15는 상이한 최적화된 가이드 RNA의 기능을 도시하는 그래프를 보여준다.
도 16은 상이한 가이드 키메라 RNA의 서열 및 구조를 보여준다.
도 17은 tracrRNA 및 직접 반복부의 동시-폴드 구조를 보여준다.
도 18a 및 도 18b는 시험관내 St1Cas9 키메라 가이드 RNA 최적화로부터의 데이터를 보여준다.
도 19a 및 도 19b는 SpCas9 세포 용해물에 의한 비메틸화 또는 메틸화 표적 중 어느 하나의 절단을 보여준다.
도 20a 내지 도 20g는 SpCas9-매개의 포유동물 게놈 교정을 위한 가이드 RNA 구조의 최적화를 보여준다. (a) 모든 이후의 실험을 위해 사용된 U6 프로모터-유도 단일의 가이드 RNA(sgRNA) 및 CBh 프로모터-유도 인간 코돈-최적화 스트렙토코커스 피오게네스 Cas9(hSpCas9)에 대한 비시스트로닉 발현 벡터(PX330)의 개략도. sgRNA는 표기된 다양한 위치에서 절단된 20-nt 가이드 서열(청색) 및 스캐폴드(적색)로 이루어진다. (b) 인간 EMX1 및 PVALB 유전자좌에서의 SpCas9-매개의 삽입-결실에 대한 서베이어 검정. 화살표는 예상되는 서베이어 단편을 나타낸다(n = 3). (c) 로딩 대조군으로서 U1과 함께, 4개의 sgRNA 절단 구조에 대한 노던 블롯 분석. (d) SpCas9의 야생형(wt) 또는 닉카아제 돌연변이체(D10A) 둘 모두는 인간 EMX1 유전자로의 HindIII 부위의 삽입을 증진시켰다. 게놈 서열과 비교하여 센스 또는 안티센스 방향 중 어느 하나로 배향된 단일 가닥 올리고뉴클레오티드(ssODN)를 상동성 재조합 주형으로 사용하였다. (e) 인간 SERPINB5 유전자좌의 개략도. sgRNA 및 PAM은 서열 위의 유색 막대에 의해 표기되며; 메틸시토신(Me)은 강조표시되어 있으며(분홍색) 및 전사 시작 부위(TSS, +1)와 비교하여 넘버링된다. (f) 16개 클론의 비설피트 시퀀싱에 의해 검정되는 SERPINB5의 메틸화 상태. 흑색 원, 메틸화된 CpG; 백색 원, 비메틸화된 CpG. (g) 딥 시퀀싱에 의해 검정되는, SERPINB5의 메틸화 영역을 표적화하는 3개의 sgRNA에 의한 변형 효율(n = 2). 오차 막대는 윌슨(Wilson) 간격을 나타낸다(온라인 방법).
도 21a 및 도 21b는 CRISPR-Cas sgRNA 구조의 추가의 최적화를 보여준다. (a) 4개의 추가의 sgRNA 구조, I-IV의 개략도. 각각은 tracrRNA(적색)에 혼성화되는 직접 반복부(DR, 회색)에 연결된 20-nt 가이드 서열(청색)로 이루어진다. 인공 GAAA 스템 루프가 있는 DR-tracrRNA 하이브리드는 표시된 바와 같이 +12 또는 +22에서 절단된다. tracrRNA 절단 위치는 tracrRNA에 대한 이전에 보고된 전사 시작 부위에 따라 넘버링된다. sgRNA 구조 II 및 IV는 그들의 폴리-U 트랙트(tract) 내에 돌연변이를 지니며, 이는 조기성숙 전사 종결자로 사용될 수 있다. (b) 표적 부위 1 내지 3에 대한 인간 EMX1 유전자좌에서의 SpCas9-매개의 삽입-결실에 대한 서베이어 검정. 화살표는 예상되는 서베이어 단편을 나타낸다(n = 3).
도 22는 인간 게놈 내의 일부 표적 부위의 가시화를 예시한다.
도 23A 및 도 23B는 (A) sgRNA의 개략도 및 (B) 절단 효율이 가장 높은 최적으로 절단된 구조에 대한 SaCas9에 대한 5개의 sgRNA 변이체의 서베이어 분석을 보여준다.
본원에서 도면은 오직 예시의 목적을 위한 것이며, 반드시 척도에 따라 도시된 것은 아니다.
상세한 설명
용어 "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", "핵산" 및 "올리고뉴클레오티드"는 상호교환가능하게 사용된다. 그것들은 임의의 길이의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중 어느 하나, 또는 그의 유사체의 중합체 형태를 말한다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 다음은 폴리뉴클레오티드의 비제한적인 예이다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 전령 RNA(mRNA), 운반 RNA, 리보솜 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 분리된 DNA, 임의의 서열의 분리된 RNA, 핵산 프로브 및 프라이머. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드, 예를 들어, 메틸화 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 단속될 수 있다. 폴리뉴클레오티드는 중합화 후에, 예를 들어, 표지화 성분과의 컨쥬게이션에 의해 추가로 변형될 수 있다.
본 발명의 양태에서, 용어 "키메라 RNA", "키메라 가이드 RNA", "가이드 RNA", "단일의 가이드 RNA" 및 "합성 가이드 RNA"는 상호교환가능하게 사용되며, 가이드 서열, tracr 서열 및 tracr 메이트 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 용어 "가이드 서열"은 표적 부위를 지정하는 가이드 RNA 내의 약 20bp 서열을 지칭하며, 용어 "가이드" 또는 "스페이서"와 상호교환가능하게 사용될 수 있다. 또한, 용어 "tracr 메이트 서열"은 용어 "직접 반복부(들)"와 상호교환가능하게 사용될 수 있다.
본원에 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 해당 분야의 용어이며, 그것이 돌연변이체 또는 변이체로부터 구별되는 정도로 천연에서 발생하는 것과 같은 전형적인 형태의 유기체, 균주, 유전자 또는 특징을 의미한다.
본원에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특성의 표현을 의미하는 것으로 이해해야 한다.
용어 "비-천연 발생" 또는 "조작된"은 상호교환가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 언급되는 경우, 핵산 분자 또는 폴리펩티드에 천연에서 천연적으로 관련되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다.
"상보성"은 통상의 왓슨-크릭(Watson-Crick) 염기-쌍형성 또는 기타 비-통상적 유형에 의해 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 상보성 백분율은 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기 쌍형성)을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다(예를 들어, 10개 중 5, 6, 7, 8, 9, 10개는 50%, 60%, 70%, 80%, 90% 및 100% 상보성임). "완전한 상보성"은 핵산 서열의 모든 연속 잔기가 동일한 수의 제2 핵산 서열 내의 연속 잔기와 수소 결합할 것임을 의미한다. 본원에 사용되는 바와 같이, "실질적인 상보성"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50개 이상의 뉴클레오티드의 영역에 걸쳐 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%인 상보성 정도를 지칭하거나, 엄격한 조건 하에서 혼성화하는 2개의 핵산을 지칭한다.
본원에 사용되는 바와 같이, 혼성화를 위한 "엄격한 조건"은 표적 서열에 대하여 상보성을 갖는 핵산 서열이 대개 표적 서열과 혼성화하며, 비-표적 서열에는 실질적으로 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열-의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록, 서열이 그의 표적 서열에 특이적으로 혼성화하는 온도가 더 높아진다. 엄격한 조건의 비제한적인 예는 문헌[Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y.]에 상세히 기재되어 있다.
"혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다. 수소 결합은 왓슨 크릭 염기 쌍형성, 후그스타인(Hoogstein) 결합 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 복합체는 듀플렉스 구조를 형성하는 2개의 가닥, 다중 가닥 복합체를 형성하는 3개 이상의 가닥, 단일의 자가 혼성화 가닥 또는 이들의 임의의 조합을 포함할 수 있다. 혼성화 반응은 PCR의 개시 또는 효소에 의한 폴리뉴클레오티드의 절단과 같은 보다 광범위한 과정에서 하나의 단계를 이룰 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "상보물"로 지칭된다.
CRISPR 시스템의 성분에 관하여, 본원에 사용되는 바와 같은 "안정화" 또는 "안정성의 증가"는 분자의 구조를 보호하거나 안정시키는 것에 관한 것이다. 이는 단일의 또는 다중의 염기 쌍 변화, 헤어핀 수의 증가, 가교, 특정 뉴클레오티드의 스트레치의 파단 및 다른 변형을 포함하는 하나의 돌연변이 또는 돌연변이들의 도입에 의해 달성될 수 있다. 변형은 적어도 하나의 비천연 발생 뉴클레오티드 또는 변형된 뉴클레오티드 또는 그의 유사체의 함유를 포함할 수 있다. 변형된 뉴클레오티드는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 변형된 뉴클레오티드는 2'-O-메틸 유사체, 2'-데옥시 유사체, 또는 2'-플루오로 유사체를 포함할 수 있다. 핵산 백본이 변형될 수 있으며, 예를 들어, 포스포로티오에이트 백본이 사용될 수 있다. 잠금 핵산(LNA) 또는 브리지드 핵산(BNA)의 사용도 또한 가능할 수 있다. 변형된 염기의 추가의 예는 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘, 이노신, 7-메틸구아노신을 포함하나 이들에 한정되지 않는다. 이들 변형은 CRISPR 시스템의 임의의 성분에 적용될 수 있다. 바람직한 구현예에서, 이들 변형은 RNA 성분, 예를 들어, 가이드 RNA 또는 키메라 폴리뉴클레오티드 서열에 이루어진다.
본원에 사용되는 바와 같이, "발현"은 폴리뉴클레오티드가 DNA 주형으로부터 (예를 들어, mRNA 또는 기타 RNA 전사물로) 전사되는 과정 및/또는 이후에 전사된 mRNA가 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 지칭한다. 전사물 및 인코딩된 폴리펩티드는 집합적으로 "유전자 산물"로 지칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된다면, 발현은 진핵 세포에서의 mRNA의 스플라이싱을 포함할 수 있다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 본원에서 임의의 길이의 아미노산의 중합체를 지칭하기 위해 상호교환가능하게 사용된다. 중합체는 선형 또는 분지형일 수 있으며, 그것은 변형된 아미노산을 포함할 수 있고, 그것은 비-아미노산에 의해 단속될 수 있다. 또한, 상기 용어는 변형된 아미노산 중합체, 예를 들어, 이황화 결합 형성, 글리코실화, 지질화(lipidation), 아세틸화, 인산화 또는 임의의 기타 조작, 예를 들어, 표지화 성분과의 컨쥬게이션을 포함한다. 본원에 사용되는 바와 같이, 용어 "아미노산"은 글리신 및 D 또는 L 광학 이성질체 및 아미노산 유사체 및 펩티도미메틱을 포함하는 천연 및/또는 비천연 또는 합성 아미노산을 포함한다.
용어 "대상체", "개체" 및 "환자"는 척추동물, 바람직하게는 포유동물, 더욱 바람직하게는 인간을 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 포유동물은 쥣과, 원숭이, 인간, 농장 동물, 스포츠 동물 및 애완동물을 포함하나 이들에 한정되지 않는다. 생체내에서 수득되거나 시험관내에서 배양된 생물학적 엔티티(entity)의 조직, 세포 및 그들의 자손도 또한 포함된다. 일부 구현예에서, 대상체는 무척추 동물, 예를 들어, 곤충 또는 선충일 수 있는 한편; 다른 경우에, 대상체는 식물 또는 진균일 수 있다.
용어 "치료제", "치료가능한 작용제" 또는 "치료 작용제"는 상호교환가능하게 사용되며, 대상체로의 투여 시에 몇몇 유리한 효과를 부여하는 분자 또는 화합물을 지칭한다. 유리한 효과는 진단적 결정을 가능하게 하는 것; 질병, 증상, 장애 또는 병태의 개선; 질병, 증상, 장애 또는 질환의 발병의 감소 또는 예방; 및 일반적으로 질병, 증상, 장애 또는 병태의 대응을 포함한다.
본원에 사용되는 바와 같이, "치료" 또는 "치료하는" 또는 "완화하는" 또는 "개선하는"은 상호교환가능하게 사용된다. 이들 용어는 치료 이익 및/또는 예방 이익을 포함하나 이들에 한정되지 않는 유리한 또는 요망되는 결과를 수득하는 방법을 지칭한다. 치료 이익은 치료 하의 하나 이상의 질병, 질환 또는 증상의 임의의 치료적으로 유의미한 개선 또는 그에 대한 효과를 의미한다. 예방 이익에 있어서, 조성물은 특정 질병, 질환 또는 증상이 발생할 위험이 있는 대상체에게 또는 질병, 질환 또는 증상이 아직 나타나지 않을지라도, 질병의 하나 이상의 생리학적 증상을 보고하는 대상체에게 투여될 수 있다.
용어 "유효량" 또는 "치료적 유효량"은 유리한 또는 요망되는 결과를 야기하기에 충분한 작용제의 양을 지칭한다. 치료적 유효량은 치료되는 대상체 및 병태, 대상체의 체중 및 연령, 병태의 중증도, 투여 방식 등 중 하나 이상에 따라 달라질 수 있으며, 이는 당업자에 의해 용이하게 결정될 수 있다. 또한, 상기 용어는 본원에 기술된 영상화 방법 중 임의의 것에 의한 검출을 위한 이미지를 제공할 용량에 적용된다. 특정 용량은 선택된 특정 작용제, 뒤따르는 투여 요법, 그것이 다른 화합물과 병용하여 투여되는지 여부, 투여 시기, 영상화되는 조직 및 그것을 운반하는 신체 전달 시스템 중 하나 이상에 따라 달라질 수 있다.
본 발명의 실시는 달리 나타내지 않는 한, 당업계의 기술 내에 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상의 기술을 사용한다. 문헌[Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989)]; 문헌[CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987))]; 시리즈 문헌[METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987))]을 참조한다.
본 발명의 몇몇 양태는 하나 이상의 벡터를 포함하는 벡터 시스템 또는 그와 같은 벡터에 관한 것이다. 벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예를 들어, 에스케리키아 콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포 또는 포유동물 세포에서 발현될 수 있다. 적절한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는 예를 들어, T7 프로모터 조절 서열 및 T7 중합효소를 사용하여 시험관내에서 전사되고 번역될 수 있다.
벡터는 원핵생물에 도입되고, 그에서 증식될 수 있다. 일부 구현예에서, 원핵생물은 진핵 세포로 도입되거나 또는 진핵 세포로 도입되는 벡터의 생성에서 중간체 벡터(예를 들어, 바이러스 벡터 패키징 시스템의 일부로서 플라스미드 증폭)로서 벡터의 카피를 증폭시키기 위해서 사용될 수 있다. 일부 구현예에서, 원핵생물은 벡터의 카피를 증폭시키고, 하나 이상의 핵산을 발현하기 위해, 예를 들어, 숙주 세포 또는 숙주 유기체로의 전달을 위한 하나 이상의 단백질의 공급원을 제공하기 위해 사용된다. 원핵생물에서의 단백질의 발현은 자주 융합 또는 비-융합 단백질 중 어느 하나의 발현을 유도하는 구성성 또는 유도성 프로모터를 함유하는 벡터를 사용하여 에스케리키아 콜라이에서 수행된다. 융합 벡터는 거기에 인코딩된 단백질로, 예를 들어, 재조합 단백질의 아미노 말단으로 수많은 아미노산을 부가한다. 이러한 융합 벡터는 다음과 같은 하나 이상의 목적을 제공할 수 있다: (i) 재조합 단백질의 발현의 증가; (ii) 재조합 단백질의 용해도의 증가; 및 (iii) 친화성 정제에서 리간드로 작용함으로써 재조합 단백질의 정제의 보조. 종종, 융합 발현 벡터에서, 단백질분해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부에 도입되어, 융합 단백질의 정제 이후에 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 한다. 이러한 효소 및 그들의 동족 인식 서열은 인자 Xa, 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX(파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌[Smith and Johnson, 1988. Gene 67: 31-40]), pMAL(미국 매사추세츠주 비벌리 소재의 뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 pRIT5(미국 뉴저지주 피스카타웨이 소재의 파마시아(Pharmacia))를 포함하며, 이는 각각 글루타티온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질 또는 단백질 A를 표적 재조합 단백질에 융합시킨다.
적절한 유도성 비-융합 에스케리키아 콜라이 발현 벡터의 예는 pTrc(문헌[Amrann et al., (1988) Gene 69:301-315]) 및 pET 11d(문헌[Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89])를 포함한다.
일부 구현예에서, 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비지애에서의 발현을 위한 벡터의 예에는 pYepSec1(문헌[Baldari, et al., 1987. EMBO J. 6: 229-234]), pMFa(문헌[Kuijan and Herskowitz, 1982. Cell 30: 933-943]), pJRY88(문헌[Schultz et al., 1987. Gene 54: 113-123]), pYES2(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션) 및 picZ(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션)가 포함된다.
일부 구현예에서, 벡터는 배큘로바이러스 발현 벡터를 사용하여 곤충 세포에서 단백질 발현을 유도한다. 배양된 곤충 세포(예를 들어, SF9 세포)에서 단백질의 발현에 이용가능한 배큘로바이러스 벡터는 pAc 시리즈(문헌[Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165]) 및 pVL 시리즈(문헌[Lucklow and Summers, 1989. Virology 170: 31-39])를 포함한다.
일부 구현예에서, 벡터는 포유동물 발현 벡터를 사용하여 포유동물 세포에서 하나 이상의 서열의 발현을 유도할 수 있다. 포유동물 발현 벡터의 예는 pCDM8(문헌[Seed, 1987. Nature 329: 840]) 및 pMT2PC(문헌[Kaufman, et al., 1987. EMBO J. 6: 187-195])를 포함한다. 포유동물 세포에서 사용되는 경우, 발현 벡터의 조절 기능은 전형적으로 하나 이상의 조절 요소에 의해 제공된다. 예를 들어, 통상적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스, 유인원 바이러스 40 및 본원에 개시되고 당업계에 공지되어 있는 기타의 것으로부터 유래된다. 원핵 및 진핵 세포 둘 모두를 위한 다른 적절한 발현 시스템에 대하여, 예를 들어, 문헌[Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]의 16 및 17장을 참조한다.
일부 구현예에서, 재조합 포유동물 발현 벡터는 특정 세포 유형에서 우선적으로 핵산의 발현을 유도할 수 있다(예를 들어, 핵산을 발현하기 위하여 조직-특이적 조절 요소가 사용됨). 조직-특이적 조절 요소가 해당 분야에 공지되어 있다. 적절한 조직-특이적 프로모터의 비제한적인 예에는 알부민 프로모터(간-특이적; 문헌[Pinkert, et al., 1987. Genes Dev. 1: 268-277]), 림프-특이적 프로모터(문헌[Calame and Eaton, 1988. Adv. Immunol. 43: 235-275]), 특히, T 세포 수용체(문헌[Winoto and Baltimore, 1989. EMBO J. 8: 729-733]) 및 면역글로불린의 프로모터(문헌[Baneiji, et al., 1983. Cell 33: 729-740]; 문헌[Queen and Baltimore, 1983. Cell 33: 741-748]), 뉴런-특이적 프로모터(예를 들어, 신경섬유 프로모터; 문헌[Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477]), 췌장-특이적 프로모터(문헌[Edlund, et al., 1985. Science 230: 912-916]) 및 유선-특이적 프로모터(예를 들어, 유장(milk whey) 프로모터; 미국 특허 제4,873,316호 및 유럽 출원 공개 제264,166호)가 포함된다. 발생-조절 프로모터, 예를 들어, 쥣과 hox 프로모터(문헌[Kessel and Gruss, 1990. Science 249: 374-379]) 및 α-태아단백질 프로모터(문헌[Campes and Tilghman, 1989. Genes Dev. 3: 537-546])도 또한 포함된다.
일부 구현예에서, 조절 요소는 CRISPR 시스템의 하나 이상의 요소에 작동가능하게 연결되어 CRISPR 시스템의 하나 이상의 요소의 발현을 유도한다. 일반적으로, SPIDR(스페이서 산재 직접 반복부)로도 공지되어 있는 CRISPR(클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부)은 통상 특정 박테리아 종에 특이적인 DNA 유전자좌의 과를 구성한다. CRISPR 유전자좌는 에스케리키아 콜라이에서 인식되는 별개의 부류의 산재된 짧은 서열 반복부(SSR) 및 관련 유전자를 포함한다(문헌[Ishino et al., J. Bacteriol., 169:5429-5433 [1987]]; 및 문헌[Nakata et al., J. Bacteriol., 171:3553-3556 [1989]]). 유사한 산재된 SSR이 할로페락스 메디테라네이(Haloferax mediterranei), 스트렙토코커스 피오게네스, 아나바에나(Anabaena) 및 마이코박테리움 튜베르큘로시스(Mycobacterium tuberculosis)에서 확인되었다(문헌[Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]]; 문헌[Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]]; 문헌[Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]]; 및 문헌[Mojica et al., Mol. Microbiol., 17:85-93 [1995]] 참조). CRISPR 유전자좌는 전형적으로 SRSR(규칙적으로 산재된 짧은 반복부(short regularly spaced repeats))로 명명된 반복부의 구조가 다른 SSR과 상이하다(문헌[Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]]; 및 문헌[Mojica et al., Mol. Microbiol., 36:244-246 [2000]]). 일반적으로, 반복부는 실질적으로 고정된 길이를 갖는 독특한 개재 서열에 의해 규칙적으로 산재된 클러스터에 존재하는 짧은 요소이다(상기 문헌[Mojica et al., [2000]]). 반복 서열이 균주들 간에 고도로 보존되어 있지만, 산재된 반복부의 수와 스페이서 영역의 서열은 전형적으로 균주마다 상이하다(문헌[van Embden et al., J. Bacteriol., 182:2393-2401 [2000]]). CRISPR 유전자좌는 아에로피룸(Aeropyrum), 피로바쿨룸(Pyrobaculum), 술폴로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로카르쿨라(Halocarcula), 메타노박테리움(Methanobacterium), 메타노코커스(Methanococcus), 메타노사르시나(Methanosarcina), 메타노피러스(Methanopyrus), 피로코커스(Pyrococcus), 피크로필러스(Picrophilus), 써모플라스마(Thermoplasma), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobacterium), 스트렙토마이세스(Streptomyces), 아퀴펙스(Aquifex), 포르피로모나스(Porphyromonas), 클로로비움(Chlorobium), 써머스(Thermus), 바실러스(Bacillus), 리스테리아(Listeria), 스타필로코커스(Staphylococcus), 클로스트리디움(Clostridium), 써모아나에로박터(Thermoanaerobacter), 마이코플라스마(Mycoplasma), 푸소박테리움(Fusobacterium), 아자쿠스(Azarcus), 크로모박테리움(Chromobacterium), 네이세리아(Neisseria), 니트로소모나스(Nitrosomonas), 데설포비브리오(Desulfovibrio), 게오박터(Geobacter), 믹소코커스(Myxococcus), 캄필로박터, 볼리넬라(Wolinella), 아시네토박터(Acinetobacter), 에르위니아(Erwinia), 에스케리키아, 레지오넬라(Legionella), 메틸로코커스(Methylococcus), 파스퇴렐라(Pasteurella), 포토박테리움(Photobacterium), 살모넬라(Salmonella), 잔토모나스(Xanthomonas), 예르시니아(Yersinia), 트레포네마(Treponema) 및 써모토가(Thermotoga)를 포함하나 이들에 한정되지 않는 40개 초과의 원핵생물에서 확인되었다(예를 들어, 문헌[Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]]; 및 문헌[Mojica et al., [2005]] 참조).
일반적으로, "CRISPR 시스템"은 집합적으로 Cas 유전자를 인코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복부" 및 tracrRNA-가공 부분 직접 반복부 포함), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭) 또는 CRISPR 유전자좌로부터의 기타 서열 및 전사물을 포함하는 CRISPR-관련("Cas") 유전자의 발현에 수반되거나, 그의 활성을 유도하는 전사물 및 다른 요소를 지칭한다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 I형, II형 또는 III형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 내인성 CRISPR 시스템을 포함하는 특정 유기체, 예를 들어, 스트렙토코커스 피오게네스로부터 유래된다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 증진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서로도 지칭)를 특징으로 한다. CRISPR 복합체의 형성의 맥락에서, "표적 서열"은 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 증진시킨다. 본질적으로 완전한 상보성이 필요하지 않지만, 혼성화를 야기하고, CRISPR 복합체의 형성을 증진시키는 충분한 상보성이 존재한다. 표적 서열은 임의의 폴리뉴클레오티드, 예를 들어, DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치한다. 일부 구현예에서, 표적 서열은 진핵 세포의 세포기관, 예를 들어, 미토콘드리아 또는 엽록체 내에 존재할 수 있다. 표적 서열을 포함하는 표적화된 유전자좌로의 재조합을 위해 사용될 수 있는 서열 또는 주형은 "교정 주형" 또는 "교정 폴리뉴클레오티드" 또는 "교정 서열"로 지칭된다. 본 발명의 양태에서, 외인성 주형 폴리뉴클레오티드는 교정 주형으로 지칭될 수 있다. 본 발명의 일 양태에서, 재조합은 상동성 재조합이다.
전형적으로, 내인성 CRISPR 시스템의 맥락에서, CRISPR 복합체(표적 서열에 혼성화되고, 하나 이상의 Cas 단백질과 복합체화되는 가이드 서열을 포함)의 형성은 표적 서열 내의 또는 그 근처의(예를 들어, 그로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50개 이상의 염기쌍 내의) 하나의 또는 둘 모두의 가닥의 절단을 야기한다. 이론에 구속되지 않으면서, 야생형 tracr 서열의 전부 또는 그의 일부(예를 들어, 야생형 tracr 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85개 이상의 뉴클레오티드)를 포함하거나 그로 이루어질 수 있는 tracr 서열은 또한, 가이드 서열에 작동가능하게 연결된 tracr 메이트 서열의 전부 또는 일부로의 tracr 서열의 적어도 일부분에 따른 혼성화에 의해서와 같이 CRISPR 복합체의 일부를 형성할 수 있다. 일부 구현예에서, tracr 서열은 혼성화하고, CRISPR 복합체의 형성에 참여하기에 충분한, tracr 메이트 서열에 대한 상보성을 갖는다. 표적 서열과 마찬가지로, 완전한 상보성이 필요하지 않지만, 작용성이기에 충분한 상보성이 존재하는 것으로 여겨진다. 일부 구현예에서, tracr 서열은 최적으로 정렬되는 경우 tracr 메이트 서열의 길이를 따라 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 99%의 서열 상보성을 갖는다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소의 발현을 유도하는 하나 이상의 벡터는 CRISPR 시스템의 요소의 발현이 하나 이상의 표적 부위에서 CRISPR 복합체의 형성을 유도하도록 숙주 세포 내로 도입된다. 예를 들어, Cas 효소, tracr-메이트 서열에 연결된 가이드 서열 및 tracr 서열은 각각 개별 벡터 상의 개별 조절 요소에 작동가능하게 연결될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현되는 요소 중 둘 이상은 단일의 벡터에서 조합될 수 있으며, 하나 이상의 추가의 벡터는 제1 벡터에 포함되지 않은 CRISPR 시스템의 임의의 성분을 제공한다. 단일의 벡터에서 조합되는 CRISPR 시스템 요소는 임의의 적절한 배향으로 배열될 수 있으며, 예를 들어, 하나의 요소는 제2 요소에 대하여 5'에(그의 "상류"에) 위치하거나 그에 대하여 3'에(그의 "하류"에) 위치한다. 하나의 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일한 가닥 또는 반대 가닥에 위치할 수 있으며, 동일하거나 반대 방향으로 배향될 수 있다. 일부 구현예에서, 단일의 프로모터는 CRISPR 효소를 인코딩하는 전사물 및 하나 이상의 인트론 서열 내에(예를 들어, 각각이 상이한 인트론 내에, 2개 이상이 적어도 하나의 인트론 내에 또는 전부가 단일의 인트론 내에) 매립된 가이드 서열, tracr 메이트 서열(선택적으로 가이드 서열에 작동가능하게 연결), 및 tracr 서열 중 하나 이상의 발현을 유도한다. 일부 구현예에서, CRISPR 효소, 가이드 서열, tracr 메이트 서열 및 tracr 서열이 동일한 프로모터에 작동가능하게 연결되고, 그로부터 발현된다.
일부 구현예에서, 벡터는 하나 이상의 삽입 부위, 예를 들어, 제한 엔도뉴클레아제 인식 서열("클로닝 부위"로도 지칭)을 포함한다. 일부 구현예에서, 하나 이상의 삽입 부위(예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 삽입 부위)는 하나 이상의 벡터의 하나 이상의 서열 요소의 상류 및/또는 하류에 위치한다. 일부 구현예에서, 벡터는 tracr 메이트 서열의 상류에 있고, 선택적으로 tracr 메이트 서열에 작동가능하게 연결된 조절 요소의 하류에 있는 삽입 부위를 포함하여, 삽입 부위로의 가이드 서열의 삽입 후에, 그리고 발현 시에, 가이드 서열이 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하게 한다. 일부 구현예에서, 벡터는 2개 이상의 삽입 부위를 포함하며, 각각의 삽입 부위는 2개의 tracr 메이트 서열 사이에 위치하여, 각 부위에서 가이드 서열의 삽입을 가능하게 한다. 이러한 배열에서, 2개 이상의 가이드 서열은 단일의 가이드 서열의 2개 이상의 카피, 2개 이상의 상이한 가이드 서열 또는 이들의 조합을 포함할 수 있다. 다중의 상이한 가이드 서열이 사용되는 경우, 단일의 발현 작제물을 사용하여 세포 내의 다중의 상이한 상응하는 표적 서열에 CRISPR 활성을 표적화할 수 있다. 예를 들어, 단일의 벡터는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20개 이상의 가이드 서열을 포함할 수 있다. 일부 구현예에서, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 이러한 가이드-서열-함유 벡터가 제공될 수 있으며, 선택적으로 세포로 전달될 수 있다.
일부 구현예에서, 벡터는 CRISPR 효소, 예를 들어, Cas 단백질을 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 조절 요소를 포함한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 이들 효소가 알려져 있으며; 예를 들어, 스트렙토코커스 피오게네스 Cas9 단백질의 아미노산 서열은 수탁 번호 Q99ZW2 하에 스위스프로트(SwissProt) 데이터베이스에서 관찰될 수 있다. 일부 구현예에서, 비변형 CRISPR 효소, 예를 들어, Cas9는 DNA 절단 활성을 갖는다. 일부 구현예에서, CRISPR 효소는 Cas9이며, 스트렙토코커스 피오게네스 또는 스트렙토코커스 뉴모니애로부터의 Cas9일 수 있다. 일부 구현예에서, CRISPR 효소는 표적 서열 내 및/또는 표적 서열의 상보물 내에서와 같은 표적 서열의 위치에서 1개 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, CRISPR 효소는 표적 서열의 처음 또는 마지막 뉴클레오티드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500개 이상의 염기쌍에서 1개 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, 벡터는 상응하는 야생형 효소에 대하여 돌연변이되어, 돌연변이된 CRISPR 효소에 표적 서열을 함유하는 표적 폴리뉴클레오티드의 1개 또는 2개 모두의 가닥의 절단 능력이 결여되게 한 CRISPR 효소를 인코딩한다. 예를 들어, 스트렙토코커스 피오게네스로부터의 Cas9의 RuvC I 촉매 도메인 내에서의 아스파르트산에서 알라닌으로의 치환(D10A)은 Cas9를 둘 모두의 가닥을 절단하는 뉴클레아제에서 닉카아제(단일 가닥 절단)로 전환시킨다. Cas9가 닉카아제가 되게 하는 돌연변이의 다른 예는 제한 없이, H840A, N854A 및 N863A를 포함한다. 일부 구현예에서, Cas9 닉카아제는 가이드 서열(들), 예를 들어, 각각 DNA 표적의 센스 및 안티센스 가닥을 표적화하는 2개의 가이드 서열과 병용하여 사용될 수 있다. 이러한 조합은 둘 모두의 가닥에 닉(nick)이 생기게 하고, NHEJ를 유도하는데 사용되게 한다. 본 발명자들은 돌연변이유발 NHEJ의 유도에서 2개의 닉카아제 표적(즉, DNA의 동일한 위치에, 그러나, 상이한 가닥에 표적화된 sgRNA)의 효능을 입증하였다(데이터 미도시). 단일의 닉카아제(단일의 sgRNA가 있는 Cas9-D10A)는 NHEJ를 유도하고, 삽입-결실을 생성할 수 없지만, 본 발명자들은 이중 닉카아제(Cas9-D10A 및 동일한 위치에서 상이한 가닥에 표적화된 2개의 sgRNA)가 인간 배아 줄기 세포(hESC)에서 그럴 수 있음을 보였다. 효율은 hESC에서 뉴클레아제(즉, D10 돌연변이가 없는 보통의 Cas9)의 약 50%이다.
추가의 예로서, Cas9의 2개 이상의 촉매 도메인(RuvC I, RuvC II 및 RuvC III)을 돌연변이시켜, 모든 DNA 절단 활성이 실질적으로 결여된 돌연변이된 Cas9를 생성할 수 있다. 일부 구현예에서, D10A 돌연변이를 H840A, N854A 또는 N863A 돌연변이 중 하나 이상과 조합하여, 모든 DNA 절단 활성이 실질적으로 결여된 Cas9 효소를 생성한다. 일부 구현예에서, CRISPR 효소는 돌연변이된 효소의 DNA 절단 활성이 비-돌연변이 형태에 대하여 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하인 경우 모든 DNA 절단 활성이 실질적으로 결여된 것으로 여겨진다. 다른 돌연변이가 유용할 수 있으며; 여기서, Cas9 또는 다른 CRISPR 효소는 스트렙토코커스 피오게네스 이외의 종으로부터의 것이며, 유사한 효과를 달성하기 위하여 상응하는 아미노산의 돌연변이가 이루어질 수 있다.
일부 구현예에서, CRISPR 효소를 인코딩하는 효소 코딩 서열은 특정 세포, 예를 들어, 진핵 세포에서의 발현을 위해 코돈 최적화된다. 진핵 세포는 인간, 마우스, 랫트, 토끼, 개 또는 비인간 영장류를 포함하나 이들에 한정되지 않는 특정 유기체, 예를 들어, 포유동물의 것이거나 그로부터 유래될 수 있다. 일반적으로, 코돈 최적화는 고유 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노산 서열을 유지함으로써 대상 숙주 세포에서의 발현의 증진을 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 나타낸다. 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 전령 RNA(mRNA)의 번역의 효율과 상호관련되며, 이는 차례로, 다른 것들 중에, 번역되는 코돈의 특성 및 특정 운반 RNA(tRNA) 분자의 이용가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는 예를 들어, "코돈 사용 데이터베이스"에서 용이하게 이용가능하며, 이들 표는 다수의 방식으로 적합하게 될 수 있다. 문헌[Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)]을 참조한다. 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘도 또한 이용가능하며, 예를 들어, 진 포르지(Gene Forge)(압타젠(Aptagen); 미국 펜실베니아주 야코부스)도 또한 이용가능하다. 일부 구현예에서, CRISPR 효소를 인코딩하는 효소 내의 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상 또는 모든 코돈)은 특정 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 상응한다.
일부 구현예에서, 벡터는 하나 이상의 핵 국소화 서열(NLS), 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS를 포함하는 CRISPR 효소를 인코딩한다. 일부 구현예에서, CRISPR 효소는 아미노-말단에 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS, 카르복시-말단에 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS, 또는 이들의 조합(예를 들어, 아미노 말단에 하나 이상의 NLS 및 카르복시 말단에 하나 이상의 NLS)을 포함한다. 1개 초과의 NLS가 존재하는 경우, 각각은 단일의 NLS가 1개 초과의 카피로 존재하고/거나 1개 이상의 카피로 존재하는 하나 이상의 다른 NLS와 함께 존재할 수 있도록 다른 것들로부터 독립적으로 선택될 수 있다. 본 발명의 바람직한 구현예에서, CRISPR 효소는 최대 6개의 NLS를 포함한다. 일부 구현예에서, NLS는 NLS의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 쇄를 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50개 이상의 아미노산 내에 존재하는 경우 N- 또는 C-말단 근처에 있는 것으로 여겨진다. 전형적으로, NLS는 단백질 표면에 노출된 양으로 하전된 라이신 또는 아르기닌이 있는 하나 이상의 짧은 서열로 이루어지나, 다른 유형의 NLS이 알려져 있다. NLS의 비제한적인 예는 하기로부터 유래된 NLS 서열을 포함한다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK.
일반적으로, 하나 이상의 NLS는 진핵 세포의 핵에서 검출가능한 양의 CRISPR 효소의 축적을 유도하기에 충분한 세기의 것이다. 일반적으로, 핵 국소화 활성의 세기는 CRISPR 효소 내의 NLS의 수, 사용되는 특정 NLS(들) 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵에서의 축적의 검출은 임의의 적절한 기술에 의해 수행될 수 있다. 예를 들어, 검출가능한 마커는 예를 들어, 핵의 위치를 검출하기 위한 수단(예를 들어, 핵에 특이적인 염색제, 예를 들어, DAPI)과 함께 세포 내의 위치가 가시화될 수 있도록 CRISPR 효소에 융합될 수 있다. 검출가능한 마커의 예는 형광 단백질(예를 들어, 녹색 형광 단백질 또는 GFP; RFP; CFP) 및 에피토프 태그(HA 태그, flag 태그, SNAP 태그)를 포함한다. 또한, 세포 핵을 세포로부터 분리할 수 있으며, 그 다음, 그의 내용물을 단백질을 검출하기 위한 임의의 적절한 과정, 예를 들어, 면역조직화학, 웨스턴 블롯 또는 효소 활성 검정에 의해 분석할 수 있다. 또한, 핵에서의 축적은 예를 들어, CRISPR 효소 또는 복합체에 노출되지 않거나, 하나 이상의 NLS가 결여된 CRISPR 효소에 노출된 대조군과 비교하여, 간접적으로, 예를 들어, CRISPR 복합체 형성의 영향에 대한 검정(예를 들어, 표적 서열에서의 DNA 절단 또는 돌연변이에 대한 검정, 또는 CRISPR 복합체 형성 및/또는 CRISPR 효소 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 검정)에 의해 결정될 수 있다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기에 충분한, 표적 폴리뉴클레오티드 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 버로우즈-휠러 트랜스폼(Burrows-Wheeler Transform)에 기초한 알고리즘(예를 들어, 버로우즈 휠러 얼라이너(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, 노보얼라인(Novoalign)(노보크라프트 테크놀로지즈(Novocraft Technologies), ELAND(일루미나(Illumina), 미국 캘리포니아주 샌 디에고), SOAP(soap.genomics.org.cn에서 이용가능) 및 Maq(maq.sourceforge.net에서 이용가능)를 포함한다. 일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이이다. 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적절한 검정에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은 예를 들어, CRISPR 서열의 성분을 인코딩하는 벡터로의 트랜스펙션 후에, 예를 들어, 본원에 기술된 바와 같은 서베이어 검정에 의한 표적 서열 내의 우선적인 절단의 평가에 의해서와 같이, 상응하는 표적 서열을 갖는 숙주 세포로 제공될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 비율을 비교함으로써 시험관에서 평가될 수 있다. 다른 검정이 가능하며, 당업자에게 떠오를 것이다.
가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내의 서열이다. 예시적인 표적 서열은 표적 게놈에서 독특한 것들을 포함한다. 예를 들어, 스트렙토코커스 피오게네스 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGG(N은 A, G, T 또는 C이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGG(N은 A, G, T 또는 C이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 써모필러스 CRISPR1 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXXAGAAW의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXXAGAAW(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXXAGAAW의 스트렙토코커스 써모필러스 CRISPR1 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXXAGAAW(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 피오게네스 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGGXG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGGXG(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGGXG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGGXG(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 이들 서열 각각에서, "M"은 A, G, T 또는 C일 수 있으며, 서열을 독특한 것으로 확인하는데 고려될 필요는 없다.
일부 구현예에서, 가이드 서열은 가이드 서열 내의 2차 구조의 정도를 감소시키기 위해 선택된다. 2차 구조는 임의의 적절한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스(Gibbs) 자유 에너지의 계산에 기초한다. 이러한 알고리즘의 일 예는 문헌[Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148)]에 기술된 바와 같은 mFold이다. 다른 예시적인 폴딩 알고리즘은 센트로이드 구조 예측 알고리즘(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 문헌[PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조)을 사용하는 비엔나 대학의 이론 화학 기관에서 개발된 온라인 웹서버 RNAfold이다. 추가의 알고리즘은 본원에 참조로 포함되는 미국 출원 번호 TBA(브로드 참조번호 BI-2012/084 44790.11.2022)에서 찾을 수 있다.
일반적으로, tracr 메이트 서열은 다음 중 하나 이상을 증진시키기에 충분한, tracr 서열과의 상보성을 갖는 임의의 서열을 포함한다: (1) 상응하는 tracr 서열을 함유하는 세포에서 tracr 메이트 서열이 측부 배치된 가이드 서열의 절제; 및 (2) 표적 서열에서의 CRISPR 복합체의 형성으로서, CRISPR 복합체가 tracr 서열에 혼성화되는 tracr 메이트 서열을 포함하는 표적 서열에서의 CRISPR 복합체의 형성. 일반적으로, 상보성의 정도는 2개의 서열 중 더 짧은 서열의 길이에 따른 tracr 메이트 서열과 tracr 서열의 최적의 정렬을 참조한다. 최적의 정렬은 임의의 적절한 정렬 알고리즘에 의해 결정될 수 있으며, tracr 서열 또는 tracr 메이트 서열 중 어느 하나에서의 자가-상보성과 같이 2차 구조를 추가로 설명할 수 있다. 일부 구현예에서, 2개 중 보다 짧은 것의 길이를 따른 tracr 서열과 tracr 메이트 서열 간의 상보성의 정도는 최적으로 정렬되는 경우, 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 이상이다. tracr 서열과 tracr 메이트 서열 간의 최적의 정렬의 예시는 도 12b 및 도 13b에 제공되어 있다. 일부 구현예에서, tracr 서열은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, tracr 서열 및 tracr 메이트 서열은 2개 간의 혼성화가 헤어핀과 같은 2차 구조를 갖는 전사물을 생성하도록 단일의 전사물 내에 함유된다. 헤어핀 구조에 사용하기에 바람직한 루프 형성 서열은 4개 뉴클레오티드 길이이며, 바람직하게는 서열 GAAA를 갖는다. 그러나, 대안적인 서열과 같이 더 길거나 더 짧은 루프 서열이 사용될 수 있다. 서열은 바람직하게는 뉴클레오티드 트리플렛(예를 들어, AAA) 및 추가의 뉴클레오티드(예를 들어, C 또는 G)를 포함한다. 루프 형성 서열의 예는 CAAA 및 AAAG를 포함한다. 본 발명의 일 구현예에서, 전사물 또는 전사된 폴리뉴클레오티드 서열은 적어도 2개 이상의 헤어핀을 갖는다. 바람직한 구현예에서, 전사물은 2, 3, 4 또는 5개의 헤어핀을 갖는다. 본 발명의 추가의 구현예에서, 전사물은 최대 5개의 헤어핀을 갖는다. 일부 구현예에서, 단일의 전사물은 전사 종결 서열을 더 포함하며; 바람직하게는 이것은 폴리T 서열, 예를 들어, 6개의 T 뉴클레오티드이다. 이러한 헤어핀 구조의 예는 도 13b의 하부에 제공되며, 여기서, 루프의 상류 및 마지막 "N"의 5' 서열의 부분은 tracr 메이트 서열에 상응하며, 루프의 3' 서열의 부분은 tracr 서열에 상응한다. 가이드 서열, tracr 메이트 서열 및 tracr 서열을 포함하는 단일의 폴리뉴클레오티드의 추가의 비제한적인 예는 하기와 같으며(5'에서 3'으로 표기), 여기서, "N"은 가이드 서열의 염기를 나타내고, 소문자의 제1 블록은 tracr 메이트 서열을 나타내며, 소문자의 제2 블록은 tracr 서열을 나타내고, 마지막 폴리-T 서열은 전사 종결자를 나타낸다:
일부 구현예에서, 서열 (1) 내지 (3)은 스트렙토코커스 써모필러스 CRISPR1 유래의 Cas9와 함께 사용된다. 일부 구현예에서, 서열 (4) 내지 (6)은 스트렙토코커스 피오게네스 유래의 Cas9와 함께 사용된다. 일부 구현예에서, tracr 서열은 tracr 메이트 서열을 포함하는 전사물과 별개의 전사물이다(예를 들어, 도 13b의 상부에 예시).
일부 구현예에서, 재조합 주형도 또한 제공된다. 재조합 주형은 개별 벡터에 포함되거나, 개별 폴리뉴클레오티드로서 제공되는 본원에 기술된 바와 같은 다른 벡터의 성분일 수 있다. 일부 구현예에서, 재조합 주형은 상동성 재조합에서, 예를 들어, CRISPR 복합체의 일부로서 CRISPR 효소에 의해 닉이 생기거나 절단되는 표적 서열 내 또는 그 근처에서 주형으로 소용되도록 설계된다. 주형 폴리뉴클레오티드는 임의의 적절한 길이, 예를 들어, 약 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000개 이상의 뉴클레오티드 길이의 것일 수 있다. 일부 구현예에서, 주형 폴리뉴클레오티드는 표적 서열을 포함하는 폴리뉴클레오티드의 부분에 상보적이다. 최적으로 정렬되는 경우, 주형 폴리뉴클레오티드는 표적 서열의 하나 이상의 뉴클레오티드(예를 들어, 약 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개 이상의 뉴클레오티드)와 중첩할 수 있다. 일부 구현예에서, 주형 서열 및 표적 서열을 포함하는 폴리뉴클레오티드가 최적으로 정렬되는 경우, 주형 폴리뉴클레오티드의 가장 가까운 뉴클레오티드는 표적 서열로부터 약 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000개 이상의 뉴클레오티드 이내이다.
일부 구현예에서, CRISPR 효소는 하나 이상의 이종 단백질 도메인(예를 들어, CRISPR 효소에 더하여 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 도메인)을 포함하는 융합 단백질의 부분이다. CRISPR 효소 융합 단백질은 임의의 추가의 단백질 서열 및 선택적으로 임의의 2개 도메인 사이의 링커 서열을 포함할 수 있다. CRISPR 효소에 융합될 수 있는 단백질 도메인의 예는 비제한적으로 에피토프 태그, 리포터 유전자 서열 및 하기의 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다: 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는 글루타티온-S-트랜스퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나 이들에 한정되지 않는다. CRISPR 효소는 DNA 분자에 결합하거나, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합체, GAL4 DNA 결합 도메인 융합체 및 단순 포진 바이러스(HSV) BP16 단백질 융합체를 포함하나 이들에 한정되지 않는 다른 세포 분자에 결합하는 단백질 또는 단백질의 단편을 인코딩하는 유전자 서열에 융합될 수 있다. CRISPR 효소를 포함하는 융합 단백질의 부분을 형성할 수 있는 추가의 도메인은 본원에 참조로 포함되는 US20110059502호에 기술되어 있다. 일부 구현예에서, 태그가 부착된 CRISPR 효소를 사용하여 표적 서열의 위치를 확인한다.
일부 양태에서, 본 발명은 하나 이상의 폴리뉴클레오티드, 예를 들어, 본원에 기술된 바와 같은 하나 이상의 벡터, 그의 하나 이상의 전사물 및/또는 그로부터 전사된 하나의 단백질 또는 단백질들을 숙주 세포에 전달하는 단계를 포함한다. 일부 양태에서, 본 발명은 이러한 방법에 의해 생성된 세포, 및 이러한 세포를 포함하거나 이로부터 생성된 유기체(예를 들어, 동물, 식물 또는 진균)를 추가로 제공한다. 일부 구현예에서, 가이드 서열과 조합된(선택적으로 복합체화된) CRISPR 효소는 세포로 전달된다. 통상의 바이러스 및 비-바이러스 기반의 유전자 운반 방법을 사용하여 핵산을 포유동물 세포 또는 표적 조직에 도입할 수 있다. 이러한 방법을 사용하여 CRISPR 시스템의 성분을 인코딩하는 핵산을 배양물 중의 또는 숙주 유기체 내의 세포로 투여할 수 있다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들어, 본원에 기술된 벡터의 전사물), 네이키드(naked) 핵산 및 전달 비히클, 예를 들어, 리포솜과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이는 세포로의 전달 후에 에피솜 또는 통합된 게놈을 갖는다. 유전자 치료법 절차의 개요에 대해서는 문헌[Anderson, Science 256:808-813 (1992)]; 문헌[Nabel & Felgner, TIBTECH 11:211-217 (1993)]; 문헌[Mitani & Caskey, TIBTECH 11:162-166 (1993)]; 문헌[Dillon, TIBTECH 11:167-175 (1993)]; 문헌[Miller, Nature 357:455-460 (1992)]; 문헌[Van Brunt, Biotechnology 6(10):1149-1154 (1988)]; 문헌[Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995)]; 문헌[Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995)]; 문헌[Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Boehm (eds) (1995)]; 및 문헌[Yu et al., Gene Therapy 1:13-26 (1994)]을 참조한다.
핵산의 비-바이러스 전달 방법은 리포펙션(lipofection), 뉴클레오펙션(nucleofection), 미세주입, 비올리스틱스(biolistics), 비로좀(virosome), 리포솜, 면역리포솜, 다가양이온 또는 지질:핵산 컨쥬게이트, 네이키드 DNA, 인공 비리온 및 작용제-증진된 DNA의 흡수를 포함한다. 리포펙션은 예를 들어, 미국 특허 제5,049,386호, 제4,946,787호; 및 제4,897,355호에 기술되어 있으며, 리포펙션 시약은 상업적으로 시판된다(예를 들어, 트랜스펙탐(Transfectam)™ 및 리포펙틴(Lipofectin)™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 적절한 양이온 및 중성 지질은 펠그너(Felgner)의 WO 91/17424호; WO 91/16024호의 것들을 포함한다. 전달은 세포로(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직으로(예를 들어, 생체내 투여) 이루어질 수 있다.
표적화된 리포솜, 예를 들어, 면역지질 복합체를 포함하는 지질:핵산 복합체의 제제는 당업자에게 널리 공지되어 있다(예를 들어, 문헌[Crystal, Science 270:404-410 (1995)]; 문헌[Blaese et al., Cancer Gene Ther. 2:291-297 (1995)]; 문헌[Behr et al., Bioconjugate Chem. 5:382-389 (1994)]; 문헌[Remy et al., Bioconjugate Chem. 5:647-654 (1994)]; 문헌[Gao et al., Gene Therapy 2:710-722 (1995)]; 문헌[Ahmad et al., Cancer Res. 52:4817-4820 (1992)]; 미국 특허 제4,186,183호, 제4,217,344호, 제4,235,871호, 제4,261,975호, 제4,485,054호, 제4,501,728호, 제4,774,085호, 제4,837,028호 및 제4,946,787호 참조).
핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반의 시스템의 사용은 바이러스를 체내의 특정 세포에 표적화하고, 바이러스 페이로드(payload)를 핵에 수송하기 위한 고도로 발달된 과정을 이용한다. 바이러스 벡터를 환자에게 직접 투여하거나(생체내), 그들을 사용하여 시험관내에서 세포를 처리할 수 있으며, 변형된 세포가 선택적으로 환자에게 투여될 수 있다(생체외). 통상의 바이러스 기반의 시스템에는 유전자 운반을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 및 단순 포진 바이러스 벡터가 포함될 수 있다. 레트로바이러스, 렌티바이러스 및 아데노-관련 바이러스 유전자 운반 방법을 사용하여 숙주 게놈으로의 통합이 가능하며, 종종 삽입된 트랜스유전자의 장기간 발현을 야기한다. 또한, 높은 형질도입 효율이 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 편향성은 외래 외피 단백질을 혼입시키고, 잠재적 표적 집단의 표적 세포를 증식시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분열 세포에 형질도입할 수 있거나, 그를 감염시킬 수 있으며, 전형적으로 높은 바이러스 역가를 생성하는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 운반 시스템의 선택은 표적 조직에 따라 달라질 것이다. 레트로바이러스 벡터는 최대 6 내지 10kb의 외래 서열에 대하여 패키징 능력을 갖는 시스-작용성 긴 말단 반복부로 이루어진다. 최소 시스-작용성 LTR은 벡터의 복제 및 패키징에 충분하며, 이는 이어서, 치료적 유전자를 표적 세포로 통합시켜, 영구적인 트랜스유전자 발현을 제공하는데 사용된다. 널리 사용되는 레트로바이러스 벡터는 쥣과 백혈병 바이러스(MuLV), 긴팔원숭이 유인원 백혈병 바이러스(GaLV), 원숭이 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV) 및 그들의 조합에 기초한 것들을 포함한다(예를 들어, 문헌[Buchscher et al., J. Virol. 66:2731-2739 (1992)]; 문헌[Johann et al., J. Virol. 66:1635-1640 (1992)]; 문헌[Sommnerfelt et al., Virol. 176:58-59 (1990)]; 문헌[Wilson et al., J. Virol. 63:2374-2378 (1989)]; 문헌[Miller et al., J. Virol. 65:2220-2224 (1991)]; PCT/US94/05700호 참조).
일시적 발현이 바람직한 출원에서, 아데노바이러스 기반의 시스템이 사용될 수 있다. 아데노바이러스 기반의 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있으며, 세포 분열을 필요로 하지 않는다. 이러한 벡터를 사용하여, 높은 역가 및 발현 수준이 수득된다. 이러한 벡터는 비교적 간단한 시스템에서 대량 생성될 수 있다. 예를 들어, 핵산 및 펩티드의 시험관내 생성에서, 그리고 생체내 및 생체외 유전자 치료법 절차를 위하여, 아데노-관련 바이러스("AAV") 벡터를 사용하여, 표적 핵산으로 세포를 형질도입시킬 수도 있다(예를 들어, 문헌[West et al., Virology 160:38-47 (1987)]; 미국 특허 제4,797,368호; WO 93/24641호; 문헌[Kotin, Human Gene Therapy 5:793-801 (1994)]; 문헌[Muzyczka, J. Clin. Invest. 94:1351 (1994)] 참조). 재조합 AAV 벡터의 작제는 미국 특허 제5,173,414호; 문헌[Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985)]; 문헌[Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984)]; 문헌[Hermonat & Muzyczka, PNAS 81:6466-6470 (1984)]; 및 문헌[Samulski et al., J. Virol. 63:03822-3828 (1989)]을 포함하는 수많은 간행물에 기술되어 있다.
패키징 세포는 전형적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하기 위해 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에 사용되는 바이러스 벡터는 통상적으로 핵산 벡터를 바이러스 입자로 패키징하는 세포주를 생성함으로써 생성된다. 벡터는 전형적으로 패키징 및 이후의 숙주로의 통합에 필요한 최소 바이러스 서열을 함유하며, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 대한 발현 카세트로 대체된다. 소실 바이러스 기능은 전형적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에 사용되는 AAV 벡터는 전형적으로 패키징 및 숙주 게놈으로의 통합에 필요한 AAV 게놈 유래의 ITR 서열만을 갖는다. 바이러스 DNA는 다른 AAV 유전자, 즉, rep 및 cap을 인코딩하나 ITR 서열이 결여된 헬퍼 플라스미드를 함유하는 세포주에서 패키징된다. 또한, 세포주는 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인해 충분한 양으로 패키징되지 않는다. 아데노바이러스로의 오염은 예를 들어, 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다. 세포로의 핵산의 전달을 위한 추가의 방법은 당업자에게 공지되어 있다. 예를 들어, 본원에 참조로 포함되는 US20030087817호를 참조한다.
일부 구현예에서, 숙주 세포는 본원에 기술된 하나 이상의 벡터로 일시적으로 또는 비-일시적으로 트랜스펙션된다. 일부 구현예에서, 세포는 그것이 대상체에서 천연적으로 발생한 대로 트랜스펙션된다. 일부 구현예에서, 트랜스펙션되는 세포는 대상체로부터 취해진다. 일부 구현예에서, 세포는 세포주와 같이 대상체로부터 취해진 세포로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 공지되어 있다. 세포주의 예는 C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피, BALB/3T3 마우스 배아 섬유아세포, 3T3 Swiss, 3T3-L1, 132-d5 인간 태아 섬유아세포; 10.1 마우스 섬유아세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY 세포, K562 세포, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN / OPCT 세포주, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THP1 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR 및 그의 트랜스제닉 변이형을 포함하나 이들에 한정되지 않는다. 세포주는 당업자에게 공지되어 있는 다양한 공급원으로부터 입수가능하다(예를 들어, 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; ATCC)(미국 버지니아주 머내서스 소재) 참조). 일부 구현예에서, 본원에 기술된 하나 이상의 벡터로 트랜스펙션된 세포를 사용하여 하나 이상의 벡터-유래 서열을 포함하는 신규 세포주를 확립한다. 일부 구현예에서, 본원에 기술된 바와 같은 CRISPR 시스템의 성분이 일시적으로 트랜스펙션되고(예를 들어, 하나 이상의 벡터의 일시적 트랜스펙션 또는 RNA로의 트랜스펙션에 의해), CRISPR 복합체의 활성을 통해 변형된 세포를 사용하여, 변형을 포함하나 임의의 다른 외인성 서열이 결여된 세포를 포함하는 신규 세포주를 확립한다. 일부 구현예에서, 일시적으로 또는 비-일시적으로 본원에 기술된 하나 이상의 벡터로 트랜스펙션된 세포 또는 이러한 세포로부터 유래된 세포주가 하나 이상의 시험 화합물의 평가에서 사용된다.
일부 구현예에서, 본원에 기술된 하나 이상의 벡터를 사용하여 비-인간 트랜스제닉 동물 또는 트랜스제닉 식물을 생성한다. 일부 구현예에서, 트랜스제닉 동물은 포유동물, 예를 들어, 마우스, 랫트 또는 토끼이다. 특정 구현예에서, 유기체 또는 대상체는 식물이다. 특정 구현예에서, 유기체 또는 대상체 또는 식물은 조류이다. 트랜스제닉 식물 및 동물의 생성 방법은 당업계에 공지되어 있으며, 일반적으로 본원에 기술된 바와 같은 세포 트랜스펙션 방법으로 시작한다. 또한, 트랜스제닉 식물, 특히 농작물 및 조류와 같이, 트랜스제닉 동물도 제공된다. 트랜스제닉 동물 또는 식물은 질병 모델을 제공하는 것 이외의 응용에 유용할 수 있다. 이들은 예를 들어, 보통 야생형에서 관찰될 것보다 높은 수준의 단백질, 탄수화물, 영양소 또는 비타민의 발현을 통한 식품 또는 사료 생성을 포함할 수 있다. 이와 관련하여, 트랜스제닉 식물, 특히, 두류 및 덩이줄기, 및 동물, 특히, 포유동물, 예를 들어, 가축(소, 양, 염소 및 돼지)뿐 아니라 가금류 및 식용 곤충도 바람직하다.
트랜스제닉 조류 또는 다른 식물, 예를 들어, 유채가 예를 들어, 식물유 또는 바이오연료, 예를 들어, 알코올(특히, 메탄올 및 에탄올)의 생성에 특히 유용할 수 있다. 이들은 오일 또는 바이오연료 산업에 사용하기 위한 높은 수준의 오일 또는 알코올을 발현하거나 과발현하도록 조작될 수 있다.
일 양태에서, 본 발명은 진핵 세포에서의 표적 폴리뉴클레오티드의 변형 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하게 하여, 상기 표적 폴리뉴클레오티드의 절단을 초래하여, 표적 폴리뉴클레오티드를 변형시키는 단계를 포함하며, 여기서, CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함하고, 상기 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다.
일 양태에서, 본 발명은 진핵 세포에서의 표적 폴리뉴클레오티드의 발현의 변경 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 폴리뉴클레오티드에 결합하여, 상기 결합이 상기 폴리뉴클레오티드의 발현 증가 또는 감소를 야기하도록 하는 단계를 포함하며; 여기서, CRISPR 복합체는 상기 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화된 CRISPR 효소를 포함하며, 상기 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다.
작물 유전체학의 최근의 진전으로, 효율적이며 비용 효율이 높은 유전자 교정 및 조작을 수행하기 위한 CRISPR-Cas 시스템의 사용 능력은 단일 및 다중 유전자 조작의 신속한 선택과 비교를 가능하게 하여, 향상된 생성 및 증진된 특성을 위해 이러한 게놈을 형질전환시킬 것이다. 이와 관련하여, 다음의 미국 특허 및 간행물을 참조한다: 각각의 모든 내용 및 개시내용이 본원에 참조로 포함되는 미국 특허 제6,603,061호(Agrobacterium-Mediated Plant Transformation Method); 미국 특허 제7,868,149호(Plant Genome Sequences and Uses Thereof) 및 US 2009/0100536호(Transgenic Plants with Enhanced Agronomic Traits). 본 발명의 실시에 있어서, 문헌[Morrell et al "Crop genomics:advances and applications" Nat Rev Genet. 2011 Dec 29;13(2):85-96]의 내용 및 개시내용도 또한 그들 전문이 본원에 참조로 포함된다. 본 발명의 유리한 구현예에서, CRISPR/Cas9 시스템을 사용하여, 미세조류를 조작한다(실시예 14). 따라서, 본원에서 동물 세포에 대한 참고내용은 다르게 명백하지 않은 한, 필요한 부분만 약간 수정하여 식물 세포에도 적용할 수 있다.
일 양태에서, 본 발명은 생체내, 생체외 또는 시험관내에서 이루어질 수 있는 진핵 세포에서의 표적 폴리뉴클레오티드의 변형 방법을 제공한다. 일부 구현예에서, 상기 방법은 인간 또는 비-인간 동물 또는 식물(미세조류 포함)로부터 세포 또는 세포 집단을 샘플링하는 단계 및 세포 또는 세포들을 변형시키는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비-인간 동물 또는 식물(미세조류 포함)로 재도입될 수 있다.
일 양태에서, 본 발명은 상기 방법 및 조성물에 개시된 임의의 하나 이상의 요소를 함유하는 키트를 제공한다. 일부 구현예에서, 키트는 벡터 시스템 및 키트의 사용을 위한 지침서를 포함한다. 일부 구현예에서, 벡터 시스템은 (a) tracr 메이트 서열, 및 tracr 메이트 서열의 상류에 하나 이상의 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동가능하게 연결된 제1 조절 요소로서, 가이드 서열은 발현되는 경우, 진핵 세포 내의 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하고, CRISPR 복합체는 (1) 표적 서열에 혼성화되는 가이드 서열, 및 (2) tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화된 CRISPR 효소를 포함하는 제1 조절 요소; 및/또는 (b) 핵 국소화 서열을 포함하는 상기 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함한다. 요소는 개별적으로 또는 조합하여 제공될 수 있으며, 임의의 적절한 용기, 예를 들어, 바이얼, 병 또는 튜브에 제공될 수 있다. 일부 구현예에서, 키트는 1가지 이상의 언어, 예를 들어, 1가지 초과의 언어의 지침서를 포함한다.
일부 구현예에서, 키트는 본원에 기술된 요소 중 하나 이상을 사용하는 과정에 사용하기 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적절한 용기에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 저장 완충제를 제공할 수 있다. 시약은 특정 검정에 사용가능한 형태 또는 사용 전에 하나 이상의 다른 성분의 첨가를 필요로 하는 형태(예를 들어, 농축물 또는 동결건조 형태)로 제공될 수 있다. 완충제는 탄산나트륨 완충제, 중탄산나트륨 완충제, 붕산염 완충제, 트리스(Tris) 완충제, MOPS 완충제, HEPES 완충제 및 그들의 조합을 포함하나 이들에 한정되지 않는 임의의 완충제일 수 있다. 일부 구현예에서, 완충제는 알칼리성이다. 일부 구현예에서, 완충제는 약 7 내지 약 10의 pH를 갖는다. 일부 구현예에서, 키트는 가이드 서열과 조절 요소를 작동가능하게 연결하도록, 벡터에 삽입하기 위한 가이드 서열에 상응하는 하나 이상의 올리고뉴클레오티드를 포함한다. 일부 구현예에서, 키트는 상동성 재조합 주형 폴리뉴클레오티드를 포함한다.
일 양태에서, 본 발명은 CRISPR 시스템의 하나 이상의 요소의 사용 방법을 제공한다. 본 발명의 CRISPR 복합체는 효율적인 표적 폴리뉴클레오티드의 변형 수단을 제공한다. 본 발명의 CRISPR 복합체는 다수의 세포 유형에서 표적 폴리뉴클레오티드를 변형시키는(예를 들어, 결실시키는, 삽입하는, 전위시키는, 불활성화시키는, 활성화시키는) 것을 포함하는 매우 다양한 유용성을 갖는다. 이와 같이, 본 발명의 CRISPR 복합체는 예를 들어, 유전자 치료법, 약물 스크리닝, 질병 진단 및 예후에서 넓은 스펙트럼의 응용을 갖는다. 예시적인 CRISPR 복합체는 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열과 복합체화되는 CRISPR 효소를 포함한다. 가이드 서열은 tracr 메이트 서열에 연결되며, tracr 메이트 서열은 차례로 tracr 서열에 혼성화된다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내인성이거나 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 산물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크(junk) DNA)일 수 있다. 이론에 구속되지 않으면서, 표적 서열이 PAM(프로토스페이서 인접 모티프); 즉, CRISPR 복합체에 의해 인식되는 짧은 서열과 회합되어야 하는 것으로 여겨진다. PAM에 대한 정밀한 서열 및 길이 요건은 사용되는 CRISPR 효소에 따라 달라지지만, PAM은 전형적으로 프로토스페이서(즉, 표적 서열)에 인접한 2 내지 5개 염기쌍 서열이다. PAM 서열의 예는 하기 실시예 섹션에 제공되어 있으며, 당업자는 주어진 CRISPR 효소와 함께 사용하기 위한 추가의 PAM 서열을 확인할 수 있을 것이다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 모두의 내용이 본원에 참조로 포함되는, 각각 브로드 참조번호 BI-2011/008/WSGR 사건 번호 44063-701.101 및 BI-2011/008/WSGR 사건 번호 44063-701.102를 갖고, 둘 모두 명칭이 SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION이고, 각각 2012년 12월 12일 및 2013년 1월 2일에 출원된 미국 가출원 제61/736,527호 및 제61/748,427호에 열거된 바와 같은 다수의 질병-관련 유전자 및 폴리뉴클레오티드, 및 신호전달 생화학 경로-관련 유전자 및 폴리뉴클레오티드를 포함할 수 있다.
표적 폴리뉴클레오티드의 예는 신호전달 생화학 경로와 관련된 서열, 예를 들어, 신호전달 생화학적 경로-관련 유전자 또는 폴리뉴클레오티드를 포함한다. 표적 폴리뉴클레오티드의 예는 질병 관련 유전자 또는 폴리뉴클레오티드를 포함한다. "질병-관련" 유전자 또는 폴리뉴클레오티드는 질병이 없는 대조군의 조직 또는 세포와 비교하여, 질병-발생 조직으로부터 유래된 세포에서 비정상적인 수준 또는 비정상적인 형태로 전사 또는 번역 산물을 생성하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자일 수 있으며; 그것은 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있고, 여기서, 변경된 발현은 질병의 발생 및/또는 진행과 관련이 있다. 또한, 질병-관련 유전자는 질병의 병인에 직접적인 원인이 있거나, 그에 원인이 있는 유전자(들)와 연관 불균형이 있는 돌연변이(들) 또는 유전적 변이를 갖는 유전자를 지칭한다. 전사 또는 번역된 산물은 공지된 것이거나 미공지된 것일 수 있으며, 정상 또는 비정상 수준으로 존재할 수 있다.
질병-관련 유전자 및 폴리뉴클레오티드의 예는 맥쿠식-네이선스 유전의학연구소(McKusick-Nathans Institute of Genetic Medicine), 존스 홉킨스 대학(Johns Hopkins University)(미국 메릴랜드주 볼티모어) 및 미국 국립생물공학정보센터(National Center for Biotechnology Information), 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용가능하며, 월드 와이드 웹에서 이용가능하다.
질병-관련 유전자 및 폴리뉴클레오티드의 예는 표 A 및 B에 열거되어 있다. 질병 특이적 정보는 맥쿠식-네이선스 유전의학연구소, 존스 홉킨스 대학(미국 메릴랜드주 볼티모어) 및 미국 국립생물공학정보센터, 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용가능하며, 월드 와이드 웹에서 이용가능하다. 신호전달 생화학 경로-관련 유전자 및 폴리뉴클레오티드의 예는 표 C에 열거되어 있다.
이들 유전자 및 경로의 돌연변이는 기능에 영향을 미치는 부적절한 단백질 또는 부적절한 양의 단백질의 생성을 야기할 수 있다. 유전자, 질병 및 단백질의 추가의 예는 미국 가출원 제61/736,527호 및 제61/748,427호로부터 본원에 참고로 포함된다. 이러한 유전자, 단백질 및 경로는 CRISPR 복합체의 표적 폴리뉴클레오티드일 수 있다.
표 A
표 B:
표 C:
또한, 본 발명의 구현예는 유전자의 녹아웃, 유전자의 증폭 및 DNA 반복부 불안정성 및 신경계 장애와 관련된 특정 돌연변이의 수복에 관한 방법 및 조성물에 관한 것이다(문헌[Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical]). 연쇄 반복(tandem repeat) 서열의 특정 양태는 20개 초과의 인간 질병의 원인이 되는 것으로 관찰되었다(반복부 불안정성의 새로운 이해: RNA·DNA 하이브리드의 역할. 문헌[McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8]). CRISPR-Cas 시스템은 이들 게놈 불안정성의 결함을 교정하도록 이용될 수 있다.
본 발명의 추가의 양태는 라포라 질병(Lafora disease)과 관련이 있는 것으로 확인된 EMP2A 및 EMP2B 유전자의 결함을 교정하기 위하여 CRISPR-Cas 시스템을 사용하는 것에 관한 것이다. 라포라 질병은 청소년기에 간질성 발작으로 시작할 수 있는 진행성 간대성근경련 간질을 특징으로 하는 상염색체 열성 질환이다. 소수의 경우의 질병이 아직 확인되지 않은 유전자의 돌연변이에 의해 유발될 수 있다. 질병은 발작, 근육연축, 보행곤란, 치매 및 결국에는 사망을 야기한다. 질병 진행에 대하여 효율적인 것으로 입증된 치료법이 현재 존재하지 않는다. 또한, 간질과 관련된 다른 유전자 이상은 CRISPR-Cas 시스템에 의해 표적화될 수 있으며, 근본이 되는 유전학은 문헌[Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009]에 추가로 기술되어 있다.
본 발명의 또 다른 양태에서, CRISPR-Cas 시스템을 사용하여 문헌[Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012]에 추가로 기술된 몇몇 유전자 돌연변이로부터 야기되는 안구 결함을 교정할 수 있다.
본 발명의 몇몇 추가의 양태는 토픽 세부항목 유전 장애하에 국립보건원의 웹사이트에 추가로 기술된 매우 다양한 유전 질병과 관련된 결함을 교정하는 것에 관한 것이다. 유전적 뇌 질병은 부신백질이영양증, 뇌들보 무발생, 에카르디 증후군, 알퍼스병, 알츠하이머병, 바르트 증후군, 배튼병, CADASIL, 소뇌변성, 파브리병, 게르스트만 슈투로이슬러 샤잉커 병, 헌팅톤병 및 기타 3중 반복 장애, 라이병, 레슈-니한 증후군, 멘케스 질병, 사립체성 근병증 및 NINDS 거대후두각을 포함할 수 있으나 이들에 한정되지 않는다. 이들 질병은 세부항목 유전 뇌 장애하에 국립보건원의 웹사이트에 추가로 기술되어 있다.
일부 구현예에서, 질환은 신생물일 수 있다. 일부 구현예에서, 질환이 신생물인 경우, 표적화될 유전자는 표 A에 열거된 것들 중 임의의 것이다(이러한 경우에, PTEN 등). 일부 구현예에서, 질환은 연령-관련 황반 변성일 수 있다. 일부 구현예에서, 질환은 정신분열 장애일 수 있다. 일부 구현예에서, 질환은 트리뉴클레오티드 반복 장애일 수 있다. 일부 구현예에서, 질환은 유약 X 증후군일 수 있다. 일부 구현예에서, 질환은 세크레타제 관련 장애일 수 있다. 일부 구현예에서, 질환은 프리온-관련 장애일 수 있다. 일부 구현예에서, 질환은 ALS일 수 있다. 일부 구현예에서, 질환은 약물 중독일 수 있다. 일부 구현예에서, 질환은 자폐증일 수 있다. 일부 구현예에서, 질환은 알츠하이머병일 수 있다. 일부 구현예에서, 질환은 염증일 수 있다. 일부 구현예에서, 질환은 파킨슨병일 수 있다.
파킨슨병과 관련된 단백질의 예는 α-시누클레인, DJ-1, LRRK2, PINK1, Parkin, UCHL1, 신필린(Synphilin)-1 및 NURR1을 포함하나 이들에 한정되지 않는다.
중독 관련 단백질의 예는 예를 들어, ABAT를 포함할 수 있다.
염증-관련 단백질의 예는 예를 들어, Ccr2 유전자에 의해 인코딩된 단핵구 화학주성 단백질-1(MCP1), Ccr5 유전자에 의해 인코딩된 C-C 케모카인 수용체 5형(CCR5), Fcgr2b 유전자에 의해 인코딩된 IgG 수용체 IIB(FCGR2b, CD32로도 명명) 또는 Fcer1g 유전자에 의해 인코딩된 Fc 엡실론(epsilon) R1g(FCER1g) 단백질을 포함할 수 있다.
심혈관 질병 관련 단백질의 예는 예를 들어, IL1B(인터류킨 1, 베타), XDH(잔틴 데하이드로게나제), TP53(종양 단백질 p53), PTGIS(프로스타글란딘 I2(프로스타사이클린(prostacyclin)) 신타제), MB(미오글로빈), IL4(인터류킨 4), ANGPT1(안지오포이에틴 1), ABCG8(ATP-결합 카세트, 하위-과 G(WHITE), 구성원 8) 또는 CTSK(카텝신 K)를 포함할 수 있다.
알츠하이머병 관련 단백질의 예는 예를 들어, VLDLR 유전자에 의해 인코딩되는 극저밀도 리포단백질 수용체 단백질(VLDLR), UBA1 유전자에 의해 인코딩되는 유비퀴틴-유사 변형 활성화 효소(UBA1) 또는 UBA3 유전자에 의해 인코딩되는 NEDD8-활성화 효소 E1 촉매 서브유닛 단백질(UBE1C)을 포함할 수 있다.
자폐 스펙트럼 장애와 관련된 단백질의 예는 예를 들어, BZRAP1 유전자에 의해 인코딩되는 벤조디아자핀 수용체(주변) 관련 단백질 1(BZRAP1), AFF2 유전자(MFR2로도 명명)에 의해 인코딩되는 AF4/FMR2 과 구성원 2 단백질(AFF2), FXR1 유전자에 의해 인코딩되는 유약 X 정신 지체 상염색체 상동체 1 단백질(FXR1) 또는 FXR2 유전자에 의해 인코딩되는 유약 X 정신 지체 상염색체 상동체 2 단백질(FXR2)을 포함할 수 있다.
황반 변성과 관련된 단백질의 예는 예를 들어, ABCR 유전자에 의해 인코딩되는 ATP-결합 카세트, 하위과 A(ABC1) 구성원 4 단백질(ABCA4), APOE 유전자에 의해 인코딩되는 아포리포단백질 E 단백질(APOE) 또는 CCL2 유전자에 의해 인코딩되는 케모카인(C-C 모티프) 리간드 2 단백질(CCL2)을 포함할 수 있다.
정신분열증과 관련된 단백질의 예는 NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B 및 그들의 조합을 포함할 수 있다.
종양 저해에 수반되는 단백질의 예는 예를 들어, ATM(돌연변이된 혈관확장성 운동실조증), ATR(혈관확장성 운동실조증 및 Rad3 관련), EGFR(상피 성장 인자 수용체), ERBB2(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 2), ERBB3(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 3), ERBB4(v-erb-b2 적혈모구성 백혈병 바이러스 암유전자 상동체 4), Notch 1, Notch2, Notch 3 또는 Notch 4를 포함할 수 있다.
세크레타제 장애와 관련된 단백질의 예는 예를 들어, PSENEN(프레세닐린 인핸서 2 상동체(C. 엘레간스(C. elegans)), CTSB(카텝신 B), PSEN1(프레세닐린 1), APP(아밀로이드 베타(A4) 전구체 단백질), APH1B(앞인두 결함 1 상동체 B(C. 엘레간스)), PSEN2(프레세닐린 2(알츠하이머병 4)) 또는 BACE1(베타-부위 APP-절단 효소 1)을 포함할 수 있다.
근위축성 측삭 경화증과 관련된 단백질의 예는 SOD1(슈퍼옥시드 디스뮤타제(dismutase) 1), ALS2(근위축성 측삭 경화증 2), FUS(육종에서 융합), TARDBP(TAR DNA 결합 단백질), VAGFA(혈관 내피 성장 인자 A), VAGFB(혈관 내피 성장 인자 B) 및 VAGFC(혈관 내피 성장 인자 C) 및 그들의 임의의 조합을 포함할 수 있다.
프리온 질병과 관련된 단백질의 예는 SOD1(슈퍼옥시드 디스뮤타제 1), ALS2(근위축성 측삭 경화증 2), FUS(육종에서 융합), TARDBP(TAR DNA 결합 단백질), VAGFA(혈관 내피 성장 인자 A), VAGFB(혈관 내피 성장 인자 B) 및 VAGFC(혈관 내피 성장 인자 C) 및 그들의 임의의 조합을 포함할 수 있다.
프리온 장애에서의 신경변성 질환과 관련된 단백질의 예는 예를 들어, A2M(알파-2-마크로글로불린), AATF(아폽토시스 길항작용 전사 인자), ACPP(전립선 산 포스파타제), ACTA2(액틴 알파 2 평활근 대동맥), ADAM22(ADAM 메탈로펩티다제 도메인), ADORA3(아데노신 A3 수용체) 또는 ADRA1D(알파-1D 아드레노수용체에 대한 알파-1D 아드레날린 작용성 수용체)를 포함할 수 있다.
면역결핍과 관련된 단백질의 예는 예를 들어, A2M[알파-2-마크로글로불린]; AANAT[아릴알킬아민 N-아세틸트랜스퍼라제]; ABCA1[ATP-결합 카세트, 하위과 A(ABC1), 구성원 1]; ABCA2[ATP-결합 카세트, 하위과 A(ABC1), 구성원 2]; 또는 ABCA3[ATP-결합 카세트, 하위과 A(ABC1), 구성원 3];을 포함할 수 있다.
트리뉴클레오티드 반복 장애와 관련된 단백질의 예는 예를 들어, AR(안드로겐 수용체), FMR1(유약 X 정신 지체 1), HTT(헌팅틴) 또는 DMPK(근긴장성 이영양증-단백질 키나제), FXN(프라탁신(frataxin)), ATXN2(아탁신(ataxin) 2)를 포함한다.
신경전달 장애와 관련된 단백질의 예는 예를 들어, SST(소마토스타틴), NOS1(산화질소 신타제 1(뉴런)), ADRA2A(아드레날린 작용성, 알파-2A-, 수용체), ADRA2C(아드레날린 작용성, 알파-2C-, 수용체), TACR1(타키키닌 수용체 1) 또는 HTR2c(5-하이드록시트립타민(세로토닌) 수용체 2C)를 포함한다.
신경발달-관련 서열의 예는 예를 들어, A2BP1[아탁신 2-결합 단백질 1], AADAT[아미노아디페이트 아미노트랜스퍼라제], AANAT[아릴알킬아민 N-아세틸트랜스퍼라제], ABAT[4-아미노부티레이트 아미노트랜스퍼라제], ABCA1[ATP-결합 카세트, 하위과 A(ABC1), 구성원 1] 또는 ABCA13[ATP-결합 카세트, 하위과 A(ABC1), 구성원 13]을 포함한다.
본 발명의 시스템으로 치료가능한 바람직한 질환의 추가의 예는 에카르디 고우티에레스(Aicardi-Goutieres) 증후군; 알렉산더병; 알란-헌든-두들리(Allan-Herndon-Dudley) 증후군; POLG-관련 장애; 알파-만노시도시스(Alpha-Mannosidosis)(II 및 III형); 알스트스트롬(Alstrom) 증후군; 안젤만(Angelman); 증후군; 혈관확장성 운동실조증; 신경 세로이드 리포푸신증; 베타-지중해빈혈; 양쪽성 시신경위축 및 (영아) 1형 시신경위축; 망막모세포종(양쪽성); 캐너번병; 뇌-눈-얼굴-골격 증후군 1[COFS1]; 뇌힘줄황색종증; 코넬리아디란지 증후군; MAPT-관련 장애; 유전적 프리온 질병; 드라벳 증후군; 조기-발병 가족성 알츠하이머병; 프리드리히 운동실조[FRDA]; 프린스 증후군; 푸코시드 축적증; 후쿠야마형 선천성 근이영양증; 갈락토시알리도시스; 고셰병; 유기 산혈증; 혈구탐식성 림프조직구증; 허친슨-길포오드 조로증 증후군; II형 뮤코리피드증; 유아 유리 시알산 축적병; PLA2G6-관련 신경변성; 제벨 랑쥐-닐슨 증후군; 연접부 수포성 표피박리증; 헌팅톤병; 크라베병(유아); 미토콘드리아 DNA-관련 레이 증후군 및 NARP; 레슈-니한 증후군; LIS1-관련 뇌회결손; 로우 증후군; 단풍시럽뇨병; MECP2 중복 증후군; ATP7A-관련 구리 수송 장애; LAMA2-관련 근이영양증; 아릴설파타제 A 결핍; I, II 또는 III형 점액다당류증; 퍼옥시좀 생물발생 장애; 젤웨거 증후군 스펙트럼; 뇌 철 축적 장애가 있는 신경변성; 산 스핑고미엘리나제 결핍; C형 니만 픽병; 글리신 뇌병증; ARX-관련 장애; 요소 사이클 장애; COL1A1/2-관련 불완전골형성; 미토콘드리아 DNA 결실 증후군; PLP1-관련 장애; 페리(Perry) 증후군; 펠란-맥더미드 증후군; II형 글리코겐 축적병(폼페병)(유아); MAPT-관련 장애; MECP2-관련 장애; 1형 어깨엉덩관절 점상 연골형성이상; 로버츠 증후군; 샌드호프병; 쉰들러병 - 1형; 아데노신 탈아미노효소 결핍; 스미스-렘리-오피츠 증후군; 척수성 근위축; 유아-발병 척수소뇌성 실조증; 헥소사미니다제 A 결핍; 1형 치사성 이형성증; VI형 콜라겐-관련 장애; I형 어셔 증후군; 선천성 근이영양증; 울프-허쉬호른 증후군; 리소좀산 리파제 결핍; 및 색소성 건피증으로부터 선택될 수 있다.
단백질 치료제의 만성적 투여는 특정 단백질에 대한 허용가능하지 않은 면역 반응을 야기할 수 있다. 단백질 약물의 면역원성은 소수의 면역우성 헬퍼 T 림프구(HTL) 에피토프의 결과일 수 있다. 이들 단백질에 함유된 이들 HTL 에피토프의 MHC 결합 친화성의 감소에 의해, 면역원성이 더 낮은 약물이 생성될 수 있다(문헌[Tangri S, et al. ("Rationally engineered therapeutic proteins with reduced immunogenicity" J Immunol. 2005 Mar 15;174(6):3187-96)]. 본 발명에서, 특히, CRISPR 효소의 면역원성은 에리트로포이에틴에 관하여 탄그리(Tangri) 등에서 먼저 시작되고, 이후에 개발된 방법에 따라 감소될 수 있다. 따라서, 유도 진화(directed evolution) 또는 합리적 설계를 사용하여 숙주 종(인간 또는 다른 종)에서 CRISPR 효소(예를 들어, Cas9)의 면역원성을 감소시킬 수 있다.
식물에서, 병원체는 종종 숙주-특이적이다. 예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum) f. sp. 리코페르시시(lycopersici)는 토마토 시듦을 야기하나 오직 토마토만을 공격하고, 푸사리움 옥시스포룸 f. 디안티이 푸키니아 그라미니스(dianthii Puccinia graminis) f. sp. 트리티시(tritici)는 오직 밀만을 공격한다. 식물은 대부분의 병원체에 저항하는 기존의 방어 및 유도된 방어를 갖는다. 식물 세대에 걸친 돌연변이 및 재조합 사건은 유전적 변이를 야기하며, 이는 특히 병원체가 식물보다 더 많은 빈도로 재생되기 때문에, 감수성이 생기게 한다. 식물에서는 비-숙주 저항성이 존재할 수 있는데, 예를 들어 숙주 및 병원체는 양립불가능하다. 또한, 수평 저항성, 예를 들어, 통상적으로 많은 유전자에 의해 제어되는 모든 종류의 병원체에 대한 불완전한 저항성, 및 수직 저항성, 예를 들어, 통상 소수의 유전자에 의해 제어되는 일부 종류의 병원체에 대해서는 완전하지만 다른 종류에 대해서는 그렇지 않은 저항성이 존재할 수 있다. 유전자 대 유전자(Gene-for-Gene) 수준에 있어서, 식물 및 병원체는 함께 진화하며, 하나의 균형의 유전적 변화는 다른 것을 변화시킨다. 따라서, 천연 가변성을 사용하여, 육종자는 수율, 품질, 균일성, 내한성, 저항성에 대해 가장 유용한 유전자를 조합한다. 저항성 유전자의 공급원은 고유 또는 외래 품종, 토종(Heirloom) 품종, 야생 식물 동류 및 유도된 돌연변이, 예를 들어 돌연변이유발 작용제로 식물 물질을 처리하는 것을 포함한다. 본 발명을 사용하여, 식물 육종자에게 돌연변이를 유도하는 신규 도구가 제공된다. 따라서, 당업자는 저항성 유전자 공급원의 게놈을 분석할 수 있으며, 요망되는 특징 또는 특성을 갖는 품종에서 본 발명을 이용하여 이전의 돌연변이유발 작용제보다 더 큰 정밀도로 저항성 유전자의 발생을 유도하여, 이에 따라 식물 육종 프로그램을 가속화시키고 향상시킬 수 있다.
명백한 바와 같이, 본 발명의 시스템이 임의의 대상 폴리뉴클레오티드 서열을 표적화하기 위해 사용될 수 있음이 예상된다. 본 발명의 시스템을 사용하여 유용하게 치료될 수 있는 질환 또는 질병의 일부 예는 상기 표에 포함되어 있으며, 그들 질환과 현재 관련되어 있는 유전자의 예도 또한 거기에 제공된다. 그러나, 예시된 유전자는 배타적인 것은 아니다.
실시예
하기의 실시예는 본 발명의 다양한 구현예를 예시할 목적으로 제공되며, 어떠한 방식으로든 본 발명을 제한하고자 하지 않는다. 본원에 기술된 방법과 함께 본 발명의 실시예는 본원에서 바람직한 구현예를 대표하는 것이며, 예시적이고, 본 발명의 범주에 대한 제한으로 의도되지 않는다. 거기에서의 변화 및 다른 용도는 청구범위의 범주에 의해 정의되는 바와 같은 본 발명의 목적에 포함되며, 당업자에게 수행될 것이다.
실시예 1: 진핵 세포의 핵에서의 CRISPR 복합체 활성
예시적인 II형 CRISPR 시스템은 스트렙토코커스 피오게네스 SF370 유래의 II형 CRISPR 유전자좌이며, 이는 4개 유전자, Cas9, Casl, Cas2 및 Csn1의 클러스터 뿐 아니라 2개의 비-코딩 RNA 요소, tracrRNA, 및 비-반복 서열의 짧은 스트레치(스페이서, 각각 30bp)에 의해 산재된 반복 서열의 특징적 어레이(직접 반복부)를 포함한다. 이러한 시스템에서, 표적화된 DNA 이중-가닥 파단(DSB)은 4개의 순차적 단계로 생성된다(도 2a). 먼저, 2개의 비-코딩 RNA, pre-crRNA 어레이 및 tracrRNA를 CRISPR 유전자좌로부터 전사시킨다. 두번째로, tracrRNA를 pre-crRNA 의 직접 반복부에 혼성화시키고, 이어서 개별 스페이서 서열을 함유하는 성숙 crRNA로 가공한다. 세 번째로, 성숙 crRNA:tracrRNA 복합체는 crRNA의 스페이서 영역과 프로토스페이서 DNA 사이의 헤테로듀플렉스 형성을 통해 Cas9를 프로토스페이서 및 상응하는 PAM으로 구성된 DNA 표적으로 유도한다. 마지막으로, Cas9는 PAM의 상류의 표적 DNA의 절단을 매개하여 프로토스페이서 내에 DSB를 생성한다(도 2a). 이러한 실시예는 진핵 세포의 핵에서 CRISPR 복합체 활성을 유도하기 위해 이러한 RNA-프로그램화가능 뉴클레아제 시스템을 조정하는 예시적인 과정을 기술한다.
포유동물 세포에서의 CRISPR 성분의 발현을 향상시키기 위하여, 스트렙토코커스 피오게네스(S. 피오게네스)의 SF370 유전자좌 1 유래의 2개의 유전자, Cas9(SpCas9) 및 RNase III(SpRNase III)를 코돈-최적화시켰다. 핵 국소화를 용이하게 하기 위하여, 핵 국소화 신호(NLS)를 SpCas9 및 SpRNase III 둘 모두의 아미노(N)- 또는 카르복실(C)-말단에 포함시켰다(도 2b). 또한, 단백질 발현의 가시화를 용이하게 하기 위하여, 형광 단백질 마커도 또한 단백질 둘 모두의 N- 또는 C-말단에 포함시켰다(도 2b). NLS가 N- 및 C-말단 둘 모두에 부착된 SpCas9의 버전(2xNLS-SpCas9)도 또한 생성하였다. NLS-융합 SpCas9 및 SpRNase III를 함유하는 작제물을 293FT 인간 배아 신장(HEK) 세포 내로 트랜스펙션시키고, SpCas9 및 SpRNase III에 대한 NLS의 상대적 위치지정이 그들의 핵 국소화 효율에 영향을 미치는 것으로 관찰되었다. C-말단 NLS는 SpRNase III를 핵에 표적화시키는데 충분하였지만, 단일의 카피의 이들 특정 NLS를 SpCas9의 N- 또는 C-말단 중 어느 하나로 부착하면, 이러한 시스템에서 적당한 핵 국소화를 달성할 수 없었다. 이러한 실시예에서, C-말단 NLS는 뉴클레오플라스민의 것이었으며(KRPAATKKAGQAKKKK), C-말단 NLS는 SV40 대형 T-항원의 것이었다(PKKKRKV). 시험한 SpCas9의 버전 중에, 오직 2xNLS-SpCas9만이 핵 국소화를 나타내었다(도 2b).
스트렙토코커스 피오게네스 SF370의 CRISPR 유전자좌로부터의 tracrRNA은 2개의 전사 시작 부위를 가져, 89-뉴클레오티드(nt) 및 171 nt의 2개의 전사물을 야기하며, 이는 이후에 동일한 75 nt 성숙 tracrRNA로 가공된다. 보다 짧은 89 nt tracrRNA를 포유동물 세포에서의 발현을 위해 선택하였다(도 6b에 나타낸 서베이어 검정의 결과에 의해 결정시 작용성이 있는 도 6에 예시된 발현 작제물). 전사 시작 부위는 +1로 표시되며, 전사 종결자 및 노던 블롯에 의해 프로빙되는 서열도 또한 표시되어 있다. 가공된 tracrRNA의 발현도 또한 노던 블롯에 의해 확인하였다. 도 7c는 긴 또는 짧은 tracrRNA, 및 SpCas9 및 DR-EMX1(1)-DR을 지니는 U6 발현 작제물이 트랜스펙션된 293FT 세포로부터 추출된 전체 RNA의 노던 블롯 분석의 결과를 보여준다. 좌측 및 우측 패널은 각각 SpRNase III의 부재 또는 존재 하에 트랜스펙션된 293FT 세포로부터의 것이다. U6은 인간 U6 snRNA를 표적화하는 프로브로 블롯팅된 로딩 대조군을 나타낸다. 짧은 tracrRNA 발현 작제물의 트랜스펙션은 풍부한 수준의 tracrRNA의 가공된 형태를 야기한다(약 75 bp). 매우 소량의 긴 tracrRNA가 노던 블롯에서 검출된다.
정밀한 전사 개시를 촉진시키기 위하여 RNA 중합효소 III 기반의 U6 프로모터를 선택하여, tracrRNA의 발현을 유도하였다(도 2c). 유사하게, U6 프로모터 기반의 작제물을 2개의 직접 반복부(DR, 또한 용어 "tracr-메이트 서열"에 포함; 도 2c)가 측부 배치된 단일의 스페이서로 구성된 pre-crRNA 어레이를 발현하도록 발생시켰다. 초기 스페이서를 대뇌 피질의 발생의 주요 유전자인 인간 EMX1 유전자좌 내의 33-염기-쌍(bp) 표적 부위(30-bp 프로토스페이서 + Cas9의 NGG 인식 모티프를 만족시키는 3-bp CRISPR 모티프(PAM) 서열)를 표적화하도록 설계하였다(도 2c).
포유동물 세포에서 CRISPR 시스템(SpCas9, SpRNase III, tracrRNA 및 pre-crRNA)의 이종 발현이 포유동물 염색체의 표적화된 절단을 달성할 수 있는지를 시험하기 위하여, HEK 293FT 세포를 CRISPR 성분의 조합으로 트랜스펙션시켰다. 포유동물 핵에서 DSB가 삽입-결실의 형성을 야기하는 비-상동 말단 연결(NHEJ) 경로에 의해 부분적으로 수복되기 때문에, 서베이어 검정을 사용하여, 표적 EMX1 유전자좌에서 잠재적인 절단 활성을 검출하였다(예를 들어, 문헌[Guschin et al., 2010, Methods Mol Biol 649: 247] 참조). 모든 4개의 CRISPR 성분의 동시-트랜스펙션은 프로토스페이서 최대 5.0% 절단을 유도할 수 있었다(도 2d 참조). 또한, SpRNase III을 제한 모든 CRISPR 성분의 동시-트랜스펙션에 의해, 프로토스페이서에서 최대 4.7% 삽입-결실이 유도되었으며, 이는 crRNA 성숙을 보조할 수 있는 내인성 포유동물 RNase, 예를 들어, 관련 Dicer 및 Drosha 효소가 존재할 수 있음을 시사한다. 남아 있는 3개 성분 중 임의의 것의 제거에 의해, CRISPR 시스템의 게놈 절단 활성이 없어졌다(도 2d). 표적 유전자좌를 함유하는 앰플리콘(amplicon)의 생거(Sanger) 시퀀싱에 의해, 절단 활성이 입증되었으며: 43개의 시퀀싱된 클론 중에, 5개의 돌연변이된 대립형질(11.6%)이 관찰되었다. 다양한 가이드 서열을 사용하는 유사한 실험에 의해, 29%만큼 높은 삽입-결실 백분율을 생성하였다(도 4 내지 8, 10 및 11 참조). 이들 결과는 포유동물 세포에서의 효율적인 CRISPR-매개의 게놈 변형을 위한 3-성분 시스템을 정의한다.
절단 효율을 최적화시키기 위하여, 본 발명자들은 또한 상이한 아이소형의 tracrRNA가 절단 효율에 영향을 미치는지를 시험하였으며, 이러한 예시적인 시스템에서, 오직 짧은(89-bp) 전사물 형태만이 인간 EMX1 게놈 유전자좌의 절단을 매개할 수 있는 것이 관찰되었다. 도 9는 포유동물 세포에서의 crRNA 가공의 추가의 노던 블롯 분석을 제공한다. 도 9A는 2개의 직접 반복부가 측부 배치된 단일의 스페이서(DR-EMX1(1)-DR)에 대한 발현 벡터를 보여주는 개략도를 예시한다. 인간 EMX1 유전자좌 프로토스페이서 1을 표적화하는 30 bp 스페이서 및 직접 반복부 서열은 도 9A 아래의 서열에 나타나 있다. 선은 역-상보 서열을 사용하여 EMX1(1) crRNA 검출을 위한 노던 블롯 프로브를 생성한 영역을 나타낸다. 도 9B는 DR-EMX1(1)-DR을 지니는 U6 발현 작제물로 트랜스펙션된 293FT 세포로부터 추출된 전체 RNA의 노던 블롯 분석을 보여준다. 좌측 및 우측 패널은 각각 SpRNase III의 부재 또는 존재 하에 트랜스펙션된 293FT 세포로부터의 것이다. DR-EMX1(1)-DR은 SpCas9 및 짧은 tracrRNA의 존재 하에서만 성숙 crRNA로 처리되었고, SpRNase III의 존재에 따라 달라지지 않았다. 트랜스펙션된 293FT 전체 RNA로부터 검출된 성숙 crRNA는 약 33 bp이며, 스트렙토코커스 피오게네스로부터의 39 내지 42 bp 성숙 crRNA보다 더 짧다. 이들 결과는 CRISPR 시스템이 진핵 세포로 이식될 수 있으며, 내인성 포유동물 표적 폴리뉴클레오티드의 절단을 용이하게 하도록 재프로그램화될 수 있음을 보여준다.
도 2는 이러한 실시예에 기술된 박테리아 CRISPR 시스템을 예시한다. 도 2a는 스트렙토코커스 피오게네스 SF370으로부터의 CRISPR 유전자좌 1 및 이러한 시스템에 의한 제안된 CRISPR-매개의 DNA 절단의 메카니즘을 보여주는 개략도를 예시한다. 직접 반복부-스페이서 어레이로부터 가공된 성숙 crRNA는 Cas9를 상보성 프로토스페이서 및 프로토스페이서-인접 모티프(PAM)로 구성된 게놈 표적에 지향시킨다. 표적-스페이서 염기 쌍형성 시에, Cas9는 표적 DNA에서 이중 가닥 파단을 매개한다. 도 2b는 포유동물 핵으로의 유입을 가능하게 하는 핵 국소화 신호(NLS)가 있는 스트렙토코커스 피오게네스 Cas9(SpCas9) 및 RNase III(SpRNase III)의 조작을 예시한다. 도 2c는 정밀한 전사 개시 및 종결을 촉진하기 위한 구성성 EF1a 프로모터에 의해 유도되는 SpCas9 및 SpRNase III 및 RNA Pol3 프로모터 U6에 의해 유도되는 tracrRNA 및 pre-crRNA 어레이(DR-스페이서-DR)의 포유동물 발현을 예시한다. 만족스러운 PAM 서열이 있는 인간 EMX1 유전자좌로부터의 프로토스페이서는 pre-crRNA 검정에서 스페이서로 사용된다. 도 2d는 SpCas9-매개의 최소 삽입 및 결실을 위한 서베이어 뉴클레아제 검정을 예시한다. SpRNase III, tracrRNA 및 EMX1-표적 스페이서를 지니는 pre-crRNA 어레이의 존재 및 부재 하에 SpCas9를 발현시켰다. 도 2e는 표적 유전자좌와 EMX1-표적화 crRNA 사이의 염기 쌍형성의 개략적 표현, 및 SpCas9 절단 부위에 인접한 마이크로 결실을 보이는 예시적인 크로마토그램을 예시한다. 도 2f는 다양한 마이크로 삽입 및 결실을 보이는 43개의 클론 앰플리콘의 시퀀싱 분석으로부터 확인된 돌연변이된 대립형질을 예시한다. 줄표는 결실된 염기를 나타내며, 비-정렬 또는 미스매치된 염기는 삽입 또는 돌연변이를 나타낸다. 스케일 바(scale bar) = 10 ㎛.
3-성분 시스템을 더욱 단순화시키기 위하여, 키메라 crRNA-tracrRNA 하이브리드 설계를 조정하였으며, 여기서, 성숙 crRNA(가이드 서열 포함)는 스템-루프를 통해 부분 tracrRNA에 융합되어, 천연 crRNA:tracrRNA 듀플렉스를 모방한다(도 3A).
가이드 서열은 어닐링된 올리고뉴클레오티드를 사용하여 BbsI 부위 사이에 삽입될 수 있다. 센스 및 안티-센스 가닥 상의 프로토스페이서는 각각 DNA 서열 상측 및 하측에 표기되어 있다. 인간 PVALB 및 마우스 Th 유전자좌 각각에 대하여 6.3% 및 0.75%의 변형률이 달성되었으며, 이는 다수의 유기체에 걸쳐 상이한 유전자좌의 변형에서의 CRISPR 시스템의 넓은 응용가능성을 입증한다. 키메라 작제물을 사용하여 각 유전자좌에 대하여 3개의 스페이서 중 1개에서만 절단이 검출되었지만, 동시-발현되는 pre-crRNA 배열을 사용하는 경우 27%에 미치는 삽입-결실 생성 효율로, 모든 표적 서열이 절단되었다(도 4 및 5).
도 5는 SpCas9가 포유동물 세포에서 다수의 게놈 유전자좌를 표적화하도록 재프로그램화될 수 있다는 추가의 예시를 제공한다. 도 5a는 5개의 프로토스페이서의 위치를 밑줄이 있는 서열로 나타내어 보여주는 인간 EMX1 유전자좌의 개략도를 제공한다. 도 5b는 pre-crRNA의 직접 반복부 영역과 tracrRNA 간의 혼성화를 보여주는 pre-crRNA/trcrRNA 복합체의 개략도(상측) 및 20 bp 가이드 서열, 및 헤어핀 구조로 혼성화되는 부분 직접 반복부 및 tracrRNA 서열로 구성된 tracr 메이트 서열 및 tracr 서열을 포함하는 키메라 RNA 설계의 개략도(하측)를 제공한다. 인간 EMX1 유전자좌 내의 5개의 프로토스페이서에서의 Cas9-매개의 절단의 효능을 비교하는 서베이어 검정의 결과는 도 5c에 예시되어 있다. 각각의 프로토스페이서는 가공된 pre-crRNA/tracrRNA 복합체(crRNA) 또는 키메라 RNA(chiRNA)를 사용하여 표적화된다.
RNA의 2차 구조가 분자간 상호작용에 결정적일 수 있기 때문에, 최소 자유 에너지 및 볼쯔만(Boltzmann)-가중 구조 앙상블에 기초한 구조 예측 알고리즘을 사용하여 본 발명자들의 게놈 표적화 실험에 사용되는 모든 가이드 서열의 추정상 2차 구조를 비교하였다(도 3B)(예를 들어, 문헌[Gruber et al., 2008, Nucleic Acids Research, 36: W70] 참조). 분석에 의해, 대부분의 경우에, 키메라 crRNA 맥락에서 효율적인 가이드 서열에 2차 구조 모티프가 실질적으로 없지만, 비효율적인 가이드 서열은 표적 프로토스페이서 DNA와의 염기 쌍형성을 막을 수 있는 내부 2차 구조를 형성할 가능성이 더 큰 것으로 드러났다. 따라서, 키메라 crRNA를 사용하는 경우, 스페이서 2차 구조의 가변성이 CRISPR-매개 간섭의 효율에 영향을 미칠 수 있다.
도 3은 예시적인 발현 벡터를 예시한다. 도 3A는 합성 crRNA-tracrRNA 키메라(키메라 RNA), 및 SpCas9의 발현을 유도하기 위한 비-시스트로닉 벡터의 개략도를 제공한다. 키메라 가이드 RNA는 게놈 표적 부위 내의 프로토스페이서에 상응하는 20-bp 가이드 서열을 함유한다. 도 3B는 인간 EMX1, PVALB, 및 마우스 Th 유전자좌를 표적화하는 가이드 서열, 및 그들의 예측된 2차 구조를 보여주는 개략도를 제공한다. 각 표적 부위에서의 변형 효율은 RNA 2차 구조 도면 아래에 표기되어 있다(EMX1, n = 216개 앰플리콘 시퀀싱 판독치; PVALB, n = 224개 판독치; Th, n = 265개 판독치). 폴딩 알고리즘에 의해, 레인보우 스케일로 표기시 각 염기가 예측되는 2차 구조의 그의 추정 확률에 따라 채색된 결과가 생성되었으며, 이는 도 3B에 그레이 스케일로 재현된다. 가이드 올리고에 대한 삽입 부위에 연결된 U6 프로모터 및 SpCas9 코딩 서열에 연결된 Cbh 프로모터를 혼입한 단일의 발현 벡터를 포함하는 SpCas9에 대한 추가의 벡터 설계는 도 3A에 나타나 있다.
천연적으로 CRISPR이 작동되는 원핵 세포에서 2차 구조를 함유하는 스페이서가 기능할 수 있는지를 시험하기 위하여, 프로토스페이서를 지니는 플라스미드의 형질전환 간섭을, 스트렙토코커스 피오게네스 SF370 CRISPR 유전자좌 1을 이종 발현하는 에스케리키아 콜라이 균주에서 시험하였다(도 3C). CRISPR 유전자좌를 저-카피 에스케리키아 콜라이 발현 벡터로 클로닝하고, crRNA 어레이를 DR의 쌍이 측부 배치된 단일의 스페이서로 대체하였다(pCRISPR). 상이한 pCRISPR 플라스미드를 지니는 에스케리키아 콜라이 균주를, 상응하는 프로토스페이서 및 PAM 서열을 함유하는 챌린지 플라스미드로 형질전환시켰다(도 3C). 박테리아 검정에서, 모든 스페이서는 효율적인 CRISPR 간섭을 촉진시켰다(도 3C). 이들 결과는 포유동물 세포에서 CRISPR 활성의 효율에 영향을 미치는 추가의 인자가 존재함을 시사한다.
CRISPR-매개의 절단의 특이성을 조사하기 위하여, 포유동물 게놈에서 프로토스페이서 절단에 대한 가이드 서열 내의 단일-뉴클레오티드 돌연변이의 영향을, 단일의 점 돌연변이가 있는 일련의 EMX1-표적화 키메라 crRNA를 사용하여 분석하였다(도 4a). 도 4b는 상이한 돌연변이 키메라 RNA와 쌍을 형성하는 경우, Cas9의 절단 효율을 비교하는 서베이어 뉴클레아제 검정의 결과를 예시한다. PAM의 최대 12-bp 5'의 단일-염기 미스매치는 SpCas9에 의한 게놈 절단을 없애는 한편, 더 먼 상류 위치에 돌연변이가 있는 스페이서는 원래의 프로토스페이서 표적에 대한 활성을 보유하였다(도 4b). PAM에 더하여, SpCas9는 마지막 12-bp의 스페이서 내에 단일-염기 특이성을 갖는다. 또한, CRISPR은 동일한 EMX1 프로토스페이서를 표적화하는 TALE 뉴클레아제(TALEN)의 쌍만큼 효율적으로 게놈 절단을 매개할 수 있다. 도 4c는 EMX1을 표적화하는 TALEN의 설계를 보여주는 개략도를 제공하며, 도 4d는 TALEN 및 Cas9의 효율을 비교하는 서베이어 겔을 보여준다(n=3).
오류-유발 NHEJ 메카니즘을 통해 포유동물 세포에서 CRISPR-매개의 유전자 교정을 달성하기 위한 성분의 세트를 확립하면, 상동성 재조합(HR), 게놈에서 정밀한 교정을 이루기 위한 고충실도 유전자 수복 경로를 자극하는 CRISPR의 능력을 시험하였다. 야생형 SpCas9는 부위-특이적 DSB를 매개할 수 있는데, 이는 NHEJ 및 HR 둘 모두를 통해 수복될 수 있다. 또한, SpCas9의 RuvC I 촉매 도메인에서의 아스파르트산염에서 알라닌으로의 치환(D10A)을 조작하여 뉴클레아제를 닉카아제로 전환시켜(SpCas9n; 도 5a에 예시)(예를 들어, 문헌[Sapranausaks et al., 2011, Cucleic Acis Research, 39: 9275]; 문헌[Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109:E2579] 참조), 닉이 있는 게놈 DNA가 고-충실도 상동성-유도 수복(HDR)을 겪게 하였다. 서베이어 검정에 의해, SpCas9n이 EMX1 프로토스페이서 표적에서 삽입-결실을 생성하지 않음이 확인되었다. 도 5b에 예시된 바와 같이, EMX1-표적화 키메라 crRNA와 SpCas9의 동시-발현에 의해, 표적 부위에서 삽입-결실이 생성되는 한편, SpCas9n과의 동시-발현은 그렇지 않았다(n=3). 또한, 327개 앰플리콘의 시퀀싱에 의해, SpCas9n에 의해 유도되는 임의의 삽입-결실이 검출되지 않았다. 동일한 유전자좌를 선택하여, HEK 293FT 세포를 EMX1, hSpCas9 또는 hSpCas9n을 표적화하는 키메라 RNA, 및 프로토스페이서 근처에 제한 부위(HindIII 및 NheI)의 쌍을 도입하기 위한 HR 주형으로 동시-트랜스펙션시킴으로써 CRISPR-매개의 HR을 시험하였다. 도 5c는 재조합 지점 및 프라이머 어닐링 서열(화살표)의 상대적 위치와 함께, HR 전략의 개략적 예시를 제공한다. SpCas9 및 SpCas9n은 실제로 HR 주형이 EMX1 유전자좌로 통합되는 것을 촉매작용시킨다. 표적 영역의 PCR 증폭 후에, HindIII를 사용한 제한 분해에 의해, 예상되는 단편 크기(도 5d에 나타낸 제한 단편 길이 다형성 겔 분석에서 화살표)에 상응하는 절단 산물이 나타났으며, SpCas9 및 SpCas9n은 유사한 수준의 HR 효율을 매개한다. 본 발명자들은 게놈 앰플리콘의 생거 시퀀싱을 사용하여 HR을 추가로 입증하였다(도 5e). 이들 결과는 포유동물 게놈 내로의 표적화된 유전자 삽입을 촉진시키기 위한 CRISPR의 유용성을 입증한다. 야생형 SpCas9의 14-bp(스페이서로부터 12-bp 및 PAM으로부터 2-bp) 표적 특이성을 고려하여, 단일 가닥 파단이 오류-유발 NHEJ 경로에 대한 기질이 아니기 때문에, 닉카아제의 이용가능성은 표적외 변형 가능성을 상당히 감소시킬 수 있다.
배열된 스페이서가 있는 CRISPR 유전자좌의 천연 구조를 모방하는 발현 작제물(도 2a)을 작제하여, 다중 서열 표적화의 가능성을 시험하였다. EMX1- 및 PVALB-표적화 스페이서의 쌍을 인코딩하는 단일의 CRISPR 어레이를 사용하여, 둘 모두의 유전자좌에서의 효율적인 절단이 검출되었다(도 4f, crRNA 어레이의 개략적 설계 및 효율적인 절단의 매개를 보여주는 서베이어 블롯을 보여줌). 119 bp 만큼 이격된 EMX1 내의 2개의 표적에 대한 스페이서를 사용하여 동시 발생 DSB을 통한 보다 큰 게놈 영역의 표적화된 결실도 또한 시험하고, 1.6% 결실 효능(182개 앰플리콘 중 3개; 도 5g)을 검출하였다. 이는 CRISPR 시스템이 단일의 게놈 내에서 다중화 교정을 매개할 수 있음을 나타낸다.
실시예 2: CRISPR 시스템 변형 및 대안
서열-특이적 DNA 절단을 프로그램화시키기 위하여 RNA를 사용하는 능력은 다양한 연구 및 산업 응용을 위한 신규한 부류의 게놈 조작 도구를 정한다. CRISPR 시스템의 몇몇 양태를 추가로 향상시켜, CRISPR 표적화의 효율 및 다능성을 증가시킬 수 있다. 최적의 Cas9 활성은 포유동물 핵에 존재하는 것보다 더 높은 수준의 유리 Mg2 +의 이용가능성에 따라 달라질 수 있으며(예를 들어, 문헌[Jinek et al., 2012, Science, 337:816] 참조), 프로토스페이서의 인접 하류 NGG 모티프에 대한 선호는 인간 게놈에서 평균하여 12-bp 마다를 표적화하는 능력을 제한한다. 이들 제약 중 일부는 미생물 메타게놈에 걸친 CRISPR 유전자좌의 다양성을 연구함으로써 극복될 수 있다(예를 들어, 문헌[Makarova et al., 2011, Nat Rev Microbiol, 9:467] 참조). 다른 CRISPR 유전자좌는 실시예 1에 기술된 것과 유사한 과정에 의해 포유동물 세포 환경으로 이식될 수 있다. 각 표적 부위에서의 변형 효율은 RNA 2차 구조 아래에 표기되어 있다. 구조를 생성하는 알고리즘은 예측되는 2차 구조의 그의 추정 확률에 따라 각 염기를 채색한다. RNA 가이드 스페이서 1 및 2는 각각 14% 및 6.4%를 유도하였다. 이들 2개의 프로토스페이서 부위에서의 생물학적 반복 검증에 걸친 절단 활성의 통계적 분석도 또한 도 7에 제공된다.
실시예 3: 샘플 표적 서열 선택 알고리즘
소프트웨어 프로그램을 설계하여, 특정 CRISPR 효소에 대하여 요망되는 가이드 서열 길이 및 CRISPR 모티프 서열(PAM)에 기초하여 투입 DNA 서열의 둘 모두의 가닥에서 후보 CRISPR 표적 서열을 확인한다. 예를 들어, PAM 서열 NGG가 있는 스트렙토코커스 피오게네스 유래의 Cas9에 대한 표적 부위는 투입 서열, 및 투입 서열의 역-상보물 둘 모두에서 5'-Nx-NGG-3'을 검색함으로써 확인될 수 있다. 마찬가지로, PAM 서열 NNAGAAW가 있는 스트렙토코커스 써모필러스 CRISPR1의 Cas9에 대한 표적 부위는 투입 서열, 및 투입 서열의 역-상보물 둘 모두에서 5'-Nx-NNAGAAW-3'을 검색함으로써 확인될 수 있다. 마찬가지로, PAM 서열 NGGNG가 있는 스트렙토코커스 써모필러스 CRISPR3의 Cas9에 대한 표적 부위는 투입 서열, 및 투입 서열의 역-상보물 둘 모두에서 5'-Nx-NGGNG-3'을 검색함으로써 확인될 수 있다. Nx에서 값 "x"는 프로그램에 의해 고정되거나, 사용자에 의해 지정될 수 있으며, 예를 들어, 20일 수 있다.
게놈에서의 DNA 표적 부위의 다수의 존재가 비특이적인 게놈 교정을 야기할 수 있기 때문에, 모든 가능한 부위를 확인한 후에, 프로그램은 그들이 관련 참조 게놈에 나타나는 횟수에 기초하여 서열을 필터링한다. 서열 특이성이 '씨드(seed)' 서열, 예를 들어, PAM 서열 그 자체를 포함하여 PAM 서열로부터 5'의 11 내지 12 bp에 의해 결정되는 CRISPR 효소에 있어서, 필터링 단계는 씨드 서열에 기초하여 이루어질 수 있다. 따라서, 추가의 게놈 유전자좌에서 교정을 피하기 위하여, 결과는 관련 게놈에서의 씨드:PAM 서열의 발생 수에 기초하여 필터링된다. 사용자가 씨드 서열의 길이를 선택하게 할 수 있다. 또한, 필터를 통과시키기 위하여, 사용자가 게놈 내의 씨드:PAM 서열의 발생 수를 지정하게 할 수 있다. 디폴트는 독특한 서열에 대하여 스크리닝하는 것이다. 여과 수준은 씨드 서열의 길이와 게놈에서의 서열의 발생 수 둘 모두를 변화시킴으로써 변경된다. 프로그램은 추가로 또는 대안적으로, 확인된 표적 서열(들)의 역 상보물을 제공함으로써 보고된 표적 서열(들)에 상보적인 가이드 서열의 서열을 제공할 수 있다.
서열 선택을 최적화시키기 위한 방법 및 알고리즘의 추가의 상세사항은 본원에 참조로 포함되는 미국 출원 TBA(브로드 참조번호 BI-2012/084 44790.11.2022)에서 찾을 수 있다.
실시예 4: 다중 키메라 crRNA - tracrRNA 하이브리드의 평가
본 실시예는 상이한 길이의 야생형 tracrRNA 서열이 혼입된 tracr 서열을 갖는 키메라 RNA(chiRNA; 단일의 전사물에 가이드 서열, tracr 메이트 서열 및 tracr 서열을 포함)에 대해 수득된 결과를 기술한다. 도 18a는 키메라 RNA 및 Cas9에 대한 비시스트로닉 발현 벡터의 개략도를 예시한다. Cas9는 CBh 프로모터에 의해 유도되며, 키메라 RNA는 U6 프로모터에 의해 유도된다. 키메라 가이드 RNA는 표기된 바와 같은 다양한 위치에서 절단되는 tracr 서열(하부 가닥의 처음 "U"에서 전사물의 마지막까지 계속)에 연결된 20 bp 가이드 서열(N)로 구성된다. 가이드 및 tracr 서열은 tracr-메이트 서열 GUUUUAGAGCUA에 이어서 루프 서열 GAAA에 의해 분리된다. 인간 EMX1 및 PVALB 유전자좌에서의 Cas9-매개의 삽입-결실에 대한 서베이어 검정의 결과는 각각 도 18b 및 도 18c에 예시되어 있다. 화살표는 예상된 서베이어 단편을 나타낸다. chiRNA는 그들의 "+n" 표기로 표시되며, crRNA는 가이드 및 tracr 서열이 개별 전사물로서 발현되는 하이브리드 RNA를 지칭한다. 3벌로 수행되는 이들 결과의 정량화는 각각 도 10b 및 도 10c에 상응하는 도 11a 및 도 11b의 히스토그램에 의해 예시되어 있다("N.D."는 삽입-결실이 검출되지 않음을 나타낸다). 프로토스페이서 ID 및 그들의 상응하는 게놈 표적, 프로토스페이서 서열, PAM 서열 및 가닥 위치는 표 D에 제공되어 있다. 하이브리드 시스템에서 개별 전사물의 경우에는 전체 프로토스페이서 서열에 상보적이거나, 키메라 RNA의 경우에는 밑줄이 있는 부분에만 상보성이도록 가이드 서열을 설계하였다.
세포 배양 및 트랜스펙션 .
인간 배아 신장(HEK) 세포주 293FT(라이프 테크놀로지즈)를 10% 우태아혈청(하이클론), 2mM GlutaMAX(라이프 테크놀로지즈), 100U/㎖ 페니실린 및 100㎍/㎖ 스트렙토마이신이 보충된 둘베코 개질 이글스 배지(DMEM)에서 37℃에서 5% C02 인큐베이션시키면서 유지시켰다. 293FT 세포를 웰마다 150,000개 세포의 밀도로 트랜스펙션 24시간 전에 24-웰 플레이트(코닝)에 씨딩하였다. 세포를 제조사의 권고된 프로토콜에 따라 리포펙타민 2000(라이프 테크놀로지즈)을 사용하여 트랜스펙션시켰다. 24-웰 플레이트의 각 웰에 대하여 총 500 ng의 플라스미드를 사용하였다.
게놈 변형에 대한 서베이어 검정
293FT 세포를 상기 기재한 바와 같이 플라스미드 DNA로 트랜스펙션하였다. 게놈 DNA 추출 전에, 트랜스펙션 후 72시간 동안 37℃에서 세포를 인큐베이션하였다. 게놈 DNA를 제조사의 프로토콜에 따라 퀵익스트랙트 DNA 추출 용액(에피센트레)을 사용하여 추출하였다. 간략하게, 펠렛화된 세포를 퀵익스트랙트 용액에 재현탁화시키고, 65℃에서 15분 동안 및 98℃에서 10분 동안 인큐베이션하였다. 각 유전자에 대한 CRISPR 표적 부위의 측부에 배치된 게놈 부위를 PCR 증폭시키고(표 E에 열거된 프라이머), 산물을 제조사의 프로토콜에 따라 퀴아퀵 스핀 컬럼(퀴아젠)을 사용하여 정제하였다. 총 400 ng의 정제된 PCR 산물을 2㎕ 10X Taq DNA 중합효소 PCR 완충제(엔자이머틱스) 및 초순수와 총 20 ㎕ 부피로 혼합하고, 재어닐링 과정을 거치게 하여 헤테로듀플렉스가 형성되게 하였다: 95℃에서 10분, 95℃에서 85℃(-2℃/초로 램핑), 85℃에서 25℃(-0.25℃/초), 및 25℃에서 1분 유지. 재어닐링 후, 산물을 제조사의 권고 프로토콜에 따라 서베이어 뉴클레아제 및 서베이어 인핸서 S(트랜스게노믹스)로 처리하고, 4 내지 20% 노벡스 TBE 폴리-아크릴아미드 겔(라이프 테크놀로지즈)에서 분석하였다. 겔을 SYBR 골드 DNA 염색제(라이프 테크놀로지즈)로 30분 동안 염색하고, Gel Doc 겔 영상화 시스템(바이오-라드)으로 영상화하였다. 정량화는 상대적 밴드 세기를 기반으로 하였다.
독특한 CRISPR 표적 부위의 컴퓨터에 의한 확인
인간, 마우스, 랫트, 제브라피시, 초파리 및 C. 엘레간스 게놈에서 스트렙토코커스 피오게네스 SF370 Cas9(SpCas9) 효소에 대한 독특한 표적 부위를 확인하기 위하여, 본 발명자들은 DNA 서열의 둘 모두의 가닥을 스캐닝하고, 모든 가능한 SpCas9 표적 부위를 확인하기 위한 소프트웨어 패키지를 개발하였다. 이러한 실시예에 있어서, 각각의 SpCas9 표적 부위는 작용에 있어서 NGG 프로토스페이서 인접 모티프(PAM) 서열이 뒤에 오는 20 bp 서열로서 정의되며, 본 발명자들은 모든 염색체에서 이러한 5'-N20-NGG-3' 정의를 만족시키는 모든 서열을 확인하였다. 비-특이적인 게놈 교정을 방지하기 위하여, 모든 잠재적인 부위를 확인한 후에, 모든 표적 부위를 그들이 관련 참조 게놈에 나타나는 횟수에 기초하여 필터링하였다. 예를 들어, PAM 서열로부터 5'의 대략 11 내지 12 bp 서열일 수 있는 '씨드' 서열에 의해 부여되는 Cas9 활성의 서열 특이성을 이용하기 위하여, 5'-NNNNNNNNNN-NGG-3' 서열이 관련 게놈에서 독특한 것으로 선택되었다. 모든 게놈 서열을 UCSC 게놈 브라우저(Genome Browser)(인간 게놈 hg19, 마우스 게놈 mm9, 랫트 게놈 rn5, 제브라피시 게놈 danRer7, 드로소필라 멜라노개스터(D. melanogaster) 게놈 dm4 및 C. 엘레간스 게놈 ce10)로부터 다운로드하였다. UCSC 게놈 브라우저 정보를 사용하여 브라우징하기 위하여 전체 검색 결과가 이용가능하다. 인간 게놈 내의 몇몇 표적 부위의 예시적인 가시화가 도 22에 제공되어 있다.
먼저, 인간 HEK 293FT 세포에서 EMX1 유전자좌 내의 3개의 부위를 표적화시켰다. 각 chiRNA의 게놈 변형 효율을 서베이어 뉴클레아제 검정을 사용하여 평가하였으며, 이 검정은 DNA 이중-가닥 파단(DSB) 및 비-상동성 말단 연결(NHEJ) DNA 손상 수복 경로에 의한 그들의 이후의 수복으로부터 야기되는 돌연변이를 검출한다. chiRNA(+n)로 표기된 작제물은 야생형 tracrRNA의 최대 +n 뉴클레오티드가 키메라 RNA 작제물에 포함되는 것을 나타내며, 48, 54, 67 및 85의 값이 n에 대해 사용된다. 보다 긴 야생형 tracrRNA의 단편을 함유하는 키메라 RNA(chiRNA(+67) 및 chiRNA(+85))는 모든 3개의 EMX1 표적 부위에서 DNA 절단을 매개하며, chiRNA(+85)는 특히 개별 전사물에서 가이드 및 tracr 서열을 발현하는 상응하는 crRNA/tracrRNA 하이브리드보다 상당히 더 높은 수준의 DNA 절단을 나타낸다(도 10b 및 도 10a). 또한, 하이브리드 시스템(개별 전사물로 발현되는 가이드 서열 및 tracr 서열)을 사용하여 검출가능한 절단을 제공하지 않는 PVALB 유전자좌 내의 2개의 부위를 chiRNA를 사용하여 표적화하였다. chiRNA(+67) 및 chiRNA(+85)는 2개의 PVALB 프로토스페이서에서 상당한 절단을 매개할 수 있었다(도 10c 및 도 10b).
EMX1 및 PVALB 유전자좌 내의 모든 5개의 표적에 있어서, tracr 서열 길이의 증가와 일치하는 게놈 변형 효율의 증가가 관찰되었다. 임의의 이론에 구속되지 않고, tracrRNA의 3' 말단에 의해 형성되는 2차 구조는 CRISPR 복합체 형성 비율을 향상시키는데 역할을 수행할 수 있다. 본 실시예에 사용되는 키메라 RNA의 각각에 대하여 예측된 2차 구조의 예시는 도 21에 제공되어 있다. 2차 구조를 최소 자유 에너지 및 분배 함수 알고리즘을 사용하는 RNAfold(http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi)를 사용하여 예측하였다. 각 염기에 대한 의사 색채(pseudocolor)(그레이 스케일로 재현)는 쌍형성 가능성을 나타낸다. 보다 긴 tracr 서열을 갖는 chiRNA가 고유 CRISPR crRNA/tracrRNA 하이브리드에 의해 절단될 수 없었던 표적을 절단할 수 있기 때문에, 키메라 RNA가 그의 고유 하이브리드 대응물보다 더욱 효율적으로 Cas9에 로딩될 수 있다. 진핵 세포 및 유기체에서 부위-특이적 게놈 교정을 위한 Cas9의 응용을 용이하게 하기 위하여, 스트렙토코커스 피오게네스 Cas9에 대한 모든 예측된 독특한 표적 부위를 인간, 마우스, 랫트, 지브라피시, C. 엘레간스 및 드로소필라 멜라노개스터 게놈에서 컴퓨터로 확인하였다. 키메라 RNA를 다른 미생물 유래의 Cas9 효소를 위해 설계하여, CRISPR RNA-프로그램화가능한 뉴클레아제의 표적 공간을 확대할 수 있다.
도 11 및 도 21은 야생형 tracr RNA 서열의 최대 +85 뉴클레오티드 및 핵 국소화 서열이 있는 SpCas9를 포함하는 키메라 RNA의 발현을 위한 예시적인 비시스트로닉 발현 벡터를 예시한다. SpCas9는 CBh 프로모터로부터 발현되며, bGH 폴리A 신호(bGH pA)로 종결된다. 개략도 바로 아래에 예시되어 있는 확대된 서열은 가이드 서열 삽입 부위 주위의 영역에 상응하며, 5'에서 3'으로, U6 프로모터의 3'-부분(제1 음영 영역), BbsI 절단 부위(화살표), 부분 직접 반복부(tracr 메이트 서열 GTTTTAGAGCTA, 밑줄), 루프 서열 GAAA, 및 +85 tracr 서열(루프 서열 뒤의 밑줄이 있는 서열)을 포함한다. 예시적인 가이드 서열 삽입물은 가이드 서열 삽입 부위 아래에 예시되어 있으며, 선택된 표적에 대한 가이드 서열의 뉴클레오티드는 "N"으로 표시된다.
상기 실시예에 기술된 서열은 하기와 같다(폴리뉴클레오티드 서열은 5'에서 3'이다):
U6-짧은 tracrRNA(스트렙토코커스 피오게네스 SF370):
U6-긴 tracrRNA(스트렙토코커스 피오게네스 SF370):
U6-DR-BbsI 백본-DR(스트렙토코커스 피오게네스 SF370):
U6-키메라 RNA-BbsI 백본(스트렙토코커스 피오게네스 SF370)
NLS-SpCas9-EGFP:
SpCas9-EGFP-NLS:
NLS-SpCas9-EGFP-NLS:
NLS-SpCas9-NLS:
NLS-mCherry-SpRNase3:
SpRNase3-mCherry-NLS:
NLS-SpCas9n-NLS(D10A 닉카아제 돌연변이는 소문자임):
hEMX1-HR 주형-HindII-NheI:
NLS-StCsn1-NLS:
U6-St_tracrRNA(7-97):
U6-DR-스페이서-DR(스트렙토코커스 피오게네스 SF370)
+48 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
+54 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
+67 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
+85 tracr RNA를 함유하는 키메라 RNA(스트렙토코커스 피오게네스 SF370)
CBh-NLS-SpCas9-NLS
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR1 Cas9에 대한 예시적인 키메라 RNA(NNAGAAW의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR3 Cas9에 대한 예시적인 키메라 RNA(NGGNG의 PAM 존재)
스트렙토코커스 써모필러스 LMD-9 CRISPR3 유전자좌 유래의 Cas9의 코돈-최적화 버전(5' 및 3' 말단 둘 모두에 NLS 존재)
실시예 5: 스트렙토코커스 피오게네스 Cas9(SpCas9로 지칭)에 대한 가이드 RNA의 최적화
본 발명자들은 세포에서 RNA를 증가시키기 위하여 tracrRNA 및 직접 반복부 서열을 돌연변이시키거나 키메라 가이드 RNA를 돌연변이시켰다.
최적화는 tracrRNA 및 가이드 RNA 내에 티민(T)의 스트레치가 존재한다는 관찰을 기초로 한 것이며, 이는 pol 3 프로모터에 의한 조기 전사 종결을 야기할 수 있다. 따라서, 본 발명자들은 하기의 최적화된 서열을 생성하였다. 최적화된 tracrRNA 및 상응하는 최적화된 직접 반복부가 쌍으로 제시되어 있다.
최적화된 tracrRNA 1(돌연변이는 밑줄):
최적화된 직접 반복부 1(돌연변이는 밑줄):
최적화된 tracrRNA 2(돌연변이는 밑줄):
최적화된 직접 반복부 2(돌연변이는 밑줄):
또한, 본 발명자들은 진핵 세포에서의 최적의 활성을 위해 키메라 가이드 RNA를 최적화시켰다.
원래 가이드 RNA:
최적화된 키메라 가이드 RNA 서열 1:
최적화된 키메라 가이드 RNA 서열 2:
최적화된 키메라 가이드 RNA 서열 3:
본 발명자들은 최적화된 키메라 가이드 RNA가 도 9에 나타낸 바와 같이 더 잘 작동하는 것을 보여주었다. 293FT 세포를 Cas9 및 U6-가이드 RNA DNA 카세트로 동시-트랜스펙션시켜, 상기 나타낸 4개의 RNA 형태 중 하나를 발현함으로써 실험을 행하였다. 가이드 RNA의 표적은 인간 Emx1 유전자좌 내의 동일한 표적 부위이다: "GTCACCTCCAATGACTAGGG".
실시예 6: 스트렙토코커스 써모필러스 LMD -9 CRISPR1 Cas9(St1Cas9로 지칭)의 최적화
본 발명자들은 도 12에 나타낸 바와 같이 가이드 키메라 RNA를 설계하였다.
St1Cas9 가이드 RNA는 폴리 티민(T)의 스트레치를 파단시킴으로써, SpCas9 가이드 RNA에 대해서와 동일한 유형의 최적화를 겪을 수 있다.
실시예 7: 생체내 응용을 위한 Cas9 시스템의 향상
본 발명자들은 분자량이 작은 Cas9에 대한 메타게놈 검색을 행하였다. 대부분의 Cas9 상동체는 상당히 크다. 예를 들어, SpCas9는 대략 1368aa 길이이며, 이는 전달을 위해 바이러스 벡터로 용이하게 패키징되기에 너무 크다. 서열 중 일부는 잘못 주석 추가(mis-annotated)될 수 있으며, 이에 따라, 각 길이에 대한 정밀한 빈도는 본질적으로 정확하지 않을 수 있다. 그럼에도 불구하고, 그것은 Cas9 단백질의 분포의 일별을 제공하며, 보다 짧은 Cas9 상동체가 존재하는 것을 시사한다.
전산 분석을 통하여, 본 발명자들은 박테리아 균주 캄필로박터에서, 1000개 미만의 아미노산이 있는 2개의 Cas9 단백질이 존재하는 것을 관찰하였다. 캄필로박터 제주니(Campylobacter jejuni)로부터의 하나의 Cas9의 서열이 하기에 제시되어 있다. 이러한 길이에서, CjCas9는 일차 세포, 및 동물 모델에서 생체내로의 강력한 전달을 위해 AAV, 렌티바이러스, 아데노바이러스 및 다른 바이러스 벡터로 용이하게 패키징될 수 있다.
>캄필로박터 제주니 Cas9(CjCas9)
이러한 CjCas9에 대한 추정의 tracrRNA 요소는 하기와 같다:
직접 반복부 서열은 하기와 같다:
tracrRNA 및 직접 반복부의 동시-폴드 구조는 도 6에 제공되어 있다.
CjCas9에 대한 키메라 가이드RNA의 예는 하기와 같다:
또한, 본 발명자들은 시험관내 방법을 사용하여 Cas9 가이드 RNA를 최적화시켰다. 도 18은 시험관내 St1Cas9 키메라 가이드 RNA 최적화로부터의 데이터를 보여준다.
본 발명의 바람직한 구현예가 본원에 나타나고 기술되어 있지만, 이러한 구현예가 오직 예시로만 제공되는 것이 당업자에게 명백할 것이다. 수많은 변이, 변화 및 치환이 이제 본 발명으로부터 벗어남 없이, 당업자에게 일어날 것이다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 하기의 청구범위가 본 발명의 범주를 한정하며, 이들 청구범위의 범주 내의 방법 및 구조, 및 그들의 등가물이 그에 의해 커버되는 것으로 의도된다.
실시예 8: Sa sgRNA 최적화
본 발명자들은 가장 높은 절단 효능이 있는 최적의 절단 구조를 위해, SaCas9에 대한 5개의 sgRNA 변이체를 설계하였다. 또한, 고유 직접 반복부:tracr 듀플렉스 시스템을 sgRNA와 함께 시험하였다. 표기된 길이가 있는 가이드를 SaCas9와 동시에 트랜스펙션시키고, 활성에 대하여 HEK 293FT 세포에서 시험하였다. 총 100ng의 sgRNA U6-PCR 앰플리콘(또는 50ng의 직접 반복부 및 50ng의 tracrRNA) 및 400ng의 SaCas9 플라스미드를 200,000개의 Hepa1-6 마우스 간세포로 동시-트랜스펙션시키고, DNA를 서베이어 분석을 위해 트랜스펙션후 72시간에 수집하였다. 결과는 도 23에 나타나 있다.
참조문헌
본 발명의 바람직한 구현예가 본원에 나타나고 기술되어 있지만, 이러한 구현예가 오직 예시로만 제공되는 것이 당업자에게 명백할 것이다. 수많은 변이, 변화 및 치환이 이제 본 발명으로부터 벗어남 없이, 당업자에게 일어날 것이다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다.
SEQUENCE LISTING
<110> THE BROAD INSTITUTE, INC.
MASSACHUSETTS INSTITUTE OF TECHNOLOGY
<120> ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED GUIDE COMPOSITIONS
FOR SEQUENCE MANIPULATION
<130> 44790.99.2047
<140> PCT/US2013/074819
<141> 2013-12-12
<150> 61/836,127
<151> 2013-06-17
<150> 61/835,931
<151> 2013-06-17
<150> 61/828,130
<151> 2013-05-28
<150> 61/819,803
<151> 2013-05-06
<150> 61/814,263
<151> 2013-04-20
<150> 61/806,375
<151> 2013-03-28
<150> 61/802,174
<151> 2013-03-15
<150> 61/791,409
<151> 2013-03-15
<150> 61/769,046
<151> 2013-02-25
<150> 61/758,468
<151> 2013-01-30
<150> 61/748,427
<151> 2013-01-02
<150> 61/736,527
<151> 2012-12-12
<160> 264
<170> PatentIn version 3.5
<210> 1
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 1
aggacgaagt cctaa 15
<210> 2
<211> 7
<212> PRT
<213> Simian virus 40
<400> 2
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 3
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Nucleoplasmin bipartite NLS sequence"
<400> 3
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 4
<211> 9
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
C-myc NLS sequence"
<400> 4
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 5
<211> 11
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
C-myc NLS sequence"
<400> 5
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 6
<211> 38
<212> PRT
<213> Homo sapiens
<400> 6
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 7
<211> 42
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
IBB domain from importin-alpha sequence"
<400> 7
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 8
<211> 8
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Myoma T protein sequence"
<400> 8
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 9
<211> 8
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Myoma T protein sequence"
<400> 9
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 10
<211> 8
<212> PRT
<213> Homo sapiens
<400> 10
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 11
<211> 12
<212> PRT
<213> Mus musculus
<400> 11
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 12
<211> 5
<212> PRT
<213> Influenza virus
<400> 12
Asp Arg Leu Arg Arg
1 5
<210> 13
<211> 7
<212> PRT
<213> Influenza virus
<400> 13
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 14
<211> 10
<212> PRT
<213> Hepatitus delta virus
<400> 14
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 15
<211> 10
<212> PRT
<213> Mus musculus
<400> 15
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 16
<211> 20
<212> PRT
<213> Homo sapiens
<400> 16
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 17
<211> 17
<212> PRT
<213> Homo sapiens
<400> 17
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 18
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t or g
<220>
<221> modified_base
<222> (21)..(22)
<223> a, c, t, g, unknown or other
<400> 18
nnnnnnnnnn nnnnnnnnnn nnagaaw 27
<210> 19
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(12)
<223> a, c, t or g
<220>
<221> modified_base
<222> (13)..(14)
<223> a, c, t, g, unknown or other
<400> 19
nnnnnnnnnn nnnnagaaw 19
<210> 20
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t or g
<220>
<221> modified_base
<222> (21)..(22)
<223> a, c, t, g, unknown or other
<400> 20
nnnnnnnnnn nnnnnnnnnn nnagaaw 27
<210> 21
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(11)
<223> a, c, t or g
<220>
<221> modified_base
<222> (12)..(13)
<223> a, c, t, g, unknown or other
<400> 21
nnnnnnnnnn nnnagaaw 18
<210> 22
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 22
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120
tcgttattta atttttt 137
<210> 23
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 23
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120
ttt 123
<210> 24
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 24
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110
<210> 25
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 25
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt 102
<210> 26
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 26
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt gttttttt 88
<210> 27
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 27
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcatt tttttt 76
<210> 28
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 28
guuuuagagc ua 12
<210> 29
<211> 33
<212> DNA
<213> Homo sapiens
<400> 29
ggacatcgat gtcacctcca atgactaggg tgg 33
<210> 30
<211> 33
<212> DNA
<213> Homo sapiens
<400> 30
cattggaggt gacatcgatg tcctccccat tgg 33
<210> 31
<211> 33
<212> DNA
<213> Homo sapiens
<400> 31
ggaagggcct gagtccgagc agaagaagaa ggg 33
<210> 32
<211> 33
<212> DNA
<213> Homo sapiens
<400> 32
ggtggcgaga ggggccgaga ttgggtgttc agg 33
<210> 33
<211> 33
<212> DNA
<213> Homo sapiens
<400> 33
atgcaggagg gtggcgagag gggccgagat tgg 33
<210> 34
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 34
aaaaccaccc ttctctctgg c 21
<210> 35
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 35
ggagattgga gacacggaga g 21
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 36
ctggaaagcc aatgcctgac 20
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 37
ggcagcaaac tccttgtcct 20
<210> 38
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 38
gttttagagc ta 12
<210> 39
<211> 335
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 39
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gaaccattca aaacagcata gcaagttaaa ataaggctag tccgttatca 300
acttgaaaaa gtggcaccga gtcggtgctt ttttt 335
<210> 40
<211> 423
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 40
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gtagtattaa gtattgtttt atggctgata aatttctttg aatttctcct 300
tgattatttg ttataaaagt tataaaataa tcttgttgga accattcaaa acagcatagc 360
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 420
ttt 423
<210> 41
<211> 339
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 41
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggttttagag ctatgctgtt ttgaatggtc ccaaaacggg tcttcgagaa 300
gacgttttag agctatgctg ttttgaatgg tcccaaaac 339
<210> 42
<211> 309
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 42
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccg 309
<210> 43
<211> 1648
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 43
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Ala Ala Val Ser Lys
1400 1405 1410
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu
1415 1420 1425
Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly
1430 1435 1440
Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
1445 1450 1455
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
1460 1465 1470
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met
1475 1480 1485
Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val
1490 1495 1500
Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr
1505 1510 1515
Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile
1520 1525 1530
Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly
1535 1540 1545
His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
1550 1555 1560
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg
1565 1570 1575
His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln
1580 1585 1590
Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn
1595 1600 1605
His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu
1610 1615 1620
Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly
1625 1630 1635
Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
1640 1645
<210> 44
<211> 1625
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 44
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ala Ala Ala Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val
1370 1375 1380
Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe
1385 1390 1395
Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu
1400 1405 1410
Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
1415 1420 1425
Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser
1430 1435 1440
Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala
1445 1450 1455
Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp
1460 1465 1470
Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp
1475 1480 1485
Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu
1490 1495 1500
Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser
1505 1510 1515
His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys
1520 1525 1530
Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln
1535 1540 1545
Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
1550 1555 1560
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
1565 1570 1575
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu
1580 1585 1590
Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr
1595 1600 1605
Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1610 1615 1620
Lys Lys
1625
<210> 45
<211> 1664
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 45
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Ala Ala Val Ser Lys
1400 1405 1410
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu
1415 1420 1425
Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly
1430 1435 1440
Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
1445 1450 1455
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
1460 1465 1470
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met
1475 1480 1485
Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val
1490 1495 1500
Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr
1505 1510 1515
Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile
1520 1525 1530
Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly
1535 1540 1545
His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
1550 1555 1560
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg
1565 1570 1575
His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln
1580 1585 1590
Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn
1595 1600 1605
His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu
1610 1615 1620
Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly
1625 1630 1635
Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Lys Arg Pro Ala Ala
1640 1645 1650
Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1655 1660
<210> 46
<211> 1423
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 46
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210> 47
<211> 483
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 47
Met Phe Leu Phe Leu Ser Leu Thr Ser Phe Leu Ser Ser Ser Arg Thr
1 5 10 15
Leu Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
20 25 30
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
35 40 45
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
50 55 60
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
65 70 75 80
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
85 90 95
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
100 105 110
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
115 120 125
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
130 135 140
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
145 150 155 160
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
165 170 175
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
180 185 190
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
195 200 205
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
210 215 220
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
225 230 235 240
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys Gly Ser Lys Gln
245 250 255
Leu Glu Glu Leu Leu Ser Thr Ser Phe Asp Ile Gln Phe Asn Asp Leu
260 265 270
Thr Leu Leu Glu Thr Ala Phe Thr His Thr Ser Tyr Ala Asn Glu His
275 280 285
Arg Leu Leu Asn Val Ser His Asn Glu Arg Leu Glu Phe Leu Gly Asp
290 295 300
Ala Val Leu Gln Leu Ile Ile Ser Glu Tyr Leu Phe Ala Lys Tyr Pro
305 310 315 320
Lys Lys Thr Glu Gly Asp Met Ser Lys Leu Arg Ser Met Ile Val Arg
325 330 335
Glu Glu Ser Leu Ala Gly Phe Ser Arg Phe Cys Ser Phe Asp Ala Tyr
340 345 350
Ile Lys Leu Gly Lys Gly Glu Glu Lys Ser Gly Gly Arg Arg Arg Asp
355 360 365
Thr Ile Leu Gly Asp Leu Phe Glu Ala Phe Leu Gly Ala Leu Leu Leu
370 375 380
Asp Lys Gly Ile Asp Ala Val Arg Arg Phe Leu Lys Gln Val Met Ile
385 390 395 400
Pro Gln Val Glu Lys Gly Asn Phe Glu Arg Val Lys Asp Tyr Lys Thr
405 410 415
Cys Leu Gln Glu Phe Leu Gln Thr Lys Gly Asp Val Ala Ile Asp Tyr
420 425 430
Gln Val Ile Ser Glu Lys Gly Pro Ala His Ala Lys Gln Phe Glu Val
435 440 445
Ser Ile Val Val Asn Gly Ala Val Leu Ser Lys Gly Leu Gly Lys Ser
450 455 460
Lys Lys Leu Ala Glu Gln Asp Ala Ala Lys Asn Ala Leu Ala Gln Leu
465 470 475 480
Ser Glu Val
<210> 48
<211> 483
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 48
Met Lys Gln Leu Glu Glu Leu Leu Ser Thr Ser Phe Asp Ile Gln Phe
1 5 10 15
Asn Asp Leu Thr Leu Leu Glu Thr Ala Phe Thr His Thr Ser Tyr Ala
20 25 30
Asn Glu His Arg Leu Leu Asn Val Ser His Asn Glu Arg Leu Glu Phe
35 40 45
Leu Gly Asp Ala Val Leu Gln Leu Ile Ile Ser Glu Tyr Leu Phe Ala
50 55 60
Lys Tyr Pro Lys Lys Thr Glu Gly Asp Met Ser Lys Leu Arg Ser Met
65 70 75 80
Ile Val Arg Glu Glu Ser Leu Ala Gly Phe Ser Arg Phe Cys Ser Phe
85 90 95
Asp Ala Tyr Ile Lys Leu Gly Lys Gly Glu Glu Lys Ser Gly Gly Arg
100 105 110
Arg Arg Asp Thr Ile Leu Gly Asp Leu Phe Glu Ala Phe Leu Gly Ala
115 120 125
Leu Leu Leu Asp Lys Gly Ile Asp Ala Val Arg Arg Phe Leu Lys Gln
130 135 140
Val Met Ile Pro Gln Val Glu Lys Gly Asn Phe Glu Arg Val Lys Asp
145 150 155 160
Tyr Lys Thr Cys Leu Gln Glu Phe Leu Gln Thr Lys Gly Asp Val Ala
165 170 175
Ile Asp Tyr Gln Val Ile Ser Glu Lys Gly Pro Ala His Ala Lys Gln
180 185 190
Phe Glu Val Ser Ile Val Val Asn Gly Ala Val Leu Ser Lys Gly Leu
195 200 205
Gly Lys Ser Lys Lys Leu Ala Glu Gln Asp Ala Ala Lys Asn Ala Leu
210 215 220
Ala Gln Leu Ser Glu Val Gly Ser Val Ser Lys Gly Glu Glu Asp Asn
225 230 235 240
Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val His Met Glu Gly
245 250 255
Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly Glu Gly Arg
260 265 270
Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val Thr Lys Gly Gly
275 280 285
Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe Met Tyr Gly
290 295 300
Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile Pro Asp Tyr Leu Lys
305 310 315 320
Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val Met Asn Phe Glu
325 330 335
Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser Leu Gln Asp Gly
340 345 350
Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr Asn Phe Pro Ser Asp
355 360 365
Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu Ala Ser Ser Glu
370 375 380
Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly Glu Ile Lys Gln Arg
385 390 395 400
Leu Lys Leu Lys Asp Gly Gly His Tyr Asp Ala Glu Val Lys Thr Thr
405 410 415
Tyr Lys Ala Lys Lys Pro Val Gln Leu Pro Gly Ala Tyr Asn Val Asn
420 425 430
Ile Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr Ile Val Glu
435 440 445
Gln Tyr Glu Arg Ala Glu Gly Arg His Ser Thr Gly Gly Met Asp Glu
450 455 460
Leu Tyr Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
465 470 475 480
Lys Lys Lys
<210> 49
<211> 1423
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 49
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210> 50
<211> 2012
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 50
gaatgctgcc ctcagacccg cttcctccct gtccttgtct gtccaaggag aatgaggtct 60
cactggtgga tttcggacta ccctgaggag ctggcacctg agggacaagg ccccccacct 120
gcccagctcc agcctctgat gaggggtggg agagagctac atgaggttgc taagaaagcc 180
tcccctgaag gagaccacac agtgtgtgag gttggagtct ctagcagcgg gttctgtgcc 240
cccagggata gtctggctgt ccaggcactg ctcttgatat aaacaccacc tcctagttat 300
gaaaccatgc ccattctgcc tctctgtatg gaaaagagca tggggctggc ccgtggggtg 360
gtgtccactt taggccctgt gggagatcat gggaacccac gcagtgggtc ataggctctc 420
tcatttacta ctcacatcca ctctgtgaag aagcgattat gatctctcct ctagaaactc 480
gtagagtccc atgtctgccg gcttccagag cctgcactcc tccaccttgg cttggctttg 540
ctggggctag aggagctagg atgcacagca gctctgtgac cctttgtttg agaggaacag 600
gaaaaccacc cttctctctg gcccactgtg tcctcttcct gccctgccat ccccttctgt 660
gaatgttaga cccatgggag cagctggtca gaggggaccc cggcctgggg cccctaaccc 720
tatgtagcct cagtcttccc atcaggctct cagctcagcc tgagtgttga ggccccagtg 780
gctgctctgg gggcctcctg agtttctcat ctgtgcccct ccctccctgg cccaggtgaa 840
ggtgtggttc cagaaccgga ggacaaagta caaacggcag aagctggagg aggaagggcc 900
tgagtccgag cagaagaaga agggctccca tcacatcaac cggtggcgca ttgccacgaa 960
gcaggccaat ggggaggaca tcgatgtcac ctccaatgac aagcttgcta gcggtgggca 1020
accacaaacc cacgagggca gagtgctgct tgctgctggc caggcccctg cgtgggccca 1080
agctggactc tggccactcc ctggccaggc tttggggagg cctggagtca tggccccaca 1140
gggcttgaag cccggggccg ccattgacag agggacaagc aatgggctgg ctgaggcctg 1200
ggaccacttg gccttctcct cggagagcct gcctgcctgg gcgggcccgc ccgccaccgc 1260
agcctcccag ctgctctccg tgtctccaat ctcccttttg ttttgatgca tttctgtttt 1320
aatttatttt ccaggcacca ctgtagttta gtgatcccca gtgtccccct tccctatggg 1380
aataataaaa gtctctctct taatgacacg ggcatccagc tccagcccca gagcctgggg 1440
tggtagattc cggctctgag ggccagtggg ggctggtaga gcaaacgcgt tcagggcctg 1500
ggagcctggg gtggggtact ggtggagggg gtcaagggta attcattaac tcctctcttt 1560
tgttggggga ccctggtctc tacctccagc tccacagcag gagaaacagg ctagacatag 1620
ggaagggcca tcctgtatct tgagggagga caggcccagg tctttcttaa cgtattgaga 1680
ggtgggaatc aggcccaggt agttcaatgg gagagggaga gtgcttccct ctgcctagag 1740
actctggtgg cttctccagt tgaggagaaa ccagaggaaa ggggaggatt ggggtctggg 1800
ggagggaaca ccattcacaa aggctgacgg ttccagtccg aagtcgtggg cccaccagga 1860
tgctcacctg tccttggaga accgctgggc aggttgagac tgcagagaca gggcttaagg 1920
ctgagcctgc aaccagtccc cagtgactca gggcctcctc agcccaagaa agagcaacgt 1980
gccagggccc gctgagctct tgtgttcacc tg 2012
<210> 51
<211> 1153
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 51
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Ser Asp Leu Val Leu Gly Leu Asp Ile Gly Ile Gly Ser Val Gly
20 25 30
Val Gly Ile Leu Asn Lys Val Thr Gly Glu Ile Ile His Lys Asn Ser
35 40 45
Arg Ile Phe Pro Ala Ala Gln Ala Glu Asn Asn Leu Val Arg Arg Thr
50 55 60
Asn Arg Gln Gly Arg Arg Leu Ala Arg Arg Lys Lys His Arg Arg Val
65 70 75 80
Arg Leu Asn Arg Leu Phe Glu Glu Ser Gly Leu Ile Thr Asp Phe Thr
85 90 95
Lys Ile Ser Ile Asn Leu Asn Pro Tyr Gln Leu Arg Val Lys Gly Leu
100 105 110
Thr Asp Glu Leu Ser Asn Glu Glu Leu Phe Ile Ala Leu Lys Asn Met
115 120 125
Val Lys His Arg Gly Ile Ser Tyr Leu Asp Asp Ala Ser Asp Asp Gly
130 135 140
Asn Ser Ser Val Gly Asp Tyr Ala Gln Ile Val Lys Glu Asn Ser Lys
145 150 155 160
Gln Leu Glu Thr Lys Thr Pro Gly Gln Ile Gln Leu Glu Arg Tyr Gln
165 170 175
Thr Tyr Gly Gln Leu Arg Gly Asp Phe Thr Val Glu Lys Asp Gly Lys
180 185 190
Lys His Arg Leu Ile Asn Val Phe Pro Thr Ser Ala Tyr Arg Ser Glu
195 200 205
Ala Leu Arg Ile Leu Gln Thr Gln Gln Glu Phe Asn Pro Gln Ile Thr
210 215 220
Asp Glu Phe Ile Asn Arg Tyr Leu Glu Ile Leu Thr Gly Lys Arg Lys
225 230 235 240
Tyr Tyr His Gly Pro Gly Asn Glu Lys Ser Arg Thr Asp Tyr Gly Arg
245 250 255
Tyr Arg Thr Ser Gly Glu Thr Leu Asp Asn Ile Phe Gly Ile Leu Ile
260 265 270
Gly Lys Cys Thr Phe Tyr Pro Asp Glu Phe Arg Ala Ala Lys Ala Ser
275 280 285
Tyr Thr Ala Gln Glu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Thr
290 295 300
Val Pro Thr Glu Thr Lys Lys Leu Ser Lys Glu Gln Lys Asn Gln Ile
305 310 315 320
Ile Asn Tyr Val Lys Asn Glu Lys Ala Met Gly Pro Ala Lys Leu Phe
325 330 335
Lys Tyr Ile Ala Lys Leu Leu Ser Cys Asp Val Ala Asp Ile Lys Gly
340 345 350
Tyr Arg Ile Asp Lys Ser Gly Lys Ala Glu Ile His Thr Phe Glu Ala
355 360 365
Tyr Arg Lys Met Lys Thr Leu Glu Thr Leu Asp Ile Glu Gln Met Asp
370 375 380
Arg Glu Thr Leu Asp Lys Leu Ala Tyr Val Leu Thr Leu Asn Thr Glu
385 390 395 400
Arg Glu Gly Ile Gln Glu Ala Leu Glu His Glu Phe Ala Asp Gly Ser
405 410 415
Phe Ser Gln Lys Gln Val Asp Glu Leu Val Gln Phe Arg Lys Ala Asn
420 425 430
Ser Ser Ile Phe Gly Lys Gly Trp His Asn Phe Ser Val Lys Leu Met
435 440 445
Met Glu Leu Ile Pro Glu Leu Tyr Glu Thr Ser Glu Glu Gln Met Thr
450 455 460
Ile Leu Thr Arg Leu Gly Lys Gln Lys Thr Thr Ser Ser Ser Asn Lys
465 470 475 480
Thr Lys Tyr Ile Asp Glu Lys Leu Leu Thr Glu Glu Ile Tyr Asn Pro
485 490 495
Val Val Ala Lys Ser Val Arg Gln Ala Ile Lys Ile Val Asn Ala Ala
500 505 510
Ile Lys Glu Tyr Gly Asp Phe Asp Asn Ile Val Ile Glu Met Ala Arg
515 520 525
Glu Thr Asn Glu Asp Asp Glu Lys Lys Ala Ile Gln Lys Ile Gln Lys
530 535 540
Ala Asn Lys Asp Glu Lys Asp Ala Ala Met Leu Lys Ala Ala Asn Gln
545 550 555 560
Tyr Asn Gly Lys Ala Glu Leu Pro His Ser Val Phe His Gly His Lys
565 570 575
Gln Leu Ala Thr Lys Ile Arg Leu Trp His Gln Gln Gly Glu Arg Cys
580 585 590
Leu Tyr Thr Gly Lys Thr Ile Ser Ile His Asp Leu Ile Asn Asn Ser
595 600 605
Asn Gln Phe Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp
610 615 620
Asp Ser Leu Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn Gln Glu
625 630 635 640
Lys Gly Gln Arg Thr Pro Tyr Gln Ala Leu Asp Ser Met Asp Asp Ala
645 650 655
Trp Ser Phe Arg Glu Leu Lys Ala Phe Val Arg Glu Ser Lys Thr Leu
660 665 670
Ser Asn Lys Lys Lys Glu Tyr Leu Leu Thr Glu Glu Asp Ile Ser Lys
675 680 685
Phe Asp Val Arg Lys Lys Phe Ile Glu Arg Asn Leu Val Asp Thr Arg
690 695 700
Tyr Ala Ser Arg Val Val Leu Asn Ala Leu Gln Glu His Phe Arg Ala
705 710 715 720
His Lys Ile Asp Thr Lys Val Ser Val Val Arg Gly Gln Phe Thr Ser
725 730 735
Gln Leu Arg Arg His Trp Gly Ile Glu Lys Thr Arg Asp Thr Tyr His
740 745 750
His His Ala Val Asp Ala Leu Ile Ile Ala Ala Ser Ser Gln Leu Asn
755 760 765
Leu Trp Lys Lys Gln Lys Asn Thr Leu Val Ser Tyr Ser Glu Asp Gln
770 775 780
Leu Leu Asp Ile Glu Thr Gly Glu Leu Ile Ser Asp Asp Glu Tyr Lys
785 790 795 800
Glu Ser Val Phe Lys Ala Pro Tyr Gln His Phe Val Asp Thr Leu Lys
805 810 815
Ser Lys Glu Phe Glu Asp Ser Ile Leu Phe Ser Tyr Gln Val Asp Ser
820 825 830
Lys Phe Asn Arg Lys Ile Ser Asp Ala Thr Ile Tyr Ala Thr Arg Gln
835 840 845
Ala Lys Val Gly Lys Asp Lys Ala Asp Glu Thr Tyr Val Leu Gly Lys
850 855 860
Ile Lys Asp Ile Tyr Thr Gln Asp Gly Tyr Asp Ala Phe Met Lys Ile
865 870 875 880
Tyr Lys Lys Asp Lys Ser Lys Phe Leu Met Tyr Arg His Asp Pro Gln
885 890 895
Thr Phe Glu Lys Val Ile Glu Pro Ile Leu Glu Asn Tyr Pro Asn Lys
900 905 910
Gln Ile Asn Glu Lys Gly Lys Glu Val Pro Cys Asn Pro Phe Leu Lys
915 920 925
Tyr Lys Glu Glu His Gly Tyr Ile Arg Lys Tyr Ser Lys Lys Gly Asn
930 935 940
Gly Pro Glu Ile Lys Ser Leu Lys Tyr Tyr Asp Ser Lys Leu Gly Asn
945 950 955 960
His Ile Asp Ile Thr Pro Lys Asp Ser Asn Asn Lys Val Val Leu Gln
965 970 975
Ser Val Ser Pro Trp Arg Ala Asp Val Tyr Phe Asn Lys Thr Thr Gly
980 985 990
Lys Tyr Glu Ile Leu Gly Leu Lys Tyr Ala Asp Leu Gln Phe Glu Lys
995 1000 1005
Gly Thr Gly Thr Tyr Lys Ile Ser Gln Glu Lys Tyr Asn Asp Ile
1010 1015 1020
Lys Lys Lys Glu Gly Val Asp Ser Asp Ser Glu Phe Lys Phe Thr
1025 1030 1035
Leu Tyr Lys Asn Asp Leu Leu Leu Val Lys Asp Thr Glu Thr Lys
1040 1045 1050
Glu Gln Gln Leu Phe Arg Phe Leu Ser Arg Thr Met Pro Lys Gln
1055 1060 1065
Lys His Tyr Val Glu Leu Lys Pro Tyr Asp Lys Gln Lys Phe Glu
1070 1075 1080
Gly Gly Glu Ala Leu Ile Lys Val Leu Gly Asn Val Ala Asn Ser
1085 1090 1095
Gly Gln Cys Lys Lys Gly Leu Gly Lys Ser Asn Ile Ser Ile Tyr
1100 1105 1110
Lys Val Arg Thr Asp Val Leu Gly Asn Gln His Ile Ile Lys Asn
1115 1120 1125
Glu Gly Asp Lys Pro Lys Leu Asp Phe Lys Arg Pro Ala Ala Thr
1130 1135 1140
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1145 1150
<210> 52
<211> 340
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 52
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ttacttaaat cttgcagaag ctacaaagat aaggcttcat gccgaaatca 300
acaccctgtc attttatggc agggtgtttt cgttatttaa 340
<210> 53
<211> 360
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (288)..(317)
<223> a, c, t, g, unknown or other
<400> 53
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggttttagag ctatgctgtt ttgaatggtc ccaaaacnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnngtt ttagagctat gctgttttga atggtcccaa aacttttttt 360
<210> 54
<211> 318
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 54
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttttttt 318
<210> 55
<211> 325
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 55
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcattt ttttt 325
<210> 56
<211> 337
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 56
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg ttttttt 337
<210> 57
<211> 352
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 57
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tt 352
<210> 58
<211> 5101
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 58
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 360
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 420
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 480
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 540
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct 600
gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 660
ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 720
tgagcaagag gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc 780
tggagcacct gcctgaaatc actttttttc aggttggacc ggtgccacca tggactataa 840
ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg acgataagat 900
ggccccaaag aagaagcgga aggtcggtat ccacggagtc ccagcagccg acaagaagta 960
cagcatcggc ctggacatcg gcaccaactc tgtgggctgg gccgtgatca ccgacgagta 1020
caaggtgccc agcaagaaat tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa 1080
gaacctgatc ggagccctgc tgttcgacag cggcgaaaca gccgaggcca cccggctgaa 1140
gagaaccgcc agaagaagat acaccagacg gaagaaccgg atctgctatc tgcaagagat 1200
cttcagcaac gagatggcca aggtggacga cagcttcttc cacagactgg aagagtcctt 1260
cctggtggaa gaggataaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga 1320
ggtggcctac cacgagaagt accccaccat ctaccacctg agaaagaaac tggtggacag 1380
caccgacaag gccgacctgc ggctgatcta tctggccctg gcccacatga tcaagttccg 1440
gggccacttc ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt 1500
catccagctg gtgcagacct acaaccagct gttcgaggaa aaccccatca acgccagcgg 1560
cgtggacgcc aaggccatcc tgtctgccag actgagcaag agcagacggc tggaaaatct 1620
gatcgcccag ctgcccggcg agaagaagaa tggcctgttc ggcaacctga ttgccctgag 1680
cctgggcctg acccccaact tcaagagcaa cttcgacctg gccgaggatg ccaaactgca 1740
gctgagcaag gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca 1800
gtacgccgac ctgtttctgg ccgccaagaa cctgtccgac gccatcctgc tgagcgacat 1860
cctgagagtg aacaccgaga tcaccaaggc ccccctgagc gcctctatga tcaagagata 1920
cgacgagcac caccaggacc tgaccctgct gaaagctctc gtgcggcagc agctgcctga 1980
gaagtacaaa gagattttct tcgaccagag caagaacggc tacgccggct acattgacgg 2040
cggagccagc caggaagagt tctacaagtt catcaagccc atcctggaaa agatggacgg 2100
caccgaggaa ctgctcgtga agctgaacag agaggacctg ctgcggaagc agcggacctt 2160
cgacaacggc agcatccccc accagatcca cctgggagag ctgcacgcca ttctgcggcg 2220
gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga agatcctgac 2280
cttccgcatc ccctactacg tgggccctct ggccagggga aacagcagat tcgcctggat 2340
gaccagaaag agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg tggacaaggg 2400
cgcttccgcc cagagcttca tcgagcggat gaccaacttc gataagaacc tgcccaacga 2460
gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtata acgagctgac 2520
caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg gcgagcagaa 2580
aaaggccatc gtggacctgc tgttcaagac caaccggaaa gtgaccgtga agcagctgaa 2640
agaggactac ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg gcgtggaaga 2700
tcggttcaac gcctccctgg gcacatacca cgatctgctg aaaattatca aggacaagga 2760
cttcctggac aatgaggaaa acgaggacat tctggaagat atcgtgctga ccctgacact 2820
gtttgaggac agagagatga tcgaggaacg gctgaaaacc tatgcccacc tgttcgacga 2880
caaagtgatg aagcagctga agcggcggag atacaccggc tggggcaggc tgagccggaa 2940
gctgatcaac ggcatccggg acaagcagtc cggcaagaca atcctggatt tcctgaagtc 3000
cgacggcttc gccaacagaa acttcatgca gctgatccac gacgacagcc tgacctttaa 3060
agaggacatc cagaaagccc aggtgtccgg ccagggcgat agcctgcacg agcacattgc 3120
caatctggcc ggcagccccg ccattaagaa gggcatcctg cagacagtga aggtggtgga 3180
cgagctcgtg aaagtgatgg gccggcacaa gcccgagaac atcgtgatcg aaatggccag 3240
agagaaccag accacccaga agggacagaa gaacagccgc gagagaatga agcggatcga 3300
agagggcatc aaagagctgg gcagccagat cctgaaagaa caccccgtgg aaaacaccca 3360
gctgcagaac gagaagctgt acctgtacta cctgcagaat gggcgggata tgtacgtgga 3420
ccaggaactg gacatcaacc ggctgtccga ctacgatgtg gaccatatcg tgcctcagag 3480
ctttctgaag gacgactcca tcgacaacaa ggtgctgacc agaagcgaca agaaccgggg 3540
caagagcgac aacgtgccct ccgaagaggt cgtgaagaag atgaagaact actggcggca 3600
gctgctgaac gccaagctga ttacccagag aaagttcgac aatctgacca aggccgagag 3660
aggcggcctg agcgaactgg ataaggccgg cttcatcaag agacagctgg tggaaacccg 3720
gcagatcaca aagcacgtgg cacagatcct ggactcccgg atgaacacta agtacgacga 3780
gaatgacaag ctgatccggg aagtgaaagt gatcaccctg aagtccaagc tggtgtccga 3840
tttccggaag gatttccagt tttacaaagt gcgcgagatc aacaactacc accacgccca 3900
cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc ctaagctgga 3960
aagcgagttc gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag 4020
cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc tacagcaaca tcatgaactt 4080
tttcaagacc gagattaccc tggccaacgg cgagatccgg aagcggcctc tgatcgagac 4140
aaacggcgaa accggggaga tcgtgtggga taagggccgg gattttgcca ccgtgcggaa 4200
agtgctgagc atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga caggcggctt 4260
cagcaaagag tctatcctgc ccaagaggaa cagcgataag ctgatcgcca gaaagaagga 4320
ctgggaccct aagaagtacg gcggcttcga cagccccacc gtggcctatt ctgtgctggt 4380
ggtggccaaa gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag agctgctggg 4440
gatcaccatc atggaaagaa gcagcttcga gaagaatccc atcgactttc tggaagccaa 4500
gggctacaaa gaagtgaaaa aggacctgat catcaagctg cctaagtact ccctgttcga 4560
gctggaaaac ggccggaaga gaatgctggc ctctgccggc gaactgcaga agggaaacga 4620
actggccctg ccctccaaat atgtgaactt cctgtacctg gccagccact atgagaagct 4680
gaagggctcc cccgaggata atgagcagaa acagctgttt gtggaacagc acaagcacta 4740
cctggacgag atcatcgagc agatcagcga gttctccaag agagtgatcc tggccgacgc 4800
taatctggac aaagtgctgt ccgcctacaa caagcaccgg gataagccca tcagagagca 4860
ggccgagaat atcatccacc tgtttaccct gaccaatctg ggagcccctg ccgccttcaa 4920
gtactttgac accaccatcg accggaagag gtacaccagc accaaagagg tgctggacgc 4980
caccctgatc caccagagca tcaccggcct gtacgagaca cggatcgacc tgtctcagct 5040
gggaggcgac tttctttttc ttagcttgac cagctttctt agtagcagca ggacgcttta 5100
a 5101
<210> 59
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 59
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120
tcgttattta atttttt 137
<210> 60
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 60
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120
ttt 123
<210> 61
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 61
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110
<210> 62
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 62
nnnnnnnnnn nnnnnnnnnn gttattgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120
tcgttattta atttttt 137
<210> 63
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 63
nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caaagataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120
ttt 123
<210> 64
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 64
nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caaagataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110
<210> 65
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 65
nnnnnnnnnn nnnnnnnnnn gttattgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaatga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120
tcgttattta atttttt 137
<210> 66
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 66
nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caatgataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120
ttt 123
<210> 67
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 67
nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caatgataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110
<210> 68
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 68
nnnnnnnnnn nnnnnnnnnn gttttagagc tgtggaaaca cagcgagtta aaataaggct 60
tagtccgtac tcaacttgaa aaggtggcac cgattcggtg ttttttt 107
<210> 69
<211> 4263
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 69
atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa gaccaagccc 60
tacagcatcg gcctggacat cggcaccaat agcgtgggct gggccgtgac caccgacaac 120
tacaaggtgc ccagcaagaa aatgaaggtg ctgggcaaca cctccaagaa gtacatcaag 180
aaaaacctgc tgggcgtgct gctgttcgac agcggcatta cagccgaggg cagacggctg 240
aagagaaccg ccagacggcg gtacacccgg cggagaaaca gaatcctgta tctgcaagag 300
atcttcagca ccgagatggc taccctggac gacgccttct tccagcggct ggacgacagc 360
ttcctggtgc ccgacgacaa gcgggacagc aagtacccca tcttcggcaa cctggtggaa 420
gagaaggcct accacgacga gttccccacc atctaccacc tgagaaagta cctggccgac 480
agcaccaaga aggccgacct gagactggtg tatctggccc tggcccacat gatcaagtac 540
cggggccact tcctgatcga gggcgagttc aacagcaaga acaacgacat ccagaagaac 600
ttccaggact tcctggacac ctacaacgcc atcttcgaga gcgacctgtc cctggaaaac 660
agcaagcagc tggaagagat cgtgaaggac aagatcagca agctggaaaa gaaggaccgc 720
atcctgaagc tgttccccgg cgagaagaac agcggaatct tcagcgagtt tctgaagctg 780
atcgtgggca accaggccga cttcagaaag tgcttcaacc tggacgagaa agccagcctg 840
cacttcagca aagagagcta cgacgaggac ctggaaaccc tgctgggata tatcggcgac 900
gactacagcg acgtgttcct gaaggccaag aagctgtacg acgctatcct gctgagcggc 960
ttcctgaccg tgaccgacaa cgagacagag gccccactga gcagcgccat gattaagcgg 1020
tacaacgagc acaaagagga tctggctctg ctgaaagagt acatccggaa catcagcctg 1080
aaaacctaca atgaggtgtt caaggacgac accaagaacg gctacgccgg ctacatcgac 1140
ggcaagacca accaggaaga tttctatgtg tacctgaaga agctgctggc cgagttcgag 1200
ggggccgact actttctgga aaaaatcgac cgcgaggatt tcctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ctaccagatc catctgcagg aaatgcgggc catcctggac 1320
aagcaggcca agttctaccc attcctggcc aagaacaaag agcggatcga gaagatcctg 1380
accttccgca tcccttacta cgtgggcccc ctggccagag gcaacagcga ttttgcctgg 1440
tccatccgga agcgcaatga gaagatcacc ccctggaact tcgaggacgt gatcgacaaa 1500
gagtccagcg ccgaggcctt catcaaccgg atgaccagct tcgacctgta cctgcccgag 1560
gaaaaggtgc tgcccaagca cagcctgctg tacgagacat tcaatgtgta taacgagctg 1620
accaaagtgc ggtttatcgc cgagtctatg cgggactacc agttcctgga ctccaagcag 1680
aaaaaggaca tcgtgcggct gtacttcaag gacaagcgga aagtgaccga taaggacatc 1740
atcgagtacc tgcacgccat ctacggctac gatggcatcg agctgaaggg catcgagaag 1800
cagttcaact ccagcctgag cacataccac gacctgctga acattatcaa cgacaaagaa 1860
tttctggacg actccagcaa cgaggccatc atcgaagaga tcatccacac cctgaccatc 1920
tttgaggacc gcgagatgat caagcagcgg ctgagcaagt tcgagaacat cttcgacaag 1980
agcgtgctga aaaagctgag cagacggcac tacaccggct ggggcaagct gagcgccaag 2040
ctgatcaacg gcatccggga cgagaagtcc ggcaacacaa tcctggacta cctgatcgac 2100
gacggcatca gcaaccggaa cttcatgcag ctgatccacg acgacgccct gagcttcaag 2160
aagaagatcc agaaggccca gatcatcggg gacgaggaca agggcaacat caaagaagtc 2220
gtgaagtccc tgcccggcag ccccgccatc aagaagggaa tcctgcagag catcaagatc 2280
gtggacgagc tcgtgaaagt gatgggcggc agaaagcccg agagcatcgt ggtggaaatg 2340
gctagagaga accagtacac caatcagggc aagagcaaca gccagcagag actgaagaga 2400
ctggaaaagt ccctgaaaga gctgggcagc aagattctga aagagaatat ccctgccaag 2460
ctgtccaaga tcgacaacaa cgccctgcag aacgaccggc tgtacctgta ctacctgcag 2520
aatggcaagg acatgtatac aggcgacgac ctggatatcg accgcctgag caactacgac 2580
atcgaccata ttatccccca ggccttcctg aaagacaaca gcattgacaa caaagtgctg 2640
gtgtcctccg ccagcaaccg cggcaagtcc gatgatgtgc ccagcctgga agtcgtgaaa 2700
aagagaaaga ccttctggta tcagctgctg aaaagcaagc tgattagcca gaggaagttc 2760
gacaacctga ccaaggccga gagaggcggc ctgagccctg aagataaggc cggcttcatc 2820
cagagacagc tggtggaaac ccggcagatc accaagcacg tggccagact gctggatgag 2880
aagtttaaca acaagaagga cgagaacaac cgggccgtgc ggaccgtgaa gatcatcacc 2940
ctgaagtcca ccctggtgtc ccagttccgg aaggacttcg agctgtataa agtgcgcgag 3000
atcaatgact ttcaccacgc ccacgacgcc tacctgaatg ccgtggtggc ttccgccctg 3060
ctgaagaagt accctaagct ggaacccgag ttcgtgtacg gcgactaccc caagtacaac 3120
tccttcagag agcggaagtc cgccaccgag aaggtgtact tctactccaa catcatgaat 3180
atctttaaga agtccatctc cctggccgat ggcagagtga tcgagcggcc cctgatcgaa 3240
gtgaacgaag agacaggcga gagcgtgtgg aacaaagaaa gcgacctggc caccgtgcgg 3300
cgggtgctga gttatcctca agtgaatgtc gtgaagaagg tggaagaaca gaaccacggc 3360
ctggatcggg gcaagcccaa gggcctgttc aacgccaacc tgtccagcaa gcctaagccc 3420
aactccaacg agaatctcgt gggggccaaa gagtacctgg accctaagaa gtacggcgga 3480
tacgccggca tctccaatag cttcaccgtg ctcgtgaagg gcacaatcga gaagggcgct 3540
aagaaaaaga tcacaaacgt gctggaattt caggggatct ctatcctgga ccggatcaac 3600
taccggaagg ataagctgaa ctttctgctg gaaaaaggct acaaggacat tgagctgatt 3660
atcgagctgc ctaagtactc cctgttcgaa ctgagcgacg gctccagacg gatgctggcc 3720
tccatcctgt ccaccaacaa caagcggggc gagatccaca agggaaacca gatcttcctg 3780
agccagaaat ttgtgaaact gctgtaccac gccaagcgga tctccaacac catcaatgag 3840
aaccaccgga aatacgtgga aaaccacaag aaagagtttg aggaactgtt ctactacatc 3900
ctggagttca acgagaacta tgtgggagcc aagaagaacg gcaaactgct gaactccgcc 3960
ttccagagct ggcagaacca cagcatcgac gagctgtgca gctccttcat cggccctacc 4020
ggcagcgagc ggaagggact gtttgagctg acctccagag gctctgccgc cgactttgag 4080
ttcctgggag tgaagatccc ccggtacaga gactacaccc cctctagtct gctgaaggac 4140
gccaccctga tccaccagag cgtgaccggc ctgtacgaaa cccggatcga cctggctaag 4200
ctgggcgagg gaaagcgtcc tgctgctact aagaaagctg gtcaagctaa gaaaaagaaa 4260
taa 4263
<210> 70
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 70
ggaaccattc ataacagcat agcaagttat aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttt 84
<210> 71
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 71
gttatagagc tatgctgtta tgaatggtcc caaaac 36
<210> 72
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 72
ggaaccattc aatacagcat agcaagttaa tataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttt 84
<210> 73
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 73
gtattagagc tatgctgtat tgaatggtcc caaaac 36
<210> 74
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 74
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttt 103
<210> 75
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 75
nnnnnnnnnn nnnnnnnnnn gtattagagc tagaaatagc aagttaatat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttt 103
<210> 76
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 76
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttt tggaaacaaa acagcatagc 60
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 120
ttt 123
<210> 77
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 77
nnnnnnnnnn nnnnnnnnnn gtattagagc tatgctgtat tggaaacaat acagcatagc 60
aagttaatat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 120
ttt 123
<210> 78
<211> 20
<212> DNA
<213> Homo sapiens
<400> 78
gtcacctcca atgactaggg 20
<210> 79
<211> 984
<212> PRT
<213> Campylobacter jejuni
<400> 79
Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp
1 5 10 15
Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe
20 25 30
Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg
35 40 45
Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg
50 55 60
Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr
65 70 75 80
Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly
85 90 95
Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu
100 105 110
Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg
115 120 125
Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala
130 135 140
Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln
145 150 155 160
Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu
165 170 175
Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu
180 185 190
Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe
195 200 205
Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu
210 215 220
Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser
225 230 235 240
His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro
245 250 255
Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile
260 265 270
Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys
275 280 285
Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu
290 295 300
Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu
305 310 315 320
Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys
325 330 335
Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu
340 345 350
Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu
355 360 365
Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser
370 375 380
Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala
385 390 395 400
Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu
405 410 415
Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys
420 425 430
Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr
435 440 445
Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn
450 455 460
Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu
465 470 475 480
Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys
485 490 495
Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys
500 505 510
Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg
515 520 525
Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile
530 535 540
Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile
545 550 555 560
Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu
565 570 575
Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu
580 585 590
Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala
595 600 605
Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr
610 615 620
Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr
625 630 635 640
Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp
645 650 655
Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln
660 665 670
Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser
675 680 685
Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His
690 695 700
Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser
705 710 715 720
Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser
725 730 735
Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys
740 745 750
Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp
755 760 765
Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser
770 775 780
Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln
785 790 795 800
Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys
805 810 815
Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg
820 825 830
Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro
835 840 845
Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val
850 855 860
Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu
865 870 875 880
Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile
885 890 895
Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe
900 905 910
Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe
915 920 925
Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu
930 935 940
Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe
945 950 955 960
Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe
965 970 975
Arg Gln Arg Glu Asp Phe Lys Lys
980
<210> 80
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 80
tataatctca taagaaattt aaaaagggac taaaataaag agtttgcggg actctgcggg 60
gttacaatcc cctaaaaccg cttttaaaat t 91
<210> 81
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 81
attttaccat aaagaaattt aaaaagggac taaaac 36
<210> 82
<211> 95
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<400> 82
nnnnnnnnnn nnnnnnnnnn guuuuagucc cgaaagggac uaaaauaaag aguuugcggg 60
acucugcggg guuacaaucc ccuaaaaccg cuuuu 95
<210> 83
<211> 69
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 83
gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuuuuuu 69
<210> 84
<211> 69
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 84
gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuuuuuu 69
<210> 85
<211> 69
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 85
gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuuuuuu 69
<210> 86
<211> 69
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 86
ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuuuuuu 69
<210> 87
<211> 69
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 87
guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuuuuuu 69
<210> 88
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 88
gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucauu uuuuuu 76
<210> 89
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 89
gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucauu uuuuuu 76
<210> 90
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 90
gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucauu uuuuuu 76
<210> 91
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 91
ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucauu uuuuuu 76
<210> 92
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 92
guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucauu uuuuuu 76
<210> 93
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 93
gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu guuuuuuu 88
<210> 94
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 94
gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu guuuuuuu 88
<210> 95
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 95
gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu guuuuuuu 88
<210> 96
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 96
ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu guuuuuuu 88
<210> 97
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 97
guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu guuuuuuu 88
<210> 98
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 98
gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 99
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 99
gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 100
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 100
gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 101
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 101
ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 102
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 102
guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 103
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 103
gttttagagc tatgctgttt tgaatggtcc caaaacggaa gggcctgagt ccgagcagaa 60
gaagaagttt tagagctatg ctgttttgaa tggtcccaaa ac 102
<210> 104
<211> 100
<212> DNA
<213> Homo sapiens
<400> 104
cggaggacaa agtacaaacg gcagaagctg gaggaggaag ggcctgagtc cgagcagaag 60
aagaagggct cccatcacat caaccggtgg cgcattgcca 100
<210> 105
<211> 50
<212> DNA
<213> Homo sapiens
<400> 105
agctggagga ggaagggcct gagtccgagc agaagaagaa gggctcccac 50
<210> 106
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 106
gaguccgagc agaagaagaa guuuuagagc 30
<210> 107
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 107
agctggagga ggaagggcct gagtccgagc agaagagaag ggctcccat 49
<210> 108
<211> 53
<212> DNA
<213> Homo sapiens
<400> 108
ctggaggagg aagggcctga gtccgagcag aagaagaagg gctcccatca cat 53
<210> 109
<211> 52
<212> DNA
<213> Homo sapiens
<400> 109
ctggaggagg aagggcctga gtccgagcag aagagaaggg ctcccatcac at 52
<210> 110
<211> 54
<212> DNA
<213> Homo sapiens
<400> 110
ctggaggagg aagggcctga gtccgagcag aagaaagaag ggctcccatc acat 54
<210> 111
<211> 50
<212> DNA
<213> Homo sapiens
<400> 111
ctggaggagg aagggcctga gtccgagcag aagaagggct cccatcacat 50
<210> 112
<211> 47
<212> DNA
<213> Homo sapiens
<400> 112
ctggaggagg aagggcctga gcccgagcag aagggctccc atcacat 47
<210> 113
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> source
<223> /note="Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 113
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggctagtc 60
cguuuu 66
<210> 114
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 114
gaguccgagc agaagaagaa 20
<210> 115
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 115
gacaucgaug uccuccccau 20
<210> 116
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 116
gucaccucca augacuaggg 20
<210> 117
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 117
auuggguguu cagggcagag 20
<210> 118
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 118
guggcgagag gggccgagau 20
<210> 119
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 119
ggggccgaga uuggguguuc 20
<210> 120
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 120
gugccauuag cuaaaugcau 20
<210> 121
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 121
guaccaccca caggugccag 20
<210> 122
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 122
gaaagccucu gggccaggaa 20
<210> 123
<211> 48
<212> DNA
<213> Homo sapiens
<400> 123
ctggaggagg aagggcctga gtccgagcag aagaagaagg gctcccat 48
<210> 124
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 124
gaguccgagc agaagaagau 20
<210> 125
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 125
gaguccgagc agaagaagua 20
<210> 126
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 126
gaguccgagc agaagaacaa 20
<210> 127
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 127
gaguccgagc agaagaugaa 20
<210> 128
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 128
gaguccgagc agaaguagaa 20
<210> 129
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 129
gaguccgagc agaugaagaa 20
<210> 130
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 130
gaguccgagc acaagaagaa 20
<210> 131
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 131
gaguccgagg agaagaagaa 20
<210> 132
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 132
gaguccgugc agaagaagaa 20
<210> 133
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 133
gagucggagc agaagaagaa 20
<210> 134
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 134
gagaccgagc agaagaagaa 20
<210> 135
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 135
aatgacaagc ttgctagcgg tggg 24
<210> 136
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 136
aaaacggaag ggcctgagtc cgagcagaag aagaagttt 39
<210> 137
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 137
aaacaggggc cgagattggg tgttcagggc agaggtttt 39
<210> 138
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 138
aaaacggaag ggcctgagtc cgagcagaag aagaagtt 38
<210> 139
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 139
aacggaggga ggggcacaga tgagaaactc agggttttag 40
<210> 140
<211> 38
<212> DNA
<213> Homo sapiens
<400> 140
agcccttctt cttctgctcg gactcaggcc cttcctcc 38
<210> 141
<211> 40
<212> DNA
<213> Homo sapiens
<400> 141
cagggaggga ggggcacaga tgagaaactc aggaggcccc 40
<210> 142
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 142
ggcaatgcgc caccggttga tgtgatggga gcccttctag gaggccccca gagcagccac 60
tggggcctca acactcaggc 80
<210> 143
<211> 98
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 143
ggacgaaaca ccggaaccat tcaaaacagc atagcaagtt aaaataaggc tagtccgtta 60
tcaacttgaa aaagtggcac cgagtcggtg cttttttt 98
<210> 144
<211> 186
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 144
ggacgaaaca ccggtagtat taagtattgt tttatggctg ataaatttct ttgaatttct 60
ccttgattat ttgttataaa agttataaaa taatcttgtt ggaaccattc aaaacagcat 120
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 180
tttttt 186
<210> 145
<211> 46
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(19)
<223> a, c, u, g, unknown or other
<400> 145
nnnnnnnnnn nnnnnnnnng uuauuguacu cucaagauuu auuuuu 46
<210> 146
<211> 91
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 146
guuacuuaaa ucuugcagaa gcuacaaaga uaaggcuuca ugccgaaauc aacacccugu 60
cauuuuaugg caggguguuu ucguuauuua a 91
<210> 147
<211> 70
<212> DNA
<213> Homo sapiens
<400> 147
ttttctagtg ctgagtttct gtgactcctc tacattctac ttctctgtgt ttctgtatac 60
tacctcctcc 70
<210> 148
<211> 122
<212> DNA
<213> Homo sapiens
<400> 148
ggaggaaggg cctgagtccg agcagaagaa gaagggctcc catcacatca accggtggcg 60
cattgccacg aagcaggcca atggggagga catcgatgtc acctccaatg actagggtgg 120
gc 122
<210> 149
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (3)..(32)
<223> a, c, u, g, unknown or other
<400> 149
acnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnguuuuaga gcuaugcu 48
<210> 150
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> source
<223> /note="Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide"
<400> 150
agcauagcaa guuaaaauaa ggctaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 151
<211> 62
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<400> 151
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cg 62
<210> 152
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 152
tgaatggtcc caaaacggaa gggcctgagt ccgagcagaa gaagaagttt tagagctatg 60
ctgttttgaa tgg 73
<210> 153
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<400> 153
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 99
<210> 154
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 154
guuuuuguac ucucaagauu uaaguaacug uacaacguua cuuaaaucuu gcagaagcua 60
caaagauaag gcuucaugcc gaaaucaaca cccugucauu uuauggcagg guguuuucgu 120
uauuuaa 127
<210> 155
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 155
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt taagtaactg tacaac 56
<210> 156
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 156
gttacttaaa tcttgcagaa gctacaaaga taaggcttca tgccgaaatc aacaccctgt 60
cattttatgg cagggtgttt tcgttattta a 91
<210> 157
<211> 134
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 157
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt taaggaaact aaatcttgca 60
gaagctacaa agataaggct tcatgccgaa atcaacaccc tgtcatttta tggcagggtg 120
ttttcgttat ttaa 134
<210> 158
<211> 131
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 158
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120
tcgttattta a 131
<210> 159
<211> 125
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 159
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatg aaaatcttgc agaagctaca 60
aagataaggc ttcatgccga aatcaacacc ctgtcatttt atggcagggt gttttcgtta 120
tttaa 125
<210> 160
<211> 112
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 160
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctgaaaaga agctacaaag ataaggcttc 60
atgccgaaat caacaccctg tcattttatg gcagggtgtt ttcgttattt aa 112
<210> 161
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 161
nnnnnnnnnn nnnnnnnnnn gtttttgtac tgaaaagcta caaagataag gcttcatgcc 60
gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaa 107
<210> 162
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 162
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttat 108
<210> 163
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 163
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taaggcttca tgccga 86
<210> 164
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 164
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taaggcttc 79
<210> 165
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, t, g, unknown or other
<400> 165
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
gctacaaaga taa 73
<210> 166
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 166
guuuuagucc cuuuuuaaau uucuuuaugg uaaaauuaua aucucauaag aaauuuaaaa 60
agggacuaaa auaaagaguu ugcgggacuc ugcgggguua caauccccua aaaccgcuuu 120
uaaaa 125
<210> 167
<211> 91
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 167
guuacuuaaa ucuugcagaa gcuacaaaga uaaggcuuca ugccgaaauc aacacccugu 60
cauuuuaugg caggguguuu ucguuauuua a 91
<210> 168
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 168
gggacucaac caagucauuc guuuuuguac ucucaagauu uaaguaacug uacaac 56
<210> 169
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 169
gggacucaac caagucauuc guuuuuguac ucucaagauu uaaguaacug uacaacguua 60
cuuaaaucuu gcagaagcua caaagauaag gcuucaugcc gaaaucaaca cccugucauu 120
uuauggcagg guguuuucgu uauuuaa 147
<210> 170
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 170
cuugcagaag cuacaaagau aaggcuucau gccgaaauca acacccuguc auuuuauggc 60
aggguguuuu 70
<210> 171
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 171
gggacucaac caagucauuc guuuuuguac ucucaagauu ua 42
<210> 172
<211> 112
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 172
gggacucaac caagucauuc guuuuuguac ucucaagauu uacuugcaga agcuacaaag 60
auaaggcuuc augccgaaau caacacccug ucauuuuaug gcaggguguu uu 112
<210> 173
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 173
gggacucaac caagucauuc guuuuuguac ucucaagauu uagaaacuug cagaagcuac 60
aaagauaagg cuucaugccg aaaucaacac ccugucauuu uauggcaggg uguuuu 116
<210> 174
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 174
gggacucaac caagucauuc guuuuuguac ucucaagauu uagaaacuug cagaagcuac 60
aaagauaagg cuucaugccg aaaucaacac ccugucauuu uauggcaggg uguuuu 116
<210> 175
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 175
gggacucaac caagucauuc guuuuuguag aaauacaaag auaaggcuuc augccgaaau 60
caacacccug ucauuuuaug gcaggguguu uucguuauuu aa 102
<210> 176
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 176
gggacucaac caagucauuc guuuuuguag aaauacaaag auaaggcuuc augccgaaau 60
caacacccug ucauuuuaug gcaggguguu uucguuauuu aa 102
<210> 177
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 177
gggacucaac caagucauuc guuuuuguag aaauacaaag auaaggcuuc augccga 57
<210> 178
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 178
gggacucaac caagucauuc guuuuuguag aaauacaaag auaaggcuuc augccga 57
<210> 179
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 179
gtggtgtcac gctcgtcgtt tgg 23
<210> 180
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 180
tccagtctat taattgttgc cgg 23
<210> 181
<211> 64
<212> DNA
<213> Homo sapiens
<400> 181
caagaggctt gagtaggaga ggagtgccgc cgaggcgggg cggggcgggg cgtggagctg 60
ggct 64
<210> 182
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<400> 182
nnnnnnnnnn nnnnnnnnnn guauuagagc uagaaauagc aaguuaauau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 99
<210> 183
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<400> 183
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 119
<210> 184
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<400> 184
nnnnnnnnnn nnnnnnnnnn guauuagagc uaugcuguau uggaaacaau acagcauagc 60
aaguuaauau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 119
<210> 185
<211> 12
<212> DNA
<213> Homo sapiens
<400> 185
tagcgggtaa gc 12
<210> 186
<211> 12
<212> DNA
<213> Homo sapiens
<400> 186
tcggtgacat gt 12
<210> 187
<211> 12
<212> DNA
<213> Homo sapiens
<400> 187
actccccgta gg 12
<210> 188
<211> 12
<212> DNA
<213> Homo sapiens
<400> 188
actgcgtgtt aa 12
<210> 189
<211> 12
<212> DNA
<213> Homo sapiens
<400> 189
acgtcgcctg at 12
<210> 190
<211> 12
<212> DNA
<213> Homo sapiens
<400> 190
taggtcgacc ag 12
<210> 191
<211> 12
<212> DNA
<213> Homo sapiens
<400> 191
ggcgttaatg at 12
<210> 192
<211> 12
<212> DNA
<213> Homo sapiens
<400> 192
tgtcgcatgt ta 12
<210> 193
<211> 12
<212> DNA
<213> Homo sapiens
<400> 193
atggaaacgc at 12
<210> 194
<211> 12
<212> DNA
<213> Homo sapiens
<400> 194
gccgaattcc tc 12
<210> 195
<211> 12
<212> DNA
<213> Homo sapiens
<400> 195
gcatggtacg ga 12
<210> 196
<211> 12
<212> DNA
<213> Homo sapiens
<400> 196
cggtactctt ac 12
<210> 197
<211> 12
<212> DNA
<213> Homo sapiens
<400> 197
gcctgtgccg ta 12
<210> 198
<211> 12
<212> DNA
<213> Homo sapiens
<400> 198
tacggtaagt cg 12
<210> 199
<211> 12
<212> DNA
<213> Homo sapiens
<400> 199
cacgaaatta cc 12
<210> 200
<211> 12
<212> DNA
<213> Homo sapiens
<400> 200
aaccaagata cg 12
<210> 201
<211> 12
<212> DNA
<213> Homo sapiens
<400> 201
gagtcgatac gc 12
<210> 202
<211> 12
<212> DNA
<213> Homo sapiens
<400> 202
gtctcacgat cg 12
<210> 203
<211> 12
<212> DNA
<213> Homo sapiens
<400> 203
tcgtcgggtg ca 12
<210> 204
<211> 12
<212> DNA
<213> Homo sapiens
<400> 204
actccgtagt ga 12
<210> 205
<211> 12
<212> DNA
<213> Homo sapiens
<400> 205
caggacgtcc gt 12
<210> 206
<211> 12
<212> DNA
<213> Homo sapiens
<400> 206
tcgtatccct ac 12
<210> 207
<211> 12
<212> DNA
<213> Homo sapiens
<400> 207
tttcaaggcc gg 12
<210> 208
<211> 12
<212> DNA
<213> Homo sapiens
<400> 208
cgccggtgga at 12
<210> 209
<211> 12
<212> DNA
<213> Homo sapiens
<400> 209
gaacccgtcc ta 12
<210> 210
<211> 12
<212> DNA
<213> Homo sapiens
<400> 210
gattcatcag cg 12
<210> 211
<211> 12
<212> DNA
<213> Homo sapiens
<400> 211
acaccggtct tc 12
<210> 212
<211> 12
<212> DNA
<213> Homo sapiens
<400> 212
atcgtgccct aa 12
<210> 213
<211> 12
<212> DNA
<213> Homo sapiens
<400> 213
gcgtcaatgt tc 12
<210> 214
<211> 12
<212> DNA
<213> Homo sapiens
<400> 214
ctccgtatct cg 12
<210> 215
<211> 12
<212> DNA
<213> Homo sapiens
<400> 215
ccgattcctt cg 12
<210> 216
<211> 12
<212> DNA
<213> Homo sapiens
<400> 216
tgcgcctcca gt 12
<210> 217
<211> 12
<212> DNA
<213> Homo sapiens
<400> 217
taacgtcgga gc 12
<210> 218
<211> 12
<212> DNA
<213> Homo sapiens
<400> 218
aaggtcgccc at 12
<210> 219
<211> 12
<212> DNA
<213> Homo sapiens
<400> 219
gtcggggact at 12
<210> 220
<211> 12
<212> DNA
<213> Homo sapiens
<400> 220
ttcgagcgat tt 12
<210> 221
<211> 12
<212> DNA
<213> Homo sapiens
<400> 221
tgagtcgtcg ag 12
<210> 222
<211> 12
<212> DNA
<213> Homo sapiens
<400> 222
tttacgcaga gg 12
<210> 223
<211> 12
<212> DNA
<213> Homo sapiens
<400> 223
aggaagtatc gc 12
<210> 224
<211> 12
<212> DNA
<213> Homo sapiens
<400> 224
actcgatacc at 12
<210> 225
<211> 12
<212> DNA
<213> Homo sapiens
<400> 225
cgctacatag ca 12
<210> 226
<211> 12
<212> DNA
<213> Homo sapiens
<400> 226
ttcataaccg gc 12
<210> 227
<211> 12
<212> DNA
<213> Homo sapiens
<400> 227
ccaaacggtt aa 12
<210> 228
<211> 12
<212> DNA
<213> Homo sapiens
<400> 228
cgattccttc gt 12
<210> 229
<211> 12
<212> DNA
<213> Homo sapiens
<400> 229
cgtcatgaat aa 12
<210> 230
<211> 12
<212> DNA
<213> Homo sapiens
<400> 230
agtggcgatg ac 12
<210> 231
<211> 12
<212> DNA
<213> Homo sapiens
<400> 231
cccctacggc ac 12
<210> 232
<211> 12
<212> DNA
<213> Homo sapiens
<400> 232
gccaacccgc ac 12
<210> 233
<211> 12
<212> DNA
<213> Homo sapiens
<400> 233
tgggacaccg gt 12
<210> 234
<211> 12
<212> DNA
<213> Homo sapiens
<400> 234
ttgactgcgg cg 12
<210> 235
<211> 12
<212> DNA
<213> Homo sapiens
<400> 235
actatgcgta gg 12
<210> 236
<211> 12
<212> DNA
<213> Homo sapiens
<400> 236
tcacccaaag cg 12
<210> 237
<211> 12
<212> DNA
<213> Homo sapiens
<400> 237
gcaggacgtc cg 12
<210> 238
<211> 12
<212> DNA
<213> Homo sapiens
<400> 238
acaccgaaaa cg 12
<210> 239
<211> 12
<212> DNA
<213> Homo sapiens
<400> 239
cggtgtattg ag 12
<210> 240
<211> 12
<212> DNA
<213> Homo sapiens
<400> 240
cacgaggtat gc 12
<210> 241
<211> 12
<212> DNA
<213> Homo sapiens
<400> 241
taaagcgacc cg 12
<210> 242
<211> 12
<212> DNA
<213> Homo sapiens
<400> 242
cttagtcggc ca 12
<210> 243
<211> 12
<212> DNA
<213> Homo sapiens
<400> 243
cgaaaacgtg gc 12
<210> 244
<211> 12
<212> DNA
<213> Homo sapiens
<400> 244
cgtgccctga ac 12
<210> 245
<211> 12
<212> DNA
<213> Homo sapiens
<400> 245
tttaccatcg aa 12
<210> 246
<211> 12
<212> DNA
<213> Homo sapiens
<400> 246
cgtagccatg tt 12
<210> 247
<211> 12
<212> DNA
<213> Homo sapiens
<400> 247
cccaaacggt ta 12
<210> 248
<211> 12
<212> DNA
<213> Homo sapiens
<400> 248
gcgttatcag aa 12
<210> 249
<211> 12
<212> DNA
<213> Homo sapiens
<400> 249
tcgatggtaa ac 12
<210> 250
<211> 12
<212> DNA
<213> Homo sapiens
<400> 250
cgactttttg ca 12
<210> 251
<211> 12
<212> DNA
<213> Homo sapiens
<400> 251
tcgacgactc ac 12
<210> 252
<211> 12
<212> DNA
<213> Homo sapiens
<400> 252
acgcgtcaga ta 12
<210> 253
<211> 12
<212> DNA
<213> Homo sapiens
<400> 253
cgtacggcac ag 12
<210> 254
<211> 12
<212> DNA
<213> Homo sapiens
<400> 254
ctatgccgtg ca 12
<210> 255
<211> 12
<212> DNA
<213> Homo sapiens
<400> 255
cgcgtcagat at 12
<210> 256
<211> 12
<212> DNA
<213> Homo sapiens
<400> 256
aagatcggta gc 12
<210> 257
<211> 12
<212> DNA
<213> Homo sapiens
<400> 257
cttcgcaagg ag 12
<210> 258
<211> 12
<212> DNA
<213> Homo sapiens
<400> 258
gtcgtggact ac 12
<210> 259
<211> 12
<212> DNA
<213> Homo sapiens
<400> 259
ggtcgtcatc aa 12
<210> 260
<211> 12
<212> DNA
<213> Homo sapiens
<400> 260
gttaacagcg tg 12
<210> 261
<211> 12
<212> DNA
<213> Homo sapiens
<400> 261
tagctaaccg tt 12
<210> 262
<211> 12
<212> DNA
<213> Homo sapiens
<400> 262
agtaaaggcg ct 12
<210> 263
<211> 12
<212> DNA
<213> Homo sapiens
<400> 263
ggtaatttcg tg 12
<210> 264
<211> 147
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<400> 264
nnnnnnnnnn nnnnnnnnnn guuuuaguac ucuguaauuu uagguaugag guagacgaaa 60
auuguacuua uaccuaaaau uacagaaucu acuaaaacaa ggcaaaaugc cguguuuauc 120
ucgucaacuu guuggcgaga uuuuuuu 147
Claims (53)
- A) CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열로서, 상기 폴리뉴클레오티드 서열이
(a) 진핵 세포 내의 표적 서열에 혼성화할 수 있는 가이드 서열,
(b) tracr 메이트(mate) 서열, 및
(c) tracr 서열을 포함하고,
(a), (b) 및 (c)가 5'에서 3' 배향으로 배열되며,
전사되는 경우, 상기 tracr 메이트 서열이 상기 tracr 서열에 혼성화되고, 상기 가이드 서열이 상기 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며,
상기 CRISPR 복합체가 (1) 상기 표적 서열에 혼성화되는 가이드 서열, 및 (2) 상기 tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하는 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열,
또는
B) CRISPR 효소 시스템으로서, 상기 시스템이
I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열에 작동가능하게 연결된 제1 조절 요소로서, 상기 폴리뉴클레오티드 서열이
(a) 진핵 세포 내의 하나 이상의 표적 서열에 혼성화할 수 있는 하나 이상의 가이드 서열,
(b) tracr 메이트 서열, 및
(c) 하나 이상의 tracr 서열을 포함하는 제1 조절 요소, 및
II. 적어도 하나 이상의 핵 국소화 서열을 포함하는 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함하는 하나 이상의 벡터를 포함하는 벡터 시스템에 의해 인코딩되고,
(a), (b) 및 (c)가 5'에서 3' 배향으로 배열되며,
성분 I 및 II가 상기 시스템의 동일한 또는 상이한 벡터에 배치되고,
전사되는 경우, 상기 tracr 메이트 서열이 상기 tracr 서열에 혼성화되며, 상기 가이드 서열이 상기 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하고,
상기 CRISPR 복합체가 (1) 상기 표적 서열에 혼성화되는 가이드 서열, 및 (2) 상기 tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하는 CRISPR 효소 시스템,
또는
C) 다중화 CRISPR 효소 시스템으로서, 상기 시스템이
I. CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열에 작동가능하게 연결된 제1 조절 요소로서, 상기 폴리뉴클레오티드 서열이
(a) 진핵 세포 내의 하나 이상의 표적 서열에 혼성화할 수 있는 하나 이상의 가이드 서열,
(b) tracr 메이트 서열, 및
(c) 하나 이상의 tracr 서열을 포함하는 제1 조절 요소, 및
II. 적어도 하나 이상의 핵 국소화 서열을 포함하는 CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함하는 하나 이상의 벡터를 포함하는 벡터 시스템에 의해 암호화되고,
(a), (b) 및 (c)가 5'에서 3' 배향으로 배열되며,
성분 I 및 II가 상기 시스템의 동일한 또는 상이한 벡터에 배치되고,
전사되는 경우, 상기 tracr 메이트 서열이 상기 tracr 서열에 혼성화되며, 상기 가이드 서열이 상기 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하고,
상기 CRISPR 복합체가 (1) 상기 표적 서열에 혼성화되는 가이드 서열, 및 (2) 상기 tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하며,
상기 다중화 시스템에서, 다중의 chiRNA 폴리뉴클레오티드 서열이 사용되는 다중화 CRISPR 효소 시스템,
또는
D) 다중화 CRISPR 효소 시스템으로서, 상기 시스템이
I. (a) 세포 내의 표적 서열에 혼성화할 수 있는 하나 이상의 가이드 서열, 및
(b) 적어도 하나 이상의 tracr 메이트 서열에 작동가능하게 연결된 제1 조절 요소,
II. CRISPR 효소를 인코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 요소, 및
III. tracr 서열에 작동가능하게 연결된 제3 조절 요소를 포함하는 하나 이상의 벡터를 포함하는 벡터 시스템에 의해 인코딩되고,
성분 I, II 및 III이 시스템의 동일한 또는 상이한 벡터에 배치되며,
전사되는 경우, 상기 tracr 메이트 서열이 상기 tracr 서열에 혼성화되고, 상기 가이드 서열이 상기 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며,
상기 CRISPR 복합체가 (1) 상기 표적 서열에 혼성화되는 가이드 서열, 및 (2) 상기 tracr 서열에 혼성화되는 tracr 메이트 서열과 복합체화되는 CRISPR 효소를 포함하고,
상기 다중화 시스템에서, 다중의 가이드 서열 및 단일의 tracr 서열이 사용되는 다중화 CRISPR 효소 시스템을 포함하는 비-천연 발생 또는 조작된 조성물로서,
A)의 폴리뉴클레오티드 서열에서, 또는 B), C) 또는 D)의 시스템에서, 가이드, tracr 및 tracr 메이트 서열 중 하나 이상을 변형시켜, 안정성을 향상시킨 비-천연 발생 또는 조작된 조성물. - 제1항에 있어서, 상기 변형이 조작된 2차 구조를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 또는 제2항에 있어서, 상기 변형이 상기 tracr 메이트 서열과 상기 tracr 서열 간의 혼성화 영역의 감소를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 변형이 인공 루프를 통해 tracr 메이트 서열과 tracr 서열을 융합시키는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 변형이 40 내지 120 bp의 길이를 갖는 tracr 서열을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 tracr 서열이 40 bp 내지 전장의 tracr인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 tracr 서열이 적어도 상응하는 야생형 tracRNA의 뉴클레오티드 1 내지 67을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 tracr 서열이 적어도 상응하는 야생형 tracRNA의 뉴클레오티드 1 내지 85를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 tracr 서열이 야생형 스트렙토코커스 피오게네스(S. pyogenes) Cas9 tracRNA의 뉴클레오티드 1 내지 67에 상응하는 뉴클레오티드를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 tracr 서열이 야생형 스트렙토코커스 피오게네스 Cas9 tracRNA의 뉴클레오티드 1 내지 85에 상응하는 뉴클레오티드를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제9항에 있어서, 상기 tracr 서열이 본질적으로 야생형 스트렙토코커스 피오게네스 Cas9 tracRNA의 뉴클레오티드 1 내지 67에 상응하는 뉴클레오티드로 이루어진 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제10항에 있어서, 상기 tracr 서열이 본질적으로 야생형 스트렙토코커스 피오게네스 Cas9 tracRNA의 뉴클레오티드 1 내지 85에 상응하는 뉴클레오티드로 이루어진 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 변형이 서열 최적화를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제13항에 있어서, 상기 변형이 상기 tracr 및/또는 상기 tracr 메이트 서열 내의 폴리T 서열의 감소를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제14항에 있어서, 관련 야생형 서열의 폴리-T 서열에 존재하는 하나 이상의 T가 비-T 뉴클레오티드로 치환되는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제13항, 제14항 또는 제15항에 있어서, 상기 변형된 서열이 4개 초과의 연속 T를 갖는 임의의 폴리T 서열을 포함하지 않는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 변형이 폴리T 종결자 서열을 부가하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제17항에 있어서, 상기 변형이 tracr 및/또는 tracr 메이트 서열 내에 폴리T 종결자 서열을 부가하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제17항 또는 제18항에 있어서, 상기 변형이 가이드 서열에 폴리T 종결자 서열을 부가하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 변형이 루프 및/또는 헤어핀을 변경시키는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제20항에 있어서, 상기 변형이 상기 가이드 서열에 최소 2개의 헤어핀을 제공하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제20항 또는 제21항에 있어서, 상기 변형이 tracr과 tracr 메이트 서열 간의 상보성에 의해 형성되는 헤어핀을 제공하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제20항 내지 제22항 중 어느 한 항에 있어서, 상기 변형이 tracrRNA 서열의 3' 말단에 하나 이상의 추가의 헤어핀(들)을 제공하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제20항 내지 제23항 중 어느 한 항에 있어서, 상기 변형이 상기 가이드 서열의 3'에 부가된 하나 이상의 추가의 헤어핀(들)을 제공하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 변형이 상기 가이드 서열의 5' 말단을 연장하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제25항에 있어서, 상기 변형이 상기 가이드 서열의 5' 말단에 하나 이상의 헤어핀을 제공하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제25항 또는 제26항에 있어서, 상기 변형이 상기 가이드 서열의 5' 말단에 서열(5'-AGGACGAAGTCCTAA)을 부착시키는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 변형이 가교를 제공하거나 상기 폴리뉴클레오티드 서열에 하나 이상의 변형된 뉴클레오티드를 제공하는 것을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제28항에 있어서, 변형된 뉴클레오티드가 상기 tracr, tracr 메이트 및/또는 가이드 서열 중 임의의 것 또는 모두에, 및/또는 효소 코딩 서열에, 및/또는 벡터 서열에 제공되는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제28항 또는 제29항에 있어서, 변형된 뉴클레오티드를 제공하는 것이 적어도 하나의 비천연 발생 뉴클레오티드 또는 변형된 뉴클레오티드 또는 그의 유사체의 함유를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제30항에 있어서, 상기 변형된 뉴클레오티드가 리보스, 포스페이트 및/또는 염기 모이어티(moiety)에서 변형되는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제30항에 있어서, 상기 변형된 뉴클레오티드가 2'-O-메틸 유사체, 2'-데옥시 유사체 또는 2'-플루오로 유사체로 이루어진 군으로부터 선택되는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제30항에 있어서, 상기 변형된 뉴클레오티드가 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘, 이노신, 7-메틸구아노신으로 이루어진 군으로부터 선택되는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 변형이 2개의 헤어핀을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제34항 중 어느 한 항에 있어서, 상기 변형이 3개의 헤어핀을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 변형이 최대 5개의 헤어핀을 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제36항 중 어느 한 항에 있어서, 상기 CRISPR 효소가 II형 CRISPR 시스템 효소인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 CRISPR 효소가 Cas9 효소인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 상기 CRISPR 효소가 1000개 미만의 아미노산으로 이루어진 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 상기 CRISPR 효소가 4000개 미만의 아미노산으로 이루어진 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제40항 중 어느 한 항에 있어서, 상기 Cas9 효소가 StCas9 또는 St1Cas9인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 Cas9 효소가 스트렙토코커스(Streptococcus), 캄필로박터(Campylobacter), 니트라티프랙터(Nitratifractor), 스타필로코커스(Staphylococcus), 파비바쿨룸(Parvibaculum), 로세부리아(Roseburia), 네이세리아(Neisseria), 글루코나세토박터(Gluconacetobacter), 아조스피릴룸(Azospirillum), 스파에로카에타(Sphaerochaeta), 락토바실러스(Lactobacillus), 유박테리움(Eubacterium) 또는 코리네박터(Corynebacter) 속으로 이루어진 군으로부터 선택되는 유기체로부터의 Cas9 효소인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제42항 중 어느 한 항에 있어서, 상기 CRISPR 효소가 상기 표적 서열의 위치에서 둘 모두의 가닥의 절단을 유도하는 뉴클레아제인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제43항 중 어느 한 항에 있어서, 상기 제1 조절 요소가 중합효소 III 프로모터인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제44항 중 어느 한 항에 있어서, 상기 제2 조절 요소가 중합효소 II 프로모터인 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 가이드 서열이 적어도 15개의 뉴클레오티드를 포함하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제46항 중 어느 한 항에 있어서, 상기 변형이 최적화된 tracr 서열 및/또는 최적화된 가이드 서열 RNA 및/또는 tracr 서열 및/또는 tracr 메이트 서열(들)의 동시-폴드 구조 및/또는 tracr 서열의 2차 구조의 안정화 및/또는 염기-쌍형성 영역이 감소된 tracr 서열 및/또는 tracr 서열 융합 RNA 요소를 포함하고/거나; 다중화 시스템에서, 하나의 tracer을 포함하고, 복수의 가이드를 포함하는 2개의 RNA가 존재하거나 복수의 키메라를 포함하는 하나의 RNA가 존재하는 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제47항 중 어느 한 항에 있어서, 상기 CRISPR 효소가 진핵 세포에서의 발현을 위해 코돈-최적화된 CRISPR-Cas 시스템 chiRNA 또는 CRISPR 효소 시스템.
- 제1항 내지 제48항 중 어느 한 항에 있어서, 상기 조성물이 CRISPR-Cas 시스템 키메라 RNA(chiRNA) 폴리뉴클레오티드 서열을 포함하는 조성물.
- 제49항에 있어서, 상기 조성물이 적어도 하나 이상의 핵 국소화 서열을 포함하는 CRISPR 효소를 인코딩하는 폴리뉴클레오티드 서열을 더 포함하는 조성물.
- 제1항 내지 제50항 중 어느 한 항의 CRISPR 효소 시스템.
- 제1항 내지 제51항 중 어느 한 항의 다중화 CRISPR 효소 시스템.
- 제49항 또는 제50항의 조성물, 제51항의 CRISPR 효소 시스템 또는 제52항의 다중화 CRISPR 효소 시스템의 전사 또는 번역 산물.
Applications Claiming Priority (25)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261736527P | 2012-12-12 | 2012-12-12 | |
US61/736,527 | 2012-12-12 | ||
US201361748427P | 2013-01-02 | 2013-01-02 | |
US61/748,427 | 2013-01-02 | ||
US201361758468P | 2013-01-30 | 2013-01-30 | |
US61/758,468 | 2013-01-30 | ||
US201361769046P | 2013-02-25 | 2013-02-25 | |
US61/769,046 | 2013-02-25 | ||
US201361791409P | 2013-03-15 | 2013-03-15 | |
US201361802174P | 2013-03-15 | 2013-03-15 | |
US61/802,174 | 2013-03-15 | ||
US61/791,409 | 2013-03-15 | ||
US201361806375P | 2013-03-28 | 2013-03-28 | |
US61/806,375 | 2013-03-28 | ||
US201361814263P | 2013-04-20 | 2013-04-20 | |
US61/814,263 | 2013-04-20 | ||
US201361819803P | 2013-05-06 | 2013-05-06 | |
US61/819,803 | 2013-05-06 | ||
US201361828130P | 2013-05-28 | 2013-05-28 | |
US61/828,130 | 2013-05-28 | ||
US201361836127P | 2013-06-17 | 2013-06-17 | |
US201361835931P | 2013-06-17 | 2013-06-17 | |
US61/836,127 | 2013-06-17 | ||
US61/835,931 | 2013-06-17 | ||
PCT/US2013/074819 WO2014093712A1 (en) | 2012-12-12 | 2013-12-12 | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20150105633A true KR20150105633A (ko) | 2015-09-17 |
Family
ID=49920627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157018614A KR20150105633A (ko) | 2012-12-12 | 2013-12-12 | 서열 조작을 위한 시스템, 방법 및 최적화된 가이드 조성물의 조작 |
Country Status (16)
Country | Link |
---|---|
US (5) | US20140242664A1 (ko) |
EP (2) | EP4279588A3 (ko) |
JP (10) | JP2016504026A (ko) |
KR (1) | KR20150105633A (ko) |
CN (2) | CN105121648B (ko) |
AU (4) | AU2013359123B2 (ko) |
CA (1) | CA2894701A1 (ko) |
DK (1) | DK2771468T3 (ko) |
ES (4) | ES2598115T3 (ko) |
HK (5) | HK1202586A1 (ko) |
IL (2) | IL307735A (ko) |
MX (1) | MX2015007549A (ko) |
PL (2) | PL2921557T3 (ko) |
PT (4) | PT2771468E (ko) |
RU (1) | RU2701850C2 (ko) |
WO (1) | WO2014093712A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019066490A3 (ko) * | 2017-09-28 | 2019-06-27 | 주식회사 툴젠 | 유전자 발현 조절을 위한 인위적인 게놈 조작 |
US11572574B2 (en) | 2017-09-28 | 2023-02-07 | Toolgen Incorporated | Artificial genome manipulation for gene expression regulation |
Families Citing this family (553)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3613852A3 (en) | 2011-07-22 | 2020-04-22 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US11021737B2 (en) | 2011-12-22 | 2021-06-01 | President And Fellows Of Harvard College | Compositions and methods for analyte detection |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
US9637739B2 (en) * | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
IN2014DN09261A (ko) | 2012-04-25 | 2015-07-10 | Regeneron Pharma | |
EP3597741A1 (en) | 2012-04-27 | 2020-01-22 | Duke University | Genetic correction of mutated genes |
MA37663B1 (fr) | 2012-05-25 | 2019-12-31 | Univ California | Procédés et compositions permettant la modification de l'adn cible dirigée par l'arn et la modulation de la transcription dirigée par l'arn |
EP2861737B1 (en) | 2012-06-19 | 2019-04-17 | Regents Of The University Of Minnesota | Gene targeting in plants using dna viruses |
US10648001B2 (en) | 2012-07-11 | 2020-05-12 | Sangamo Therapeutics, Inc. | Method of treating mucopolysaccharidosis type I or II |
ES2813080T3 (es) | 2012-07-11 | 2021-03-22 | Sangamo Therapeutics Inc | Métodos y composiciones para el tratamiento de enfermedades por almacenamiento lisosomal |
CN116622704A (zh) * | 2012-07-25 | 2023-08-22 | 布罗德研究所有限公司 | 可诱导的dna结合蛋白和基因组干扰工具及其应用 |
US9567631B2 (en) | 2012-12-14 | 2017-02-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10584381B2 (en) | 2012-08-14 | 2020-03-10 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
EP2885418A4 (en) | 2012-08-14 | 2016-03-02 | 10X Genomics Inc | MICROCAPSE COMPOSITIONS AND METHOD THEREFOR |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
KR102182847B1 (ko) | 2012-10-23 | 2020-11-27 | 주식회사 툴젠 | 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도 |
EP3502240B1 (en) | 2012-11-27 | 2021-05-05 | The Children's Medical Center Corporation | Targeting bcl11a distal regulatory elements for fetal hemoglobin reinduction |
EP3617309A3 (en) | 2012-12-06 | 2020-05-06 | Sigma Aldrich Co. LLC | Crispr-based genome modification and regulation |
KR20150105634A (ko) | 2012-12-12 | 2015-09-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화 |
WO2014093595A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
PT2771468E (pt) * | 2012-12-12 | 2015-06-02 | Harvard College | Engenharia de sistemas, métodos e composições-guia otimizadas para manipulação de sequências |
WO2014093709A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
EP3064585B1 (en) | 2012-12-12 | 2020-02-05 | The Broad Institute, Inc. | Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation |
IL293526A (en) | 2012-12-12 | 2022-08-01 | Harvard College | Providing, engineering and optimizing systems, methods and compositions for sequence manipulation and therapeutic applications |
DK2931898T3 (en) | 2012-12-12 | 2016-06-20 | Massachusetts Inst Technology | CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
ES2741951T3 (es) | 2012-12-17 | 2020-02-12 | Harvard College | Modificación por ingeniería genética del genoma humano guiada por ARN |
CN113005148A (zh) | 2013-01-16 | 2021-06-22 | 爱默蕾大学 | Cas9-核酸复合物及其相关用途 |
WO2014124336A2 (en) | 2013-02-08 | 2014-08-14 | 10X Technologies, Inc. | Partitioning and processing of analytes and other species |
EP2971184B1 (en) | 2013-03-12 | 2019-04-17 | President and Fellows of Harvard College | Method of generating a three-dimensional nucleic acid containing matrix |
RU2018122288A (ru) * | 2013-03-14 | 2019-03-06 | Карибо Биосайенсиз, Инк. | Композиции и способы с участием нуклеиновых кислот, нацеленных на нуклеиновые кислоты |
AU2014227653B2 (en) | 2013-03-15 | 2017-04-20 | The General Hospital Corporation | Using RNA-guided foki nucleases (RFNs) to increase specificity for RNA-guided genome editing |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
US20140273235A1 (en) * | 2013-03-15 | 2014-09-18 | Regents Of The University Of Minnesota | ENGINEERING PLANT GENOMES USING CRISPR/Cas SYSTEMS |
WO2014165825A2 (en) | 2013-04-04 | 2014-10-09 | President And Fellows Of Harvard College | Therapeutic uses of genome editing with crispr/cas systems |
SI2986729T1 (sl) | 2013-04-16 | 2019-02-28 | Regeneron Pharmaceuticals, Inc. | Ciljana sprememba genoma podgane |
US20140356956A1 (en) * | 2013-06-04 | 2014-12-04 | President And Fellows Of Harvard College | RNA-Guided Transcriptional Regulation |
MY197877A (en) | 2013-06-04 | 2023-07-22 | Harvard College | Rna-guided transcriptional regulation |
EP3011034B1 (en) | 2013-06-17 | 2019-08-07 | The Broad Institute, Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components |
CN106062197A (zh) | 2013-06-17 | 2016-10-26 | 布罗德研究所有限公司 | 用于序列操纵的串联指导系统、方法和组合物的递送、工程化和优化 |
AU2014281027A1 (en) | 2013-06-17 | 2016-01-28 | Massachusetts Institute Of Technology | Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation |
EP3725885A1 (en) | 2013-06-17 | 2020-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
SG11201510284XA (en) | 2013-06-17 | 2016-01-28 | Broad Inst Inc | Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy |
US10349733B2 (en) | 2013-06-19 | 2019-07-16 | Kolibree | Toothbrush system with sensors for a dental hygiene monitoring system |
US10011850B2 (en) | 2013-06-21 | 2018-07-03 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing |
WO2015006498A2 (en) * | 2013-07-09 | 2015-01-15 | President And Fellows Of Harvard College | Therapeutic uses of genome editing with crispr/cas systems |
SI3019619T1 (sl) * | 2013-07-11 | 2021-12-31 | Modernatx, Inc. | Sestave, ki zajemajo sintetične polinukleotide, ki kodirajo proteine, pozvezane s crispr, in sintetične sgrna, ter metode uporabe |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
CA3221516A1 (en) | 2013-08-22 | 2015-02-26 | E. I. Du Pont De Nemours And Company | Plant genome modification using guide rna/cas endonuclease systems and methods of use |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340800B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | Extended DNA-sensing GRNAS |
ES2844174T3 (es) | 2013-09-18 | 2021-07-21 | Kymab Ltd | Métodos, células y organismos |
WO2015054507A1 (en) | 2013-10-10 | 2015-04-16 | Pronutria, Inc. | Nutritive polypeptide production systems, and methods of manufacture and use thereof |
WO2015065964A1 (en) | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
CN106459995B (zh) | 2013-11-07 | 2020-02-21 | 爱迪塔斯医药有限公司 | 使用统治型gRNA的CRISPR相关方法和组合物 |
MX2016007654A (es) | 2013-12-11 | 2017-08-15 | Regeneron Pharma | Metodos y composiciones para la modificacion dirigida de un genoma. |
KR20160089530A (ko) | 2013-12-12 | 2016-07-27 | 더 브로드 인스티튜트, 인코퍼레이티드 | Hbv 및 바이러스 질병 및 질환을 위한 crisprcas 시스템 및 조성물의 전달,용도 및 치료적 적용 |
EP4219699A1 (en) | 2013-12-12 | 2023-08-02 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation |
WO2015089427A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
JP6793547B2 (ja) | 2013-12-12 | 2020-12-02 | ザ・ブロード・インスティテュート・インコーポレイテッド | 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物 |
US20150166985A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting von willebrand factor point mutations |
BR112016013213A2 (pt) | 2013-12-12 | 2017-12-05 | Massachusetts Inst Technology | administração, uso e aplicações terapêuticas dos sistemas crispr-cas e composições para visar distúrbios e doenças usando componentes de administração de partículas |
KR20160089527A (ko) | 2013-12-12 | 2016-07-27 | 더 브로드 인스티튜트, 인코퍼레이티드 | 게놈 편집을 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료적 응용 |
BR112016013520A2 (pt) | 2013-12-12 | 2017-10-03 | Broad Inst Inc | Composições e métodos de uso de sistemas crispr-cas em distúrbios de repetições de nucleotídeos |
WO2015123339A1 (en) | 2014-02-11 | 2015-08-20 | The Regents Of The University Of Colorado, A Body Corporate | Crispr enabled multiplexed genome engineering |
AU2015219167A1 (en) | 2014-02-18 | 2016-09-08 | Duke University | Compositions for the inactivation of virus replication and methods of making and using the same |
EP3514246B1 (en) | 2014-02-27 | 2021-11-17 | The Broad Institute, Inc. | T cell balance gene expression and methods of use thereof |
CA3194412A1 (en) | 2014-02-27 | 2015-09-03 | Monsanto Technology Llc | Compositions and methods for site directed genomic modification |
US11028388B2 (en) | 2014-03-05 | 2021-06-08 | Editas Medicine, Inc. | CRISPR/Cas-related methods and compositions for treating Usher syndrome and retinitis pigmentosa |
EP3115457B1 (en) | 2014-03-05 | 2019-10-02 | National University Corporation Kobe University | Genomic sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same |
DK3116997T3 (da) | 2014-03-10 | 2019-08-19 | Editas Medicine Inc | Crispr/cas-relaterede fremgangsmåder og sammensætninger til behandling af lebers kongenitale amaurose 10 (lca10) |
US11141493B2 (en) | 2014-03-10 | 2021-10-12 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
US11339437B2 (en) | 2014-03-10 | 2022-05-24 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
JP6815986B2 (ja) | 2014-03-26 | 2021-01-20 | ユニバーシティ オブ メリーランド, カレッジ パーク | 大型家畜の接合体における標的化ゲノム編集 |
EP3122880B1 (en) | 2014-03-26 | 2021-05-05 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating sickle cell disease |
WO2015153789A1 (en) * | 2014-04-01 | 2015-10-08 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1) |
JP6726659B2 (ja) | 2014-04-10 | 2020-07-22 | 10エックス ジェノミクス, インコーポレイテッド | 試薬をカプセル化およびパーティション化するための流体デバイス、システム、および方法、ならびにそれらの応用 |
DK3134130T3 (da) | 2014-04-25 | 2019-08-26 | Childrens Medical Center | Sammensætninger og fremgangsmåder til behandling af hæmoglobinopatier |
WO2015184268A1 (en) | 2014-05-30 | 2015-12-03 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and methods of delivering treatments for latent viral infections |
CA2952121A1 (en) | 2014-06-13 | 2015-12-17 | Childrens' Medical Center Corporation | Products and methods to isolate mitochondria |
EP3919621A1 (en) | 2014-06-23 | 2021-12-08 | The General Hospital Corporation | Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq) |
WO2015200555A2 (en) * | 2014-06-25 | 2015-12-30 | Caribou Biosciences, Inc. | Rna modification to engineer cas9 activity |
CA2953374A1 (en) | 2014-06-26 | 2015-12-30 | 10X Genomics, Inc. | Methods of analyzing nucleic acids from individual cells or cell populations |
AU2015288157A1 (en) | 2014-07-11 | 2017-01-19 | E. I. Du Pont De Nemours And Company | Compositions and methods for producing plants resistant to glyphosate herbicide |
EP4079847A1 (en) | 2014-07-30 | 2022-10-26 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
CN104195177B (zh) * | 2014-08-05 | 2017-06-09 | 南京大学 | 一种显著提高鱼类基因组编辑效率的方法 |
WO2016028682A1 (en) | 2014-08-17 | 2016-02-25 | The Broad Institute Inc. | Genome editing using cas9 nickases |
WO2016028887A1 (en) | 2014-08-19 | 2016-02-25 | Pacific Biosciences Of California, Inc. | Compositions and methods for enrichment of nucleic acids |
NZ728437A (en) | 2014-08-27 | 2018-02-23 | Caribou Biosciences Inc | Methods for increasing cas9-mediated engineering efficiency |
EP3188763B1 (en) | 2014-09-02 | 2020-05-13 | The Regents of The University of California | Methods and compositions for rna-directed target dna modification |
WO2016040030A1 (en) | 2014-09-12 | 2016-03-17 | E. I. Du Pont De Nemours And Company | Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use |
WO2016049251A1 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes |
WO2016049024A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo |
WO2016049163A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder |
US10040048B1 (en) | 2014-09-25 | 2018-08-07 | Synthego Corporation | Automated modular system and method for production of biopolymers |
WO2016049258A2 (en) | 2014-09-25 | 2016-03-31 | The Broad Institute Inc. | Functional screening with optimized functional crispr-cas systems |
WO2016069591A2 (en) | 2014-10-27 | 2016-05-06 | The Broad Institute Inc. | Compositions, methods and use of synthetic lethal screening |
US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
EP3215617B1 (en) | 2014-11-07 | 2024-05-08 | Editas Medicine, Inc. | Systems for improving crispr/cas-mediated genome-editing |
EP3218508A4 (en) * | 2014-11-10 | 2018-04-18 | Modernatx, Inc. | Multiparametric nucleic acid optimization |
KR101833433B1 (ko) * | 2014-11-25 | 2018-02-28 | 한국생명공학연구원 | 돼지 t 세포 및 b 세포 면역결핍 세포주 생산 및 그의 제조 방법 |
WO2016086197A1 (en) | 2014-11-25 | 2016-06-02 | The Brigham And Women's Hospital, Inc. | Method of identifying and treating a person having a predisposition to or afflicted with a cardiometabolic disease |
US20180057839A1 (en) | 2014-11-26 | 2018-03-01 | The Regents Of The University Of California | Therapeutic compositions comprising transcription factors and methods of making and using the same |
GB201421096D0 (en) | 2014-11-27 | 2015-01-14 | Imp Innovations Ltd | Genome editing methods |
WO2016089866A1 (en) * | 2014-12-01 | 2016-06-09 | President And Fellows Of Harvard College | Rna-guided systems for in vivo gene editing |
CA2969619A1 (en) * | 2014-12-03 | 2016-06-09 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
CN116059378A (zh) | 2014-12-10 | 2023-05-05 | 明尼苏达大学董事会 | 用于治疗疾病的遗传修饰的细胞、组织和器官 |
WO2016094880A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs) |
EP3230451B1 (en) | 2014-12-12 | 2021-04-07 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
WO2016094872A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Dead guides for crispr transcription factors |
WO2016094874A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Escorted and functionalized guides for crispr-cas systems |
WO2016100951A2 (en) * | 2014-12-18 | 2016-06-23 | Integrated Dna Technologies, Inc. | Crispr-based compositions and methods of use |
WO2016100974A1 (en) | 2014-12-19 | 2016-06-23 | The Broad Institute Inc. | Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing |
WO2016106236A1 (en) | 2014-12-23 | 2016-06-30 | The Broad Institute Inc. | Rna-targeting system |
WO2016106244A1 (en) | 2014-12-24 | 2016-06-30 | The Broad Institute Inc. | Crispr having or associated with destabilization domains |
WO2016108926A1 (en) | 2014-12-30 | 2016-07-07 | The Broad Institute Inc. | Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis |
EP3245232B1 (en) | 2015-01-12 | 2021-04-21 | The Regents of The University of California | Heterodimeric cas9 and methods of use thereof |
EP3244992B1 (en) | 2015-01-12 | 2023-03-08 | 10X Genomics, Inc. | Processes for barcoding nucleic acids |
WO2016123243A1 (en) | 2015-01-28 | 2016-08-04 | The Regents Of The University Of California | Methods and compositions for labeling a single-stranded target nucleic acid |
KR102319192B1 (ko) * | 2015-01-28 | 2021-10-28 | 카리부 바이오사이언시스 인코포레이티드 | Crispr 하이브리드 dna/rna 폴리뉴클레오티드 및 사용 방법 |
WO2016135557A2 (en) | 2015-02-23 | 2016-09-01 | Crispr Therapeutics Ag | Materials and methods for treatment of hemoglobinopathies |
EP4286516A3 (en) | 2015-02-24 | 2024-03-06 | 10X Genomics, Inc. | Partition processing methods and systems |
EP3262193A2 (en) | 2015-02-26 | 2018-01-03 | The Broad Institute Inc. | T cell balance gene expression, compositions of matters and methods of use thereof |
WO2016138574A1 (en) | 2015-03-02 | 2016-09-09 | Sinai Health System | Homologous recombination factors |
KR20230156800A (ko) | 2015-03-03 | 2023-11-14 | 더 제너럴 하스피탈 코포레이션 | 변경된 PAM 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제 |
EP3274454B1 (en) * | 2015-03-25 | 2021-08-25 | Editas Medicine, Inc. | Crispr/cas-related methods, compositions and components |
WO2016160389A1 (en) | 2015-03-27 | 2016-10-06 | E I Du Pont De Nemours And Company | Soybean u6 small nuclear rna gene promoters and their use in constitutive expression of small rna genes in plants |
EP3280803B1 (en) | 2015-04-06 | 2021-05-26 | The Board of Trustees of the Leland Stanford Junior University | Chemically modified guide rnas for crispr/cas-mediated gene regulation |
GB201506509D0 (en) | 2015-04-16 | 2015-06-03 | Univ Wageningen | Nuclease-mediated genome editing |
EP3286571B1 (en) | 2015-04-24 | 2021-08-18 | Editas Medicine, Inc. | Evaluation of cas9 molecule/guide rna molecule complexes |
EP3294873B1 (en) | 2015-05-08 | 2020-08-19 | The Children's Medical Center Corporation | Targeting bcl11a enhancer functional regions for fetal hemoglobin reinduction |
WO2016182893A1 (en) | 2015-05-08 | 2016-11-17 | Teh Broad Institute Inc. | Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof |
AU2016261358B2 (en) | 2015-05-11 | 2021-09-16 | Editas Medicine, Inc. | Optimized CRISPR/Cas9 systems and methods for gene editing in stem cells |
US10117911B2 (en) | 2015-05-29 | 2018-11-06 | Agenovir Corporation | Compositions and methods to treat herpes simplex virus infections |
EP3303585A4 (en) | 2015-06-03 | 2018-10-31 | Board of Regents of the University of Nebraska | Dna editing using single-stranded dna |
EP3303634B1 (en) | 2015-06-03 | 2023-08-30 | The Regents of The University of California | Cas9 variants and methods of use thereof |
WO2016193945A2 (en) | 2015-06-05 | 2016-12-08 | Novartis Ag | Methods and compositions for diagnosing, treating, and monitoring treatment of shank3 deficiency associated disorders |
WO2016201047A1 (en) | 2015-06-09 | 2016-12-15 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for improving transplantation |
US20160362667A1 (en) * | 2015-06-10 | 2016-12-15 | Caribou Biosciences, Inc. | CRISPR-Cas Compositions and Methods |
EP3310932B1 (en) | 2015-06-17 | 2023-08-30 | The UAB Research Foundation | Crispr/cas9 complex for genomic editing |
WO2016205728A1 (en) | 2015-06-17 | 2016-12-22 | Massachusetts Institute Of Technology | Crispr mediated recording of cellular events |
WO2016205680A1 (en) | 2015-06-17 | 2016-12-22 | The Uab Research Foundation | Crispr/cas9 complex for introducing a functional polypeptide into cells of blood cell lineage |
EP3129393B1 (en) | 2015-06-18 | 2021-08-04 | The Broad Institute Inc. | Crispr enzyme mutations reducing off-target effects |
AU2016279062A1 (en) | 2015-06-18 | 2019-03-28 | Omar O. Abudayyeh | Novel CRISPR enzymes and systems |
US10648020B2 (en) | 2015-06-18 | 2020-05-12 | The Broad Institute, Inc. | CRISPR enzymes and systems |
WO2016205745A2 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Cell sorting |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
EP3666895A1 (en) | 2015-06-18 | 2020-06-17 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
US11414657B2 (en) | 2015-06-29 | 2022-08-16 | Ionis Pharmaceuticals, Inc. | Modified CRISPR RNA and modified single CRISPR RNA and uses thereof |
WO2017004279A2 (en) * | 2015-06-29 | 2017-01-05 | Massachusetts Institute Of Technology | Compositions comprising nucleic acids and methods of using the same |
US20170119820A1 (en) | 2015-07-31 | 2017-05-04 | Regents Of The University Of Minnesota | Modified cells and methods of therapy |
US9580727B1 (en) | 2015-08-07 | 2017-02-28 | Caribou Biosciences, Inc. | Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides |
WO2017031370A1 (en) | 2015-08-18 | 2017-02-23 | The Broad Institute, Inc. | Methods and compositions for altering function and structure of chromatin loops and/or domains |
IL288662B2 (en) * | 2015-08-25 | 2023-09-01 | Univ Duke | Preparations and methods for improving specificity in genomic engineering using RNA-guided endonucleases |
WO2017040348A1 (en) | 2015-08-28 | 2017-03-09 | The General Hospital Corporation | Engineered crispr-cas9 nucleases |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
US9512446B1 (en) | 2015-08-28 | 2016-12-06 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
EP3344771A4 (en) * | 2015-08-31 | 2019-03-20 | Agilent Technologies, Inc. | COMPOUNDS AND METHODS FOR GENOME EDITING BASED ON CRISPR / CAS BY HOMOLOGOUS RECOMBINATION |
JP6664693B2 (ja) | 2015-09-09 | 2020-03-13 | 国立大学法人神戸大学 | 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体 |
CN108350453A (zh) | 2015-09-11 | 2018-07-31 | 通用医疗公司 | 核酸酶dsb的完全查询和测序(find-seq) |
WO2017048969A1 (en) * | 2015-09-17 | 2017-03-23 | The Regents Of The University Of California | Variant cas9 polypeptides comprising internal insertions |
JP6799058B2 (ja) * | 2015-09-21 | 2020-12-09 | アークトゥラス・セラピューティクス・インコーポレイテッドArcturus Therapeutics,Inc. | アレル選択的な遺伝子編集およびその使用 |
US11667911B2 (en) | 2015-09-24 | 2023-06-06 | Editas Medicine, Inc. | Use of exonucleases to improve CRISPR/CAS-mediated genome editing |
CA3000762A1 (en) | 2015-09-30 | 2017-04-06 | The General Hospital Corporation | Comprehensive in vitro reporting of cleavage events by sequencing (circle-seq) |
WO2017069958A2 (en) | 2015-10-09 | 2017-04-27 | The Brigham And Women's Hospital, Inc. | Modulation of novel immune checkpoint targets |
EP3362571A4 (en) | 2015-10-13 | 2019-07-10 | Duke University | GENOMIC ENGINEERING WITH TYPE I CRISPRISMS IN EUKARYOTIC CELLS |
CN116814590A (zh) | 2015-10-22 | 2023-09-29 | 布罗德研究所有限公司 | Vi-b型crispr酶和系统 |
DK3350327T3 (en) | 2015-10-23 | 2019-01-21 | Caribou Biosciences Inc | CONSTRUCTED CRISPR CLASS-2-NUCLEIC ACID TARGETING-NUCLEIC ACID |
JP7067793B2 (ja) | 2015-10-23 | 2022-05-16 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸塩基編集因子およびその使用 |
US11492670B2 (en) | 2015-10-27 | 2022-11-08 | The Broad Institute Inc. | Compositions and methods for targeting cancer-specific sequence variations |
US11092607B2 (en) | 2015-10-28 | 2021-08-17 | The Board Institute, Inc. | Multiplex analysis of single cell constituents |
WO2017075465A1 (en) | 2015-10-28 | 2017-05-04 | The Broad Institute Inc. | Compositions and methods for evaluating and modulating immune responses by detecting and targeting gata3 |
WO2017075294A1 (en) | 2015-10-28 | 2017-05-04 | The Board Institute Inc. | Assays for massively combinatorial perturbation profiling and cellular circuit reconstruction |
WO2017075451A1 (en) | 2015-10-28 | 2017-05-04 | The Broad Institute Inc. | Compositions and methods for evaluating and modulating immune responses by detecting and targeting pou2af1 |
WO2017075478A2 (en) | 2015-10-28 | 2017-05-04 | The Broad Institute Inc. | Compositions and methods for evaluating and modulating immune responses by use of immune cell gene signatures |
GB2559526B (en) | 2015-11-03 | 2021-02-17 | Harvard College | Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix |
ES2905558T3 (es) | 2015-11-13 | 2022-04-11 | Avellino Lab Usa Inc | Procedimientos para el tratamiento de las distrofias corneales |
BR112018009954A2 (pt) * | 2015-11-16 | 2018-11-13 | Res Inst Nationwide Childrens Hospital | materiais e métodos para o tratamento de miopatias baseadas em titinas e outras titinopatias |
US11371094B2 (en) | 2015-11-19 | 2022-06-28 | 10X Genomics, Inc. | Systems and methods for nucleic acid processing using degenerate nucleotides |
EP3377086B1 (en) | 2015-11-19 | 2024-05-01 | The Brigham and Women's Hospital, Inc. | Lymphocyte antigen cd5-like (cd5l)-interleukin 12b (p40) heterodimers in immunity |
CN114774529A (zh) * | 2015-11-19 | 2022-07-22 | 10X基因组学有限公司 | 可转化标记组合物、方法及结合其的过程 |
CN108495932B (zh) * | 2015-11-27 | 2022-08-09 | 国立大学法人神户大学 | 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体 |
WO2017095940A1 (en) | 2015-11-30 | 2017-06-08 | Flagship Pioneering, Inc. | Methods and compositions relating to chondrisomes from cultured cells |
KR20180081164A (ko) | 2015-12-04 | 2018-07-13 | 10엑스 제노믹스, 인크. | 핵산 분석을 위한 방법 및 조성물 |
EP3371310B1 (en) | 2015-12-04 | 2019-05-01 | Caribou Biosciences, Inc. | Engineered nucleic-acid targeting nucleic acids |
US11208649B2 (en) | 2015-12-07 | 2021-12-28 | Zymergen Inc. | HTP genomic engineering platform |
US9988624B2 (en) | 2015-12-07 | 2018-06-05 | Zymergen Inc. | Microbial strain improvement by a HTP genomic engineering platform |
JP6821598B2 (ja) | 2015-12-07 | 2021-01-27 | ザイマージェン インコーポレイテッド | Corynebacterium glutamicum由来のプロモーター |
WO2017106767A1 (en) * | 2015-12-18 | 2017-06-22 | The Scripps Research Institute | Production of unnatural nucleotides using a crispr/cas9 system |
US11118194B2 (en) | 2015-12-18 | 2021-09-14 | The Regents Of The University Of California | Modified site-directed modifying polypeptides and methods of use thereof |
JP2019500394A (ja) | 2015-12-30 | 2019-01-10 | ノバルティス アーゲー | 有効性が増強された免疫エフェクター細胞治療 |
EA201891614A1 (ru) | 2016-01-11 | 2019-02-28 | Те Борд Оф Трастиз Оф Те Лилэнд Стэнфорд Джуниор Юниверсити | Химерные белки и способы иммунотерапии |
IL260532B2 (en) | 2016-01-11 | 2023-12-01 | Univ Leland Stanford Junior | Systems containing chaperone proteins and their uses for controlling gene expression |
WO2017136794A1 (en) * | 2016-02-03 | 2017-08-10 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide rna and its applications |
WO2017139309A1 (en) | 2016-02-12 | 2017-08-17 | Ceres, Inc. | Methods and materials for high throughput testing of mutagenized allele combinations |
US20190249172A1 (en) | 2016-02-18 | 2019-08-15 | The Regents Of The University Of California | Methods and compositions for gene editing in stem cells |
EP3420102B1 (en) | 2016-02-22 | 2024-04-03 | Massachusetts Institute of Technology | Methods for identifying and modulating immune phenotypes |
KR20180110144A (ko) * | 2016-02-26 | 2018-10-08 | 란자테크 뉴질랜드 리미티드 | C1-고정 박테리아에 대한 crispr/cas 시스템 |
JP2019515654A (ja) | 2016-03-16 | 2019-06-13 | ザ ジェイ. デヴィッド グラッドストーン インスティテューツ | 肥満及び/又は糖尿病を処置するための方法及び組成物、並びに候補処置薬剤を識別するための方法及び組成物 |
US11427861B2 (en) | 2016-03-17 | 2022-08-30 | Massachusetts Institute Of Technology | Methods for identifying and modulating co-occurant cellular phenotypes |
EP3219799A1 (en) | 2016-03-17 | 2017-09-20 | IMBA-Institut für Molekulare Biotechnologie GmbH | Conditional crispr sgrna expression |
CA3018729A1 (en) | 2016-03-23 | 2017-09-28 | The Regents Of The University Of California | Methods of treating mitochondrial disorders |
WO2017165859A1 (en) * | 2016-03-24 | 2017-09-28 | Research Institute At Nationwide Children's Hospital | Modified viral capsid proteins |
US11512311B2 (en) | 2016-03-25 | 2022-11-29 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency |
US11597924B2 (en) | 2016-03-25 | 2023-03-07 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
EP3443086B1 (en) | 2016-04-13 | 2021-11-24 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
WO2017180926A1 (en) * | 2016-04-14 | 2017-10-19 | Boco Silicon Valley. Inc. | Genome editing of human neural stem cells using nucleases |
US20210155911A1 (en) * | 2016-04-19 | 2021-05-27 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
EP3445853A1 (en) | 2016-04-19 | 2019-02-27 | The Broad Institute, Inc. | Cpf1 complexes with reduced indel activity |
EP3449016A4 (en) | 2016-04-25 | 2019-10-02 | President and Fellows of Harvard College | HYBRIDIZATION CHAIN REACTION PROCESS FOR IN-SITU MOLECULE DETECTION |
WO2017197338A1 (en) | 2016-05-13 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic systems and methods of use |
US10767175B2 (en) * | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
WO2017219027A1 (en) * | 2016-06-17 | 2017-12-21 | The Broad Institute Inc. | Type vi crispr orthologs and systems |
EP3474669B1 (en) | 2016-06-24 | 2022-04-06 | The Regents of The University of Colorado, A Body Corporate | Methods for generating barcoded combinatorial libraries |
US11471462B2 (en) | 2016-06-27 | 2022-10-18 | The Broad Institute, Inc. | Compositions and methods for detecting and treating diabetes |
CA3029271A1 (en) | 2016-06-28 | 2018-01-04 | Cellectis | Altering expression of gene products in plants through targeted insertion of nucleic acid sequences |
US10544411B2 (en) | 2016-06-30 | 2020-01-28 | Zymergen Inc. | Methods for generating a glucose permease library and uses thereof |
EP3478833A4 (en) | 2016-06-30 | 2019-10-02 | Zymergen, Inc. | METHODS OF GENERATING A BACTERIAL HEMOGLOBIN LIBRARY AND USES THEREOF |
WO2018013840A1 (en) | 2016-07-13 | 2018-01-18 | Vertex Pharmaceuticals Incorporated | Methods, compositions and kits for increasing genome editing efficiency |
CA3032822A1 (en) | 2016-08-02 | 2018-02-08 | Editas Medicine, Inc. | Compositions and methods for treating cep290 associated disease |
US11078481B1 (en) | 2016-08-03 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for screening for cancer targets |
KR102547316B1 (ko) | 2016-08-03 | 2023-06-23 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11630103B2 (en) | 2016-08-17 | 2023-04-18 | The Broad Institute, Inc. | Product and methods useful for modulating and evaluating immune responses |
US11810649B2 (en) | 2016-08-17 | 2023-11-07 | The Broad Institute, Inc. | Methods for identifying novel gene editing elements |
WO2018035388A1 (en) | 2016-08-17 | 2018-02-22 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
US20210166783A1 (en) | 2016-08-17 | 2021-06-03 | The Broad Institute, Inc. | Methods for identifying class 2 crispr-cas systems |
JP2019524149A (ja) | 2016-08-20 | 2019-09-05 | アベリノ ラボ ユーエスエー インコーポレイテッドAvellino Lab USA, Inc. | 一本鎖ガイドRNA、CRISPR/Cas9システム、及びそれらの使用方法 |
WO2020225754A1 (en) | 2019-05-06 | 2020-11-12 | Mcmullen Tara | Crispr gene editing for autosomal dominant diseases |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US11078483B1 (en) | 2016-09-02 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for measuring and improving CRISPR reagent function |
WO2018049025A2 (en) | 2016-09-07 | 2018-03-15 | The Broad Institute Inc. | Compositions and methods for evaluating and modulating immune responses |
CA3034931A1 (en) | 2016-09-23 | 2018-03-29 | Board Of Trustees Of Southern Illinois University | Tuning crispr/cas9 activity with chemically modified nucleotide substitutions |
US20190225974A1 (en) | 2016-09-23 | 2019-07-25 | BASF Agricultural Solutions Seed US LLC | Targeted genome optimization in plants |
MX2019003674A (es) | 2016-09-30 | 2021-01-08 | Univ California | Enzimas modificadoras de ácido nucleico guiadas por arn y métodos de uso de estas. |
US10669539B2 (en) | 2016-10-06 | 2020-06-02 | Pioneer Biolabs, Llc | Methods and compositions for generating CRISPR guide RNA libraries |
WO2018067991A1 (en) | 2016-10-07 | 2018-04-12 | The Brigham And Women's Hospital, Inc. | Modulation of novel immune checkpoint targets |
US11242542B2 (en) | 2016-10-07 | 2022-02-08 | Integrated Dna Technologies, Inc. | S. pyogenes Cas9 mutant genes and polypeptides encoded by same |
KR20230164759A (ko) | 2016-10-07 | 2023-12-04 | 인티그레이티드 디엔에이 테크놀로지스 아이엔씨. | S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드 |
US11306324B2 (en) | 2016-10-14 | 2022-04-19 | President And Fellows Of Harvard College | AAV delivery of nucleobase editors |
GB201617559D0 (en) | 2016-10-17 | 2016-11-30 | University Court Of The University Of Edinburgh The | Swine comprising modified cd163 and associated methods |
GB2573406B (en) | 2016-10-18 | 2021-11-10 | Univ Minnesota | Tumor infiltrating lymphocytes and methods of therapy |
EP3535396A1 (en) | 2016-11-01 | 2019-09-11 | Novartis AG | Methods and compositions for enhancing gene editing |
CA3042259A1 (en) | 2016-11-04 | 2018-05-11 | Flagship Pioneering Innovations V. Inc. | Novel plant cells, plants, and seeds |
KR20190082318A (ko) | 2016-11-22 | 2019-07-09 | 인티그레이티드 디엔에이 테크놀로지스 아이엔씨. | Crispr/cpf1 시스템 및 방법 |
US9816093B1 (en) | 2016-12-06 | 2017-11-14 | Caribou Biosciences, Inc. | Engineered nucleic acid-targeting nucleic acids |
WO2018111947A1 (en) | 2016-12-12 | 2018-06-21 | Integrated Dna Technologies, Inc. | Genome editing enhancement |
JP7317706B2 (ja) | 2016-12-14 | 2023-07-31 | リガンダル インコーポレイテッド | 核酸およびタンパク質ペイロード送達のための方法および組成物 |
US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10550429B2 (en) | 2016-12-22 | 2020-02-04 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
EP3573448A4 (en) | 2017-01-28 | 2020-09-02 | Inari Agriculture, Inc. | NEW PLANT CELLS, PLANTS AND SEEDS |
CN110214186B (zh) | 2017-01-30 | 2023-11-24 | 10X基因组学有限公司 | 用于基于微滴的单细胞条形编码的方法和系统 |
TW201839136A (zh) | 2017-02-06 | 2018-11-01 | 瑞士商諾華公司 | 治療血色素異常症之組合物及方法 |
US10995333B2 (en) | 2017-02-06 | 2021-05-04 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation |
WO2018148511A1 (en) | 2017-02-10 | 2018-08-16 | Zymergen Inc. | A modular universal plasmid design strategy for the assembly and editing of multiple dna constructs for multiple hosts |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
EP3596217A1 (en) | 2017-03-14 | 2020-01-22 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
EP4361261A2 (en) | 2017-03-15 | 2024-05-01 | The Broad Institute Inc. | Novel cas13b orthologues crispr enzymes and systems |
WO2018170515A1 (en) | 2017-03-17 | 2018-09-20 | The Broad Institute, Inc. | Methods for identifying and modulating co-occurant cellular phenotypes |
IL306092A (en) | 2017-03-23 | 2023-11-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
WO2018183908A1 (en) | 2017-03-31 | 2018-10-04 | Dana-Farber Cancer Institute, Inc. | Compositions and methods for treating ovarian tumors |
WO2018183921A1 (en) | 2017-04-01 | 2018-10-04 | The Broad Institute, Inc. | Methods and compositions for detecting and modulating an immunotherapy resistance gene signature in cancer |
US20210115407A1 (en) | 2017-04-12 | 2021-04-22 | The Broad Institute, Inc. | Respiratory and sweat gland ionocytes |
US20200071773A1 (en) | 2017-04-12 | 2020-03-05 | Massachusetts Eye And Ear Infirmary | Tumor signature for metastasis, compositions of matter methods of use thereof |
BR112019021378A2 (pt) | 2017-04-12 | 2020-05-05 | Massachusetts Inst Technology | ortólogos de crispr tipo vi inovadores e sistemas |
US20200405639A1 (en) | 2017-04-14 | 2020-12-31 | The Broad Institute, Inc. | Novel delivery of large payloads |
MX2019012398A (es) | 2017-04-18 | 2020-09-25 | Broad Inst Inc | Composiciones para detectar secreciones y metodos de uso. |
WO2018195486A1 (en) | 2017-04-21 | 2018-10-25 | The Broad Institute, Inc. | Targeted delivery to beta cells |
CN110799525A (zh) | 2017-04-21 | 2020-02-14 | 通用医疗公司 | 具有改变的PAM特异性的CPF1(CAS12a)的变体 |
EP3615672A1 (en) | 2017-04-28 | 2020-03-04 | Editas Medicine, Inc. | Methods and systems for analyzing guide rna molecules |
US11591601B2 (en) | 2017-05-05 | 2023-02-28 | The Broad Institute, Inc. | Methods for identification and modification of lncRNA associated with target genotypes and phenotypes |
JP7235391B2 (ja) * | 2017-05-08 | 2023-03-08 | ツールゲン インコーポレイテッド | 人工的に操作された免疫細胞 |
EP3622070A2 (en) | 2017-05-10 | 2020-03-18 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
AU2018270088B2 (en) | 2017-05-18 | 2024-05-16 | Massachusetts Institute Of Technology | Systems, methods, and compositions for targeted nucleic acid editing |
CA3063449A1 (en) | 2017-05-25 | 2018-11-29 | The General Hospital Corporation | Using split deaminases to limit unwanted off-target base editor deamination |
WO2018218135A1 (en) | 2017-05-25 | 2018-11-29 | The Children's Medical Center Corporation | Bcl11a guide delivery |
US20180340169A1 (en) | 2017-05-26 | 2018-11-29 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
CN109526228B (zh) | 2017-05-26 | 2022-11-25 | 10X基因组学有限公司 | 转座酶可接近性染色质的单细胞分析 |
EP3409104A1 (en) | 2017-05-31 | 2018-12-05 | Vilmorin et Cie | Tomato plant resistant to tomato yellow leaf curl virus, powdery mildew, and nematodes |
EP3409106A1 (en) | 2017-06-01 | 2018-12-05 | Vilmorin et Cie | Tolerance in plants of solanum lycopersicum to the tobamovirus tomato brown rugose fruit virus (tbrfv) |
WO2020249996A1 (en) | 2019-06-14 | 2020-12-17 | Vilmorin & Cie | Resistance in plants of solanum lycopersicum to the tobamovirus tomato brown rugose fruit virus |
WO2018226762A1 (en) | 2017-06-05 | 2018-12-13 | Fred Hutchinson Cancer Research Center | Genomic safe harbors for genetic therapies in human stem cells and engineered nanoparticles to provide targeted genetic therapies |
US20200370058A1 (en) | 2017-06-06 | 2020-11-26 | Zymergen Inc. | A htp genomic engineering platform for improving escherichia coli |
CA3061984A1 (en) | 2017-06-06 | 2018-12-13 | Zymergen Inc. | A htp genomic engineering platform for improving fungal strains |
US10428319B2 (en) | 2017-06-09 | 2019-10-01 | Editas Medicine, Inc. | Engineered Cas9 nucleases |
RU2020100074A (ru) | 2017-06-13 | 2021-08-03 | Флэгшип Пайониринг Инновейшнз V, Инк. | Композиции, содержащие куроны, и пути их применения |
WO2018232195A1 (en) | 2017-06-14 | 2018-12-20 | The Broad Institute, Inc. | Compositions and methods targeting complement component 3 for inhibiting tumor growth |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
JP7454494B2 (ja) | 2017-06-26 | 2024-03-22 | ザ・ブロード・インスティテュート・インコーポレイテッド | 標的化された核酸編集のためのcrispr/cas-アデニンデアミナーゼ系の組成物、系及び方法 |
WO2019003193A1 (en) | 2017-06-30 | 2019-01-03 | Novartis Ag | METHODS FOR TREATING DISEASES USING GENE EDITING SYSTEMS |
EP3645021A4 (en) | 2017-06-30 | 2021-04-21 | Intima Bioscience, Inc. | ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY |
WO2019011118A1 (zh) * | 2017-07-14 | 2019-01-17 | 苏州克睿基因生物科技有限公司 | 一种基因编辑系统及基因编辑的方法 |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11286468B2 (en) | 2017-08-23 | 2022-03-29 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases with altered PAM specificity |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
CA3073848A1 (en) | 2017-09-21 | 2019-03-28 | The Broad Institute, Inc. | Systems, methods, and compositions for targeted nucleic acid editing |
EP3684389A4 (en) | 2017-09-21 | 2021-06-16 | Dana Farber Cancer Institute, Inc. | INSULATION, PRESERVATION, COMPOSITIONS AND USES OF EXTRACTS FROM JUSTICIA PLANTS |
US20200255828A1 (en) | 2017-10-04 | 2020-08-13 | The Broad Institute, Inc. | Methods and compositions for altering function and structure of chromatin loops and/or domains |
US11725228B2 (en) | 2017-10-11 | 2023-08-15 | The General Hospital Corporation | Methods for detecting site-specific and spurious genomic deamination induced by base editing technologies |
US11680296B2 (en) | 2017-10-16 | 2023-06-20 | Massachusetts Institute Of Technology | Mycobacterium tuberculosis host-pathogen interaction |
JP2021500036A (ja) | 2017-10-16 | 2021-01-07 | ザ ブロード インスティテュート, インコーポレーテッドThe Broad Institute, Inc. | アデノシン塩基編集因子の使用 |
JP7383607B2 (ja) | 2017-10-20 | 2023-11-20 | フレッド ハッチンソン キャンサー センター | 選択された抗体を発現するように遺伝子改変されたb細胞を産生するシステム及び方法 |
WO2019089803A1 (en) | 2017-10-31 | 2019-05-09 | The Broad Institute, Inc. | Methods and compositions for studying cell evolution |
US20210180053A1 (en) | 2017-11-01 | 2021-06-17 | Novartis Ag | Synthetic rnas and methods of use |
WO2019084664A1 (en) * | 2017-11-02 | 2019-05-09 | The Governors Of The University Of Alberta | Chemically-modified guide rnas to improve crispr-cas protein specificity |
EP3710039A4 (en) | 2017-11-13 | 2021-08-04 | The Broad Institute, Inc. | METHODS AND COMPOSITIONS FOR CANCER TREATMENT BY TARGETING THE CLEC2D-KLRB1 PATH |
WO2019099751A1 (en) | 2017-11-15 | 2019-05-23 | 10X Genomics, Inc. | Functionalized gel beads |
US20210180059A1 (en) * | 2017-11-16 | 2021-06-17 | Astrazeneca Ab | Compositions and methods for improving the efficacy of cas9-based knock-in strategies |
US20200277573A1 (en) | 2017-11-17 | 2020-09-03 | Iovance Biotherapeutics, Inc. | Til expansion from fine needle aspirates and small biopsies |
US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
JP2021503885A (ja) | 2017-11-22 | 2021-02-15 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 末梢血からの末梢血リンパ球(pbl)の拡大培養 |
WO2019113506A1 (en) | 2017-12-07 | 2019-06-13 | The Broad Institute, Inc. | Methods and compositions for multiplexing single cell and single nuclei sequencing |
WO2019126037A1 (en) | 2017-12-19 | 2019-06-27 | City Of Hope | Modified tracrrnas grnas, and uses thereof |
RU2652899C1 (ru) * | 2017-12-28 | 2018-05-03 | Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) | РНК-проводники для подавления репликации вируса гепатита B и для элиминации вируса гепатита B из клетки-хозяина |
US11994512B2 (en) | 2018-01-04 | 2024-05-28 | Massachusetts Institute Of Technology | Single-cell genomic methods to generate ex vivo cell systems that recapitulate in vivo biology with improved fidelity |
CN111566121A (zh) | 2018-01-12 | 2020-08-21 | 巴斯夫欧洲公司 | 小麦7a染色体上决定每穗小穗数QTL的基因 |
IL276082B2 (en) | 2018-01-17 | 2024-01-01 | Vertex Pharma | DNA-PK inhibitor compounds, preparations containing them and their uses |
CN111770921B (zh) | 2018-01-17 | 2024-03-22 | 沃泰克斯药物股份有限公司 | 用于提高基因组编辑效率的喹喔啉酮化合物,组合物,方法和试剂盒 |
EA202091708A1 (ru) | 2018-01-17 | 2020-11-10 | Вертекс Фармасьютикалз Инкорпорейтед | Ингибиторы днк-пк |
US20190233816A1 (en) | 2018-01-26 | 2019-08-01 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide rna and its applications |
US11926835B1 (en) | 2018-01-29 | 2024-03-12 | Inari Agriculture Technology, Inc. | Methods for efficient tomato genome editing |
WO2019150203A1 (en) | 2018-02-05 | 2019-08-08 | Crispr Therapeutics Ag | Materials and methods for treatment of hemoglobinopathies |
EP3749767A1 (en) | 2018-02-05 | 2020-12-16 | Vertex Pharmaceuticals Incorporated | Materials and methods for treatment of hemoglobinopathies |
CN111699254A (zh) | 2018-02-08 | 2020-09-22 | 齐默尔根公司 | 使用crispr在棒状杆菌属中进行基因组编辑 |
WO2019157529A1 (en) | 2018-02-12 | 2019-08-15 | 10X Genomics, Inc. | Methods characterizing multiple analytes from individual cells or cell populations |
PL235163B1 (pl) * | 2018-04-05 | 2020-06-01 | Inst Hodowli I Aklimatyzacji Roslin Panstwowy Inst Badawczy | Sekwencja nukleotydowa syntetycznego genu Cas9, kaseta kierująca sgRNA do edytowania genomu roślinnego i wydajny system do ukierunkowanej mutagenezy wybranego regionu genomu roślinnego |
CA3096274A1 (en) | 2018-04-06 | 2019-10-10 | Children's Medical Center Corporation | Compositions and methods for somatic cell reprogramming and modulating imprinting |
EP3775271A1 (en) | 2018-04-06 | 2021-02-17 | 10X Genomics, Inc. | Systems and methods for quality control in single cell processing |
WO2019204378A1 (en) | 2018-04-17 | 2019-10-24 | The General Hospital Corporation | Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents |
WO2019204585A1 (en) | 2018-04-19 | 2019-10-24 | Massachusetts Institute Of Technology | Single-stranded break detection in double-stranded dna |
SG11202009783WA (en) | 2018-04-19 | 2020-11-27 | Univ California | Compositions and methods for gene editing |
ES2922902T3 (es) | 2018-04-24 | 2022-09-21 | Kws Saat Se & Co Kgaa | Plantas con digestibilidad mejorada y haplotipos marcadores |
US11957695B2 (en) | 2018-04-26 | 2024-04-16 | The Broad Institute, Inc. | Methods and compositions targeting glucocorticoid signaling for modulating immune responses |
SG11202010319RA (en) | 2018-04-27 | 2020-11-27 | Iovance Biotherapeutics Inc | Closed process for expansion and gene editing of tumor infiltrating lymphocytes and uses of same in immunotherapy |
WO2019210268A2 (en) | 2018-04-27 | 2019-10-31 | The Broad Institute, Inc. | Sequencing-based proteomics |
JP2021522385A (ja) | 2018-04-27 | 2021-08-30 | ジーンエディット インコーポレイテッド | カチオン性ポリマーおよびその生体分子送達のための使用 |
WO2019213273A1 (en) * | 2018-05-01 | 2019-11-07 | The Children's Medical Center Corporation | Enhanced bcl11a rnp / crispr delivery & editing using a 3xnls-cas9 |
US20210386829A1 (en) | 2018-05-04 | 2021-12-16 | The Broad Institute, Inc. | Compositions and methods for modulating cgrp signaling to regulate innate lymphoid cell inflammatory responses |
JP2021523745A (ja) | 2018-05-16 | 2021-09-09 | シンテゴ コーポレイション | ガイドrna設計および使用のための方法およびシステム |
CN108707628B (zh) * | 2018-05-28 | 2021-11-23 | 上海海洋大学 | 斑马鱼notch2基因突变体的制备方法 |
WO2019232542A2 (en) | 2018-06-01 | 2019-12-05 | Massachusetts Institute Of Technology | Methods and compositions for detecting and modulating microenvironment gene signatures from the csf of metastasis patients |
US11866719B1 (en) | 2018-06-04 | 2024-01-09 | Inari Agriculture Technology, Inc. | Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants |
BR112020024979A2 (pt) | 2018-06-07 | 2021-04-20 | The Brigham And Women's Hospital, Inc. | métodos para geração de células-tronco hematopoiéticas |
EP3806888B1 (en) | 2018-06-12 | 2024-01-31 | Obsidian Therapeutics, Inc. | Pde5 derived regulatory constructs and methods of use in immunotherapy |
JP2021528975A (ja) | 2018-06-26 | 2021-10-28 | ザ・ブロード・インスティテュート・インコーポレイテッド | Crispr/cas及びトランスポザーゼを利用した増幅用の組成物、システム、及び方法 |
MX2020013836A (es) | 2018-06-26 | 2021-05-27 | Massachusetts Inst Technology | Métodos, sistemas y diagnósticos de amplificación basados en el sistema efector crispr. |
EP3814369A1 (en) | 2018-06-29 | 2021-05-05 | Stichting Het Nederlands Kanker Instituut- Antoni van Leeuwenhoek Ziekenhuis | Tweak-receptor agonists for use in combination with immunotherapy of a cancer |
WO2020014528A1 (en) | 2018-07-13 | 2020-01-16 | The Regents Of The University Of California | Retrotransposon-based delivery vehicle and methods of use thereof |
US20200032335A1 (en) | 2018-07-27 | 2020-01-30 | 10X Genomics, Inc. | Systems and methods for metabolome analysis |
SG11202102068TA (en) | 2018-07-31 | 2021-03-30 | Broad Inst Inc | Novel crispr enzymes and systems |
WO2020028729A1 (en) | 2018-08-01 | 2020-02-06 | Mammoth Biosciences, Inc. | Programmable nuclease compositions and methods of use thereof |
CA3106035A1 (en) | 2018-08-07 | 2020-02-13 | The Broad Institute, Inc. | Cas12b enzymes and systems |
EP3607819A1 (en) | 2018-08-10 | 2020-02-12 | Vilmorin et Cie | Resistance to xanthomonas campestris pv. campestris (xcc) in cauliflower |
WO2020086144A2 (en) | 2018-08-15 | 2020-04-30 | Zymergen Inc. | APPLICATIONS OF CRISPRi IN HIGH THROUGHPUT METABOLIC ENGINEERING |
US20210324357A1 (en) | 2018-08-20 | 2021-10-21 | The Brigham And Women's Hospital, Inc. | Degradation domain modifications for spatio-temporal control of rna-guided nucleases |
US20210317429A1 (en) | 2018-08-20 | 2021-10-14 | The Broad Institute, Inc. | Methods and compositions for optochemical control of crispr-cas9 |
WO2020041751A1 (en) * | 2018-08-23 | 2020-02-27 | The Broad Institute, Inc. | Cas9 variants having non-canonical pam specificities and uses thereof |
JP2021536229A (ja) | 2018-08-23 | 2021-12-27 | サンガモ セラピューティクス, インコーポレイテッド | 操作された標的特異的な塩基エディター |
US11479762B1 (en) | 2018-08-31 | 2022-10-25 | Inari Agriculture Technology, Inc. | Compositions, systems, and methods for genome editing |
WO2020051507A1 (en) | 2018-09-06 | 2020-03-12 | The Broad Institute, Inc. | Nucleic acid assemblies for use in targeted delivery |
EP4268831A3 (en) | 2018-09-12 | 2024-05-22 | Fred Hutchinson Cancer Center | Reducing cd33 expression to selectively protect therapeutic cells |
US20220088224A1 (en) | 2018-09-18 | 2022-03-24 | Vnv Newco Inc. | Arc-based capsids and uses thereof |
WO2020069029A1 (en) | 2018-09-26 | 2020-04-02 | Emendobio Inc. | Novel crispr nucleases |
US20220411783A1 (en) | 2018-10-12 | 2022-12-29 | The Broad Institute, Inc. | Method for extracting nuclei or whole cells from formalin-fixed paraffin-embedded tissues |
WO2020081730A2 (en) | 2018-10-16 | 2020-04-23 | Massachusetts Institute Of Technology | Methods and compositions for modulating microenvironment |
WO2020086910A1 (en) | 2018-10-24 | 2020-04-30 | Genedit Inc. | Cationic polymer with alkyl side chains and use for biomolecule delivery |
WO2020086742A1 (en) | 2018-10-24 | 2020-04-30 | Obsidian Therapeutics, Inc. | Er tunable protein regulation |
US11407995B1 (en) | 2018-10-26 | 2022-08-09 | Inari Agriculture Technology, Inc. | RNA-guided nucleases and DNA binding proteins |
KR20210088615A (ko) | 2018-10-31 | 2021-07-14 | 지머젠 인코포레이티드 | Dna 라이브러리의 다중 결정적 어셈블리 |
WO2020089448A1 (en) * | 2018-11-01 | 2020-05-07 | Keygene N.V. | Dual guide rna for crispr/cas genome editing in plants cells |
US11434477B1 (en) | 2018-11-02 | 2022-09-06 | Inari Agriculture Technology, Inc. | RNA-guided nucleases and DNA binding proteins |
MX2021004775A (es) | 2018-11-05 | 2021-06-08 | Iovance Biotherapeutics Inc | Expansion de linfocitos infiltrantes de tumores (tils) usando inhibidores de la via de proteina cinasa b (akt). |
JP2022512915A (ja) | 2018-11-05 | 2022-02-07 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 改良された腫瘍反応性t細胞の選択 |
EP3877513A2 (en) | 2018-11-05 | 2021-09-15 | Iovance Biotherapeutics, Inc. | Processes for production of tumor infiltrating lymphocytes and uses of the same in immunotherapy |
JP2022512899A (ja) | 2018-11-05 | 2022-02-07 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 抗pd-1抗体に対して不応性のnsclc患者の治療 |
SG11202104560XA (en) | 2018-11-08 | 2021-05-28 | Triton Algae Innovations Inc | Methods for overproducing protoporphyrin ix in algae and compositions therefrom |
US11459607B1 (en) | 2018-12-10 | 2022-10-04 | 10X Genomics, Inc. | Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes |
US11166996B2 (en) | 2018-12-12 | 2021-11-09 | Flagship Pioneering Innovations V, Inc. | Anellovirus compositions and methods of use |
CA3117228A1 (en) | 2018-12-14 | 2020-06-18 | Pioneer Hi-Bred International, Inc. | Novel crispr-cas systems for genome editing |
CA3124110A1 (en) | 2018-12-17 | 2020-06-25 | The Broad Institute, Inc. | Crispr-associated transposase systems and methods of use thereof |
WO2020131586A2 (en) | 2018-12-17 | 2020-06-25 | The Broad Institute, Inc. | Methods for identifying neoantigens |
CA3123392A1 (en) | 2018-12-19 | 2020-06-25 | Iovance Biotherapeutics, Inc. | Methods of expanding tumor infiltrating lymphocytes using engineered cytokine receptor pairs and uses thereof |
EP3931313A2 (en) | 2019-01-04 | 2022-01-05 | Mammoth Biosciences, Inc. | Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection |
US11739156B2 (en) | 2019-01-06 | 2023-08-29 | The Broad Institute, Inc. Massachusetts Institute of Technology | Methods and compositions for overcoming immunosuppression |
US11845983B1 (en) | 2019-01-09 | 2023-12-19 | 10X Genomics, Inc. | Methods and systems for multiplexing of droplet based assays |
WO2020160044A1 (en) | 2019-01-28 | 2020-08-06 | The Broad Institute, Inc. | In-situ spatial transcriptomics |
US11946040B2 (en) | 2019-02-04 | 2024-04-02 | The General Hospital Corporation | Adenine DNA base editor variants with reduced off-target RNA editing |
WO2020163379A1 (en) | 2019-02-05 | 2020-08-13 | Emendobio Inc. | Crispr compositions and methods for promoting gene editing of ribosomal protein s19 (rps19) gene |
US20220145330A1 (en) | 2019-02-10 | 2022-05-12 | The J. David Gladstone Institutes, a testamentary trust established under the Will of J. David Glads | Modified mitochondrion and methods of use thereof |
US11851683B1 (en) | 2019-02-12 | 2023-12-26 | 10X Genomics, Inc. | Methods and systems for selective analysis of cellular samples |
WO2020180733A1 (en) | 2019-03-01 | 2020-09-10 | Iovance Biotherapeutics, Inc. | Expansion of tumor infiltrating lymphocytes from liquid tumors and therapeutic uses thereof |
MX2021010559A (es) | 2019-03-07 | 2021-12-15 | Univ California | Polipéptidos efectores de crispr-cas y métodos de uso de estos. |
WO2020185590A1 (en) | 2019-03-08 | 2020-09-17 | Zymergen Inc. | Iterative genome editing in microbes |
CN113966397A (zh) | 2019-03-08 | 2022-01-21 | 黑曜石疗法公司 | 人碳酸酐酶2组合物和用于可调调节的方法 |
US11053515B2 (en) | 2019-03-08 | 2021-07-06 | Zymergen Inc. | Pooled genome editing in microbes |
AU2020242032A1 (en) | 2019-03-19 | 2021-10-07 | Massachusetts Institute Of Technology | Methods and compositions for editing nucleotide sequences |
US20220162649A1 (en) | 2019-04-01 | 2022-05-26 | The Broad Institute, Inc. | Novel nucleic acid modifiers |
CA3136061A1 (en) | 2019-04-05 | 2020-10-08 | Osaka University | Method for producing knock-in cell |
WO2020219776A1 (en) | 2019-04-23 | 2020-10-29 | Genedit Inc. | Cationic polymer with alkyl side chains |
WO2020229533A1 (en) | 2019-05-13 | 2020-11-19 | KWS SAAT SE & Co. KGaA | Drought tolerance in corn |
WO2020232029A1 (en) | 2019-05-13 | 2020-11-19 | Iovance Biotherapeutics, Inc. | Methods and compositions for selecting tumor infiltrating lymphocytes and uses of the same in immunotherapy |
US20220220469A1 (en) | 2019-05-20 | 2022-07-14 | The Broad Institute, Inc. | Non-class i multi-component nucleic acid targeting systems |
WO2020236967A1 (en) | 2019-05-20 | 2020-11-26 | The Broad Institute, Inc. | Random crispr-cas deletion mutant |
AR118995A1 (es) | 2019-05-25 | 2021-11-17 | Kws Saat Se & Co Kgaa | Mejorador de la inducción de haploides |
WO2020243370A1 (en) | 2019-05-28 | 2020-12-03 | Genedit Inc. | Polymer comprising multiple functionalized sidechains for biomolecule delivery |
WO2020243661A1 (en) | 2019-05-31 | 2020-12-03 | The Broad Institute, Inc. | Methods for treating metabolic disorders by targeting adcy5 |
WO2020254850A1 (en) | 2019-06-21 | 2020-12-24 | Vilmorin & Cie | Improvement of quality and permanence of green color of peppers at maturity and over-maturity |
MX2021014861A (es) | 2019-06-25 | 2022-06-22 | Inari Agriculture Tech Inc | Edicion genomica de reparacion dependiente de homologia mejorada. |
MX2021015433A (es) | 2019-07-02 | 2022-06-08 | Hutchinson Fred Cancer Res | Vectores ad35 recombinantes y mejoras de la terapia génica relacionadas. |
WO2021019272A1 (en) | 2019-07-31 | 2021-02-04 | Vilmorin & Cie | Tolerance to tolcndv in cucumber |
EP3772542A1 (en) | 2019-08-07 | 2021-02-10 | KWS SAAT SE & Co. KGaA | Modifying genetic variation in crops by modulating the pachytene checkpoint protein 2 |
WO2021028359A1 (en) | 2019-08-09 | 2021-02-18 | Sangamo Therapeutics France | Controlled expression of chimeric antigen receptors in t cells |
US20220298501A1 (en) | 2019-08-30 | 2022-09-22 | The Broad Institute, Inc. | Crispr-associated mu transposase systems |
MX2022002663A (es) | 2019-09-05 | 2022-04-07 | Crispr Therapeutics Ag | Celulas donantes universales. |
EP4025690A1 (en) | 2019-09-05 | 2022-07-13 | CRISPR Therapeutics AG | Universal donor cells |
WO2021046451A1 (en) | 2019-09-06 | 2021-03-11 | Obsidian Therapeutics, Inc. | Compositions and methods for dhfr tunable protein regulation |
EP4031660A1 (en) | 2019-09-20 | 2022-07-27 | The Broad Institute, Inc. | Novel type vi crispr enzymes and systems |
AU2020355000A1 (en) | 2019-09-23 | 2022-03-17 | Omega Therapeutics, Inc. | Compositions and methods for modulating apolipoprotein B (APOB) gene expression |
CN114729376A (zh) | 2019-09-23 | 2022-07-08 | 欧米茄治疗公司 | 用于调节肝细胞核因子4α(HNF4α)基因表达的组合物和方法 |
US11981922B2 (en) | 2019-10-03 | 2024-05-14 | Dana-Farber Cancer Institute, Inc. | Methods and compositions for the modulation of cell interactions and signaling in the tumor microenvironment |
AU2020366566A1 (en) | 2019-10-17 | 2022-04-21 | KWS SAAT SE & Co. KGaA | Enhanced disease resistance of crops by downregulation of repressor genes |
JP2022553389A (ja) | 2019-10-25 | 2022-12-22 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 腫瘍浸潤リンパ球の遺伝子編集及び免疫療法におけるその使用 |
GB201916020D0 (en) | 2019-11-04 | 2019-12-18 | Univ Of Essex Enterprise Limited | Crispr-mediated identification of biotinylated proteins and chromatin regions |
EP4057802A1 (en) | 2019-11-14 | 2022-09-21 | Vilmorin & Cie | Resistance to acidovorax valerianellae in corn salad |
EP4073236A1 (en) | 2019-12-11 | 2022-10-19 | Iovance Biotherapeutics, Inc. | Processes for the production of tumor infiltrating lymphocytes (tils) and methods of using the same |
US20230272429A1 (en) | 2020-01-13 | 2023-08-31 | Sana Biotechnology, Inc. | Modification of blood type antigens |
MX2022008648A (es) | 2020-01-23 | 2022-12-15 | The Children´S Medical Center Corp | Diferenciacion de celulas t sin estroma a partir de celulas madre pluripotentes humanas. |
EP3872190A1 (en) | 2020-02-26 | 2021-09-01 | Antibodies-Online GmbH | A method of using cut&run or cut&tag to validate crispr-cas targeting |
US20230081632A1 (en) | 2020-02-28 | 2023-03-16 | KWS SAAT SE & Co. KGaA | Immature inflorescence meristem editing |
US20240191248A1 (en) | 2020-02-28 | 2024-06-13 | KWS SAAT SE & Co. KGaA | Method for rapid genome modification in recalcitrant plants |
JP2023517326A (ja) | 2020-03-11 | 2023-04-25 | オメガ セラピューティクス, インコーポレイテッド | フォークヘッドボックスp3(foxp3)遺伝子発現をモジュレートするための組成物および方法 |
WO2021202938A1 (en) | 2020-04-03 | 2021-10-07 | Creyon Bio, Inc. | Oligonucleotide-based machine learning |
WO2021216622A1 (en) | 2020-04-21 | 2021-10-28 | Aspen Neuroscience, Inc. | Gene editing of gba1 in stem cells and method of use of cells differentiated therefrom |
WO2021216623A1 (en) | 2020-04-21 | 2021-10-28 | Aspen Neuroscience, Inc. | Gene editing of lrrk2 in stem cells and method of use of cells differentiated therefrom |
CA3176826A1 (en) | 2020-05-04 | 2021-11-11 | Iovance Biotherapeutics, Inc. | Processes for production of tumor infiltrating lymphocytes and uses of the same in immunotherapy |
EP4146797A1 (en) | 2020-05-06 | 2023-03-15 | Orchard Therapeutics (Europe) Limited | Treatment for neurodegenerative diseases |
BR112022022603A2 (pt) | 2020-05-08 | 2023-01-17 | Broad Inst Inc | Métodos e composições para edição simultânea de ambas as fitas de sequência alvo de nucleotídeos de fita dupla |
WO2021239986A1 (en) | 2020-05-29 | 2021-12-02 | KWS SAAT SE & Co. KGaA | Plant haploid induction |
WO2021245435A1 (en) | 2020-06-03 | 2021-12-09 | Vilmorin & Cie | Melon plants resistant to scab disease, aphids and powdery mildew |
MA59015B1 (fr) | 2020-06-05 | 2023-11-30 | Vilmorin & Cie | Résistance des plants de tomate - solanum lycopersicum - au tobrfv |
EP4161552A1 (en) | 2020-06-05 | 2023-04-12 | The Broad Institute, Inc. | Compositions and methods for treating neoplasia |
EP4172340A1 (en) | 2020-06-29 | 2023-05-03 | KWS SAAT SE & Co. KGaA | Boosting homology directed repair in plants |
US20240011030A1 (en) | 2020-08-10 | 2024-01-11 | Novartis Ag | Treatments for retinal degenerative diseases |
IL301846A (en) | 2020-10-02 | 2023-06-01 | Vilmorin & Cie | A hotel with an extended shelf life |
WO2022076606A1 (en) | 2020-10-06 | 2022-04-14 | Iovance Biotherapeutics, Inc. | Treatment of nsclc patients with tumor infiltrating lymphocyte therapies |
US20230372397A1 (en) | 2020-10-06 | 2023-11-23 | Iovance Biotherapeutics, Inc. | Treatment of nsclc patients with tumor infiltrating lymphocyte therapies |
WO2022090224A1 (en) | 2020-10-27 | 2022-05-05 | KWS SAAT SE & Co. KGaA | Use of enhanced pol theta activity for eukaryotic genome engineering |
US20230147779A1 (en) | 2020-10-28 | 2023-05-11 | GeneEdit, Inc. | Polymer with cationic and hydrophobic side chains |
WO2022097663A1 (ja) | 2020-11-06 | 2022-05-12 | エディットフォース株式会社 | FokIヌクレアーゼドメインの変異体 |
WO2022101286A1 (en) | 2020-11-11 | 2022-05-19 | Leibniz-Institut Für Pflanzenbiochemie | Fusion protein for editing endogenous dna of a eukaryotic cell |
EP4001429A1 (en) | 2020-11-16 | 2022-05-25 | Antibodies-Online GmbH | Analysis of crispr-cas binding and cleavage sites followed by high-throughput sequencing (abc-seq) |
IL303102A (en) | 2020-12-03 | 2023-07-01 | Vilmorin & Cie | Tomato plants resistant to TOMMV, TOMV, TMV, TOBRFV and suitable resistant genes |
WO2022133149A1 (en) | 2020-12-17 | 2022-06-23 | Iovance Biotherapeutics, Inc. | Treatment of cancers with tumor infiltrating lymphocytes |
CA3202483A1 (en) | 2020-12-17 | 2022-06-23 | Maria Fardis | Treatment with tumor infiltrating lymphocyte therapies in combination with ctla-4 and pd-1 inhibitors |
CA3204988A1 (en) * | 2020-12-22 | 2022-06-30 | Ensoma, Inc. | Adenoviral serotype 35 helper vectors |
BR112023012460A2 (pt) | 2020-12-23 | 2023-11-07 | Flagship Pioneering Innovations V Inc | Conjunto in vitro de capsídeos de anellovirus que envolvem rna |
JP2024503290A (ja) | 2020-12-31 | 2024-01-25 | クリスパー セラピューティクス アクチェンゲゼルシャフト | ユニバーサルドナー細胞 |
JP2024506557A (ja) | 2021-01-29 | 2024-02-14 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 修飾された腫瘍浸潤リンパ球を作製する方法及び養子細胞療法におけるそれらの使用 |
US20240191191A1 (en) | 2021-03-19 | 2024-06-13 | Iovance Biotherapeutics, Inc. | Methods for infiltrating lymphocyte (til) expansion related to cd39/cd69 selection and gene knockout in tils |
KR20240009393A (ko) | 2021-03-31 | 2024-01-22 | 엔트라다 테라퓨틱스, 인크. | 사이클릭 세포 침투 펩티드 |
WO2022208489A1 (en) | 2021-04-02 | 2022-10-06 | Vilmorin & Cie | Semi-determinate or determinate growth habit trait in cucurbita |
KR20240037185A (ko) | 2021-04-19 | 2024-03-21 | 이오반스 바이오테라퓨틱스, 인크. | 키메라 공동자극 수용체, 케모카인 수용체, 및 세포 면역치료에서의 이의 용도 |
WO2022235929A1 (en) | 2021-05-05 | 2022-11-10 | Radius Pharmaceuticals, Inc. | Animal model having homologous recombination of mouse pth1 receptor |
EP4337261A2 (en) | 2021-05-10 | 2024-03-20 | Entrada Therapeutics, Inc. | Compositions and methods for modulating mrna splicing |
EP4337263A1 (en) | 2021-05-10 | 2024-03-20 | Entrada Therapeutics, Inc. | Compositions and methods for modulating interferon regulatory factor-5 (irf-5) activity |
JP2024518068A (ja) | 2021-05-10 | 2024-04-24 | エントラーダ セラピューティクス,インコーポレイティド | 細胞内治療のための組成物及び方法 |
EP4340850A1 (en) | 2021-05-17 | 2024-03-27 | Iovance Biotherapeutics, Inc. | Pd-1 gene-edited tumor infiltrating lymphocytes and uses of same in immunotherapy |
GB202107057D0 (en) | 2021-05-18 | 2021-06-30 | Univ York | Glycosylation method |
WO2022243437A1 (en) | 2021-05-19 | 2022-11-24 | KWS SAAT SE & Co. KGaA | Sample preparation with oppositely oriented guide polynucleotides |
KR20240031238A (ko) | 2021-06-01 | 2024-03-07 | 아버 바이오테크놀로지스, 인크. | Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도 |
WO2022256448A2 (en) | 2021-06-01 | 2022-12-08 | Artisan Development Labs, Inc. | Compositions and methods for targeting, editing, or modifying genes |
EP4352131A1 (en) | 2021-06-11 | 2024-04-17 | Genedit Inc. | Biodegradable polymer comprising side chains with polyamine and polyalkylene oxide groups |
CA3223311A1 (en) | 2021-06-18 | 2022-12-22 | Andrea BARGHETTI | Compositions and methods for targeting, editing or modifying human genes |
WO2022271818A1 (en) | 2021-06-23 | 2022-12-29 | Entrada Therapeutics, Inc. | Antisense compounds and methods for targeting cug repeats |
EP4367242A2 (en) | 2021-07-07 | 2024-05-15 | Omega Therapeutics, Inc. | Compositions and methods for modulating secreted frizzled receptor protein 1 (sfrp1) gene expression |
CA3226111A1 (en) | 2021-07-22 | 2023-01-26 | Iovance Biotherapeutics, Inc. | Method for cryopreservation of solid tumor fragments |
TW202327631A (zh) | 2021-07-28 | 2023-07-16 | 美商艾歐凡斯生物治療公司 | 利用腫瘤浸潤性淋巴球療法與kras抑制劑組合治療癌症患者 |
CA3221517A1 (en) | 2021-07-30 | 2023-02-02 | Monika KLOIBER-MAITZ | Plants with improved digestibility and marker haplotypes |
IL310564A (en) | 2021-08-06 | 2024-03-01 | Vilmorin & Cie | Resistance to Leveillula Taurica in pepper plant |
KR20240055811A (ko) | 2021-09-10 | 2024-04-29 | 애질런트 테크놀로지스, 인크. | 프라임 편집을 위한 화학적 변형을 갖는 가이드 rna |
EP4166670A1 (en) | 2021-10-18 | 2023-04-19 | KWS SAAT SE & Co. KGaA | Plant-tag-based weeding control |
AR127482A1 (es) | 2021-10-27 | 2024-01-31 | Iovance Biotherapeutics Inc | Sistemas y métodos para coordinar la fabricación de células para inmunoterapia específica de paciente |
WO2023077148A1 (en) | 2021-11-01 | 2023-05-04 | Tome Biosciences, Inc. | Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo |
WO2023081756A1 (en) | 2021-11-03 | 2023-05-11 | The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone | Precise genome editing using retrons |
CA3237410A1 (en) | 2021-11-10 | 2023-05-19 | Friedrich Graf Finck VON FINCKENSTEIN | Methods of expansion treatment utilizing cd8 tumor infiltrating lymphocytes |
WO2023093862A1 (en) | 2021-11-26 | 2023-06-01 | Epigenic Therapeutics Inc. | Method of modulating pcsk9 and uses thereof |
GB202118058D0 (en) | 2021-12-14 | 2022-01-26 | Univ Warwick | Methods to increase yields in crops |
US20230279442A1 (en) | 2021-12-15 | 2023-09-07 | Versitech Limited | Engineered cas9-nucleases and method of use thereof |
TW202342757A (zh) | 2021-12-17 | 2023-11-01 | 美商薩那生物科技公司 | 經修飾副黏液病毒科附著醣蛋白 |
TW202342498A (zh) | 2021-12-17 | 2023-11-01 | 美商薩那生物科技公司 | 經修飾副黏液病毒科融合醣蛋白 |
WO2023118349A1 (en) | 2021-12-21 | 2023-06-29 | Alia Therapeutics Srl | Type ii cas proteins and applications thereof |
WO2023122764A1 (en) | 2021-12-22 | 2023-06-29 | Tome Biosciences, Inc. | Co-delivery of a gene editor construct and a donor template |
CA3240593A1 (en) | 2021-12-23 | 2023-06-29 | Joel D. Richter | Therapeutic treatment for fragile x-associated disorder |
WO2023133595A2 (en) | 2022-01-10 | 2023-07-13 | Sana Biotechnology, Inc. | Methods of ex vivo dosing and administration of lipid particles or viral vectors and related systems and uses |
WO2023141602A2 (en) | 2022-01-21 | 2023-07-27 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2023147488A1 (en) | 2022-01-28 | 2023-08-03 | Iovance Biotherapeutics, Inc. | Cytokine associated tumor infiltrating lymphocytes compositions and methods |
WO2023150518A1 (en) | 2022-02-01 | 2023-08-10 | Sana Biotechnology, Inc. | Cd3-targeted lentiviral vectors and uses thereof |
WO2023150647A1 (en) | 2022-02-02 | 2023-08-10 | Sana Biotechnology, Inc. | Methods of repeat dosing and administration of lipid particles or viral vectors and related systems and uses |
WO2023167882A1 (en) | 2022-03-01 | 2023-09-07 | Artisan Development Labs, Inc. | Composition and methods for transgene insertion |
WO2023194359A1 (en) | 2022-04-04 | 2023-10-12 | Alia Therapeutics Srl | Compositions and methods for treatment of usher syndrome type 2a |
EP4256950A1 (en) | 2022-04-06 | 2023-10-11 | Vilmorin et Cie | Tolerance to cgmmv in cucumber |
WO2023196877A1 (en) | 2022-04-06 | 2023-10-12 | Iovance Biotherapeutics, Inc. | Treatment of nsclc patients with tumor infiltrating lymphocyte therapies |
WO2023201369A1 (en) | 2022-04-15 | 2023-10-19 | Iovance Biotherapeutics, Inc. | Til expansion processes using specific cytokine combinations and/or akti treatment |
WO2023205744A1 (en) | 2022-04-20 | 2023-10-26 | Tome Biosciences, Inc. | Programmable gene insertion compositions |
WO2023215831A1 (en) | 2022-05-04 | 2023-11-09 | Tome Biosciences, Inc. | Guide rna compositions for programmable gene insertion |
WO2023219933A1 (en) | 2022-05-09 | 2023-11-16 | Entrada Therapeutics, Inc. | Compositions and methods for delivery of nucleic acid therapeutics |
WO2023220608A1 (en) | 2022-05-10 | 2023-11-16 | Iovance Biotherapeutics, Inc. | Treatment of cancer patients with tumor infiltrating lymphocyte therapies in combination with an il-15r agonist |
WO2023225410A2 (en) | 2022-05-20 | 2023-11-23 | Artisan Development Labs, Inc. | Systems and methods for assessing risk of genome editing events |
WO2023225670A2 (en) | 2022-05-20 | 2023-11-23 | Tome Biosciences, Inc. | Ex vivo programmable gene insertion |
WO2023230578A2 (en) | 2022-05-25 | 2023-11-30 | Flagship Pioneering Innovations Vii, Llc | Compositions and methods for modulating circulating factors |
WO2023230566A2 (en) | 2022-05-25 | 2023-11-30 | Flagship Pioneering Innovations Vii, Llc | Compositions and methods for modulating cytokines |
WO2023230573A2 (en) | 2022-05-25 | 2023-11-30 | Flagship Pioneering Innovations Vii, Llc | Compositions and methods for modulation of immune responses |
WO2023230549A2 (en) | 2022-05-25 | 2023-11-30 | Flagship Pioneering Innovations Vii, Llc | Compositions and methods for modulation of tumor suppressors and oncogenes |
WO2023230570A2 (en) | 2022-05-25 | 2023-11-30 | Flagship Pioneering Innovations Vii, Llc | Compositions and methods for modulating genetic drivers |
GB2621813A (en) | 2022-06-30 | 2024-02-28 | Univ Newcastle | Preventing disease recurrence in Mitochondrial replacement therapy |
WO2024005864A1 (en) | 2022-06-30 | 2024-01-04 | Inari Agriculture Technology, Inc. | Compositions, systems, and methods for genome editing |
EP4299733A1 (en) | 2022-06-30 | 2024-01-03 | Inari Agriculture Technology, Inc. | Compositions, systems, and methods for genome editing |
EP4299739A1 (en) | 2022-06-30 | 2024-01-03 | Inari Agriculture Technology, Inc. | Compositions, systems, and methods for genome editing |
JP7152094B1 (ja) * | 2022-06-30 | 2022-10-12 | リージョナルフィッシュ株式会社 | tracrRNAユニット、及びゲノム編集方法 |
WO2024005863A1 (en) | 2022-06-30 | 2024-01-04 | Inari Agriculture Technology, Inc. | Compositions, systems, and methods for genome editing |
WO2024020346A2 (en) | 2022-07-18 | 2024-01-25 | Renagade Therapeutics Management Inc. | Gene editing components, systems, and methods of use |
WO2024020587A2 (en) | 2022-07-22 | 2024-01-25 | Tome Biosciences, Inc. | Pleiopluripotent stem cell programmable gene insertion |
WO2024044655A1 (en) | 2022-08-24 | 2024-02-29 | Sana Biotechnology, Inc. | Delivery of heterologous proteins |
WO2024044723A1 (en) | 2022-08-25 | 2024-02-29 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2024042199A1 (en) | 2022-08-26 | 2024-02-29 | KWS SAAT SE & Co. KGaA | Use of paired genes in hybrid breeding |
KR20240034661A (ko) * | 2022-09-06 | 2024-03-14 | 주식회사 툴젠 | 캄필로박터 제주니 유래 Cas9의 가이드 RNA 구조변화를 통한 유전자교정 향상 시스템 |
WO2024056880A2 (en) | 2022-09-16 | 2024-03-21 | Alia Therapeutics Srl | Enqp type ii cas proteins and applications thereof |
WO2024064838A1 (en) | 2022-09-21 | 2024-03-28 | Sana Biotechnology, Inc. | Lipid particles comprising variant paramyxovirus attachment glycoproteins and uses thereof |
WO2024081820A1 (en) | 2022-10-13 | 2024-04-18 | Sana Biotechnology, Inc. | Viral particles targeting hematopoietic stem cells |
WO2024098027A1 (en) | 2022-11-04 | 2024-05-10 | Iovance Biotherapeutics, Inc. | Methods for tumor infiltrating lymphocyte (til) expansion related to cd39/cd103 selection |
WO2024098024A1 (en) | 2022-11-04 | 2024-05-10 | Iovance Biotherapeutics, Inc. | Expansion of tumor infiltrating lymphocytes from liquid tumors and therapeutic uses thereof |
WO2024102434A1 (en) | 2022-11-10 | 2024-05-16 | Senda Biosciences, Inc. | Rna compositions comprising lipid nanoparticles or lipid reconstructed natural messenger packs |
WO2024105162A1 (en) | 2022-11-16 | 2024-05-23 | Alia Therapeutics Srl | Type ii cas proteins and applications thereof |
WO2024112571A2 (en) | 2022-11-21 | 2024-05-30 | Iovance Biotherapeutics, Inc. | Two-dimensional processes for the expansion of tumor infiltrating lymphocytes and therapies therefrom |
WO2024118836A1 (en) | 2022-11-30 | 2024-06-06 | Iovance Biotherapeutics, Inc. | Processes for production of tumor infiltrating lymphocytes with shortened rep step |
WO2024119157A1 (en) | 2022-12-02 | 2024-06-06 | Sana Biotechnology, Inc. | Lipid particles with cofusogens and methods of producing and using the same |
CN115982034B (zh) * | 2022-12-30 | 2023-11-28 | 云舟生物科技(广州)股份有限公司 | 载体构建系统虚拟终端的测试方法、存储介质及电子设备 |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
DE122007000007I2 (de) | 1986-04-09 | 2010-12-30 | Genzyme Corp | Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
US4873316A (en) | 1987-06-23 | 1989-10-10 | Biogen, Inc. | Isolation of exogenous recombinant proteins from the milk of transgenic mammals |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
WO1991017424A1 (en) | 1990-05-03 | 1991-11-14 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US7150982B2 (en) * | 1991-09-09 | 2006-12-19 | Third Wave Technologies, Inc. | RNA detection assays |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7868149B2 (en) | 1999-07-20 | 2011-01-11 | Monsanto Technology Llc | Plant genome sequence and uses thereof |
US6603061B1 (en) | 1999-07-29 | 2003-08-05 | Monsanto Company | Agrobacterium-mediated plant transformation method |
US7033744B2 (en) * | 2001-03-16 | 2006-04-25 | Naoya Kobayashi | Method for proliferating a liver cell, a liver cell obtained thereby, and use thereof |
US20090100536A1 (en) | 2001-12-04 | 2009-04-16 | Monsanto Company | Transgenic plants with enhanced agronomic traits |
KR20080033455A (ko) * | 2005-07-26 | 2008-04-16 | 상가모 바이오사이언스 인코포레이티드 | 외래 핵산 서열의 표적화된 통합 및 발현 |
US9677123B2 (en) * | 2006-03-15 | 2017-06-13 | Siemens Healthcare Diagnostics Inc. | Degenerate nucleobase analogs |
MX2009009071A (es) * | 2007-03-02 | 2009-09-24 | Danisco | Cultivos con resistencia mejorada a fagos. |
US8546553B2 (en) | 2008-07-25 | 2013-10-01 | University Of Georgia Research Foundation, Inc. | Prokaryotic RNAi-like system and methods of use |
US20100076057A1 (en) * | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
US9404098B2 (en) | 2008-11-06 | 2016-08-02 | University Of Georgia Research Foundation, Inc. | Method for cleaving a target RNA using a Cas6 polypeptide |
CA2745031C (en) * | 2008-12-04 | 2018-08-14 | Sangamo Biosciences, Inc. | Genome editing in rats using zinc-finger nucleases |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
US9404099B2 (en) * | 2009-11-27 | 2016-08-02 | Basf Plant Science Company Gmbh | Optimized endonucleases and uses thereof |
US10087431B2 (en) | 2010-03-10 | 2018-10-02 | The Regents Of The University Of California | Methods of generating nucleic acid fragments |
JP5926242B2 (ja) | 2010-05-10 | 2016-05-25 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | エンドリボヌクレアーゼ組成物およびその使用方法 |
EP3156062A1 (en) * | 2010-05-17 | 2017-04-19 | Sangamo BioSciences, Inc. | Novel dna-binding proteins and uses thereof |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
CA2834375C (en) * | 2011-04-27 | 2020-07-14 | Amyris, Inc. | Methods for genomic modification |
WO2012164565A1 (en) | 2011-06-01 | 2012-12-06 | Yeda Research And Development Co. Ltd. | Compositions and methods for downregulating prokaryotic genes |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
MA37663B1 (fr) * | 2012-05-25 | 2019-12-31 | Univ California | Procédés et compositions permettant la modification de l'adn cible dirigée par l'arn et la modulation de la transcription dirigée par l'arn |
KR102182847B1 (ko) * | 2012-10-23 | 2020-11-27 | 주식회사 툴젠 | 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도 |
EP3617309A3 (en) * | 2012-12-06 | 2020-05-06 | Sigma Aldrich Co. LLC | Crispr-based genome modification and regulation |
WO2014093479A1 (en) | 2012-12-11 | 2014-06-19 | Montana State University | Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
US8697359B1 (en) * | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
PT2771468E (pt) * | 2012-12-12 | 2015-06-02 | Harvard College | Engenharia de sistemas, métodos e composições-guia otimizadas para manipulação de sequências |
ES2741951T3 (es) | 2012-12-17 | 2020-02-12 | Harvard College | Modificación por ingeniería genética del genoma humano guiada por ARN |
-
2013
- 2013-12-12 PT PT138185707T patent/PT2771468E/pt unknown
- 2013-12-12 PT PT141703835T patent/PT2784162E/pt unknown
- 2013-12-12 IL IL307735A patent/IL307735A/en unknown
- 2013-12-12 EP EP23193042.1A patent/EP4279588A3/en active Pending
- 2013-12-12 PL PL15154566T patent/PL2921557T3/pl unknown
- 2013-12-12 DK DK13818570.7T patent/DK2771468T3/en active
- 2013-12-12 CN CN201380070567.XA patent/CN105121648B/zh active Active
- 2013-12-12 CA CA2894701A patent/CA2894701A1/en not_active Abandoned
- 2013-12-12 US US14/104,990 patent/US20140242664A1/en not_active Abandoned
- 2013-12-12 MX MX2015007549A patent/MX2015007549A/es unknown
- 2013-12-12 PT PT151545399T patent/PT2896697E/pt unknown
- 2013-12-12 RU RU2015128098A patent/RU2701850C2/ru active
- 2013-12-12 ES ES15154566.2T patent/ES2598115T3/es active Active
- 2013-12-12 EP EP13818570.7A patent/EP2771468B1/en not_active Revoked
- 2013-12-12 IL IL239344A patent/IL239344B2/en unknown
- 2013-12-12 WO PCT/US2013/074819 patent/WO2014093712A1/en active Application Filing
- 2013-12-12 KR KR1020157018614A patent/KR20150105633A/ko not_active Application Discontinuation
- 2013-12-12 ES ES15154539.9T patent/ES2553782T3/es active Active
- 2013-12-12 AU AU2013359123A patent/AU2013359123B2/en active Active
- 2013-12-12 ES ES14170383.5T patent/ES2542015T3/es active Active
- 2013-12-12 JP JP2015547573A patent/JP2016504026A/ja active Pending
- 2013-12-12 PT PT151545662T patent/PT2921557T/pt unknown
- 2013-12-12 ES ES13818570.7T patent/ES2536353T3/es active Active
- 2013-12-12 PL PL13818570T patent/PL2771468T3/pl unknown
- 2013-12-12 CN CN202110406914.8A patent/CN113528577A/zh active Pending
-
2014
- 2014-05-29 US US14/290,575 patent/US8906616B2/en active Active
-
2015
- 2015-03-31 HK HK15103251.1A patent/HK1202586A1/xx not_active IP Right Cessation
- 2015-05-04 US US14/703,511 patent/US20150232882A1/en active Pending
- 2015-05-05 US US14/704,551 patent/US20150247150A1/en active Pending
- 2015-10-02 HK HK15109700.5A patent/HK1209153A1/zh not_active IP Right Cessation
- 2015-10-02 HK HK15109702.3A patent/HK1209154A1/xx not_active IP Right Cessation
- 2015-11-09 HK HK15111023.1A patent/HK1210221A1/xx unknown
-
2016
- 2016-02-15 JP JP2016025710A patent/JP6203879B2/ja active Active
- 2016-03-30 JP JP2016067687A patent/JP6420273B2/ja active Active
- 2016-04-21 HK HK16104577.5A patent/HK1216759A1/zh unknown
- 2016-06-14 JP JP2016117740A patent/JP2016165307A/ja active Pending
- 2016-08-05 US US15/230,025 patent/US20160340662A1/en active Pending
- 2016-10-12 AU AU2016244241A patent/AU2016244241C1/en active Active
-
2017
- 2017-08-30 JP JP2017165304A patent/JP6495395B2/ja active Active
-
2018
- 2018-03-20 JP JP2018053045A patent/JP6726225B2/ja active Active
-
2019
- 2019-03-05 JP JP2019039724A patent/JP6960951B2/ja active Active
- 2019-03-05 JP JP2019039723A patent/JP6960950B2/ja active Active
- 2019-09-13 AU AU2019229420A patent/AU2019229420B2/en active Active
-
2021
- 2021-10-12 JP JP2021167368A patent/JP7198328B2/ja active Active
-
2022
- 2022-06-01 AU AU2022203762A patent/AU2022203762A1/en active Pending
- 2022-12-16 JP JP2022200815A patent/JP2023040015A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019066490A3 (ko) * | 2017-09-28 | 2019-06-27 | 주식회사 툴젠 | 유전자 발현 조절을 위한 인위적인 게놈 조작 |
US11572574B2 (en) | 2017-09-28 | 2023-02-07 | Toolgen Incorporated | Artificial genome manipulation for gene expression regulation |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7198328B2 (ja) | 配列操作のための系、方法および最適化ガイド組成物のエンジニアリング | |
JP7383062B2 (ja) | 配列操作のための最適化されたCRISPR-Cas二重ニッカーゼ系、方法および組成物 | |
JP7090775B2 (ja) | 遺伝子産物の発現を変更するためのCRISPR-Cas系および方法 | |
DK2784162T3 (en) | Design of systems, methods and optimized control manipulations for sequence manipulation | |
JP6395765B2 (ja) | 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化 | |
DK2931898T3 (en) | CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS | |
JP2016521993A (ja) | 配列操作のためのタンデムガイド系、方法および組成物の送達、エンジニアリングおよび最適化 | |
KR20150105635A (ko) | 서열 조작을 위한 crispr-cas 성분 시스템, 방법 및 조성물 | |
JP2020511931A (ja) | 改良された遺伝子編集 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |