KR20220168554A - enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물 - Google Patents
enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물 Download PDFInfo
- Publication number
- KR20220168554A KR20220168554A KR1020220064949A KR20220064949A KR20220168554A KR 20220168554 A KR20220168554 A KR 20220168554A KR 1020220064949 A KR1020220064949 A KR 1020220064949A KR 20220064949 A KR20220064949 A KR 20220064949A KR 20220168554 A KR20220168554 A KR 20220168554A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- lys
- glu
- ile
- ala
- Prior art date
Links
- 238000010362 genome editing Methods 0.000 title claims abstract description 62
- 239000000203 mixture Substances 0.000 title claims abstract description 46
- 230000014509 gene expression Effects 0.000 title claims abstract description 15
- 230000002401 inhibitory effect Effects 0.000 title description 3
- 108090000623 proteins and genes Proteins 0.000 claims description 152
- 108020004414 DNA Proteins 0.000 claims description 132
- 239000002773 nucleotide Substances 0.000 claims description 80
- 125000003729 nucleotide group Chemical group 0.000 claims description 75
- 235000018102 proteins Nutrition 0.000 claims description 57
- 102000004169 proteins and genes Human genes 0.000 claims description 57
- 102000040430 polynucleotide Human genes 0.000 claims description 51
- 108091033319 polynucleotide Proteins 0.000 claims description 51
- 239000002157 polynucleotide Substances 0.000 claims description 51
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 48
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 34
- 238000006467 substitution reaction Methods 0.000 claims description 28
- 235000001014 amino acid Nutrition 0.000 claims description 19
- 102000053602 DNA Human genes 0.000 claims description 13
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 12
- 208000016361 genetic disease Diseases 0.000 claims description 12
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 11
- 230000002068 genetic effect Effects 0.000 claims description 8
- 206010028980 Neoplasm Diseases 0.000 claims description 7
- 239000008194 pharmaceutical composition Substances 0.000 claims description 7
- 208000035143 Bacterial infection Diseases 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 6
- 208000023275 Autoimmune disease Diseases 0.000 claims description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 5
- 208000022362 bacterial infectious disease Diseases 0.000 claims description 5
- 201000011510 cancer Diseases 0.000 claims description 5
- 241000093740 Acidaminococcus sp. Species 0.000 claims description 4
- 208000036142 Viral infection Diseases 0.000 claims description 4
- 235000004279 alanine Nutrition 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 230000009385 viral infection Effects 0.000 claims description 4
- 229910019142 PO4 Inorganic materials 0.000 claims description 3
- 235000003704 aspartic acid Nutrition 0.000 claims description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 3
- 239000010452 phosphate Substances 0.000 claims description 3
- 239000004332 silver Substances 0.000 claims description 3
- 230000006287 biotinylation Effects 0.000 claims description 2
- 238000007413 biotinylation Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 claims description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 6
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Chemical group OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 claims 1
- 230000005764 inhibitory process Effects 0.000 abstract description 4
- 230000001225 therapeutic effect Effects 0.000 abstract description 2
- 238000001415 gene therapy Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 69
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 59
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 54
- 108010068265 aspartyltyrosine Proteins 0.000 description 54
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 51
- 108010048818 seryl-histidine Proteins 0.000 description 51
- 108010061238 threonyl-glycine Proteins 0.000 description 42
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 39
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 39
- 108010034529 leucyl-lysine Proteins 0.000 description 39
- 150000007523 nucleic acids Chemical class 0.000 description 39
- 108010092854 aspartyllysine Proteins 0.000 description 38
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 36
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 36
- 238000003776 cleavage reaction Methods 0.000 description 36
- 230000007017 scission Effects 0.000 description 36
- 230000000694 effects Effects 0.000 description 33
- 102000039446 nucleic acids Human genes 0.000 description 32
- 108020004707 nucleic acids Proteins 0.000 description 32
- 108020005004 Guide RNA Proteins 0.000 description 30
- 108010003700 lysyl aspartic acid Proteins 0.000 description 30
- 108010009298 lysylglutamic acid Proteins 0.000 description 30
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 28
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 27
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 27
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 27
- 108010064235 lysylglycine Proteins 0.000 description 27
- 108010051110 tyrosyl-lysine Proteins 0.000 description 27
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 26
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 26
- 241000880493 Leptailurus serval Species 0.000 description 26
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 26
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 26
- 108010005233 alanylglutamic acid Proteins 0.000 description 26
- 108010070944 alanylhistidine Proteins 0.000 description 26
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 26
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 25
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 25
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 25
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 25
- 230000035772 mutation Effects 0.000 description 25
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 24
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 24
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 24
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 24
- 108010081551 glycylphenylalanine Proteins 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 23
- 150000001413 amino acids Chemical group 0.000 description 23
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 22
- 230000001965 increasing effect Effects 0.000 description 21
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 20
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 19
- 108091033409 CRISPR Proteins 0.000 description 18
- 239000013615 primer Substances 0.000 description 18
- 239000013598 vector Substances 0.000 description 18
- 201000010099 disease Diseases 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 17
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 16
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 16
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 16
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 16
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 16
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 16
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 description 16
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 16
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 15
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 15
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 15
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 15
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 15
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 15
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 15
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 15
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 15
- 229940024606 amino acid Drugs 0.000 description 15
- 108010093581 aspartyl-proline Proteins 0.000 description 15
- 108010078144 glutaminyl-glycine Proteins 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 15
- 230000002829 reductive effect Effects 0.000 description 15
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 15
- 108010020532 tyrosyl-proline Proteins 0.000 description 15
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 14
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 14
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 14
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 14
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 14
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 14
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 14
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 14
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 14
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 14
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 14
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 14
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 14
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 14
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 14
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 14
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 14
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 14
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 14
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 14
- MKWFGXSFLYNTKC-XIRDDKMYSA-N His-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N MKWFGXSFLYNTKC-XIRDDKMYSA-N 0.000 description 14
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 14
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 14
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 14
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 14
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 14
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 14
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 14
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 14
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 14
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 14
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 14
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 14
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 14
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 14
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 14
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 14
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 14
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 14
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 14
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 14
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 14
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 14
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 14
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 14
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 14
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 14
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 14
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 14
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 14
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 14
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 14
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 14
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 14
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 14
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 14
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 14
- FASACHWGQBNSRO-ZEWNOJEFSA-N Tyr-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FASACHWGQBNSRO-ZEWNOJEFSA-N 0.000 description 14
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 14
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 14
- 108010015792 glycyllysine Proteins 0.000 description 14
- 210000005260 human cell Anatomy 0.000 description 14
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 14
- 108010005652 splenotritin Proteins 0.000 description 14
- 108700004896 tripeptide FEG Proteins 0.000 description 14
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 13
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 13
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 13
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 13
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 13
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 13
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 13
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 13
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 13
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 13
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 13
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 13
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 13
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 13
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 13
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 13
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 13
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 13
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 13
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 13
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 13
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 13
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 13
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 13
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 13
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 13
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 13
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 13
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 13
- WZZGXXNRSZIQFC-VGDYDELISA-N Cys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N WZZGXXNRSZIQFC-VGDYDELISA-N 0.000 description 13
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 13
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 13
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 13
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 13
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 13
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 13
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 13
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 13
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 13
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 13
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 13
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 13
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 13
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 13
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 13
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 13
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 13
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 13
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 13
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 13
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 13
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 13
- FBCURAVMSXNOLP-JYJNAYRXSA-N His-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBCURAVMSXNOLP-JYJNAYRXSA-N 0.000 description 13
- YAEKRYQASVCDLK-JYJNAYRXSA-N His-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YAEKRYQASVCDLK-JYJNAYRXSA-N 0.000 description 13
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 13
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 13
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 13
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 13
- FTUZWJVSNZMLPI-RVMXOQNASA-N Ile-Met-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N FTUZWJVSNZMLPI-RVMXOQNASA-N 0.000 description 13
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 13
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 13
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 13
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 13
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 13
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 13
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 13
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 13
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 13
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 13
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 13
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 13
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 13
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 13
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 13
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 13
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 13
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 13
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 13
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 13
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 13
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 13
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 13
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 13
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 13
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 13
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 13
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 13
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 13
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 13
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 13
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 13
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 13
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 13
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 13
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 13
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 13
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 13
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 13
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 13
- YEEFZOKPYOUXMX-KKUMJFAQSA-N Phe-Gln-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YEEFZOKPYOUXMX-KKUMJFAQSA-N 0.000 description 13
- SPXWRYVHOZVYBU-ULQDDVLXSA-N Phe-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N SPXWRYVHOZVYBU-ULQDDVLXSA-N 0.000 description 13
- PHJUFDQVVKVOPU-ULQDDVLXSA-N Phe-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=CC=C1)N PHJUFDQVVKVOPU-ULQDDVLXSA-N 0.000 description 13
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 13
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 13
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 13
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 13
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 13
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 13
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 13
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 13
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 13
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 13
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 13
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 13
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 13
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 13
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 13
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 13
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 13
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 13
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 13
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 13
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 13
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 13
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 13
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 13
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 13
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 13
- XOSGQKFEIOCPIJ-SZMVWBNQSA-N Trp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CNC3=CC=CC=C32)N XOSGQKFEIOCPIJ-SZMVWBNQSA-N 0.000 description 13
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 13
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 13
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 13
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 13
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 13
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 13
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 13
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 13
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 13
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 13
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 13
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 13
- 108010081404 acein-2 Proteins 0.000 description 13
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 13
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 13
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 13
- 108010008355 arginyl-glutamine Proteins 0.000 description 13
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 13
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 13
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 13
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 13
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 13
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 13
- 108010010147 glycylglutamine Proteins 0.000 description 13
- 108010025306 histidylleucine Proteins 0.000 description 13
- 108010092114 histidylphenylalanine Proteins 0.000 description 13
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 13
- 108010054155 lysyllysine Proteins 0.000 description 13
- 108010005942 methionylglycine Proteins 0.000 description 13
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 13
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 13
- 108010003137 tyrosyltyrosine Proteins 0.000 description 13
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 12
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 12
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 12
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 12
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 12
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 12
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 12
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 12
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 12
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 12
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 12
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 12
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 12
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 12
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 12
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 12
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 12
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 12
- HKALUUKHYNEDRS-GUBZILKMSA-N Cys-Leu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HKALUUKHYNEDRS-GUBZILKMSA-N 0.000 description 12
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 12
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 12
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 12
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 12
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 12
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 12
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 12
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 12
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 12
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 12
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 12
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 12
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 12
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 12
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 12
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 12
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 12
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 12
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 12
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 12
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 12
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 12
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 12
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 12
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 12
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 12
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 12
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 12
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 12
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 12
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 12
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 12
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 12
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 12
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 12
- 108010066427 N-valyltryptophan Proteins 0.000 description 12
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 12
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 12
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 12
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 12
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 12
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 12
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 12
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 12
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 12
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 12
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 12
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 12
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 12
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 12
- WKQNLTQSCYXKQK-VFAJRCTISA-N Trp-Lys-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WKQNLTQSCYXKQK-VFAJRCTISA-N 0.000 description 12
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 12
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 12
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 12
- 108010013835 arginine glutamate Proteins 0.000 description 12
- 108010038633 aspartylglutamate Proteins 0.000 description 12
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 12
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 12
- 108010018625 phenylalanylarginine Proteins 0.000 description 12
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 11
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 11
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 11
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 11
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 11
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 11
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 11
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 11
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 11
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 11
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 11
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 11
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 11
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 11
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 11
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 11
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 11
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 11
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 11
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 11
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 11
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 11
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 11
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 11
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 11
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 11
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 11
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 11
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 11
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 11
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 11
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 11
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 11
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 11
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 11
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 11
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 11
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 11
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 11
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 11
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 11
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 11
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 11
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 11
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 11
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 11
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 11
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 11
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 11
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 11
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 11
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 11
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 11
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 11
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 11
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 11
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 11
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 11
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 11
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 11
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 11
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 11
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 11
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 11
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 11
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 11
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 11
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 11
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 11
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 11
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 11
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 11
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 11
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 11
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 11
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 11
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 11
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 11
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 11
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 11
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 11
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 11
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 11
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 11
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 11
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 11
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 11
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 11
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 11
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 11
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 11
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 11
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 11
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 11
- 108010062796 arginyllysine Proteins 0.000 description 11
- 108010060035 arginylproline Proteins 0.000 description 11
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 11
- 108010036413 histidylglycine Proteins 0.000 description 11
- 108010085325 histidylproline Proteins 0.000 description 11
- 108010091871 leucylmethionine Proteins 0.000 description 11
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 11
- 108010070643 prolylglutamic acid Proteins 0.000 description 11
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 10
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 10
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 10
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 10
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 10
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 10
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 10
- 230000027455 binding Effects 0.000 description 10
- 239000000872 buffer Substances 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 108010084389 glycyltryptophan Proteins 0.000 description 10
- 102100031780 Endonuclease Human genes 0.000 description 9
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 9
- 238000005520 cutting process Methods 0.000 description 9
- 108020001507 fusion proteins Proteins 0.000 description 9
- 102000037865 fusion proteins Human genes 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 108010051242 phenylalanylserine Proteins 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 230000007018 DNA scission Effects 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 108091093088 Amplicon Proteins 0.000 description 7
- 238000010354 CRISPR gene editing Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 108700004991 Cas12a Proteins 0.000 description 6
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 230000001915 proofreading effect Effects 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 108020001019 DNA Primers Proteins 0.000 description 5
- 239000003155 DNA primer Substances 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000012636 effector Substances 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 230000009438 off-target cleavage Effects 0.000 description 5
- 102000054765 polymorphisms of proteins Human genes 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 4
- 241000713869 Moloney murine leukemia virus Species 0.000 description 4
- 101710163270 Nuclease Proteins 0.000 description 4
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 4
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 4
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 4
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000010457 gene scissor Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- 102100036664 Adenosine deaminase Human genes 0.000 description 3
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 3
- 208000015943 Coeliac disease Diseases 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 201000000140 Fanconi anemia complementation group T Diseases 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000837581 Homo sapiens Ubiquitin-conjugating enzyme E2 T Proteins 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 3
- 102100028705 Ubiquitin-conjugating enzyme E2 T Human genes 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 238000000246 agarose gel electrophoresis Methods 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 2
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 2
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 2
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 2
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 2
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 2
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 2
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 2
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 2
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 2
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 2
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 2
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 2
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 2
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 2
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 2
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 2
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 2
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 2
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 101710160287 Heterochromatin protein 1 Proteins 0.000 description 2
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 2
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 2
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 2
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 2
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 2
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 2
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 2
- 102000011787 Histone Methyltransferases Human genes 0.000 description 2
- 108010036115 Histone Methyltransferases Proteins 0.000 description 2
- 102000003893 Histone acetyltransferases Human genes 0.000 description 2
- 108090000246 Histone acetyltransferases Proteins 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 2
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 2
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 2
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 2
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 2
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 2
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 2
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 2
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 2
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 2
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 2
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 2
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 2
- ZJSXCIMWLPSTMG-HSCHXYMDSA-N Lys-Trp-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJSXCIMWLPSTMG-HSCHXYMDSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 2
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- CKJACGQPCPMWIT-UFYCRDLUSA-N Phe-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CKJACGQPCPMWIT-UFYCRDLUSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 241000725643 Respiratory syncytial virus Species 0.000 description 2
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 2
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 2
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 2
- RERIQEJUYCLJQI-QRTARXTBSA-N Trp-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERIQEJUYCLJQI-QRTARXTBSA-N 0.000 description 2
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 2
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 2
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 2
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 2
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 2
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 206010064930 age-related macular degeneration Diseases 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 239000003125 aqueous solvent Substances 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000012236 epigenome editing Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 208000002780 macular degeneration Diseases 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 101150039622 so gene Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000004797 therapeutic response Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- OCUSNPIJIZCRSZ-ZTZWCFDHSA-N (2s)-2-amino-3-methylbutanoic acid;(2s)-2-amino-4-methylpentanoic acid;(2s,3s)-2-amino-3-methylpentanoic acid Chemical compound CC(C)[C@H](N)C(O)=O.CC[C@H](C)[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O OCUSNPIJIZCRSZ-ZTZWCFDHSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 208000026872 Addison Disease Diseases 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 206010055128 Autoimmune neutropenia Diseases 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 208000008439 Biliary Liver Cirrhosis Diseases 0.000 description 1
- 208000033222 Biliary cirrhosis primary Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 208000005692 Bloom Syndrome Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 206010008909 Chronic Hepatitis Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 208000006926 Discoid Lupus Erythematosus Diseases 0.000 description 1
- 101150007297 Dnmt1 gene Proteins 0.000 description 1
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 1
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 1
- 102100024692 Double-stranded RNA-specific editase B2 Human genes 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 102100030013 Endoribonuclease Human genes 0.000 description 1
- 108010093099 Endoribonucleases Proteins 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 201000004939 Fanconi anemia Diseases 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- NKSGKPWXSWBRRX-ACZMJKKPSA-N Glu-Asn-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NKSGKPWXSWBRRX-ACZMJKKPSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 208000024869 Goodpasture syndrome Diseases 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 208000003807 Graves Disease Diseases 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 206010019755 Hepatitis chronic active Diseases 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 101000929495 Homo sapiens Adenosine deaminase Proteins 0.000 description 1
- 101000720051 Homo sapiens Adenosine deaminase 2 Proteins 0.000 description 1
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 1
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 1
- 101000686486 Homo sapiens Double-stranded RNA-specific editase B2 Proteins 0.000 description 1
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 description 1
- 101001002657 Homo sapiens Interleukin-2 Proteins 0.000 description 1
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 description 1
- 101000799048 Homo sapiens Probable inactive tRNA-specific adenosine deaminase-like protein 3 Proteins 0.000 description 1
- 101000625338 Homo sapiens Transcriptional adapter 1 Proteins 0.000 description 1
- 101000657352 Homo sapiens Transcriptional adapter 2-alpha Proteins 0.000 description 1
- 101000799160 Homo sapiens tRNA-specific adenosine deaminase 1 Proteins 0.000 description 1
- 101000799057 Homo sapiens tRNA-specific adenosine deaminase 2 Proteins 0.000 description 1
- 101100321817 Human parvovirus B19 (strain HV) 7.5K gene Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- 208000007924 IgA Deficiency Diseases 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- 208000002979 Influenza in Birds Diseases 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 206010024229 Leprosy Diseases 0.000 description 1
- 208000009625 Lesch-Nyhan syndrome Diseases 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 208000003250 Mixed connective tissue disease Diseases 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 206010034277 Pemphigoid Diseases 0.000 description 1
- 201000011152 Pemphigus Diseases 0.000 description 1
- 208000031845 Pernicious anaemia Diseases 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- XBCOOBCTVMMQSC-BVSLBCMMSA-N Phe-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XBCOOBCTVMMQSC-BVSLBCMMSA-N 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- 208000012654 Primary biliary cholangitis Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- 102100034006 Probable inactive tRNA-specific adenosine deaminase-like protein 3 Human genes 0.000 description 1
- 206010037549 Purpura Diseases 0.000 description 1
- 241001672981 Purpura Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 208000034189 Sclerosis Diseases 0.000 description 1
- 206010039915 Selective IgA immunodeficiency Diseases 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 206010062129 Tongue neoplasm Diseases 0.000 description 1
- 208000035317 Total hypoxanthine-guanine phosphoribosyl transferase deficiency Diseases 0.000 description 1
- 102000005747 Transcription Factor RelA Human genes 0.000 description 1
- 108010031154 Transcription Factor RelA Proteins 0.000 description 1
- 102100034777 Transcriptional adapter 2-alpha Human genes 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- 108010056354 Ubiquitin C Proteins 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 206010047642 Vitiligo Diseases 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 206010048218 Xeroderma Diseases 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 201000010275 acute porphyria Diseases 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 206010064097 avian influenza Diseases 0.000 description 1
- 239000013602 bacteriophage vector Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 201000006491 bone marrow cancer Diseases 0.000 description 1
- 208000000594 bullous pemphigoid Diseases 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 201000007455 central nervous system cancer Diseases 0.000 description 1
- 208000025997 central nervous system neoplasm Diseases 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000025302 chronic primary adrenal insufficiency Diseases 0.000 description 1
- 230000007882 cirrhosis Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 208000004921 cutaneous lupus erythematosus Diseases 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 210000002308 embryonic cell Anatomy 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 201000010175 gallbladder cancer Diseases 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 231100000089 gene mutation induction Toxicity 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 230000010224 hepatic metabolism Effects 0.000 description 1
- 208000033552 hepatic porphyria Diseases 0.000 description 1
- 208000006359 hepatoblastoma Diseases 0.000 description 1
- 102000055277 human IL2 Human genes 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 206010021198 ichthyosis Diseases 0.000 description 1
- 150000002460 imidazoles Chemical class 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 201000007156 immunoglobulin alpha deficiency Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 201000001976 pemphigus vulgaris Diseases 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 208000005987 polymyositis Diseases 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 208000029138 selective IgA deficiency disease Diseases 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 102100034113 tRNA-specific adenosine deaminase 1 Human genes 0.000 description 1
- 102100034045 tRNA-specific adenosine deaminase 2 Human genes 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 201000006134 tongue cancer Diseases 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물에 관한 것으로, 기존의 RNA 가이드 대비 인델 효율은 유사하면서도, RNA 가이드 대비 표적 특이성이 우수하므로, 안정성 및 높은 치료 효과를 요구하는 유전자 치료 등에 효과적으로 적용될 수 있다.
Description
본 발명은 enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물에 관한 것이다.
CRISPR-Cas12a(이하, Cpf1)는 class II, type V에 속하는 CRISPR 시스템으로, Cas9 유전자 가위와 마찬가지로 뉴클레아제 도메인과 인식(recognition) 도메인의 bi-lobed 형식의 구조로 이루어져 있으며, 단일 가닥의 crRNA를 이용하여 표적 DNA 이중 나선에 DNA-RNA 하이브리드 듀플렉스(hybrid duplex)를 이루어 바인딩 하는 것으로 알려져 있다. 이러한 Cpf1은 Cas9의 발견 이후 PAM의 제한적인 부분을 보완할 우수한 유전자 가위로 주목받아 왔다. 또한, Cpf1 유전자 가위는 세포 내 유전자 좌의 구아닌(guanine, G)이 많은 영역 이외에 타이민(thymine, T)이 많은 부분을 PAM(TTTN 또는 TTN)으로 인식하여 특이적으로 DNA 이중나선 절단을 유도할 수 있기 때문에, 표적 특이적 유전자 가위로서도 널리 사용되고 있다.
현재까지 Cpf1은 구조적으로 24개 염기의 프로토스페이서(protospacer)를 인식하며, 이중 내부의 seed region이 대략 PAM 염기서열로부터 5 내지 10개 정도인 것으로 알려져 있다. 표적 DNA를 인식하는 과정에서 CRISPR-Cas9보다 미스매치(mismatch)에 민감하여 프로토스페이서 영역의 seed 부분에 미스매치 도입 시, 그 활성이 현저히 저하되는 효과를 보임으로써 표적 특이성이 우수한 유전자 가위로 알려져 왔다. 다만, seed 부분 이외에 생기는 미스매치에 대한 절단 가능성이 여전히 존재하기 때문에, 추후 활성이 더 증가된 Cpf1의 타겟 염기서열을 포함한 DNA 절단 과정에서, 이와 같은 오프-타겟(off-target) 절단(cleavage) 비검측 이슈가 더욱 부각될 수 있다.
한편, CRISPR Nickase는 비표적(타겟을 벗어나는) 유전자에 작용하는 가능성을 줄일 수 있는 매우 유연하고 효율적인 역할을 할 수 있어, 표적 유전자 특이성과 실험의 안전성과 유전자 교정 효율을 높인다고 알려져 있어 위와 관련된 대다수의 관련 시스템에서 보충적으로 이용되고 있다. 그러나, 부차적으로 사용되는 CRISPR nickase는 표적 특이적 교정에 필요한 원래 Cpf1 모듈 이외에 추가로 세포나 조직으로 전달해야 하는 단점이 존재하기 때문에 CRISPR nickase의 도움 없이도 효율적이고 정확한 유전자 교정이 가능한 Cpf1 모듈이 필요한 상황이다.
이에, 본 발명자들은 키메릭 DNA-RNA 가이드를 이용하고 엔지니어링되어 표적 DNA 인식이 향상된 CRISPR-Cas12a(enCpf1)을 이용하여 표적 특이성이 우수하면서도 인델 효율이 개선된 (특히, Nickase의 도움 없이도 인체 유래 세포주내 유전자 교정 효율이 유지됨과 동시에 비표적 특이성이 줄어듦) CRISPR-enCpf1 유전자 가위를 완성하였다.
본 발명의 하나의 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물을 제공하는 것이다.
본 발명의 다른 목적은 상기 유전체 교정용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 유전체 교정용 조성물을 표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여, 유전자 산물의 발현을 변경시키는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 역전사 효소 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 및 상기 enCpf1 단백질과 복합체를 형성하는 프라임 에디팅(prime editing) 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정용 조성물로서, 상기 prime editing 키메릭 DNA-RNA 가이드는 (i) primer binding site, (ii) edit template 및 (iii) homology arm 서열을 포함하는 것인, 유전자 교정용 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 디아미나제 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 및 베이스 에디팅(base editing) 키메릭 DNA-RNA 가이드를 포함하는 유전자 교정용 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 비활성 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 발현 억제용 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 유전체 교정용 조성물을 표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여 유전자 산물의 발현을 변경시킴(여기서, DNA 분자는 돌연변이 서열을 포함한다)으로써, 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료하는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물을 이용한 의약 용도를 제공하는 것이다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 진단용 조성물을 이용한 진단 용도를 제공하는 것이다.
본 발명은 또한 상기 언급된 발명들에 대한 의약, 진단 용도 등을 제공하는 것이다.
본 발명의 일 양상은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물을 제공한다.
본 발명에 따르면, CRISPR-Cas12a(Cpf1) 유전자 가위를 엔지니어링을 통해 표적 인식 효율성이 향상된 enCpf1를 키메릭 DNA-RNA 가이드와 함께 사용하여 표적 특이성의 향상된 장점을 더욱 증진시켜 유전체 교정에 우수한 효과를 나타낸다. 즉, 인델 효율이 개선되며 특히 Nickase의 도움 없이도 인체 유래 세포주 내 유전자 교정 효율이 유지됨과 동시에 비표적 특이성이 줄어든 장점을 가진 측면에서 우수한 효과가 인정될 수 있다.
Cpf1은 Cas9과 대비하여 아래와 같은 장점을 지닐 수 있다:
야생형 Streptococcus pyogenes Cas9에 비하여 인간 세포에 대해 상대적으로 더 큰 Genome-wide 특이성,
T-rich protospacer-adjacent motif (PAM) 서열에 대한 인식,
다중 부위의 동시 표적을 단순화하는 pre-crRNA 처리를 위한 endoribonuclease 활성,
5'-DNA overhang을 생성하는 DNA endonuclease 활성,
PAM으로부터 먼 말단에서 protospacer DNA의 절단,
이러한 장점에 더하여 enCpf1은 표적 범위를 확장할 뿐만 아니라 on-target 활성을 증진시킬 수 있다. 특히, 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드와의 사용은 on-target에 대한 특이도를 크게 증진시킴으로써 우수한 교정 효율을 나타낼 수 있다. 또한, multiplex nuclease targeting, epigenome editing, C-to-T, A-to-G base-editing, prime editing 및 Cpf1-mediated DNA detection 등에서도 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드와의 사용은 보다 더 우수한 효능을 나타낼 수 있다.
즉, Cpf1 단백질은 하나의 crRNA로 작동하기 때문에 Cas9의 경우와 같이 crRNA와 trans-activating crRNA (tracrRNA)를 동시에 사용하거나 인위적으로 tracrRNA와 crRNA를 합친 single guide RNA (sgRNA)를 제작할 필요가 없다. 또한 Cpf1 시스템은 Cas9과 다르게 PAM이 표적 서열의 5' 위치에 존재하고, 표적을 결정하는 guide RNA의 길이도 Cas9에 비해 짧다. 이러한 특징을 활용하면, Cpf1은 Cas9이 사용될 수 없는 표적 염기서열에도 유전체 교정이 가능하고, 가이드 RNA인 crRNA를 제작하는 것도 Cas9과 비교하여 상대적으로 쉽다는 이점을 갖는다. 또한, Cpf1은 표적 DNA가 절단된 위치에 blunt-end가 아닌 5' overhang (sticky end)이 발생시키므로, 보다 정확하고 다양한 유전자 교정이 가능하다는 이점을 갖는다. 본 명세서에서는 enCpf1 시스템을 이용한 보다 편리하면서 정확하고 효과적으로 표적 유전체를 교정하는 기술이 제공된다.
"en (엔지니어링된)"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 본 발명에 따른 "enCpf1"은 야생형과 대비하여 넓은 범위의 PAM을 인지하며 이로써 가이드된 뉴클레아제에 의해 표적될 수 있는 범위를 증가시킬 수 있다.
또한, TTTN PAM이 있는 대상 사이트 인식 및 교정에 우수한 효과를 나타낼 수 있다. 상기 N은 임의의 핵산이 올 수 있으나, 바람직하게는 TTTV (V=A, C 또는 G임)일 수 있다.
즉, genome editing, epigenome editing, prime editing, base editing, 및 in vitro DNA detection 측면에서 증가된 활성을 나타낼 수 있고, 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드와의 사용은 보다 더 우수한 효능을 나타낼 수 있다.
본 발명에 따른 "enCpf1"은 서열번호 1의 아미노산 서열로부터 T167, S170, E174, T539, S542, K548, N551, N552, M604 및 K607로 이루어진 군으로부터 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것일 수 있다.
상기 분리된 "enCpf1"은 Acidaminococcus sp. BV3L6 (AsCpf1)로부터 유래된 enAsCpf1일 수 있다. 즉, Cpf1 분자는 아시다미노콕쿠스 종(Acidaminococcus sp.) 균주 BV3L6 Cpf1 분자(AsCpf1)로부터 유래된 서열에 대한 변이 서열에 해당할 수 있다.
일부 실시양태에서, "enAsCpf1"은 Acidaminococcus sp. BV3L6 (AsCpf1)로부터 유래된 서열번호 1의 아미노산 서열로부터 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상 서열 상동성을 가지는 서열에 대하여 T167, S170, E174, T539, S542, K548, N551, N552, M604 및 K607로 이루어진 군으로부터 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것일 수 있다. 상기 상동성과 관련하여, 상기 아미노산 치환을 포함하는 "enAsCpf1"은 아생형의 활성을 가지고 있는 범주 내에서 보존적 치환을 포함하는 것일 수 있다.
일부 실시양태에서, "enAsCpf1"은 서열번호 1의 아미노산 서열로부터 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상 서열 상동성을 가지는 서열에 대하여 T167A, S170R, S170K, E174K, E174R, T539K, T539R, S542Q, S542K, S542R, K548R, K548V, N551R, N552R, M604A, K607Q, K607R, K607S, 및 K607H로 이루어진 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것일 수 있다.
일부 실시양태에서, 서열번호 1의 아미노산 서열로부터 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상 서열 상동성을 가지는 서열에 대하여 S170R/E174R, E174R/K548R, S170R/K548R, E174R/S542R, S170R/S542R, E174R/S542R/K548R, E174R/N551R, S170R/N551R, S542R/K548R, S542R/N551R, S542R/N552R, K548R/N551R, S170R/S542R/K607R, E174R/S542R/K607R, E174R/S542R/K607H, E174R/S542R/K548R/N551R, S170R/S542R/K548V/N552R, E174R/S542R/K548V/N552R, S170R/S542R/K607R 및 E174R/S542R/K607R로 이루어진 군으로부터 선택되는 어느 하나의 치환을 포함하는 것일 수 있다.
본 발명에 따른 enCpf1 단백질은 필요에 따라 이종 기능적 도메인(heterologous functional domain)과 융합되어 제공될 수 있다. 보다 구체적으로, 융합 단백질의 활성에 영향을 미치지 않는 링커를 선택적으로 포함하여 enCpf1과 heterologous functional domain의 융합 단백질 형태로 제공될 수 있다.
이종 기능적 도메인은 전사 활성화 도메인이다. 일부 실시양태에서, 전사 활성화 도메인은 VP64 또는 NF-κB p65로부터의 것이다. 일부 실시양태에서, 이종 기능적 도메인은 전사 사일런서 또는 전사 저해 도메인이다. 일부 실시양태에서, 전사 저해 도메인은 크뤼펠-연관된 박스 (KRAB) 도메인, ERF 저해인자 도메인 (ERD), 또는 mSin3A 상호작용 도메인 (SID)이다. 일부 실시양태에서, 전사 사일런서는 이질염색질 단백질 1 (HP1), 예를 들어 HP1α 또는 HP1β이다. 일부 실시양태에서, 이종 기능적 도메인은 DNA의 메틸화 상태를 변형시키는 효소이다. 일부 실시양태에서, DNA의 메틸화 상태를 변형시키는 효소는 DNA 메틸트랜스퍼라제 (DNMT) 또는 TET 단백질이다. 일부 실시양태에서, TET 단백질은 TET1이다. 일부 실시양태에서, 이종 기능적 도메인은 히스톤 서브유닛을 변형시키는 효소이다. 일부 실시양태에서, 히스톤 서브유닛을 변형시키는 효소는 히스톤 아세틸트랜스퍼라제 (HAT), 히스톤 디아세틸라제 (HDAC), 히스톤 메틸트랜스퍼라제 (HMT), 또는 히스톤 데메틸라제이다. 일부 실시양태에서, 이종 기능적 도메인은 생물학적 테더이다. 일부 실시양태에서, 생물학적 테더는 MS2, Csy4 또는 람다 N 단백질이다. 일부 실시양태에서, 이종 기능적 도메인은 FokI이다.
일부 실시양태에서, 이종 기능성 도메인은 아데노신 DNA 염기를 변형하는 디아미나제이고, 예를 들어, 디아미나제는 아데노신 디아미나제, 또는 시토신 디아미나제이다. 보다 구체적으로, ADA1, ADA2, ADAR1, ADAR2, ADAR3, ADAT1, ADAT2, ADAT3 및 TadA로부터 선택되는 어느 하나 이상일 수 있다. 이러한 디아미나제와 융합을 통해 베이스 에디터로 기능할 수 있다.
일부 실시양태에서, 이종 기능성 도메인은 역전사 효소(reverse transcriptase)이고, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소, 및/또는 그 변이체일 수 있다. 이때, 상기 역전사 효소가 융합된 경우 프라임 에디터로 기능할 수 있다.
또한, enCpf1 단백질 또는 이종 기능적 도메인(heterologous functional domain)과 융합된 융합 단백질을 암호화하는 DNA를 제공한다.
서열 일치도 또는 상동성은 종래 알려진 표준 기술을 이용하여 측정할 수 있다. 배열은 배열되는 서열에서 갭의 도입을 포함할 것이다. 또한, 여기에 개시된 단백질에 비해 더 많거나 적은 아미노산을 포함하는 서열에 대해, 상동성 비율은 전체 아미노산의 수와 비교하여 상동 아미노산의 수에 근거하여 측정될 것으로 이해된다. 결과적으로, 단백질의 변이체(해당 핵산에 의해 암호화되는 폴리펩타이드를 포함하여)는 서열번호 1의 단백질 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 상동성을 가질 수 있다.
본 발명에서, "치환"은 야생형 핵산, DNA, RNA 또는 펩타이드와 비교하여 각각 다른 DNA, RNA 또는 펩타이드에 의해 하나 이상의 DNA, RNA 또는 펩타이드의 교체에서 비롯된다.
한편, 치환 위치에서 바람직한 아미노산 변이는 잔기의 극성, 전하, 용해성, 소수성, 친수성 및/또는 양친매성 특성의 유사성에 기반하여 수행되는 것일 수 있다. 예를 들어, 이에 한정되는 것은 아니나, 음으로 하전된(negatively charged) 아미노산으로서는 아스파르트산 및 글루타민산을 포함하며; 양으로 하전된(positively charged) 아미노산으로서는 리신 및 아르기닌을 포함하고; 그리고 유사한 친수성값을 가지는 비하전성 극성 헤드기를 가지는 아미노산으로서는 류신, 이소류신 및 발린; 글리신 및 알라닌; 아스파라긴 및 글루타민; 세린, 트레오닌, 페닐알라닌 및 티로신을 들 수 있다. 상기 변이는 보존적 치환을 포함할 수 있다. '보존적 치환'이란, 어느 아미노산이 유사한 특성을 가지는 다른 아미노산으로 치환되어 당업자라면 그 폴리펩타이드의 2차 구조 및 감수성질(hydropathic nature, 소수성 또는 친수성 성질)이 실질적으로 비변화되었다고 예측할 수 있는 치환이다. 일반적으로 하기 아미노산 군이 보존성 변화를 나타낸다: (1) ala, pro, gly, glu, asp, gln, asn, ser, thr; (2) cys, ser, tyr, thr; (3) val, ile, leu, met, ala, phe; (4) lys, arg, his; 및 (5) phe, tyr, trp, his.
상기 enCpf1 단백질 또는 이종 기능적 도메인(heterologous functional domain)과 융합된 융합 단백질은 재조합적 방법 또는 합성적 방법으로 비자연적 생산된 것(non-naturally occurring)일 수 있다.
상기 enCpf1 단백질 또는 융합 단백질은 진핵 세포의 핵 내 전달을 위하여 통상적으로 사용되는 요소 (예컨대, 핵위치신호 (nuclear localization signal; NLS) 등)를 추가로 포함하는 것일 수 있으나, 이에 제한되는 것은 아니다. 상기 enCpf1 단백질 또는 융합 단백질은 정제된 단백질 형태로 사용되거나, 이를 암호화하는 핵산(DNA/RNA), 또는 상기 DNA를 포함하는 재조합 벡터의 형태로 사용될 수 있다.
구체적으로, enCpf1 단백질 또는 융합 단백질은 진핵 세포의 핵 내 전달을 위하여 통상적으로 사용되는 요소(예를 들어, 핵위치신호(nuclear localization signal; NLS; 예를 들어, PKKKRKV (서열번호 60), KRPAATKKAGQAKKKK(서열번호 61), 또는 이를 암호화하는 핵산 분자) 등)를 N-말단 또는 C-말단(또는 이를 암호화하는 핵산 분자의 5' 말단 또는 3' 말단)에 추가로 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다. 본 발명의 enCpf1 단백질 또는 융합 단백질은 정제된 단백질 형태로 사용되거나, 이를 암호화하는 핵산(DNA/RNA), 또는 상기 DNA를 포함하는 재조합 벡터의 형태로 사용될 수 있다.
enCpf1 단백질 또는 융합 단백질은 분리 및/또는 정제에 유리한 태그와 연결될 수 있다. 예를 들어, His 태그, Flag 태그, S 태그 등과 같은 작은 펩타이드 태그, 또는 GST(Glutathione S-transferase) 태그, MBP(Maltose binding protein) 태그 등이 목적에 따라 사용될 수 있으나, 이에 한정되는 것은 아니다.
본 발명에 따른 예시적인 enCpf1 단백질 서열 및 이의 DNA 서열을 하기 표 1에 나타내었다.
서열 | 단백질 | DNA |
WT | 서열번호 1 | 서열번호 2 |
S170R/E174R | 서열번호 3 | 서열번호 4 |
E174R/K548R | 서열번호 5 | 서열번호 6 |
S170R/K548R | 서열번호 7 | 서열번호 8 |
E174R/S542R | 서열번호 9 | 서열번호 10 |
S170R/S542R | 서열번호 11 | 서열번호 12 |
E174R/S542R/K548R | 서열번호 13 | 서열번호 14 |
E174R/N551R | 서열번호 15 | 서열번호 16 |
S170R/N551R | 서열번호 17 | 서열번호 18 |
S542R/K548R | 서열번호 19 | 서열번호 20 |
상기 서열은 enCpf1 서열에 대한 일 예시적인 서열에 불과하고, 위 기재된 서열로 본발명의 내용이 한정되는 것은 아니다.
상기 가이드 RNA와 복합체를 형성할 enCpf1 단백질은 필요 활성에 따라 상기 언급된 범위 내에서 적절히 선택될 수 있다. 바람직하게 enCpf1 단백질은 서열번호 1의 아미노산 서열로부터 E174R/S542R/K548R의 치환을 포함하는 것일 수 있다. 바람직하게 서열번호 13의 아미노산 서열을 가지며, 이를 코딩하는 서열은 서열번호 14의 DNA 서열을 가질 수 있다.
본 발명에서 사용되는 용어, "키메릭 DNA-RNA 가이드"는 표적 DNA에 특이적인 crRNA(crispr RNA)의 RNA 중 일부 RNA가 DNA로 치환된 것으로, 키메릭 DNA-RNA 가이드는 enCpf1 단백질과 복합체를 형성할 수 있고, enCpf1 단백질을 표적 DNA에 가져올 수 있다. 가이드 RNA의 DNA 치환은 가이드와 표적 DNA의 결합 에너지에 변화를 주어 오프-타겟(off-target) DNA 염기서열 절단을 줄일 수 있다. 그 외에도, 값싸게 합성할 수 있음은 물론, 실험실 자체 제작 시 필연적으로 생기는 5' 포스페이트(phosphate)의 이슈로부터 벗어날 수 있고, 면역 반응의 유도를 피할 수 있다는 점에서 고등동물 세포 내 유전체 교정을 위한 enCpf1 도입 시 보다 안전하게 사용될 수 있다. 또한, 수용액 내 화학적으로 불안정한 RNA 대비, DNA 형태의 가이드는 화학적 개질이 용이하고, 응용적인 접근이 쉽다는 장점이 있다.
이러한 키메릭 DNA-RNA 가이드에 있어서 상기 DNA는 상기 가이드의 3' 말단에서의 치환일 수 있다. 구체적으로, 상기 DNA는 3' 말단에서 약 4개 내지 16개 치환인 것이 바람직하다. 보다 구체적으로, 약 6 내지 12개의 치환인 것이 바람직하다. 보다 구체적으로, 약 6 내지 10개의 치환인 것이 바람직하다.
예를 들어, 상기 확인되는 서열에서의 3' 말단으로부터 약 4 내지 16개의 RNA가 바람직하게 DNA로 치환된 것일 수 있다. 보다 구체적으로, 약 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16개의 RNA가 DNA로 치환된 것일 수 있다. crRNA의 3' 말단부터 4 내지 16개의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드는 높은 특이성 및 절단 활성을 나타내므로, crRNA의 치환은 crRNA의 3' 말단에서 이루어지는 것이 바람직하다.
crRNA의 3' 말단부터 4 내지 16개의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드는 높은 특이성 및 절단 활성을 나타내므로, crRNA의 치환은 crRNA의 3' 말단에서 이루어지는 것이 바람직하다.
본 발명에서 사용되는 용어, "혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다.
본 명세서에서, 유전자 표적 부위와 혼성화 가능한 뉴클레오타이드 서열은 유전자 표적 부위의 뉴클레오타이드 서열 (표적 서열)과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오타이드 서열을 의미한다 (이하, 특별한 언급이 없는 한 동일한 의미로 사용되며, 상기 서열 상동성은 통상적인 서열 비교 수단 (예컨대 BLAST)를 사용하여 확인될 수 있다).
본 발명의 유전자 교정용 조성물은 enCpf1을 암호화하는 뉴클레오티드를 포함하는 재조합 벡터 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터, 또는 enCpf1을 암호화하는 뉴클레오티드 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터의 형태로 세포 또는 유기체에 도입되거나, enCpf1 단백질 및 키메릭 DNA-RNA를 포함하는 혼합물 또는 이들이 복합체를 이루는 리보핵산단백질 형태로 세포 또는 유기체에 도입될 수 있다.
본 발명의 키메릭 DNA-RNA 가이드는 표적 DNA와 혼성화될 수 있다.
본 발명의 유전자 교정용 조성물은 진핵 유기체에 적용될 수 있다. 상기 진핵 유기체는 진핵 세포(예를 들어, 효모 등의 균류, 진핵 동물 및/또는 진핵 식물 유래 세포(예를 들어, 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물(예를 들어, 척추동물 또는 무척추동물, 보다 구체적으로, 인간, 원숭이 등의 영장류, 개, 돼지, 소, 양, 염소, 마우스, 래트 등을 포함하는 포유류 등), 및 진핵 식물(예를 들어, 녹조류 등의 조류, 옥수수, 콩, 밀, 벼 등의 단자엽 또는 쌍자엽 식물 등)로 이루어진 군에서 선택된 것일 수 있으나, 이에 한정되는 것은 아니다.
본 발명의 유전자 교정용 조성물은 enCpf1을 암호화하는 뉴클레오티드를 포함하는 재조합 벡터 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터, 또는 enCpf1을 암호화하는 뉴클레오티드 및 키메릭 DNA-RNA 가이드를 암호화하는 뉴클레오티드를 포함하는 재조합 벡터의 형태로 사용될 경우, 상기 재조합 벡터는 상기 뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함할 수 있다.
본 발명에서 사용되는 용어, "프로모터"는 폴리머라아제와 결합되고, 다운스트림(3' 방향) 코딩 또는 비-코딩 서열의 전사를 개시할 수 있는 DNA 조절 영역이다.
본 발명에서 사용되는 용어, "작동 가능하게 연결된"은 유전자 발현 조절 서열과 다른 뉴클레오티드 서열사이의 기능적인 결합(cis)을 의미한다. 상기 유전자 발현 조절 서열은 복제원점(replication origin), 프로모터, 전사 종결 서열(terminator) 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
본 발명의 프로모터는 특정 유전자의 전사 개시를 조절하는 전사 조절 서열 중 하나로, 통상적으로 약 100bp 내지 약 2,500bp 길이의 폴리뉴클레오티드 단편일 수 있다.
상기 프로모터는 세포, 예를 들어, 진핵 세포(예를 들어, 식물 세포, 또는 동물 세포(예를 들어, 인간, 마우스 등의 포유류 세포 등) 등)에서 전사 개시를 조절할 수 있으면, 제한 없이 사용 가능하다. 예를 들어, 상기 프로모터는 CMV 프로모터(cytomegalovirus promoter;예를 들어, 인간 또는 마우스 CMV immediate-early 프로모터), U6 프로모터, EF1-alpha(elongation factor 1-a) 프로모터, EF1-alpha short(EFS) 프로모터, SV40 프로모터, 아데노바이러스 프로모터(major late promoter), pL λ 프로모터, trp 프로모터, lac 프로모터, tac 프로모터, T7 프로모터, 백시니아 바이러스 7.5K 프로모터, HSV의 tk 프로모터, SV40E1 프로모터, 호흡기 세포융합 바이러스(Respiratory syncytial virus; RSV) 프로모터, 메탈로티오닌 프로모터(metallothionin promoter), β-액틴 프로모터, 유비퀴틴 C 프로모터, 인간 IL-2(human interleukin-2) 유전자 프로모터, 인간 림포톡신(human lymphotoxin) 유전자 프로모터, 인간 GM-CSF(human granulocyte-macrophage colony stimulating factor) 유전자 프로모터 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 한정되는 것은 아니다. 일 예에서, 상기 프로모터는 CMV immediate-early 프로모터, U6 프로모터, EF1-alpha(elongation factor 1-a) 프로모터, EF1-alpha short(EFS) 프로모터 등으로 이루어진 군에서 선택된 것일 수 있다. 상기 전사 종결 서열은 폴리아데닐화 서열(pA) 등일 수 있다. 상기 복제 원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, BBV 복제원점 등일 수 있다.
본 발명의 벡터는 플라스미드 벡터, 코즈미드 벡터 및 박테리오파아지 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 아데노-연관 바이러스 벡터와 같은 바이러스 벡터로 이루어진 군에서 선택된 것일 수 있다. 상기 재조합 벡터로 사용될 수 있는 벡터는 당업계에서 사용되는 플라스미드(예를 들면, pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, pUC19 등), 파지(예를 들면, λgt4λB, λ-Charon, λΔz1, M13 등) 또는 바이러스 벡터(예를 들면, 아데노-연관 바이러스(AAV) 벡터 등) 등을 기본으로 하여 제작될 수 있으나, 이에 한정되는 것은 아니다.
본 발명의 재조합 발현벡터의 제작은 당해 기술 분야에서 잘 알려진 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적 DNA 절단 및 연결은 당해 기술 분야에서 일반적으로 알려진 효소 등을 사용하여 수행될 수 있다.
본 발명의 일 구체예에 따르면, 상기 가이드는 3'-말단이 개질된 것일 수 있다. 본 발명의 키메릭 DNA-RNA 가이드는 3'-말단이 개질됨으로써, 세포 내에서 DNA 엑소뉴클레아제(exonuclease)에 의한 영향 없이 높은 표적 특이성 및 우수한 인델 효율을 나타낼 수 있다. 특히, enCfp1과 함께 사용하는 경우 비표적에 대한 인델이 크게 감소하면서도 표적에 대한 인델 효율이 크게 증가하여 NIckase의 사용 없이도 쉽게 유전자 교정을 수행할 수 있다.
구체적으로, 포스포네이트, 포스포로티오에이트 또는 포스포트리에스테르인 포스페이트로의 개질을 포함할 수 있다. 또한, LNA, HNA, CeNA, 2'-메톡시에틸, 2'-O-알킬, 2'-O-알릴, 2'-C-알릴, 2'-플루오로, 2'-데옥시, 2'-히드록실 및 그들의 조합으로 이루어진 그룹으로부터 선택되는 개질일 수 있다. 또한, 비오틴화 등을 통해 개질될 수 있다.
구체적으로, 포스포로티오에이트(phosphorothioate)로 개질(modification)된 것일 수 있다.
본 발명의 키메릭 DNA-RNA 가이드는 3'-말단이 포스포로티오에이트로 개질됨으로써, 세포내에서 3' DNA 엑소뉴클레아제(exonuclease)에 의한 영향 없이 높은 표적 특이성 및 우수한 인델 효율을 나타낼 수 있다.
본 발명의 일 구체예에 따르면, 상기 DNA는 상기 가이드의 3' 말단에 치환된 것일 수 있다.
본 발명의 일 구체예에 따르면, 상기 DNA는 4 내지 16개인 것일 수 있다.
crRNA의 5' 말단 또는 seed region의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드의 경우, 절단 활성이 낮다. 반면, crRNA의 3' 말단부터 6 내지 10개의 RNA가 DNA로 치환된 키메릭 DNA-RNA 가이드는 높은 특이성 및 절단 활성을 나타내므로, crRNA의 치환은 crRNA의 3' 말단에서 이루어지는 것이 바람직하다.
특히, enCfp1 과 함께 사용하는 경우 비표적에 대한 인델이 크게 감소하면서도 표적에 대한 인델 효율이 크게 증가하여 NIckase의 사용 없이도 쉽게 유전자 교정을 수행할 수 있다.
본 발명에 따른 조성물은 SpCas9 닉카아제(nickase)(D10A) 또는 비활성(Dead) SpCas9(D10A, H840A) 없이도 우수한 표적 특이성 및 우수한 인델 효율을 나타낸다는 점에서 우수한 효과를 나타낸다. 즉, 부차적으로 사용되는 CRISPR nickase를 추가로 세포나 조직으로 전달해야 하는 기존 기술들의 단점을 극복하면서, 위와 같은 작용을 나타냈다는 점에서 우수한 효과가 인정될 수 있다.
다만, 선택적으로 상기 조성물은 SpCas9 닉카아제(nickase)(D10A) 또는 비활성(Dead) SpCas9(D10A, H840A)을 더 포함하거나 이와 혼용되어 사용될 수 있다. SpCas9 닉카아제(nickase)(D10A)는 D10A 돌연변이를 갖는 S. 피오게네스 Cas9 nickase를 의미한다. 비활성 SpCas9 (dead SpCas9)(D10A, H840A)는 D10A, H840A 돌연변이를 갖는 S. 피오게네스 Cas9을 의미한다.
SpCas9 닉카아제(D10A)은 세포내 존재하는 DNA 이중나선의 negative supercoil을 제거할 수 있으므로, 세포내에서 키메릭 DNA-RNA 가이드의 유전체 교정 효율을 제고할 수 있다.
본 명세서에서, 용어 '유전체 교정 (genome editing)'은, 특별한 언급이 없는 한, 표적 유전자의 표적 부위에서의 절단에 의한 핵산 분자 (하나 이상, 예컨대, 1-100,000bp, 1-10,000bp, 1-1000, 1-100bp, 1-70bp, 1-50bp, 1-30bp, 1-20bp, 또는 1-10bp)의 결실, 삽입, 치환 등에 의하여 유전자 기능을 상실, 변경, 및/또는 회복 (수정) 시키는 것을 의미하기 위하여 사용될 수 있다.
본 명세서 내 유전자 교정은 하기 내용을 포함할 수 있다.
바람직하게 유전자 교정의 결과로 표적 유전자 또는 표적 핵산에 인델이 발생할 수 있다. 이때, 상기 인델은 표적 서열 부분 및/또는 프로토스페이서 서열 부분의 내부 및/또는 외부에서 일어날 수 있다. 상기 인델은, 유전자 교정 전 핵산의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 결실되거나, 임의의 뉴클레오타이드가 삽입되거나, 및/또는 상기 삽입과 결실이 혼입된 변이를 일컫는다. 일반적으로, 표적 유전자 또는 표적 핵산 서열 내 인델이 일어나면, 해당 유전자 또는 핵산이 불활성화된다. 일 구현예로, 상기 유전자 교정 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 뉴클레오타이드가 결실 및/또는 추가될 수 있다.
유전자 교정을 위해 적절 변형 범주 내에서 베이스 에디터, 및/또는 프라임 에디터 (역전사 효소(reverse transcriptase))가 포함될 수도 있다. 일 구현예로, 상기 베이스 에디터는 adenosine deaminase, 및/또는 cytosine deaminase일 수 있다. 일 구현예로, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소, 및/또는 그 변이체일 수 있다.
이에 따라, 본 명세서 내 유전자 교정은 하기 내용을 포함할 수 있다.
본 명세서에서 제공하는 유전자 교정용 조성물 또는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 베이스 에디팅이 일어날 수 있다. 이는 표적 유전자 또는 표적 핵산 내 임의의 염기가 결실, 또는 추가되는 인델과는 달리, 핵산 내 하나 이상의 특정 염기를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 염기가 다른 염기로 치환될 수 있다.
본 명세서에서 제공하는 유전자 교정 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 넉인이 발생할 수 있다. 상기 넉인은 표적 유전자 또는 표적 핵산 서열 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 넉인이 일어나려면, 추가적인 핵산 서열을 포함하는 도너가 더 필요할 수 있다. 세포 내에서 표적 유전자 또는 표적 핵산을 절단하는 경우, 상기 절단된 표적 유전자 또는 표적 핵산의 수복이 일어나게 된다. 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열이 표적 유전자 또는 표적 핵산 내에 삽입될 수 있도록 한다. 일 구현예로, 상기 유전자 교정 방법은 대상 세포 내로 도너를 전달하는 것을 추가적으로 포함할 수 있다. 이때, 상기 도너는 추가 대상 핵산을 포함하며, 상기 도너에 의해 상기 표적 유전자 또는 상기 표적 핵산 내 상기 추가 대상 핵산의 삽입이 유도된다. 이때, 상기 도너를 대상 세포 내로 전달할 때, 전술한 전달 형태 및/또는 전달 방법이 사용될 수 있다.
본 명세서에서 제공하는 유전자 교정 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 서열의 전부 또는 일부를 제거할 수 있다. 상기 제거는 상기 표적 유전자 또는 상기 표적 핵산 내 일부 염기 서열을 제거하는 것을 의미한다. 일 구현예로, 상기 유전자 교정 방법은 enCpf1 단백질 또는 이를 암호화하는 핵산, 키메릭 가이드 DNA-RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하는 세포내에 도입하는 것을 포함한다. 이로 인해, 상기 유전자 교정 결과 표적 유전자 또는 표적 핵산 내에 특정 서열 부분의 제거가 일어난다.
본 발명의 다른 양상은 상기 유전체 교정용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법을 제공한다. 여기서 상기 유기체는 인간을 제외할 수 있다.
본 발명의 유전체 교정용 조성물은 핵산 분자를 유기체, 세포, 조직 또는 기관에 도입하는 당 분야에서 공지된 방법에 의해 세포 또는 유기체에 도입될 수 있으며, 당 분야에서 공지된 바와 같이 숙주 세포에 따라 적합한 표준 기술을 선택하여 수행할 수 있다. 이런 방법에는 예를 들어, 전기천공법(electroporation), 인산칼슘(CaPO4) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, DEAE-덱스트란법, 양이온성 리포좀법, 및 초산 리튬-DMSO법 등이 포함될 수 있으나, 이에 한정되는 것은 아니다.
본 발명의 또 다른 목적은 상기 유전체 교정용 조성물을 표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여, 유전자 산물의 발현을 변경시키는 방법을 제공하는 것이다.
핵산 변경 이벤트를 겪은 세포(즉, "변경된" 세포)는 임의의 적합한 방법을 사용하여 단리될 수 있다. 수선 뉴클레오티드 분자는 선별 마커(selectable marker)를 암호화하는 핵산을 추가로 포함한다. 이러한 선별 마커는 당업계에 널리 공지되어 있으며 이들 마커를 암호화하는 핵산 서열은 상업적으로 이용 가능하다(예를 들면, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press 1989] 참조). 형광에 의해 시각화될 수 있는 선별마커를 사용하는 방법은 형광 활성화 세포 분류(FACS) 기법을 사용하여 추가로 분류될 수 있다. 단리된 조작된 세포가 이식을 위한 세포주를 확립하는데 사용될 수 있다. 단리된 변경된 세포는 안정한 세포주를 생산하기 위해 임의의 적합한 방법을 사용하여 배양할 수 있다.
본 발명의 또 다른 목적은 상기 유전체 교정용 조성물을 표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여 유전자 산물의 발현을 변경시킴으로써, 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료하는 방법을 제공하는 것이다. 여기서 DNA 분자는 돌연변이 또는 SNP 돌연변이 서열을 포함한다.
DNA 분자는 적어도 하나, 둘, 셋, 넷 또는 그 이상의 SNP 또는 돌연변이 부위를 포함할 수 있고, 본원에 기술된 방법은 적어도 하나, 둘, 셋, 넷 또는 그 이상의 SNP 또는 돌연변이 부위와 관련된 유전자 산물의 발현을 변경시킨다. 즉, 다수의 SNP 부위 또는 선조 SNP에서 돌연변이 서열을 변경시킬 수 있다.
이러한 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료를 위한 질환은 예를 들어 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함한다.
여기서, "유전 질환"은 게놈에서 하나 이상의 이상, 특히 출생 시 존재하는 상태에 의해 부분적으로 또는 전적으로, 직접적으로 또는 간접적으로 유발되는 질환을 지칭한다. 이상은 돌연변이, 삽입 또는 결실일 수 있다. 이상은 유전자의 코딩 서열 또는 이의 조절 서열에 영향을 줄 수 있다. 유전 질환은 DMD, 혈우병, 낭포성 섬유증, 헌팅턴 무도병, 가족성 고콜레스테롤혈증 (LDL 수용체 결함), 간모세포종, 윌슨병(Wilson's disease), 선천성 간성 포르피린증, 간 대사의 유전성 장애, 레쉬 니한 증후군(Lesch Nyhan syndrome), 겸상 적혈구 빈혈, 지중해빈혈, 색소피부건조증, 판코니 빈혈(Fanconi's anemia), 망막색소변성증, 모세혈관확장성 실조증, 블룸 증후군(Bloom's syndrome), 망막모세포종 및 테이-삭스병(Tay-Sachs disease)일 수 있지만, 이에 제한되지는 않는다.
비유전 질환 타겟은 enCpf1을 이용, 변이된 유전자 이외 정상 유전자를 조절하여 질병을 치료하는 것으로, 대표적으로 노인성 황반 변성(AMD)일 수 있지만, 이에 제한되지는 않는다.
여기서, 바이러스, 박테리아 감염, 또는 이들에 의한 질환은 에이즈, 조류독감, 독감, CMV 감염질환, 결핵 또는 나병 등을 포함하며, 이에 제한되지 않는다.
여기서, 암은 방광암, 골암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 구성된 군으로부터 선택되는 어느 하나를 포함하며, 이에 제한되지 않는다.
여기서, 자가 면역 질환은 제1형 당뇨병, 류마티스 관절염, 셀리악 병(Celiac disease-sprue), IgA 결핍(IgA deficiency), 크론병(Crohn's disease), 다발성 경화증, 전신성 홍반성 낭창, 쇼그렌 증후군, 피부 경화증, 다발성 근염, 만성 활동성간염, 혼합 결체 조직 질환, 원발성 담즙성 간경변, 악성 빈혈, 자가면역 갑상선염, 특발성 에디슨 병, 백반, 글루텐 감수성 장병증, 그레이브병, 중증 근무력증, 자가면역성 호중구 감소증, 특발성 혈소판 감소 자반증, 간경변증, 심상성천포창, 자가면역 불임증, 구드패스츄어 증후군, 수포성 유천포창, 원판상 홍반 루푸스, 궤양성 대장염 또는 고밀도 침착병 등을 포함하며, 이에 제한되지 않는다.
상기 내용에 있어서, 치료는 질환 또는 병태에 대해 양성 치료 반응을 제공한다. "양성 치료 반응"이란 질환 또는 병태의 개선, 및/또는 질환 또는 병태와 관련된 증상의 개선으로 의도된다.
상기 증상의 개선은 유효량, 또는 치료학적 유효량의 유전체 교정용 조성물의 투여를 포함한다. "유효량" 또는 "치료학적 유효량"은 유리하거나 목적하는 결과를 가져오기에 충분한 제제의 양을 가리킨다. 치료학적 유효량은 다음 중의 하나 이상에 따라 달라질 수 있다: 대상체 및 치료되는 질환 상태, 대상체의 체중 및 연령, 질환 상태의 중증도, 투여 방식 등, 이것은 당업계의 통상의 숙련가에 의해 용이하게 결정될 수 있다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물을 제공하는 것이다.
발명의 약학적 조성물의 제형은 비경구용일 수 있다. 제제화할 경우에는 보통 사용하는 충진제, 증량제, 결합제, 습윤제, 붕해제, 계면활성제 등의 희석제 또는 부형제를 사용하여 조제된다. 특히, 비경구 투여를 위한 제제에는 멸균된 수용액, 비수성용제, 현탁제, 유제, 동결건조제제, 좌제가 포함된다. 비수성용제 및 현탁용제로는 프로필렌글리콜(propylene glycol), 폴리에틸렌 글리콜, 올리브 오일과 같은 식물성 기름, 에틸올레이트와 같은 주사 가능한 에스테르 등이 사용될 수 있다.
본 발명의 약학적 조성물은 비경구로 투여될 수 있으며, 종양내 투여, 정맥내, 근육내, 피내, 피하, 복강내, 소동맥내, 심실내, 병변내, 척추강내, 국소, 및 이들의 조합으로 구성된 군으로부터 선택되는 어느 하나의 경로로 투여될 수 있다.
본 발명의 약학적 조성물의 투여량은 환자의 체중, 연령, 성별, 건강상태, 식이, 투여시간, 투여방법, 배설율 및 질환의 중증도에 따라 그 범위가 다양하며, 당업자에 의해 적절하게 선택될 수 있다. 바람직한 효과를 위해서, 본 발명의 약학적 조성물을 1일 0.01 ug/kg 내지 100 mg/kg으로, 구체적으로는 1 ug/kg 내지 1 mg/kg으로 투여할 수 있다. 투여는 하루에 한번 투여할 수도 있고, 수회 나누어 투여할 수 있다. 따라서, 상기 투여량은 어떠한 면으로든 본 발명의 범위를 한정하는 것은 아니다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물을 이용한 의약 용도를 제공하는 것이다.
여기서 상기 의약 용도는 대상체에서 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환을 예방, 개선 또는 치료하기 위한 것일 수 있다. 보다 구체적으로, 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함하는, 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환에 대한 예방, 개선 또는 치료하기 위한 것일 수 있다.
본 발명의 또 다른 목적은 유전체 교정에 사용하기 위한, enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환을 포함하는, 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료에 사용하기 위한, enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 암이나 유전 질병, 바이러스에 의한 감염을 특정 DNA 혹은 RNA 상의 돌연변이를 표적하여 검출하는데 사용되는 것이다. 정상 유전자와 변이 유전자를 정확하게 구분하는 데 있어서 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 진단용 조성물을 제공하는 것이다.
본 발명에 따른 유전자 진단용 조성물은 우수한 표적 특이성 및 신속성을 통하여 빠르고 정확하게 표적 유전자를 검출할 수 있다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및
표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물의 유전체 교정 용도를 제공하는 것이다.
본 발명의 또 다른 목적은 돌연변이 또는 단일-뉴클레오티드 다형태(SNP)와 관련된 질환의 예방 또는 치료에 사용하기 위한 약제의 제조에 있어서,
enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 조성물의 용도를 제공하는 것이다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 역전사 효소 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 및 상기 enCpf1 단백질과 복합체를 형성하는 프라임 에디팅(prime editing) 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정용 조성물로서, 상기 프라임 에디팅 키메릭 DNA-RNA 가이드는 (i) a primer binding site, (ii) edit template 및 (iii) homology arm 서열을 포함하는 것인, 유전자 교정용 조성물을 제공하는 것이다.
상기 primer binding site는 표적 DNA의 가닥으로부터 형성된 프라이머 서열을 어닐링하는 extension arm의 일부를 의미한다.
상기 edit template는 역전사 효소에 의해 합성되는 단일 가닥 DNA 플랩 내 원하는 교정을 인코딩하는 extension arm의 일부를 나타낸다.
상기 homology arm은 endogenous strand의 대체에 의해 표적 DNA 위치로 통합될 생성된 역전사 효소-인코딩된 단일 가닥 DNA 플랩의 서열을 포함하는 extension arm의 일부를 지칭한다. homology arm에 의해 인코딩된 단일 가닥 DNA 플랩의 부분은 표적 DNA 서열의 교정되지 않은 가닥에 상보적이다. 프라임 에디팅에 관하여 WO2020/191153 A2의 기재가 본원 명세서 내 적절히 적용되고 통합될 수 있다.
본 발명의 또 다른 목적은 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 디아미나제 단백질 또는 이를 암호화하는 폴리뉴클레오타이드; 및 베이스 에디팅(base editing) 키메릭 DNA-RNA 가이드를 포함하는 유전자 교정용 조성물을 제공하는 것이다.
본 발명의 또 다른 양상은 비활성 enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭 DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 발현 억제용 조성물을 제공한다.
본 발명의 유전자 발현 억제용 조성물에 있어서, 전술한 내용과 중복되는 부분은 전술한 의미와 동일한 의미로 사용될 수 있다.
비활성(deactivated) enCpf1 단백질은 키메릭 DNA-RNA 가이드에 의해 표적 유전자에 바인딩할 수 있으나, 뉴클레아제 활성을 나타내지 않으므로, 표적 유전자의 전사가 억제 또는 감소될 수 있으므로, 표적 유전자의 발현을 조절하는데 효과적으로 활용될 수 있다.
본 발명에서 사용되는 비활성 enCpf1 단백질은 당업계에서 알려진 enCpf1 단백질의 활성을 제거 또는 감소시키는 방법에 의해 제조된 것일 수 있다.
본 발명의 일 구체예에 따르면, 상기 가이드는 3'-말단이 포스포로티오에이트로 개질된 것일 수 있다.
본 발명의 일 구체예에 따르면, 상기 DNA는 상기 가이드의 3' 말단에 치환된 것일 수 있다.
본 발명의 일 구체예에 따르면, 상기 조성물은 SpCas9 닉카아제(nickase)(D10A)를 더 포함할 수 있다.
enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물에 따르면, 기존의 RNA 가이드 대비 인델 효율은 유사하면서도, RNA 가이드 대비 표적 특이성이 우수하므로, 안정성 및 높은 치료 효과를 요구하는 유전자 치료 등에 효과적으로 적용될 수 있다.
도 1은 키메릭 DNA-RNA 가이드 사용하는 AsCas12a 시스템과 enhanced- AsCas12a(enAsCas12a) 시스템의 표적 특이성 증진 메커니즘과 작동원리를 나타내는 도이다. 도 1의 A는 키메릭 DNA-RNA를 이용한 AsCpf1(파란색)의 유전자상 표적 염기서열에 대한 표적 특이성 제고 메커니즘을 나타낸다. on-target 상의 효율적인 작동을 위하여 표적 염기서열 근처의 nickase의 바인딩을 필요로 하며(노란색), 키메릭 DNA-RNA 가이드에 의해 off-target 절단을 목적하는 방식으로 작동될 수 있다. 도 1의 B는 본 발명에 따른 키메릭 DNA-RNA를 이용한 enAsCpf1(주황색)의 유전자상 표적 염기서열에 대한 표적 특이성 제고 메커니즘을 나타낸다. 표적 염기서열 근처의 nickase의 바인딩이 없어도 on-target 상에서 효과적인 유전자 교정이 가능하며, 키메릭 DNA-RNA 가이드에 의해 off-target 절단은 획기적으로 감소할 수 있다.
도 2는 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율을 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드(붉은색: crRNA의 3'말단부터 다양한 길이의 연속된 DNA치환, D+N: 가이드 RNA 내에서 각각의 치환된 DNA 갯수)를 이용한 AsCpf1과 enAsCpf1의 DNMT1 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 3은 Nickase(nCas9)의 유무에 따른 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타낸다. 구체적으로, 도 3의 A 및 B는 인체 유래 세포주 내 (HEK293FT) CCR5 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 3의 C 및 D는 인체 유래 세포주 내 (HEK293FT) IL2A-AS1 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험 결과를 나타낸다.
도 4는 AsCas12a 과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(AAVS1-1)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 4의 A 및 C는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1-1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 4의 B 및 D는 인체 유래 세포주 내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8 DNA) 기반 enAsCpf1 전달 시 AAVS1-1 표적/비표적 염기서열에 대한 각각의 교정 효율 비교 결과를 나타낸다.
도 5는 상기 도 4의 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1-1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 6은 키메릭 DNA-RNA 기반 enAsCas12a 시스템 사용을 통한 인체 유래 세포주 내 유전자상 표적 염기서열(CCR5)에 대한 작동효율 및 표적 특이성 검증 실험을 나타낸다. 도 6의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 사용 enAsCpf1 전달시, 각 CCR5 표적(on-target)/비표적(off-target) 염기서열에 대한 교정 효율을 비교한 결과를 나타낸다. 도 6의 C는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 enAsCpf1 전달시, CCR5 염기서열에 대한 표적 특이성 비교 결과를 나타낸다.
도 7은 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드(붉은색: crRNA의 3'말단부터 다양한 길이의 연속된 DNA치환, D+N: 가이드 RNA 내에서 각각의 치환된 DNA 갯수)를 이용한 AsCpf1과 enAsCpf1의 hDNMT1_site1 유전자 및 CCR5_site2 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 8은 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드를 이용한 AsCpf1과 enAsCpf1의 DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 9는 인간 세포주(HEK293FT)에서 내인성 표적(DNMT1-site2)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 9의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 DNMT1-site2 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 9의 C는 Nickase(nCas9)의 유무에 따른 DNMT1-site2 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 9의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, DNMT1-site2 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 10은 인간 세포주(HEK293FT)에서 내인성 표적(CCR5-site1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 10의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 CCR5-site1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 10의 C는 Nickase(nCas9)의 유무에 따른 CCR5-site1 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 10의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, CCR5-site1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 11은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(CCR5-site2)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 11의 A 내지 B는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 11의 C는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8 내지 11) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타낸다. 또한, 도 11의 D 내지 E는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 비표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 11의 F는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, CCR5-site2 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 12는 인간 세포주(HEK293FT)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 12의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 12의 C는 Nickase(nCas9)의 유무에 따른 AAVS1 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 12의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 13은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(FANCF)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 13의 A 내지 B는 인체 유래 세포주 내 (HEK293FT) FANCF 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 13의 C 내지 D는 인체 유래 세포주 내 (HEK293FT) FANCF 비표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타낸다.
도 14는 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적/비표적 염기서열(AAVS1, CCR5_site1, CCR_site2, DNMT1_site1, DNMT1_site2, FANCF 및 IL12A_AS1)에 대한 작동효율을 비교한 결과를 나타낸다.
도 15는 인간 세포주(HeLa, K562)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 15의 A 및 C는 인체유래 세포주내 (HeLa, K562) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 15의 B 및 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 2는 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율을 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드(붉은색: crRNA의 3'말단부터 다양한 길이의 연속된 DNA치환, D+N: 가이드 RNA 내에서 각각의 치환된 DNA 갯수)를 이용한 AsCpf1과 enAsCpf1의 DNMT1 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 3은 Nickase(nCas9)의 유무에 따른 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타낸다. 구체적으로, 도 3의 A 및 B는 인체 유래 세포주 내 (HEK293FT) CCR5 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 3의 C 및 D는 인체 유래 세포주 내 (HEK293FT) IL2A-AS1 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험 결과를 나타낸다.
도 4는 AsCas12a 과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(AAVS1-1)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 4의 A 및 C는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1-1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 4의 B 및 D는 인체 유래 세포주 내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8 DNA) 기반 enAsCpf1 전달 시 AAVS1-1 표적/비표적 염기서열에 대한 각각의 교정 효율 비교 결과를 나타낸다.
도 5는 상기 도 4의 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1-1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 6은 키메릭 DNA-RNA 기반 enAsCas12a 시스템 사용을 통한 인체 유래 세포주 내 유전자상 표적 염기서열(CCR5)에 대한 작동효율 및 표적 특이성 검증 실험을 나타낸다. 도 6의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 사용 enAsCpf1 전달시, 각 CCR5 표적(on-target)/비표적(off-target) 염기서열에 대한 교정 효율을 비교한 결과를 나타낸다. 도 6의 C는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 enAsCpf1 전달시, CCR5 염기서열에 대한 표적 특이성 비교 결과를 나타낸다.
도 7은 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드(붉은색: crRNA의 3'말단부터 다양한 길이의 연속된 DNA치환, D+N: 가이드 RNA 내에서 각각의 치환된 DNA 갯수)를 이용한 AsCpf1과 enAsCpf1의 hDNMT1_site1 유전자 및 CCR5_site2 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 8은 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 비교한 결과를 나타낸다. 구체적으로, 키메릭 DNA-RNA 가이드를 이용한 AsCpf1과 enAsCpf1의 DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자 염기서열 타겟 이중나선 절단 효율 비교이다. D+0은 WT-crRNA을 나타내며, NC는 negative control를 나타낸다.
도 9는 인간 세포주(HEK293FT)에서 내인성 표적(DNMT1-site2)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 9의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 DNMT1-site2 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 9의 C는 Nickase(nCas9)의 유무에 따른 DNMT1-site2 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 9의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, DNMT1-site2 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 10은 인간 세포주(HEK293FT)에서 내인성 표적(CCR5-site1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 10의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 CCR5-site1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 10의 C는 Nickase(nCas9)의 유무에 따른 CCR5-site1 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 10의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, CCR5-site1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 11은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(CCR5-site2)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 11의 A 내지 B는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 11의 C는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8 내지 11) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타낸다. 또한, 도 11의 D 내지 E는 인체 유래 세포주 내 (HEK293FT) CCR5-site2 비표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 11의 F는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, CCR5-site2 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 12는 인간 세포주(HEK293FT)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 12의 A 및 B는 인체유래 세포주내 (HEK293FT) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 12의 C는 Nickase(nCas9)의 유무에 따른 AAVS1 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율을 비교한 결과를 나타내고, 도 12의 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
도 13은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(FANCF)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 13의 A 내지 B는 인체 유래 세포주 내 (HEK293FT) FANCF 표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타내며, 도 13의 C 내지 D는 인체 유래 세포주 내 (HEK293FT) FANCF 비표적 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(DNA+8) 사용 유전체 교정 유도 시, AsCpf1과 enAsCpf1의 nickase(nCas9) 의존성 비교 실험을 나타낸다.
도 14는 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적/비표적 염기서열(AAVS1, CCR5_site1, CCR_site2, DNMT1_site1, DNMT1_site2, FANCF 및 IL12A_AS1)에 대한 작동효율을 비교한 결과를 나타낸다.
도 15는 인간 세포주(HeLa, K562)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 15의 A 및 C는 인체유래 세포주내 (HeLa, K562) 정상 가이드 RNA(WT)와 키메릭 DNA-RNA 가이드(8DNA) 기반 AsCpf1 전달 시 AAVS1 표적/비표적 염기서열에 대한 각각의 교정 효율을 비교한 결과를 나타내며, 도 15의 B 및 D는 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시, AAVS1 염기서열에 대한 각각의 표적 특이성을 비교한 결과를 나타낸다.
이하 본 발명을 하나 이상의 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
<
실시예
1>
CRISPR
-
Cas12a
(
AsCpf1
),
CRISPR
-
enAsCas12a
(
enAsCpf1
) 재조합 단백질의 정제와
키메릭
(Chimeric) DNA-
RNA가이드의
합성
CRISPR-AsCas12a, CRISPR-enAsCas12a (E174R, S542R, K548R) 재조합 단백질 정제를 위하여 pET28a-AsCas12a(서열번호 62(아미노산서열) 및 서열번호 63(염기서열)), pET28a-enAsCas12a (E174R, S542R, K548R)(서열번호 64(아미노산서열) 및 서열번호 65(염기서열) 박테리아 발현 벡터를 E. coli BL21(DE3)종에 형질전환 진행한 후, OD=0.6까지 37℃에서 배양하였다. IPTG 접종 뒤 48시간 후에 박테리아 세포들을 침전하여 배양액을 제거하고, 남은 침전물을 buffer A[20mM Tris-HCl(pH 8.0), 300mM NaCl, 10mM β-mercaptoethanol, 1% TritonX-100, 1mM PMSF]로 재용해하였다. 이후 sonication을 통하여(ice, 3min) 박테리아 세포막을 부수고, 원심분리(5,000rpm, 10min)후 세포 lysate를 harvest하였다. 먼저 buffer B[20mM Tris-HCl(pH8.0), 300nM NaCl] 로 pre-washing 된 Ni-NTA resin과 초음파 파쇄된 세포내 용액을 섞어서 cold room(4℃)에서 1시간 30분 동안 교반하였다. 박테리아 세포 침전 이후 buffer B[20mM Tris-HCl(pH 8.0), 300nM NaCl]를 사용, 10배 volume으로 washing을 통해 non-specific binding component 들을 제거하고, buffer C[20mM Tris-HCl(pH8.0), 300nM NaCl, 200mM Imidazole]를 사용해 Cas12a 단백질을 용출하였다. 용출된 단백질은 buffer E[200mM NaCl, 50mM HEPES(pH7.5), 1mM DTT, 40% glycerol]로 centricon(Amicon Ultra)을 사용하여 교환해주고 -80℃에 분주하여 보관하였다. 결과적으로 고순도의 DNA 절단 활성이 있는 단백질을 정제하였다. Chimeric DNA-RNA 가이드는 각 목표 유전자 내 타겟으로 하는 염기서열에 맞추어 일괄 합성 주문 제작하였다(bioneer).
실험에 사용된 chimeric DNA-RNA 가이드 염기서열 정보를 하기 표 2에 나타내었다.
표적 유전자 위치 | CRISPR-Cas12a(AsCpf1) 표적 염기서열 |
Chimeric DNA-RNA 염기서열 (5'-3') |
hDNMT1 D +0 | TTTC CTGATGGTCCATGTCTGTTACTCG (서열번호 21) | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUACUCG 3' (서열번호 22) |
hDNMT1 D +4 | TTTC CTGATGGTCCATGTCTGTTACTCG | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUA CTCG 3' (서열번호 23) |
hDNMT1 D +8 | TTTC CTGATGGTCCATGTCTGTTACTCG | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCU GTTACTCG 3' (서열번호 24) |
hDNMT1 D +12 | TTTC CTGATGGTCCATGTCTGTTACTCG | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAU GTCTGTTACTCG 3' (서열번호 25) |
hDNMT1 D +16 | TTTC CTGATGGTCCATGTCTGTTACTCG | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGU CCATGTCTGTTACTCG 3' (서열번호 26) |
hDNMT1 D +20 | TTTC CTGATGGTCCATGTCTGTTACTCG | 5'UAAUUUCUACUCUUGUAGAUCUGA TGGTCCATGTCTGTTACTCG 3' (서열번호 27) |
hDNMT1 D +24 | TTTC CTGATGGTCCATGTCTGTTACTCG | 5'UAAUUUCUACUCUUGUAGAU CTGATGGTCCATGTCTGTTACTCG 3' (서열번호 28) |
hDNMT1 D +44 | TTTC CTGATGGTCCATGTCTGTTACTCG | 5' T AATTTCTACTCTTGTAGATCTGATGGTCCATGTCTGTTACTCG 3' (서열번호 29) |
hCCR5 D +0 | TTTG GTCGGCATGGCCCCATTCGCACGG(서열번호 30) | 5'UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGGUCAUCCUC 3' (서열번호 31) |
hCCR5 D +8 | TTTG GTCGGCATGGCCCCATTCGCACGG | 5'UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGG TCATCCTC 3' (서열번호 32) |
hAAVS1 D +0 | TTTG GTGCTCAATGAAAGGAGATAAGGT(서열번호 33) | 5'UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAGAGAGGAUC 3' (서열번호 34) |
hAAVS1 D +8 | TTTG GTGCTCAATGAAAGGAGATAAGGT | 5'UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAG AGAGGATC 3' (서열번호 35) |
a) 타겟 DNA 유전자내의 PAM 염기서열(TTTN)은 굵은 글씨 및 밑줄로 표시되었음.
b) 키메릭 가이드의 RNA는 굵은 글씨로 DNA는 밑줄 및 기울임 글씨로 표시되었음.
<
실시예
2>
키메릭
DNA-RNA 가이드 이용 표적 염기서열에 대한
AsCas12a
시스템과 enhanced-
AsCas12a
시스템의 절단 효율 비교
키메릭 DNA-RNA 가이드를 사용하는 AsCpf1 및 enAsCpf1 시스템의 절단 효율 비교를 위해서, DNMT1 유전자에서 다양한 키메릭 DNA-RNA 가이드를 사용하여 on target 절단 효율을 각각 측정하였다.
구체적으로, 각 유전자위(DNMT1)에 해당하는 DNA primer를 표 3과 같이 제조하였다.
유전자 위치 및 프라이머 방향 | DNA 염기서열 (5' to 3') |
hDNMT1 on-target F1 | GTTGCACGTGTCAAGTGCTTA (서열번호 36) |
hDNMT1 on-target R1 | TTAAAATCCAGAATGCACAAAGTACT(서열번호 37) |
hDNMT1 on-target F2 | GTGAATTTGGCTCAGCAGGCA (서열번호 38) |
hDNMT1 on-target R2 | AAGCGAACCTCACACAACAGC (서열번호 39) |
*목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정 보임.
그리고 나서, genomic DNA(HEK293FT)로부터 PCR amplicon(DNMT1)을 얻었다. 정제된 재조합 Cas12a(AsCpf1)와 각 유전자위에 해당하는 synthesised chimeric crRNA-DNA(purchased from Bioneer) 혹은 정제된 crRNA를 premix하고, cleavage buffer(NEB3, 10㎕ volumn) 조건에서 37℃, 1hour incubation 하였다. 반응 이후, stop buffer(100mM EDTA, 1.2% SDS)를 넣어서 반응을 중지시키고, 2% agarose gel 전기영동으로 DNA 절단 여부를 확인하였다. DNA cleavage 효율은, 절단된 이미지 패턴을 imageJ software를 사용하여 측정된 band intensity profile 값을 공식(Intensity of the cleaved fragment/total sum of the fragment intensity * 100 =%)에 따라 계산하였다.
그 결과를 도 2에 나타내었다.
도 2에서는 키메릭 DNA-RNA 가이드와 관련하여 crRNA의 3'말단부터 다양한 길이의 연속된 DNA를 붉은색으로 기재하고, D+N은 가이드 RNA내에서 각각의 치환된 DNA 개수를 나타내도록 기재하였다(D+0: WT-crRNA, NC: negative control).
도 2에서 확인할 수 있는 바와 같이, 본 발명에 따른 enAsCpf1 시스템을 사용하는 경우, AsCpf1와 대비하여 보다 우수한 절단 효율을 나타내었다.
구체적으로, enAsCpf1 시스템을 사용하여 D+4부터 D+16까지 우수한 절단 효능을 나타내었다. 이러한 효과의 경우 AsCpf1와 대비하여 보다 높게 나타나는 것으로, 본원 발명에 따른 우수한 효과를 확인하였다.
<
실시예
3>
AsCas12a와
enhanced-
AsCas12a
시스템의
키메릭
DNA-RNA 가이드 사용
인체유래
세포주내
유전자상 표적 염기서열(
CCR5
,
AAVS1
)에 대한 작동효율 및 표적 특이성 비교
인체유래 세포주 내 (HEK293FT)에서, 키메릭 DNA-RNA 기반 AsCas12a 시스템과 enhanced-AsCas12a (E174R, S542R, K548R) 시스템 간의 표적/비표적 염기서열 교정 효율을 비교하기 위하여, CCR5 site 와 AAVS1 site에 절단을 유도한 뒤, 작동 효율을 비교하였다.
고등동물 세포(HEK293FT)에 가이드와 CRISPR-Cas12a 단백질의 복합체 형태로 전달하여 CCR5, AAVS1 유전자 염기서열 절단을 유도하였다.
HEK293FT 세포주(ATCC)를 DMEM media(DMEM(Gibco) with 10% FBS (Gibco))에서 48시간마다 37℃, 5% CO2에서 계대 배양하면서 confluency 70%를 유지하였고, chimeric 세포 transfection시 electroporation kit (amaxa, V4XC-2032)을 이용하였고, 105개의 세포를 사용하여 CMV-Cas12a vector, CMV-nCas9 vector와 crRNA, sgRNA를 각각 섞어준 이후 electroporation buffer(CMV-Cas12a: 500ng, CMV-nCas9: 100ng, crRNA: 100pmol, sgRNA: 15pmol) 조건에서 electric shock(program: CM-137)을 가하였다. 이후 37℃, 5% CO2 조건에서 30분간 pre incubation된 24well plate의 DMEM media solution(500㎕l)에 transfection된 세포들을 옮기고 같은 조건(37℃, 5% CO2)에서 배양시켰다. crRNA와 CMV-AsCas12a vector 복합체(CMV-AsCas12a(서열번호 66(아미노산서열) 및 서열번호 67(염기서열)) 또는 CMV-enAsCas12a (E174R, S542R, K548R)(서열번호 68(아미노산서열) 및 서열번호 69(염기서열))를 세포(HEK293FT) 내부로 전달한 뒤 24시간 이후에 동일한 양의 crRNA와 sgRNA를 1.4㎕l의 Lipofectamine 3000 (ThermoFisher)과 1.0㎕의 P3000 시약을 이용하여 세포 내로 전달하였다. Electric shock 후, 72 시간 뒤 genomic DNA purification kit(Qiagen, DNeasy Blood & Tissue Kit)를 사용하여 genomic DNA를 분리하였다. In-silico(Cas-offinder) 방식으로 각각의 유전자 타겟 염기서열(on-target)에 대한 유사 염기서열(off-target)을 선정하였다.
목표 유전자의 교정 부위의 정확한 염기서열을 확인하기 위하여 표적/비표적 유전자위에 해당하는 DNA primer(표 4에 기재)를 이용하여 얻은 PCR amplicon(CCR5(On, OT1), AAVS1(On, OT1))에서 nested PCR(Denaturation: 98℃ - 30 sec, Primer Anealing: 58℃ - 30 sec, Elongation: 72℃ - 30 sec, 35 cycles)을 반복하여 adaptor와 index 시퀀스를 amplicon 양단에 삽입하였다((Denaturation: 98℃ - 30 sec, Primer Anealing: 62℃ - 15 sec, Elongation: 72℃ - 15 sec, 35 cycles). 이후 tagging된 amplicon mixture를 manufactor's guideline에 따라서 mini-SEQ analyzer(illumina MiniSeq system, SY-420-1001)에 로딩하고 targeted deep sequencing을 진행하였다. 저장된 Fastq file은 Cas-Analyzer 코드로 분석되었고 교정 효율(%)이 계산되었다.
유전자 위치 및 프라이머 방향 |
DNA 염기서열 (5' to 3') |
hCCR5 on-target F1 | TGAGATGGTGCTTTCATGAAT (서열번호 40) |
hCCR5 on-target R1 | GAAAATGAGAGCTGCAGGTG (서열번호 41) |
hCCR5 off-target F1 | GAAAATGGCTGTTGGGTAAATC (서열번호 42) |
hCCR5 off-target R1 | TAAGGGCCACAGACATAAAC (서열번호 43) |
hAAVS1 on-target F1 | CCTGGTGAACACCTAGGACG (서열번호 44) |
hAAVS1 on-target R1 | CTATGTCCACTTCAGGACAGC (서열번호 45) |
hAAVS1 off-target1 F1 | AGCAGGTTGGGTATCCTGTG (서열번호 46) |
hAAVS1 off-target1 R1 | AGGCTGTTTCTGCCTCCATA (서열번호 47) |
hAAVS1 off-target2 F1 | ATCCAGGGGGTTGGAATATC (서열번호 48) |
hAAVS1 off-target2 R1 | TGCCTGAGAGCAGGTCTTTT (서열번호 49) |
hCCR5 on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CCTGCCAAAAAATCAATGTGAAG (서열번호 50) |
hCCR5 on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAGGGGACAGTAAGAAGGAA (서열번호 51) |
hCCR5 off-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT TCCCTGTCATAAATTTGACGTG (서열번호 52) |
hCCR5 off-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAAAAGCAGATCAGAGATGGC (서열번호 53) |
hAAVS1 on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CTTCCCTCCCACCCCCTG (서열번호 54) |
hAAVS1 on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCCATCCTTAGGCCTCCT (서열번호 55) |
hAAVS1 off-target1 Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CCATCTCCTGGTCTGCACAA (서열번호 56) |
hAAVS1 off-target1 Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAAGGGGCTATTCAGATGT (서열번호 57) |
hAAVS1 off-target2 Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GGTTATCTGTTAATGATAGCCTG (서열번호 58) |
hAAVS1 off-target2 Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCACAAGCCCATGAAGACTGG (서열번호 59) |
목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정보를 표시하였다. 차세대 염기서열 분석에 사용된 정방향 어답터(forward adaptor 녹색), 역방향 어답터(reverse adaptor 파란색) 프라이머의 염기서열은 각각 기울임, 밑줄 및 굵은 글씨 표시; 밑줄 글씨 표시로 기재하였다.
Nickase(nCas9) 이용 유무와 함께 표적 염기서열에 대한 키메릭 DNA-RNA 가이드 기반 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율 비교 결과를 도 3에 나타내었다.
도 3에서 확인할 수 있는 바와 같이, 키메릭 가이드 사용 AsCas12a 시스템에서는 표적 서열 근처의 nickase에 의해서만 on-target 절단이 효율적으로 일어나는 반면, enAsCas12a 시스템에서는 nickase의 바인딩 없이 효율적인 on-target 절단이 일어나는 것을 확인하였다.
구체적으로, 도 3의 A 및 B는 CCR5에 대한 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율 비교 결과를 나타낸다. AsCas12a 시스템의 경우 D+8 키메릭에 대하여 Nickase의 도움이 없을 때 Indel 효율이 크게 떨어졌다. 반면, enAsCas12a 시스템은 D+8 키메릭 DNA-RNA에 대하여 Nickase의 도움이 없이도 우수한 On target 절단 효율을 나타내었다. 특히, D+8 키메릭 DNA-RNA 사용에 의하여 WT와 대비하여서도 On target 절단 효율이 증가된 것을 확인할 수 있다.
또한, 도 3의 C 및 D는 IL2A-AS1에 대한 AsCas12a 시스템과 enAsCas12a 시스템의 작동효율 비교 결과를 나타낸다. 해당 결과를 통해서도 AsCas12a 시스템의 경우 D+8 키메릭에 대하여 Nickase의 도움이 없을 때 Indel 효율이 크게 떨어지는 것을 확인할 수 있다. 반면, 본원 발명의 enAsCas12a 시스템은 D+8 키메릭 DNA-RNA에 대하여 Nickase의 도움이 없이도 우수한 On target 절단 효율을 나타내었다.
도 4 및 도 5는 AsCas12a 과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용 인체유래 세포주내 유전자상 표적 염기서열(AAVS1-1)에 대한 작동효율 및 표적 특이성 비교 결과를 나타낸다.
키메릭 DNA-RNA(8DNA) 사용으로 비표적 염기서열에 대한 절단 효율이 감소하는 것을 enAsCas12a (E174R, S542R, K548R) 시스템에서 확인하였다.
도 4의 A 및 B에서 확인할 수 있는 바와 같이 AsCas12a 과 enAsCas12a 시스템을 비교할 때 enAsCas12a 시스템의 경우 on-Target에 대한 indel ratio가 크게 증가하였다. 이러한 증가는 필연적으로 Off-target에 대한 문제를 가져올 수밖에 없는데, 도 4의 C 및 D를 통해 확인할 수 있는 바와 같이, WT를 사용하여 enAsCas12a 시스템에서 나타나는 Off-target에 대한 절단 문제를 키메릭 DNA-RNA의 사용을 통해 해소하였음을 확인하였다.
상기 결과를 통해서, 본 발명에 따른 enAsCas12a을 적용한 키메릭 DNA-RNA의 사용이 On-target에 대한 절단 효율을 크게 증가시키면서 비표적 염기서열에 대한 절단 효율을 감소시킴을 확인하였다.
또한, 도 5에서 확인할 수 있는 바와 같이, 정상 가이드 RNA(WT)와 키메릭 DNA-RNA(8DNA) 가이드 사용 AsCpf1과 enAsCpf1 전달 시 AAVS1-1에 대한 작동효율 및 표적 특이성이 크게 증가한 것을 확인할 수 있었다. 특히, On-target/off-target 측면에 AsCpf1 사용 시스템은 키메릭 DNA-RNA 와 WT 간의 특이도(Specificity)에 큰 차이가 없었던 반면, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 특이도가 현저히 상승함을 확인하였다.
도 6은 키메릭 DNA-RNA 기반 enAsCas12a 시스템 사용 인체 유래 세포주내 유전자상 표적 염기서열(CCR5)에 대한 작동효율 및 표적 특이성 검증 결과를 나타낸다.
도 6을 통해 확인할 수 있는 바와 같이, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 Off-target에 대한 indel ratio를 크게 감소시킴으로써 특이도를 크게 증가시켰음을 확인하였다.
<
실시예
4>
키메릭
(Chimeric) DNA-RNA 가이드의 합성
더욱 다양한 표적 유전자 위치에 따른 키메릭 DNA-RNA 가이드 이용 표적 염기서열에 대한 AsCas12a 시스템과 enhanced- AsCas12a 시스템의 절단효율, 작동효율 및 표적 특이성을 확인하기 위하여, 상기 실시예 1과 동일한 방법을 이용하여 키메릭 DNA-RNA 가이드를 제작하였다.
실험에 사용된 chimeric DNA-RNA 가이드 염기서열 정보를 하기 표 5에 나타내었다.
표적 유전자 위치 | CRISPR-Cas12a(AsCpf1) 표적 염기서열 |
Chimeric DNA-RNA 염기서열 (5'-3') |
hDNMT1_site1 D +0 | TTTC CTGATGGTCCATGTCTGTTACTCG (서열번호 21) | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUA CTCG 3' (서열번호 22) |
hDNMT1_site1 D +4 | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCUGUUA CTCG 3' (서열번호 23) | |
hDNMT1_site1 D +8 | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAUGUCU GTTACTCG 3' (서열번호 24) | |
hDNMT1_site1 D +12 | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGUCCAU GTCTGTTACTCG 3' (서열번호 25) | |
hDNMT1_site1 D +16 | 5'UAAUUUCUACUCUUGUAGAUCUGAUGGU CCATGTCTGTTACTCG 3' (서열번호 26) | |
hDNMT1_site1 D +20 | 5'UAAUUUCUACUCUUGUAGAUCUGA TGGTCCATGTCTGTTACTCG 3' (서열번호 27) | |
hDNMT1_site1 D +24 | 5'UAAUUUCUACUCUUGUAGAU CTGATGGTCCATGTCTGTTACTCG 3' (서열번호 28) | |
hDNMT1_site1 D +44 | 5' T AATTTCTACTCTTGTAGATCTGATGGTCCATGTCTGTTACTCG 3' (서열번호 29) | |
hDNMT1_site2 D +0 | TTTG GCTCAGCAGGCACCTGCCTCAGCT (서열번호 70) | UAAUUUCUACUCUUGUAGAUGCUCAGCAGGCACCUGCCUCAGCU (서열번호 71) |
hDNMT1_site2 D +8 | UAAUUUCUACUCUUGUAGAUGCUCAGCAGGCACCUG CCTCAGCT (서열번호 72) | |
hCCR5_site1 D +0 | TTTA TGCACAGGGTGGAACAAGATGGAT (서열번호 73) | UAAUUUCUACUCUUGUAGAUUGCACAGGGUGGAACAAGAUGGAU (서열번호 74) |
hCCR5_site1 D +8 | UAAUUUCUACUCUUGUAGAUUGCACAGGGUGGAACA AGATGGAT (서열번호 75) | |
hCCR5_site1 D +12 | UAAUUUCUACUCUUGUAGAUUGCACAGGGUGG AACAAGATGGAT (서열번호 76) | |
hCCR5_site1 D +16 | UAAUUUCUACUCUUGUAGAUUGCACAGG GTGGAACAAGATGGAT (서열번호 77) | |
hCCR5_site1 D +20 | UAAUUUCUACUCUUGUAGAUUGCA CAGGGTGGAACAAGATGGAT (서열번호 78) | |
hCCR5_site1 D +24 | UAAUUUCUACUCUUGUAGAU TGCACAGGGTGGAACAAGATGGAT (서열번호 79) | |
hCCR5_site1 D +44 | TAATTTCTACTCTTGTAGATTGCACAGGGTGGAACAAGATGGAT (서열번호 80) | |
hCCR5_site2 D +0 | TTTT GTGGGCAACATGCTGGTCATCCTC (서열번호 81) | UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGGUCAUCCUC (서열번호 82) |
hCCR5_site2 D +8 | UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUGG TCATCCTC (서열번호 83) | |
hCCR5_site2 D +9 | UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCUG GTCATCCTC (서열번호 84) | |
hCCR5_site2 D +10 | UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGCU GGTCATCCTC (서열번호 85) | |
hCCR5_site2 D +11 | UAAUUUCUACUCUUGUAGAUGUGGGCAACAUGC TGGTCATCCTC (서열번호 86) | |
hCCR5_site2 D +12 | UAAUUUCUACUCUUGUAGAUGUGGGCAACAUG CTGGTCATCCTC (서열번호 87) | |
hCCR5_site2 D + 16 | UAAUUUCUACUCUUGUAGAUGUGGGCAA CATGCTGGTCATCCTC (서열번호 88) | |
hCCR5_site2 D +20 | UAAUUUCUACUCUUGUAGAUGUGG GCAACATGCTGGTCATCCTC (서열번호 89) | |
hCCR5_site2 D +24 | UAAUUUCUACUCUUGUAGAU GTGGGCAACATGCTGGTCATCCTC (서열번호 90) | |
hCCR5_site2 D +44 | TAATTTCTACTCTTGTAGATGTGGGCAACATGCTGGTCATCCTC (서열번호 91) | |
hIL12A-AS1 D +0 | TTTA GGATGCCACTAAAAGGGAAAGGGG (서열번호 92) | UAAUUUCUACUCUUGUAGAUGGAUGCCACUAAAAGGGAAAGGGG (서열번호 93) |
hIL12A-AS1 D +8 | UAAUUUCUACUCUUGUAGAUGGAUGCCACUAAAAGG GAAAGGGG (서열번호 94) | |
hIL12A-AS1 D +12 | UAAUUUCUACUCUUGUAGAUGGAUGCCACUAA AAGGGAAAGGGG (서열번호 95) | |
hIL12A-AS1 D +16 | UAAUUUCUACUCUUGUAGAUGGAUGCCA CTAAAAGGGAAAGGGG (서열번호 96) | |
hIL12A-AS1 D +20 | UAAUUUCUACUCUUGUAGAUGGAU GCCACTAAAAGGGAAAGGGG (서열번호 97) | |
hIL12A-AS1 D +24 | UAAUUUCUACUCUUGUAGAU GGATGCCACTAAAAGGGAAAGGGG (서열번호 98) | |
hIL12A-AS1 D +44 | TAATTTCTACTCTTGTAGATGGATGCCACTAAAAGGGAAAGGGG (서열번호 99) | |
hAAVS1 D +0 | TTTG CTTACGATGGAGCCAGAGAGGATC (서열번호 100) | UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAGAGAGGAUC (서열번호 101) |
hAAVS1 D +8 | UAAUUUCUACUCUUGUAGAUCUUACGAUGGAGCCAG AGAGGATC (서열번호 102) | |
hFANCF D +0 | TTTG GGCGGGGTCCAGTTCCGGGATTAG (서열번호 103) | UAAUUUCUACUCUUGUAGAUGGCGGGGUCCAGUUCCGGGAUUAG (서열번호 104) |
hFANCF D +8 | UAAUUUCUACUCUUGUAGAUGGCGGGGUCCAGUUCC GGGATTAG (서열번호 105) |
a) 타겟 DNA 유전자내의 PAM 염기서열(TTTN)은 굵은 글씨 및 밑줄로 표시되었음.
b) 키메릭 가이드의 RNA는 굵은 글씨로 DNA는 밑줄 및 기울임 글씨로 표시되었음.
<
실시예
5>
키메릭
DNA-RNA 가이드 이용 표적 염기서열에 대한
AsCas12a
시스템과 enhanced-
AsCas12a
시스템의 절단 효율 비교
키메릭 DNA-RNA 가이드를 사용하는 AsCpf1 및 enAsCpf1 시스템의 절단 효율 비교를 위해서, hDNMT1_site1 유전자 및 CCR5_site2 유전자에서 다양한 키메릭 DNA-RNA 가이드를 사용하여 on target 절단 효율을 각각 측정하였다.
구체적으로, 각 유전자위(hDNMT1_site1 및 CCR5_site2)에 해당하는 DNA primer를 표 6과 같이 제조하였다.
유전자 위치 및 프라이머 방향 | DNA 염기서열 (5' to 3') |
hDNMT1_site1_on-target F1 | GGAGATCAAGCTTTGTATGTTG (서열번호 106) |
hDNMT1_site1_on-target R1 | CCAGAATGCACAAAGTACTGC (서열번호 107) |
hDNMT1_site1_on-target F2 | CTGTGAGGATTGAGTGAGTTG (서열번호 108) |
hDNMT1_site1_on-target R2 | CACACATGTGAACGGACAGA (서열번호 109) |
hCCR5_site2_on-target F1 | TGAGATGGTGCTTTCATGAAT (서열번호 110) |
hCCR5_site2_on-target R1 | GAAAATGAGAGCTGCAGGTG (서열번호 111) |
hCCR5_site2_on-target F2 | AAACTTCATTGCTTGGCCAA (서열번호 112) |
hCCR5_site2_on-target R2 | GAAGATTCCAGAGAAGAAGCC (서열번호 113) |
*목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정보임.
그리고 나서, genomic DNA(HEK293FT)로부터 PCR amplicon(hDNMT1_site1 및 CCR5_site2)을 얻었다. 정제된 재조합 Cas12a(AsCpf1)와 각 유전자위에 해당하는 synthesised chimeric crRNA-DNA(purchased from Bioneer) 혹은 정제된 crRNA를 premix하고, cleavage buffer(NEB3, 10㎕ volumn) 조건에서 37℃, 1hour incubation하였다. 반응 이후, stop buffer(100mM EDTA, 1.2% SDS)를 넣어서 반응을 중지시키고, 2% agarose gel 전기영동으로 DNA 절단 여부를 확인하였다. DNA cleavage 효율은, 절단된 이미지 패턴을 imageJ software를 사용하여 측정된 band intensity profile 값을 공식(Intensity of the cleaved fragment/total sum of the fragment intensity * 100 =%)에 따라 계산하였다.
그 결과를 도 7에 나타내었다.
도 7에서는 키메릭 DNA-RNA 가이드와 관련하여 crRNA의 3'말단부터 다양한 길이의 연속된 DNA를 붉은색으로 기재하고, D+N은 가이드 RNA내에서 각각의 치환된 DNA 개수를 나타내도록 기재하였다(D+0: WT-crRNA, NC: negative control).
도 7에서 확인할 수 있는 바와 같이, 본 발명에 따른 enAsCpf1 시스템을 사용하는 경우, AsCpf1와 대비하여 hDNMT1_site1 및 CCR5_site2 유전자에서 보다 우수한 절단 효율을 나타내었다.
구체적으로, enAsCpf1 시스템을 사용하여 D+4부터 D+16까지 우수한 절단 효능을 나타내었다. 이러한 효과의 경우 AsCpf1와 대비하여 hDNMT1_site1 및 CCR5_site2 유전자에서 보다 높게 나타나는 것으로, 본원 발명에 따른 우수한 효과를 확인하였다.
<
실시예
6>
키메릭
DNA-RNA 가이드 이용 표적 염기서열에 대한
AsCas12a
시스템과 enhanced-
AsCas12a
시스템의 게놈 편집 활성 최적화
키메릭 DNA-RNA 가이드를 기반으로 조작된 enhanced-AsCas12a 이펙터가 인간 세포에서 표적 유전자 돌연변이를 효과적으로 유도할 수 있는지 확인하기 위하여, DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자에서 다양한 키메릭 DNA-RNA 가이드를 사용하여 on target 절단 효율을 각각 측정하였다.
구체적으로, 각 유전자위(DNMT1_site1, IL12A-AS1 및 CCR5_site1)에 해당하는 DNA primer를 표 7과 같이 제조하였다.
유전자 위치 및 프라이머 방향 | DNA 염기서열 (5' to 3') |
hDNMT1_site1_on-target F1 | GGAGATCAAGCTTTGTATGTTG (서열번호 106) |
hDNMT1_site1_on-target R1 | CCAGAATGCACAAAGTACTGC (서열번호 107) |
hDNMT1_site1_on-target F2 | CTGTGAGGATTGAGTGAGTTG (서열번호 108) |
hDNMT1_site1_on-target R2 | CACACATGTGAACGGACAGA (서열번호 109) |
hIL12A-AS1_on-target F | GCTTGCTGTATACACAAGGC (서열번호 114) |
hIL12A-AS1_on-target R | CTGATCTTGAGAACAGAAGACC (서열번호 115) |
hCCR5_site1_on-target F | ACCATGCTTGACCCAGTTTC (서열번호 116) |
hCCR5_site1_on-target R | AAACACAGCATGGACGACAG (서열번호 117) |
*목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정 보임.
그리고 나서, genomic DNA(HEK293FT)로부터 PCR amplicon(hDNMT1_site1 및 CCR5_site2)을 얻었다. 정제된 재조합 Cas12a(AsCpf1)와 각 유전자위에 해당하는 synthesised chimeric crRNA-DNA(purchased from Bioneer) 혹은 정제된 crRNA를 premix하고, cleavage buffer(NEB3, 10㎕ volumn) 조건에서 37℃, 1hour incubation하였다. 반응 이후, stop buffer(100mM EDTA, 1.2% SDS)를 넣어서 반응을 중지시키고, 2% agarose gel 전기영동으로 DNA 절단 여부를 확인하였다. DNA cleavage 효율은, 절단된 이미지 패턴을 imageJ software를 사용하여 측정된 band intensity profile 값을 공식(Intensity of the cleaved fragment/total sum of the fragment intensity * 100 =%)에 따라 계산하였다.
그 결과를 도 8에 나타내었다.
도 8에서 확인할 수 있는 바와 같이, 세포내 유전자좌를 표적으로 하는 유전자 돌연변이의 유도는 상기한 앰플리콘 절단과는 다른 경향을 보였다. 즉, 본 발명에 따른 enAsCpf1 시스템을 사용하는 경우, AsCpf1와 대비하여 DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자에서 보다 우수한 절단 효율을 나타내었다.
구체적으로, enAsCpf1 시스템을 사용하여 D+4부터 D+8까지 우수한 절단 효능을 나타내었다. 이러한 효과의 경우 AsCpf1와 대비하여 DNMT1_site1, IL12A-AS1 및 CCR5_site1 유전자에서 보다 높게 나타나는 것으로, 본원 발명에 따른 인간 세포 내에서의 우수한 효과를 확인하였다.
<
실시예
7>
AsCas12a와
enhanced-
AsCas12a
시스템의
키메릭
DNA-RNA 가이드 사용
인체유래
세포주내
유전자상 표적 염기서열(
DNMT1
_
site2
,
CCR5
_
site1
, CCR5_site2,
AAVS1
및
FANCT
)에 대한 작동효율 및 표적 특이성 비교
(1)
HEK293FT
세포주 내에서 실험 수행
인체유래 세포주 내 (HEK293FT)에서, 키메릭 DNA-RNA 기반 AsCas12a 시스템과 enhanced-AsCas12a (E174R, S542R, K548R) 시스템 간의 표적/비표적 염기서열 교정 효율을 비교하기 위하여, DNMT1_site2, CCR5_site1, CCR5_site2, AAVS1 및 FANCT에 절단을 유도한 뒤, 상기 실시예 3의 방법과 동일한 방법을 이용하여 작동 효율 및 표적 특이성을 비교하였다.
목표 유전자의 교정 부위의 정확한 염기서열을 확인하기 위하여 표적/비표적 유전자위에 해당하는 DNA primer를 표 8과 같이 제조하였다.
유전자 위치 및 프라이머 방향 |
DNA 염기서열 (5' to 3') |
hDNMT1_site1_on-target F1 | GGAGATCAAGCTTTGTATGTTG (서열번호 106) |
hDNMT1_site1_on-target R1 | CCAGAATGCACAAAGTACTGC (서열번호 107) |
hDNMT1_site1_on-target F2 | CTGTGAGGATTGAGTGAGTTG (서열번호 108) |
hDNMT1_site1_on-target R2 | CACACATGTGAACGGACAGA (서열번호 109) |
hDNMT1_site1_on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GGAGTGTTCAGTCTCCGTGA (서열번호 118) |
hDNMT1_site1_on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCTTAGCAGCTTCCTCCTC (서열번호 119) |
hDNMT1_site1_off-target F | CAGGGGTATTTTCCTTCAAGA (서열번호 120) |
hDNMT1_site1_off-target R | TCAGGAATACCAACATGGAAAA (서열번호 121) |
hDNMT1_site1_off-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT TGTGTGTCTGCTGGAAGCTC (서열번호 122) |
hDNMT1_site1_off-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCAGATAGGGTCTGTGCTC (서열번호 123) |
hDNMT1_site2_on-target F | ACACAACAGCTTCATGTCAG (서열번호 124) |
hDNMT1_site2_on-target R | TTGGCTTGGAGATCAAGCTT (서열번호 125) |
hDNMT1_site2_on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GCAGAGTGCTAAGGGAACGT (서열번호 126) |
hDNMT1_site2_on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAGTGCTTAGAGCAGGCGTG (서열번호 127) |
hDNMT1_site2_off-target F1 | CTGAGCTGGTATCCAAGATGC (서열번호 128) |
hDNMT1_site2_off-target R1 | GCATTGTCATTAGAACCACAAATC (서열번호 129) |
hDNMT1_site2_off-target Adaptor_F1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GCAGAAGTGAGTCTTGCTGAG (서열번호 130) |
hDNMT1_site2_off-target Adaptor_R1 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGAATCTGTGCACTCGGAG (서열번호 131) |
hDNMT1_site2_off-target F2 | GTTGCAGTGAGCCAAGATCA (서열번호 132) |
hDNMT1_site2_off-target R2 | TCTTGGAACCAATCCTCTGC (서열번호 133) |
hDNMT1_site2_off-target Adaptor_F2 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT AAGCAGTGCTTCTCCATTGAG (서열번호 134) |
hDNMT1_site2_off-target Adaptor_R2 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTACGCCATGGGTGATAGTG (서열번호 135) |
hDNMT1_site2_off-target F3 | GCAACCAGATTTTTCCTCCA (서열번호 136) |
hDNMT1_site2_off-target R3 | CCAAGCCGTTACAGATGGTT (서열번호 137) |
hDNMT1_site2_off-target Adaptor_F3 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GGCAATGGACTCTGGGATAG (서열번호 138) |
hDNMT1_site2_off-target Adaptor_R3 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCGGGTTGTGAACAGGAAACT (서열번호 139) |
hCCR5_site1_on-target F | ACCATGCTTGACCCAGTTTC (서열번호 116) |
hCCR5_site1_on-target R | AAACACAGCATGGACGACAG (서열번호 117) |
hCCR5_site1_on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CAATGTAGACATCTATGTAGGCAA (서열번호 140) |
hCCR5_site1_on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTGCGATTTGCTTCACATTG (서열번호 141) |
hCCR5_site1_off-target F1 | CAAGCAATTCTTGTGCCTCA (서열번호 142) |
hCCR5_site1_off-target R1 | TCCAGGCCCTGTATACTTGC (서열번호 143) |
hCCR5_site1_off-target Adaptor_F1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT AGGGTCAACATTGCAAGGAG (서열번호 144) |
hCCR5_site1_off-target Adaptor_R1 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTCAAAGCCATTCTGGAAAAGA (서열번호 145) |
hCCR5_site1_off-target F2 | CATGGTGAAACCCCAACTCT (서열번호 146) |
hCCR5_site1_off-target R2 | CCAAATCCCACACTTTGCTT (서열번호 147) |
hCCR5_site1_off-target Adaptor_F2 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GCTCAACTGTATTGAGAGGAAGC (서열번호 148) |
hCCR5_site1_off-target Adaptor_R2 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTCTGGTGGATAAGAAGGAATTTT (서열번호 149) |
hCCR5_site2_on-target F1 | TGAGATGGTGCTTTCATGAAT (서열번호 110) |
hCCR5_site2_on-target R1 | GAAAATGAGAGCTGCAGGTG 서열번호 111) |
hCCR5_site2_on-target F2 | AAACTTCATTGCTTGGCCAA (서열번호 112) |
hCCR5_site2_on-target R2 | GAAGATTCCAGAGAAGAAGCC (서열번호 113) |
hCCR5_site2_on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CCTGCCAAAAAATCAATGTGAAG (서열번호 150) |
hCCR5_site2_on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAGGGGACAGTAAGAAGGAA (서열번호 151) |
hCCR5_site2_off-target F | GAAAATGGCTGTTGGGTAAATC (서열번호 152) |
hCCR5_site2_off-target R | TAAGGGCCACAGACATAAAC (서열번호 153) |
hCCR5_site2_off-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT TCCCTGTCATAAATTTGACGTG (서열번호 154) |
hCCR5_site2_off-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAAAAGCAGATCAGAGATGGC (서열번호 155) |
hAAVS1_ on-target F | CCTGGTGAACACCTAGGACG (서열번호 156) |
hAAVS1_ on-target R | CTATGTCCACTTCAGGACAGC (서열번호 157) |
hAAVS1_ on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CTTCCCTCCCACCCCCTG (서열번호 158) |
hAAVS1_ on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCCATCCTTAGGCCTCCT (서열번호 159) |
hAAVS1_ off-target F1 | AGCAGGTTGGGTATCCTGTG (서열번호 160) |
hAAVS1_ off-target R1 | AGGCTGTTTCTGCCTCCATA (서열번호 161) |
hAAVS1_ off-target Adaptor_F1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CCATCTCCTGGTCTGCACAA (서열번호 162) |
hAAVS1_ off-target Adaptor_R1 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAAGGGGCTATTCAGATGT (서열번호 163) |
hAAVS1_ off-target F2 | ATCCAGGGGGTTGGAATATC (서열번호 164) |
hAAVS1_ off-target R2 | TGCCTGAGAGCAGGTCTTTT (서열번호 165) |
hAAVS1_ off-target Adaptor_F2 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GGTTATCTGTTAATGATAGCCTG (서열번호 166) |
hAAVS1_ off-target Adaptor_R2 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCACAAGCCCATGAAGACTGG (서열번호 167) |
hIL12A-AS1_on-target F | GCTTGCTGTATACACAAGGC (서열번호 114) |
hIL12A-AS1_on-target R | CTGATCTTGAGAACAGAAGACC (서열번호 115) |
hIL12A-AS1_on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GAAAAGGTGTTGCTTATTGCCC (서열번호 168) |
hIL12A-AS1_on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCTCCTTCCATCTGGGTTTC (서열번호 169) |
hIL12A-AS1_off-target F1 | ATTCTGCCTCCTCTCCCACT (서열번호 170) |
hIL12A-AS1_off-target R1 | CAGGAGGAGCAAATTCCAGA (서열번호 171) |
hIL12A-AS1_off-target Adaptor_F1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GGTCCTAACAGAGATTTACTTTCTC (서열번호 172) |
hIL12A-AS1_off-target Adaptor_R1 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCCCTCTCTCCCTTCCTCTC (서열번호 173) |
hIL12A-AS1_off-target F2 | GCATCAACAAACTGGCTCATT (서열번호 174) |
hIL12A-AS1_off-target R2 | CCTTTGGGATGGTGTCATCT (서열번호 175) |
hIL12A-AS1_off-target Adaptor_F2 | ACACTCTTTCCCTACACGACGCTCTTCCGATCT GCCACTGCTAATGTTTAAAATTC (서열번호 176) |
hIL12A-AS1_off-target Adaptor_R2 | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTTAGGGCAGCATTTTGTAG (서열번호 177) |
hFANCF_on-target F | CACGGATAAAGACGCTGGGA (서열번호 178) |
hFANCF_on-target R | CACAGGCTGCTGAGAAACCT (서열번호 179) |
hFANCF_on-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CACATCCATCGGCGCTTTG (서열번호 180) |
hFANCF_on-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGTGGTAACGAGCTGCATCC (서열번호 181) |
hFANCF_off-target F | TGGGAGGAAACCCTAAAGAG (서열번호 182) |
hFANCF_off-target R | TGCAGGCCCAAGTATTTTGA (서열번호 183) |
hFANCF_off-target Adaptor_F | ACACTCTTTCCCTACACGACGCTCTTCCGATCT CAGCTGACTCAGCTGAACTG (서열번호 184) |
hFANCF_off-target Adaptor_R | GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTCTGGTGTGTTATGCCTGT (서열번호 185) |
IVT_AsCas12a_hDNMT1_site1_sense | CGAGTAACAGACATGGACCATCAGATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 186) |
IVT_AsCas12a_hDNMT1_site2_sense | AGCTGAGGCAGGTGCCTGCTGAGCATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 187) |
IVT_AsCas12a_hCCR5_site1_sense | ATCCATCTTGTTCCACCCTGTGCAATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 188) |
IVT_AsCas12a_hCCR5_site2_sense | GAGGATGACCAGCATGTTGCCCACATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 189) |
IVT_AsCas12a_hAAVS1_sense | GATCCTCTCTGGCTCCATCGTAAGATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 190) |
IVT_AsCas12a_hIL12A-AS1_sense | CCCCTTTCCCTTTTAGTGGCATCCATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 191) |
IVT_AsCas12a_hFANCF_sense | CTAATCCCGGAACTGGACCCCGCCATCTACAAGAGTAGAAATTACCCTATAGTGAGTCGTATTAATTTC (서열번호 192) |
IVT_AsCas12a_universial_antisense | GAAATTAATACGACTCACTATAGGG (서열번호 193) |
IVT_SpCas9_hDNMT1_site1_sgRNA_sense | GAAATTAATACGACTCACTATAGGAGTGCTAAGGGAACGTTCAGTTTTAGAGCTAGAAATAGCAAG (서열번호 194) |
IVT_SpCas9_hDNMT1_site2_sgRNA_sense | GAAATTAATACGACTCACTATAGCCAGCAGCCAACCTGACCAAGTTTTAGAGCTAGAAATAGCAAG (서열번호 195) |
IVT_SpCas9_hCCR5_site1_sgRNA_sense | GAAATTAATACGACTCACTATAGTAATAATTGATGTCATAGATGTTTTAGAGCTAGAAATAGCAAG (서열번호 196) |
IVT_SpCas9_hCCR5_site2_sgRNA_sense | GAAATTAATACGACTCACTATAGAACACCAGTGAGTAGAGCGGGTTTTAGAGCTAGAAATAGCAAG (서열번호 197) |
IVT_SpCas9_hAAVS1_sgRNA_sense | GAAATTAATACGACTCACTATAGGCAAGGAGAGAGATGGCTCCGTTTTAGAGCTAGAAATAGCAAG (서열번호 198) |
IVT_SpCas9_hIL12A-AS1_sgRNA_sense | GAAATTAATACGACTCACTATAGTTCTGGGGTCAACATCTTGGGTTTTAGAGCTAGAAATAGCAAG (서열번호 199) |
IVT_SpCas9_hFANCF_sgRNA_sense | GAAATTAATACGACTCACTATAGCCGCTCCAGAGCCGTGCGAAGTTTTAGAGCTAGAAATAGCAAG (서열번호 200) |
IVT_SpCas9_universial_antisense | AAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC (서열번호 201) |
목표 유전자를 증폭하기 위한 각각의 유전자에 대한 프라이머 염기서열 정보를 표시하였다. 차세대 염기서열 분석에 사용된 정방향 어답터(forward adaptor 녹색), 역방향 어답터(reverse adaptor 파란색) 프라이머의 염기서열은 각각 기울임, 밑줄 및 굵은 글씨 표시; 밑줄 글씨 표시로 기재하였다.
도 9는 인간 세포주(HEK293FT)에서 내인성 표적(DNMT1-site2)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.
도 9에서 확인할 수 있는 바와 같이, DNMT1 - site2는 Cas12a 시스템이 표적으로 하는 AAVS1 - site1 유전자좌와 동일한 경향을 나타냈다. 구체적으로, 도 9의 A 및 B에서 확인할 수 있는 바와 같이, 3' 말단에 8nt DNA 치환을 갖는 키메라 DNA-RNA 가이드를 기반으로 하는 enAsCas12a 이펙터의 경우, 인델 비율(%)이 wt-AsCas12a에 비해 유의하게 증가(1.9배)되었다. 또한, 표적을 벗어난 뉴클레오티드 서열에 의해 유도된 돌연변이가 극적으로 감소하였다.
즉, AsCas12a과 enAsCas12a 시스템을 비교할 때 enAsCas12a 시스템의 경우 on-Target에 대한 indel ratio가 크게 증가하였다. 이러한 증가는 필연적으로 Off-target에 대한 문제를 가져올 수밖에 없는데, WT를 사용하여 enAsCas12a 시스템에서 나타나는 Off-target에 대한 절단 문제를 키메릭 DNA-RNA의 사용을 통해 해소하였음을 확인하였다.
또한, 도 9의 C에서 확인할 수 있는 바와 같이, 키메릭 가이드 사용 AsCas12a 시스템에서는 표적 서열 근처의 nickase에 의해서만 on-target 절단이 효율적으로 일어나는 반면, enAsCas12a 시스템에서는 nickase의 바인딩 없이 효율적인 on-target 절단이 일어나는 것을 확인하였다.
또한, 도 9의 D에서 확인할 수 있는 바와 같이, On-target/off-target 측면에 AsCpf1 사용 시스템은 키메릭 DNA-RNA와 WT 간의 특이도(Specificity)에 큰 차이가 없었던 반면, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 특이도가 현저히 상승함을 확인하였다. 즉, enAsCas12a 시스템에서 nickase의 사용에 관계없이 표적 특이성이 2배 증가하였음을 확인하였다.
도 10은 인간 세포주(HEK293FT)에서 내인성 표적(CCR5-site1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.
구체적으로, 도 10의 A에서 확인할 수 있는 바와 같이, CCR5-site1의 wt-Cas12a 기반 표적화의 경우, 표적 돌연변이 유도 효율은 키메라 DNA-RNA의 사용에 의해 크게 감소하였다. 또한, 도 10의 B에서 확인할 수 있는 바와 같이, nickase-dependent 방식으로 돌연변이 유도 효율이 회복된 wt-AsCas12a와 달리 en-AsCas12a의 경우 3' 말단이 8nt DNA로 치환된 chimeric DNA-RNA를 사용하여 표적 돌연변이 효율을 nickase-independent 방식으로 유지할 수 있었다.
또한, 도 10의 C에서 확인할 수 있는 바와 같이, enAsCas12a 시스템에서 nickase 의존도가 11.25배 감소함을 확인함으로써, 키메릭 가이드 사용 AsCas12a 시스템에서는 표적 서열 근처의 nickase에 의해서만 on-target 절단이 효율적으로 일어나는 반면, enAsCas12a 시스템에서는 nickase의 바인딩 없이 효율적인 on-target 절단이 일어나는 것을 확인하였다.
또한, 도 10의 D에서 확인할 수 있는 바와 같이, enAsCas12a를 사용하여 표적 특이성이 2.79배 증가하였고, 표적 염기서열 부근의 염색체 위상이 nickase를 사용하여 변경되었을 때 키메라 DNA-RNA를 사용한 표적 특이성은 wt-AsCas12a의 표적 특이성에 비해 3.45배 더 증가하였음을 확인하였다.
도 11은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(CCR5-site1)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.
도 12는 인간 세포주(HEK293FT)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다. 구체적으로, 도 12의 A 및 B에서 확인할 수 있는 바와 같이, AAVS1-site1 서열을 표적화하기 위해 enAsCas12a 이펙터를 사용할 때, 인델 비율(%)은 wt-Cas12a보다 3.6배 더 높게 나타났다.
반면, 오프 타겟 시퀀스(off-target1)에는 의도하지 않은 돌연변이가 더 많이 있었다. 다만, 3' 말단이 8nt DNA로 치환된 키메라 DNA-RNA를 사용함으로써 off-target1 서열에서 유도된 돌연변이의 수를 유의하게 감소시킬 수 있었다.
또한, 도 12의 C에서 확인할 수 있는 바와 같이, AAVS1 _site1에서 키메라 DNA-RNA 가이드를 사용한 경우, enAsCas12a 및 wt-AsCas12a 이펙터 모두 nickase 의존성을 나타내지 않았다.
또한, 도 12의 D에서 확인할 수 있는 바와 같이, 키메라 DNA-RNA(8DNA) 가이드된 enAsCas12a를 사용하는 경우 전체 표적 특이성이 wt-AsCas12a에 비해 3.5배 증가하였다.
도 13은 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적 염기서열(AAVS1)에 대한 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.
한편, wt-AsCas12a 또는 enAsCas12a를 사용하여 다양한 유전자를 표적으로 하는 돌연변이 유도 효과를 한 눈에 보기 위해 데이터를 요약하여, 도 14에 나타내었다. 도 14는 AsCas12a과 enAsCas12a 시스템의 키메릭 DNA-RNA 가이드 사용시 인체 유래 세포주내 유전자 상 표적/비표적 염기서열(AAVS1, CCR5_site1, CCR_site2, DNMT1_site1, DNMT1_site2, FANCF 및 IL12A_AS1)에 대한 작동효율을 비교한 결과를 나타낸다.
구체적으로, 도 14에서 확인할 수 있는 바와 같이, chimeric DNA-RNA-guided en-AsCas12a를 이용하여 다중 유전자의 돌연변이를 유도함으로써 nickase의 도움 없이 표적 indel 비율(%)이 평균 2.6배 향상되었으며, 오프 타겟 돌연변이 유도 효율도 감소하였다. 이에 따라, 표적 특이성은 wt-AsCas12a에 비해 2.8배 향상되었다.
이러한 결과는, chimeric-crRNA 기반 en-AsCas12a를 이용하여 표적 DNA에 돌연변이를 유도할 경우, 상이한 세포주에서 다양한 유전자에 대한 표적 돌연변이 활성을 유지하면서 오프-타겟팅 효과를 감소시킬 수 있음을 의미하는 것이다.
(2)
HeLa
및 K562
세포주 내에서 실험 수행
인체유래 세포주 내 (HeLa 및 K562)에서, 키메릭 DNA-RNA 기반 AsCas12a 시스템과 enhanced-AsCas12a (E174R, S542R, K548R) 시스템 간의 표적/비표적 염기서열 교정 효율을 비교하기 위하여, AAVS1에 절단을 유도한 뒤, 상기 실시예 3의 방법과 동일한 방법을 이용하여 작동 효율 및 표적 특이성을 비교하였다.
도 15는 인간 세포주(HeLa, K562)에서 내인성 표적(AAVS1)에 대한 wt-AsCas12a 시스템과 enhanced-AsCas12a 시스템의 작동효율 및 표적 특이성을 비교한 결과를 나타낸다.
구체적으로, 도 15의 A 및 C에서 확인할 수 있는 바와 같이, 3' 말단에 8nt DNA 치환을 갖는 키메라 DNA-RNA 가이드를 기반으로 하는 enAsCas12a 이펙터의 경우, 상기 HEK293FT 세포주에서와 동일하게 인델 비율(%)이 wt-AsCas12a에 비해 유의하게 증가되었다. 또한, 표적을 벗어난 뉴클레오티드 서열에 의해 유도된 돌연변이가 극적으로 감소하였다.
즉, AsCas12a과 enAsCas12a 시스템을 비교할 때 enAsCas12a 시스템의 경우 on-Target에 대한 indel ratio가 크게 증가하였다. 이러한 증가는 필연적으로 Off-target에 대한 문제를 가져올 수밖에 없는데, WT를 사용하여 enAsCas12a 시스템에서 나타나는 Off-target에 대한 절단 문제를 키메릭 DNA-RNA의 사용을 통해 해소하였음을 확인하였다.
또한, 도 15의 B 및 D에서 확인할 수 있는 바와 같이, On-target/off-target 측면에 AsCpf1 사용 시스템은 상기 HEK293FT 세포주에서와 동일하게 키메릭 DNA-RNA와 WT 간의 특이도(Specificity)에 큰 차이가 없거나, 오히려 키메릭 DNA-RNA이용시 특이도가 현저히 감소하는 반면, enAsCpf1의 경우 키메릭 DNA-RNA 사용에 따라 특이도가 현저히 상승함을 확인하였다. 즉, enAsCas12a 시스템에서 nickase의 사용에 관계없이 표적 특이성이 2배 이상 증가하였음을 확인하였다.
이제까지 본 발명에 대하여 그 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
<110> Korea Research Institute of Bioscience and Biotechnology
<120> Composition for Genome Editing or Inhibiting Gene Expression
comprising Cpf1 and Chimeric DNA-RNA Guide
<130> P22021-KRIBB-PA
<150> KR 10-2021-0078378
<151> 2021-06-17
<160> 201
<170> KoPatentIn 3.0
<210> 1
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> WT
<400> 1
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 2
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> WT
<400> 2
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttatg agaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcctctggct gggacgtgaa taaggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 3
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> S170R/E174R
<400> 3
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 4
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> S170R/E174R
<400> 4
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 5
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> E174R/K548R
<400> 5
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 6
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> E174R/K548R
<400> 6
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 7
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> S170R/K548R
<400> 7
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 8
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> S170R/K548R
<400> 8
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 9
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> E174R/S542R
<400> 9
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 10
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> E174R/S542R
<400> 10
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 11
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> S170R/S542R
<400> 11
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 12
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> S170R/S542R
<400> 12
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 13
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> E174R/S542R/K548R
<400> 13
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 14
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> E174R/S542R/K548R
<400> 14
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 15
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> E174R/N551R
<400> 15
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Arg Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 16
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> E174R/N551R
<400> 16
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aggaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 17
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> S170R/N551R
<400> 17
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Arg Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Arg Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 18
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> S170R/N551R
<400> 18
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttcagg ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aggaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 19
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> S542R/K548R
<400> 19
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 20
<211> 3921
<212> DNA
<213> Artificial Sequence
<220>
<223> S542R/K548R
<400> 20
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 21
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1 target DNA
<400> 21
tttcctgatg gtccatgtct gttactcg 28
<210> 22
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +0
<400> 22
uaauuucuac ucuuguagau cugauggucc augucuguua cucg 44
<210> 23
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +4
<220>
<223> Chimeric DNA-RNA
<400> 23
uaauuucuac ucuuguagau cugauggucc augucuguua ctcg 44
<210> 24
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +8
<220>
<223> Chimeric DNA-RNA
<400> 24
uaauuucuac ucuuguagau cugauggucc augucugtta ctcg 44
<210> 25
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +12
<220>
<223> Chimeric DNA-RNA
<400> 25
uaauuucuac ucuuguagau cugauggucc augtctgtta ctcg 44
<210> 26
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +16
<220>
<223> Chimeric DNA-RNA
<400> 26
uaauuucuac ucuuguagau cugauggucc atgtctgtta ctcg 44
<210> 27
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +20
<220>
<223> Chimeric DNA-RNA
<400> 27
uaauuucuac ucuuguagau cugatggtcc atgtctgtta ctcg 44
<210> 28
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +24
<220>
<223> Chimeric DNA-RNA
<400> 28
uaauuucuac ucuuguagau ctgatggtcc atgtctgtta ctcg 44
<210> 29
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1 D +44
<400> 29
taatttctac tcttgtagat ctgatggtcc atgtctgtta ctcg 44
<210> 30
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 target DNA
<400> 30
tttggtcggc atggccccat tcgcacgg 28
<210> 31
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hCCR5 D +0
<400> 31
uaauuucuac ucuuguagau gugggcaaca ugcuggucau ccuc 44
<210> 32
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5 D +8
<220>
<223> Chimeric DNA-RNA
<400> 32
uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44
<210> 33
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 target DNA
<400> 33
tttggtgctc aatgaaagga gataaggt 28
<210> 34
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hAAVS1 D +0
<400> 34
uaauuucuac ucuuguagau cuuacgaugg agccagagag gauc 44
<210> 35
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hAAVS1 D +8
<220>
<223> Chimeric DNA-RNA
<400> 35
uaauuucuac ucuuguagau cuuacgaugg agccagagag gatc 44
<210> 36
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1 on-target F1
<400> 36
gttgcacgtg tcaagtgctt a 21
<210> 37
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1 on-target R1
<400> 37
ttaaaatcca gaatgcacaa agtact 26
<210> 38
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1 on-target F2
<400> 38
gtgaatttgg ctcagcaggc a 21
<210> 39
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1 on-target R2
<400> 39
aagcgaacct cacacaacag c 21
<210> 40
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 on-target F1
<400> 40
tgagatggtg ctttcatgaa t 21
<210> 41
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 on-target R1
<400> 41
gaaaatgaga gctgcaggtg 20
<210> 42
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 off-target F1
<400> 42
gaaaatggct gttgggtaaa tc 22
<210> 43
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 off-target R1
<400> 43
taagggccac agacataaac 20
<210> 44
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 on-target F1
<400> 44
cctggtgaac acctaggacg 20
<210> 45
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 on-target R1
<400> 45
ctatgtccac ttcaggacag c 21
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target1 F1
<400> 46
agcaggttgg gtatcctgtg 20
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target1 R1
<400> 47
aggctgtttc tgcctccata 20
<210> 48
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target2 F1
<400> 48
atccaggggg ttggaatatc 20
<210> 49
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target2 R1
<400> 49
tgcctgagag caggtctttt 20
<210> 50
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 on-target Adaptor_F
<400> 50
acactctttc cctacacgac gctcttccga tctcctgcca aaaaatcaat gtgaag 56
<210> 51
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 on-target Adaptor_R
<400> 51
gtgactggag ttcagacgtg tgctcttccg atctgaaggg gacagtaaga aggaa 55
<210> 52
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 off-target Adaptor_F
<400> 52
acactctttc cctacacgac gctcttccga tcttccctgt cataaatttg acgtg 55
<210> 53
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5 off-target Adaptor_R
<400> 53
gtgactggag ttcagacgtg tgctcttccg atctgaaaaa gcagatcaga gatggc 56
<210> 54
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 on-target Adaptor_F
<400> 54
acactctttc cctacacgac gctcttccga tctcttccct cccaccccct g 51
<210> 55
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 on-target Adaptor_R
<400> 55
gtgactggag ttcagacgtg tgctcttccg atctccccat ccttaggcct cct 53
<210> 56
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target1 Adaptor_F
<400> 56
acactctttc cctacacgac gctcttccga tctccatctc ctggtctgca caa 53
<210> 57
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target1 Adaptor_R
<400> 57
gtgactggag ttcagacgtg tgctcttccg atctcaaagg ggctattcag atgt 54
<210> 58
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target2 Adaptor_F
<400> 58
acactctttc cctacacgac gctcttccga tctggttatc tgttaatgat agcctg 56
<210> 59
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 off-target2 Adaptor_R
<400> 59
gtgactggag ttcagacgtg tgctcttccg atctcacaag cccatgaaga ctgg 54
<210> 60
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> NLS
<400> 60
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 61
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> NLS
<400> 61
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 62
<211> 1355
<212> PRT
<213> Artificial Sequence
<220>
<223> pET28-wt-AsCas12a
<400> 62
His His His His His His Val Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5 10 15
Glu Leu Pro Pro Lys Lys Lys Arg Lys Val Met Thr Gln Phe Glu Gly
20 25 30
Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg Phe Glu Leu Ile
35 40 45
Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln Gly Phe Ile Glu
50 55 60
Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu Lys Pro Ile Ile
65 70 75 80
Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln
85 90 95
Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu
100 105 110
Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr
115 120 125
Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr
130 135 140
Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys Gly Leu Phe Lys
145 150 155 160
Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu Gly Thr Val Thr
165 170 175
Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr
180 185 190
Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys Asn Val Phe Ser Ala
195 200 205
Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val Gln Asp Asn Phe
210 215 220
Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg Leu Ile Thr Ala
225 230 235 240
Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys Lys Ala Ile Gly
245 250 255
Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr
260 265 270
Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu
275 280 285
Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn
290 295 300
Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu Thr Ala His Ile
305 310 315 320
Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu
325 330 335
Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp
340 345 350
Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn
355 360 365
Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser
370 375 380
Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys Leu Glu Thr Ile
385 390 395 400
Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg Asn Ala Leu Tyr
405 410 415
Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys
420 425 430
Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile Asn Leu Gln Glu
435 440 445
Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys
450 455 460
Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu Asp Gln Pro Leu
465 470 475 480
Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln
485 490 495
Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp Trp Phe Ala Val
500 505 510
Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly
515 520 525
Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg
530 535 540
Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn
545 550 555 560
Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp Val Asn Lys Glu Lys
565 570 575
Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly
580 585 590
Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro
595 600 605
Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe
610 615 620
Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala
625 630 635 640
Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile Leu Leu Ser Asn
645 650 655
Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn
660 665 670
Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys
675 680 685
Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp
690 695 700
Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp
705 710 715 720
Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr
725 730 735
Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser Phe Gln Arg Ile
740 745 750
Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu
755 760 765
Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His His Gly Lys Pro
770 775 780
Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu
785 790 795 800
Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg
805 810 815
Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu Gly Glu Lys Met
820 825 830
Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu
835 840 845
Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu Ser His Asp Leu
850 855 860
Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile Thr Lys Glu Val
865 870 875 880
Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe
885 890 895
Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser
900 905 910
Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr
915 920 925
Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr
930 935 940
Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
945 950 955 960
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu
965 970 975
Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile Lys Asp
980 985 990
Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile Val Asp Leu
995 1000 1005
Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly
1010 1015 1020
Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln
1025 1030 1035 1040
Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp
1045 1050 1055
Tyr Pro Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr
1060 1065 1070
Asp Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu
1075 1080 1085
Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly
1090 1095 1100
Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg
1105 1110 1115 1120
Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr
1125 1130 1135
Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln
1140 1145 1150
Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys
1155 1160 1165
Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1170 1175 1180
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1185 1190 1195 1200
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly
1205 1210 1215
Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu Asn
1220 1225 1230
Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile Arg Ser Val
1235 1240 1245
Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn
1250 1255 1260
Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln
1265 1270 1275 1280
Asn Pro Glu Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile
1285 1290 1295
Ala Leu Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp
1300 1305 1310
Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile
1315 1320 1325
Gln Glu Leu Arg Asn Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp
1330 1335 1340
His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys
1345 1350 1355
<210> 63
<211> 4065
<212> DNA
<213> Artificial Sequence
<220>
<223> pET28-wt-AsCas12a
<400> 63
catcatcatc atcatcatgt gtacccctac gacgtgcccg actacgccga attgcctcca 60
aaaaagaaga gaaaggtaat gacacagttt gaaggcttca ccaatctcta ccaggtcagc 120
aagacgctac gttttgagct tatcccgcag ggaaaaaccc tgaaacacat tcaggaacag 180
gggttcatag aggaagataa ggcgcgtaac gaccattata aagaactgaa gcctataatc 240
gaccgtattt ataaaacgta cgcggatcag tgcctgcagc tggttcagct ggattgggag 300
aatctgtccg cggctattga tagctatcgc aaagagaaga ccgaggaaac ccgtaacgca 360
ctgattgaag agcaggcgac ctatcggaat gcgatccatg attacttcat cggccgcacc 420
gacaacctga ccgatgcaat taacaaacgt cacgcagaga tttacaaagg tctgtttaaa 480
gcagagttat tcaatggcaa ggttctgaaa cagctgggta cggtcaccac caccgaacac 540
gaaaacgcac tgctgaggag ctttgataaa tttaccacat atttcagcgg tttctatgaa 600
aatcgtaaga atgtatttag cgccgaagat atttccaccg caattcctca tcgtattgtg 660
caggataatt ttccgaagtt taaagaaaat tgtcatattt ttacccgtct gatcaccgcg 720
gtaccgagcc tgcgagagca ttttgaaaac gttaagaaag ccattggaat ttttgtcagt 780
accagcattg aagaagtgtt ttcgttcccg ttctataacc aactgctgac ccagacccag 840
attgatctgt acaatcagct gctggggggc ataagccgcg aggcaggtac cgaaaagata 900
aagggactca atgaggtgct gaatctggca attcagaaga atgatgagac ggctcatatc 960
attgctagcc tgccgcatcg tttcattccc ctgtttaagc aaatcctgag cgatcgcaat 1020
acactgagct ttatcctcga agagtttaaa tcggacgaag aagttatcca gagcttttgc 1080
aaatacaaaa ccctgctgcg gaacgaaaat gtgctggaga ccgctgaagc actgtttaat 1140
gaactgaact cgatcgacct cacccatatt tttatatccc acaaaaaact ggaaaccata 1200
agcagcgctc tgtgtgacca ttgggatacc ctgcgcaacg ccctgtatga acggcgtatc 1260
agcgagctga ccgggaaaat caccaaatcc gcaaaggaaa aagttcagcg tagtctgaaa 1320
cacgaggaca tcaacctgca agaaattatt agcgcagcag gtaaagagct gagcgaagca 1380
ttcaaacaga aaaccagcga aatcctgagc catgcccatg ctgcactgga tcagccgctg 1440
ccgaccaccc tgaaaaaaca ggaggaaaag gagattctga aaagccaact ggacagcctg 1500
ctgggcctgt atcacctgct ggactggttt gcagtcgatg agagcaacga ggttgatcct 1560
gagttctccg ctcgtctgac cggaatcaag ctggagatgg aaccgagtct gtcgttttac 1620
aataaagcgc gtaattacgc gaccaagaaa ccgtatagcg tggaaaaatt caaactgaac 1680
tttcagatgc cgacccttgc aagcggatgg gacgttaaca aagaaaaaaa caatggggca 1740
attctgtttg tgaaaaatgg cctctattat ctgggtatca tgccgaaaca gaaagggcgc 1800
tacaaagccc tgtcatttga gccgaccgag aaaacctcag agggtttcga caagatgtac 1860
tacgattatt tcccggatgc ggcaaaaatg atacccaaat gtagcaccca actgaaggca 1920
gttacagccc actttcagac ccataccacc ccgatcctgc tgtcgaacaa ttttatagag 1980
ccgctggaaa ttaccaaaga gatttatgat ctgaataatc cggaaaagga gcccaagaaa 2040
tttcagacgg cgtatgcaaa aaagaccggg gatcagaaag gttatcgtga agcgctgtgc 2100
aaatggattg actttacccg tgactttctg tcaaaatata ccaaaacgac gagcattgat 2160
ctgagcagcc tacgtccgag cagccaatat aaggatctgg gcgaatatta cgccgaactg 2220
aatccgctgc tctaccatat ttccttccaa cgaatcgctg aaaaagaaat aatggacgcc 2280
gttgaaaccg gcaaactgta tctgtttcaa atctacaaca aagatttcgc caaaggccat 2340
cacggtaagc cgaacctgca taccctgtat tggaccggtc tgtttagccc ggagaatctg 2400
gccaaaacca gcatcaagct gaacggacag gcagaactgt tttaccgccc caaaagccgt 2460
atgaaaagga tggcacaccg cctgggcgaa aaaatgctga ataagaaact caaagatcag 2520
aaaacgccga taccggatac cctttatcag gagctgtatg attatgttaa ccaccggctg 2580
agccatgacc tgagcgacga agcgcgtgca ctgctgccga acgtgattac caaggaagtc 2640
tcgcatgaaa ttattaaaga tcggcgcttc accagtgata aatttttctt ccatgtaccg 2700
atcaccctga attatcaagc cgcaaatagc ccttccaaat ttaatcaacg cgtgaatgcg 2760
tacctgaaag agcatccgga gaccccaatt attggcatag accgaggaga acgcaatctc 2820
atttatatca ccgtcattga tagcaccggt aagatcctgg aacagcgtag cctgaatacc 2880
attcagcagt ttgactacca gaaaaagctg gacaacagag aaaaggaacg tgtagccgcc 2940
cggcaggctt ggagtgtggt gggtactatc aaggatctga agcaggggta tctctcccaa 3000
gttatccatg aaattgtcga tctaatgatt cactatcaag cagtagtggt actggaaaat 3060
ctgaatttcg gtttcaaaag caaacgtaca gggatcgctg aaaaagccgt ttatcagcag 3120
ttcgagaaaa tgctgataga caagctgaat tgcctggttc tgaaagatta tccggcagag 3180
aaggtgggcg gtgtgctgaa cccgtaccag ctgactgatc aatttacgag ctttgcaaaa 3240
atgggaacgc agagcggttt cctgttctat gttccggcgc catataccag caagatagac 3300
ccgctgacag gtttcgtaga tccgtttgtc tggaaaacca ttaaaaatca tgaaagtcgc 3360
aaacattttc tggagggctt tgattttctg cactatgacg tgaaaaccgg cgacttcatt 3420
ctgcatttta aaatgaaccg taatctgtcc tttcagcgcg gcctgcctgg ctttatgccg 3480
gcgtgggaca ttgtttttga aaagaatgag acacagtttg atgccaaagg tacccccttt 3540
attgcgggga aacgcattgt gcccgttata gaaaatcacc gcttcaccgg acggtatagg 3600
gacttgtacc cggcaaatga attgatagcg ctgctggagg agaaaggtat tgtctttcgg 3660
gatggatcaa acatcctgcc gaagctgctg gagaacgatg acagccacgc aatagacacc 3720
atggtagcgc tgatccgaag cgtgctgcag atgcgtaaca gtaatgcggc tacgggggaa 3780
gactacatta atagcccggt ccgtgatctg aacggcgttt gtttcgatag cagatttcaa 3840
aatccggagt ggccgatgga tgccgatgcc aatggagctt accatatcgc tctcaaaggt 3900
cagctcctac tgaaccattt gaaagaatca aaagatctga aactgcagaa cggcatctcg 3960
aatcaggact ggctggccta cattcaagaa ctgagaaacg actacaaaga ccatgacggt 4020
gattataaag atcatgacat cgattacaag gatgacgatg acaag 4065
<210> 64
<211> 1355
<212> PRT
<213> Artificial Sequence
<220>
<223> pET28-en-AsCas12a
<400> 64
His His His His His His Val Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5 10 15
Glu Leu Pro Pro Lys Lys Lys Arg Lys Val Met Thr Gln Phe Glu Gly
20 25 30
Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg Phe Glu Leu Ile
35 40 45
Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln Gly Phe Ile Glu
50 55 60
Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu Lys Pro Ile Ile
65 70 75 80
Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln
85 90 95
Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu
100 105 110
Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr
115 120 125
Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr
130 135 140
Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys Gly Leu Phe Lys
145 150 155 160
Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu Gly Thr Val Thr
165 170 175
Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr
180 185 190
Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg Lys Asn Val Phe Ser Ala
195 200 205
Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val Gln Asp Asn Phe
210 215 220
Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg Leu Ile Thr Ala
225 230 235 240
Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys Lys Ala Ile Gly
245 250 255
Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr
260 265 270
Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu
275 280 285
Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn
290 295 300
Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu Thr Ala His Ile
305 310 315 320
Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu
325 330 335
Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp
340 345 350
Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn
355 360 365
Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser
370 375 380
Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys Leu Glu Thr Ile
385 390 395 400
Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg Asn Ala Leu Tyr
405 410 415
Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys
420 425 430
Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile Asn Leu Gln Glu
435 440 445
Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys
450 455 460
Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu Asp Gln Pro Leu
465 470 475 480
Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln
485 490 495
Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp Trp Phe Ala Val
500 505 510
Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly
515 520 525
Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg
530 535 540
Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn
545 550 555 560
Phe Gln Met Pro Thr Leu Ala Arg Gly Trp Asp Val Asn Arg Glu Lys
565 570 575
Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly
580 585 590
Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro
595 600 605
Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe
610 615 620
Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala
625 630 635 640
Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile Leu Leu Ser Asn
645 650 655
Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn
660 665 670
Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys
675 680 685
Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp
690 695 700
Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp
705 710 715 720
Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr
725 730 735
Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser Phe Gln Arg Ile
740 745 750
Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu
755 760 765
Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His His Gly Lys Pro
770 775 780
Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu
785 790 795 800
Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg
805 810 815
Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu Gly Glu Lys Met
820 825 830
Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu
835 840 845
Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu Ser His Asp Leu
850 855 860
Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile Thr Lys Glu Val
865 870 875 880
Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe
885 890 895
Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser
900 905 910
Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr
915 920 925
Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr
930 935 940
Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
945 950 955 960
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu
965 970 975
Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile Lys Asp
980 985 990
Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile Val Asp Leu
995 1000 1005
Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly
1010 1015 1020
Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln
1025 1030 1035 1040
Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp
1045 1050 1055
Tyr Pro Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr
1060 1065 1070
Asp Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu
1075 1080 1085
Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly
1090 1095 1100
Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg
1105 1110 1115 1120
Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr
1125 1130 1135
Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln
1140 1145 1150
Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys
1155 1160 1165
Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1170 1175 1180
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg
1185 1190 1195 1200
Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly
1205 1210 1215
Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu Asn
1220 1225 1230
Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile Arg Ser Val
1235 1240 1245
Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn
1250 1255 1260
Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln
1265 1270 1275 1280
Asn Pro Glu Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile
1285 1290 1295
Ala Leu Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp
1300 1305 1310
Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile
1315 1320 1325
Gln Glu Leu Arg Asn Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp
1330 1335 1340
His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys
1345 1350 1355
<210> 65
<211> 4065
<212> DNA
<213> Artificial Sequence
<220>
<223> pET28-en-AsCas12a
<400> 65
catcatcatc atcatcatgt gtacccctac gacgtgcccg actacgccga attgcctcca 60
aaaaagaaga gaaaggtaat gacacagttt gaaggcttca ccaatctcta ccaggtcagc 120
aagacgctac gttttgagct tatcccgcag ggaaaaaccc tgaaacacat tcaggaacag 180
gggttcatag aggaagataa ggcgcgtaac gaccattata aagaactgaa gcctataatc 240
gaccgtattt ataaaacgta cgcggatcag tgcctgcagc tggttcagct ggattgggag 300
aatctgtccg cggctattga tagctatcgc aaagagaaga ccgaggaaac ccgtaacgca 360
ctgattgaag agcaggcgac ctatcggaat gcgatccatg attacttcat cggccgcacc 420
gacaacctga ccgatgcaat taacaaacgt cacgcagaga tttacaaagg tctgtttaaa 480
gcagagttat tcaatggcaa ggttctgaaa cagctgggta cggtcaccac caccgaacac 540
gaaaacgcac tgctgaggag ctttgataaa tttaccacat atttcagcgg tttctatcgt 600
aatcgtaaga atgtatttag cgccgaagat atttccaccg caattcctca tcgtattgtg 660
caggataatt ttccgaagtt taaagaaaat tgtcatattt ttacccgtct gatcaccgcg 720
gtaccgagcc tgcgagagca ttttgaaaac gttaagaaag ccattggaat ttttgtcagt 780
accagcattg aagaagtgtt ttcgttcccg ttctataacc aactgctgac ccagacccag 840
attgatctgt acaatcagct gctggggggc ataagccgcg aggcaggtac cgaaaagata 900
aagggactca atgaggtgct gaatctggca attcagaaga atgatgaaac ggctcatatc 960
attgctagcc tgccgcatcg tttcattccc ctgtttaagc aaatcctgag cgatcgcaat 1020
acactgagct ttatcctcga agagtttaaa tcggacgaag aagttatcca gagcttttgc 1080
aaatacaaaa ccctgctgcg gaacgaaaat gtgctggaga ccgctgaagc actgtttaat 1140
gaactgaact cgatcgacct cacccatatt tttatatccc acaaaaaact ggaaaccata 1200
agcagcgctc tgtgtgacca ttgggatacc ctgcgcaacg ccctgtatga acggcgtatc 1260
agcgagctga ccgggaaaat caccaaatcc gcaaaggaaa aagttcagcg tagtctgaaa 1320
cacgaggaca tcaacctgca agaaattatt agcgcagcag gtaaagagct gagcgaagca 1380
ttcaaacaga aaaccagcga aatcctgagc catgcccatg ctgcactgga tcagccgctg 1440
ccgaccaccc tgaaaaaaca ggaggaaaag gagattctga aaagccaact ggacagcctg 1500
ctgggcctgt atcacctgct ggactggttt gcagtcgatg agagcaacga ggttgatcct 1560
gagttctccg ctcgtctgac cggaatcaag ctggagatgg aaccgagtct gtcgttttac 1620
aacaaagcgc gtaattacgc gaccaagaaa ccgtatagcg tggaaaaatt caaactgaac 1680
tttcagatgc cgacccttgc acgtggatgg gacgttaacc gtgaaaaaaa caatggggca 1740
attctgtttg tgaaaaatgg cctctattat ctgggtatca tgccgaaaca gaaagggcgc 1800
tacaaagccc tgtcatttga gccgaccgag aaaacctcag agggtttcga caagatgtac 1860
tacgattatt tcccggatgc ggcaaaaatg atacccaaat gtagcaccca actgaaggca 1920
gttacagccc actttcagac ccataccacc ccgatcctgc tgtcgaacaa ttttatagag 1980
ccgctggaaa ttaccaaaga gatttatgat ctgaataatc cggaaaagga gcccaagaaa 2040
tttcagacgg cgtatgcaaa aaagaccggg gatcagaaag gttatcgtga agcgctgtgc 2100
aaatggattg actttacccg tgactttctg tcaaaatata ccaaaacgac gagcattgat 2160
ctgagcagcc tacgtccgag cagccaatat aaggatctgg gcgaatatta cgccgaactg 2220
aatccgctgc tctaccatat ttccttccaa cgaatcgctg aaaaagaaat aatggacgcc 2280
gttgaaaccg gcaaactgta tctgtttcaa atctacaaca aagatttcgc caaaggccat 2340
cacggtaagc cgaacctgca taccctgtat tggaccggtc tgtttagccc ggagaatctg 2400
gccaaaacca gcatcaagct gaacggacag gcagaactgt tttaccgccc caaaagccgt 2460
atgaaaagga tggcacaccg cctgggcgaa aaaatgctga ataagaaact caaagatcag 2520
aaaacgccga taccggatac cctttatcag gagctgtatg attatgttaa ccaccggctg 2580
agccatgacc tgagcgacga agcgcgtgca ctgctgccga acgtgattac caaggaagtc 2640
tcgcatgaaa ttattaaaga tcggcgcttc accagtgata aatttttctt ccatgtaccg 2700
atcaccctga attatcaagc cgcaaatagc ccttccaaat ttaatcaacg cgtgaatgcg 2760
tacctgaaag agcatccgga gaccccaatt attggcatag accgaggaga acgcaatctc 2820
atttatatca ccgtcattga tagcaccggt aagatcctgg aacagcgtag cctgaatacc 2880
attcagcagt ttgactacca gaaaaagctg gacaacagag aaaaggaacg tgtagccgcc 2940
cggcaggctt ggagtgtggt gggtactatc aaggatctga agcaggggta tctctcccaa 3000
gttatccatg aaattgtcga tctaatgatt cactatcaag cagtagtggt actggaaaat 3060
ctgaatttcg gtttcaaaag caaacgtaca gggatcgctg aaaaagccgt ttatcagcag 3120
ttcgagaaaa tgctgataga caagctgaat tgcctggttc tgaaagatta tccggcagag 3180
aaggtgggcg gtgtgctgaa cccgtaccag ctgactgatc aatttacgag ctttgcaaaa 3240
atgggaacgc agagcggttt cctgttctat gttccggcgc catataccag caagatagac 3300
ccgctgacag gtttcgtaga tccgtttgtc tggaaaacca ttaaaaatca tgaaagtcgc 3360
aaacattttc tggagggctt tgattttctg cactatgacg tgaaaaccgg cgacttcatt 3420
ctgcatttta aaatgaaccg taatctgtcc tttcagcgcg gcctgcctgg ctttatgccg 3480
gcgtgggaca ttgtttttga aaagaatgag acacagtttg atgccaaagg tacccccttt 3540
attgcgggga aacgcattgt gcccgttata gaaaatcacc gcttcaccgg acggtatagg 3600
gacttgtacc cggcaaatga attgatagcg ctgctggagg agaaaggtat tgtctttcgg 3660
gatggatcaa acatcctgcc gaagctgctg gagaacgatg acagccacgc aatagacacc 3720
atggtagcgc tgatccgaag cgtgctgcag atgcgtaaca gtaatgcggc tacgggggaa 3780
gactacatta atagcccggt ccgtgatctg aacggcgttt gtttcgatag cagatttcaa 3840
aatccggagt ggccgatgga tgccgatgcc aatggagctt accatatcgc tctcaaaggt 3900
cagctcctac tgaaccattt gaaagaatca aaagatctga aactgcagaa cggcatctcg 3960
aatcaggact ggctggccta cattcaagaa ctgagaaacg actacaaaga ccatgacggt 4020
gattataaag atcatgacat cgattacaag gatgacgatg acaag 4065
<210> 66
<211> 1352
<212> PRT
<213> Artificial Sequence
<220>
<223> CMV-wt-AsCas12a
<400> 66
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys Arg Pro Ala Ala
1300 1305 1310
Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr
1315 1320 1325
Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1330 1335 1340
Pro Tyr Asp Val Pro Asp Tyr Ala
1345 1350
<210> 67
<211> 4056
<212> DNA
<213> Artificial Sequence
<220>
<223> CMV-wt-AsCas12a
<400> 67
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttatg agaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcctctggct gggacgtgaa taaggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 3960
aagaaaaagg gatcctaccc atacgatgtt ccagattacg cttatcccta cgacgtgcct 4020
gattatgcat acccatatga tgtccccgac tatgcc 4056
<210> 68
<211> 1352
<212> PRT
<213> Artificial Sequence
<220>
<223> CMV-en-AsCas12a
<400> 68
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Arg Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Arg Gly Trp
530 535 540
Asp Val Asn Arg Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys Arg Pro Ala Ala
1300 1305 1310
Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr
1315 1320 1325
Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1330 1335 1340
Pro Tyr Asp Val Pro Asp Tyr Ala
1345 1350
<210> 69
<211> 4056
<212> DNA
<213> Artificial Sequence
<220>
<223> CMV-en-AsCas12a
<400> 69
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttata ggaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcccggggct gggacgtgaa tcgggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 3960
aagaaaaagg gatcctaccc atacgatgtt ccagattacg cttatcccta cgacgtgcct 4020
gattatgcat acccatatga tgtccccgac tatgcc 4056
<210> 70
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2 target DNA
<400> 70
tttggctcag caggcacctg cctcagct 28
<210> 71
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2 D +0
<400> 71
uaauuucuac ucuuguagau gcucagcagg caccugccuc agcu 44
<210> 72
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2 D +8
<220>
<223> Chimeric DNA-RNA
<400> 72
uaauuucuac ucuuguagau gcucagcagg caccugcctc agct 44
<210> 73
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 target DNA
<400> 73
tttatgcaca gggtggaaca agatggat 28
<210> 74
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 D +0
<400> 74
uaauuucuac ucuuguagau ugcacagggu ggaacaagau ggau 44
<210> 75
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 D +8
<220>
<223> Chimeric DNA-RNA
<400> 75
uaauuucuac ucuuguagau ugcacagggu ggaacaagat ggat 44
<210> 76
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 D +12
<220>
<223> Chimeric DNA-RNA
<400> 76
uaauuucuac ucuuguagau ugcacagggu ggaacaagat ggat 44
<210> 77
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 D +16
<220>
<223> Chimeric DNA-RNA
<400> 77
uaauuucuac ucuuguagau ugcacagggt ggaacaagat ggat 44
<210> 78
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 D +20
<220>
<223> Chimeric DNA-RNA
<400> 78
uaauuucuac ucuuguagau ugcacagggt ggaacaagat ggat 44
<210> 79
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 D +24
<220>
<223> Chimeric DNA-RNA
<400> 79
uaauuucuac ucuuguagau tgcacagggt ggaacaagat ggat 44
<210> 80
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1 D +44
<400> 80
taatttctac tcttgtagat tgcacagggt ggaacaagat ggat 44
<210> 81
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 target DNA
<400> 81
ttttgtgggc aacatgctgg tcatcctc 28
<210> 82
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +0
<400> 82
uaauuucuac ucuuguagau gugggcaaca ugcuggucau ccuc 44
<210> 83
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +8
<220>
<223> Chimeric DNA-RNA
<400> 83
uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44
<210> 84
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +9
<220>
<223> Chimeric DNA-RNA
<400> 84
uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44
<210> 85
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +10
<220>
<223> Chimeric DNA-RNA
<400> 85
uaauuucuac ucuuguagau gugggcaaca ugcuggtcat cctc 44
<210> 86
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +11
<220>
<223> Chimeric DNA-RNA
<400> 86
uaauuucuac ucuuguagau gugggcaaca ugctggtcat cctc 44
<210> 87
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +12
<220>
<223> Chimeric DNA-RNA
<400> 87
uaauuucuac ucuuguagau gugggcaaca ugctggtcat cctc 44
<210> 88
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D + 16
<220>
<223> Chimeric DNA-RNA
<400> 88
uaauuucuac ucuuguagau gugggcaaca tgctggtcat cctc 44
<210> 89
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +20
<220>
<223> Chimeric DNA-RNA
<400> 89
uaauuucuac ucuuguagau gugggcaaca tgctggtcat cctc 44
<210> 90
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +24
<220>
<223> Chimeric DNA-RNA
<400> 90
uaauuucuac ucuuguagau gtgggcaaca tgctggtcat cctc 44
<210> 91
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2 D +44
<400> 91
taatttctac tcttgtagat gtgggcaaca tgctggtcat cctc 44
<210> 92
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 target DNA
<400> 92
tttaggatgc cactaaaagg gaaagggg 28
<210> 93
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 D +0
<400> 93
uaauuucuac ucuuguagau ggaugccacu aaaagggaaa gggg 44
<210> 94
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 D +8
<220>
<223> Chimeric DNA-RNA
<400> 94
uaauuucuac ucuuguagau ggaugccacu aaaagggaaa gggg 44
<210> 95
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 D +12
<220>
<223> Chimeric DNA-RNA
<400> 95
uaauuucuac ucuuguagau ggaugccacu aaaagggaaa gggg 44
<210> 96
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 D +16
<220>
<223> Chimeric DNA-RNA
<400> 96
uaauuucuac ucuuguagau ggaugccact aaaagggaaa gggg 44
<210> 97
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 D +20
<220>
<223> Chimeric DNA-RNA
<400> 97
uaauuucuac ucuuguagau ggaugccact aaaagggaaa gggg 44
<210> 98
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 D +24
<220>
<223> Chimeric DNA-RNA
<400> 98
uaauuucuac ucuuguagau ggatgccact aaaagggaaa gggg 44
<210> 99
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1 D +44
<400> 99
taatttctac tcttgtagat ggatgccact aaaagggaaa gggg 44
<210> 100
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1 target DNA
<400> 100
tttgcttacg atggagccag agaggatc 28
<210> 101
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hAAVS1 D +0
<400> 101
uaauuucuac ucuuguagau cuuacgaugg agccagagag gauc 44
<210> 102
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hAAVS1 D +8
<220>
<223> Chimeric DNA-RNA
<400> 102
uaauuucuac ucuuguagau cuuacgaugg agccagagag gatc 44
<210> 103
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF target DNA
<400> 103
tttgggcggg gtccagttcc gggattag 28
<210> 104
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> hFANCF D +0
<400> 104
uaauuucuac ucuuguagau ggcggggucc aguuccggga uuag 44
<210> 105
<211> 44
<212> DNA_RNA
<213> Artificial Sequence
<220>
<223> hFANCF D +8
<220>
<223> Chimeric DNA-RNA
<400> 105
uaauuucuac ucuuguagau ggcggggucc aguuccggga ttag 44
<210> 106
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_on-target F1
<400> 106
ggagatcaag ctttgtatgt tg 22
<210> 107
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_on-target R1
<400> 107
ccagaatgca caaagtactg c 21
<210> 108
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_on-target F2
<400> 108
ctgtgaggat tgagtgagtt g 21
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_on-target R2
<400> 109
cacacatgtg aacggacaga 20
<210> 110
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_on-target F1
<400> 110
tgagatggtg ctttcatgaa t 21
<210> 111
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_on-target R1
<400> 111
gaaaatgaga gctgcaggtg 20
<210> 112
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_on-target F2
<400> 112
aaacttcatt gcttggccaa 20
<210> 113
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_on-target R2
<400> 113
gaagattcca gagaagaagc c 21
<210> 114
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_on-target F
<400> 114
gcttgctgta tacacaaggc 20
<210> 115
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_on-target R
<400> 115
ctgatcttga gaacagaaga cc 22
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_on-target F
<400> 116
accatgcttg acccagtttc 20
<210> 117
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_on-target R
<400> 117
aaacacagca tggacgacag 20
<210> 118
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_on-target Adaptor_F
<400> 118
acactctttc cctacacgac gctcttccga tctggagtgt tcagtctccg tga 53
<210> 119
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_on-target Adaptor_R
<400> 119
gtgactggag ttcagacgtg tgctcttccg atctccttag cagcttcctc ctc 53
<210> 120
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_off-target F
<400> 120
caggggtatt ttccttcaag a 21
<210> 121
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_off-target R
<400> 121
tcaggaatac caacatggaa aa 22
<210> 122
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_off-target Adaptor_F
<400> 122
acactctttc cctacacgac gctcttccga tcttgtgtgt ctgctggaag ctc 53
<210> 123
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site1_off-target Adaptor_R
<400> 123
gtgactggag ttcagacgtg tgctcttccg atctcagcag atagggtctg tgctc 55
<210> 124
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_on-target F
<400> 124
acacaacagc ttcatgtcag 20
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_on-target R
<400> 125
ttggcttgga gatcaagctt 20
<210> 126
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_on-target Adaptor_F
<400> 126
acactctttc cctacacgac gctcttccga tctgcagagt gctaagggaa cgt 53
<210> 127
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_on-target Adaptor_R
<400> 127
gtgactggag ttcagacgtg tgctcttccg atctaagtgc ttagagcagg cgtg 54
<210> 128
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target F1
<400> 128
ctgagctggt atccaagatg c 21
<210> 129
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target R1
<400> 129
gcattgtcat tagaaccaca aatc 24
<210> 130
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target Adaptor_F1
<400> 130
acactctttc cctacacgac gctcttccga tctgcagaag tgagtcttgc tgag 54
<210> 131
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target Adaptor_R1
<400> 131
gtgactggag ttcagacgtg tgctcttccg atctcagaat ctgtgcactc ggag 54
<210> 132
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target F2
<400> 132
gttgcagtga gccaagatca 20
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target R2
<400> 133
tcttggaacc aatcctctgc 20
<210> 134
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target Adaptor_F2
<400> 134
acactctttc cctacacgac gctcttccga tctaagcagt gcttctccat tgag 54
<210> 135
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target Adaptor_R2
<400> 135
gtgactggag ttcagacgtg tgctcttccg atctttacgc catgggtgat agtg 54
<210> 136
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target F3
<400> 136
gcaaccagat ttttcctcca 20
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target R3
<400> 137
ccaagccgtt acagatggtt 20
<210> 138
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target Adaptor_F3
<400> 138
acactctttc cctacacgac gctcttccga tctggcaatg gactctggga tag 53
<210> 139
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hDNMT1_site2_off-target Adaptor_R3
<400> 139
gtgactggag ttcagacgtg tgctcttccg atctcgggtt gtgaacagga aact 54
<210> 140
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_on-target Adaptor_F
<400> 140
acactctttc cctacacgac gctcttccga tctcaatgta gacatctatg taggcaa 57
<210> 141
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_on-target Adaptor_R
<400> 141
gtgactggag ttcagacgtg tgctcttccg atctctgcga tttgcttcac attg 54
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target F1
<400> 142
caagcaattc ttgtgcctca 20
<210> 143
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target R1
<400> 143
tccaggccct gtatacttgc 20
<210> 144
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target Adaptor_F1
<400> 144
acactctttc cctacacgac gctcttccga tctagggtca acattgcaag gag 53
<210> 145
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target Adaptor_R1
<400> 145
gtgactggag ttcagacgtg tgctcttccg atcttcaaag ccattctgga aaaga 55
<210> 146
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target F2
<400> 146
catggtgaaa ccccaactct 20
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target R2
<400> 147
ccaaatccca cactttgctt 20
<210> 148
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target Adaptor_F2
<400> 148
acactctttc cctacacgac gctcttccga tctgctcaac tgtattgaga ggaagc 56
<210> 149
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site1_off-target Adaptor_R2
<400> 149
gtgactggag ttcagacgtg tgctcttccg atctttctgg tggataagaa ggaatttt 58
<210> 150
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_on-target Adaptor_F
<400> 150
acactctttc cctacacgac gctcttccga tctcctgcca aaaaatcaat gtgaag 56
<210> 151
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_on-target Adaptor_R
<400> 151
gtgactggag ttcagacgtg tgctcttccg atctgaaggg gacagtaaga aggaa 55
<210> 152
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_off-target F
<400> 152
gaaaatggct gttgggtaaa tc 22
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_off-target R
<400> 153
taagggccac agacataaac 20
<210> 154
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_off-target Adaptor_F
<400> 154
acactctttc cctacacgac gctcttccga tcttccctgt cataaatttg acgtg 55
<210> 155
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hCCR5_site2_off-target Adaptor_R
<400> 155
gtgactggag ttcagacgtg tgctcttccg atctgaaaaa gcagatcaga gatggc 56
<210> 156
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ on-target F
<400> 156
cctggtgaac acctaggacg 20
<210> 157
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ on-target R
<400> 157
ctatgtccac ttcaggacag c 21
<210> 158
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ on-target Adaptor_F
<400> 158
acactctttc cctacacgac gctcttccga tctcttccct cccaccccct g 51
<210> 159
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ on-target Adaptor_R
<400> 159
gtgactggag ttcagacgtg tgctcttccg atctccccat ccttaggcct cct 53
<210> 160
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target F1
<400> 160
agcaggttgg gtatcctgtg 20
<210> 161
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target R1
<400> 161
aggctgtttc tgcctccata 20
<210> 162
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target Adaptor_F1
<400> 162
acactctttc cctacacgac gctcttccga tctccatctc ctggtctgca caa 53
<210> 163
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target Adaptor_R1
<400> 163
gtgactggag ttcagacgtg tgctcttccg atctcaaagg ggctattcag atgt 54
<210> 164
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target F2
<400> 164
atccaggggg ttggaatatc 20
<210> 165
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target R2
<400> 165
tgcctgagag caggtctttt 20
<210> 166
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target Adaptor_F2
<400> 166
acactctttc cctacacgac gctcttccga tctggttatc tgttaatgat agcctg 56
<210> 167
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAVS1_ off-target Adaptor_R2
<400> 167
gtgactggag ttcagacgtg tgctcttccg atctcacaag cccatgaaga ctgg 54
<210> 168
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_on-target Adaptor_F
<400> 168
acactctttc cctacacgac gctcttccga tctgaaaagg tgttgcttat tgccc 55
<210> 169
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_on-target Adaptor_R
<400> 169
gtgactggag ttcagacgtg tgctcttccg atctcagctc cttccatctg ggtttc 56
<210> 170
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target F1
<400> 170
attctgcctc ctctcccact 20
<210> 171
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target R1
<400> 171
caggaggagc aaattccaga 20
<210> 172
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target Adaptor_F1
<400> 172
acactctttc cctacacgac gctcttccga tctggtccta acagagattt actttctc 58
<210> 173
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target Adaptor_R1
<400> 173
gtgactggag ttcagacgtg tgctcttccg atctctccct ctctcccttc ctctc 55
<210> 174
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target F2
<400> 174
gcatcaacaa actggctcat t 21
<210> 175
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target R2
<400> 175
cctttgggat ggtgtcatct 20
<210> 176
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target Adaptor_F2
<400> 176
acactctttc cctacacgac gctcttccga tctgccactg ctaatgttta aaattc 56
<210> 177
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> hIL12A-AS1_off-target Adaptor_R2
<400> 177
gtgactggag ttcagacgtg tgctcttccg atctctttag ggcagcattt tgtag 55
<210> 178
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_on-target F
<400> 178
cacggataaa gacgctggga 20
<210> 179
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_on-target R
<400> 179
cacaggctgc tgagaaacct 20
<210> 180
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_on-target Adaptor_F
<400> 180
acactctttc cctacacgac gctcttccga tctcacatcc atcggcgctt tg 52
<210> 181
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_on-target Adaptor_R
<400> 181
gtgactggag ttcagacgtg tgctcttccg atctggtggt aacgagctgc atcc 54
<210> 182
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_off-target F
<400> 182
tgggaggaaa ccctaaagag 20
<210> 183
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_off-target R
<400> 183
tgcaggccca agtattttga 20
<210> 184
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_off-target Adaptor_F
<400> 184
acactctttc cctacacgac gctcttccga tctcagctga ctcagctgaa ctg 53
<210> 185
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> hFANCF_off-target Adaptor_R
<400> 185
gtgactggag ttcagacgtg tgctcttccg atctgtctgg tgtgttatgc ctgt 54
<210> 186
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_hDNMT1_site1_sense
<400> 186
cgagtaacag acatggacca tcagatctac aagagtagaa attaccctat agtgagtcgt 60
attaatttc 69
<210> 187
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_hDNMT1_site2_sense
<400> 187
agctgaggca ggtgcctgct gagcatctac aagagtagaa attaccctat agtgagtcgt 60
attaatttc 69
<210> 188
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_hCCR5_site1_sense
<400> 188
atccatcttg ttccaccctg tgcaatctac aagagtagaa attaccctat agtgagtcgt 60
attaatttc 69
<210> 189
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_hCCR5_site2_sense
<400> 189
gaggatgacc agcatgttgc ccacatctac aagagtagaa attaccctat agtgagtcgt 60
attaatttc 69
<210> 190
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_hAAVS1_sense
<400> 190
gatcctctct ggctccatcg taagatctac aagagtagaa attaccctat agtgagtcgt 60
attaatttc 69
<210> 191
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_hIL12A-AS1_sense
<400> 191
cccctttccc ttttagtggc atccatctac aagagtagaa attaccctat agtgagtcgt 60
attaatttc 69
<210> 192
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_hFANCF_sense
<400> 192
ctaatcccgg aactggaccc cgccatctac aagagtagaa attaccctat agtgagtcgt 60
attaatttc 69
<210> 193
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_AsCas12a_universial_antisense
<400> 193
gaaattaata cgactcacta taggg 25
<210> 194
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_hDNMT1_site1_sgRNA_sense
<400> 194
gaaattaata cgactcacta taggagtgct aagggaacgt tcagttttag agctagaaat 60
agcaag 66
<210> 195
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_hDNMT1_site2_sgRNA_sense
<400> 195
gaaattaata cgactcacta tagccagcag ccaacctgac caagttttag agctagaaat 60
agcaag 66
<210> 196
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_hCCR5_site1_sgRNA_sense
<400> 196
gaaattaata cgactcacta tagtaataat tgatgtcata gatgttttag agctagaaat 60
agcaag 66
<210> 197
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_hCCR5_site2_sgRNA_sense
<400> 197
gaaattaata cgactcacta tagaacacca gtgagtagag cgggttttag agctagaaat 60
agcaag 66
<210> 198
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_hAAVS1_sgRNA_sense
<400> 198
gaaattaata cgactcacta taggcaagga gagagatggc tccgttttag agctagaaat 60
agcaag 66
<210> 199
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_hIL12A-AS1_sgRNA_sense
<400> 199
gaaattaata cgactcacta tagttctggg gtcaacatct tgggttttag agctagaaat 60
agcaag 66
<210> 200
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_hFANCF_sgRNA_sense
<400> 200
gaaattaata cgactcacta tagccgctcc agagccgtgc gaagttttag agctagaaat 60
agcaag 66
<210> 201
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> IVT_SpCas9_universial_antisense
<400> 201
aaaaaagcac cgactcggtg ccactttttc aagttgataa cggactagcc ttattttaac 60
ttgctatttc tagctctaaa ac 82
Claims (15)
- enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및
표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물. - 제1항에 있어서, 상기 가이드는 3'-말단이 포스포네이트, 스포로티오에이트 또는 포스포트리에스테르인 포스페이트로의 개질; 비오틴화에 의한 개질; 또는 LNA, HNA, CeNA, 2'-메톡시에틸, 2'-O-알킬, 2'-O-알릴, 2'-C-알릴, 2'-플루오로, 2'-데옥시, 2'-히드록실 및 그들의 조합으로 이루어진 그룹으로부터 선택되는 어느 하나에 의한 개질에 의해 개질(modification)된 것인 유전체 교정용 조성물.
- 제1항에 있어서, 상기 DNA는 상기 가이드의 3' 말단에 치환된 것인 유전체 교정용 조성물.
- 제3항에 있어서, 상기 DNA는 4 내지 16개인 것인 유전체 교정용 조성물.
- 제1항에 있어서, enCpf1 단백질은 서열번호 1의 아미노산 서열에 대하여 T167, S170, E174, T539, S542, K548, N551, N552, M604 및 K607로 이루어진 군으로부터 선택되는 어느 하나 이상의 아미노산 치환을 포함하는 것인 유전체 교정용 조성물.
- 제5항에 있어서, 상기 서열번호 1의 아미노산 서열은 아시다미노콕쿠스 종(Acidaminococcus sp.) 균주 BV3L6 Cpf1 분자(AsCpf1)로부터 유래된 서열인 유전체 교정용 조성물.
- 제5항에 있어서, 상기 서열번호 1의 아미노산 서열에 대하여 T167A, S170R, S170K, E174K, E174R, T539K, T539R, S542Q, S542K, S542R, K548R, K548V, N551R, N552R, M604A, K607Q, K607R, K607S, 및 K607H로 이루어진 군으로부터 선택되는 어느 하나 이상의 치환을 포함하는 것인 유전체 교정용 조성물.
- 제7항에 있어서, 상기 서열번호 1의 아미노산 서열에 대하여 S170R/E174R, E174R/K548R, S170R/K548R, E174R/S542R, S170R/S542R, E174R/S542R/K548R, E174R/N551R, S170R/N551R, S542R/K548R, S542R/N551R, S542R/N552R, K548R/N551R, S170R/S542R/K607R, E174R/S542R/K607R, E174R/S542R/K607H, E174R/S542R/K548R/N551R, S170R/S542R/K548V/N552R, E174R/S542R/K548V/N552R, S170R/S542R/K607R 및 E174R/S542R/K607R로 이루어진 군으로부터 선택되는 어느 하나의 치환을 포함하는 것인 유전체 교정용 조성물.
- 제8항에 있어서, 상기 서열번호 1의 아미노산 서열에 대하여 E174R/S542R/K548R의 치환을 포함하는 것인 유전체 교정용 조성물.
- 제1항에 있어서, 상기 조성물은 10번 위치의 아스파르탐산이 알라닌으로 치환된 SpCas9 닉카아제(nickase) 또는 10번 위치의 아스파르탐산이 알라닌으로 치환되거나 840번 위치의 히스티딘이 알라닌으로 치환된 비활성(Dead) SpCas9를 더 포함하는 것인 유전체 교정용 조성물.
- 제1항의 유전체 교정용 조성물을 분리된 세포 또는 인간을 제외한 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법.
- enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 약학적 조성물.
- enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전 질환, 비유전 질환, 바이러스 감염, 박테리아 감염, 암, 또는 자가 면역 질환의 예방 또는 치료용 약학적 조성물.
- enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전체 교정용 조성물을,
표적 서열을 갖고 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 세포에 도입함을 포함하여, 유전자 산물의 발현을 변경시키는 방법. - enCpf1 단백질 또는 이를 암호화하는 폴리뉴클레오티드; 및
표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 뉴클레오티드 서열을 포함하는 키메릭(chimeric) DNA-RNA 가이드 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 유전자 진단용 조성물.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20210078378 | 2021-06-16 | ||
KR1020210078378 | 2021-06-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220168554A true KR20220168554A (ko) | 2022-12-23 |
Family
ID=84536204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220064949A KR20220168554A (ko) | 2021-06-16 | 2022-05-26 | enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20220168554A (ko) |
-
2022
- 2022-05-26 KR KR1020220064949A patent/KR20220168554A/ko unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10633642B2 (en) | Engineered CRISPR-Cas9 nucleases | |
US20230272394A1 (en) | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX | |
US11060078B2 (en) | Engineered CRISPR-Cas9 nucleases | |
US11667917B2 (en) | Composition for genome editing using CRISPR/CPF1 system and use thereof | |
EP3341477B1 (en) | Engineered crispr-cas9 nucleases | |
US6211351B1 (en) | Chimeric mutational vectors | |
US20200362346A1 (en) | Genome editing using crispr in corynebacterium | |
KR20180069898A (ko) | 핵염기 편집제 및 그의 용도 | |
CA3204158A1 (en) | Mad nucleases | |
KR102551876B1 (ko) | Cpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물 | |
KR20220168554A (ko) | enCpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물 | |
WO2019189147A1 (ja) | 細胞の有する二本鎖dnaの標的部位を改変する方法 | |
KR20180128864A (ko) | 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법 | |
JP2023507163A (ja) | バクテロイデスにおけるゲノム編集 | |
KR20230120366A (ko) | CRISPR-Cas12a 기반의 닉카아제를 포함하는 유전체 편집용 조성물 | |
RU2791447C1 (ru) | Средство разрезания ДНК на основе ScCas12a белка из бактерии Sedimentisphaera cyanobacteriorum | |
KR20220106079A (ko) | Francisella novicida Cas9 모듈 기반의 역전사 효소를 사용한 유전체 치환 및 삽입 기술 | |
CN113614247A (zh) | Dna切割剂 |