KR20240019759A - 아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템 - Google Patents
아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템 Download PDFInfo
- Publication number
- KR20240019759A KR20240019759A KR1020237039938A KR20237039938A KR20240019759A KR 20240019759 A KR20240019759 A KR 20240019759A KR 1020237039938 A KR1020237039938 A KR 1020237039938A KR 20237039938 A KR20237039938 A KR 20237039938A KR 20240019759 A KR20240019759 A KR 20240019759A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- acid sequence
- seq
- sequence encoding
- ser
- Prior art date
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 251
- 241000702421 Dependoparvovirus Species 0.000 title claims description 86
- 238000000034 method Methods 0.000 claims abstract description 51
- 150000007523 nucleic acids Chemical class 0.000 claims description 777
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 552
- 102000039446 nucleic acids Human genes 0.000 claims description 205
- 108020004707 nucleic acids Proteins 0.000 claims description 205
- 108020004705 Codon Proteins 0.000 claims description 203
- 108020004485 Nonsense Codon Proteins 0.000 claims description 193
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 176
- 230000035772 mutation Effects 0.000 claims description 145
- 230000001939 inductive effect Effects 0.000 claims description 115
- 102000040430 polynucleotide Human genes 0.000 claims description 66
- 108091033319 polynucleotide Proteins 0.000 claims description 66
- 150000001413 amino acids Chemical class 0.000 claims description 61
- 230000000295 complement effect Effects 0.000 claims description 53
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims description 50
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims description 50
- 239000013612 plasmid Substances 0.000 claims description 32
- 239000003550 marker Substances 0.000 claims description 30
- 108091033409 CRISPR Proteins 0.000 claims description 28
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 28
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 claims description 24
- 229930024421 Adenine Natural products 0.000 claims description 23
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 23
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 23
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 23
- 229960000643 adenine Drugs 0.000 claims description 23
- 108091006106 transcriptional activators Proteins 0.000 claims description 23
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 21
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 claims description 19
- 101710123256 Pyrrolysine-tRNA ligase Proteins 0.000 claims description 19
- 150000003384 small molecules Chemical class 0.000 claims description 19
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 claims description 18
- 108010014064 CCCTC-Binding Factor Proteins 0.000 claims description 18
- 229960003722 doxycycline Drugs 0.000 claims description 18
- 239000002157 polynucleotide Substances 0.000 claims description 18
- 239000012212 insulator Substances 0.000 claims description 17
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 claims description 16
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 claims description 15
- -1 DA-Rep52 Proteins 0.000 claims description 15
- 239000004475 Arginine Substances 0.000 claims description 14
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 14
- 229940104302 cytosine Drugs 0.000 claims description 14
- VGEREEWJJVICBM-UHFFFAOYSA-N phloretin Chemical compound C1=CC(O)=CC=C1CCC(=O)C1=C(O)C=C(O)C=C1O VGEREEWJJVICBM-UHFFFAOYSA-N 0.000 claims description 14
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 12
- 239000000411 inducer Substances 0.000 claims description 12
- 238000010367 cloning Methods 0.000 claims description 9
- VVQIIIAZJXTLRE-QMMMGPOBSA-N (2s)-2-amino-6-[(2-methylpropan-2-yl)oxycarbonylamino]hexanoic acid Chemical compound CC(C)(C)OC(=O)NCCCC[C@H](N)C(O)=O VVQIIIAZJXTLRE-QMMMGPOBSA-N 0.000 claims description 7
- ZWTDXYUDJYDHJR-UHFFFAOYSA-N (E)-1-(2,4-dihydroxyphenyl)-3-(2,4-dihydroxyphenyl)-2-propen-1-one Natural products OC1=CC(O)=CC=C1C=CC(=O)C1=CC=C(O)C=C1O ZWTDXYUDJYDHJR-UHFFFAOYSA-N 0.000 claims description 7
- YQHMWTPYORBCMF-UHFFFAOYSA-N Naringenin chalcone Natural products C1=CC(O)=CC=C1C=CC(=O)C1=C(O)C=C(O)C=C1O YQHMWTPYORBCMF-UHFFFAOYSA-N 0.000 claims description 7
- IVIYFJSPDLOPEX-AXKFECAUSA-N acetyloxymethyl (1R,2R,5S,8S,9S,10R,11S,12S)-5,12-dihydroxy-11-methyl-6-methylidene-16-oxo-15-oxapentacyclo[9.3.2.15,8.01,10.02,8]heptadec-13-ene-9-carboxylate Chemical compound CC(=O)OCOC(=O)[C@H]1[C@@H]2[C@@]3(C)[C@@H](O)C=C[C@@]2(OC3=O)[C@@H]2CC[C@]3(O)C[C@]12CC3=C IVIYFJSPDLOPEX-AXKFECAUSA-N 0.000 claims description 7
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 claims description 7
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 claims description 7
- 229960002930 sirolimus Drugs 0.000 claims description 7
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 claims description 7
- WKOLLVMJNQIZCI-UHFFFAOYSA-M vanillate Chemical compound COC1=CC(C([O-])=O)=CC=C1O WKOLLVMJNQIZCI-UHFFFAOYSA-M 0.000 claims description 7
- 108010001515 Galectin 4 Proteins 0.000 claims description 6
- 102100039556 Galectin-4 Human genes 0.000 claims description 6
- 230000009615 deamination Effects 0.000 claims description 6
- 238000006481 deamination reaction Methods 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 5
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 claims 3
- 102000016897 CCCTC-Binding Factor Human genes 0.000 claims 1
- 108040001032 pyrrolysyl-tRNA synthetase activity proteins Proteins 0.000 claims 1
- 230000014509 gene expression Effects 0.000 abstract description 27
- 230000002123 temporal effect Effects 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 153
- 230000000875 corresponding effect Effects 0.000 description 135
- 235000001014 amino acid Nutrition 0.000 description 120
- 108090000623 proteins and genes Proteins 0.000 description 114
- 108090000765 processed proteins & peptides Proteins 0.000 description 107
- 102000004196 processed proteins & peptides Human genes 0.000 description 94
- 229920001184 polypeptide Polymers 0.000 description 93
- 230000000694 effects Effects 0.000 description 89
- 108020005004 Guide RNA Proteins 0.000 description 65
- 229940024606 amino acid Drugs 0.000 description 56
- 108020004414 DNA Proteins 0.000 description 39
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 34
- 125000006850 spacer group Chemical group 0.000 description 34
- 230000014616 translation Effects 0.000 description 26
- 238000013519 translation Methods 0.000 description 25
- 241000588724 Escherichia coli Species 0.000 description 24
- 241000880493 Leptailurus serval Species 0.000 description 24
- 101000666382 Homo sapiens Transcription factor E2-alpha Proteins 0.000 description 21
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 20
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 20
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 19
- 108020004999 messenger RNA Proteins 0.000 description 18
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 17
- 108020004566 Transfer RNA Proteins 0.000 description 17
- 125000000539 amino acid group Chemical group 0.000 description 16
- 108010031719 prolyl-serine Proteins 0.000 description 16
- 102000004169 proteins and genes Human genes 0.000 description 16
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 15
- 108010079364 N-glycylalanine Proteins 0.000 description 15
- 108010013835 arginine glutamate Proteins 0.000 description 15
- 108010077245 asparaginyl-proline Proteins 0.000 description 15
- 238000010348 incorporation Methods 0.000 description 15
- 238000006467 substitution reaction Methods 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 14
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 14
- 108010005233 alanylglutamic acid Proteins 0.000 description 13
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 13
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 13
- 108010057821 leucylproline Proteins 0.000 description 13
- 235000018102 proteins Nutrition 0.000 description 13
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 12
- 108010015792 glycyllysine Proteins 0.000 description 12
- 230000010354 integration Effects 0.000 description 12
- 108010053725 prolylvaline Proteins 0.000 description 12
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 11
- 125000001314 canonical amino-acid group Chemical group 0.000 description 11
- 108010073969 valyllysine Proteins 0.000 description 11
- 239000004472 Lysine Substances 0.000 description 10
- 101710087110 ORF6 protein Proteins 0.000 description 10
- 101710095001 Uncharacterized protein in nifU 5'region Proteins 0.000 description 10
- 108010044940 alanylglutamine Proteins 0.000 description 10
- 108010087924 alanylproline Proteins 0.000 description 10
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 10
- 108010060035 arginylproline Proteins 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 10
- 238000001890 transfection Methods 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 9
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 9
- 241000205276 Methanosarcina Species 0.000 description 9
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 9
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 9
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 9
- 108010003700 lysyl aspartic acid Proteins 0.000 description 9
- 229930182817 methionine Natural products 0.000 description 9
- 108010012581 phenylalanylglutamate Proteins 0.000 description 9
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 8
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 8
- 108010090461 DFG peptide Proteins 0.000 description 8
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 8
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 8
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 8
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 8
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 8
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 8
- 108010070944 alanylhistidine Proteins 0.000 description 8
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 8
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 8
- 238000010361 transduction Methods 0.000 description 8
- 230000026683 transduction Effects 0.000 description 8
- 108010080629 tryptophan-leucine Proteins 0.000 description 8
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 7
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 7
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 7
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 7
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 7
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 7
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 7
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 7
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 7
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- 108010008355 arginyl-glutamine Proteins 0.000 description 7
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 108010026333 seryl-proline Proteins 0.000 description 7
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 6
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 6
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 6
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 6
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 6
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 6
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 6
- 101710146427 Probable tyrosine-tRNA ligase, cytoplasmic Proteins 0.000 description 6
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 6
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 6
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 6
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 6
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 6
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 6
- 102100025336 Tyrosine-tRNA ligase, mitochondrial Human genes 0.000 description 6
- 101710107268 Tyrosine-tRNA ligase, mitochondrial Proteins 0.000 description 6
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 6
- 108010041407 alanylaspartic acid Proteins 0.000 description 6
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 6
- 231100000433 cytotoxic Toxicity 0.000 description 6
- 230000001472 cytotoxic effect Effects 0.000 description 6
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 238000003146 transient transfection Methods 0.000 description 6
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 5
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 5
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 5
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 5
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 5
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 5
- 235000014469 Bacillus subtilis Nutrition 0.000 description 5
- 102100021277 Beta-secretase 2 Human genes 0.000 description 5
- 101710150190 Beta-secretase 2 Proteins 0.000 description 5
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 5
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 5
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 5
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 5
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 5
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 5
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 5
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 5
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 5
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 5
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 5
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 5
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 5
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 5
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 5
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 5
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 5
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 5
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 5
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 5
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 5
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 5
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 5
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 5
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 5
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 5
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 5
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 5
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 5
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 5
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 5
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 5
- NMPXRFYMZDIBRF-ZOBUZTSGSA-N Val-Asn-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NMPXRFYMZDIBRF-ZOBUZTSGSA-N 0.000 description 5
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 5
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 5
- 108010004073 cysteinylcysteine Proteins 0.000 description 5
- 108010069495 cysteinyltyrosine Proteins 0.000 description 5
- 230000001085 cytostatic effect Effects 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 108010071207 serylmethionine Proteins 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 4
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 4
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 4
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 4
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 4
- 101000640990 Arabidopsis thaliana Tryptophan-tRNA ligase, chloroplastic/mitochondrial Proteins 0.000 description 4
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 4
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 4
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 4
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 4
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 4
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 4
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 4
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 4
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 4
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 4
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 4
- HGGIYWURFPGLIU-FXQIFTODSA-N Asn-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(N)=O HGGIYWURFPGLIU-FXQIFTODSA-N 0.000 description 4
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 4
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 4
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 4
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 4
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 4
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 4
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 4
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 4
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 4
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 4
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 4
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 4
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 4
- ZFHXNNXMNLWKJH-HJPIBITLSA-N Cys-Tyr-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZFHXNNXMNLWKJH-HJPIBITLSA-N 0.000 description 4
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 4
- DGQJGBDBFVGLGL-ZKWXMUAHSA-N Cys-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DGQJGBDBFVGLGL-ZKWXMUAHSA-N 0.000 description 4
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 4
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 4
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 4
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 4
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 4
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 4
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 4
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 4
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 4
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 4
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 4
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 4
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 4
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 4
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 4
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 4
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 4
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 4
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 4
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 4
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 4
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 4
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 4
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 4
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 4
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 4
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 4
- XDVKZSJODLMNLJ-GGQYPGDFSA-N Ile-Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 XDVKZSJODLMNLJ-GGQYPGDFSA-N 0.000 description 4
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 4
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 4
- 108010061833 Integrases Proteins 0.000 description 4
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 4
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 4
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 4
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 4
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 4
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 4
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 4
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 4
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 4
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 4
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 4
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 4
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 4
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 4
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 4
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 4
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 4
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 4
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 4
- XMQZLGBUJMMODC-AVGNSLFASA-N Met-His-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O XMQZLGBUJMMODC-AVGNSLFASA-N 0.000 description 4
- 241000205274 Methanosarcina mazei Species 0.000 description 4
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 4
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 4
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 4
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 4
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 4
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 4
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 4
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 4
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 4
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 4
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 4
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 4
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 4
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 4
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 4
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 4
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 4
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 4
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 4
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 4
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 4
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 4
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 4
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 4
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 4
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 4
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 4
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 4
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 4
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 4
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 4
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 4
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 4
- 102100034300 Tryptophan-tRNA ligase, cytoplasmic Human genes 0.000 description 4
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 4
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 4
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 4
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 4
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 239000004295 calcium sulphite Substances 0.000 description 4
- 238000012761 co-transfection Methods 0.000 description 4
- 239000000824 cytostatic agent Substances 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 108010068488 methionylphenylalanine Proteins 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 4
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 3
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 3
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 3
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 3
- 102000055025 Adenosine deaminases Human genes 0.000 description 3
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 3
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 3
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 3
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 3
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 3
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 3
- DGLQWAFPIXDKRL-UBHSHLNASA-N Ala-Met-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N DGLQWAFPIXDKRL-UBHSHLNASA-N 0.000 description 3
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 3
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 3
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 3
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 3
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 3
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 3
- 108020005098 Anticodon Proteins 0.000 description 3
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Natural products CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 3
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 3
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 3
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 3
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 3
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 3
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 3
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 3
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 3
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 3
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 3
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 3
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 3
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 3
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 3
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 3
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 3
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 3
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 3
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 3
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 3
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 3
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 3
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 3
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 3
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 3
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 3
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 3
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 3
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 3
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 3
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 3
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 3
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 3
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 3
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 3
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 3
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 3
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 3
- 241001509319 Desulfitobacterium Species 0.000 description 3
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 3
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 3
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 3
- IPHGBVYWRKCGKG-FXQIFTODSA-N Gln-Cys-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O IPHGBVYWRKCGKG-FXQIFTODSA-N 0.000 description 3
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 3
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 3
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 3
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 3
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 3
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 3
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 3
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 3
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 3
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 3
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 3
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 3
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 3
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 3
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 3
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 3
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 3
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 3
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 3
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 3
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 3
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 3
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 3
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 3
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 3
- WEIYKCOEVBUJQC-JYJNAYRXSA-N His-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WEIYKCOEVBUJQC-JYJNAYRXSA-N 0.000 description 3
- CSTNMMIHMYJGFR-IHRRRGAJSA-N His-His-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 CSTNMMIHMYJGFR-IHRRRGAJSA-N 0.000 description 3
- CMMBEMZGNGYJRJ-IHRRRGAJSA-N His-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N CMMBEMZGNGYJRJ-IHRRRGAJSA-N 0.000 description 3
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 3
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 3
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 3
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 3
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 3
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 3
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 3
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 3
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 3
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 3
- 102100034343 Integrase Human genes 0.000 description 3
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 3
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 3
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 3
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 3
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 3
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 3
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 3
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 3
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 3
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 3
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 3
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 3
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 3
- BYEBKXRNDLTGFW-CIUDSAMLSA-N Lys-Cys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O BYEBKXRNDLTGFW-CIUDSAMLSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- GHOIOYHDDKXIDX-SZMVWBNQSA-N Lys-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 GHOIOYHDDKXIDX-SZMVWBNQSA-N 0.000 description 3
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 3
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 3
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 3
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 3
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 3
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 3
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 3
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 3
- RPEPZINUYHUBKG-FXQIFTODSA-N Met-Cys-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O RPEPZINUYHUBKG-FXQIFTODSA-N 0.000 description 3
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 3
- OBCRZLRPJFNLAN-DCAQKATOSA-N Met-His-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OBCRZLRPJFNLAN-DCAQKATOSA-N 0.000 description 3
- NLDXSXDCNZIQCN-ULQDDVLXSA-N Met-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 NLDXSXDCNZIQCN-ULQDDVLXSA-N 0.000 description 3
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 3
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 3
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 3
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 3
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 108010065395 Neuropep-1 Proteins 0.000 description 3
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 3
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 3
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 3
- NRKNYPRRWXVELC-NQCBNZPSSA-N Phe-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NRKNYPRRWXVELC-NQCBNZPSSA-N 0.000 description 3
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 3
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 3
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 3
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 3
- RETPETNFPLNLRV-JYJNAYRXSA-N Pro-Asn-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O RETPETNFPLNLRV-JYJNAYRXSA-N 0.000 description 3
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 3
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 3
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 3
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 3
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 3
- QCARZLHECSFOGG-CIUDSAMLSA-N Pro-Glu-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O QCARZLHECSFOGG-CIUDSAMLSA-N 0.000 description 3
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 3
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 3
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 3
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 3
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 3
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 3
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 3
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 3
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 3
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 3
- 108010079005 RDV peptide Proteins 0.000 description 3
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 3
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 3
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 3
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 3
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 3
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 3
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 3
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 3
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 3
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 3
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 3
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 3
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 3
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 3
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 3
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 3
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 3
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 3
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 3
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 3
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 3
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 3
- 239000004098 Tetracycline Substances 0.000 description 3
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 3
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 3
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 3
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 3
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 3
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 3
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 3
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 3
- LHNNQVXITHUCAB-QTKMDUPCSA-N Thr-Met-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O LHNNQVXITHUCAB-QTKMDUPCSA-N 0.000 description 3
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 3
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 3
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 3
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 3
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 3
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 3
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 3
- HJWVPKJHHLZCNH-DVXDUOKCSA-N Trp-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=3C4=CC=CC=C4NC=3)C)C(O)=O)=CNC2=C1 HJWVPKJHHLZCNH-DVXDUOKCSA-N 0.000 description 3
- WLQRIHCMPFHGKP-PMVMPFDFSA-N Trp-Leu-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=CC=C1 WLQRIHCMPFHGKP-PMVMPFDFSA-N 0.000 description 3
- IYHRKILQAQWODS-VJBMBRPKSA-N Trp-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IYHRKILQAQWODS-VJBMBRPKSA-N 0.000 description 3
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 3
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 3
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 3
- LTSIAOZUVISRAQ-QWRGUYRKSA-N Tyr-Gly-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O LTSIAOZUVISRAQ-QWRGUYRKSA-N 0.000 description 3
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 3
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 3
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 3
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 3
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 3
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 3
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 3
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 3
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 3
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 3
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 3
- DHINLYMWMXQGMQ-IHRRRGAJSA-N Val-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 DHINLYMWMXQGMQ-IHRRRGAJSA-N 0.000 description 3
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 3
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 3
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 3
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 3
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 3
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 3
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 3
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 3
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 3
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- 230000001464 adherent effect Effects 0.000 description 3
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- GGNALUCSASGNCK-UHFFFAOYSA-N carbon dioxide;propan-2-ol Chemical compound O=C=O.CC(C)O GGNALUCSASGNCK-UHFFFAOYSA-N 0.000 description 3
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 3
- 108010091617 pentalysine Proteins 0.000 description 3
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 3
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000037432 silent mutation Effects 0.000 description 3
- 239000011550 stock solution Substances 0.000 description 3
- 229960002180 tetracycline Drugs 0.000 description 3
- 229930101283 tetracycline Natural products 0.000 description 3
- 235000019364 tetracycline Nutrition 0.000 description 3
- 150000003522 tetracyclines Chemical class 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- PIFFQYJYNWXNGE-UHFFFAOYSA-N 2,4-diacetylphloroglucinol Chemical compound CC(=O)C1=C(O)C=C(O)C(C(C)=O)=C1O PIFFQYJYNWXNGE-UHFFFAOYSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 2
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 2
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 2
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 2
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 2
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 2
- PXAFZDXYEIIUTF-LKTVYLICSA-N Ala-Trp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXAFZDXYEIIUTF-LKTVYLICSA-N 0.000 description 2
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 2
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 2
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 2
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 2
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 2
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 2
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 2
- BGDILZXXDJCKPF-CIUDSAMLSA-N Arg-Gln-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(O)=O BGDILZXXDJCKPF-CIUDSAMLSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- JJIBHAOBNIFUEL-SRVKXCTJSA-N Arg-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)N JJIBHAOBNIFUEL-SRVKXCTJSA-N 0.000 description 2
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 2
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 2
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 2
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 2
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 2
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 2
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 2
- BSBNNPICFPXDNH-SRVKXCTJSA-N Asn-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BSBNNPICFPXDNH-SRVKXCTJSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- CPYHLXSGDBDULY-IHPCNDPISA-N Asn-Trp-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CPYHLXSGDBDULY-IHPCNDPISA-N 0.000 description 2
- GBAWQWASNGUNQF-ZLUOBGJFSA-N Asp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N GBAWQWASNGUNQF-ZLUOBGJFSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 2
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 2
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 2
- WJHYGGVCWREQMO-GHCJXIJMSA-N Asp-Cys-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WJHYGGVCWREQMO-GHCJXIJMSA-N 0.000 description 2
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 2
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 2
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 2
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 2
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 2
- BYALSSDCQYHKMY-XGEHTFHBSA-N Cys-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O BYALSSDCQYHKMY-XGEHTFHBSA-N 0.000 description 2
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 2
- DVKQPQKQDHHFTE-ZLUOBGJFSA-N Cys-Cys-Asn Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N DVKQPQKQDHHFTE-ZLUOBGJFSA-N 0.000 description 2
- HNNGTYHNYDOSKV-FXQIFTODSA-N Cys-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N HNNGTYHNYDOSKV-FXQIFTODSA-N 0.000 description 2
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 2
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 2
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 2
- DYBIDOHFRRUMLW-CIUDSAMLSA-N Cys-Leu-Cys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O DYBIDOHFRRUMLW-CIUDSAMLSA-N 0.000 description 2
- RWVBNRYBHAGYSG-GUBZILKMSA-N Cys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N RWVBNRYBHAGYSG-GUBZILKMSA-N 0.000 description 2
- GFMJUESGWILPEN-MELADBBJSA-N Cys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CS)N)C(=O)O GFMJUESGWILPEN-MELADBBJSA-N 0.000 description 2
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 2
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 2
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 2
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 2
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 2
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 2
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 2
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 2
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 2
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 2
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 2
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 2
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 2
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 2
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 2
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 2
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 2
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 2
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 2
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 2
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 2
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 2
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 2
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 2
- JDAYMLXPUJRSDJ-XIRDDKMYSA-N Glu-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 JDAYMLXPUJRSDJ-XIRDDKMYSA-N 0.000 description 2
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- 102100024977 Glutamine-tRNA ligase Human genes 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 2
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 2
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- JHVCZQFWRLHUQR-DCAQKATOSA-N His-Arg-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JHVCZQFWRLHUQR-DCAQKATOSA-N 0.000 description 2
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 2
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 2
- LBCAQRFTWMMWRR-CIUDSAMLSA-N His-Cys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O LBCAQRFTWMMWRR-CIUDSAMLSA-N 0.000 description 2
- OSZUPUINVNPCOE-SDDRHHMPSA-N His-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OSZUPUINVNPCOE-SDDRHHMPSA-N 0.000 description 2
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 2
- SYIPVNMWBZXKMU-HJPIBITLSA-N His-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N SYIPVNMWBZXKMU-HJPIBITLSA-N 0.000 description 2
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 2
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 2
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 2
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 2
- QLBXWYXMLHAREM-PYJNHQTQSA-N His-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N QLBXWYXMLHAREM-PYJNHQTQSA-N 0.000 description 2
- 241000701109 Human adenovirus 2 Species 0.000 description 2
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 2
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 2
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 2
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 2
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 2
- AMSYMDIIIRJRKZ-HJPIBITLSA-N Ile-His-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AMSYMDIIIRJRKZ-HJPIBITLSA-N 0.000 description 2
- YBGTWSFIGHUWQE-MXAVVETBSA-N Ile-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CN=CN1 YBGTWSFIGHUWQE-MXAVVETBSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 2
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 2
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 2
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 2
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 2
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 2
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 2
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- PIHFVNPEAHFNLN-KKUMJFAQSA-N Leu-Cys-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N PIHFVNPEAHFNLN-KKUMJFAQSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- DXYBNWJZJVSZAE-GUBZILKMSA-N Leu-Gln-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DXYBNWJZJVSZAE-GUBZILKMSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- DDEMUMVXNFPDKC-SRVKXCTJSA-N Leu-His-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N DDEMUMVXNFPDKC-SRVKXCTJSA-N 0.000 description 2
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 2
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 2
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 2
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 2
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 2
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 2
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 2
- GTAXSKOXPIISBW-AVGNSLFASA-N Lys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N GTAXSKOXPIISBW-AVGNSLFASA-N 0.000 description 2
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 2
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 2
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 2
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 2
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 2
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 2
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 2
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 2
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 2
- WXJXYMFUTRXRGO-UWVGGRQHSA-N Met-His-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 WXJXYMFUTRXRGO-UWVGGRQHSA-N 0.000 description 2
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 2
- WNJXJJSGUXAIQU-UFYCRDLUSA-N Met-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 WNJXJJSGUXAIQU-UFYCRDLUSA-N 0.000 description 2
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 2
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 2
- 241000205275 Methanosarcina barkeri Species 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 2
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 2
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 2
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 2
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- IEOHQGFKHXUALJ-JYJNAYRXSA-N Phe-Met-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IEOHQGFKHXUALJ-JYJNAYRXSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- YVXPUUOTMVBKDO-IHRRRGAJSA-N Phe-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CS)C(=O)O YVXPUUOTMVBKDO-IHRRRGAJSA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 2
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 102100037935 Polyubiquitin-C Human genes 0.000 description 2
- 239000004236 Ponceau SX Substances 0.000 description 2
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 2
- XZGWNSIRZIUHHP-SRVKXCTJSA-N Pro-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 XZGWNSIRZIUHHP-SRVKXCTJSA-N 0.000 description 2
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 2
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 2
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 2
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 2
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 2
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 2
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 2
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 239000004283 Sodium sorbate Substances 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 101150006914 TRP1 gene Proteins 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 2
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 2
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 2
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 2
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 2
- PMIJXCLOQFMOKZ-BPUTZDHNSA-N Trp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PMIJXCLOQFMOKZ-BPUTZDHNSA-N 0.000 description 2
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 2
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 2
- OCCYDHCUKXRPSJ-SXNHZJKMSA-N Trp-Ile-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OCCYDHCUKXRPSJ-SXNHZJKMSA-N 0.000 description 2
- KIMOCKLJBXHFIN-YLVFBTJISA-N Trp-Ile-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O)=CNC2=C1 KIMOCKLJBXHFIN-YLVFBTJISA-N 0.000 description 2
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 2
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 2
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 2
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 2
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 2
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 2
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 2
- BVWADTBVGZHSLW-IHRRRGAJSA-N Tyr-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BVWADTBVGZHSLW-IHRRRGAJSA-N 0.000 description 2
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 2
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 2
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 2
- MXFPBNFKVBHIRW-BZSNNMDCSA-N Tyr-Lys-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O MXFPBNFKVBHIRW-BZSNNMDCSA-N 0.000 description 2
- ZMKDQRJLMRZHRI-ACRUOGEOSA-N Tyr-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N ZMKDQRJLMRZHRI-ACRUOGEOSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 2
- 108010056354 Ubiquitin C Proteins 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 2
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 2
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 2
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 2
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 2
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 239000004411 aluminium Substances 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 2
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 108010051239 glutaminyl-tRNA synthetase Proteins 0.000 description 2
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000002028 premature Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- QRBLKGHRWFGINE-UGWAGOLRSA-N 2-[2-[2-[[2-[[4-[[2-[[6-amino-2-[3-amino-1-[(2,3-diamino-3-oxopropyl)amino]-3-oxopropyl]-5-methylpyrimidine-4-carbonyl]amino]-3-[(2r,3s,4s,5s,6s)-3-[(2s,3r,4r,5s)-4-carbamoyl-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)- Chemical compound N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(C)=O)NC(=O)C(C)C(O)C(C)NC(=O)C(C(O[C@H]1[C@@]([C@@H](O)[C@H](O)[C@H](CO)O1)(C)O[C@H]1[C@@H]([C@](O)([C@@H](O)C(CO)O1)C(N)=O)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C QRBLKGHRWFGINE-UGWAGOLRSA-N 0.000 description 1
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- AHPWQERCDZTTNB-FXQIFTODSA-N Arg-Cys-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N AHPWQERCDZTTNB-FXQIFTODSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- DTBPLQNKYCYUOM-JYJNAYRXSA-N Arg-Met-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DTBPLQNKYCYUOM-JYJNAYRXSA-N 0.000 description 1
- ZEBDYGZVMMKZNB-SRVKXCTJSA-N Arg-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N ZEBDYGZVMMKZNB-SRVKXCTJSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- WTFIFQWLQXZLIZ-UMPQAUOISA-N Arg-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O WTFIFQWLQXZLIZ-UMPQAUOISA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- CQMQJWRCRQSBAF-BPUTZDHNSA-N Asn-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N CQMQJWRCRQSBAF-BPUTZDHNSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- GMCOADLDNLGOFE-ZLUOBGJFSA-N Asn-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N GMCOADLDNLGOFE-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 1
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 1
- ULZOQOKFYMXHPZ-AQZXSJQPSA-N Asn-Trp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ULZOQOKFYMXHPZ-AQZXSJQPSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- MULILVLIEUHVTJ-UHFFFAOYSA-N Asp Ile Met Thr Chemical compound OC(=O)CC(N)C(=O)NC(C(C)CC)C(=O)NC(CCSC)C(=O)NC(C(C)O)C(O)=O MULILVLIEUHVTJ-UHFFFAOYSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 1
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 1
- BUIYOWKUSCTBRE-CIUDSAMLSA-N Cys-Arg-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O BUIYOWKUSCTBRE-CIUDSAMLSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 1
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 1
- FIADUEYFRSCCIK-CIUDSAMLSA-N Cys-Glu-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIADUEYFRSCCIK-CIUDSAMLSA-N 0.000 description 1
- KKUVRYLJEXJSGX-MXAVVETBSA-N Cys-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KKUVRYLJEXJSGX-MXAVVETBSA-N 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 1
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 101710135281 DNA polymerase III PolC-type Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 101150029662 E1 gene Proteins 0.000 description 1
- 108091005947 EBFP2 Proteins 0.000 description 1
- 102100021579 Enhancer of filamentation 1 Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 108010046649 GDNP peptide Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- GNDJOCGXGLNCKY-ACZMJKKPSA-N Gln-Cys-Cys Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O GNDJOCGXGLNCKY-ACZMJKKPSA-N 0.000 description 1
- VVWWRZZMPSPVQU-KBIXCLLPSA-N Gln-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N VVWWRZZMPSPVQU-KBIXCLLPSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- ATTWDCRXQNKRII-GUBZILKMSA-N Gln-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ATTWDCRXQNKRII-GUBZILKMSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- NJMYZEJORPYOTO-BQBZGAKWSA-N Gln-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O NJMYZEJORPYOTO-BQBZGAKWSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- MIWJDJAMMKHUAR-ZVZYQTTQSA-N Glu-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N MIWJDJAMMKHUAR-ZVZYQTTQSA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 1
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- CHZRWFUGWRTUOD-IUCAKERBSA-N His-Gly-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N CHZRWFUGWRTUOD-IUCAKERBSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- JSHOVJTVPXJFTE-HOCLYGCPSA-N His-Gly-Trp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JSHOVJTVPXJFTE-HOCLYGCPSA-N 0.000 description 1
- BILZDIPAKWZFSG-PYJNHQTQSA-N His-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N BILZDIPAKWZFSG-PYJNHQTQSA-N 0.000 description 1
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 1
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- WSAILOWUJZEAGC-DCAQKATOSA-N His-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSAILOWUJZEAGC-DCAQKATOSA-N 0.000 description 1
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 1
- 101000898310 Homo sapiens Enhancer of filamentation 1 Proteins 0.000 description 1
- 108700039609 IRW peptide Proteins 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- ZXJFURYTPZMUNY-VKOGCVSHSA-N Ile-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 ZXJFURYTPZMUNY-VKOGCVSHSA-N 0.000 description 1
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- SYVMEYAPXRRXAN-MXAVVETBSA-N Ile-Cys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SYVMEYAPXRRXAN-MXAVVETBSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- SQXUUGUCGJSWCK-CIUDSAMLSA-N Lys-Asp-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N SQXUUGUCGJSWCK-CIUDSAMLSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- PRCHKVGXZVTALR-KKUMJFAQSA-N Lys-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N PRCHKVGXZVTALR-KKUMJFAQSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- NSGXXVIHCIAISP-CIUDSAMLSA-N Met-Asn-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NSGXXVIHCIAISP-CIUDSAMLSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 1
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 1
- ZACMJPCWVSLCNS-JYJNAYRXSA-N Met-Phe-Met Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCSC)C(O)=O)CC1=CC=CC=C1 ZACMJPCWVSLCNS-JYJNAYRXSA-N 0.000 description 1
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- YQNBKXUTWBRQCS-BVSLBCMMSA-N Phe-Arg-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 YQNBKXUTWBRQCS-BVSLBCMMSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- AKJAKCBHLJGRBU-JYJNAYRXSA-N Phe-Glu-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AKJAKCBHLJGRBU-JYJNAYRXSA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- NAOVYENZCWFBDG-BZSNNMDCSA-N Phe-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 NAOVYENZCWFBDG-BZSNNMDCSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- PTLMYJOMJLTMCB-KKUMJFAQSA-N Phe-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N PTLMYJOMJLTMCB-KKUMJFAQSA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- CKJACGQPCPMWIT-UFYCRDLUSA-N Phe-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CKJACGQPCPMWIT-UFYCRDLUSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- LTQCLFMNABRKSH-UHFFFAOYSA-N Phleomycin Natural products N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(O)C)NC(=O)C(C)C(O)C(C)NC(=O)C(C(OC1C(C(O)C(O)C(CO)O1)OC1C(C(OC(N)=O)C(O)C(CO)O1)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C LTQCLFMNABRKSH-UHFFFAOYSA-N 0.000 description 1
- 108010035235 Phleomycins Proteins 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- WECYCNFPGZLOOU-FXQIFTODSA-N Pro-Asn-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O WECYCNFPGZLOOU-FXQIFTODSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- QSHKTZVJGDVFEW-GUBZILKMSA-N Ser-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N QSHKTZVJGDVFEW-GUBZILKMSA-N 0.000 description 1
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- PZHJLTWGMYERRJ-SRVKXCTJSA-N Ser-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O PZHJLTWGMYERRJ-SRVKXCTJSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- XUGYQLFEJYZOKQ-NGTWOADLSA-N Thr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XUGYQLFEJYZOKQ-NGTWOADLSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- UXUAZXWKIGPUCH-RCWTZXSCSA-N Thr-Met-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O UXUAZXWKIGPUCH-RCWTZXSCSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- PEYSVKMXSLPQRU-FJHTZYQYSA-N Trp-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PEYSVKMXSLPQRU-FJHTZYQYSA-N 0.000 description 1
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 1
- GZTKZDGIEBKZAH-XIRDDKMYSA-N Trp-Cys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N GZTKZDGIEBKZAH-XIRDDKMYSA-N 0.000 description 1
- OBWQLWYNNZPWGX-QEJZJMRPSA-N Trp-Gln-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OBWQLWYNNZPWGX-QEJZJMRPSA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- UIRPULWLRODAEQ-QEJZJMRPSA-N Trp-Ser-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 UIRPULWLRODAEQ-QEJZJMRPSA-N 0.000 description 1
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 1
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000002074 deregulated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 229960003248 mifepristone Drugs 0.000 description 1
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 230000002477 vacuolizing effect Effects 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0684—Cells of the urinary tract or kidneys
- C12N5/0686—Kidney cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y601/00—Ligases forming carbon-oxygen bonds (6.1)
- C12Y601/01—Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
- C12Y601/01026—Pyrrolysine-tRNAPyl ligase (6.1.1.26)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Urology & Nephrology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
AAV 생산을 위한 유전자 조작된 세포가 본 명세서에 개시된다. 유전자 조작된 세포는 AAV 생산에 필요한 유전자 발현의 일시적 제어를 위한 분자 시스템을 포함한다. 또한 AAV 생산을 위한 유전자 조작된 세포를 이용하는 방법이 본 명세서에 개시된다.
Description
기술분야
아데노-연관 바이러스(Adeno-Associated Virus: AAV) 생산 시스템이 본 명세서에 기재된다. 또한 조작된 세포, 및 AAV 생산 시스템을 포함하는 키트 및 AAV 생산을 위해 이를 사용하는 방법이 본 명세서에 기재된다.
관련 출원
본 출원은 미국 특허법(35 U.S.C. § 119) 하에서 2021년 4월 21일자로 출원된 미국 가출원 특허 일련 번호 63/177760의 유익을 주장하며, 이의 전문은 본 명세서에 참조에 의해 원용된다.
EFS-WEB을 통해 텍스트 파일로서 제출된 서열목록에 대한 참조
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출되고 본 명세서에 전문이 참조에 의해 원용되는 서열목록을 포함한다. 2022년 4월 21일자로 생성된 상기 ASCII 사본은 파일명이 A121070007WO00-SEQ-ARM이며, 용량이 347,698 바이트이다.
AAV는 세포 및 유전자 요법을 위한 유망한 유전자 전달 양상이다. AAV는 대상체 내의 세포에 치료적 유전자 페이로드를 운반하도록 변형될 수 있다. AAV의 생산은 일반적으로 바이러스 벡터 생산에 필요한 유전자를 함유하는 플라스미드의 세포 배양물에의 일시적 형질감염을 수반한다. 그러나, 일시적 형질감염은 몇 가지의 부족한 점이 있다. 형질감염 과정을 위해서는 다량의 DNA 및 형질감염 시약이 조달되어야 하는데, 이는 비용이 든다. 또한, 불량한 형질감염 효율은 최소 수의 '형질감염' 세포, 및 형질감염 단계 및 바이러스 생산과 연관된 증가된 변이를 초래할 수 있다.
세포증식억제성 또는 세포독성 유전자 산물을 포함하는 AAV 생산에 필요한 유전자 산물의 유도성 제어를 도입하는 AAV 생산 시스템이 본 명세서에 기재된다. 이러한 유도성 제어는 게놈 수준(즉, 게놈 변형의 유도성 제어)에서 또는 번역 수준(즉, 변경된 번역의 유도성 제어)에서 매개될 수 있다. 기재된 AAV 생산 시스템의 각각은 무작위 통합, 표적화된 통합, 또는 트랜스포존-매개 통합을 이용하여 게놈에 통합될 수 있다.
일부 실시형태에서, 본 출원은, 비표준 tRNA 합성효소(noncanonical tRNA synthetase); 비표준 tRNA 합성효소에 상응하는 비표준 tRNA; NC-Rep 78; 및 NC-Rep52 각각을 암호화하는 핵산 서열을 일괄적으로(collectively) 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포를 개시하며; 이들 각각은 프로모터에 작동 가능하게 연결되되; NC-Rep78을 암호화하는 핵산 서열 및 NC-Rep52를 암호화하는 핵산 서열은 각각 조기 정지 코돈과 비표준 tRNA에 대응하는 아미노산 코돈 둘 다인 코돈을 포함한다. 일부 실시형태에서, 조작된 세포는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하고, 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 포함하는 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 조작된 세포는 피롤리실-tRNA 합성효소(Pyrrolysyl-tRNA synthetase: pylRS)인 비표준 tRNA 합성효소를 포함한다. 일부 실시형태에서, 조작된 세포는 서열번호 20 및 21 중 어느 하나의 아미노산 서열을 포함하는 pylRS를 포함한다. 일부 실시형태에서, 조작된 세포는 서열번호 21의 아미노산 서열을 포함하는 PylRS를 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 비표준 tRNA를 암호화하는 핵산 서열을 포함하는 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 조작된 세포는 H-Lys(Boc)-OH를 담고 있는(charge) 비표준 tRNA를 포함한다. 일부 실시형태에서, 조작된 세포 내에 포함된 비표준 tRNA는 PylT U25C이다. 일부 실시형태에서, 조작된 세포는 서열번호 22의 핵산 서열을 포함하는 PylT U25C를 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는, 각각 PylT U25C를 암호화하고 프로모터에 각각 작동 가능하게 연결된 핵산 서열을 포함하는 4개의 핵산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 NC-Rep78 및 NC-Rep52를 암호화하는 핵산 서열을 포함하는 제3의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, NC-Rep78은 17번 위치에서 조기 정지 코돈을 포함하거나; NC-Rep52는 233번 위치에서 조기 정지 코돈을 포함하거나; 또는 이들의 조합이다. 일부 실시형태에서, 조작된 세포는 pylRS 비표준 tRNA 합성효소 및 PylT U25C 비표준 tRNA를 포함한다. 일부 실시형태에서, 조작된 세포는 단일 전사체로서 암호화된 NC-Rep78을 암호화하는 핵산 서열 및 NC-Rep52를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 단일 전사체는 서열번호 26 내지 27 중 어느 하나의 아미노산 서열을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 NC-Rep40을 암호화하는 핵산 서열; NC-Rep68을 암호화하는 핵산 서열; 또는 둘 다를 추가로 포함한다.
일부 실시형태에서, 조작된 세포는 HEK293 세포, HeLa 세포, BHK 세포 또는 SB9 세포이다.
일부 실시형태에서, 본 출원은 위에 기재한 바와 같이 조작된 세포 중 어느 하나를 포함하는 키트를 개시한다. 일부 실시형태에서, 키트는, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 추가로 포함한다. 일부 실시형태에서, 키트 내에 포함된 폴리뉴클레오타이드는 플라스미드 또는 벡터이다.
일부 실시형태에서, 본 출원은 위에 기재한 바와 같은 조작된 세포 중 어느 하나를 비표준 아미노산과 접촉시키는 단계를 포함하는, AAV 생산 방법을 개시한다. 일부 실시형태에서, 비표준 아미노산은 H-Lys(Boc)-OH이다.
일부 양상에서, 본 출원은 Rep52, DA-Rep52, Rep40 또는 DA-Rep40; Rep78, DA-Rep78, Rep68 또는 DA-Rep68; E2A 또는 DA-E2A; E4ORF6 또는 DA-E4ORF6; VARNA 또는 DA-VARNA; VP1 또는 DA-VP1; VP2 또는 DA-VP2; VP3 또는 DA-VP3; AAP; 및 L4 100K 또는 DA-L4 100K 및 염기 편집기의 각각을 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포를 개시하고, 각각의 핵산 분자는 프로모터에 작동 가능하게 연결되되; 세포는 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K 중 적어도 하나의 핵산 서열을 포함하고; DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K의 핵산 서열은 각각 변형된 코돈을 포함한다.
일부 실시형태에서, 변형된 코돈은 미스센스 코돈을 암호화하고, 변형된 코돈에서 사이토신 또는 아데닌의 탈아미노화는 암호화된 아미노산을 다른 아미노산으로 전환시킨다.
일부 실시형태에서, 변형된 코돈은 조기 정지 코돈을 암호화하고, 변형된 코돈에서 아데닌의 탈아미노화는 변형된 코돈을 트립토판 코돈, 글루타민 코돈 또는 아르기닌으로 전환시킨다.
일부 실시형태에서, 변형된 코돈은 조기 정지 코돈을 암호화하고, 변형된 코돈에서 사이토신의 탈아미노화는 암호화된 아미노산을 프롤린으로 전환시킨다.
일부 실시형태에서, 조작된 세포는 하나 이상의 CTCF 절연체를 암호화하는 핵산 서열을 각각 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는 DA-E2A를 암호화하는 핵산 서열, DA-E4ORF6을 암호화하는 핵산 서열 및 VARNA를 암호화하는 핵산 서열을 포함하는, 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 L4 100K 또는 DA-L4 100K를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하는 DA-E2A의 핵산 서열을 포함하여 하나 이상의 조기 정지 코돈을 생성한다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 39 또는 40의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-E2A의 181번 및/또는 324번 위치(서열번호 39 또는 40)는 조기 정지 코돈을 생성하는 아데닌에 대한 돌연변이와 상응한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 아데닌에 대한 하나 이상의 돌연변이를 포함하는 DA-E4ORF6의 핵산 서열을 포함하여 하나 이상의 조기 정지 코돈을 생성한다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 41 또는 42의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6의 77번 및/또는 192번 위치(서열번호 41 또는 42)는 조기 정지 코돈을 생성하는 아데닌을 포함하는 변형된 코돈과 상응한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자는 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열, DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열, VP1 또는 DA-VP1을 암호화하는 핵산 서열, VP2 또는 DA-VP2를 암호화하는 핵산 서열 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함하는, 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제2의 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52를 암호화하는 핵산 서열은 서열번호 43 또는 47의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-Rep40을 암호화하는 핵산 서열은 서열번호 44 또는 48의 아미노산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78을 암호화하는 핵산 서열은 서열번호 45, 49 및 51 중 어느 하나의 아미노산 서열을 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 서열번호 46, 50 또는 52의 아미노산 서열을 포함하는 DA-Rep68을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 아미노산 서열을 포함한다. 일부 실시형태에서, Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 핵산 서열은 서열번호 53 내지 55, 113 내지 115 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52, DA-Rep40, DA-Rep68 및 DA-Rep78을 암호화하는 핵산 서열은 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성한다. 일부 실시형태에서, 뉴클레오타이드 서열에서 하나의 아데닌 돌연변이는 DA-Rep78의 67, 262 및/또는 319번 아미노산 위치(서열번호 45, 49 및 51)에 상응하는 위치이다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 하나 이상의 sgRNA를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 하나 이상의 sgRNA는 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하는 핵산 서열에 상보성인 핵산 서열을 각각 포함한다. 일부 실시형태에서, 하나 이상의 sgRNA는 각각 서열번호 56 내지 81 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 sgRNA는 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 하나 이상의 sgRNA에 작동 가능하게 연결된 화학적 유도성 프로모터는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF, CymR 또는 Gal4 UAS 작동유전자 서열 중 적어도 하나를 포함하는 프로모터로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 하나 이상의 sgRNA에 작동 가능하게 연결된 화학적 유도성 프로모터를 암호화하는 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 VP1 또는 DA-VP1, VP2 또는 DA-VP2 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, VP1을 암호화하는 핵산 서열은 서열번호 14의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 서열번호 99 또는 102의 아미노산 서열을 포함한다. 일부 실시형태에서, VP2를 암호화하는 핵산 서열은 서열번호 15의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-VP2를 암호화하는 핵산 서열은 서열번호 100 또는 103의 아미노산 서열을 포함한다. 일부 실시형태에서, VP3을 암호화하는 핵산 서열은 서열번호 16의 아미노산 서열을 포함한다. 일부 실시형태에서, DA-VP3을 암호화하는 핵산 서열은 서열번호 101 또는 104의 아미노산 서열을 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 AAP를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, AAP를 암호화하는 핵산 서열은 서열번호 17의 아미노산 서열을 포함한다.
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 조작된 세포는, 소분자 유도물질(inducer)의 존재 하에 발현될 때, 조작된 세포의 화학적 유도성 프로모터에 결합하는 전사 활성체를 암호화하는 핵산 서열 및 염기 편집기를 암호화하는 핵산 서열을 포함하는, 제3의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 추가로 포함한다.
일부 실시형태에서, 염기 편집기를 포함하는 제3의 안정적으로 통합된 핵산 분자는 아데닌 염기 편집기(Adenine Base Editor: ABE) 또는 사이토신 염기 편집기(Cytosine Base Editor: CBE)를 포함한다. 일부 실시형태에서, CBE는 Cas9 CBE 또는 Cas13 CBE이다. 일부 실시형태에서, ABE는 Cas9 ABE 또는 Cas13 ABE이다. 일부 실시형태에서, Cas9 ABE는 서열번호 82 또는 83을 포함하는 아미노산 서열에 의해 암호화된다. 일부 실시형태에서, Cas13 ABE는 서열번호 84 또는 85를 포함하는 아미노산 서열에 의해 암호화된다. 일부 실시형태에서, ABE를 암호화하는 핵산 서열은 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, ABE는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF 또는 CymR 중 적어도 하나, 또는 Gal4 UAS 작동유전자 서열을 포함하는 프로모터로 이루어진 군으로부터 선택되는, 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 제3의 화학적 유도성 프로모터를 암호화하는 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함한다. 일부 실시형태에서, 조작된 세포는 TetOn-3G, TetOn-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16 및 큐메이트(cumate) cTA 및 rcTA로 이루어진 군으로부터 선택된 전사 활성체를 포함한다. 일부 실시형태에서, 전사 활성체는 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된 소분자 유도물질에 의해 활성화된다. 일부 실시형태에서, 전사 활성체는 TetOn 3G이고, 소분자 유도물질은 독시사이클린이다.
일부 실시형태에서, 조작된 세포는 HEK293 세포 또는 HeLa 세포이다.
일부 양상에서, 본 출원은 본 명세서에 기재된 바와 같은 조작된 세포를 포함하는 키트를 개시한다. 일부 실시형태에서, 키트는, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 추가로 포함한다. 일부 실시형태에서, 키트 내에 포함된 폴리뉴클레오타이드는 플라스미드 또는 벡터이다.
일부 양상에서, 본 출원은 위에 기재한 바와 같은 조작된 세포를 화학적 유도성 프로모터에 결합하는 소분자 유도물질과 접촉시키는 단계를 포함하는, AAV 생산 방법을 개시한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된다.
도 1은 ncAA AAV 플라스미드에 대한 플라스미드 개략도이다. 고세균 메타노사르시나 마제이(Methanosarcina mazei) 직교성 tRNA 합성효소("pylRS")는 hEF1a를 이용하여 구성요소로서 발현된다. 동족 tRNA("PylT")는 ncAA 혼입의 효율이 ncAA tRNA 존재비와 연관되어 있기 때문에 다중-복사 맥락에서 U6 RNA 중합효소 III 프로모터를 이용하여 발현된다. RepAAV2 Rep78 + 52 단독 작제물은 D233X 및 E17X TAG 정지 코돈 돌연변이에 추가로 Rep68/40 스플라이스 부위를 없애는 점 돌연변이를 포함한다. AAV2 Rep52/40-IRES-Rep78/68 작제물은 p19 AAV2 프로모터의 활성을 제거/최소화하는 점 돌연변이를 포함하고, D233X 및 E17X를 포함한다. AAV WT Rep 작제물은 Rep78/68/52/40을 암호화하고, D233X 및 E17X TAG 정지 코돈 돌연변이를 포함한다. Cap 및 헬퍼 유전자 발현 작제물과 관련하여 이러한 ncAA 플라스미드를 이용하는 일시적 시험을 사용하여 ncAA 유도성 AAV 생산을 특성규명할 수 있다.
도 2는 일시적 형질감염 플라스미드에 대한 플라스미드 개략도이다. 조기 정지 코돈은 Rep, Cap, E2A, L4 100K 및/또는 E4 ORF6의 암호화 서열에서 트립토판(W), 글루타민(Q) 또는 아르기닌(R) 코돈을 돌연변이시킴으로써 생성된다. 구성요소로서 발현된 ABE 및 단일 가이드 RNA는 AAV를 생산하는 형질감염 동안 이러한 정지 코돈을 수선한다. ABE 또는 단일 가이드 RNA의 부재 하에서, AAV는 생산되지 않는다.
도 3은 플라스미드의 안정적인 통합을 위한 플라스미드 개략도이다. 트랜스포존 IR/DRs, CTCF 절연체 및 항생제 내성 선택 카세트는 AAV 페이로드, 돌연변이체 Rep/Cap, 및 돌연변이체 헬퍼 유전자에 측접한다. 하나 이상의 조기 정지 코돈이 Rep, E2A 및 E4 ORF6에 도입될 수 있다. ABE는 유도성 TRE 프로모터에 의해 발현되고, rtTA(TetOn) 유전자는 동일한 플라스미드 상에서 항생제 내성 유전자에 융합된다.
도 4는 바이러스 역가를 회복하기 위해 ABE8.17-m 유무와 상관없이 Rep, Cap, E2A, E4 ORF6 및 L4 100K의 개개 조기 정지 돌연변이체를 도시한다. 시험한 모든 Rep 및 Cap 돌연변이체는 ABE의 부재 하에서 AAV 역가를 음성 대조군("편집기 없음")과 비슷한 수준으로 감소시킬 수 있다. 돌연변이체 Rep78 W319* 및 Rep78 Q262*는 ABE8.17-m에 의해 '야생형' AAV("ABE8.17-m[V106W]")와 비슷한 역가로 회복될 수 있었다. 그러나, E2A, E4 ORF6 또는 L4 100K 단독 중 하나의 단일 돌연변이는 ABE의 부재 하에서 AAV 역가를 완전히 감소시키기에 충분하지 않았다.
도 5는 돌연변이 Rep W319* 또는 "야생형" pRepCap 플라스미드와 조합되고, ABE8.17-m 유무와 상관없이 공동 형질감염된 다양한 pHelper 돌연변이의 조합을 나타낸다. pHelper 플라스미드를 삽입 플라스미드로 대체하는 것은 음성 대조군으로서 작용하였다. ABE 유무와 상관없이 모든 삼중 돌연변이("RepW319*,ABE-")는 음성 대조군 수준으로 AAV 역가의 비슷한 감소를 나타낸다. ABE의 부재 하에서 이중 pHelper 돌연변이("wtRep,ABE-")만을 찾을 때, AAV 역가는 감소되지만, 완전히 없어지지는 않는다. ABE의 공동 형질감염("wtRep,ABE+" 및 "RepW319*,ABE+")은, 시험한 돌연변이체 조합물마다 2배 이내에서, 역가를 '야생형' AAV(제1 "wt pHelper" 및 "wtRep,ABE+" 막대) 근처의 수준으로 회복시킨다.
도 6은 독시사이클린 유무와 상관없이 공동 형질감염된 다양한 안정적인 AAV 플라스미드의 조합물을 나타낸다. ABE 플라스미드가 없는 공동 형질감염은 음성 대조군으로서 작용한다. 유도성 가이드 RNA를 이용할 때, 얻어진 AAV 역가는 독시사이클린의 부재 하에서 음성 대조군 수준과 비슷하고, 독시사이클린의 존재 하에서 야생형 AAV 역가 수준과 비슷하며, 둘 다 4배 이내이다. 그러나, 구성적 가이드 RNA를 이용할 때, 얻어진 AAV 역가는 2배 이내에서 독시사이클린의 유무와 상관없이 야생형 대조군 수준과 비슷하고, 이는 일시적으로 시험한 플라스미드 조합물의 유도성 결여를 나타낸다.
도 2는 일시적 형질감염 플라스미드에 대한 플라스미드 개략도이다. 조기 정지 코돈은 Rep, Cap, E2A, L4 100K 및/또는 E4 ORF6의 암호화 서열에서 트립토판(W), 글루타민(Q) 또는 아르기닌(R) 코돈을 돌연변이시킴으로써 생성된다. 구성요소로서 발현된 ABE 및 단일 가이드 RNA는 AAV를 생산하는 형질감염 동안 이러한 정지 코돈을 수선한다. ABE 또는 단일 가이드 RNA의 부재 하에서, AAV는 생산되지 않는다.
도 3은 플라스미드의 안정적인 통합을 위한 플라스미드 개략도이다. 트랜스포존 IR/DRs, CTCF 절연체 및 항생제 내성 선택 카세트는 AAV 페이로드, 돌연변이체 Rep/Cap, 및 돌연변이체 헬퍼 유전자에 측접한다. 하나 이상의 조기 정지 코돈이 Rep, E2A 및 E4 ORF6에 도입될 수 있다. ABE는 유도성 TRE 프로모터에 의해 발현되고, rtTA(TetOn) 유전자는 동일한 플라스미드 상에서 항생제 내성 유전자에 융합된다.
도 4는 바이러스 역가를 회복하기 위해 ABE8.17-m 유무와 상관없이 Rep, Cap, E2A, E4 ORF6 및 L4 100K의 개개 조기 정지 돌연변이체를 도시한다. 시험한 모든 Rep 및 Cap 돌연변이체는 ABE의 부재 하에서 AAV 역가를 음성 대조군("편집기 없음")과 비슷한 수준으로 감소시킬 수 있다. 돌연변이체 Rep78 W319* 및 Rep78 Q262*는 ABE8.17-m에 의해 '야생형' AAV("ABE8.17-m[V106W]")와 비슷한 역가로 회복될 수 있었다. 그러나, E2A, E4 ORF6 또는 L4 100K 단독 중 하나의 단일 돌연변이는 ABE의 부재 하에서 AAV 역가를 완전히 감소시키기에 충분하지 않았다.
도 5는 돌연변이 Rep W319* 또는 "야생형" pRepCap 플라스미드와 조합되고, ABE8.17-m 유무와 상관없이 공동 형질감염된 다양한 pHelper 돌연변이의 조합을 나타낸다. pHelper 플라스미드를 삽입 플라스미드로 대체하는 것은 음성 대조군으로서 작용하였다. ABE 유무와 상관없이 모든 삼중 돌연변이("RepW319*,ABE-")는 음성 대조군 수준으로 AAV 역가의 비슷한 감소를 나타낸다. ABE의 부재 하에서 이중 pHelper 돌연변이("wtRep,ABE-")만을 찾을 때, AAV 역가는 감소되지만, 완전히 없어지지는 않는다. ABE의 공동 형질감염("wtRep,ABE+" 및 "RepW319*,ABE+")은, 시험한 돌연변이체 조합물마다 2배 이내에서, 역가를 '야생형' AAV(제1 "wt pHelper" 및 "wtRep,ABE+" 막대) 근처의 수준으로 회복시킨다.
도 6은 독시사이클린 유무와 상관없이 공동 형질감염된 다양한 안정적인 AAV 플라스미드의 조합물을 나타낸다. ABE 플라스미드가 없는 공동 형질감염은 음성 대조군으로서 작용한다. 유도성 가이드 RNA를 이용할 때, 얻어진 AAV 역가는 독시사이클린의 부재 하에서 음성 대조군 수준과 비슷하고, 독시사이클린의 존재 하에서 야생형 AAV 역가 수준과 비슷하며, 둘 다 4배 이내이다. 그러나, 구성적 가이드 RNA를 이용할 때, 얻어진 AAV 역가는 2배 이내에서 독시사이클린의 유무와 상관없이 야생형 대조군 수준과 비슷하고, 이는 일시적으로 시험한 플라스미드 조합물의 유도성 결여를 나타낸다.
AAV는 세포 및 유전자 요법을 위한 유망한 유전자 전달 양상이다. AAV의 생산은 일반적으로 플라스미드의 세포 배양물에의 일시적 형질감염을 수반한다. 그러나, 게놈에 치료 AAV를 생산하는 데 필요한 유전자의 안정적인 통합은 일시적 형질감염을 통한 전통적인 생산과 비교할 때 여러 이점을 제공한다. 세포가 이들 자체의 세포분열 동안에 바이러스 유전자를 증식시키기 때문에, 형질감염 과정을 위해 더 이상 다량의 DNA 및 형질감염 시약을 조달할 필요가 없어서, 비용이 절감된다. 또한, DNA는 이미 핵 내에 있기 때문에, 최소 수의 "비형질감염" 세포 및 형질감염 단계와 연관된 감소된 변이로 인해 바이러스 역가는 더 높고 더 일관될 수 있다. 또한 생산 과정이 간단할수록 연구자의 시간을 절약한다.
그러나, 아데노-연관 바이러스(AAV) 벡터 생산에 필요한 여러 유전자는 다른 연구자들에 의해 세포증식억제성 또는 세포독성, 즉, Rep, E2A 및 E4인 것으로 입증되었다. HEK293 세포에서 아데노바이러스 E1 유전자의 천연 발현이 이러한 독성 유전자의 발현을 상향조절하기 때문에, 이러한 단백질의 세포독성 및 세포증식억제성 특성은 널리 사용되는 HEK293 세포주에서의 안정적인 AAV 생산자 세포주의 개발을 방해하였다. 이러한 유전자에 의해 안정적으로 형질감염된 세포는 선택 단계에서 생존하지 못하거나 발현이 침묵되어, 적절한 양의 AAV를 생산하는 것의 불능을 초래한다.
I.
아데노-연관 바이러스 생산 시스템
일부 양상에서, 본 개시내용은 아데노-연관 바이러스(AAV) 생산 시스템에 관한 것이다. 일부 실시형태에서, AAV 생산 시스템은 세포에 대해 세포독성 또는 세포증식억제성인 생성물(들)을 포함하는 AAV 생산에 필요한 유전자 산물(들)의 유도성 제어를 가능하게 한다. 이러한 유도성 제어는 게놈 수준(즉, 게놈 변형의 유도성 제어)에서 또는 번역 수준(즉, 변경된 번역의 유도성 제어)에서 매개될 수 있다.
본 명세서에 기재된 바와 같은 AAV 생산 시스템은, (a) AAV 생산 구성성분 및 (b) 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다. 본 명세서에 사용되는 바와 같은 용어 "AAV 생산 구성성분"은 재조합 숙주 세포에서 AAV의 생성에 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리핵산을 지칭하되, AAV 생산에 필요한 적어도 하나의 유전자는 AAV 생산에 필요한 유전자에 필요한 유전자 활성을 감소시키는 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, 돌연변이는 조기 정지 코돈을 생성한다.
일부 실시형태에서, AAV 생산 구성성분은 재조합 숙주 세포에서 AAV 벡터를 생성하는 데 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 예시적인 AAV 유전자 산물은 Rep52, Rep40, Rep78, Rep68, E2A, E4Orf6, VARNA, CAP(VP1, VP2, VP3) 및 AAP를 포함한다. Rep 유전자 산물(Rep52, Rep40, Rep78 및 Rep68 포함)은 AAV 게놈 복제에 수반된다. E2A 유전자 산물은 AAV 복제 동안 DNA 합성 진행성(processivity)을 돕는 것에 관여한다. E4Orf6 유전자 산물은 AAV 복제를 지원한다. VARNA 유전자 산물은 번역을 조절하는 데 어떤 역할을 한다. CAP 유전자 산물(VP1, VP2, VP3 포함)은 바이러스 캡시드 단백질을 암호화한다. AAP 유전자 산물은 캡시드 조립체에서 어떤 역할을 한다. 일부 실시형태에서, AAV 구성성분은 유전자 산물: Rep52 또는 Rep40; Rep78 또는 Rep68; E2A; E4Orf6; VARNA; VP1; VP2; VP3; 및 AAP를 일괄적으로 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, AAV 구성성분은 유전자 산물: Rep52, Rep40, Rep78, Rep68, E2A, E4Orf6, VARNA, VP1, VP2, VP3 및 AAP를 일괄적으로 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)(예를 들어, 세포에 대해 세포독성 또는 세포증식억제성인 산물(들), 예컨대, Rep, E2A 및/또는 E4)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 AAV 생산에 필요한 유전자의 활성을 감소시키는 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, 돌연변이는 조기 정지 코돈을 생성한다.
일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 적어도 1개의 돌연변이(예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 돌연변이)를 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이(들)를 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산 내의 임의의 코돈은 돌연변이될 수 있다.
일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 적어도 1개의 조기 정지 코돈(예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 조기 정지 코돈)을 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 조기 정지 코돈(들)을 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산은 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 조기 정지 코돈(들)을 포함한다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산 내의 임의의 코돈은 조기 정지 코돈에 대해 변형될 수 있다.
본 명세서에 사용되는 바와 같은 용어 "조기 정지 코돈"은 주어진 코돈의 서열이 TAG, TAA 또는 TGA가 되도록 암호화 서열에서 하나 이상의 핵산 잔기를 돌연변이시킴으로써 유전자의 암호화 서열에 첨가되는 정지 코돈을 지칭한다.
일부 실시형태에서, AAV 생산 구성성분은(즉, AAV 구성성분의 유전자 산물은) 단일 폴리핵산 상에서 암호화된다. 다른 실시형태에서, 다중 폴리핵산은 일괄적으로 AAV 구성성분을 포함한다(즉, AAV 구성성분의 유전자 산물 중 적어도 둘 이상은 상이한 폴리핵산 상에서 암호화된다). 예를 들어, AAV 구성성분은 적어도 2, 적어도 3, 적어도 4, 또는 적어도 5개의 폴리핵산을 포함할 수 있다. 일부 실시형태에서, AAV 구성성분은 2, 3, 4 또는 5개의 폴리핵산을 포함한다.
본 명세서에 사용되는 바와 같은 용어 "활성 제어 구성성분"은 유전자 산물의 활성을 감소시키는 하나 이상의 돌연변이를 포함하는 AAV 생산에 필요한 유전자의 생산을 유도하는 데 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리핵산을 지칭한다. 일부 실시형태에서, 하나 이상의 돌연변이는 야생형 유전자 산물에 비해 적어도 10%(예를 들어, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%)만큼 AAV 생산에 필요한 유전자 산물의 활성을 감소시킨다. 일부 실시형태에서, 하나 이상의 돌연변이는 AAV 생산에 필요한 유전자 산물의 활성을 10% 내지 20%, 10% 내지 30%, 10%, 50%, 10% 내지 70%, 10% 내지 90%, 10% 내지 99%, 30% 내지 50%, 30% 내지 70%, 30% 내지 90%, 30% 내지 99%, 50% 내지 70%, 50% 내지 90%, 50% 내지 99%, 70% 내지 90% 또는 70% 내지 99%만큼 감소시킨다. 일부 실시형태에서, AAV 생산에 필요한 유전자의 하나 이상의 돌연변이는 유전자 산물의 기능상실을 초래한다. 일부 실시형태에서, 하나 이상의 돌연변이는 세포에서의 AAV 생산을 적어도 1배(예를 들어, 적어도 1배, 적어도 2배, 적어도 5배, 적어도 10배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배, 적어도 10000배)만큼 감소시킨다. 일부 실시형태에서, 하나 이상의 돌연변이는 AAV 생산을 세포 1 내지 2, 1 내지 5, 1 내지 10, 1 내지 50, 1 내지 100, 1 내지 1000, 5 내지 10, 5 내지 50, 5 내지 100, 5 내지 1000, 10 내지 20, 10 내지 50, 10 내지 100, 10 내지 1000, 10 내지 10000, 100 내지 1000, 또는 100 내지 10000배로 감소시킨다.
일부 실시형태에서, AAV 생산에 필요한 유전자는 조기 정지 코돈(들)을 포함하도록 돌연변이된다. 일부 실시형태에서, 활성 제어 구성성분은 조기 정지 코돈(들)을 포함하는 유전자의 발현을 유도하는 데 필요한 유전자 산물을 일괄적으로 암호화하는 하나 이상의 폴리핵산을 포함한다. 본 명세서에 기재된 예시적인 활성 제어 구성성분은 비표준 tRNA 합성효소/tRNA 시스템 및 염기 편집기 시스템을 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 AAV 생산에 필요한 유전자에서 하나 이상의 돌연변이를 수정할 수 있는 염기 편집기(예를 들어, ABE 또는 CBE)를 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 AAV 생산에 필요한 유전자에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 20개의 돌연변이를 수정할 수 있는 염기 편집기(예를 들어, ABE 또는 CBE)를 포함한다. 일부 실시형태에서, 활성 제어 구성성분이 표준 코돈을 암호화하도록 조기 정지 코돈(들)을 편집할 수 있는 염기 편집기(예를 들어, ABE)를 포함한다. 일부 실시형태에서, 활성 제어 구성성분이 본래의 야생형 표준 코돈을 암호화하도록 조기 정지 코돈(들)을 편집할 수 있는 염기 편집기 시스템을 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 조기 정지 코돈에 상보성인 비표준 tRNA 안티코돈을 포함하는 비표준 tRNA 합성효소/tRNA 시스템을 포함한다. 일부 실시형태에서, 비표준 아미노산이 존재할 때, 비표준 아미노산이 번역 동안 AAV 생산에 필요한 단백질에 혼입되도록, 비표준 tRNA 합성효소/tRNA 시스템은 비표준 아미노산을 담는다. 일부 실시형태에서, 비표준 tRNA 합성효소/tRNA 시스템은 화학적으로 유도성이다.
일부 실시형태에서, 활성 제어 구성성분은 단일 폴리핵산 상에서 암호화된다. 일부 실시형태에서, 다중 폴리핵산은 일괄적으로 활성 제어 구성성분을 포함한다. 예를 들어, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 또는 적어도 5개의 폴리핵산을 포함할 수 있다. 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 폴리핵산을 포함한다.
본 명세서에 사용되는 바와 같은 용어 "프로모터"는 DNA로부터 RNA의 전사를 개시하기 위해 단백질에 의해 결합될 수 있는 핵산 서열을 지칭한다. 프로모터는 구성적 프로모터(즉, 계속적 전사를 가능하게 하는 비조절 프로모터)일 수 있다. 구성적 프로모터의 예는 당업계에 공지되어 있으며, 거대세포 바이러스(CMV) 프로모터, 연장인자 1α(EF1α) 프로모터, 시미안 공포화 바이러스 40(SV40) 프로모터, 유비퀴틴-C(UBC) 프로모터, U6 프로모터 및 포스포글리세르산 키나제(PGK) 프로모터를 포함하지만, 이들로 제한되지 않는다. 예를 들어, 문헌[Ferreira et al., Tuning gene expression with synthetic upstream open reading frames. Proc. Natl. Acad. Sci. U.S.A. 2013 Jul; 110(28): 11284-89]; 공개번호: 미국 특허 제2014/377861 A1호를 참조하며 - 이들의 전문은 본 명세서에 참조에 의해 원용된다. 대안적으로, 프로모터는 유도성 프로모터일 수 있다(즉, 특정 상황 하에서 전사를 단지 활성화시킨다). 유도성 프로모터는 화학적 유도성 프로모터, 온도 유도성 프로모터, 또는 광 유도성 프로모터일 수 있다. 유도성 프로모터의 예는 당업계에 알려져 있으며, 테트라사이클린/독시사이클린 유도성 프로모터, 큐메이트 유도성 프로모터, ABA 유도성 프로모터, CRY2-CIB1 유도성 프로모터, DAPG 유도성 프로모터, 및 미페프리스톤 유도성 프로모터를 포함하지만, 이들로 제한되지 않는다. 예를 들어, 문헌[Stanton et al., ACS Synth. Biol. 2014 Dec 19; 3(12): 880-91; Liang et al., Sci. Signal. 2011 Mar 15; 4(164): rs2]; 특허 번호: US 7,745,592 B2; 특허 번호: US 7,935,788 B2를 참조하며 - 이들의 전문은 본 명세서에 참조에 의해 원용된다.
일부 실시형태에서, 본 명세서에 기재된 AAV 생산 시스템은 조작된 세포를 추가로 포함한다. 조작된 세포는 본 명세서에 기재된 AAV 생산 시스템의 임의의 부분(및 부분의 임의의 조합)을 포함할 수 있다.
예를 들어, 조작된 세포는 AAV 생산 구성성분의 적어도 일부를 포함할 수 있다. 예를 들어, 위에 기재한 바와 같이, AAV 생산 구성성분은 다중 폴리핵산을 포함할 수 있다. 이러한 실시형태에서, 조작된 세포는 상기 다중 폴리핵산 중 하나 이상을 포함하고 - 이들 각각은 염색체 외에 위치되거나 또는 조작된 세포의 게놈 내로 안정적으로 통합될 수 있다. 일부 실시형태에서, 조작된 세포는 전체 AAV 생산 구성성분을 포함한다.
대안적으로, 또는 추가로, 조작된 세포는 AAV 생산 시스템의 활성 제어 구성성분을 포함할 수 있다.
일부 실시형태에서, AAV 생산 시스템은 (a) AAV 생산에 필요한 유전자를 일괄적으로 암호화하는 하나 이상의 이종성 폴리핵산을 포함하는 AAV 생산 구성성분을 포함하는 조작된 세포로서, 적어도 하나의 유전자는 돌연변이를 포함하는, 상기 조작된 세포; (b) 생산을 유도할 수 있고/있거나 돌연변이를 포함하는 적어도 하나의 유전자의 돌연변이를 수정할 수 있는 활성 제어 구성성분을 포함한다. 일부 실시형태에서, 돌연변이는 조기 정지 코돈을 생성한다.
A.
랜딩 패드
본 명세서에 기재된 조작된 세포는 랜딩 패드를 더 포함할 수 있다. 본 명세서에 사용되는 바와 같은 용어 "랜딩 패드"는 세포 게놈의 특정 좌위(또는 다중 좌위)에 "페이로드" 서열의 표적화된 삽입을 용이하게 하는 이종성 폴리핵산 서열을 지칭한다. 따라서, 랜딩 패드는 세포 게놈에 통합된다. 고정된 통합 부위는 위치상의 후성적 효과 또는 근위 조절 구성요소에 의해 야기될 수 있는 실험 간의 가변성을 감소시키는 것이 바람직할 수 있다. 페이로드 복제수를 제어하는 능력은 또한 임의의 유전자 구성성분을 변화시키는 일 없이 페이로드의 발현 수준을 조절하는 것이 바람직할 수 있다.
일부 실시형태에서, 랜딩 패드는 조작된 세포의 게놈에서 안전 항만 부위(safe harbor site)에 위치된다. 본 명세서에 사용되는 바와 같은 용어 "안전 항만 부위"는 유전자 또는 유전자 구성요소가 인접한 유전자 및/또는 인접한 게놈 구성요소의 조절 또는 조절을 붕괴시키는 일 없이 도입될 수 있고 도입된 유전자 또는 유전자 구성요소의 발현 또는 조절을 붕괴시키지 않는 게놈 내 위치를 지칭한다. 안전 항만 부위의 예는 당업자에게 알려져 있으며, AAVS1, ROSA26, COSMIC, H11, CCR5 및 LiPS-A3S을 포함하지만, 이들로 제한되지 않는다. 예를 들어, 문헌[Gaidukov et al., Nucleic Acids Res. 2018 May 4; 46(8): 4072-4086]; 특허 번호: US 8,980,579 B2; 특허 번호: US 10,017,786 B2; 특허 번호: US 9,932,607 B2; 공개 번호: US 2013/280222 A; 공개 번호: WO 2017/180669 A1을 참조하며, 이들의 전문은 본 명세서에 원용된다. 일부 실시형태에서, 안전 항만 부위는 알려진 부위이다. 다른 실시형태에서, 안전 항만 부위는 이전에 개시되지 않은 부위이다. 본 명세서의 "고발현 게놈 좌위의 확인 방법 및 이의 용도"를 참조한다. 일부 실시형태에서, 본 명세서에 기재된 조작된 세포는 AAVS1, ROSA26, COSMIC, H11, CCR5 및 LiPS-A3S으로 이루어진 군으로부터 선택된 안전 항만 좌위에서 통합된 랜딩 패드를 포함한다.
일부 실시형태에서, 조작된 세포는 HEK293 세포로부터 유래된다. 일부 실시형태에서, 조작된 HEK293 세포는 AAVS1, ROSA26, CCR5 및 LiPS-A3S로 이루어진 군으로부터 선택된 안전 항만 좌위에서 통합된 랜딩 패드를 포함한다.
일부 실시형태에서, 조작된 세포는 CHO 세포로부터 유래된다. 일부 실시형태에서, 조작된 CHO 세포는 ROSA26, COSMIC 및 H11로 이루어진 군으로부터 선택된 안전 항만 좌위에서 통합된 랜딩 패드를 포함한다.
본 명세서에 기재된 각각의 랜딩 패드는 적어도 하나의 재조합 부위를 포함한다. 다양한 인테그라제에 대한 재조합 부위는 이전에 확인되었다. 예를 들어, 랜딩 패드는 Bxb1 인테그라제, 람다-인테그라제, Cre 재조합효소, Flp 재조합효소, 감마-델타 레솔베이즈, Tn3 레솔베이즈, φC31 인테그라제 또는 R4 인테그라제에 상응하는 재조합 부위를 포함할 수 있다. 예시적인 재조합 부위 서열은 당업계에 공지되어 있다(예를 들어, attP, attB, attR, attL, Lox 및 Frt).
본 명세서에 기재된 랜딩 패드는 하나 이상의 발현 카세트를 포함할 수 있다.
일부 실시형태에서, 페이로드 서열은 (본 명세서에 기재된 바와 같이) 제1 역위 말단 반복부(ITR), 제2 ITR 및 프로모터에 작동 가능하게 연결된 유전자를 암호화하는 핵산 분자를 포함한다. 일부 실시형태에서, 페이로드는 5' - ITR-프로모터-유전자-ITR - 3'을 암호화하는 핵산 분자를 포함하며, 유전자는 AAV 전달을 위한 유전자이다. 일부 실시형태에서, 유전자는 형광 단백질이다. 일부 실시형태에서, 유전자는 녹색 형광 단백질이다. 일부 실시형태에서, 페이로드 서열은 다중 클로닝 부위를 포함한다.
B.
전사 활성체
일부 실시형태에서, AAV 생산 시스템은 전사 활성체를 암호화하는 핵산 서열을 추가로 포함한다. 일부 실시형태에서, 전사 활성체는 TetOn-3G, rtTA-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16, 및 큐메이트 cTA 및 rcTA로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 전사 활성체는 전문이 참조에 의해 원용된 문헌[Das et al. Curr. Gene Therapy 2016; 16(3):156-67]에 기재된 바와 같은 rtTA-V1, rtTA-V2, rtTA-V3, rtTA-V4, rtTA-V5, rtTA-V7, rtTA-V8, rtTA-V9, rtTA-V10, rtTA-V11, rtTA-V12, rtTA-V13, rtTA-V14, rtTA-V15, rtTA-V16, rtTA-V17 및 rtTA-V18로 이루어진 군으로부터 선택된 rtTA/TetOn 변이체이다. 일부 실시형태에서, 전사 활성체를 암호화하는 핵산 서열은 선택 마커에 융합된다. 일부 실시형태에서, 전사 활성체는 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 전사 활성화는 구성적으로 활성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 전사 활성체는 이의 상응하는 화학적 유도성 프로모터에 작동 가능하게 연결된다. 비제한적 예에서, TetOn-3G 전사 활성체는 TRE 프로모터에 작동 가능하게 연결될 수 있다. 일부 실시형태에서, 전사 활성화는 hEF1a 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 전사 활성체는, 소분자 유도물질에 노출될 때, 조작된 세포 내의 상응하는 화학적 유도성 프로모터의 발현을 유도한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된다.
II.
mRNA 번역 동안 조기 정지 코돈(들) 대신에 아미노산(들)을 도입하기 위한 AAV 생산 시스템
mRNA 번역 동안 조기 정지 코돈(들) 대신 아미노산(들)을 도입하기 위한 시스템은 비표준 tRNA 합성효소, 비표준 tRNA 또는 이들의 조합을 포함할 수 있다. 일부 실시형태에서, 조기 정지 코돈(들) 대신에 아미노산(들)을 도입하기 위한 시스템은 비표준 아미노산을 더 포함한다.
본 명세서에 사용되는 바와 같은 용어 "비표준 tRNA 합성효소"는 조작된 세포가 유래된 세포에 자연적으로 존재하지 않는 tRNA 합성효소를 지칭한다. tRNA 합성효소는 번역 동안 동족 tRNA에 대한 아미노산의 공유 부착을 촉매하는 효소이다.
본 명세서에 사용되는 바와 같은 용어 "비표준 tRNA"는 조작된 세포가 유래된 세포의 자연 발생적 tRNA에 의해 사용되지 않는 안티코돈을 갖는 tRNA를 지칭한다. 일부 실시형태에서, 비표준 tRNA는 조작된 세포의 조기 정지 코돈(TAG, TAA 또는 TGA)과 상응하는 안티-코돈을 포함한다. 일부 실시형태에서, 비표준 tRNA는 상응하는 비표준 tRNA 합성효소에 의해 담아지고; 특정 tRNA 합성효소에 관해, 비표준 tRNA는 접합체 tRNA로 지칭될 수 있다.
일부 실시형태에서, 활성 제어 구성성분은 비표준 tRNA 합성효소 및 이의 접합체 비표준 tRNA를 포함한다. 일부 실시형태에서, 비표준 tRNA 합성효소 및 이의 접합체 비표준 tRNA는 본 명세서에 전문이 참조에 의해 원용된 문헌[Mukai, Takahito, et al. Annual review of microbiology 71 (2017): 557-577]에 기재된 바와 같이 이콜라이(E. coli) GlnRS-tRNAGln, 이콜라이 TyrRS 및 Bst tRNATyr, 이콜라이 TyrRS-tRNATyr, 바실러스 서브틸리스(B. subtilis) TrpRS-tRNATrp, 이콜라이 TrpRS-tRNATrp, 이콜라이 LeuRS-tRNALeu, 메타노사르시나 바커리(M. bareri) PylRS(b)-tRNAPyl, 메타노사르시나 바커리 PylRS 및 데설피토박테리움 하프니엔스(D. hafniense) tRNAPyl, 이콜라이 TyrRS 및 게오바실러스 스테아로써모필러스(G. stearothermophilus) tRNATyr로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 비표준 tRNA 합성효소 및 이의 접합체 비표준 tRNA는 메타노사르시나 마제이(M. mazei) 피롤리실-tRNA 합성효소(PylRS)-tRNAPyl이며, 이는 mRNA 번역 동안에 l-라이신 유도체인 비표준 아미노산 H-Lys(Boc)-OH를 혼입한다.
A.
예시적인 비표준 tRNA 합성효소
일부 실시형태에서, mRNA 번역 동안 조기 정지 코돈 대신에 아미노산을 도입하기 위한 시스템은 프로모터(본 명세서에 기재된 바와 같은 구성적 또는 유도성)에 작동 가능하게 연결된 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 포함하는 이종성 폴리뉴클레오타이드를 포함한다. 예시적인 비표준 tRNA 합성효소는 당업계에 공지되어 있으며, 이콜라이 GlnRS, 이콜라이 TyrRS, 바실러스 서브틸리스 TrpRS, 이콜라이 TrpRS, 이콜라이 LeuRS, 메타노사르시나 바커리 PylRS, 이콜라이 TyrRS 및 메타노사르시나 마제이 PylRS를 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 활성 제어 구성성분은 이콜라이 GlnRS, 이콜라이 TyrRS, 바실러스 서브틸리스 TrpRS, 이콜라이 TrpRS, 이콜라이 LeuRS, 메타노사르시나 바커리 PylRS, 이콜라이 TyrRS 및 메타노사르시나 마제이 PylRS로 이루어진 군으로부터 선택된 tRNA 합성효소를 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 활성 제어 구성성분의 비표준 tRNA 합성효소는 서열번호 20("메타노사르시나 마제이 PylRS")과 적어도 80% 동일성(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99% 동일성)을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 20의 아미노산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA는 서열번호 20의 아미노산 서열로 이루어진다.
일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 21("MmPylRS (Y384F)")과 적어도 80% 동일성(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99% 동일성)을 갖는 아미노산 서열을 포함하되, 384번 위치에서 아미노산은 F이다. 일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 21의 아미노산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA 합성효소는 서열번호 21의 아미노산 서열로 이루어진다.
일부 실시형태에서, mRNA 번역 동안 조기 정지 코돈 대신 비표준 아미노산을 도입하기 위한 시스템은 적어도 2개의 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 이종성 폴리뉴클레오타이드를 포함하며(위에 기재한 바와 같음), 이들 각각은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된다. 예를 들어, 일부 실시형태에서, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
본 명세서에 기재된 바와 같은 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함할 수 있다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
B.
예시적인 비표준 tRNA
일부 실시형태에서, 활성 제어 구성성분은 프로모터(본 명세서에 기재된 바와 같은 구성적 또는 유도성)에 작동 가능하게 연결된 비표준 tRNA를 암호화하는 핵산 서열을 포함하는 이종성 폴리뉴클레오타이드를 포함한다. 예시적인 비표준 tRNA는 당업계에 공지되어 있으며, 이콜라이 tRNAGln, 이콜라이 tRNATyr, 바실러스 서브틸리스 tRNATrp, 이콜라이 tRNATrp, 이콜라이 tRNALeu, 메타노사르시나 바커리 tRNAPyl, 데설피토박테리움 하프니엔스 tRNAPyl, 게오바실러스 스테아로써모필러스 tRNATyr, 및 메타노사르시나 마제이 tRNAPyl을 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 활성 제어 구성성분은 이콜라이 tRNAGln, 이콜라이 tRNATyr, 바실러스 서브틸리스 tRNATrp, 이콜라이 tRNATrp, 이콜라이 tRNALeu, 메타노사르시나 바커리 tRNAPyl, 데설피토박테리움 하프니엔스 tRNAPyl, 게오바실러스 스테아로써모필러스 tRNATyr, 및 메타노사르시나 마제이 tRNAPyl로 이루어진 군으로부터 선택된 tRNA를 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 활성 제어 구성성분의 비표준 tRNA는 서열번호 22("PylT(U25C)")와 적어도 80% 동일성(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99% 동일성)을 갖는 핵산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA는 서열번호 22의 핵산 서열을 포함한다. 일부 실시형태에서, 비표준 tRNA는 서열번호 22의 핵산 서열로 이루어진다.
일부 실시형태에서, mRNA 번역 동안 조기 정지 코돈 대신 비표준 아미노산을 도입하기 위한 시스템은 적어도 2개의 비표준 tRNA를 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 이종성 폴리뉴클레오타이드를 포함하며(위에 기재한 바와 같음), 이들 각각은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된다. 예를 들어, 일부 실시형태에서, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 tRNA를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 tRNA를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 tRNA를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
본 명세서에 기재된 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함할 수 있다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음). 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별도의 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다(위에 기재한 바와 같음).
일부 실시형태에서, 활성 제어 구성성분은, 5'에서 3'으로: (i) 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열; (ii) 비표준 tRNA(본 명세서에 기재된 바와 같음)를 암호화하는 핵산 서열; 및 (iii) 종결자 서열을 포함하는, 비표준 tRNA 발현 카세트를 포함한다. 일부 실시형태에서, 비표준 tRNA 발현 카세트는 서열번호 23의 핵산 서열 또는 서열번호 23의 핵산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 갖는 핵산 서열을 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 다중 비표준 tRNA 발현 카세트를 포함한다. 예를 들어, 일부 실시형태에서, 활성 제어 구성성분은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 비표준 tRNA 발현 카세트를 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 비표준 tRNA 발현 카세트를 포함한다. 일부 실시형태에서, 활성 제어 구성성분은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 비표준 tRNA 발현 카세트를 포함한다.
C.
조기 정지 코돈을 갖는 AAV 유전자 산물
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 조기 정지 코돈과 비표준 tRNA에 상응하는(즉, 파트 IA에 기재된 바와 같은) 아미노산 코돈 둘 다인 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 핵산 서열 내의 대체를 용인하는 아미노산에 대한 코돈은 조기 정지 코돈과 비표준 tRNA에 상응하는 아미노산 코돈 둘 다인 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 핵산 서열 내의 라이신 코돈은 조기 정지 코돈과 비표준 tRNA에 상응하는 아미노산 코돈 둘 다인 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 대체를 용인하는 아미노산에 대한 코돈에 상응하는 위치(들)에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 조기 정지 코돈(들)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 라이신 코돈(들)에 상응하는 위치(들)에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 조기 정지 코돈(들)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 대체를 용인하는 아미노산에 대한 코돈에 상응하는 위치(들)에서 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 조기 정지 코돈(들)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 라이신 코돈(들)에 상응하는 위치(들)에서 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 조기 정지 코돈(들)을 포함할 수 있다.
본 명세서에서 사용되는 바와 같은 수식어 "NC"는 조기 정지 코돈과 비표준 tRNA에 상응하는 코돈 둘 다인 코돈(들)을 포함하는 유전자를 지칭한다. 일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 NC-Rep52을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep40을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78을 암호화하는 핵산 서열; 프로모터(구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep68을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78+52를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E2A를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E4 ORF6을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP1을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP2를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP3을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP를 암호화하는 핵산 서열; 또는 이들의 임의의 조합을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep40을 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep40"은 서열번호 7의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep40 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep40은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep40은 아미노산 치환의 용인으로서 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 본 명세서에 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E226 및 D233에 상응하는 위치). 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep40을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep68을 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep68"은 서열번호 9의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep68 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep68은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep68은 아미노산 치환이 용인되는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E17, D24, E32, K33, E34, D40, D44, E49, E57, K58, R68, E75, E86, E96, E114, R119, R122, E125, D149, E173, E184, K186, R187, H192, H295, E201, K204, E205, D212, E226 및 D233에 상응하는 위치). 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep68을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78을 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep78"은 서열번호 8의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep78 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep78은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78은 아미노산 치환이 용인되는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E17, D24, E32, K33, E34, D40, D44, E49, E57, K58, R68, E75, E86, E96, E114, R119, R122, E125, D149, E173, E184, K186, R187, H192, H295, E201, K204, E205, D212, E226 및 D233에 상응하는 위치). 일부 실시형태에서, NC-Rep78 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep78은 서열번호 33, 35, 37 및 113 내지 115 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 33, 35, 37 및 113 내지 115 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 33, 35, 37 및 113 내지 115 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78 핵산 서열은 내부 리보솜 유입 부위(internal ribosomal entry site: IRES)를 더 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep68 및 NC-Rep78(NC-Rep78/68)을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep78/68은 서열번호 113 내지 115 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68은 서열번호 113 내지 115 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68은 서열번호 113 내지 115 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78/68 핵산 서열은 내부 리보솜 유입 부위(IRES)를 더 포함한다.
본 명세서에 사용되는 바와 같은 용어 "내부 리보솜 유입 부위(IRES)"는 캡-독립적 방식으로 단백질 번역을 가능하게 하는 리보솜 결합 부위를 암호화하는 핵산 서열을 지칭한다. 예시적인 IRES은 IRES(서열번호 4) 및 약화된 IRES(서열번호 5)를 포함한다. 추가적인 IRES는 당업자에게 용이하게 알려질 것이다.
일부 실시형태에서, NC-Rep78은 서열번호 34, 36 및 38 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 아미노산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 34, 36 및 38 중 어느 하나를 포함하는 아미노산 서열을 포함한다. 일부 실시형태에서, NC-Rep78은 서열번호 34, 36 및 38 중 어느 하나로 이루어진 아미노산 서열을 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep78을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep52를 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep52"은 서열번호 6의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep52 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep52 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep52 핵산 서열은 아미노산 치환의 용인으로서 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다(예를 들어, 본 명세서에 전문이 참조에 의해 원용되는 문헌[Urabe M et al. J Virol. 1999 Apr;73(4):2682-93]에 기재된 바와 같은 서열번호 97의 E226 및 D233에 상응하는 위치). 일부 실시형태에서, NC-Rep52 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep52 핵산 서열은 내부 리보솜 유입 부위(IRES)를 더 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep52를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep78 및 NC-Rep52를 암호화하는 핵산 서열을 포함한다. 용어 "NC-Rep78+52"은 서열번호 25에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 Rep78 및 Rep 52 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈에 추가로 Rep68/40 스플라이스 부위를 없애는 점 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 26 내지 27 중 어느 하나에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 26 내지 27 중 어느 하나를 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 서열번호 26 내지 27 중 어느 하나로 이루어진다. 일부 실시형태에서, NC-Rep78+52 핵산 서열은 IRES를 더 포함한다. 일부 실시형태에서, NC-Rep78+52 핵산 서열에서 IRES는 NC-Rep78 또는 NC-Rep52의 번역을 개시한다. 일부 실시형태에서, IRES를 추가로 포함하는 NC-Rep78+52 핵산 서열은 서열번호 31 내지 32 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일하다. 일부 실시형태에서, NC-Rep78+52는 서열번호 31 내지 32 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78+52는 서열번호 31 내지 32 중 어느 하나의 핵산 서열로 이루어진다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep78+52를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-Rep를 암호화하는 핵산 서열을 포함한다. Rep 유전자는 Rep52, Rep40, Rep78 및 Rep68을 포함한다. 용어 "NC-Rep"는 서열번호 24에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-Rep 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-Rep 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-Rep 핵산 서열은 서열번호 97의 D233 및/또는 E17에 상응하는 위치에서 TAG 조기 정지 코돈을 포함하도록 변형된다. 일부 실시형태에서, NC-Rep는 서열번호 28 내지 29 및 113 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep는 서열번호 28 내지 29 및 113 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep는 서열번호 28 내지 29 및 113 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-Rep를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E2A를 암호화하는 핵산 서열을 포함한다. 용어 "NC-E2A"는 서열번호 10의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 E2A 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-E2A 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-E2A 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-E2A를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-E4ORF6를 암호화하는 핵산 서열을 포함한다. 용어 "NC-E4ORF6"은 서열번호 11의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-E4ORF6 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-E4ORF6은 제거된 스플라이스 부위를 갖는다. 일부 실시형태에서, NC-E4 ORF6 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-E4 ORF6 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-E4ORF6을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP1을 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP1"은 서열번호 14의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP1 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP1 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP1 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP1을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP2를 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP2"은 서열번호 15의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP2 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP2 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP2 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP2를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP3을 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP3"은 서열번호 16의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP3 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP3 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP3 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP3을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 NC-VP를 암호화하는 핵산 서열을 포함한다. 용어 "NC-VP"는 서열번호 14의 아미노산 서열에 대해 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭하되, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)과 비표준 tRNA에 상응하는 코돈(본 명세서에 기재된 바와 같음) 둘 다이고, 폴리펩타이드에 상응하는 mRNA의 번역 동안 비표준 아미노산(들)의 혼입은 기능적 NC-VP 폴리펩타이드의 생산을 초래한다. 일부 실시형태에서, NC-VP 핵산 서열은 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, NC-VP 핵산 서열은 아미노산 치환을 용인하는 것으로 확인된 부위에서 하나 이상의 TAG 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 위에 기재한 바와 같은 NC-VP를 포함한다.
III.
조기 정지 코돈에서 아미노산 혼입 시스템을 포함하는 조작된 세포의 예시적인 실시형태
일부 양상에서, AAV 생산 시스템은 AAV 생산을 위한 조작된 세포를 더 포함한다. 일부 실시형태에서, 조작된 세포는 (a) 위에 기재한 바와 같은 AAV 생산 구성성분 및 (b) 위에 기재한 바와 같은 비표준 tRNA 합성효소(synthase) 및 접합체 비표준 tRNA를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다. 일부 실시형태에서, AAV 생산 구성성분 및 활성 제어 구성성분은 조작된 세포의 게놈에 안정적으로 통합된다.
본 명세서에 사용되는 바와 같은 용어 "안정적으로 통합된"은 유기체의 게놈에 삽입된 이종성 핵산 서열, 핵산 분자, 작제물, 유전자 또는 폴리뉴클레오타이드(예를 들어, 본 명세서에 기재된 바와 같은 조작된 세포)를 지칭하고, 세포분열 후 장래의 세대로 통과된다. 명세서에 기재된 임의의 핵산 서열, 핵산 분자, 작제물, 유전자 또는 폴리뉴클레오타이드가 안정적으로 통합될 수 있다는 것이 이해된다. 핵산 서열, 핵산 분자, 작제물 유전자 또는 폴리뉴클레오타이드는 무작위 통합, 표적화된 통합 또는 트랜스포존-매개 통합을 이용해서 게놈에 통합될 수 있다.
일부 실시형태에서, AAV 생산 시스템의 각각의 폴리핵산은 선택 마커를 포함한다. 일부 실시형태에서, AAV 생산 시스템의 각각의 폴리핵산은 별도의 선택 마커의 핵산 서열을 포함한다.
본 명세서에 사용되는 바와 같은 용어 "선택 마커"는 -세포에 도입되거나 발현될 때 - 선택에 적합한 형질을 부여하는 단백질을 지칭한다. 본 명세서에 사용되는 바와 같은 용어 "선택 카세트"는 프로모터(본 명세서에 기재된 바와 같음) 및 종결자에 작동 가능하게 연결된 선택 마커를 암호화하는 핵산 서열을 지칭한다.
선택 마커는 형광 단백질일 수 있다. 형광 단백질의 예는 당업계에 알려져 있다(예를 들어, TagBFP, EBFP2, EGFP, EYFP, mKO2 또는 Sirius). 예를 들어, 특허 번호: US 5,874,304; 특허 번호: EP 0969284 A1; 공개 번호: US 2010/167394 A - 이들의 전문은 본 명세서에 참조에 의해 원용된다.
대안적으로, 또한 추가로, 선택 마커는 항생제 내성 단백질일 수 있다. 항생제 내성 단백질의 예는 당업계에 알려져 있다(예를 들어, 퓨로마이신, 하이그로마이신, 네오마이신, 제오신, 블라스티시딘 또는 플레오마이신 선택을 용이하게 함). 예를 들어, 공개 번호: WO 1997/15668 A2; 공개 번호: WO 1997/43900 A1 - 이의 전문은 본 명세서에 참조에 의해 원용됨.
A.
제1의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 조작된 세포는 하나 이상의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 조작된 세포는 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 비표준 tRNA 합성효소를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, tRNA 합성효소는 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 선택 마커를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 선택 마커는 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, AAV 생산에 대한 조작된 세포는 서열번호 21의 MmPyrLS WT/Y384F tRNA 합성효소를 포함한다. 일부 실시형태에서, MmPyrLS WT/Y384F를 암호화하는 핵산 서열은 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, MmPyrLS WT/Y384F는 hEF1 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자는 도 1에 도시한 바와 동일한 구조를 갖는다.
B.
제2의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자 및 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 본 출원에 기재된 tRNA 중 어느 하나의 하나 이상을 암호화하는 하나 이상의 핵산 서열(예를 들어, 본 출원에 기재된 tRNA 중 어느 하나의 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵산 서열)을 포함한다. 일부 실시형태에서, 위에 기재한 바와 같이, 본 출원에 기재된 tRNA 중 어느 하나의 각각의 하나 이상을 암호화하는 핵산 서열은 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 PylT(U25C) tRNA를 각각 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 각각 U6 프로모터에 작동 가능하게 연결된 PylT(U25C) tRNA를 암호화하는 4개의 핵산 서열을 포함한다. 일부 실시형태에서, PylT(U25C) tRNA를 암호화하는 4개의 핵산 서열은 U6 프로모터에 각각 작동 가능하게 연결된다.
일부에서, 제2의 안정적으로 통합된 핵산 분자는 선택 마커를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 선택 마커는 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자는 도 1에 도시한 바와 동일한 구조를 갖는다.
C.
제3의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자 및 제3의 안정적으로 통합된 핵산 분자를 포함한다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 NC-Rep78+52을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep78+52를 암호화하는 핵산 분자는 또한 D233번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep78+52를 암호화하는 핵산 분자는 또한 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep78+52를 암호화하는 핵산 분자는 또한 D233 및 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 NC-Rep를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, NC-Rep를 암호화하는 핵산 분자는 또한 D233번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, NC-Rep를 암호화하는 핵산 분자는 또한 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다. 일부 실시형태에서, Rep를 암호화하는 핵산 분자는 또한 D233 및 E17번 위치에서 PylT(U25C) tRNA 코돈을 암호화하는 조기 정지 코돈을 포함한다.
일부에서, 제3의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 선택 마커를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 선택 마커는 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자는 돌연변이된 Rep78+52 또는 돌연변이된 Full-Rep를 도시하는 도 1에서 다이어그램 중 어느 하나와 동일한 구조를 갖는다.
D.
제4의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자 및 제4의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 전사 활성체를 암호화하는 핵산 서열을 포함한다.
E.
제5의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제4의 안정적으로 통합된 핵산 분자 및 제5의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제5의 안정적으로 통합된 핵산 분자는 위에 기재한 프로모터에 작동 가능하게 연결된 E2A 또는 NC-E2A 및 E4ORF6 또는 NC-E4ORF6을 암호화하는 핵산 서열을 포함한다.
F.
제6의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 핵산 분자를 포함하는 조작된 세포는 본 명세서에 기재된 바와 같은 제1의 안정적으로 통합된 분자, 본 명세서에 기재된 바와 같은 제2의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제3의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제4의 안정적으로 통합된 핵산 분자, 본 명세서에 기재된 바와 같은 제5의 안정적으로 통합된 핵산 분자 및 제6의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제6의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 프로모터에 작동 가능하게 연결된 VP(CAP) 유전자를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제6의 안정적으로 통합된 핵산 분자는 AAV 페이로드를 포함한다.
IV.
비표준 tRNA를 포함하는 AAV 생산을 위해 조작된 세포를 이용하는 방법.
일부 양상에서, 본 개시내용은 (a) AAV 생산 구성성분 및 (b) 본 명세서에 기재된 비표준 tRNA 합성효소/tRNA를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함하는 AAV 생산 시스템을 이용하여 AAV를 생산하는 방법을 제공한다. 일부 실시형태에서, AAV 생산 방법은 AAV 생산 구성성분 및 본 명세서에 기재된 바와 같은 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산의 임의의 조합을 조작된 세포에 형질감염 또는 안정적으로 통합하는 단계를 포함한다. 일부 실시형태에서, AAV 생산 방법은 위에 기재한 바와 같은 AAV 전달(예를 들어, 치료적 DNA 서열)을 위해 페이로드를 포함하는 핵산 분자를 형질감염시키는 단계를 더 포함한다. 일부 실시형태에서, AAV 생산 방법에서 사용되는 조작된 세포는 본 명세서에 기재된 바와 같은 비표준 tRNA 합성효소/tRNA를 포함하는 AAV 생산을 위한 조작된 세포 중 어느 하나로부터 선택된다. 일부 실시형태에서, 상기 방법은 조작된 세포를 AAV 생산에 최적인 합류까지 성장시키는 단계를 포함한다. 최적의 합류는, 예를 들어, 조작된 세포가 유래된 세포 유형에 따를 수 있다. 당업자는 AAV 생산의 최적 합류를 알거나 결정할 수 있다. 일부 실시형태에서, 상기 방법은 조작된 세포를 비표준 tRNA 상에 담길 수 있는 아미노산과 접촉시키는 단계를 포함한다. 일부 실시형태에서, 아미노산은 H-Lys(Boc)-OH이다. 일부 실시형태에서, 상기 방법은 본 명세서에 기재된 바와 같은 소분자 유도물질을 이용하여 tRNA 합성효소 및/또는 접합체 tRNA의 발현을 유도하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 조작된 세포의 배양물로부터 생산된 AAV를 당업자에게 잘 공지된 방법을 이용하여 채취하는 단계를 포함한다.
V.
염기 편집기를 포함하는 AAV 생산 시스템
일부 양상에서, AAV 생산 시스템은 (a) AAV 생산 구성성분 및 (b) 핵산 서열에서 돌연변이(들)를 수정할 수 있는 염기 편집기를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다. 일부 실시형태에서, 염기 편집기는 조기 정지 코돈을 표준 코돈으로 대체한다.
A.
염기 편집기
본 명세서에 기재된 바와 같은 용어 "염기 편집기"는 단일-뉴클레오타이드 변이체(SNV)를 DNA 또는 RNA에 도입할 수 있는 단백질 또는 융합 단백질을 지칭한다. 예시적인 염기 편집기는 사이토신 염기 편집기(CBE): BE1, BE2, HF2-BE2, BE3, HF-BE3, YE1-BE3, EE-BE3, YEE-BE3, VQR-BE3, EQR-BE3, VRER-BE3, SaKKHBE3, FNLS-BE3, RA-BE3, eA3A-HF1-BE3-2xUGI, eA3A-Hypa-BE3-2xUGI, hA3A-BE3, hA3B-BE3, hA3G-BE3, hAID-BE3, SaCas9-BE3, xCas9-BE3, ScCas9-BE3, SniperCas9-BE3, iSpyMac-BE3, Target-AID, Target-AID-NG, BE-PLUS, BE4, BE4-Gam, BE4-Max, AncBE4-Max, SaCas9BE4-Gam, evoBe4max, evoFERNY-BE4max, 및 Cas12a-BE; 및 아데닌 염기 편집기(ABE): ABE7.8, ABE9, ABE10, ABE.8.17, xCas9-ABE7.10, VQR-ABE, Sa(KKH)-ABE, ABEmax, ABE7.10max, ABE8e, PE1, PE2, PE3, ABE REPAIRv1 및 ABE Repairv2를 포함하지만, 이들로 제한되지 않으며, 이들은 문헌[Porto, Elizabeth M., et al. Nature Reviews Drug Discovery 19.12 (2020): 839-859; Cox, David BT, et al. Science 358.6366 (2017): 1019-1027.; Komor, Alexis C., et al. Science advances 3.8 (2017): eaao4774; 및 Gaudelli, Nicole M., et al. Nature biotechnology 38.7 (2020): 892-900; 및 Kantor A. et al. International Journal of Molecular Sciences 21.17 (2020): 6240]에 더욱 상세하게 기재되어 있으며, 이들 각각은 전문이 참조에 의해 원용된다. 비제한적 검토에서, 염기 편집기는 촉매적으로 비활성인 엑소뉴클레아제 도메인(예를 들어, dCas9 또는 dCas13) 또는 CRISPR Cas 틈내기효소 단백질 도메인(예를 들어, Cas9n) 및 DNA를 변형시킬 수 있는 하나 이상의 도메인(예를 들어, 아데노신 탈아미노효소)을 갖는 CRISPR Cas 단백질을 포함하는 융합 단백질이다. 염기 편집기는 표적 DNA 또는 RNA 서열에 상보성인 핵산 서열을 포함하는 단일 가이드 RNA(sgRNA)에 결합한다. DNA 또는 RNA에 대한 염기 편집기의 표적화는 사용한 Cas 단백질 유형(DNA의 경우 Cas9 및 RNA의 경우 Cas13)에 의해 결정된다. 염기 편집기의 비제한적 예에서, 아데닌 염기 편집기(ABE)는 표적 유전자(예를 들어, 조기 정지 코돈을 포함하는 rep52 유전자)에 상보성인 서열을 포함하는 Cas9n 단백질, 아데노신 탈아미노효소, 및 단일 가이드 RNA를 포함한다. sgRNA는 ABE를 표적 DNA 서열로 보내고, 표적 DNA 서열은 Cas9n에 의해 결합되고, Cas9n은 표적 가닥에 틈을 내고, 아데노신 탈아미노효소는 표적 아데노신 뉴클레오타이드를 탈아미노화하여 이를 이노신으로 전환시키고, 이 동안에 DNA 복제는 구아닌으로서 판독되어 A-T 대 G-C DNA 변형을 초래한다. 염기 편집기를 이용하여 생성될 수 있는 돌연변이를 변경시키는 코돈의 예는 표 1 및 표 2에 예시된다. 일부 실시형태에서, 아연-핑거 뉴클레아제, 전사 활성체-유사 효과기 뉴클레아제(TALEN) 또는 프라임 에디터(Prime Editor)가 염기 편집기 대신에 사용될 수 있다.
일부 실시형태에서, 활성 제어 구성성분은 Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 ABE REPAIRv1(서열번호 84) 및 Cas13 ABE REPAIRv2(서열번호 85)로 이루어진 군으로부터 선택된 염기 편집기의 아미노산 서열을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 염기 편집기는 서열번호 82 내지 85 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드에 의해 암호화되되, 염기 편집기는 RNA 또는 DNA를 여전히 편집할 수 있다. 일부 실시형태에서, 염기 편집기는 서열번호 82 내지 85 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드에 의해 암호화된다. 일부 실시형태에서, 염기 편집기는 서열번호 82 내지 85 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드에 의해 암호화된다.
일부 실시형태에서, 활성 제어 구성성분은 프로모터(본 명세서에 기재된 바와 같음)에 작동 가능하게 연결된 염기 편집기(예를 들어, Cas9 ABE7.10, Cas9 ABE8.17m, Cas13 ABE REPAIRv1 또는 Cas13 ABE REPAIRv2)를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 프로모터는 구성적으로 활성인 프로모터이다. 일부 실시형태에서, 프로모터는 화학적 유도성 프로모터이다. 일부 실시형태에서, 염기 편집기는 pTRE3G(서열번호 1) 또는 pTREtight(서열번호 2)로 이루어진 군으로부터 선택된 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 염기 편집기는 VanR(서열번호 86), TtgR(서열번호 86), PhlF(서열번호 86), 또는 CymR(서열번호 86) 또는 Gal4 UAS(서열번호 86) 작동유전자 서열 중 적어도 하나를 함유하는 화학적 유도성 프로모터에 작동 가능하게 연결된다.
B.
AAV 생산 구성성분: AAV 유전자 산물 활성을 감소시키는 돌연변이를 포함하는 AAV 생산에 필요한 유전자
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 위에 기재한 바와 같은 유전자 산물의 기능을 감소시키는 하나 이상의 돌연변이(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)를 포함하도록 변형된다. 일부 실시형태에서, AAV 생산에 필요한 유전자 산물(들)을 암호화하는 폴리핵산은 유전자 산물의 기능을 감소시키는 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개의 돌연변이를 포함할 수 있다.
일부 실시형태에서, 하나 이상의 돌연변이는 표 1 및 표 2의 코돈 돌연변이로부터 선택된다. 일부 실시형태에서, 하나 이상의 돌연변이는, 야생형 암호화된 아미노산과 비교할 때 상이한 분류의 아미노산의 암호화를 야기하는 코돈 돌연변이를 포함한다. 일부 실시형태에서, 상이한 분류의 아미노산은 양으로 하전(아르기닌, 히스티딘 및 라이신); 음으로 하전(아스파르트산 및 글루탐산); 극성(세린, 트레오닌, 시스테인, 타이로신, 아스파라긴 및 글루타민); 비극성(글리신, 알라닌, 발린, 류신, 아이소류신, 메티오닌, 트립토판, 페닐알라닌 또는 프롤린)이 있다. 일부 실시형태에서, 양으로 하전된 아미노산(들)에 대한 하나 이상의 아미노산 코돈은 음으로 하전, 비극성 또는 극성 아미노산에 대한 코돈으로 대체된다. 일부 실시형태에서, 음으로 하전된 아미노산에 대한 하나 이상의 아미노산 코돈(들)은 양으로 하전, 비극성 또는 극성 아미노산으로 대체된다. 일부 실시형태에서, 극성 아미노산에 대한 하나 이상의 아미노산 코돈(들)은 음으로 하전, 양으로 하전 또는 극성 아미노산에 대한 코돈으로 대체된다. 일부 실시형태에서, 비극성 아미노산에 대한 하나 이상의 아미노산 코돈(들)은 음으로 하전, 비극성 또는 양으로 하전된 아미노산에 대한 코돈으로 대체된다.
일부 실시형태에서, AAV 생산 구성성분은 AAV 생산에 필요한 유전자 산물(들)을 암호화하는 핵산 서열을 포함하는 이종성 폴리핵산을 포함하되, 유전자 산물(들)은 조기 정지 코돈(들)을 포함하도록 변형된다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 트립토판 코돈, 글루타민 코돈 또는 아르기닌 코돈에 상응하는 위치에서 조기 정지 코돈을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 폴리핵산은 트립토판 코돈, 글루타민 코돈 또는 아르기닌 코돈에 상응하는 위치에서 하나 이상의 조기 정지 코돈(들)(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10)을 포함할 수 있다. 일부 실시형태에서, 유전자 산물(들)을 암호화하는 트립토판 코돈, 글루타민 코돈 또는 아르기닌 코돈에 상응하는 위치(들)에서 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 또는 6 내지 10개 조기 정지 코돈(들)을 포함할 수 있다.
본 명세서에 사용되는 바와 같은 수식어 "DA"는 유전자 산물의 활성을 감소시키는 하나 이상의 돌연변이를 포함하는 유전자(예를 들어, 조기 정지 코돈(들))를 지칭한다. 일부 실시형태에서, 하나 이상의 정지 코돈 돌연변이는 센스 DNA 가닥 상의 하나 이상의 트립토판 및/또는 아르기닌 코돈(들), 또는 하나 이상의 글루타민, 아르기닌, 및/또는 안티센스 DNA 가닥 상의 프롤린 코돈(들)을 조기 정지 코돈으로 돌연변이시킴으로써 삽입된다. 일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep52를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep40을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep78을 암호화하는 핵산 서열; 프로모터(구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep68을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep78+52을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-Rep을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-E2A를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-E4ORF6을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP1을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP2를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP3을 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-VP를 암호화하는 핵산 서열; 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된 DA-L4 100K를 암호화하는 핵산 서열; 또는 이들의 임의의 조합을 포함한다.
일부 실시형태에서, DA-E2A, DA-E4ORF6, DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-Rep, DA-VP1, DA-VP2, DA-VP3, DA-VP 및 DA-L4 100K를 암호화하는 핵산 서열은 PAM 서열을 도입하기 위해 하나 이상의 돌연변이를 추가로 포함한다. 일부 실시형태에서, DA-E2A, DA-E4ORF6, DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-Rep, DA-VP1, DA-VP2, DA-VP3, DA-VP 및 DA-L4 100K를 암호화하는 핵산 서열은 PAM 서열을 도입하기 위해 하나 이상의 침묵 돌연변이를 추가로 포함한다. 일부 실시형태에서, PAM 서열은 돌연변이(들) 근처에 도입되어 DNA 염기 편집기(예를 들어, ABE 또는 CBE를 함유하는 Cas9)에 대한 PAM 서열을 도입한다. 일부 실시형태에서, PAM 서열은 표적 편집 부위 상류에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 뉴클레오타이드가 도입된다. 일부 실시형태에서, PAM 서열은 표적화 편집 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20개 이내에 도입된다. 일부 실시형태에서, PAM 서열은 표적 편집 부위의 10 내지 17 또는 13 내지 16개의 뉴클레오타이드 이내에 도입된다. 일부 실시형태에서, 하나 이상의 침묵 돌연변이는 염기 편집기 창 이내의 비표적(off-target) 염기 편집을 감소시키도록 이루어진다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep52를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 아미노산 서열을 암호화하는 DA-Rep52 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep52"는 Rep52(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 6의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 M225에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 M225에 상응하는 아미노산 위치에 메티오닌의 글리신으로의 돌연변이를 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52를 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep52를 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep52는 Rep52 활성을 감소시키는 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410, 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 6을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 43 또는 47 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 43 또는 47 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep52는 서열번호 43 또는 47 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep40을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep40"은 Rep40(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 7의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 M225에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 M225에 상응하는 아미노산 위치에 메티오닌의 글리신으로의 돌연변이를 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep40을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep40은 Rep40 활성을 감소시키는 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410, 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 7을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 44 또는 48 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 44 또는 48 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep40은 서열번호 44 또는 48 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep78을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78 핵산 서열 암호화는 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep78"은 Rep78(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 8의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep78을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep78을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep78은 Rep78 활성을 감소시키는 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 133 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep78은 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 8의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 8의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 45 또는 49 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 45 또는 49의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep78은 서열번호 45 또는 49의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep68을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep68"은 Rep68(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 9의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep68을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep68을 암호화하는 핵산 서열은 서열번호 97의 아미노산 R529 위치에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep68은 Rep68 활성을 감소시키는 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 33 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep68은 서열번호 97의 Q262 또는 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 9의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 97의 Q262 및 W319에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 9의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 46 또는 50 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 46 또는 50 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep68은 서열번호 46 또는 50의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-Rep를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-Rep"은 Rep(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 24의 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-Rep를 암호화하는 핵산 서열은 Rep의 아미노산 위치 R529(서열번호 97)에 상응하는 위치에 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep를 암호화하는 핵산 서열은 Rep의 아미노산 위치 R529(서열번호 97)에 상응하는 위치에 AgG -> CgC 돌연변이를 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 97의 M225에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, DA-Rep는 전문이 참조에 의해 원용된 문헌[Kyostio SR et al. J Virol. 1994 May; 68(5): 2947-2957]에 기재된 바와 같이 서열번호 97의 M225에 상응하는 아미노산 위치에서 메티오닌의 글리신으로의 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, DA-Rep는 서열번호 97의 K340에 상응하는 아미노산 위치에 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, DA-Rep는 전문이 참조에 의해 원용된 문헌[Smith RH et al. J Virol. 1997 Jun; 71(6): 4461-4471]에 기재된 바와 같이 서열번호 97의 K340에 상응하는 아미노산 위치에서 라이신의 히스티딘으로의 돌연변이를 포함하도록 변형된다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-Rep는 Rep 활성을 감소시키는 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 133 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이러한 위치 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함한다. 전문이 참조에 의해 원용된 문헌[Yang Q et al. J Virol. 1992 Oct; 66(10): 6058-6069]은 이러한 위치가 삽입 돌연변이에 민감하다는 것을 나타낸다.
일부 실시형태에서, DA-Rep는 서열번호 97의 Q67, Q262 또는 W319에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 97의 Q67, Q262 및 W319에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 53 내지 55 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 53 내지 55 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-Rep는 서열번호 53 내지 55 중 어느 하나로 이루어진 핵산 서열을 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-E2A를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A 핵산 서열은 E2A 프로모터에 작동 가능하게 연결된다. 용어 "DA-E2A"은 E2A(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 10의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-E2A는 아미노산 위치 W181 또는 W324에 조기 정지 코돈을 포함하도록 변형된 서열번호 10의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 아미노산 위치 W181 및 W324에 조기 정지 코돈을 포함하도록 변형된 서열번호 10의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 39 또는 40 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 39 또는 40 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 39 또는 40 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 105 또는 106 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 105 내지 106 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E2A는 서열번호 105 내지 106 중 어느 하나로 이루어진 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-E4ORF6을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6 핵산 서열은 E4 프로모터에 작동 가능하게 연결된다. 용어 "DA-E4ORF6"은 E4ORF6(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 11의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-E4ORF6은 아미노산 위치 W77 또는 W192에 조기 정지 코돈을 포함하도록 변형된 서열번호 11의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 아미노산 위치 W77 및 W192에 조기 정지 코돈을 포함하도록 변형된 서열번호 11의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 11의 W77 또는 W192에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 서열번호 12의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 11의 W77 및 W192에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 서열번호 12의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 41 또는 42 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 41 내지 42의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 41 내지 42의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 107 또는 108 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 107 내지 108 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, DA-E4ORF6은 서열번호 107 내지 108 중 어느 하나로 이루어진 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-L4 100 K를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 아미노산 서열을 암호화하는 DA-L4 100K 핵산 서열은 p19 프로모터에 작동 가능하게 연결된다. 용어 "DA-L4 100 K"는 L4 100K(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 112의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-L4 100K는 서열번호 97의 W435에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 112를 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-L4 100K는 서열번호 98 중 어느 하나의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-L4 100K는 서열번호 98 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-L4 100K는 서열번호 98 중 어느 하나의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, DA-VARNA는 VARNA 비활성을 제공하는 돌연변이를 더 포함하는 서열번호 13의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VARNA는 VARNA 비활성을 제공하는 돌연변이를 더 포함하는 서열번호 13의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VARNA는 VARNA 비활성을 제공하는 돌연변이를 더 포함하는 서열번호 13의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열로 이루어진다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP1을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP1"은 VP1(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 14의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 VP1(서열번호 14)의 아미노산 위치 P8에 상응하는 위치에서 돌연변이를 포함한다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 VP1(서열번호 14)의 아미노산 위치 P8에 상응하는 위치에서 ccA (P) -> ccG (P) 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP1은 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 14의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 아미노산 위치 W304 또는 Q598에 조기 정지 코돈을 포함하도록 변형된 서열번호 14의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 서열번호 99 또는 102와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 서열번호 99 또는 102의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP1은 서열번호 99 또는 102의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP2를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP2"은 VP2(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 15의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP2는 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 15의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 아미노산 위치 W304 또는 Q598에 조기 정지 코돈을 포함하도록 변형된 서열번호 15의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 서열번호 100 또는 103과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 서열번호 100 또는 103의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP2는 서열번호 100 또는 103의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP3을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP3"은 VP3(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 16의 아미노산 서열과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-VP3을 암호화하는 핵산 서열은 아르기닌 또는 라이신에 대한 하나 이상의 돌연변이(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)를 포함한다. 일부 실시형태에서, DA-VP3을 암호화하는 핵산 서열은 전문이 참조에 의해 원용된 문헌[Ogden et al. Science. 2019 Nov 29; 366(6469): 1139-1143]에 기재된 바와 같이 아스파르트산, 글루탐산 또는 글리신의 아르기닌 또는 라이신으로의 하나 이상의 돌연변이(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP3은 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 16의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 14의 W304 및 Q598에 상응하는 아미노산 위치에 조기 정지 코돈을 포함하도록 변형된 서열번호 16의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 101 또는 104와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 101 또는 104의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP3은 서열번호 101 또는 104의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)의 핵산 서열에 작동 가능하게 연결된 DA-VP를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP 핵산 서열은 p40 프로모터에 작동 가능하게 연결된다. 용어 "DA-VP"는 VP(위에 기재한 바와 같음)의 활성을 감소시키는 적어도 하나의 돌연변이를 포함하는 서열번호 116과 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 지칭한다. 일부 실시형태에서, DA-VP는 전문이 참조에 의해 원용된 문헌[Ogden et al. Science. 2019 Nov 29; 366(6469): 1139-1143]에 기재된 바와 같은 VP의 활성에 해로운 하나 이상의 비-침묵 돌연변이를 포함한다. 일부 실시형태에서, DA-VP는 VP(서열번호 14)의 잔기 1 내지 200 내의 메티오닌에 대한 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아미노산 돌연변이를 포함한다. 일부 실시형태에서, DA-VP는 VP(서열번호 14)의 잔기 1 내지 200 내의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아이소류신의 메티오닌으로의 돌연변이를 포함한다. 일부 실시형태에서, 핵산 서열의 적어도 하나의 코돈은 조기 정지 코돈(예를 들어, TAG, TAA 및 TGA)이다. 일부 실시형태에서, DA-VP는 서열번호 14의 W304 또는 Q598에 상응하는 아미노산 위치에서 조기 정지 코돈을 포함하도록 변형된 서열번호 116의 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 14의 아미노산 위치 W304 또는 Q598에서 조기 정지 코돈을 포함하도록 변형된 서열번호 116의 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 110 또는 111와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 110 또는 111의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, DA-VP는 서열번호 110 또는 111의 아미노산 서열로 이루어진 폴리펩타이드를 암호화하는 핵산 서열을 포함한다.
C.
염기 편집기 단일 가이드 RNA
일부 실시형태에서, 활성 제어 구성성분은 하나 이상의 단일 가이드 RNA를 포함한다. 본 명세서에 기재된 바와 같은 용어 "단일 가이드 RNA(들) 또는 sgRNA"는 표적 DNA 또는 RNA 서열(예를 들어, DA-Rep52를 암호화하는 DNA 또는 RNA)에 결합하고 염기 편집기를 표적 DNA 또는 RNA 서열에 보낼 수 있는 RNA 서열을 지칭한다. 단일 가이드 RNA는 스페이서 또는 프로토스페이서로 지칭되는 핵산 서열을 포함한다. 일부 실시형태에서, 스페이서 또는 프로토스페이서는 약 15 내지 50개 염기쌍 길이이며, 표적 서열(예를 들어, DA-Rep52의 DNA 또는 RNA)에 충분히 상보성이어서 염기 편집기를 표적 서열에 보낸다. 일부 실시형태에서, 스페이서 또는 프로토스페이서는 프로토스페이서 인접 모티프(PAM)에 인접한 표적 서열에 상보성이다. 일부 실시형태에서, 하나 이상의 sgRNA는 AAV 생산에 필요한 유전자를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성이어서 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, 하나 이상의 sgRNA는 AAV 생산에 필요한 유전자를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성이어서 조기 정지 코돈(들)의 염기 편집을 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, 본 명세서에 기재된 임의의 sgRNA를 암호화하는 DNA 핵산 서열은 프로모터(본 명세서에 기재된 바와 같이 구성적 또는 유도성)에 작동 가능하게 연결된다. 일부 실시형태에서, 본 명세서에 기재된 임의의 sgRNA를 암호화하는 DNA 핵산 서열은 U6 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, AAV 생산 구성성분은 DA-E2A를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E2A를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-E2A를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E2A를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 10에서 아미노산 잔기 W181에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 10에서 W181에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 10에서 아미노산 W324에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 10에서 W324에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-E2A를 암호화하는 핵산 서열은 서열번호 10에서 아미노산 잔기 W181 및 W324에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 comprises 서열번호 10에서 W181에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 10에서 W324에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 56 내지 57, 66 내지 67, 및 74 내지 75 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 56 내지 57, 66 내지 67, 및 74 내지 75 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 56 내지 57, 66 내지 67, 및 74 내지 75 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-E4ORF6을 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 11에서 아미노산 잔기 W77에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 sgRNA는 서열번호 11에서 아미노산 잔기 W77에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여, 조기 정지 코돈을 트립토판 코돈으로 편집하기 위해 염기 편집기를 보낸다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 11에서 아미노산 잔기 W192에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 11에서 아미노산 잔기 W192에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여, 조기 정지 코돈을 트립토판 코돈으로 편집하기 위해 염기 편집기를 보낸다. 일부 실시형태에서, DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 11에서 아미노산 잔기 W77 및 W192에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 11에서 W77에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 11에서 W192에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 58 내지 59, 68 내지 69, 및 76 내지 77 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일성을 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 58 내지 59, 68 내지 69, 및 76 내지 77 중 어느 하나를 포함하는 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 58 내지 59, 68 내지 69, 및 76 내지 77 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-Rep52 또는 DA-Rep40를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 Q262에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 Q262에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep52 또는 DA-Rep40를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 W319에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep52 또는 DA-Rep40를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 Q262 및 W319에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 97에서 Q262에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 64 내지 65, 73, 및 81 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 64 내지 65, 73 및 81 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 64 내지 65, 73 및 81 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 서열번호 97의 M225에 상응하는 아미노산 위치에서 돌연변이(예를 들어, M225G)를 포함하도록 변형된 DA-Rep52, DA-Rep40 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52, DA-Rep40 및/또는 DA-Rep를 암호화하는 핵산 서열 내의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 서열번호 97의 R529(예를 들어, AgG -> CgC)에 상응하는 아미노산 위치에서 돌연변이를 포함하도록 변형된 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열 내의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep78, DA-Rep68 및/또는 DA-Rep 활성을 감소시키는 아미노산 위치 56 내지 57, 58 내지 59, 61 내지 62, 73 내지 74, 76 내지 77, 87 내지 88, 113 내지 114, 33 내지 134, 164 내지 165, 217 내지 218, 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이들 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함하는 DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열 내의 하나 이상의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep52 및/또는 DA-Rep40 활성을 감소시키는 아미노산 위치 226 내지 227, 256 내지 257, 259 내지 260, 346 내지 347, 400 내지 401, 409 내지 410 및 455 내지 456번 중 하나 이상에 상응하는 위치에서 또는 이들 사이에서 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7개 이상)의 미스센스 또는 조기 정지 코돈 돌연변이를 포함하는 DA-Rep78, DA-Rep68 및/또는 DA-Rep를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep52 및/또는 DA-Rep40를 암호화하는 핵산 서열 내의 하나 이상의 돌연변이에 충분히 상보성인 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 위에 기재한 바와 같이 돌연변이된 서열을 야생형 서열로 되돌린다.
일부 실시형태에서, AAV 생산 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep을 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-Rep78, DA-Rep68 또는 DA-Rep 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 W67에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 W67에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 Q262에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 Q262에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 W319에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-Rep78, DA-Rep68 또는 DA-Rep를 암호화하는 핵산 서열은 서열번호 97에서 아미노산 잔기 W67, Q262 및 W319에 상응하는 둘 이상의 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 97에서 아미노산 잔기 W67, Q262 및 W319에 상응하는 둘 이상의 조기 정지 코돈에 충분히 상보성인 스페이서 영역을 갖는 둘 이상의 단일 가이드 RNA를 포함하여, 조기 정지 코돈을 다시 본래의 야생형 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 63 내지 65, 72 내지 73, 및 80 내지 81 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 63 내지 65, 72 내지 73, 및 80 내지 81 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 63 내지 65, 72 내지 73, 및 80 내지 81 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, AAV 생산 구성성분은 VP1(서열번호 14)의 아미노산 위치 P8에 상응하는 위치에서 돌연변이(예를 들어, ccA (P) -> ccG (P))를 포함하는 DA-VP1을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-VP1의 위치 P8에서 돌연변이에 충분히 상보성인 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여 염기 편집을 위해 염기 편집기를 돌연변이에 보낸다. 일부 실시형태에서, AAV 생산 구성성분은 VP(서열번호 14)의 잔기 1 내지 200 내에서 메티오닌에 대한 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아미노산 돌연변이(예를 들어, 아이소류신에서 메티오닌으로의 돌연변이)를 포함하는 DA-VP를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 메티오닌에 대한 하나 이상의 돌연변이에 충분히 상보성인 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보낸다. 일부 실시형태에서, DA-VP는 VP(서열번호 14)의 잔기 1 내지 200 내의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 아이소류신의 메티오닌으로의 돌연변이를 포함한다. 일부 실시형태에서, AAV 생산 구성성분은 아르기닌 또는 라이신에 대한 하나 이상의 돌연변이(예를 들어, 아르기닌 또는 라이신에 대한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 돌연변이)(예를 들어, 아르기닌 또는 라이신에 대한 아스파르트산, 글루탐산 또는 글리신)를 포함하는 DA-VP3을 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 아르기닌 또는 라이신에 대한 하나 이상의 돌연변이에 충분히 상보성인 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여 염기 편집을 위해 염기 편집기를 하나 이상의 돌연변이에 보낸다. 일부 실시형태에서, DA-VP1, DA-VP2, DA-VP3 및/또는 DA-VP를 암호화하는 핵산 서열은 서열번호 14에서 아미노산 잔기 W304에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 14에서 W304에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 서열번호 14에서 아미노산 Q598에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 14에서 Q598에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 정지 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, DA-VP1을 암호화하는 핵산 서열은 서열번호 14에서 아미노산 W304 및 Q598에 상응하는 위치에서 조기 정지 코돈을 포함하고, 활성 제어 구성성분은 서열번호 14에서 W304에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보내는 제1 단일 가이드 RNA, 및 서열번호 14에서 Q598에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 글루타민 코돈으로 편집하도록 염기 편집기를 보내는 제2 단일 가이드 RNA를 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 61 내지 62, 71, 및 79 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 61 내지 62, 71, 및 79 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 61 내지 62, 71 및 79 중 어느 하나로 이루어진 스페이서를 포함한다.
일부 실시형태에서, AAV 생산 구성성분은 DA-L4 100K를 암호화하는 핵산 서열을 포함하고, 활성 제어 구성성분은 DA-L4 100K를 암호화하는 핵산 서열 내의 돌연변이(들)에 충분히 상보성인 각각의 하나 이상의 sgRNA를 암호화하는 핵산 서열을 포함하여 돌연변이(들)의 염기 편집을 위해 염기 편집기를 돌연변이(들)에 보내고 돌연변이된 서열을 야생형 서열로 되돌린다. 일부 실시형태에서, AAV 생산 구성성분은 DA-L4 100K를 암호화하는 핵산 서열을 포함하고, 정지 코돈 구성성분은 DA-L4 100K를 암호화하는 핵산 서열 내의 조기 정지 코돈(들)에 충분히 상보성인 각각의 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열을 포함하여, 조기 정지 코돈(들)을 위에 기재한 바와 같은 표준 코돈(들)으로 염기 편집하기 위해 염기 편집기를 조기 정지 코돈(들)에 보낸다. 일부 실시형태에서, DA-L4 100 K를 암호화하는 핵산 서열은 서열번호 112에서 아미노산 잔기 435에 상응하는 위치에서 조기 정지 코돈을 포함하고, 하나의 단일 가이드 RNA는 서열번호 112에서 W435에 상응하는 위치에서 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 트립토판 코돈으로 편집하도록 염기 편집기를 보낸다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 60, 70 및 78 중 어느 하나와 적어도 80%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%) 동일한 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 60, 70 및 78 중 어느 하나의 핵산 서열을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA는 각각 서열번호 60, 70 및 78 중 어느 하나로 이루어진 스페이서를 포함한다.
VI.
염기 편집기를 포함하는 AAV 생산을 위한 조작된 세포의 예시적인 실시형태
일부 양상에서, AAV 생산 시스템은 AAV 생산을 위한 조작된 세포를 더 포함한다. 일부 실시형태에서, 조작된 세포는 (a) AAV 생산 구성성분 및 (b) 보다 초기의 정지 코돈 돌연변이를 표준 코돈으로 대체할 수 있는 염기 편집기를 포함하는 활성 제어 구성성분을 일괄적으로 포함하는, 하나 이상의 폴리핵산을 포함한다.
일부 실시형태에서, 조작된 세포는 본 명세서에 기재된 바와 같은 염기 편집기(예를 들어, ABE 또는 CBE)를 암호화하는 핵산 서열, 본 명세서에 기재된 바와 같은 Rep52, DA-Rep52, Rep40, 또는 DA-Rep40 중 어느 하나를 암호화하는 핵산 서열, 본 명세서에 기재된 바와 같은 Rep78, DA-Rep78, Rep68 또는 DA-Rep68 중 어느 하나를 암호화하는 핵산 서열, 본 명세서에 기재된 바와 같은 E2A 또는 DA-E2A 중 어느 하나를 암호화하는 핵산 서열 및 본 명세서에 기재된 바와 같은 E4Orf6 또는 DA-E4Orf6 중 어느 하나를 암호화하는 핵산 서열을 포함하고, 본 명세서에 기재된 바와 같은 L4 100K 또는 DA-L4 100K; VARNA; VP1 또는 DA-VP1; VP2 또는 DA-VP2; VP3 또는 DA-VP3; 및 AAP의 각각을 암호화하는 핵산 서열을 더 포함하되, 조작된 세포는 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E4Orf6, DA-L4 100K DA-VP1, DA-VP2 및 DA-VP3 중 적어도 하나를 포함하고, 세포는 본 명세서에 기재된 바와 같은 하나 이상의 단일 가이드 RNA를 포함하고, 각각은 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E4Orf6 DA-L4 100K DA-VP1, DA-VP2 및 DA-VP3 중 적어도 하나에 대해 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 표준 코돈(예를 들어, 본래의 야생형 코돈)을 편집하도록 염기 편집기를 보낸다.
A.
제1의 안정적으로 통합된 핵산 분자
일부 실시형태에서, AAV 생산을 위한 조작된 세포는 하나 이상의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 제1의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 E2A 또는 DA-E2A; E4Orf6 또는 DA-E4Orf6; L4 100K 또는 DA-L4 100K; 및 VARNA 또는 DA-VARNA의 각각을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, E2A 또는 DA-E2A; E4Orf6 또는 DA-E4Orf6; L4 100K 또는 DA-L4 100K; 및 VARNA 또는 DA-VARNA를 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 선택 마커를 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 본 명세서에 사용되는 바와 같은 용어 "CTCF 절연체"는 게놈 영역 사이의 원치않는 크로스토크(crosstalk)를 방지할 수 있는 CCCTC-결합 인자를 지칭한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 슬리핑 뷰티 트랜스포사제(Sleeping Beauty transposase)에 결합할 수 있는 2개의 IR/DR 서열을 추가로 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-E2A를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-E4ORF6을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-E2A 및 DA-E4 ORF6을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 DA-L4 100K를 암호화하는 핵산 서열을 포함한다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112, 서열번호 41 또는 서열번호 42, 및 서열번호 13을 포함한다. 일부 실시형태에서, 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112, 서열번호 41 또는 서열번호 42, 및 서열번호 13을 포함하는 제1의 안정적으로 통합된 핵산 분자는 선택 카세트를 더 포함한다. 일부 실시형태에서, 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112 서열번호 41 또는 서열번호 42, 서열번호 13 및 선택 카세트를 포함하는 제1의 안정적으로 통합된 핵산 분자는 2개의 CTCF 절연체를 더 포함하되, CTCF 절연체는 제1의 안정적으로 통합된 핵산 분자의 5' 및 3' 말단 상에 위치되고, 서열번호 39 또는 서열번호 40, 서열번호 98 또는 112, 서열번호 41 또는 서열번호 42, 서열번호 13 및 선택 카세트는 2개의 CTCF 절연체 사이에 위치된다.
일부 실시형태에서, 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
B.
제2의 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 제1의 안정적으로 통합된 핵산 분자 및 제2의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 Rep52, DA-Rep52, Rep40, 또는 DA-Rep40; Rep78, DA-Rep78, Rep68, 또는 DA-Rep68; VP1 또는 DA-VP1; VP2 또는 DA-VP2; 및 VP3 또는 DA-VP3의 각각을 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, Rep52, DA-Rep52, Rep40, 또는 DA-Rep40; Rep78, DA-Rep78, Rep68, 또는 DA-Rep68; VP1 또는 DA-VP1; VP2 또는 DA-VP2; 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 하나 이상의 단일 가이드 RNA(예를 들어, 단일 가이드 RNA 어레이)를 더 포함하되, 하나 이상의 단일 가이드 RNA는 각각 본 명세서에 기재된 바와 같은 스페이서 영역을 포함한다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 하나 이상의 단일 가이드 RNA를 암호화하는 핵산 서열은 각각 본 명세서에 기재된 바와 같은 화학적 유도성 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 IR/DR 서열을 더 포함한다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 서열번호 97에서 W319에 상응하는 위치에서 조기 정지 코돈을 포함하는 DA-Rep를 포함한다. 일부 실시형태에서, DA-Rep는 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, DA-Rep는 p19 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 하나 이상의 sgRNA는 각각 DA-Rep W319 조기 정지 코돈에 충분히 상보성인 스페이서를 포함하여 조기 정지 코돈을 편집하기 위해 위에 기재한 바와 같이 염기 편집기를 보낸다. 일부 실시형태에서, 하나 이상의 sgRNA는 추가적으로 각각 위치 W77 및 W192에서 DA-E4 ORF6 조기 정지 코돈에 충분히 상보성인 스페이서 영역을 포함하여, 위에 기재한 바와 같이 조기 정지 코돈을 트립토판(W) 정지 코돈으로 편집하기 위해 염기 편집기를 보낸다.
일부 실시형태에서, 제2의 안정적으로 통합된 핵산 분자는 서열번호 14 내지 16, 54, 및 65 또는 81을 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81을 포함하는 제2의 안정적으로 통합된 핵산 분자는 서열번호 56 내지 59를 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81을 포함하는 제2의 안정적으로 통합된 핵산 분자는 서열번호 66 내지 69를 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81을 포함하는 제2의 안정적으로 통합된 핵산 분자는 서열번호 74 내지 77을 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81, 서열번호 56 내지 59 또는 서열번호 66 내지 69 또는 서열번호 74 내지 77을 포함하는 제2의 안정적으로 통합된 핵산 분자는 선택 카세트를 더 포함한다. 일부 실시형태에서, 서열번호 14 내지 16, 54, 및 65 또는 81, 서열번호 56 내지 59 또는 서열번호 66 내지 69 또는 서열번호 74 내지 77 및 선택 카세트를 포함하는 제2의 안정적으로 통합된 핵산 분자는 2개의 CTCF 절연체를 더 포함하되, CTCF 절연체는 제1의 안정적으로 통합된 핵산 분자의 5' 및 3' 말단 상에 위치되고, 서열번호 14 내지 16, 54, 및 65 또는 81, 서열번호 56 내지 59 또는 서열번호 66 내지 69 또는 서열번호 74 내지 77 및 선택 카세트는 2개의 CTCF 절연체 사이에 위치된다.
일부 실시형태에서, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
C.
제3의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자를 포함하고, 제3의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 염기 편집기를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재한 바와 같은 전사 활성체를 암호화하는 핵산 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 본 명세서에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 IR/DR 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 프로모터에 작동 가능하게 연결된 전사 활성체를 더 포함한다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 염기 편집기를 암호화하는 핵산 분자(예를 들어, Cas9 ABE, Cas9 CBE, 또는 Cas13 ABE를 암호화하는 핵산 분자)를 포함한다. 일부 실시형태에서, 프로모터는 화학적으로 유도성이다. 일부 실시형태에서, 화학적 유도성 프로모터는 TRE이다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 TetOn 전사 활성체를 암호화하는 핵산 서열을 포함한다. 일부 실시형태에서, 2A 서열은 TetOn 핵산 서열과 선택 마커 핵산 서열 사이에서 암호화된다.
일부 실시형태에서, 제1의 안정적으로 통합된 핵산 분자는 Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84), 또는 Cas13 REPAIRv2(서열번호 85)를 포함한다. 일부 실시형태에서, Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84) 또는 Cas13 REPAIRv2(서열번호 85)를 포함하는 제1의 안정적으로 통합된 핵산 분자는 TetOn 프로모터, 2A 펩타이드 및 선택 마커를 더 포함한다. 일부 실시형태에서, Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84), 또는 Cas13 REPAIRv2(서열번호 85), TetOn 프로모터, 2A 펩타이드 및 선택 마커를 포함하는 제1의 안정적으로 통합된 핵산 분자는 2개의 CTCF 절연체를 더 포함하되, CTCF 절연체는 제1의 안정적으로 통합된 핵산 분자의 5' 및 3' 말단 상에 위치되고, Cas9 ABE7.10(서열번호 82), Cas9 ABE8.17m(서열번호 83), Cas13 REPAIRv1(서열번호 84), 또는 Cas13 REPAIRv2(서열번호 85), TetOn 프로모터, 2A 펩타이드, 및 선택 마커는 2개의 CTCF 절연체 사이에 위치된다.
일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 사이토신 염기 편집기(CBE)를 포함하는 염기 편집기를 포함한다. 일부 실시형태에서, CBE는 Cas9 CBE 또는 Cas13 CBE이다. 일부 실시형태에서, CBE를 암호화하는 핵산 서열은 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, CBE는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF 또는 CymR 중 적어도 하나, 또는 Gal4 UAS 작동유전자 서열을 포함하는 프로모터로 이루어진 군으로부터 선택되는, 제3 화학적 유도성 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 위에 기재한 바와 같은 제3의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
D.
제4의 안정적으로 통합된 핵산 분자
일부 실시형태에서, 하나 이상의 안정적으로 통합된 핵산 분자를 포함하는 AAV 생산을 위한 조작된 세포는 위에 기재한 바와 같은 제1의 안정적으로 통합된 핵산 분자, 위에 기재한 바와 같은 제2의 안정적으로 통합된 핵산 분자, 제3의 안정적으로 통합된 핵산 분자를 포함하고, 제4의 안정적으로 통합된 핵산 분자를 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 각각의 선택 카세트, 및 형광 단백질 마커(본 명세서에 기재된 바와 같음), 예컨대, EGFP를 암호화하는 핵산 서열을 포함하고, 각각의 핵산 서열은 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 2개의 역위 말단 반복부(ITR)서열을 더 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 측접하는 2개의 역위 말단 반복부(ITR) 서열 및 위에 기재한 바와 같은 유전자를 포함하는 페이로드를 더 포함한다. 일부 실시형태에서, 제4의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 CTCF 절연체 서열을 더 포함한다. 일부 실시형태에서, 제3의 안정적으로 통합된 핵산 분자는 위에 기재된 바와 같은 2개의 IR/DR 서열을 더 포함한다.
일부 실시형태에서, 위에 기재한 바와 같은 제4의 안정적으로 통합된 핵산 분자는 도 3에 도시한 바와 동일한 구조를 갖는다.
VII.
염기 편집기를 포함하는 AAV 생산을 위한 조작된 세포를 이용하는 방법
일부 양상에서, 본 개시내용은 본 명세서에 기재된 바와 같이 화학적 유도성 프로모터에 작동 가능하게 연결된 염기 편집기 및/또는 sgRNA(들)를 포함하는 조작된 세포를 이용하여 AAV를 생산하는 방법을 제공한다. 일부 실시형태에서, 상기 방법은 AAV 전달을 위해 핵산 서열을 암호화하는 핵산 서열을 포함하는 조작된 세포를 이용하는 단계를 더 포함한다. 일부 실시형태에서, 상기 방법은 조작된 세포를 AAV 생산에 최적인 합류까지 성장시키는 단계를 포함한다. 최적의 합류는 조작된 세포가 유래된 세포 유형에 따를 것이다. 당업자는 AAV 생산의 최적 합류를 알거나 결정할 수 있다. 일부 실시형태에서, 상기 방법은 염기 편집기 또는 sgRNA(들)의 발현을 유도할 수 있는 소분자 유도물질과 조작된 세포를 접촉시키는 단계를 포함한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 또는 큐메이트이다. 일부 실시형태에서, 상기 방법은 당업자에게 잘 공지된 방법을 이용해서 조작된 세포의 배양물로부터 생산된 AAV를 채취하는 단계를 포함한다.
VIII.
조작된 세포
일부 양상에서, 본 개시내용은 조작된 세포(예를 들어, AAV 생산을 위해 조작된 세포)에 관한 것이다. 일부 실시형태에서, 조작된 세포는 알려진 또는 기존의 세포주로부터 유래된다. 일부 실시형태에서, 조작된 세포는 HEK293 세포, HeLa 세포, BHK 세포 및 Sf9 세포로 이루어진 군으로부터 유래된다. 일부 실시형태에서, 조작된 세포는 본 명세서에 기재된 바와 같이 AAV 생산에 필요한 유전자를 암호화하는 핵산 서열 및 상기 유전자의 발현을 조절하기 위한 시스템을 포함한다. 일부 실시형태에서, 조작된 세포는 하나 이상의 핵산 분자(예를 들어, 1, 2, 3, 4, 5 또는 6개의 핵산 분자)의 안정적인 통합을 위한 게놈 부위를 포함한다. 핵산 분자의 안정적인 통합을 위한 이러한 게놈 부위는 당업자에게 잘 알려져 있다. 안정적인 통합을 위한 예시적인 부위는 AAVS1, ROSA26, CCR5, H11 및 LiPS-A3S를 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 안정적으로 통합된 핵산 분자는 조작된 세포 게놈에 무작위로 통합된다.
IX.
키트
일부 양상에서, 본 개시내용은 파트 I 내지 II 및 V에서 본 명세서에 기재된 AAV 생산 시스템을 포함하는 키트에 관한 것이다.
일부 실시형태에서, 키트는 AAV 생산 시스템을 일괄적으로 포함하는 하나 이상의 폴리핵산을 포함한다.
일부 실시형태에서, 키트는 파트 III, VI 및 VIII에 기재된 조작된 세포를 포함한다.
일부 실시형태에서, 키트는, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 포함한다. 일부 실시형태에서, 폴리뉴클레오타이드는 플라스미드 또는 벡터이다.
전달 폴리핵산의 중심 핵산은 다중 클로닝 부위의 핵산 서열을 포함할 수 있다. 예시적인 다중 클로닝 부위는 당업자에게 알려져 있다. 다중 클로닝 부위는 숙주 세포 내 바이러스 벡터의 생성 전에 전달 폴리핵산에 페이로드 분자(또는 관심 유전자) - 또는 페이로드 분자를 암호화하는 발현 카세트 - 를 클로닝하기 위해 사용될 수 있다.
일부 실시형태에서, 키트는 AAV 생산 시스템의 화학적 유도성 프로모터에 상응하는 소분자 유도물질을 더 포함한다. 일부 실시형태에서, 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트이다. 일부 실시형태에서, 키트는 세포의 사용을 위한 지침을 더 포함할 수 있다.
일부 실시형태에서, 키트는 조작된 세포를 포함하되, 조작된 세포는 선택 III 또는 선택 VI의 안정적으로 통합된 핵산 분자를 포함한다.
일부 실시형태에서, 키트는 프로모터의 핵산 서열에 작동 가능하게 연결된 전사 활성체의 핵산 서열을 포함하는 폴리핵산을 포함하되, 전사 활성체는, 소분자 유도물질의 존재 하에서 발현될 때, AAV 생산 시스템의 화학적 유도성 프로모터에 결합하고, 선택적으로 조작된 세포는 전사 활성체의 핵산 서열을 포함하는 폴리핵산을 포함한다. 일부 실시형태에서, 전사 활성체는 TetOn-3G, TetOn-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16 및 큐메이트 cTA 및 rcTA로 이루어진 군으로부터 선택된다.
실시예
실시예 1.
비표준 아미노산 AAV
접근법 및 유전자 도식의 설명:
조기 정지 코돈에서 비표준 아미노산(ncAA) 혼입의 사용은 독성 단백질보다 큰 대조군의 번역 수준을 제공한다. 비표준 아미노산의 존재에 대한 전형적인 발현은 전사 후 단백질 발현의 유도성 제어를 제공하며, 이는 전사체의 존재 하에서조차 표적 단백질의 발현이 매우 낮음/없음이어야 한다는 것을 의미한다. 아미노산 변화의 용인으로서 이전에 확인된 부위에서 TAG 정지 코돈을 도입함으로써 Rep78 및 Rep52 ncAA 정지 코돈 돌연변이체를 생성하였다. 이 시스템에서, 고세균 메타노사르시나 마제이로부터 유래된 직교성 전달 RNA(tRNA) 합성효소(pylRS) 및 이의 동족 tRNA(tRNApyl)를 사용해서 H-Lys(Boc)-OH, l-라이신 유도체를 Rep 단백질에 혼입하여 AAV 생산을 유도하였다.
실시예 2.
염기 편집기 AAV
접근법 및 유전자 도식의 설명:
HEK293T 생산자 계통에서 세포독성 유전자의 E1 활성화는 조기 정지 코돈으로 해당 유전자를 가역적으로 비활성화시킴으로써 피할 수 있다. 단백질 발현이 요망되는 경우, 아데닌 염기 편집기(ABE)는 표적화된 A-대-G 점 돌연변이를 수행하여 조기 정지 코돈을 암호화 아미노산으로 되돌릴 수 있다. 센스 가닥 상에서 트립토판(W) 코돈으로 이루어진 조기 정지 돌연변이는 DNA-기반 Cas9 ABE와 RNA-기반 Cas13 ABE 둘 다에 의해 되돌아갈 수 있다. 안티-센스 가닥 상에서, DNA-기반 Cas9 ABE는 글루타민(Q) 및 아르기닌 잔기로 이루어진 조기 정지 코돈을 되돌릴 수 있다. 안티-센스 가닥 상에서, DNA-기반 Cas9 CBE는 프롤린(P) 잔기로 만들어진 조기 정지 코돈을 되돌릴 수 있다.
Rep, E2A 및 E4에 도입된 조기 정지 코돈은 이러한 단백질의 발현을 방지하여, 감소된 AAV 역가, 개선된 세포 건강, 및 그에 따라 안정적인 AAV 생산자 세포를 만드는 개선된 능력을 초래한다는 가설을 세웠다. AAV의 생산이 요망되는 경우, ABE는 소분자로 처리 시 유도성 프로모터에 의해 발현될 수 있다. 예를 들어, 테트라사이클린 반응 구성요소(TRE)는 독시사이클린 및 역 테트라사이클린 트랜스작용인자(reverse tetracycline transactivator: rtTA)의 존재 하에 ABE의 발현을 유도할 수 있었다. RNA PolIII 프로모터, 예컨대 U6에 의해 ABE에 대한 단일 가이드 RNA를 구성적으로 발현시킨다.
표 3은 Rep, Cap, E2A, E4 및 L4 100K 암호화 서열로 이루어진 특정 돌연변이를 해당 돌연변이의 수선을 위한 가이드 서열과 함께 나타낸다. 아미노산 위치 넘버링은 표시한 CDS에 상응한다. 뉴클레오타이드 위치 넘버링은 2형 아데노바이러스(GenBank: J01917.1, NCBI: NC_001405.1) 및 2형 아데노-연관 바이러스(GenBank: AF043303.1, NCBI: NC_001401.2)의 완전한 게놈에 상응하며, 측접 염기가 맥락으로 제공된다. 추가적인 침묵 돌연변이는 조기 정지 코돈 근처에서 이루어져서 Cas9 ABE의 경우 PAM 서열을 도입하거나, 또는 ABE 편집 창 내에서 비표적 염기 편집을 감소시킬 수 있다.
실험에서, 조기 정지 돌연변이는 pRepCap 및 pHelper 표준 플라스미드로 이루어졌다(도 2). 이러한 변형된 플라스미드에 의해 일시적 형질감염에 의한 AAV의 생산을 수행하여 AAV 역가에 대한 조기 정지 코돈의 영향을 결정하였다. Rep 또는 Cap으로 이루어진 단일 돌연변이는 AAV 역가를 감소시키기에 충분하였다. Rep에 의해 이루어진 돌연변이는 ABE 및 단일 가이드 RNA 플라스미드의 공동 형질감염에 의한 AAV의 '야생형' 수준으로 회복될 수 있었다. E2A, E4ORF6 또는 L4 100K에 도입된 단일 돌연변이는 개개로 AAV 역가 단독을 감소시키기에 충분하지 않았지만, 돌연변이체의 조합은 더 큰 영향을 미쳤다. ABE 및 가이드 풀에 의해 공동 형질감염될 때, 해당 조합은 마찬가지로 AAV의 '야생형' 수준으로 회복될 수 있었다. 이런 결과는 독시사이클린의 존재 하에 AAV 역가의 유도성을 나타내는 안정적인 플라스미드 시스템(도 3)을 일시적으로 분석할 때 유지되었다.
예비 데이터 및 실험 설명:
부착 HEK293FT 세포를 EGFP-발현 전달 플라스미드, pRepCap, pHelper, ABE 플라스미드 및 단일 가이드 RNA 플라스미드로 공동 형질감염시켰다(도 2). pRepCap 또는 pHelper의 돌연변이체 변이체를 '야생형' 플라스미드로 대체하여 AAV 역가에 대한 이들의 영향을 시험하였다(도 4). ABE 및 대응하는 가이드를 공동 형질감염시켜 ABE가 바이러스 역가를 회복할 수 있는지의 여부를 결정하였다. ABE 및 가이드를 시험하지 않은 샘플에서, 비활성 플라스미드를 공동 형질감염시켜 형질감염된 DNA의 양을 동일하게 유지하였다. DNA 없이 '야생형' AAV2 pRepCap 및 pHelper 플라스미드 또는 음성 대조군 형질감염 혼합물만을 함유하는 대조군 샘플을 또한 준비하였다. 형질감염 48시간 후에, AAV를 드라이아이스 아이소프로판올 욕에서 4회의 냉동 해동 주기로 채취하였다. 바이러스 저장액을 96-웰 플레이트에 플레이팅한 5e4 HEK293FT 세포에 10, 1 및 0.5㎕ 첨가하여 형질도입하였다. 형질도입 48시간 후에, 형질도입 세포를 채취하고, 유세포분석에 의해 EGFP 양성 세포의 백분율을 결정하고, ㎖당 형질도입 단위(TU/㎖)를 계산하는 데 사용하였다.
다음에, 부착 HEK293FT 세포를 pRepCap 또는 pHelper에서 조기 정지 돌연변이체의 조합으로 공동 형질감염시켜 AAV 역가에 대한 이들의 조합된 영향, 및 단일 가이드 RNA 플라스미드의 ABE 및 풀에 의해 회복되는 이들의 능력을 시험하였다(도 5). 형질감염 48시간 후에, AAV를 드라이아이스 아이소프로판올 욕에서 4회의 냉동 해동 주기로 채취하였다. 바이러스 저장액을 1배, 10배 및 100배 연속 희석시키고, 10㎕의 얻어진 바이러스 저장액을 96-웰 플레이트에 플레이팅한 5e4 HEK293FT 세포에 첨가하여 형질도입하였다. 형질도입 48시간 후에, 형질도입 세포를 채취하고, 유세포분석에 의해 EGFP 양성 세포의 백분율을 결정하고, ㎖당 형질도입 단위(TU/㎖)를 계산하는 데 사용하였다.
완전한 안정적인 시스템의 실현 가능성을 분석하기 위해, 부착 HEK293FT 세포를 500nM 독시사이클린의 유무와 상관없이 완전한 안정적인 시스템의 조합으로 공동 형질감염시켜(도 3), 독시사이클린의 존재 하에 AAV를 유도하는 이들의 조합된 능력을 시험하였다(도 6). 형질감염 48시간 후에, AAV를 드라이아이스 아이소프로판올 욕에서 4회의 냉동 해동 주기로 채취하였다. 10㎕ 및 1㎕의 얻어진 바이러스 저장액을 96-웰 플레이트에서 플레이팅한 5e4 HEK293FT 세포에 첨가하여 형질도입하였다. 형질도입 48시간 후에, 형질도입 세포를 채취하고, 유세포분석에 의해 EGFP 양성 세포의 백분율을 결정하고, ㎖당 형질도입 단위(TU/㎖)를 계산하는 데 사용하였다.
유도성 AAV 생산을 위해 현탁액 세포에서 유도성 ABE, 가이드의 구성적 풀 및 돌연변이체 Rep, Cap, E2A 또는 E4 ORF6의 조합물을 함유하는 안정적인 세포주를 생성할 것이다(도 3).
다른 실시형태
본 명세서에 개시된 모든 특징은 임의의 조합으로 조합될 수 있다. 본 명세서에 개시된 각 특징은 동일하거나, 동등하거나 또는 유사한 목적의 작용을 하는 대안의 특징으로 대체될 수 있다. 따라서, 달리 분명하게 언급되지 않는 한, 각각의 개시된 특징은 단지 일반적인 일련의 동등하거나 또는 유사한 특징의 예시이다.
위의 설명으로부터, 당업자는 본 개시내용의 필수 특징을 용이하게 확인할 수 있고, 이의 사상과 범주로부터 벗어나는 일 없이, 다양한 용도 및 조건에 적합하도록 본 개시내용의 다양한 변화 및 변형을 만들 수 있다. 따라서, 다양한 실시형태도 청구범위 내에 있다.
균등론
본 발명의 여러 실시형태를 기재하고 예시하였지만, 당업자는 기능을 수행하고/하거나 본 명세서에 기재된 결과 및/또는 하나 이상의 이점을 얻기 위한 다양한 수단 및/또는 구조를 용이하게 생각할 것이고, 각각의 이러한 변화 및/또는 변형은 본 명세서에 기재된 본 발명의 실시형태의 범주 이내인 것으로 여겨진다. 더 일반적으로는, 당업자는 본 명세서에 기재된 모든 파라미터, 치수, 물질 및 입체배치가 예시적인 것으로 의도되며, 실제 파라미터, 치수, 물질 및/또는 입체배치가 본 교시가 사용되는 특정 출원 또는 출원에 따를 것임을 용이하게 인식할 것이다. 당업자는 단지 일상적인 실험을 이용해서, 본 명세서에 기재된 구체적인 본 발명의 실시형태에 대한 다수의 균등물을 인식하고 확인할 수 있을 것이다. 따라서, 앞서 언급한 실시형태가 단지 예로서 제시되고, 첨부되는 청구범위 및 이에 대한 균등물의 범주 이내에서, 본 발명의 실시형태가 구체적으로 기재되고 특허청구되는 것과 다르게 실행될 수 있다는 것을 이해할 것이다. 본 개시내용의 본 발명의 실시형태는 본 명세서에 기재된 각각의 개개 특징, 시스템, 물품, 물질, 키트 및/또는 방법에 관한 것이다. 또한, 이러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법이 상호 모순되지 않는 경우에, 둘 이상의 러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법의 임의의 조합은 본 개시내용의 본 범주 이내에 포함된다.
본 명세서에서 정의되고 사용되는 모든 정의는 사전의 정의, 참조에 의해 원용되는 문헌의 정의 및/또는 정의된 용어의 보통의 의미로 조절하는 것으로 이해되어야 한다.
본 명세서에 개시된 모든 참고문헌, 특허 및 특허 출원은 각각이 인용되는 대상에 대해 원용되며, 일부 경우에 이는 문헌 전체로 포함될 수 있다.
본 명세서 및 청구범위에 사용되는 바와 같은 분명히 규정되지 않은 단수 항목은, 달리 분명하게 반대로 표시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본 명세서 및 청구범위에서 사용되는 어구 "및/또는"은 이렇게 결합된 구성요소, 즉, 일부 경우에 결합하여 존재하고 다른 경우에 분리해서 존재하는 구성요소 중 "하나 또는 둘 다"를 의미하는 것으로 이해되어야 한다. "및/또는"과 함께 열거되는 다수의 구성요소는 동일한 방식, 즉, 이렇게 결합된 구성요소의 "하나 이상"으로 해석되어야 한다. 다른 구성요소는 구체적으로 확인된 해당 구성요소와 관련되든 관련되지 않든, "및/또는"에 의해 구체적으로 확인되는 구성요소 이외로 선택적으로 존재할 수 있다. 따라서, 비제한적 예로서, "A 및/또는 B"에 대한 언급은 "포함하는"과 같이 제약을 두지 않은 언어와 함께 사용될 때, 일 실시형태에서, A만을(선택적으로 B 이외의 구성요소를 포함) 지칭할 수 있고; 다른 실시형태에서, B만을(선택적으로 B 이외의 구성요소를 포함) 지칭하며; 또 다른 실시형태에서, A와 B 모두(선택적으로 다른 구성요소를 포함); 등을 지칭한다.
본 명세서 및 청구범위에 사용되는 바와 같이, "또는"은 위에 정의한 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리시킬 때, "또는" 또는 "및/또는"은 포괄적인 것, 즉, 적어도 하나를 포함할 뿐만 아니라 하나 초과의 수 또는 구성요소 목록 및 선택적으로 추가적인 열거되지 않은 항목을 포함하는 것으로 해석될 것이다. 분명하게 반대로 표시되는 유일한 용어, 예컨대, "~ 중 단지 하나" 또는 "~중 정확히 하나" 또는 청구범위에서 사용될 때 "~로 이루어진"은 구성요소의 수 또는 목록 중 정확히 하나의 포함을 지칭할 것이다. 일반적으로, 본 명세서에 사용되는 바와 같은 용어 "또는"은 "중 하나", "의 하나", "중 단지 하나" 또는 "중 정확히 하나"와 같이 배타성의 용어가 선행할 때, 배타적인 대안(즉, "하나 또는 다른 하나이지만, 둘 다는 아님")을 나타내는 것으로만 해석될 것이다. "본질적으로 이루어진"은 청구범위에서 사용될 때, 특허법 분야에서 사용되는 것과 같은 이의 보통의 의미를 가질 것이다.
하나 이상의 구성요소의 목록에 관해 본 명세서 및 청구범위에서 사용되는 바와 같은 어구 "적어도 하나"는 구성요소 목록에서 구성요소 중 어느 하나 이상으로부터 선택된 적어도 하나의 구성요소를 의미하지만, 구성요소 목록 내에 구체적으로 열거된 각각의 및 모든 구성요소 중 적어도 하나를 반드시 포함하지는 않고 구성요소 목록에서 구성요소의 임의의 조합을 제외하지는 않는 것으로 이해되어야 한다. 본 정의는 또한 구체적으로 확인된 해당 구성요소와 관련되는지 관련되든 관련되지 않든, 어구 "적어도 하나"가 지칭하는 구성요소의 목록 내에서 구체적으로 확인되는 구성요소 이외의 구성요소가 선택적으로 존재할 수 있다는 것을 허용한다. 따라서, 비제한적 예로서, "A 및 B 중 적어도 하나"(또는 동등하게는, "A 또는 B 중 적어도 하나" 또는 동등하게는 "A 및/또는 B 중 적어도 하나")는, 일 실시형태에서, B가 존재하지 않고(및 선택적으로 B 이외의 구성요소를 포함) 적어도 하나, 선택적으로 하나 초과의 A를 포함하는 것; 다른 실시형태에서, A가 존재하지 않고(선택적으로 A 이외의 구성요소를 포함) 적어도 하나, 선택적으로 하나 초과의 B를 포함하는 것; 또 다른 실시형태에서, 적어도 하나, 선택적으로 하나 초과의 A를 포함하고, 적어도 하나, 선택적으로 하나 초과의 B를 포함하는 것(선택적으로 다른 구성요소를 포함); 등을 지칭할 수 있다.
달리 반대로 분명하게 표시되지 않는 한, 하나 초과의 단계 또는 행동을 포함하는 본 명세서에 특허청구된 임의의 방법에서, 상기 방법의 단계 또는 행동의 순서는 상기 방법의 단계 또는 행동이 열거되는 순서로 반드시 제한되지 않는다는 것이 또한 이해되어야 한다.
청구범위뿐만 아니라 위의 명세서에서, 모든 이행적 어구, 예컨대, "포함하는(comprising)", "포함하는(including)", "지니는", "갖는", "함유하는", "수반하는", "보유하는", "구성된" 등은 제약을 두지 않은 것으로, 즉, 포함하지만, 이들로 제한되지 않는 것을 의미하는 것으로 이해된다. 이행적 어구 "이루어진" 및 "본질적으로 이루어진"은 미국 특허청 심사 절차 매뉴얼(United States Patent Office Manual of Patent Examining Procedures), 부문 2111.03에 제시된 바와 같이 각각 제한적인 또는 반-제한적인 이행 어구일 것이다. 제약을 두지 않은 이행 어구(예를 들어, "포함하는")를 이용하는 본 문헌에 기재된 실시형태가 또한, 대안의 실시형태에서, 제약을 두지 않은 이행 어구에 의해 기재된 특징으로 "이루어진" 및 "본질적으로 이루어진"으로 생각된다는 것이 인식되어야 한다. 예를 들어, 본 개시내용이 "A 및 B를 포함하는 조성물"을 기재하는 경우, 본 개시내용은 또한 "A 및 B로 이루어진 조성물" 및 "A 및 B로 본질적으로 이루어진 조성물"의 대안의 실시형태를 상정한다.
SEQUENCE LISTING
<110> Asimov Inc.
<120> STABLE PRODUCTION SYSTEMS FOR ADENO-ASSOCIATED VIRUS PRODUCTION
<130> WO/2022/226189
<140> PCT/US2022/025755
<141> 2022-04-21
<150> US 63/177,760
<151> 2021-04-21
<160> 128
<170> PatentIn version 3.5
<210> 1
<211> 346
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 1
ctcgagttta ctccctatca gtgatagaga acgtatgtcg agtttactcc ctatcagtga 60
tagagaacga tgtcgagttt actccctatc agtgatagag aacgtatgtc gagtttactc 120
cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag agaacgtatg 180
tcgagtttat ccctatcagt gatagagaac gtatgtcgag tttactccct atcagtgata 240
gagaacgtat gtcgaggtag gcgtgtacgg tgggaggcct atataagcag agctcgttta 300
gtgaaccgtc agatcgcctg gagaattcga gctcggtacc cgggga 346
<210> 2
<211> 423
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
gtttactccc tatcagtgat agagaacgta tgaagagttt actccctatc agtgatagag 60
aacgtatgca gactttactc cctatcagtg atagagaacg tataaggagt ttactcccta 120
tcagtgatag agaacgtatg accagtttac tccctatcag tgatagagaa cgtatctaca 180
gtttactccc tatcagtgat agagaacgta tatccagttt actccctatc agtgatagag 240
aacgtataag ctttaggcgt gtacggtggg cgcctataaa agcagagctc gtttagtgaa 300
ccgtcagatc gcctggagca attccacaac acttttgtct tataccaact ttccgtacca 360
cttcctaccc tcgtaaagtc gacaccgggg cccagatcta tcgatcggcc ggataacgcc 420
acc 423
<210> 3
<211> 496
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
gaattctcca ggcgatctga cggttcacta aacgagctct gcttatatag gcctcccacc 60
gtacacgcca cctcgacata ctcgagttta ctccctatca gtgatagaga acgtatgaag 120
agtttactcc ctatcagtga tagagaacgt atgcagactt tactccctat cagtgataga 180
gaacgtataa ggagtttact ccctatcagt gatagagaac gtatgaccag tttactccct 240
atcagtgata gagaacgtat ctacagttta ctccctatca gtgatagaga acgtatatcc 300
agtttactcc ctatcagtga tagagaacgt ataagcttta ggcgtgtacg gtgggcgcct 360
ataaaagcag agctcgttta gtgaaccgtc agatcgcctg gagcaattcc acaacacttt 420
tgtcttatac caactttccg taccacttcc taccctcgta aagtcgacac cggggcccag 480
atctccgcgg ggatcc 496
<210> 4
<211> 578
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 4
cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat aaggccggtg 60
tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg tgagggcccg 120
gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 180
aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 240
aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 300
ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 360
cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg tattcaacaa 420
ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggtg 480
cacatgcttt acatgtgttt agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg 540
ggacgtggtt ttcctttgaa aaacacgatg ataatatg 578
<210> 5
<211> 571
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 5
cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 60
atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 120
ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 180
tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 240
tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 300
agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 360
ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 420
atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 480
catgtgttta gtcgaggtta aaaaaacgtc taggcccccc gaaccacggg gacgtggttt 540
tcctttgaaa aacacgatga taatagttat c 571
<210> 6
<211> 397
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 6
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
325 330 335
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
340 345 350
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
355 360 365
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
370 375 380
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 7
<211> 312
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 7
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Leu Ala Arg Gly His Ser Leu
305 310
<210> 8
<211> 621
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 8
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 9
<211> 536
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 9
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Leu Ala Arg Gly His Ser Leu
530 535
<210> 10
<211> 529
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 10
Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly
1 5 10 15
Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro
20 25 30
Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg
35 40 45
Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu
50 55 60
Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu
65 70 75 80
Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu
85 90 95
Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu
100 105 110
Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile
115 120 125
Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp
130 135 140
Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser
145 150 155 160
Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro
165 170 175
Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met
180 185 190
Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu
195 200 205
Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn
210 215 220
Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe
225 230 235 240
Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala
245 250 255
Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu
260 265 270
His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser
275 280 285
Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu
290 295 300
Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val
305 310 315 320
Lys Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala
325 330 335
Arg Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly
340 345 350
Lys Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala
355 360 365
Phe Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln
370 375 380
Thr Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser
385 390 395 400
Lys Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr
405 410 415
Pro Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser
420 425 430
Asp Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe
435 440 445
Gln Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly
450 455 460
Pro Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu
465 470 475 480
Val Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg
485 490 495
Met Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn
500 505 510
Val Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp
515 520 525
Phe
<210> 11
<211> 294
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 11
Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg
1 5 10 15
Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro
20 25 30
Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu
35 40 45
Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly
50 55 60
Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Trp Val Val Pro
65 70 75 80
Trp Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys
85 90 95
Met His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met
100 105 110
Met Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser
115 120 125
Pro Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp
130 135 140
Phe Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp
145 150 155 160
Tyr Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met
165 170 175
Ser Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Trp
180 185 190
Tyr Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr
195 200 205
Ser Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys
210 215 220
Ser Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg
225 230 235 240
Arg Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu
245 250 255
Thr Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln
260 265 270
Phe Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp
275 280 285
Tyr Asp Ser Thr Pro Met
290
<210> 12
<211> 888
<212> DNA
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 12
atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60
cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120
atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caatgtttcc 180
tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240
tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300
ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360
gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420
ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480
taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540
atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600
gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660
gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720
aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780
ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840
caccgcccta tcctgatgca cgattatgac tctaccccca tgtagtaa 888
<210> 13
<211> 738
<212> DNA
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 13
cgacgtaatc cgtagatgta cctggacatc caggtgatgc cggcggcggt ggtggaggcg 60
cgcggaaagt cgcggacgcg gttccagatg ttgcgcagcg gcaaaaagtg ctccatggtc 120
gggacgctct ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag 180
agcctgtaag cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg 240
gacgaccggg gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc 300
gcgtgtcgaa cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt 360
ccaggcgcgg cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg 420
ttaggctgga aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc 480
aagggttgag tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg 540
gggtttgcct ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag 600
cccctttttt gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag 660
cagcggcaag agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg 720
tcaggagggg caacatcc 738
<210> 14
<211> 735
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 15
<211> 598
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 15
Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
50 55 60
Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly
115 120 125
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
130 135 140
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
145 150 155 160
Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe
165 170 175
Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr
180 185 190
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
195 200 205
Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys
210 215 220
Leu Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
225 230 235 240
Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr
245 250 255
Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe
260 265 270
Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala
275 280 285
His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr
290 295 300
Leu Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln
305 310 315 320
Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln
325 330 335
Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser
340 345 350
Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala
355 360 365
Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro
370 375 380
Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser
385 390 395 400
Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp
405 410 415
Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn
420 425 430
Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg
435 440 445
Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu
450 455 460
Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile
465 470 475 480
Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu
485 490 495
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys
500 505 510
Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys
515 520 525
Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu
530 535 540
Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu
545 550 555 560
Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr
565 570 575
Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg
580 585 590
Tyr Leu Thr Arg Asn Leu
595
<210> 16
<211> 533
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 16
Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala
50 55 60
Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe
65 70 75 80
Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg
85 90 95
Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys
100 105 110
Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr
115 120 125
Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser
130 135 140
Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu
145 150 155 160
Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu
165 170 175
Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys
180 185 190
Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr
195 200 205
Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His
210 215 220
Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu
225 230 235 240
Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser
245 250 255
Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser
260 265 270
Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys
275 280 285
Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr
290 295 300
Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala
305 310 315 320
Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly
325 330 335
Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile
340 345 350
Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro
355 360 365
Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly
370 375 380
Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro
385 390 395 400
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
405 410 415
Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met
420 425 430
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn
435 440 445
Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe
450 455 460
Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile
465 470 475 480
Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
485 490 495
Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val
500 505 510
Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr
515 520 525
Leu Thr Arg Asn Leu
530
<210> 17
<211> 204
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 17
Leu Glu Thr Gln Thr Gln Tyr Leu Thr Pro Ser Leu Ser Asp Ser His
1 5 10 15
Gln Gln Pro Pro Leu Val Trp Glu Leu Ile Arg Trp Leu Gln Ala Val
20 25 30
Ala His Gln Trp Gln Thr Ile Thr Arg Ala Pro Thr Glu Trp Val Ile
35 40 45
Pro Arg Glu Ile Gly Ile Ala Ile Pro His Gly Trp Ala Thr Glu Ser
50 55 60
Ser Pro Pro Ala Pro Glu Pro Gly Pro Cys Pro Pro Thr Thr Thr Thr
65 70 75 80
Ser Thr Asn Lys Phe Pro Ala Asn Gln Glu Pro Arg Thr Thr Ile Thr
85 90 95
Thr Leu Ala Thr Ala Pro Leu Gly Gly Ile Leu Thr Ser Thr Asp Ser
100 105 110
Thr Ala Thr Phe His His Val Thr Gly Lys Asp Ser Ser Thr Thr Thr
115 120 125
Gly Asp Ser Asp Pro Arg Asp Ser Thr Ser Ser Ser Leu Thr Phe Lys
130 135 140
Ser Lys Arg Ser Arg Arg Met Thr Val Arg Arg Arg Leu Pro Ile Thr
145 150 155 160
Leu Pro Ala Arg Phe Arg Cys Leu Leu Thr Arg Ser Thr Ser Ser Arg
165 170 175
Thr Ser Ser Ala Arg Arg Ile Lys Asp Ala Ser Arg Arg Ser Gln Gln
180 185 190
Thr Ser Ser Trp Cys His Ser Met Asp Thr Ser Pro
195 200
<210> 18
<211> 19
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 18
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 19
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 20
<211> 454
<212> PRT
<213> Methanosarcina mazeii
<400> 20
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 21
<211> 454
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Phe
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 22
<211> 69
<212> DNA
<213> Methanosarcina mazeii
<400> 22
ggaaacctga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gggtttccg 69
<210> 23
<211> 372
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 23
agtcagtcac tagttgggca ggaagagggc ctatttccca tgattccttc atatttgcat 60
atacgataca aggctgttag agagataatt agaattaatt tgactgtaaa cacaaagata 120
ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc agttttaaaa 180
ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt cgatttcttg 240
gctttatata tcttgtggaa aggacgaaac accggaaacc tgatcatgta gatcgaacgg 300
actctaaatc cgttcagccg ggttagattc ccggggtttc cggacaagtg cggtttttcc 360
taggagtcag tc 372
<210> 24
<211> 1932
<212> DNA
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 24
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 25
<211> 1866
<212> DNA
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 25
ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300
aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acatggaact cgttggctgg ctggtggaca agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 26
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 26
ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300
aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acatggaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 27
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 27
ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300
aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acatggaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 28
<211> 1949
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 28
tgatctgcgc agccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc 60
ttgacgagca tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat 120
gggagttgcc gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg 180
tggccgagaa gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg 240
aggccctttt ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg 300
tggaaaccac cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa 360
aactgattca gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca 420
caaagaccag aaatggcgcc ggaggcggga acaaggtggt ggatgagtgc tacatcccca 480
attacttgct ccccaaaacc cagcctgagc tccagtgggc gtggactaat atggaacagt 540
atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc 600
acgtgtcgca gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg 660
tgatcagatc aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg 720
ggattacctc ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg 780
cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga 840
gcctgactaa aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca 900
gcaatcggat ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg 960
tctttctggg atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc 1020
ctgcaactac cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg 1080
ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga 1140
tctggtggga ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg 1200
gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc 1260
ccgtgatcgt cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct 1320
tcgaacacca gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg 1380
atcatgactt tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg 1440
atcacgtggt tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac 1500
ccgcccccag tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc 1560
catcgacgtc agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt 1620
ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc 1680
agaattcaaa tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt 1740
cagaatctca acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc 1800
atatcatggg aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg 1860
atgactgcat ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt 1920
ccagattggc tcgaggacac tctctctga 1949
<210> 29
<211> 1949
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
tgatctgcgc agccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc 60
ttgactagca tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat 120
gggagttgcc gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg 180
tggccgagaa gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg 240
aggccctttt ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg 300
tggaaaccac cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa 360
aactgattca gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca 420
caaagaccag aaatggcgcc ggaggcggga acaaggtggt ggatgagtgc tacatcccca 480
attacttgct ccccaaaacc cagcctgagc tccagtgggc gtggactaat atggaacagt 540
atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc 600
acgtgtcgca gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg 660
tgatcagatc aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg 720
ggattacctc ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg 780
cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga 840
gcctgactaa aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca 900
gcaatcggat ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg 960
tctttctggg atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc 1020
ctgcaactac cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg 1080
ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga 1140
tctggtggga ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg 1200
gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc 1260
ccgtgatcgt cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct 1320
tcgaacacca gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg 1380
atcatgactt tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg 1440
atcacgtggt tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac 1500
ccgcccccag tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc 1560
catcgacgtc agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt 1620
ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc 1680
agaattcaaa tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt 1740
cagaatctca acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc 1800
atatcatggg aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg 1860
atgactgcat ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt 1920
ccagattggc tcgaggacac tctctctga 1949
<210> 30
<211> 3648
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
gccgccacca tggaattagt gggctggttg gtcgataaag gcatcacaag cgaaaaacaa 60
tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120
cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180
gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240
ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300
aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360
aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420
gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480
atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540
gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600
acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660
caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720
acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780
cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840
atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900
gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960
ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020
acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080
gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140
gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200
tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740
accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800
atcgtgatca aggtgcccag cgacctggac gagcatctgc ctggcatcag cgacagcttc 1860
gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920
ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980
tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040
agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100
agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160
acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220
gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280
tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340
agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400
cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460
ctcgttggct ggctggtgga caagggcatc acaagcgaga agcagtggat ccaagaggac 2520
caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580
ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640
cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700
tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760
cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820
atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880
aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940
gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000
tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060
gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120
aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180
aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240
aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300
cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360
gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420
tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480
gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540
taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600
tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648
<210> 31
<211> 3648
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 31
gccgccacca tggaattagt gggctggttg gtctagaaag gcatcacaag cgaaaaacaa 60
tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120
cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180
gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240
ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300
aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360
aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420
gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480
atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540
gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600
acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660
caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720
acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780
cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840
atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900
gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960
ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020
acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080
gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140
gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200
tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740
accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800
atcgtgatca aggtgcccag cgacctggac gagcatctgc ctggcatcag cgacagcttc 1860
gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920
ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980
tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040
agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100
agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160
acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220
gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280
tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340
agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400
cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460
ctcgttggct ggctggtgta gaagggcatc acaagcgaga agcagtggat ccaagaggac 2520
caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580
ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640
cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700
tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760
cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820
atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880
aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940
gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000
tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060
gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120
aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180
aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240
aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300
cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360
gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420
tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480
gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540
taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600
tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648
<210> 32
<211> 3648
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 32
gccgccacca tggaattagt gggctggttg gtctagaaag gcatcacaag cgaaaaacaa 60
tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120
cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180
gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240
ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300
aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360
aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420
gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480
atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540
gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600
acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660
caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720
acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780
cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840
atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900
gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960
ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020
acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080
gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140
gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200
tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740
accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800
atcgtgatca aggtgcccag cgacctggac tagcatctgc ctggcatcag cgacagcttc 1860
gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920
ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980
tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040
agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100
agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160
acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220
gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280
tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340
agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400
cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460
ctcgttggct ggctggtgta gaagggcatc acaagcgaga agcagtggat ccaagaggac 2520
caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580
ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640
cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700
tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760
cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820
atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880
aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940
gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000
tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060
gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120
aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180
aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240
aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300
cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360
gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420
tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480
gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540
taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600
tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648
<210> 33
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 33
atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300
aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acggagaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 34
<211> 620
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Gly Glu Leu Val Gly Trp Leu Val Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 35
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 35
atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300
aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acggagaact cgttggctgg ctggtggaca agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 36
<211> 620
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys
20 25 30
Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu
35 40 45
Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr
50 55 60
Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Gly
210 215 220
Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 37
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 37
atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300
aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acggagaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 38
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys
20 25 30
Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu
35 40 45
Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr
50 55 60
Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Gly
210 215 220
Glu Leu Val Gly Trp Leu Val Lys Gly Ile Thr Ser Glu Lys Gln Trp
225 230 235 240
Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn
245 250 255
Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met
260 265 270
Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val
275 280 285
Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly
290 295 300
Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys
305 310 315 320
Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr
325 330 335
Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr
340 345 350
Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val
355 360 365
Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val
370 375 380
Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp
385 390 395 400
Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val
405 410 415
Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr
420 425 430
Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu
435 440 445
Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val
450 455 460
Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu His
465 470 475 480
Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser
485 490 495
Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln
500 505 510
Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr
515 520 525
Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro
530 535 540
Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr
545 550 555 560
His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln
565 570 575
Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His
580 585 590
His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val
595 600 605
Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615
<210> 39
<211> 528
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 39
Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly
1 5 10 15
Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro
20 25 30
Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg
35 40 45
Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu
50 55 60
Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu
65 70 75 80
Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu
85 90 95
Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu
100 105 110
Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile
115 120 125
Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp
130 135 140
Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser
145 150 155 160
Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro
165 170 175
Ile Val Ser Ala Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met Asp
180 185 190
Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu Pro
195 200 205
Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn Glu
210 215 220
Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe Val
225 230 235 240
Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala Glu
245 250 255
Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu His
260 265 270
Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser Ile
275 280 285
Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu Asn
290 295 300
Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val Lys
305 310 315 320
Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala Arg
325 330 335
Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly Lys
340 345 350
Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala Phe
355 360 365
Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln Thr
370 375 380
Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser Lys
385 390 395 400
Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr Pro
405 410 415
Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser Asp
420 425 430
Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe Gln
435 440 445
Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly Pro
450 455 460
Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu Val
465 470 475 480
Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg Met
485 490 495
Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn Val
500 505 510
Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp Phe
515 520 525
<210> 40
<211> 528
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly
1 5 10 15
Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro
20 25 30
Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg
35 40 45
Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu
50 55 60
Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu
65 70 75 80
Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu
85 90 95
Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu
100 105 110
Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile
115 120 125
Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp
130 135 140
Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser
145 150 155 160
Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro
165 170 175
Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met
180 185 190
Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu
195 200 205
Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn
210 215 220
Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe
225 230 235 240
Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala
245 250 255
Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu
260 265 270
His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser
275 280 285
Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu
290 295 300
Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val
305 310 315 320
Lys Asn Arg Gly Arg Asn Val Val Val Ile Ser Asn Thr Asp Ala Arg
325 330 335
Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly Lys
340 345 350
Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala Phe
355 360 365
Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln Thr
370 375 380
Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser Lys
385 390 395 400
Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr Pro
405 410 415
Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser Asp
420 425 430
Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe Gln
435 440 445
Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly Pro
450 455 460
Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu Val
465 470 475 480
Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg Met
485 490 495
Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn Val
500 505 510
Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp Phe
515 520 525
<210> 41
<211> 293
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 41
Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg
1 5 10 15
Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro
20 25 30
Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu
35 40 45
Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly
50 55 60
Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Val Val Pro Trp
65 70 75 80
Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys Met
85 90 95
His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met Met
100 105 110
Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser Pro
115 120 125
Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp Phe
130 135 140
Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp Tyr
145 150 155 160
Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met Ser
165 170 175
Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Trp Tyr
180 185 190
Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr Ser
195 200 205
Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys Ser
210 215 220
Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg Arg
225 230 235 240
Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu Thr
245 250 255
Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln Phe
260 265 270
Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp Tyr
275 280 285
Asp Ser Thr Pro Met
290
<210> 42
<211> 293
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg
1 5 10 15
Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro
20 25 30
Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu
35 40 45
Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly
50 55 60
Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Trp Val Val Pro
65 70 75 80
Trp Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys
85 90 95
Met His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met
100 105 110
Met Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser
115 120 125
Pro Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp
130 135 140
Phe Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp
145 150 155 160
Tyr Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met
165 170 175
Ser Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Tyr
180 185 190
Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr Ser
195 200 205
Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys Ser
210 215 220
Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg Arg
225 230 235 240
Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu Thr
245 250 255
Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln Phe
260 265 270
Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp Tyr
275 280 285
Asp Ser Thr Pro Met
290
<210> 43
<211> 396
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 43
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
35 40 45
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
50 55 60
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
65 70 75 80
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
305 310 315 320
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
325 330 335
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
340 345 350
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
355 360 365
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
370 375 380
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 44
<211> 311
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
35 40 45
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
50 55 60
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
65 70 75 80
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Leu Ala Arg Gly His Ser Leu
305 310
<210> 45
<211> 620
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 45
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 46
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 46
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Leu Ala Arg Gly His Ser Leu
530 535
<210> 47
<211> 396
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
305 310 315 320
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
325 330 335
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
340 345 350
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
355 360 365
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
370 375 380
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 48
<211> 311
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 48
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Leu Ala Arg Gly His Ser Leu
305 310
<210> 49
<211> 620
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 49
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 50
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 50
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Leu Ala Arg Gly His Ser Leu
530 535
<210> 51
<211> 620
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 51
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met
210 215 220
Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 52
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 52
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met
210 215 220
Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Leu Ala Arg Gly His Ser Leu
530 535
<210> 53
<211> 1932
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 53
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
agctaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 54
<211> 1932
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 54
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggataggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 55
<211> 1932
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggagta gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 56
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 56
tgcgtaggag aagggcatgg 20
<210> 57
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
ccggtagggc cgaaatgtgg 20
<210> 58
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
atgagttgtt ccctgggata 20
<210> 59
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
cttgtagtat gatggccacg 20
<210> 60
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
cgtgtagcag caatgcctgg 20
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
actgaggatt ccgacccaag 20
<210> 62
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
gccttatgtg ttgacatctg 20
<210> 63
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 63
ggagtagcgc cgtgtgagta 20
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
gatttagctc cgcgagttgg 20
<210> 65
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
ggataggcca cgaaaaagtt 20
<210> 66
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 66
cttctcccac gcagacacga tcggcaggct 30
<210> 67
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 67
tcggccccac cggttcttca cgatcttggc 30
<210> 68
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 68
gaacaaccca ttcctgaatc agcgtaaatc 30
<210> 69
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 69
atcataccac aagcgcaggt agattaagtg 30
<210> 70
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 70
ttgctgccac acgcccatgg ccgtttgcca 30
<210> 71
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 71
ggaatcccca gttgttgttg atgagtcttt 30
<210> 72
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 72
acggcgccac tccgtcagaa agtcgcgctg 30
<210> 73
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 73
cgtggcccat cccagaaaga cggaagccgc 30
<210> 74
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 74
ctccatgccc ttctcccacg cagacacgat cggcaggctc agcgggttta 50
<210> 75
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 75
caccacattt cggccccacc ggttcttcac gatcttggcc ttgctagact 50
<210> 76
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 76
tatcccaggg aacaacccat tcctgaatca gcgtaaatcc cacactgcag 50
<210> 77
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 77
cacgtggcca tcataccaca agcgcaggta gattaagtgg cgacccctca 50
<210> 78
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 78
ctccaggcat tgctgccaca cgcccatggc cgtttgccag gtgtagcaca 50
<210> 79
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 79
tcttgggtcg gaatccccag ttgttgttga tgagtctttg ccagtcacgt 50
<210> 80
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 80
cttactcaca cggcgccact ccgtcagaaa gtcgcgctgc agcttctcgg 50
<210> 81
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 81
gaactttttc gtggcccatc ccagaaagac ggaagccgca tattggggat 50
<210> 82
<211> 1775
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 82
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg
1760 1765 1770
Lys Val
1775
<210> 83
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 83
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Trp Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1520 1525 1530
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 84
<211> 1495
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 84
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Leu Thr Asn Ala Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn
145 150 155 160
Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr
165 170 175
Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val
180 185 190
Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu
290 295 300
Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys
485 490 495
Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu
500 505 510
Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn
690 695 700
Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg
785 790 795 800
Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr
930 935 940
Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu
1010 1015 1020
Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn
1025 1030 1035
Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp Ala Asn Asn Tyr Pro Asp Lys Gly Val Val Glu
1055 1060 1065
Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys Gly Ser Leu Gln Leu Pro Pro Leu
1085 1090 1095
Glu Arg Leu Thr Leu Gly Ser Gly Gly Gly Gly Ser Gln Leu His
1100 1105 1110
Leu Pro Gln Val Leu Ala Asp Ala Val Ser Arg Leu Val Leu Gly
1115 1120 1125
Lys Phe Gly Asp Leu Thr Asp Asn Phe Ser Ser Pro His Ala Arg
1130 1135 1140
Arg Lys Val Leu Ala Gly Val Val Met Thr Thr Gly Thr Asp Val
1145 1150 1155
Lys Asp Ala Lys Val Ile Ser Val Ser Thr Gly Thr Lys Cys Ile
1160 1165 1170
Asn Gly Glu Tyr Met Ser Asp Arg Gly Leu Ala Leu Asn Asp Cys
1175 1180 1185
His Ala Glu Ile Ile Ser Arg Arg Ser Leu Leu Arg Phe Leu Tyr
1190 1195 1200
Thr Gln Leu Glu Leu Tyr Leu Asn Asn Lys Asp Asp Gln Lys Arg
1205 1210 1215
Ser Ile Phe Gln Lys Ser Glu Arg Gly Gly Phe Arg Leu Lys Glu
1220 1225 1230
Asn Val Gln Phe His Leu Tyr Ile Ser Thr Ser Pro Cys Gly Asp
1235 1240 1245
Ala Arg Ile Phe Ser Pro His Glu Pro Ile Leu Glu Glu Pro Ala
1250 1255 1260
Asp Arg His Pro Asn Arg Lys Ala Arg Gly Gln Leu Arg Thr Lys
1265 1270 1275
Ile Glu Ser Gly Gln Gly Thr Ile Pro Val Arg Ser Asn Ala Ser
1280 1285 1290
Ile Gln Thr Trp Asp Gly Val Leu Gln Gly Glu Arg Leu Leu Thr
1295 1300 1305
Met Ser Cys Ser Asp Lys Ile Ala Arg Trp Asn Val Val Gly Ile
1310 1315 1320
Gln Gly Ser Leu Leu Ser Ile Phe Val Glu Pro Ile Tyr Phe Ser
1325 1330 1335
Ser Ile Ile Leu Gly Ser Leu Tyr His Gly Asp His Leu Ser Arg
1340 1345 1350
Ala Met Tyr Gln Arg Ile Ser Asn Ile Glu Asp Leu Pro Pro Leu
1355 1360 1365
Tyr Thr Leu Asn Lys Pro Leu Leu Ser Gly Ile Ser Asn Ala Glu
1370 1375 1380
Ala Arg Gln Pro Gly Lys Ala Pro Asn Phe Ser Val Asn Trp Thr
1385 1390 1395
Val Gly Asp Ser Ala Ile Glu Val Ile Asn Ala Thr Thr Gly Lys
1400 1405 1410
Asp Glu Leu Gly Arg Ala Ser Arg Leu Cys Lys His Ala Leu Tyr
1415 1420 1425
Cys Arg Trp Met Arg Val His Gly Lys Val Pro Ser His Leu Leu
1430 1435 1440
Arg Ser Lys Ile Thr Lys Pro Asn Val Tyr His Glu Ser Lys Leu
1445 1450 1455
Ala Ala Lys Glu Tyr Gln Ala Ala Lys Ala Arg Leu Phe Thr Ala
1460 1465 1470
Phe Ile Lys Ala Gly Leu Gly Ala Trp Val Glu Lys Pro Thr Glu
1475 1480 1485
Gln Asp Gln Phe Ser Leu Thr
1490 1495
<210> 85
<211> 1495
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 85
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Leu Thr Asn Ala Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn
145 150 155 160
Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr
165 170 175
Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val
180 185 190
Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu
290 295 300
Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys
485 490 495
Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu
500 505 510
Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn
690 695 700
Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg
785 790 795 800
Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr
930 935 940
Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu
1010 1015 1020
Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn
1025 1030 1035
Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp Ala Asn Asn Tyr Pro Asp Lys Gly Val Val Glu
1055 1060 1065
Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys Gly Ser Leu Gln Leu Pro Pro Leu
1085 1090 1095
Glu Arg Leu Thr Leu Gly Ser Gly Gly Gly Gly Ser Gln Leu His
1100 1105 1110
Leu Pro Gln Val Leu Ala Asp Ala Val Ser Arg Leu Val Leu Gly
1115 1120 1125
Lys Phe Gly Asp Leu Thr Asp Asn Phe Ser Ser Pro His Ala Arg
1130 1135 1140
Arg Lys Val Leu Ala Gly Val Val Met Thr Thr Gly Thr Asp Val
1145 1150 1155
Lys Asp Ala Lys Val Ile Ser Val Ser Thr Gly Gly Lys Cys Ile
1160 1165 1170
Asn Gly Glu Tyr Met Ser Asp Arg Gly Leu Ala Leu Asn Asp Cys
1175 1180 1185
His Ala Glu Ile Ile Ser Arg Arg Ser Leu Leu Arg Phe Leu Tyr
1190 1195 1200
Thr Gln Leu Glu Leu Tyr Leu Asn Asn Lys Asp Asp Gln Lys Arg
1205 1210 1215
Ser Ile Phe Gln Lys Ser Glu Arg Gly Gly Phe Arg Leu Lys Glu
1220 1225 1230
Asn Val Gln Phe His Leu Tyr Ile Ser Thr Ser Pro Cys Gly Asp
1235 1240 1245
Ala Arg Ile Phe Ser Pro His Glu Pro Ile Leu Glu Glu Pro Ala
1250 1255 1260
Asp Arg His Pro Asn Arg Lys Ala Arg Gly Gln Leu Arg Thr Lys
1265 1270 1275
Ile Glu Ser Gly Gln Gly Thr Ile Pro Val Arg Ser Asn Ala Ser
1280 1285 1290
Ile Gln Thr Trp Asp Gly Val Leu Gln Gly Glu Arg Leu Leu Thr
1295 1300 1305
Met Ser Cys Ser Asp Lys Ile Ala Arg Trp Asn Val Val Gly Ile
1310 1315 1320
Gln Gly Ser Leu Leu Ser Ile Phe Val Glu Pro Ile Tyr Phe Ser
1325 1330 1335
Ser Ile Ile Leu Gly Ser Leu Tyr His Gly Asp His Leu Ser Arg
1340 1345 1350
Ala Met Tyr Gln Arg Ile Ser Asn Ile Glu Asp Leu Pro Pro Leu
1355 1360 1365
Tyr Thr Leu Asn Lys Pro Leu Leu Ser Gly Ile Ser Asn Ala Glu
1370 1375 1380
Ala Arg Gln Pro Gly Lys Ala Pro Asn Phe Ser Val Asn Trp Thr
1385 1390 1395
Val Gly Asp Ser Ala Ile Glu Val Ile Asn Ala Thr Thr Gly Lys
1400 1405 1410
Asp Glu Leu Gly Arg Ala Ser Arg Leu Cys Lys His Ala Leu Tyr
1415 1420 1425
Cys Arg Trp Met Arg Val His Gly Lys Val Pro Ser His Leu Leu
1430 1435 1440
Arg Ser Lys Ile Thr Lys Pro Asn Val Tyr His Glu Ser Lys Leu
1445 1450 1455
Ala Ala Lys Glu Tyr Gln Ala Ala Lys Ala Arg Leu Phe Thr Ala
1460 1465 1470
Phe Ile Lys Ala Gly Leu Gly Ala Trp Val Glu Lys Pro Thr Glu
1475 1480 1485
Gln Asp Gln Phe Ser Leu Thr
1490 1495
<210> 86
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 86
attggatcca at 12
<210> 87
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 87
tatttacaaa caaccatgaa tgtaagta 28
<210> 88
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 88
cggagtactg tcctccga 18
<210> 89
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 89
atgatacgaa acgtaccgta tcgttaaggt 30
<210> 90
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 90
agaaacaaac caacctgtct gtatta 26
<210> 91
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 91
aacaaacaga caatctggtc tgtttgta 28
<210> 92
<211> 248
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 92
Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu
1 5 10 15
Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln
20 25 30
Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys
35 40 45
Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His His
50 55 60
Thr His Phe Cys Pro Leu Glu Gly Glu Ser Trp Gln Asp Phe Leu Arg
65 70 75 80
Asn Asn Ala Lys Ser Phe Arg Cys Ala Leu Leu Ser His Arg Asp Gly
85 90 95
Ala Lys Val His Leu Gly Thr Arg Pro Thr Glu Lys Gln Tyr Glu Thr
100 105 110
Leu Glu Asn Gln Leu Ala Phe Leu Cys Gln Gln Gly Phe Ser Leu Glu
115 120 125
Asn Ala Leu Tyr Ala Leu Ser Ala Val Gly His Phe Thr Leu Gly Cys
130 135 140
Val Leu Glu Asp Gln Glu His Gln Val Ala Lys Glu Glu Arg Glu Thr
145 150 155 160
Pro Thr Thr Asp Ser Met Pro Pro Leu Leu Arg Gln Ala Ile Glu Leu
165 170 175
Phe Asp His Gln Gly Ala Glu Pro Ala Phe Leu Phe Gly Leu Glu Leu
180 185 190
Ile Ile Cys Gly Leu Glu Lys Gln Leu Lys Cys Glu Ser Gly Gly Pro
195 200 205
Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Pro Gly
245
<210> 93
<211> 298
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 93
Met Asp Met Pro Arg Ile Lys Pro Gly Gln Arg Val Met Met Ala Leu
1 5 10 15
Arg Lys Met Ile Ala Ser Gly Glu Ile Lys Ser Gly Glu Arg Ile Ala
20 25 30
Glu Ile Pro Thr Ala Ala Ala Leu Gly Val Ser Arg Met Pro Val Arg
35 40 45
Ile Ala Leu Arg Ser Leu Glu Gln Glu Gly Leu Val Val Arg Leu Gly
50 55 60
Ala Arg Gly Tyr Ala Ala Arg Gly Val Ser Ser Asp Gln Ile Arg Asp
65 70 75 80
Ala Ile Glu Val Arg Gly Val Leu Glu Gly Phe Ala Ala Arg Arg Leu
85 90 95
Ala Glu Arg Gly Met Thr Ala Glu Thr His Ala Arg Phe Val Val Leu
100 105 110
Ile Ala Glu Gly Glu Ala Leu Phe Ala Ala Gly Arg Leu Asn Gly Glu
115 120 125
Asp Leu Asp Arg Tyr Ala Ala Tyr Asn Gln Ala Phe His Asp Thr Leu
130 135 140
Val Ser Ala Ala Gly Asn Gly Ala Val Glu Ser Ala Leu Ala Arg Asn
145 150 155 160
Gly Phe Glu Pro Phe Ala Ala Ala Gly Ala Leu Ala Leu Asp Leu Met
165 170 175
Asp Leu Ser Ala Glu Tyr Glu His Leu Leu Ala Ala His Arg Gln His
180 185 190
Gln Ala Val Leu Asp Ala Val Ser Cys Gly Asp Ala Glu Gly Ala Glu
195 200 205
Arg Ile Met Arg Asp His Ala Leu Ala Ala Ile Arg Asn Ala Lys Val
210 215 220
Phe Glu Ala Ala Ala Ser Ala Gly Ala Pro Leu Gly Ala Ala Trp Ser
225 230 235 240
Ile Arg Ala Asp Ser Gly Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp
245 250 255
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
260 265 270
Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
275 280 285
Pro Gly Pro Pro Lys Lys Lys Arg Lys Val
290 295
<210> 94
<211> 264
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 94
Met Val Arg Arg Thr Lys Glu Glu Ala Gln Glu Thr Arg Ala Gln Ile
1 5 10 15
Ile Glu Ala Ala Glu Arg Ala Phe Tyr Lys Arg Gly Val Ala Arg Thr
20 25 30
Thr Leu Ala Asp Ile Ala Glu Leu Ala Gly Val Thr Arg Gly Ala Ile
35 40 45
Tyr Trp His Phe Asn Asn Lys Ala Glu Leu Val Gln Ala Leu Leu Asp
50 55 60
Ser Leu His Glu Thr His Asp His Leu Ala Arg Ala Ser Glu Ser Glu
65 70 75 80
Asp Glu Val Asp Pro Leu Gly Cys Met Arg Lys Leu Leu Leu Gln Val
85 90 95
Phe Asn Glu Leu Val Leu Asp Ala Arg Thr Arg Arg Ile Asn Glu Ile
100 105 110
Leu His His Lys Cys Glu Phe Thr Asp Asp Met Cys Glu Ile Arg Gln
115 120 125
Gln His Gln Ser Ala Val Leu Asp Cys His Lys Gly Ile Thr Leu Thr
130 135 140
Leu Ala Asn Val Val Arg Arg Gly Gln Leu Pro Gly Glu Leu Asp Ala
145 150 155 160
Glu Arg Ala Ala Val Ala Met Phe Ala Tyr Val Asp Gly Leu Ile Arg
165 170 175
Arg Trp Leu Leu Leu Pro Asp Ser Val Asp Leu Leu Gly Asp Val Glu
180 185 190
Lys Trp Val Asp Thr Gly Leu Asp Met Leu Arg Leu Ser Pro Ala Leu
195 200 205
Arg Lys Ser Gly Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp Phe Asp
210 215 220
Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
225 230 235 240
Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Gly
245 250 255
Pro Pro Lys Lys Lys Arg Lys Val
260
<210> 95
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 95
Met Ala Arg Thr Pro Ser Arg Ser Ser Ile Gly Ser Leu Arg Ser Pro
1 5 10 15
His Thr His Lys Ala Ile Leu Thr Ser Thr Ile Glu Ile Leu Lys Glu
20 25 30
Cys Gly Tyr Ser Gly Leu Ser Ile Glu Ser Val Ala Arg Arg Ala Gly
35 40 45
Ala Gly Lys Pro Thr Ile Tyr Arg Trp Trp Thr Asn Lys Ala Ala Leu
50 55 60
Ile Ala Glu Val Tyr Glu Asn Glu Ile Glu Gln Val Arg Lys Phe Pro
65 70 75 80
Asp Leu Gly Ser Phe Lys Ala Asp Leu Asp Phe Leu Leu His Asn Leu
85 90 95
Trp Lys Val Trp Arg Glu Thr Ile Cys Gly Glu Ala Phe Arg Cys Val
100 105 110
Ile Ala Glu Ala Gln Leu Asp Pro Val Thr Leu Thr Gln Leu Lys Asp
115 120 125
Gln Phe Met Glu Arg Arg Arg Glu Ile Pro Lys Lys Leu Val Glu Asp
130 135 140
Ala Ile Ser Asn Gly Glu Leu Pro Lys Asp Ile Asn Arg Glu Leu Leu
145 150 155 160
Leu Asp Met Ile Phe Gly Phe Cys Trp Tyr Arg Leu Leu Thr Glu Gln
165 170 175
Leu Thr Val Glu Gln Asp Ile Glu Glu Phe Thr Phe Leu Leu Ile Asn
180 185 190
Gly Val Cys Pro Gly Thr Gln Cys Ser Gly Gly Gly Gly Pro Thr Asp
195 200 205
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
210 215 220
Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp
225 230 235 240
Leu Asp Met Leu Pro Gly Pro Pro Lys Lys Lys Arg Lys Val
245 250
<210> 96
<211> 257
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 96
Met Ser Pro Lys Arg Arg Thr Gln Ala Glu Arg Ala Met Glu Thr Gln
1 5 10 15
Gly Lys Leu Ile Ala Ala Ala Leu Gly Val Leu Arg Glu Lys Gly Tyr
20 25 30
Ala Gly Phe Arg Ile Ala Asp Val Pro Gly Ala Ala Gly Val Ser Arg
35 40 45
Gly Ala Gln Ser His His Phe Pro Thr Lys Leu Glu Leu Leu Leu Ala
50 55 60
Thr Phe Glu Trp Leu Tyr Glu Gln Ile Thr Glu Arg Ser Arg Ala Arg
65 70 75 80
Leu Ala Lys Leu Lys Pro Glu Asp Asp Val Ile Gln Gln Met Leu Asp
85 90 95
Asp Ala Ala Glu Phe Phe Leu Asp Asp Asp Phe Ser Ile Gly Leu Asp
100 105 110
Leu Ile Val Ala Ala Asp Arg Asp Pro Ala Leu Arg Glu Gly Ile Gln
115 120 125
Arg Thr Val Glu Arg Asn Arg Phe Val Val Glu Asp Met Trp Leu Gly
130 135 140
Val Leu Val Ser Arg Gly Leu Ser Arg Asp Asp Ala Glu Asp Ile Leu
145 150 155 160
Trp Leu Ile Phe Asn Ser Val Arg Gly Leu Val Val Arg Ser Leu Trp
165 170 175
Gln Lys Asp Lys Glu Arg Phe Glu Arg Val Arg Asn Ser Thr Leu Glu
180 185 190
Ile Ala Arg Glu Arg Tyr Ala Lys Phe Lys Arg Ser Gly Gly Gly Gly
195 200 205
Pro Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
210 215 220
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
225 230 235 240
Asp Phe Asp Leu Asp Met Leu Pro Gly Pro Pro Lys Lys Lys Arg Lys
245 250 255
Val
<210> 97
<211> 641
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 97
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln Met Ile Ile
610 615 620
Arg Tyr Gly Cys Arg Trp Leu Ser Ser Arg Leu Ala Arg Gly His Ser
625 630 635 640
Leu
<210> 98
<211> 804
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 98
Met Glu Ser Val Glu Lys Glu Asp Ser Leu Thr Ala Pro Phe Glu Phe
1 5 10 15
Ala Thr Thr Ala Ser Thr Asp Ala Ala Asn Ala Pro Thr Thr Phe Pro
20 25 30
Val Glu Ala Pro Pro Leu Glu Glu Glu Glu Val Ile Ile Glu Gln Asp
35 40 45
Pro Gly Phe Val Ser Glu Asp Asp Glu Asp Arg Ser Val Pro Thr Glu
50 55 60
Asp Lys Lys Gln Asp Gln Asp Asp Ala Glu Ala Asn Glu Glu Gln Val
65 70 75 80
Gly Arg Gly Asp Gln Arg His Gly Asp Tyr Leu Asp Val Gly Asp Asp
85 90 95
Val Leu Leu Lys His Leu Gln Arg Gln Cys Ala Ile Ile Cys Asp Ala
100 105 110
Leu Gln Glu Arg Ser Asp Val Pro Leu Ala Ile Ala Asp Val Ser Leu
115 120 125
Ala Tyr Glu Arg His Leu Phe Ser Pro Arg Val Pro Pro Lys Arg Gln
130 135 140
Glu Asn Gly Thr Cys Glu Pro Asn Pro Arg Leu Asn Phe Tyr Pro Val
145 150 155 160
Phe Ala Val Pro Glu Val Leu Ala Thr Tyr His Ile Phe Phe Gln Asn
165 170 175
Cys Lys Ile Pro Leu Ser Cys Arg Ala Asn Arg Ser Arg Ala Asp Lys
180 185 190
Gln Leu Ala Leu Arg Gln Gly Ala Val Ile Pro Asp Ile Ala Ser Leu
195 200 205
Asp Glu Val Pro Lys Ile Phe Glu Gly Leu Gly Arg Asp Glu Lys Arg
210 215 220
Ala Ala Asn Ala Leu Gln Gln Glu Asn Ser Glu Asn Glu Ser His Cys
225 230 235 240
Gly Val Leu Val Glu Leu Glu Gly Asp Asn Ala Arg Leu Ala Val Leu
245 250 255
Lys Arg Ser Ile Glu Val Thr His Phe Ala Tyr Pro Ala Leu Asn Leu
260 265 270
Pro Pro Lys Val Met Ser Thr Val Met Ser Glu Leu Ile Val Arg Arg
275 280 285
Ala Arg Pro Leu Glu Arg Asp Ala Asn Leu Gln Glu Gln Thr Glu Glu
290 295 300
Gly Leu Pro Ala Val Gly Asp Glu Gln Leu Ala Arg Trp Leu Glu Thr
305 310 315 320
Arg Glu Pro Ala Asp Leu Glu Glu Arg Arg Lys Leu Met Met Ala Ala
325 330 335
Val Leu Val Thr Val Glu Leu Glu Cys Met Gln Arg Phe Phe Ala Asp
340 345 350
Pro Glu Met Gln Arg Lys Leu Glu Glu Thr Leu His Tyr Thr Phe Arg
355 360 365
Gln Gly Tyr Val Arg Gln Ala Cys Lys Ile Ser Asn Val Glu Leu Cys
370 375 380
Asn Leu Val Ser Tyr Leu Gly Ile Leu His Glu Asn Arg Leu Gly Gln
385 390 395 400
Asn Val Leu His Ser Thr Leu Lys Gly Glu Ala Arg Arg Asp Tyr Val
405 410 415
Arg Asp Cys Val Tyr Leu Phe Leu Cys Tyr Thr Trp Gln Thr Ala Met
420 425 430
Gly Val Gln Gln Cys Leu Glu Glu Arg Asn Leu Lys Glu Leu Gln Lys
435 440 445
Leu Leu Lys Gln Asn Leu Lys Asp Leu Trp Thr Ala Phe Asn Glu Arg
450 455 460
Ser Val Ala Ala His Leu Ala Asp Ile Ile Phe Pro Glu Arg Leu Leu
465 470 475 480
Lys Thr Leu Gln Gln Gly Leu Pro Asp Phe Thr Ser Gln Ser Met Leu
485 490 495
Gln Asn Phe Arg Asn Phe Ile Leu Glu Arg Ser Gly Ile Leu Pro Ala
500 505 510
Thr Cys Cys Ala Leu Pro Ser Asp Phe Val Pro Ile Lys Tyr Arg Glu
515 520 525
Cys Pro Pro Pro Leu Trp Gly His Cys Tyr Leu Leu Gln Leu Ala Asn
530 535 540
Tyr Leu Ala Tyr His Ser Asp Ile Met Glu Asp Val Ser Gly Asp Gly
545 550 555 560
Leu Leu Glu Cys His Cys Arg Cys Asn Leu Cys Thr Pro His Arg Ser
565 570 575
Leu Val Cys Asn Ser Gln Leu Leu Ser Glu Ser Gln Ile Ile Gly Thr
580 585 590
Phe Glu Leu Gln Gly Pro Ser Pro Asp Glu Lys Ser Ala Ala Pro Gly
595 600 605
Leu Lys Leu Thr Pro Gly Leu Trp Thr Ser Ala Tyr Leu Arg Lys Phe
610 615 620
Val Pro Glu Asp Tyr His Ala His Glu Ile Arg Phe Tyr Glu Asp Gln
625 630 635 640
Ser Arg Pro Pro Asn Ala Glu Leu Thr Ala Cys Val Ile Thr Gln Gly
645 650 655
His Ile Leu Gly Gln Leu Gln Ala Ile Asn Lys Ala Arg Gln Glu Phe
660 665 670
Leu Leu Arg Lys Gly Arg Gly Val Tyr Leu Asp Pro Gln Ser Gly Glu
675 680 685
Glu Leu Asn Pro Ile Pro Pro Pro Pro Gln Pro Tyr Gln Gln Pro Arg
690 695 700
Ala Leu Ala Ser Gln Asp Gly Thr Gln Lys Glu Ala Ala Ala Ala Ala
705 710 715 720
Ala Ala Thr His Gly Arg Gly Gly Ile Leu Gly Gln Ser Gly Arg Gly
725 730 735
Gly Phe Gly Arg Gly Gly Gly Asp Asp Gly Arg Leu Gly Gln Pro Arg
740 745 750
Arg Ser Phe Arg Gly Arg Arg Gly Val Arg Arg Asn Thr Val Thr Leu
755 760 765
Gly Arg Ile Pro Leu Ala Gly Ala Pro Glu Ile Gly Asn Arg Ser Gln
770 775 780
His Arg Tyr Asn Leu Arg Ser Ser Gly Ala Ala Gly Thr Ala Cys Ser
785 790 795 800
Pro Thr Gln Pro
<210> 99
<211> 734
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 99
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Gly
290 295 300
Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys
305 310 315 320
Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu Thr
325 330 335
Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val
340 345 350
Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val
355 360 365
Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln
370 375 380
Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
385 390 395 400
Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu Asp
405 410 415
Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu
420 425 430
Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr Asn
435 440 445
Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln Ala
450 455 460
Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly Pro
465 470 475 480
Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn
485 490 495
Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg
500 505 510
Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp
515 520 525
Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys Gln
530 535 540
Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr Asp
545 550 555 560
Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly
565 570 575
Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr Ala
580 585 590
Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg
595 600 605
Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu
675 680 685
Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn
690 695 700
Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser
705 710 715 720
Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730
<210> 100
<211> 597
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 100
Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
50 55 60
Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly
115 120 125
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
130 135 140
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
145 150 155 160
Arg Leu Ile Asn Asn Asn Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys
165 170 175
Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr
180 185 190
Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser
195 200 205
Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu
210 215 220
Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu
225 230 235 240
Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys
245 250 255
Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr
260 265 270
Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His
275 280 285
Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu
290 295 300
Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser
305 310 315 320
Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser
325 330 335
Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys
340 345 350
Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr
355 360 365
Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala
370 375 380
Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly
385 390 395 400
Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile
405 410 415
Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro
420 425 430
Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly
435 440 445
Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro
450 455 460
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
465 470 475 480
Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met
485 490 495
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn
500 505 510
Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe
515 520 525
Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile
530 535 540
Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
545 550 555 560
Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val
565 570 575
Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr
580 585 590
Leu Thr Arg Asn Leu
595
<210> 101
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 101
Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala
50 55 60
Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe
65 70 75 80
Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg
85 90 95
Leu Ile Asn Asn Asn Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu
100 105 110
Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr
115 120 125
Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu
130 135 140
Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro
145 150 155 160
Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr
165 170 175
Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu
180 185 190
Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe
195 200 205
Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser
210 215 220
Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr
225 230 235 240
Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg
245 250 255
Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg
260 265 270
Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr
275 280 285
Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys
290 295 300
Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met
305 310 315 320
Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val
325 330 335
Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu
340 345 350
Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val
355 360 365
Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn
370 375 380
Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly
385 390 395 400
Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala
405 410 415
Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly
420 425 430
Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr
435 440 445
Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala
450 455 460
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu
465 470 475 480
Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
485 490 495
Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp
500 505 510
Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
515 520 525
Thr Arg Asn Leu
530
<210> 102
<211> 734
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 102
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg
595 600 605
Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu
675 680 685
Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn
690 695 700
Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser
705 710 715 720
Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730
<210> 103
<211> 597
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 103
Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
50 55 60
Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly
115 120 125
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
130 135 140
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
145 150 155 160
Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe
165 170 175
Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr
180 185 190
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
195 200 205
Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys
210 215 220
Leu Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
225 230 235 240
Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr
245 250 255
Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe
260 265 270
Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala
275 280 285
His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr
290 295 300
Leu Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln
305 310 315 320
Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln
325 330 335
Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser
340 345 350
Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala
355 360 365
Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro
370 375 380
Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser
385 390 395 400
Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp
405 410 415
Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn
420 425 430
Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg
435 440 445
Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gly Val Leu Pro
450 455 460
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
465 470 475 480
Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met
485 490 495
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn
500 505 510
Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe
515 520 525
Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile
530 535 540
Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
545 550 555 560
Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val
565 570 575
Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr
580 585 590
Leu Thr Arg Asn Leu
595
<210> 104
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 104
Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala
50 55 60
Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe
65 70 75 80
Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg
85 90 95
Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys
100 105 110
Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr
115 120 125
Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser
130 135 140
Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu
145 150 155 160
Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu
165 170 175
Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys
180 185 190
Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr
195 200 205
Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His
210 215 220
Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu
225 230 235 240
Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser
245 250 255
Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser
260 265 270
Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys
275 280 285
Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr
290 295 300
Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala
305 310 315 320
Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly
325 330 335
Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile
340 345 350
Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro
355 360 365
Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly
370 375 380
Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gly Val Leu Pro Gly
385 390 395 400
Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala
405 410 415
Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly
420 425 430
Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr
435 440 445
Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala
450 455 460
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu
465 470 475 480
Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
485 490 495
Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp
500 505 510
Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
515 520 525
Thr Arg Asn Leu
530
<210> 105
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 105
atggccagtc gggaagagga gcagcgcgaa accacccccg agcgcggacg cggtgcggcg 60
cgacgtccac caaccatgga ggacgtgtcg tccccgtcgc cgtcgccgcc gcctccccgc 120
gcgcccccaa aaaagcggct gaggcggcgt ctcgagtccg aggacgaaga agactcgtca 180
caagatgcgc tggtgccgcg cacacccagc ccgcggccat cgacctcgac ggcggatttg 240
gccattgcgt ccaaaaagaa aaagaagcgc ccctctccca agcccgagcg cccgccatcc 300
ccagaggtga tcgtggacag cgaggaagaa agagaagatg tggcgctaca aatggtgggt 360
ttcagcaacc caccggtgct aatcaagcac ggcaagggag gtaagcgcac ggtgcggcgg 420
ctgaatgaag acgacccagt ggcgcggggt atgcggacgc aagaggaaaa ggaagagtcc 480
agtgaagcgg aaagtgaaag cacggtgata aacccgctga gcctgccgat cgtgtctgcg 540
taggagaagg gcatggaggc tgcgcgcgcg ttgatggaca agtaccacgt ggataacgat 600
ctaaaggcaa acttcaagct actgcctgac caagtggaag ctctggcggc cgtatgcaag 660
acctggctaa acgaggagca ccgcgggttg cagctgacct tcaccagcaa caagaccttt 720
gtgacgatga tggggcgatt cctgcaggcg tacctgcagt cgtttgcaga ggtaacctac 780
aagcaccacg agcccacggg ctgcgcgttg tggctgcacc gctgcgctga gatcgaaggc 840
gagcttaagt gtctacacgg gagcattatg ataaataagg agcacgtgat tgaaatggat 900
gtgacgagcg aaaacgggca gcgcgcgctg aaggagcagt ctagcaaggc caagatcgtg 960
aagaaccggt ggggccgaaa tgtggtgcag atctccaaca ccgacgcaag gtgctgcgtg 1020
catgacgcgg cctgtccggc caatcagttt tccggcaagt cttgcggcat gttcttctct 1080
gaaggcgcaa aggctcaggt ggcttttaag cagatcaagg ctttcatgca ggcgctgtat 1140
cctaacgccc agaccgggca cggtcacctt ctgatgccac tacggtgcga gtgcaactca 1200
aagcctgggc atgcaccctt tttgggaagg cagctaccaa agttgactcc gttcgccctg 1260
agcaacgcgg aggacctgga cgcggatctg atctccgaca agagcgtgct ggccagcgtg 1320
caccacccgg cgctgatagt gttccagtgc tgcaaccctg tgtatcgcaa ctcgcgcgcg 1380
cagggcggag gccccaactg cgacttcaag atatcggcgc ccgacctgct aaacgcgttg 1440
gtgatggtgc gcagcctgtg gagtgaaaac ttcaccgagc tgccgcggat ggttgtgcct 1500
gagtttaagt ggagcactaa acaccagtat cgcaacgtgt ccctgccagt ggcgcatagc 1560
gatgcgcggc agaacccctt tgatttttaa 1590
<210> 106
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 106
atggccagtc gggaagagga gcagcgcgaa accacccccg agcgcggacg cggtgcggcg 60
cgacgtccac caaccatgga ggacgtgtcg tccccgtcgc cgtcgccgcc gcctccccgc 120
gcgcccccaa aaaagcggct gaggcggcgt ctcgagtccg aggacgaaga agactcgtca 180
caagatgcgc tggtgccgcg cacacccagc ccgcggccat cgacctcgac ggcggatttg 240
gccattgcgt ccaaaaagaa aaagaagcgc ccctctccca agcccgagcg cccgccatcc 300
ccagaggtga tcgtggacag cgaggaagaa agagaagatg tggcgctaca aatggtgggt 360
ttcagcaacc caccggtgct aatcaagcac ggcaagggag gtaagcgcac ggtgcggcgg 420
ctgaatgaag acgacccagt ggcgcggggt atgcggacgc aagaggaaaa ggaagagtcc 480
agtgaagcgg aaagtgaaag cacggtgata aacccgctga gcctgccgat cgtgtctgcg 540
tgggagaagg gcatggaggc tgcgcgcgcg ttgatggaca agtaccacgt ggataacgat 600
ctaaaggcaa acttcaagct actgcctgac caagtggaag ctctggcggc cgtatgcaag 660
acctggctaa acgaggagca ccgcgggttg cagctgacct tcaccagcaa caagaccttt 720
gtgacgatga tggggcgatt cctgcaggcg tacctgcagt cgtttgcaga ggtaacctac 780
aagcaccacg agcccacggg ctgcgcgttg tggctgcacc gctgcgctga gatcgaaggc 840
gagcttaagt gtctacacgg gagcattatg ataaataagg agcacgtgat tgaaatggat 900
gtgacgagcg aaaacgggca gcgcgcgctg aaggagcagt ctagcaaggc caagatcgtg 960
aagaaccggt agggccgaaa tgtggtggtg atctccaaca ccgacgcaag gtgctgcgtg 1020
catgacgcgg cctgtccggc caatcagttt tccggcaagt cttgcggcat gttcttctct 1080
gaaggcgcaa aggctcaggt ggcttttaag cagatcaagg ctttcatgca ggcgctgtat 1140
cctaacgccc agaccgggca cggtcacctt ctgatgccac tacggtgcga gtgcaactca 1200
aagcctgggc atgcaccctt tttgggaagg cagctaccaa agttgactcc gttcgccctg 1260
agcaacgcgg aggacctgga cgcggatctg atctccgaca agagcgtgct ggccagcgtg 1320
caccacccgg cgctgatagt gttccagtgc tgcaaccctg tgtatcgcaa ctcgcgcgcg 1380
cagggcggag gccccaactg cgacttcaag atatcggcgc ccgacctgct aaacgcgttg 1440
gtgatggtgc gcagcctgtg gagtgaaaac ttcaccgagc tgccgcggat ggttgtgcct 1500
gagtttaagt ggagcactaa acaccagtat cgcaacgtgt ccctgccagt ggcgcatagc 1560
gatgcgcggc agaacccctt tgatttttaa 1590
<210> 107
<211> 885
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 107
atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60
cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120
atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180
tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg agttgttccc 240
tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300
ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360
gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420
ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480
taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540
atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600
gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660
gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720
aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780
ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840
caccgcccta tcctgatgca cgattatgac tctaccccca tgtag 885
<210> 108
<211> 885
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 108
atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60
cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120
atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180
tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240
tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300
ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360
gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420
ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480
taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540
atgaggggtc gccacttaat ctacctgcgc ttgtagtatg atggccacgt gggttctgtg 600
gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660
gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720
aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780
ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840
caccgcccta tcctgatgca cgattatgac tctaccccca tgtag 885
<210> 109
<211> 2418
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 109
atggagtcag tcgagaagga ggacagccta accgccccct ttgagttcgc caccaccgcc 60
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag 120
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggatcgctca 180
gtaccaacag aggataaaaa gcaagaccag gacgacgcag aggcaaacga ggaacaagtc 240
gggcgggggg accaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag 300
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc 360
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tgttctcacc gcgcgtaccc 420
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta 480
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc 540
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct 600
gtcatacctg atatcgcctc gctcgacgaa gtgccaaaaa tctttgaggg tcttggacgc 660
gacgagaaac gcgcggcaaa cgctctgcaa caagaaaaca gcgaaaatga aagtcactgt 720
ggagtgctgg tggaacttga gggtgacaac gcgcgcctag ccgtgctgaa acgcagcatc 780
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggttat gagcacagtc 840
atgagcgagc tgatcgtgcg ccgtgcacga cccctggaga gggatgcaaa cttgcaagaa 900
caaaccgagg agggcctacc cgcagttggc gatgagcagc tggcgcgctg gcttgagacg 960
cgcgagcctg ccgacttgga ggagcgacgc aagctaatga tggccgcagt gcttgttacc 1020
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag 1080
gaaacgttgc actacacctt tcgccagggc tacgtgcgcc aggcctgcaa aatttccaac 1140
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg cctcgggcaa 1200
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt 1260
tacttatttc tgtgctacac ctggcaaacg gccatgggcg tgtagcagca atgcctggag 1320
gagcgcaacc taaaggagct gcagaagctg ctaaagcaaa acttgaagga cctatggacg 1380
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca ttatcttccc cgaacgcctg 1440
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcaaaacttt 1500
aggaacttta tcctagagcg ttcaggaatt ctgcccgcca cctgctgtgc gcttcctagc 1560
gactttgtgc ccattaagta ccgtgaatgc cctccgccgc tttggggtca ctgctacctt 1620
ctgcagctag ccaactacct tgcctaccac tccgacatca tggaagacgt gagcggtgac 1680
ggcctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtctgc 1740
aattcgcaac tgcttagcga aagtcaaatt atcggtacct ttgagctgca gggtccctcg 1800
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct 1860
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac 1920
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacatcctt 1980
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg 2040
gtttacctgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc 2100
tatcagcagc cgcgggccct tgcttcccag gatggcaccc aaaaagaagc tgcagctgcc 2160
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga 2220
cgaggaggag gagatgatgg aagactggga cagcctagac gaagcttccg aggccgaaga 2280
ggtgtcagac gaaacaccgt caccctcggt cgcattcccc tcgccggcgc cccagaaatt 2340
ggcaaccgtt cccagcatcg ctacaacctc cgctcctcag gcgccgccgg cactgcctgt 2400
tcgccgaccc aaccgtag 2418
<210> 110
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 110
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact gaggattccg acccaagagg ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 111
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 111
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac ataaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 112
<211> 805
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 112
Met Glu Ser Val Glu Lys Glu Asp Ser Leu Thr Ala Pro Phe Glu Phe
1 5 10 15
Ala Thr Thr Ala Ser Thr Asp Ala Ala Asn Ala Pro Thr Thr Phe Pro
20 25 30
Val Glu Ala Pro Pro Leu Glu Glu Glu Glu Val Ile Ile Glu Gln Asp
35 40 45
Pro Gly Phe Val Ser Glu Asp Asp Glu Asp Arg Ser Val Pro Thr Glu
50 55 60
Asp Lys Lys Gln Asp Gln Asp Asp Ala Glu Ala Asn Glu Glu Gln Val
65 70 75 80
Gly Arg Gly Asp Gln Arg His Gly Asp Tyr Leu Asp Val Gly Asp Asp
85 90 95
Val Leu Leu Lys His Leu Gln Arg Gln Cys Ala Ile Ile Cys Asp Ala
100 105 110
Leu Gln Glu Arg Ser Asp Val Pro Leu Ala Ile Ala Asp Val Ser Leu
115 120 125
Ala Tyr Glu Arg His Leu Phe Ser Pro Arg Val Pro Pro Lys Arg Gln
130 135 140
Glu Asn Gly Thr Cys Glu Pro Asn Pro Arg Leu Asn Phe Tyr Pro Val
145 150 155 160
Phe Ala Val Pro Glu Val Leu Ala Thr Tyr His Ile Phe Phe Gln Asn
165 170 175
Cys Lys Ile Pro Leu Ser Cys Arg Ala Asn Arg Ser Arg Ala Asp Lys
180 185 190
Gln Leu Ala Leu Arg Gln Gly Ala Val Ile Pro Asp Ile Ala Ser Leu
195 200 205
Asp Glu Val Pro Lys Ile Phe Glu Gly Leu Gly Arg Asp Glu Lys Arg
210 215 220
Ala Ala Asn Ala Leu Gln Gln Glu Asn Ser Glu Asn Glu Ser His Cys
225 230 235 240
Gly Val Leu Val Glu Leu Glu Gly Asp Asn Ala Arg Leu Ala Val Leu
245 250 255
Lys Arg Ser Ile Glu Val Thr His Phe Ala Tyr Pro Ala Leu Asn Leu
260 265 270
Pro Pro Lys Val Met Ser Thr Val Met Ser Glu Leu Ile Val Arg Arg
275 280 285
Ala Arg Pro Leu Glu Arg Asp Ala Asn Leu Gln Glu Gln Thr Glu Glu
290 295 300
Gly Leu Pro Ala Val Gly Asp Glu Gln Leu Ala Arg Trp Leu Glu Thr
305 310 315 320
Arg Glu Pro Ala Asp Leu Glu Glu Arg Arg Lys Leu Met Met Ala Ala
325 330 335
Val Leu Val Thr Val Glu Leu Glu Cys Met Gln Arg Phe Phe Ala Asp
340 345 350
Pro Glu Met Gln Arg Lys Leu Glu Glu Thr Leu His Tyr Thr Phe Arg
355 360 365
Gln Gly Tyr Val Arg Gln Ala Cys Lys Ile Ser Asn Val Glu Leu Cys
370 375 380
Asn Leu Val Ser Tyr Leu Gly Ile Leu His Glu Asn Arg Leu Gly Gln
385 390 395 400
Asn Val Leu His Ser Thr Leu Lys Gly Glu Ala Arg Arg Asp Tyr Val
405 410 415
Arg Asp Cys Val Tyr Leu Phe Leu Cys Tyr Thr Trp Gln Thr Ala Met
420 425 430
Gly Val Trp Gln Gln Cys Leu Glu Glu Arg Asn Leu Lys Glu Leu Gln
435 440 445
Lys Leu Leu Lys Gln Asn Leu Lys Asp Leu Trp Thr Ala Phe Asn Glu
450 455 460
Arg Ser Val Ala Ala His Leu Ala Asp Ile Ile Phe Pro Glu Arg Leu
465 470 475 480
Leu Lys Thr Leu Gln Gln Gly Leu Pro Asp Phe Thr Ser Gln Ser Met
485 490 495
Leu Gln Asn Phe Arg Asn Phe Ile Leu Glu Arg Ser Gly Ile Leu Pro
500 505 510
Ala Thr Cys Cys Ala Leu Pro Ser Asp Phe Val Pro Ile Lys Tyr Arg
515 520 525
Glu Cys Pro Pro Pro Leu Trp Gly His Cys Tyr Leu Leu Gln Leu Ala
530 535 540
Asn Tyr Leu Ala Tyr His Ser Asp Ile Met Glu Asp Val Ser Gly Asp
545 550 555 560
Gly Leu Leu Glu Cys His Cys Arg Cys Asn Leu Cys Thr Pro His Arg
565 570 575
Ser Leu Val Cys Asn Ser Gln Leu Leu Ser Glu Ser Gln Ile Ile Gly
580 585 590
Thr Phe Glu Leu Gln Gly Pro Ser Pro Asp Glu Lys Ser Ala Ala Pro
595 600 605
Gly Leu Lys Leu Thr Pro Gly Leu Trp Thr Ser Ala Tyr Leu Arg Lys
610 615 620
Phe Val Pro Glu Asp Tyr His Ala His Glu Ile Arg Phe Tyr Glu Asp
625 630 635 640
Gln Ser Arg Pro Pro Asn Ala Glu Leu Thr Ala Cys Val Ile Thr Gln
645 650 655
Gly His Ile Leu Gly Gln Leu Gln Ala Ile Asn Lys Ala Arg Gln Glu
660 665 670
Phe Leu Leu Arg Lys Gly Arg Gly Val Tyr Leu Asp Pro Gln Ser Gly
675 680 685
Glu Glu Leu Asn Pro Ile Pro Pro Pro Pro Gln Pro Tyr Gln Gln Pro
690 695 700
Arg Ala Leu Ala Ser Gln Asp Gly Thr Gln Lys Glu Ala Ala Ala Ala
705 710 715 720
Ala Ala Ala Thr His Gly Arg Gly Gly Ile Leu Gly Gln Ser Gly Arg
725 730 735
Gly Gly Phe Gly Arg Gly Gly Gly Asp Asp Gly Arg Leu Gly Gln Pro
740 745 750
Arg Arg Ser Phe Arg Gly Arg Arg Gly Val Arg Arg Asn Thr Val Thr
755 760 765
Leu Gly Arg Ile Pro Leu Ala Gly Ala Pro Glu Ile Gly Asn Arg Ser
770 775 780
Gln His Arg Tyr Asn Leu Arg Ser Ser Gly Ala Ala Gly Thr Ala Cys
785 790 795 800
Ser Pro Thr Gln Pro
805
<210> 113
<211> 4068
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 113
gccaccatgg agctggtcgg gtggctcgtg tagaagggga ttacctcgga gaagcagtgg 60
atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120
atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180
tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240
gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300
aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360
atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420
aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480
accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540
cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600
aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660
gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720
aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780
gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840
agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900
tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960
atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020
cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080
gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140
gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200
atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260
ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320
gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380
ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440
tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500
tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560
cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620
cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680
cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740
ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860
cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgagca 1920
tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980
gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040
gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100
ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160
cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220
gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280
gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340
ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400
ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460
gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520
aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg ggattacctc 2580
ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640
ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700
aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760
ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820
atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880
cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940
ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000
ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060
ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120
cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180
gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240
tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300
tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360
tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420
agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480
gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540
tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600
acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660
aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720
ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780
tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840
cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900
gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960
aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020
ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068
<210> 114
<211> 4068
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 114
gccaccatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 60
atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120
atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180
tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240
gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300
aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360
atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420
aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480
accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540
cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600
aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660
gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720
aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780
gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840
agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900
tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960
atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020
cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080
gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140
gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200
atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260
ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320
gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380
ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440
tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500
tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560
cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620
cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680
cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740
ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860
cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgagca 1920
tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980
gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040
gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100
ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160
cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220
gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280
gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340
ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400
ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460
gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520
aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg ggattacctc 2580
ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640
ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700
aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760
ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820
atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880
cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940
ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000
ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060
ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120
cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180
gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240
tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300
tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360
tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420
agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480
gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540
tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600
acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660
aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720
ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780
tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840
cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900
gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960
aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020
ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068
<210> 115
<211> 4068
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 115
gccaccatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 60
atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120
atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180
tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240
gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300
aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360
atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420
aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480
accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540
cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600
aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660
gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720
aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780
gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840
agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900
tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960
atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020
cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080
gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140
gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200
atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260
ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320
gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380
ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440
tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500
tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560
cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620
cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680
cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740
ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860
cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgactagca 1920
tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980
gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040
gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100
ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160
cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220
gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280
gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340
ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400
ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460
gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520
aaaaacttca gccaggtaca tggagctggt cgggtggctc gtggacaagg ggattacctc 2580
ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640
ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700
aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760
ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820
atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880
cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940
ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000
ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060
ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120
cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180
gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240
tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300
tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360
tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420
agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480
gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540
tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600
acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660
aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720
ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780
tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840
cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900
gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960
aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020
ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068
<210> 116
<211> 2208
<212> DNA
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 116
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 117
<211> 735
<212> PRT
<213> Unknown
<220>
<223> Adeno-associated virus
<400> 117
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 118
<211> 260
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 118
Met Val Ile Met Ser Pro Lys Arg Arg Thr Gln Ala Glu Arg Ala Met
1 5 10 15
Glu Thr Gln Gly Lys Leu Ile Ala Ala Ala Leu Gly Val Leu Arg Glu
20 25 30
Lys Gly Tyr Ala Gly Phe Arg Ile Ala Asp Val Pro Gly Ala Ala Gly
35 40 45
Val Ser Arg Gly Ala Gln Ser His His Phe Pro Thr Lys Leu Glu Leu
50 55 60
Leu Leu Ala Thr Phe Glu Trp Leu Tyr Glu Gln Ile Thr Glu Arg Ser
65 70 75 80
Arg Ala Arg Leu Ala Lys Leu Lys Pro Glu Asp Asp Val Ile Gln Gln
85 90 95
Met Leu Asp Asp Ala Ala Glu Phe Phe Leu Asp Asp Asp Phe Ser Ile
100 105 110
Gly Leu Asp Leu Ile Val Ala Ala Asp Arg Asp Pro Val Leu Arg Glu
115 120 125
Gly Ile Gln Arg Thr Val Glu Arg Asn Arg Phe Val Val Gly Asp Ile
130 135 140
Trp Leu Gly Val Leu Val Ser Arg Gly Leu Ser Arg Asp Asp Ala Glu
145 150 155 160
Asp Ile Leu Trp Leu Ile Phe Asn Ser Val Arg Gly Leu Val Val Arg
165 170 175
Ser Leu Trp Gln Lys Asp Lys Glu Arg Phe Glu Arg Val Arg Asn Ser
180 185 190
Thr Leu Glu Ile Ala Arg Glu Arg Tyr Ala Lys Phe Lys Arg Ser Gly
195 200 205
Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
210 215 220
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
225 230 235 240
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Gly Pro Pro Lys Lys
245 250 255
Lys Arg Lys Val
260
<210> 119
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 119
ctccatgccc ttctcctacg cagacacgat 30
<210> 120
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 120
gagatcacca ccacatttcg gccctaccgg 30
<210> 121
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 121
tcccagggaa caactcattc ctgaatcagc 30
<210> 122
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 122
cgtggccatc atactacaag cgcaggtaga 30
<210> 123
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 123
ggccatgggc gtgtagcagc aatgcctgga 30
<210> 124
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 124
aactgaggat tccgacccaa gaggctcaac 30
<210> 125
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 125
gcagatgtca acacataagg cgttcttcca 30
<210> 126
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 126
gactttctga cggagtagcg ccgtgtgagt 30
<210> 127
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 127
ctccaactcg cggagctaaa tcaaggctgc 30
<210> 128
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 128
ccgtctttct gggataggcc acgaaaaagt 30
Claims (83)
- AAV(아데노-연관 바이러스(Adeno-Associated Virus)) 생산을 위한 조작된 세포로서,
비표준 tRNA 합성효소(noncanonical tRNA synthetase); 상기 비표준 tRNA 합성효소에 상응하는 비표준 tRNA; NC-Rep 78; 및 NC-Rep52 각각을 암호화하는 핵산 서열을 일괄적으로(collectively) 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하며; 이들 각각은 프로모터에 작동 가능하게 연결되되; 상기 NC-Rep78을 암호화하는 핵산 서열 및 상기 NC-Rep52를 암호화하는 핵산 서열은 각각 조기 정지 코돈과 상기 비표준 tRNA에 대응하는 아미노산 코돈 둘 다인 코돈을 포함하는, AAV 생산을 위한 조작된 세포. - 제1항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 비표준 tRNA 합성효소를 암호화하는 상기 핵산 서열을 포함하는 제1의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
- 제2항에 있어서, 상기 비표준 tRNA 합성효소는 피롤리실-tRNA 합성효소(Pyrrolysyl-tRNA synthetase: pylRS)인, AAV 생산을 위한 조작된 세포.
- 제3항에 있어서, pylRS가 서열번호 20 및 21 중 어느 하나의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제4항에 있어서, PylRS가 서열번호 21의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 제1의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 비표준 tRNA를 암호화하는 상기 핵산 서열을 포함하는 제2의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 비표준 tRNA는 H-Lys(Boc)-OH를 담고 있는(charge), AAV 생산을 위한 조작된 세포.
- 제7항 또는 제8항에 있어서, 상기 비표준 tRNA는 PylT U25C인, AAV 생산을 위한 조작된 세포.
- 제9항에 있어서, PylT U25C는 서열번호 22의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제9항 또는 제10항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는, 각각 PylT U25C를 암호화하고 프로모터에 각각 작동 가능하게 연결된 핵산 서열을 포함하는 4개의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제7항 내지 제11항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 NC-Rep78 및 NC-Rep52를 암호화하는 핵산 서열을 포함하는 제3의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
- 제13항에 있어서, NC-Rep78은 17번 위치에서 조기 정지 코돈을 포함하거나; NC-Rep52는 233번 위치에서 조기 정지 코돈을 포함하거나; 또는 이들의 조합인, AAV 생산을 위한 조작된 세포.
- 제13항 또는 제14항에 있어서, 상기 비표준 tRNA 합성효소는 pylRS이고, 상기 비표준 tRNA는 PylT U25C인, AAV 생산을 위한 조작된 세포.
- 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 NC-Rep78을 암호화하는 핵산 서열 및 상기 NC-Rep52를 암호화하는 핵산 서열은 단일 전사체로서 암호화된, AAV 생산을 위한 조작된 세포.
- 제16항에 있어서, 상기 단일 전사체는 서열번호 26 내지 27 중 어느 하나의 아미노산 서열을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제13항 내지 제17항 중 어느 한 항에 있어서, 상기 제3의 안정적으로 통합된 핵산 분자는 NC-Rep40을 암호화하는 핵산 서열; NC-Rep68을 암호화하는 핵산 서열; 또는 둘 다를 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 조작된 세포는 HEK293 세포, HeLa 세포, BHK 세포 또는 SB9 세포인, AAV 생산을 위한 조작된 세포.
- 제1항 내지 제19항 중 어느 한 항의 조작된 세포를 포함하는, 키트.
- 제20항에 있어서, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 더 포함하는, 키트.
- 제22항에 있어서, 상기 폴리뉴클레오타이드는 플라스미드 또는 벡터인, 키트.
- AAV 생산 방법으로서, 제1항 내지 제19항 중 어느 한 항의 조작된 세포를 비표준 아미노산과 접촉시키는 단계를 포함하는, AAV 생산 방법.
- 제23항에 있어서, 상기 비표준 아미노산은 H-Lys(Boc)-OH인, AAV 생산 방법.
- AAV 생산을 위한 조작된 세포로서,
Rep52, DA-Rep52, Rep40, 또는 DA-Rep40; Rep78, DA-Rep78, Rep68, 또는 DA-Rep68; E2A 또는 DA-E2A; E4ORF6 또는 DA-E4ORF6; VARNA 또는 DA-VARNA; VP1 또는 DA-VP1; VP2 또는 DA-VP2; VP3 또는 DA-VP3; AAP; 및 L4 100K 또는 DA-L4 100K 및 염기 편집기의 각각을 암호화하는 핵산 서열을 일괄적으로 포함하는 하나 이상의 안정적으로 통합된 핵산 분자를 포함하고, 각각의 핵산 분자는 프로모터에 작동 가능하게 연결되되; 상기 세포는 DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K 중 적어도 하나의 핵산 서열을 포함하고; DA-Rep52, DA-Rep40, DA-Rep78, DA-Rep68, DA-E2A, DA-E4ORF6, DA-VP1, DA-VP2, DA-V3 및 DA-L4 100K의 상기 핵산 서열은 각각 변형된 코돈을 포함하는, AAV 생산을 위한 조작된 세포. - 제25항에 있어서, 상기 변형된 코돈은 미스센스 코돈을 암호화하고, 상기 변형된 코돈에서 사이토신 또는 아데닌의 탈아미노화는 상기 암호화된 아미노산을 다른 아미노산으로 전환시키는, AAV 생산을 위한 조작된 세포.
- 제25항에 있어서, 상기 변형된 코돈은 조기 정지 코돈을 암호화하고, 상기 변형된 코돈에서 아데닌의 탈아미노화는 상기 변형된 코돈을 트립토판 코돈, 글루타민 코돈 또는 아르기닌으로 전환시키는, AAV 생산을 위한 조작된 세포.
- 제25항에 있어서, 상기 변형된 코돈은 조기 정지 코돈을 암호화하고, 상기 변형된 코돈에서 사이토신의 탈아미노화는 상기 암호화된 아미노산을 프롤린으로 전환시키는, AAV 생산을 위한 조작된 세포.
- 제25항 내지 제28항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 하나 이상의 CTCF 절연체를 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제25항 내지 제29항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 DA-E2A를 암호화하는 핵산 서열, 상기 DA-E4ORF6을 암호화하는 핵산 서열 및 상기 VARNA를 암호화하는 핵산 서열을 포함하는 제1의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
- 제30항에 있어서, 상기 제1의 안정적으로 통합된 핵산 분자는 L4 100K 또는 DA-L4 100K를 암호화하는 핵산 서열을 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제30항 또는 제31항에 있어서, 상기 제1의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제30항 내지 제32항 중 어느 한 항에 있어서, 상기 DA-E2A의 핵산 서열은 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성하는, AAV 생산을 위한 조작된 세포.
- 제31항 내지 제33항 중 어느 한 항에 있어서, 상기 DA-E2A를 암호화하는 핵산 서열은 서열번호 39 또는 40의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제31항 내지 제34항 중 어느 한 항에 있어서, DA-E2A의 181번 및/또는 324번 위치(서열번호 39 또는 40)가 조기 정지 코돈을 생성하는 아데닌에 대한 돌연변이와 상응하는, AAV 생산을 위한 조작된 세포.
- 제31항 내지 제35항 중 어느 한 항에 있어서, 상기 DA-E4ORF6의 핵산 서열은 아데닌에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성하는, AAV 생산을 위한 조작된 세포.
- 제31항 내지 제36항 중 어느 한 항에 있어서, 상기 DA-E4ORF6을 암호화하는 핵산 서열은 서열번호 41 또는 42의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제31항 내지 제37항 중 어느 한 항에 있어서, DA-E4ORF6의 77번 및/또는 192번 위치(서열번호 41 또는 42)가 조기 정지 코돈을 생성하는 아데닌을 포함하는 변형된 코돈과 상응하는, AAV 생산을 위한 조작된 세포.
- 제25항 내지 제38항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는 상기 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열, 상기 DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열, 상기 VP1 또는 DA-VP1을 암호화하는 핵산 서열, 상기 VP2 또는 DA-VP2를 암호화하는 핵산 서열 및 상기 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함하는, 제2의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
- 제39항에 있어서, 상기 제2의 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제39항 또는 제40항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 상기 DA-Rep52 또는 DA-Rep40을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제41항에 있어서, 상기 DA-Rep52를 암호화하는 핵산 서열은 서열번호 43 또는 47의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제41항에 있어서, 상기 DA-Rep40을 암호화하는 핵산 서열은 서열번호 44 또는 48의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제39항 또는 제43항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 DA-Rep78 또는 DA-Rep68을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제44항에 있어서, 상기 DA-Rep78을 암호화하는 핵산 서열은 서열번호 45, 49 및 51 중 어느 하나의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제45항에 있어서, 상기 DA-Rep68을 암호화하는 핵산 서열은 서열번호 46, 50 또는 52의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제39항 내지 제46항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제47항에 있어서, 상기 Rep52 또는 DA-Rep52; Rep40 또는 DA-Rep40; Rep68 또는 DA-Rep68; 및 Rep78 또는 DA-Rep78을 암호화하는 핵산 서열은 서열번호 53 내지 55, 113 내지 115 중 어느 하나의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제48항에 있어서, DA-Rep52, DA-Rep40, DA-Rep68 및 DA-Rep78을 암호화하는 핵산 서열은 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하여 하나 이상의 조기 정지 코돈을 생성하는, AAV 생산을 위한 조작된 세포.
- 제49항에 있어서, 상기 뉴클레오타이드 서열에서 하나의 아데닌 돌연변이는 DA-Rep78의 67, 262 및/또는 319번 아미노산 위치(서열번호 45, 49 및 51)에 상응하는 위치인, AAV 생산을 위한 조작된 세포.
- 제39항 내지 제50항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 하나 이상의 sgRNA를 암호화하는 핵산 서열을 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제51항에 있어서, 상기 하나 이상의 sgRNA는 각각 아데닌 또는 사이토신에 대한 하나 이상의 돌연변이를 포함하는 핵산 서열에 상보성인 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제51항 또는 제52항에 있어서, 상기 하나 이상의 sgRNA는 각각 서열번호 56 내지 81 중 어느 하나의 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제51항 내지 제53항 중 어느 한 항에 있어서, 상기 하나 이상의 sgRNA는 화학적 유도성 프로모터에 작동 가능하게 연결된, AAV 생산을 위한 조작된 세포.
- 제54항에 있어서, 상기 화학적 유도성 프로모터는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF, CymR 또는 Gal4 UAS 작동유전자 서열 중 적어도 하나를 포함하는 프로모터로 이루어진 군으로부터 선택된, AAV 생산을 위한 조작된 세포.
- 제55항에 있어서, 상기 화학적 유도성 프로모터를 암호화하는 상기 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함하는, AAV 생산을 위한 조작된 세포.
- 제39항 내지 제56항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 VP1 또는 DA-VP1, VP2 또는 DA-VP2 및 VP3 또는 DA-VP3을 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제57항에 있어서, VP1을 암호화하는 상기 핵산 서열은 서열번호 14의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제58항에 있어서, 상기 DA-VP1을 암호화하는 핵산 서열은 서열번호 99 또는 102의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제59항 또는 제60항에 있어서, 상기 VP2를 암호화하는 핵산 서열은 서열번호 15의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제57항 또는 제59항에 있어서, 상기 DA-VP2를 암호화하는 핵산 서열은 서열번호 100 또는 103의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제57항 또는 제61항에 있어서, 상기 VP3을 암호화하는 핵산 서열은 서열번호 16의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제57항 또는 제60항에 있어서, DA-VP3을 암호화하는 상기 핵산 서열은 서열번호 101 또는 104의 아미노산 서열을 포함하는, 세포.
- 제57항 내지 제63항 중 어느 한 항에 있어서, 상기 제2의 안정적으로 통합된 핵산 분자는 AAP를 암호화하는 핵산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제64항에 있어서, AAP을 암호화하는 상기 핵산 서열은 서열번호 17의 아미노산 서열을 포함하는, AAV 생산을 위한 조작된 세포.
- 제25항 내지 제65항 중 어느 한 항에 있어서, 상기 하나 이상의 안정적으로 통합된 핵산 분자는, 소분자 유도물질(inducer)의 존재 하에 발현될 때, 상기 조작된 세포의 화학적 유도성 프로모터에 결합하는 전사 활성체를 암호화하는 핵산 서열 및 염기 편집기를 암호화하는 핵산 서열을 포함하는, 제3의 안정적으로 통합된 핵산 분자를 포함하는, AAV 생산을 위한 조작된 세포.
- 제66항에 있어서, 상기 제3의 안정적으로 통합된 핵산 분자는 프로모터에 작동 가능하게 연결된 선택 마커를 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제66항 또는 제67항에 있어서, 상기 염기 편집기는 아데닌 염기 편집기(Adenine Base Editor: ABE) 또는 사이토신 염기 편집기(Cytosine Base Editor: CBE)인, AAV 생산을 위한 조작된 세포.
- 제68항에 있어서, 상기 ABE는 Cas9 ABE 또는 Cas13 ABE이거나, 또는 상기 CBE는 Cas9-CBE 또는 Cas13 CBE인, AAV 생산을 위한 조작된 세포.
- 제69항에 있어서, 상기 Cas9 ABE는 서열번호 82 또는 83을 포함하는 아미노산 서열에 의해 암호화된, AAV 생산을 위한 조작된 세포.
- 제70항에 있어서, 상기 Cas13 ABE는 서열번호 84 또는 85를 포함하는 아미노산 서열에 의해 암호화된, AAV 생산을 위한 조작된 세포.
- 제66항 내지 제71항 중 어느 한 항에 있어서, 상기 ABE를 암호화하는 핵산 서열은 제3 화학적 유도성 프로모터에 작동 가능하게 연결된, AAV 생산을 위한 조작된 세포.
- 제66항 내지 제72항 중 어느 한 항에 있어서, 상기 제3의 안정적으로 통합된 핵산 분자는 pTRE3G, pTREtight, 또는 VanR, TtgR, PhlF, CymR 또는 Gal4 UAS 작동유전자 서열 중 적어도 하나를 포함하는 프로모터로 이루어진 군으로부터 선택된 화학적 유도성 프로모터를 더 포함하는, AAV 생산을 위한 조작된 세포.
- 제73항에 있어서, 상기 제3의 화학적 유도성 프로모터를 암호화하는 상기 핵산 서열은 서열번호 1 및 2 중 어느 하나이거나, 서열번호 86 내지 91 중 어느 하나를 포함하는, AAV 생산을 위한 조작된 세포.
- 제66항 내지 제74항 중 어느 한 항에 있어서, 상기 전사 활성체는 TetOn-3G, TetOn-V16, TetOff-Advanced, VanR-VP16, TtgR-VP16, PhlF-VP16 및 큐메이트(cumate) cTA 및 rcTA로 이루어진 군으로부터 선택된, AAV 생산을 위한 조작된 세포.
- 제66항 내지 제75항 중 어느 한 항에 있어서, 상기 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된, AAV 생산을 위한 조작된 세포.
- 제66항 내지 제76항 중 어느 한 항에 있어서, 상기 전사 활성체는 TetOn 3G이고, 상기 소분자 유도물질은 독시사이클린인, AAV 생산을 위한 조작된 세포.
- 제25항 내지 제77항 중 어느 한 항에 있어서, 상기 조작된 세포는 HEK293 세포 또는 HeLa 세포인, AAV 생산을 위한 조작된 세포.
- 제25항 내지 제78항 중 어느 한 항의 조작된 세포를 포함하는, 키트.
- 제79항에 있어서, 5'에서 3'으로: (i) 5' 역위 말단 반복부의 핵산 서열; (ii) 다중 클로닝 부위; 및 (iii) 3' 역위 말단 반복부의 핵산 서열을 포함하는 폴리뉴클레오타이드를 더 포함하는, 키트.
- 제80항에 있어서, 상기 폴리뉴클레오타이드는 플라스미드 또는 벡터인, 키트.
- AAV 생산 방법으로서,
제25항 내지 제78항 중 어느 한 항의 조작된 세포를 화학적 유도성 프로모터에 결합하는 소분자 유도물질과 접촉시키는 단계를 포함하는, AAV 생산 방법. - 제82항에 있어서, 상기 소분자 유도물질은 독시사이클린, 바닐레이트, 플로레틴, 라파마이신, 아브시스산, 지베렐린산 아세톡시메틸 에스터 및 큐메이트로 이루어진 군으로부터 선택된, AAV 생산 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163177760P | 2021-04-21 | 2021-04-21 | |
US63/177,760 | 2021-04-21 | ||
PCT/US2022/025755 WO2022226189A1 (en) | 2021-04-21 | 2022-04-21 | Stable production systems for adeno-associated virus production |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240019759A true KR20240019759A (ko) | 2024-02-14 |
Family
ID=83723162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237039938A KR20240019759A (ko) | 2021-04-21 | 2022-04-21 | 아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템 |
Country Status (9)
Country | Link |
---|---|
EP (1) | EP4326883A1 (ko) |
JP (1) | JP2024515369A (ko) |
KR (1) | KR20240019759A (ko) |
CN (1) | CN117529558A (ko) |
AU (1) | AU2022262365A1 (ko) |
BR (1) | BR112023021963A2 (ko) |
CA (1) | CA3217226A1 (ko) |
IL (1) | IL307830A (ko) |
WO (1) | WO2022226189A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023086822A2 (en) * | 2021-11-09 | 2023-05-19 | Asimov Inc. | Stable production systems for aav vector production |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2340335A1 (en) * | 1998-08-20 | 2000-03-02 | Cell Genesys, Inc. | Use of suppressor trna's to regulate cytotoxicity during the production of recombinant gene products |
US9023617B2 (en) * | 2004-02-17 | 2015-05-05 | University Of Florida Research Foundation, Inc. | Insulated herpesvirus-derived gene expression cassettes for sustained and regulatable gene expression |
US8679837B2 (en) * | 2009-04-02 | 2014-03-25 | University Of Florida Research Foundation, Inc. | Inducible system for highly efficient production of recombinant Adeno-associated virus (rAAV) vectors |
US9670521B2 (en) * | 2012-09-24 | 2017-06-06 | Medimmune Limited | Amino acid derivatives |
US11702673B2 (en) * | 2018-10-18 | 2023-07-18 | University Of Florida Research Foundation, Incorporated | Methods of enhancing biological potency of baculovirus system-produced recombinant adeno-associated virus |
EP3870148A4 (en) * | 2018-10-25 | 2022-11-09 | Takeda Pharmaceutical Company Limited | AAV TRIPLE PLASMID SYSTEM |
EP4021945A4 (en) * | 2019-08-30 | 2023-11-15 | The General Hospital Corporation | DNA-BASED COMBINATORIAL ADENINE AND CYTOSINE EDITORS |
WO2021072129A2 (en) * | 2019-10-08 | 2021-04-15 | Trustees Of Boston College | Proteins containing multiple, different unnatural amino acids and methods of making and using such proteins |
-
2022
- 2022-04-21 CA CA3217226A patent/CA3217226A1/en active Pending
- 2022-04-21 BR BR112023021963A patent/BR112023021963A2/pt unknown
- 2022-04-21 KR KR1020237039938A patent/KR20240019759A/ko unknown
- 2022-04-21 CN CN202280044018.4A patent/CN117529558A/zh active Pending
- 2022-04-21 JP JP2023565269A patent/JP2024515369A/ja active Pending
- 2022-04-21 IL IL307830A patent/IL307830A/en unknown
- 2022-04-21 AU AU2022262365A patent/AU2022262365A1/en active Pending
- 2022-04-21 WO PCT/US2022/025755 patent/WO2022226189A1/en active Application Filing
- 2022-04-21 EP EP22792495.8A patent/EP4326883A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
IL307830A (en) | 2023-12-01 |
CA3217226A1 (en) | 2022-10-27 |
WO2022226189A1 (en) | 2022-10-27 |
AU2022262365A9 (en) | 2023-11-16 |
BR112023021963A2 (pt) | 2024-01-16 |
JP2024515369A (ja) | 2024-04-09 |
AU2022262365A1 (en) | 2023-11-09 |
EP4326883A1 (en) | 2024-02-28 |
CN117529558A (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Surosky et al. | Adeno-associated virus Rep proteins target DNA sequences to a unique locus in the human genome | |
US6936466B2 (en) | Transcriptionally-activated AAV inverted terminal repeats (ITRs) for use with recombinant AAV vectors | |
Chejanovsky et al. | Mutagenesis of an AUG codon in the adeno-associated virus rep gene: effects on viral DNA replication | |
AU2020289851A1 (en) | Aav-mediated expression using a synthetic promoter and enhancer | |
US20040087026A1 (en) | Host cells for packing a recombinant adeno-associated virus (raav), method for the production and use thereof | |
CN110785495A (zh) | 腺相关病毒载体的生产方法 | |
JP2003310252A (ja) | 組織の細胞dnaからの組込みウイルスの直接レスキュー及び増幅の方法 | |
JPH09509564A (ja) | 高力価組換えaavベクターの生成 | |
JP2021528959A (ja) | 細胞内で存続する遺伝子送達のためのベクター | |
JP7316326B2 (ja) | スペーサーを含む核酸分子およびその使用の方法 | |
EP3999642A1 (en) | Recombinase compositions and methods of use | |
KR20240019759A (ko) | 아데노-연관 바이러스 생산을 위한 안정적인 생산 시스템 | |
AU756827B2 (en) | Transcriptionally-activated AAV inverted terminal repeats (ITRs) for use with recombinant AAV vectors | |
CN113897396B (zh) | 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用 | |
JP2022513376A (ja) | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 | |
WO2004106360A2 (en) | Viral vectors with improved properties | |
Xiao et al. | Adeno-associated virus (AAV) vectors for gene transfer | |
CN116411024A (zh) | 用于生产重组腺相关病毒的质粒系统 | |
US11230720B2 (en) | Nucleic acid molecules containing spacers and methods of use thereof | |
EP4347859A1 (en) | Integrase compositions and methods | |
IL302045A (en) | Nucleic acid structures for simultaneous gene activation | |
Trempe | Packaging systems for adeno-associated virus vectors | |
WO2024102977A1 (en) | Stable production systems for adeno-associated virus production | |
Kelemen et al. | Development of a system for virus-assisted directed evolution of enhanced suppressor tRNAs in mammalian cells (VADER) | |
AU2003203790B2 (en) | Transcriptionally-activated AAV inverted terminal repeats (ITRs) for use with recombinant AAV vectors |