KR20230158531A - 신규 crispr 효소, 방법, 시스템 및 그 용도 - Google Patents
신규 crispr 효소, 방법, 시스템 및 그 용도 Download PDFInfo
- Publication number
- KR20230158531A KR20230158531A KR1020237034367A KR20237034367A KR20230158531A KR 20230158531 A KR20230158531 A KR 20230158531A KR 1020237034367 A KR1020237034367 A KR 1020237034367A KR 20237034367 A KR20237034367 A KR 20237034367A KR 20230158531 A KR20230158531 A KR 20230158531A
- Authority
- KR
- South Korea
- Prior art keywords
- cas9
- sequence
- seq
- protein
- nucleic acid
- Prior art date
Links
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 441
- 238000000034 method Methods 0.000 title claims abstract description 150
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 231
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 187
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 187
- 241001291896 Streptococcus constellatus Species 0.000 claims abstract description 58
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 54
- 201000010099 disease Diseases 0.000 claims abstract description 37
- 241001440001 Peptoniphilus sp. Species 0.000 claims abstract description 27
- 241000186840 Lactobacillus fermentum Species 0.000 claims abstract description 22
- 229940012969 lactobacillus fermentum Drugs 0.000 claims abstract description 22
- 210000005260 human cell Anatomy 0.000 claims abstract description 20
- 241000889558 Ezakiella peruensis Species 0.000 claims abstract description 16
- 241001148135 Veillonella parvula Species 0.000 claims abstract description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 209
- 210000004027 cell Anatomy 0.000 claims description 164
- 108090000623 proteins and genes Proteins 0.000 claims description 139
- 125000003729 nucleotide group Chemical group 0.000 claims description 130
- 239000002773 nucleotide Substances 0.000 claims description 123
- 230000000694 effects Effects 0.000 claims description 108
- 102000004169 proteins and genes Human genes 0.000 claims description 101
- 235000018102 proteins Nutrition 0.000 claims description 98
- 230000035772 mutation Effects 0.000 claims description 96
- 238000010354 CRISPR gene editing Methods 0.000 claims description 78
- 108020005004 Guide RNA Proteins 0.000 claims description 75
- 102000040430 polynucleotide Human genes 0.000 claims description 75
- 108091033319 polynucleotide Proteins 0.000 claims description 75
- 239000002157 polynucleotide Substances 0.000 claims description 75
- 230000014509 gene expression Effects 0.000 claims description 74
- 235000001014 amino acid Nutrition 0.000 claims description 65
- 150000001413 amino acids Chemical group 0.000 claims description 58
- 239000013598 vector Substances 0.000 claims description 54
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 45
- 108020001507 fusion proteins Proteins 0.000 claims description 43
- 102000037865 fusion proteins Human genes 0.000 claims description 43
- 230000000295 complement effect Effects 0.000 claims description 41
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 39
- 230000027455 binding Effects 0.000 claims description 38
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 38
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 37
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 34
- 125000006850 spacer group Chemical group 0.000 claims description 31
- 229930024421 Adenine Natural products 0.000 claims description 30
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 30
- 229960000643 adenine Drugs 0.000 claims description 30
- 101710163270 Nuclease Proteins 0.000 claims description 28
- 238000006467 substitution reaction Methods 0.000 claims description 28
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 23
- 239000013603 viral vector Substances 0.000 claims description 23
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 20
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 20
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 20
- 229940104302 cytosine Drugs 0.000 claims description 19
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 17
- 208000035475 disorder Diseases 0.000 claims description 17
- 239000013607 AAV vector Substances 0.000 claims description 15
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 15
- 235000003704 aspartic acid Nutrition 0.000 claims description 15
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 15
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 14
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 14
- 230000003612 virological effect Effects 0.000 claims description 14
- 230000030648 nucleus localization Effects 0.000 claims description 13
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 claims description 12
- 241001148134 Veillonella Species 0.000 claims description 11
- 230000000051 modifying effect Effects 0.000 claims description 10
- 229940113082 thymine Drugs 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 7
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 6
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 6
- 241000702421 Dependoparvovirus Species 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 6
- 230000012743 protein tagging Effects 0.000 claims description 5
- 230000005783 single-strand break Effects 0.000 claims description 4
- 108091006106 transcriptional activators Proteins 0.000 claims description 4
- 102000008157 Histone Demethylases Human genes 0.000 claims description 3
- 108010074870 Histone Demethylases Proteins 0.000 claims description 3
- 241000756761 Sharpea Species 0.000 claims description 3
- 230000005782 double-strand break Effects 0.000 claims description 3
- 239000013600 plasmid vector Substances 0.000 claims description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 claims 17
- 102100026846 Cytidine deaminase Human genes 0.000 claims 3
- 239000000203 mixture Substances 0.000 abstract description 53
- 241000282414 Homo sapiens Species 0.000 abstract description 36
- 230000008685 targeting Effects 0.000 abstract description 20
- 241000894006 Bacteria Species 0.000 abstract description 12
- 239000002585 base Substances 0.000 description 183
- 108090000765 processed proteins & peptides Proteins 0.000 description 68
- 108020004414 DNA Proteins 0.000 description 63
- 102000004196 processed proteins & peptides Human genes 0.000 description 61
- 229920001184 polypeptide Polymers 0.000 description 57
- 125000003275 alpha amino acid group Chemical group 0.000 description 44
- 108091079001 CRISPR RNA Proteins 0.000 description 43
- 238000006243 chemical reaction Methods 0.000 description 41
- 239000008194 pharmaceutical composition Substances 0.000 description 37
- 230000000875 corresponding effect Effects 0.000 description 32
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 30
- 230000004927 fusion Effects 0.000 description 30
- 125000005647 linker group Chemical group 0.000 description 30
- 108020004705 Codon Proteins 0.000 description 27
- 238000003776 cleavage reaction Methods 0.000 description 26
- 230000007017 scission Effects 0.000 description 26
- 230000001225 therapeutic effect Effects 0.000 description 25
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 24
- 238000009472 formulation Methods 0.000 description 22
- 238000000338 in vitro Methods 0.000 description 21
- 230000001105 regulatory effect Effects 0.000 description 21
- 150000001875 compounds Chemical class 0.000 description 20
- 238000012360 testing method Methods 0.000 description 19
- 238000003780 insertion Methods 0.000 description 18
- 230000037431 insertion Effects 0.000 description 18
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 17
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 17
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 17
- 102000053602 DNA Human genes 0.000 description 16
- 239000003795 chemical substances by application Substances 0.000 description 16
- 239000012636 effector Substances 0.000 description 16
- 239000013612 plasmid Substances 0.000 description 16
- -1 rRNA Proteins 0.000 description 16
- 241000701161 unidentified adenovirus Species 0.000 description 16
- 241000700605 Viruses Species 0.000 description 15
- 108010092854 aspartyllysine Proteins 0.000 description 15
- 239000012634 fragment Substances 0.000 description 15
- 238000001727 in vivo Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 238000004806 packaging method and process Methods 0.000 description 15
- 102000005381 Cytidine Deaminase Human genes 0.000 description 14
- 238000010362 genome editing Methods 0.000 description 14
- 230000001939 inductive effect Effects 0.000 description 14
- 238000011282 treatment Methods 0.000 description 13
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 12
- 229960005305 adenosine Drugs 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- 241000700159 Rattus Species 0.000 description 11
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- 239000003814 drug Substances 0.000 description 10
- 230000017730 intein-mediated protein splicing Effects 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 108020001580 protein domains Proteins 0.000 description 10
- 102220622304 Huntingtin-associated protein 1_D10G_mutation Human genes 0.000 description 9
- 241000713666 Lentivirus Species 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 102220625641 Phosphatidylinositol 5-phosphate 4-kinase type-2 alpha_D38A_mutation Human genes 0.000 description 9
- 230000008499 blood brain barrier function Effects 0.000 description 9
- 210000001218 blood-brain barrier Anatomy 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 239000003085 diluting agent Substances 0.000 description 9
- 238000005457 optimization Methods 0.000 description 9
- 239000002245 particle Substances 0.000 description 9
- 230000001177 retroviral effect Effects 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 230000007704 transition Effects 0.000 description 9
- 239000003981 vehicle Substances 0.000 description 9
- 102220491082 ADP-ribosylation factor 6_D12A_mutation Human genes 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- 239000004471 Glycine Substances 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 8
- 230000004071 biological effect Effects 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 150000002632 lipids Chemical class 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 230000003204 osmotic effect Effects 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 241000283690 Bos taurus Species 0.000 description 7
- 108700010070 Codon Usage Proteins 0.000 description 7
- 230000007018 DNA scission Effects 0.000 description 7
- 108010033040 Histones Proteins 0.000 description 7
- 108020004566 Transfer RNA Proteins 0.000 description 7
- 235000004279 alanine Nutrition 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 239000003937 drug carrier Substances 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 238000001415 gene therapy Methods 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 102220338324 rs1554062124 Human genes 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 241000701022 Cytomegalovirus Species 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- 108020004682 Single-Stranded DNA Proteins 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- 239000013543 active substance Substances 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 239000003607 modifier Substances 0.000 description 6
- 239000002105 nanoparticle Substances 0.000 description 6
- 239000000546 pharmaceutical excipient Substances 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 230000032258 transport Effects 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 5
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 5
- 108010052875 Adenine deaminase Proteins 0.000 description 5
- 108090000565 Capsid Proteins Proteins 0.000 description 5
- 102100023321 Ceruloplasmin Human genes 0.000 description 5
- 102220606260 Cytosolic arginine sensor for mTORC1 subunit 2_D14A_mutation Human genes 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 108060004795 Methyltransferase Proteins 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 230000003139 buffering effect Effects 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 238000012350 deep sequencing Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 239000012678 infectious agent Substances 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 102000002797 APOBEC-3G Deaminase Human genes 0.000 description 4
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 4
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 4
- 102220468857 Albumin_R23H_mutation Human genes 0.000 description 4
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 4
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 108010077544 Chromatin Proteins 0.000 description 4
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 4
- 230000004568 DNA-binding Effects 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 4
- 101000742736 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3G Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 102100034349 Integrase Human genes 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 4
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 4
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 241000251742 Petromyzon Species 0.000 description 4
- 230000004570 RNA-binding Effects 0.000 description 4
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 230000033590 base-excision repair Effects 0.000 description 4
- 239000006172 buffering agent Substances 0.000 description 4
- 210000003483 chromatin Anatomy 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000009615 deamination Effects 0.000 description 4
- 238000006481 deamination reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000004049 epigenetic modification Effects 0.000 description 4
- 235000019441 ethanol Nutrition 0.000 description 4
- 238000001476 gene delivery Methods 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 102000054962 human APOBEC3G Human genes 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 4
- 238000007913 intrathecal administration Methods 0.000 description 4
- 238000001990 intravenous administration Methods 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 102200004091 rs387906857 Human genes 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 231100000419 toxicity Toxicity 0.000 description 4
- 230000001988 toxicity Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 3
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 3
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 101710132601 Capsid protein Proteins 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 102220489939 Cartilage oligomeric matrix protein_L51W_mutation Human genes 0.000 description 3
- 101710094648 Coat protein Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 101710180243 Cytidine deaminase 1 Proteins 0.000 description 3
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 241000713730 Equine infectious anemia virus Species 0.000 description 3
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 3
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 3
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 3
- 102000006947 Histones Human genes 0.000 description 3
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 3
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 3
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 3
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 3
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 3
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 3
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 3
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 3
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 3
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 3
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- 229930195725 Mannitol Natural products 0.000 description 3
- 241000699660 Mus musculus Species 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 101710141454 Nucleoprotein Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 241000282577 Pan troglodytes Species 0.000 description 3
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 241000282405 Pongo abelii Species 0.000 description 3
- 101710083689 Probable capsid protein Proteins 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- 241000700584 Simplexvirus Species 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 3
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 3
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 3
- 102000008579 Transposases Human genes 0.000 description 3
- 108010020764 Transposases Proteins 0.000 description 3
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 3
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000030833 cell death Effects 0.000 description 3
- 230000007711 cytoplasmic localization Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000002552 dosage form Substances 0.000 description 3
- 102000015694 estrogen receptors Human genes 0.000 description 3
- 108010038795 estrogen receptors Proteins 0.000 description 3
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 239000000314 lubricant Substances 0.000 description 3
- 239000000594 mannitol Substances 0.000 description 3
- 235000010355 mannitol Nutrition 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 231100000252 nontoxic Toxicity 0.000 description 3
- 230000003000 nontoxic effect Effects 0.000 description 3
- 102000044158 nucleic acid binding protein Human genes 0.000 description 3
- 108700020942 nucleic acid binding protein Proteins 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 108091008695 photoreceptors Proteins 0.000 description 3
- 238000007747 plating Methods 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 102200049192 rs1057517679 Human genes 0.000 description 3
- 102200124762 rs121918364 Human genes 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 108010005652 splenotritin Proteins 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 239000000829 suppository Substances 0.000 description 3
- 239000000454 talc Substances 0.000 description 3
- 229910052623 talc Inorganic materials 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 2
- KWVJHCQQUFDPLU-YEUCEMRASA-N 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KWVJHCQQUFDPLU-YEUCEMRASA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 101710159293 Acyl-CoA desaturase 1 Proteins 0.000 description 2
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 2
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 2
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 2
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 2
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 2
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 2
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 2
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 2
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 2
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 2
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 2
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 2
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 2
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 2
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 241000702189 Escherichia virus Mu Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 2
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 2
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 241000282575 Gorilla Species 0.000 description 2
- 239000012981 Hank's balanced salt solution Substances 0.000 description 2
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 2
- 101000964330 Homo sapiens C->U-editing enzyme APOBEC-1 Proteins 0.000 description 2
- 101001062864 Homo sapiens Fatty acid-binding protein, adipocyte Proteins 0.000 description 2
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 2
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 2
- 101000755690 Homo sapiens Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 2
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 2
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 2
- JQLFYZMEXFNRFS-DJFWLOJKSA-N Ile-Asp-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N JQLFYZMEXFNRFS-DJFWLOJKSA-N 0.000 description 2
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 2
- TVSPLSZTKTUYLV-ZPFDUUQYSA-N Ile-Glu-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O TVSPLSZTKTUYLV-ZPFDUUQYSA-N 0.000 description 2
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- 108010061833 Integrases Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- MSFITIBEMPWCBD-ULQDDVLXSA-N Leu-Val-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MSFITIBEMPWCBD-ULQDDVLXSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 2
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 2
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 2
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- CENKQZWVYMLRAX-ULQDDVLXSA-N Lys-Phe-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CENKQZWVYMLRAX-ULQDDVLXSA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010065395 Neuropep-1 Proteins 0.000 description 2
- 239000012124 Opti-MEM Substances 0.000 description 2
- 235000019483 Peanut oil Nutrition 0.000 description 2
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 2
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 2
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 2
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108091006300 SLC2A4 Proteins 0.000 description 2
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 2
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 2
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 2
- 108010017842 Telomerase Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108090000901 Transferrin Proteins 0.000 description 2
- 102000004338 Transferrin Human genes 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 2
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 2
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 2
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 2
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- MCMNRKCIXSYSNV-UHFFFAOYSA-N Zirconium dioxide Chemical compound O=[Zr]=O MCMNRKCIXSYSNV-UHFFFAOYSA-N 0.000 description 2
- NMFHJNAPXOMSRX-PUPDPRJKSA-N [(1r)-3-(3,4-dimethoxyphenyl)-1-[3-(2-morpholin-4-ylethoxy)phenyl]propyl] (2s)-1-[(2s)-2-(3,4,5-trimethoxyphenyl)butanoyl]piperidine-2-carboxylate Chemical compound C([C@@H](OC(=O)[C@@H]1CCCCN1C(=O)[C@@H](CC)C=1C=C(OC)C(OC)=C(OC)C=1)C=1C=C(OCCN2CCOCC2)C=CC=1)CC1=CC=C(OC)C(OC)=C1 NMFHJNAPXOMSRX-PUPDPRJKSA-N 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 2
- 102000005421 acetyltransferase Human genes 0.000 description 2
- 108020002494 acetyltransferase Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 230000006154 adenylylation Effects 0.000 description 2
- 210000001789 adipocyte Anatomy 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000002223 anti-pathogen Effects 0.000 description 2
- 230000000840 anti-viral effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- WWVKQTNONPWVEL-UHFFFAOYSA-N caffeic acid phenethyl ester Natural products C1=C(O)C(O)=CC=C1C=CC(=O)OCC1=CC=CC=C1 WWVKQTNONPWVEL-UHFFFAOYSA-N 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 229910001424 calcium ion Inorganic materials 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 230000000747 cardiac effect Effects 0.000 description 2
- 210000004413 cardiac myocyte Anatomy 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 108091092356 cellular DNA Proteins 0.000 description 2
- 210000003169 central nervous system Anatomy 0.000 description 2
- 239000013522 chelant Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013270 controlled release Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006114 demyristoylation Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- 230000029180 desumoylation Effects 0.000 description 2
- 230000009504 deubiquitination Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- MWRBNPKJOOWZPW-CLFAGFIQSA-N dioleoyl phosphatidylethanolamine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(=O)OCCN)OC(=O)CCCCCCC\C=C/CCCCCCCC MWRBNPKJOOWZPW-CLFAGFIQSA-N 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 229960003722 doxycycline Drugs 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 235000013355 food flavoring agent Nutrition 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 235000003869 genetically modified organism Nutrition 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000003781 hair follicle cycle Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 102000046390 human APOBEC1 Human genes 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 239000003978 infusion fluid Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 231100000053 low toxicity Toxicity 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 229920000609 methyl cellulose Polymers 0.000 description 2
- 239000001923 methylcellulose Substances 0.000 description 2
- 235000010981 methylcellulose Nutrition 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 238000007911 parenteral administration Methods 0.000 description 2
- 239000000312 peanut oil Substances 0.000 description 2
- 239000000825 pharmaceutical preparation Substances 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 102220275780 rs1555942389 Human genes 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000008159 sesame oil Substances 0.000 description 2
- 235000011803 sesame oil Nutrition 0.000 description 2
- 239000002924 silencing RNA Substances 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 210000002460 smooth muscle Anatomy 0.000 description 2
- 239000003549 soybean oil Substances 0.000 description 2
- 235000012424 soybean oil Nutrition 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 239000008181 tonicity modifier Substances 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 239000000080 wetting agent Substances 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- ALNDFFUAQIVVPG-NGJCXOISSA-N (2r,3r,4r)-3,4,5-trihydroxy-2-methoxypentanal Chemical compound CO[C@@H](C=O)[C@H](O)[C@H](O)CO ALNDFFUAQIVVPG-NGJCXOISSA-N 0.000 description 1
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2r,3r,4s,5r,6s)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2s,3r,4s,5r,6r)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2r,3r,4s,5r,6r)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 description 1
- BRCNMMGLEUILLG-NTSWFWBYSA-N (4s,5r)-4,5,6-trihydroxyhexan-2-one Chemical group CC(=O)C[C@H](O)[C@H](O)CO BRCNMMGLEUILLG-NTSWFWBYSA-N 0.000 description 1
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 description 1
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 1
- KISWVXRQTGLFGD-UHFFFAOYSA-N 2-[[2-[[6-amino-2-[[2-[[2-[[5-amino-2-[[2-[[1-[2-[[6-amino-2-[(2,5-diamino-5-oxopentanoyl)amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-(diaminomethylideneamino)p Chemical compound C1CCN(C(=O)C(CCCN=C(N)N)NC(=O)C(CCCCN)NC(=O)C(N)CCC(N)=O)C1C(=O)NC(CO)C(=O)NC(CCC(N)=O)C(=O)NC(CCCN=C(N)N)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 KISWVXRQTGLFGD-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- CVOFKRWYWCSDMA-UHFFFAOYSA-N 2-chloro-n-(2,6-diethylphenyl)-n-(methoxymethyl)acetamide;2,6-dinitro-n,n-dipropyl-4-(trifluoromethyl)aniline Chemical compound CCC1=CC=CC(CC)=C1N(COC)C(=O)CCl.CCCN(CCC)C1=C([N+]([O-])=O)C=C(C(F)(F)F)C=C1[N+]([O-])=O CVOFKRWYWCSDMA-UHFFFAOYSA-N 0.000 description 1
- 102000040125 5-hydroxytryptamine receptor family Human genes 0.000 description 1
- 108091032151 5-hydroxytryptamine receptor family Proteins 0.000 description 1
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 1
- 102100033350 ATP-dependent translocase ABCB1 Human genes 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-M Acrylate Chemical compound [O-]C(=O)C=C NIXOWILDQLNWCW-UHFFFAOYSA-M 0.000 description 1
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 102000011690 Adiponectin Human genes 0.000 description 1
- 108010076365 Adiponectin Proteins 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- ZVWXMTTZJKBJCI-BHDSKKPTSA-N Ala-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 ZVWXMTTZJKBJCI-BHDSKKPTSA-N 0.000 description 1
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 1
- XKHLBBQNPSOGPI-GUBZILKMSA-N Ala-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N XKHLBBQNPSOGPI-GUBZILKMSA-N 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 101100412103 Arabidopsis thaliana REC3 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 1
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- ZTRJUKDEALVRMW-SRVKXCTJSA-N Asn-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZTRJUKDEALVRMW-SRVKXCTJSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- ZVUMKOMKQCANOM-AVGNSLFASA-N Asn-Phe-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVUMKOMKQCANOM-AVGNSLFASA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- OEDJQRXNDRUGEU-SRVKXCTJSA-N Asp-Leu-His Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O OEDJQRXNDRUGEU-SRVKXCTJSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 1
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 101000755699 Bos taurus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 108700031361 Brachyury Proteins 0.000 description 1
- 101800004538 Bradykinin Proteins 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 102000049320 CD36 Human genes 0.000 description 1
- 108010045374 CD36 Antigens Proteins 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 102100033093 Calcium/calmodulin-dependent protein kinase type II subunit alpha Human genes 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 101000755689 Canis lupus familiaris Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 101800005309 Carboxy-terminal peptide Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000010804 Caulobacter vibrioides Species 0.000 description 1
- 102000003727 Caveolin 1 Human genes 0.000 description 1
- 108090000026 Caveolin 1 Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 241000867607 Chlorocebus sabaeus Species 0.000 description 1
- 102100031196 Choriogonadotropin subunit beta 3 Human genes 0.000 description 1
- 102100031162 Collagen alpha-1(XVIII) chain Human genes 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000003706 Complement factor D Human genes 0.000 description 1
- 108090000059 Complement factor D Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- OCUCCJIRFHNWBP-IYEMJOQQSA-L Copper gluconate Chemical class [Cu+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O OCUCCJIRFHNWBP-IYEMJOQQSA-L 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- LLUXQOVDMQZMPJ-KKUMJFAQSA-N Cys-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CS)CC1=CC=C(O)C=C1 LLUXQOVDMQZMPJ-KKUMJFAQSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 230000003682 DNA packaging effect Effects 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 description 1
- 108010079505 Endostatins Proteins 0.000 description 1
- 108010092674 Enkephalins Proteins 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241001344598 Ezakiella Species 0.000 description 1
- 102000008857 Ferritin Human genes 0.000 description 1
- 108050000784 Ferritin Proteins 0.000 description 1
- 238000008416 Ferritin Methods 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 102000004437 G-Protein-Coupled Receptor Kinase 1 Human genes 0.000 description 1
- 108091004242 G-Protein-Coupled Receptor Kinase 1 Proteins 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 101150014889 Gad1 gene Proteins 0.000 description 1
- 108090000577 Geminin Proteins 0.000 description 1
- 102000004064 Geminin Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- WPJDPEOQUIXXOY-AVGNSLFASA-N Gln-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WPJDPEOQUIXXOY-AVGNSLFASA-N 0.000 description 1
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- NPMSEUWUMOSEFM-CIUDSAMLSA-N Glu-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N NPMSEUWUMOSEFM-CIUDSAMLSA-N 0.000 description 1
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 1
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 102100035902 Glutamate decarboxylase 1 Human genes 0.000 description 1
- 102100035857 Glutamate decarboxylase 2 Human genes 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- UYPPAMNTTMJHJW-KCTSRDHCSA-N Gly-Ile-Trp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UYPPAMNTTMJHJW-KCTSRDHCSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- NMJREATYWWNIKX-UHFFFAOYSA-N GnRH Chemical compound C1CCC(C(=O)NCC(N)=O)N1C(=O)C(CC(C)C)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)CNC(=O)C(NC(=O)C(CO)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C(CC=1NC=NC=1)NC(=O)C1NC(=O)CC1)CC1=CC=C(O)C=C1 NMJREATYWWNIKX-UHFFFAOYSA-N 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- QXZGBUJJYSLZLT-UHFFFAOYSA-N H-Arg-Pro-Pro-Gly-Phe-Ser-Pro-Phe-Arg-OH Natural products NC(N)=NCCCC(N)C(=O)N1CCCC1C(=O)N1C(C(=O)NCC(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CO)C(=O)N2C(CCC2)C(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CCCN=C(N)N)C(O)=O)CCC1 QXZGBUJJYSLZLT-UHFFFAOYSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- YPLYIXGKCRQZGW-SRVKXCTJSA-N His-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YPLYIXGKCRQZGW-SRVKXCTJSA-N 0.000 description 1
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 1
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- NNBWMLHQXBTIIT-HVTMNAMFSA-N His-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N NNBWMLHQXBTIIT-HVTMNAMFSA-N 0.000 description 1
- ZYDYEPDFFVCUBI-SRVKXCTJSA-N His-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZYDYEPDFFVCUBI-SRVKXCTJSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- UQTKYYNHMVAOAA-HJPIBITLSA-N His-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N UQTKYYNHMVAOAA-HJPIBITLSA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 1
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- 101000944249 Homo sapiens Calcium/calmodulin-dependent protein kinase type II subunit alpha Proteins 0.000 description 1
- 101000776619 Homo sapiens Choriogonadotropin subunit beta 3 Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000742769 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 101000873786 Homo sapiens Glutamate decarboxylase 2 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000742373 Homo sapiens Vesicular inhibitory amino acid transporter Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- CISBRYJZMFWOHJ-JBDRJPRFSA-N Ile-Ala-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N CISBRYJZMFWOHJ-JBDRJPRFSA-N 0.000 description 1
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 101150105817 Irbp gene Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 102100035792 Kininogen-1 Human genes 0.000 description 1
- 102000015335 Ku Autoantigen Human genes 0.000 description 1
- 108010025026 Ku Autoantigen Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 1
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- JLYUZRKPDKHUTC-WDSOQIARSA-N Leu-Pro-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JLYUZRKPDKHUTC-WDSOQIARSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- NNJVILVZKWQKPM-UHFFFAOYSA-N Lidocaine Chemical compound CCN(CC)CC(=O)NC1=C(C)C=CC=C1C NNJVILVZKWQKPM-UHFFFAOYSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 108010071324 Livagen Proteins 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 1
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 241000699673 Mesocricetus auratus Species 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- AFVOKRHYSSFPHC-STECZYCISA-N Met-Ile-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFVOKRHYSSFPHC-STECZYCISA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- JOYFULUKJRJCSX-IUCAKERBSA-N Met-Met-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O JOYFULUKJRJCSX-IUCAKERBSA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- KLGIQJRMFHIGCQ-ZFWWWQNUSA-N Met-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)NCC(O)=O)=CNC2=C1 KLGIQJRMFHIGCQ-ZFWWWQNUSA-N 0.000 description 1
- PNHRPOWKRRJATF-IHRRRGAJSA-N Met-Tyr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 PNHRPOWKRRJATF-IHRRRGAJSA-N 0.000 description 1
- JHVNNUIQXOGAHI-KJEVXHAQSA-N Met-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N)O JHVNNUIQXOGAHI-KJEVXHAQSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- LPNWWHBFXPNHJG-AVGNSLFASA-N Met-Val-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN LPNWWHBFXPNHJG-AVGNSLFASA-N 0.000 description 1
- CKAVKDJBSNTJDB-SRVKXCTJSA-N Met-Val-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCSC CKAVKDJBSNTJDB-SRVKXCTJSA-N 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 241000736257 Monodelphis domestica Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101100377883 Mus musculus Apobec1 gene Proteins 0.000 description 1
- 101100377889 Mus musculus Apobec2 gene Proteins 0.000 description 1
- 101100489911 Mus musculus Apobec3 gene Proteins 0.000 description 1
- 101000755751 Mus musculus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 102000008763 Neurofilament Proteins Human genes 0.000 description 1
- 108010088373 Neurofilament Proteins Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 230000010718 Oxidation Activity Effects 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 101100214779 Pan troglodytes APOBEC3G gene Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 102100027913 Peptidyl-prolyl cis-trans isomerase FKBP1A Human genes 0.000 description 1
- 241000251745 Petromyzon marinus Species 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- VUYCNYVLKACHPA-KKUMJFAQSA-N Phe-Asp-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VUYCNYVLKACHPA-KKUMJFAQSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- ROOQMPCUFLDOSB-FHWLQOOXSA-N Phe-Phe-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ROOQMPCUFLDOSB-FHWLQOOXSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 1
- WDOCBGZHAQQIBL-IHPCNDPISA-N Phe-Trp-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 WDOCBGZHAQQIBL-IHPCNDPISA-N 0.000 description 1
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- GAMLAXHLYGLQBJ-UFYCRDLUSA-N Phe-Val-Tyr Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC1=CC=C(C=C1)O)C(C)C)CC1=CC=CC=C1 GAMLAXHLYGLQBJ-UFYCRDLUSA-N 0.000 description 1
- 102220469981 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN_D38G_mutation Human genes 0.000 description 1
- 102000015439 Phospholipases Human genes 0.000 description 1
- 108010064785 Phospholipases Proteins 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 102100031574 Platelet glycoprotein 4 Human genes 0.000 description 1
- 101710202087 Platelet glycoprotein 4 Proteins 0.000 description 1
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 1
- 101710124239 Poly(A) polymerase Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 101710150114 Protein rep Proteins 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 102000007156 Resistin Human genes 0.000 description 1
- 108010047909 Resistin Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 101710137010 Retinol-binding protein 3 Proteins 0.000 description 1
- 102100038247 Retinol-binding protein 3 Human genes 0.000 description 1
- 102100040756 Rhodopsin Human genes 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 108090000799 Rhodopsin kinases Proteins 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 101100528972 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPD3 gene Proteins 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- BIWBTRRBHIEVAH-IHPCNDPISA-N Ser-Tyr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BIWBTRRBHIEVAH-IHPCNDPISA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 241000863432 Shewanella putrefaciens Species 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 238000012167 Small RNA sequencing Methods 0.000 description 1
- 102100029937 Smoothelin Human genes 0.000 description 1
- 101710151526 Smoothelin Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 102100028897 Stearoyl-CoA desaturase Human genes 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 102000001435 Synapsin Human genes 0.000 description 1
- 108050009621 Synapsin Proteins 0.000 description 1
- 102000017299 Synapsin-1 Human genes 0.000 description 1
- 108050005241 Synapsin-1 Proteins 0.000 description 1
- 108091012456 T4 RNA ligase 1 Proteins 0.000 description 1
- 101150052863 THY1 gene Proteins 0.000 description 1
- 102000003570 TRPV5 Human genes 0.000 description 1
- 108010006877 Tacrolimus Binding Protein 1A Proteins 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000005497 Thymidylate Synthase Human genes 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000013534 Troponin C Human genes 0.000 description 1
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 1
- UTQBQJNSNXJNIH-IHPCNDPISA-N Trp-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N UTQBQJNSNXJNIH-IHPCNDPISA-N 0.000 description 1
- WACMTVIJWRNVSO-CWRNSKLLSA-N Trp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O WACMTVIJWRNVSO-CWRNSKLLSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 1
- 101150034091 Trpv5 gene Proteins 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- KSVMDJJCYKIXTK-IGNZVWTISA-N Tyr-Ala-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KSVMDJJCYKIXTK-IGNZVWTISA-N 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- DXUVJJRTVACXSO-KKUMJFAQSA-N Tyr-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DXUVJJRTVACXSO-KKUMJFAQSA-N 0.000 description 1
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- LFCQXIXJQXWZJI-BZSNNMDCSA-N Tyr-His-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O LFCQXIXJQXWZJI-BZSNNMDCSA-N 0.000 description 1
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- KRXFXDCNKLANCP-CXTHYWKRSA-N Tyr-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 KRXFXDCNKLANCP-CXTHYWKRSA-N 0.000 description 1
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 102100038170 Vesicular inhibitory amino acid transporter Human genes 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- 239000000205 acacia gum Substances 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009056 active transport Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 229940059260 amidate Drugs 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000003708 ampul Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000001772 anti-angiogenic effect Effects 0.000 description 1
- 238000011394 anticancer treatment Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 1
- 239000008228 bacteriostatic water for injection Substances 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- QXZGBUJJYSLZLT-FDISYFBBSA-N bradykinin Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CCC1 QXZGBUJJYSLZLT-FDISYFBBSA-N 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- BPKIGYQJPYCAOW-FFJTTWKXSA-I calcium;potassium;disodium;(2s)-2-hydroxypropanoate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].C[C@H](O)C([O-])=O BPKIGYQJPYCAOW-FFJTTWKXSA-I 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 239000008119 colloidal silica Substances 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 239000008139 complexing agent Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000000599 controlled substance Substances 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 238000012236 epigenome editing Methods 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- VYSYZMNJHYOXGN-UHFFFAOYSA-N ethyl n-aminocarbamate Chemical compound CCOC(=O)NN VYSYZMNJHYOXGN-UHFFFAOYSA-N 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 230000002964 excitative effect Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 210000001222 gaba-ergic neuron Anatomy 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 230000004034 genetic regulation Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 102000043482 human APOBEC2 Human genes 0.000 description 1
- 102000048646 human APOBEC3A Human genes 0.000 description 1
- 102000048415 human APOBEC3B Human genes 0.000 description 1
- 102000048419 human APOBEC3C Human genes 0.000 description 1
- 102000043429 human APOBEC3D Human genes 0.000 description 1
- 102000049338 human APOBEC3F Human genes 0.000 description 1
- 102000044839 human APOBEC3H Human genes 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000009851 immunogenic response Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 150000002485 inorganic esters Chemical class 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000000185 intracerebroventricular administration Methods 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 239000000644 isotonic solution Substances 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- 231100000636 lethal dose Toxicity 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 150000002617 leukotrienes Chemical class 0.000 description 1
- 229960004194 lidocaine Drugs 0.000 description 1
- 239000012669 liquid formulation Substances 0.000 description 1
- 238000010859 live-cell imaging Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 239000003589 local anesthetic agent Substances 0.000 description 1
- 230000007762 localization of cell Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 239000012931 lyophilized formulation Substances 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 238000007885 magnetic separation Methods 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000013081 microcrystal Substances 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 108010065781 myosin light chain 2 Proteins 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000005044 neurofilament Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 150000002895 organic esters Chemical class 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical group [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 1
- 229960000502 poloxamer Drugs 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 231100000683 possible toxicity Toxicity 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- ZJFJVRPLNAMIKH-UHFFFAOYSA-N pseudo-u Chemical compound O=C1NC(=O)C(C)=CN1C1OC(COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)CO)C(O)C1 ZJFJVRPLNAMIKH-UHFFFAOYSA-N 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 102000029752 retinol binding Human genes 0.000 description 1
- 108091000053 retinol binding Proteins 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102220102929 rs762648754 Human genes 0.000 description 1
- 102220089709 rs869320709 Human genes 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010063779 seryl-tyrosyl-prolyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229920000260 silastic Polymers 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 239000008227 sterile water for injection Substances 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 235000012222 talc Nutrition 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000031998 transcytosis Effects 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 102000027257 transmembrane receptors Human genes 0.000 description 1
- 108091008578 transmembrane receptors Proteins 0.000 description 1
- 150000003852 triazoles Chemical class 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 230000002227 vasoactive effect Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- XOOUIPVCVHRTMJ-UHFFFAOYSA-L zinc stearate Chemical compound [Zn+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O XOOUIPVCVHRTMJ-UHFFFAOYSA-L 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04001—Cytosine deaminase (3.5.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04002—Adenine deaminase (3.5.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/42—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a HA(hemagglutinin)-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/43—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Immunology (AREA)
- Virology (AREA)
- Gastroenterology & Hepatology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Bakery Products And Manufacturing Methods Therefor (AREA)
Abstract
본 발명은 핵산 표적화 및 조작을 위해 인간 세포에 최적화된 재조합적으로 조작된 신규 Cas9 효소를 제조하고 사용하기 위한 신규 시스템, 방법 및 조성물을 제공한다. 본 발명은 인간 세포에 사용하기 위해 코돈-최적화되고 재조합적으로 생성된 스트렙토코커스 콘스텔라투스(Streptococcus constellatus), 샤르펜(Sharpen) spp. 단리물 RUG017, 베일로넬라 파르불라(Veillonella parvula), 에자키엘라 페루엔시스(Ezakiella peruensis), 락토바실러스 퍼멘텀 균주(Lactobacillus fermentum strain) AF15-40LB 균주 및 펩토니필러스 sp. 마르세유(Peptoniphilus sp. Marseille)-P3761 박테리아로부터 신규 Cas9 효소의 발견에 기반한다. 일부 구현예에서, 신규 Cas9 효소는 염기 편집을 위해 사용될 수 있다. 일부 구현예에서, 신규 조작된 Cas9 효소는 인간 질병을 치료하기 위해 사용된다.
Description
관련 출원에 대한 상호 참조
본 출원은 모든 목적을 위해 전체적으로 본원에 참고로 통합되는 2021년 3월 23일에 출원된 미국 가특허 출원 일련번호 제63/164,798호의 우선권을 주장한다.
원핵생물의 일정한 간격으로 놓인 짧은 회문 반복부 집합(CRISPR) 및 CRISPR-연관 단백질(CRISPR-Cas) 시스템 유래의 효소가 진핵생물에서 사용하기 위해 재프로그래밍 가능한 매우 특이적인 게놈 편집 도구(tool)로서 활용되었다. 게놈 편집 및 절단 이외에, CRISPR-Cas9는 게놈 상의 특이적 부위에 이펙터 분자를 위치시키기 위해 사용될 수 있어, 다양한 메커니즘을 통한 유전적 및 후생적 조절과 전사적 조절을 가능하게 한다.
그러나, 다양한 게놈과 게놈 표적은 효과적인 유전자 조작을 위한 다양한 도구를 필요로 하고, 다양한 서열을 인식하고 표적으로 할 수 있는 신규 Cas 단백질을 발견하고 조작하여 CRISPR 도구상자를 확장해야 할 필요성이 여전히 남아 있다.
유전자를 녹아웃시키거나 유전자 발현을 변형시키기 위해 CRISPR-Cas9 시스템을 사용할 수 있지만, 특정 종류의 유전자 편집에는 유전자 내 단일 염기 편집과 같이 표적 유전자에 대한 정확한 변형이 필요하다. 이러한 정확한 변형은 여전히 기술적 과제로 남아 있고, 광범위한 표적 유전자에서 정확한 게놈 변형을 수행하기 위해 다양한 유전자 편집 도구키트를 필요로 한다.
발명의 요약
고유의 프로토스페이서 인접 모티프(PAM)에 대하여 특이성을 갖는 신규 Cas9 효소를 식별하여, 유전자 편집을 위해 이용가능한 도구를 확장할 수 있다. 본 발명은 특히 스트렙토코커스 콘스텔라투스(Streptococcus constellatus), 샤르페아(Sharpea) spp. 단리물 RUG017, 베일로넬라 파르불라(Veillonella parvula), 에자키엘라 페루엔시스(Ezakiella peruensis), 락토바실러스 퍼멘텀 균주(Lactobacillus fermentum strain) AF15-40LB 또는 펩토니필러스 sp. 마르세유(Peptoniphilus sp. Marseille)-P3761 박테리아로부터 단리된 조작된 비천연 발생한 신규 Cas9 효소를 제공한다. 본 발명은 특이적 PAM 서열을 인식하는 상이한 박테리아로부터 발견된 신규 Cas9 효소가 진핵 세포(예: 인간, 식물 등)에서 발현되도록 조작될 수 있다는 놀라운 발견에 부분적으로 기반한다. 따라서, 기술된 Cas9 효소 및 그 변이체는 진핵생물에서 기능한다. 여기에 제공된 예는 다양한 게놈 부위를 표적으로 하기 위해 다양한 PAM 인식 서열을 사용하여 인간 세포에서 조작된 비천연 Cas9 효소의 사용을 보여준다. 예를 들어, 스트렙토코커스 콘스텔라투스, 에자키엘라 페루엔시스 및 펩토니필러스 sp. 마르세유-P3761로부터 조작된 Cas9는 공통 PAM 서열 5'-NGG-3'을 인식한다. 샤르페아 spp. 단리물 RUG017로부터 단리된 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NAGHC-3'이다. 베일로넬라 파르불라로부터 단리된 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NRHRRH-3'으로 식별되었다. 락토바실러스 퍼멘텀 균주 AF15-40LB로부터 단리된 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NNAAA-3'으로 식별되었다.(H=A, C 또는 T; R=A 또는 G).
일 측면에서, 스트렙토코커스 콘스텔라투스 Cas9, 샤르페아 Cas9, 베일로넬라 파르불라 Cas9, 에자키엘라 페루엔시스 Cas9, 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9 또는 펩토니필러스 sp. 마르세유-P3761 Cas9로부터 변형되는 조작된, 비천연 발생 Cas9 단백질이 본원에 제공된다.
일부 구현예에서, 상기 스트렙토코커스 콘스텔라투스 Cas9 단백질은
MGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGED (서열번호 1)와 적어도 80% 서열 동일성을 가진다.
일부 구현예에서, 상기 샤르페아 Cas9 단백질은
MAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKL (서열번호 4)와 적어도 80% 서열 동일성을 가진다.
일부 구현예에서, 상기 베일로넬라 파르불라 Cas9 단백질은 MSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIV (서열번호 8)와 적어도 80% 서열 동일성을 가진다.
일부 구현예에서, 상기 에자키엘라 페루엔시스 Cas9 단백질은 MTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKL (서열번호 14)와 적어도 80% 서열 동일성을 가진다.
일부 구현예에서, 상기 락토바실러스 퍼멘텀 Cas9 단백질은
MKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNL (서열번호 84)와 적어도 80% 서열 동일성을 가진다.
일부 구현예에서, 상기 펩토니필러스 sp. 마르세유-P3761 Cas9 단백질은
MEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFED (서열번호 86)와 적어도 80% 서열 동일성을 가진다.
일부 구현예에서, Cas9 단백질은 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산을 포함한다.
일부 구현예에서, Cas9 단백질은 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함한다.
일부 구현예에서, 상기 스트렙토코커스 콘스텔라투스 Cas9는 MPKKKRKVGGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 2)와 적어도 80% 서열 동일한 아미노산 서열을 가진다.
일부 구현예에서, 상기 샤르페아 Cas9는
MPKKKRKVGAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 5)와 적어도 80% 동일한 아미노산 서열을 가진다.
일부 구현예에서, 상기 베일로넬라 파르불라 Cas9는
MPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 9)와 적어도 80% 동일한 아미노산 서열을 가진다.
일부 구현예에서, 상기 에자키엘라 페루엔시스 Cas9는
MPKKKRKVGTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 15)와 적어도 80% 동일한 아미노산 서열을 가진다.
일부 구현예에서, 상기 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9는
MPKKKRKVGKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 85)와 적어도 80% 동일한 아미노산 서열을 가진다.
일부 구현예에서, 상기 펩토니필러스 sp. 마르세유-P3761 Cas9가
MPKKKRKVGEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 87)와 적어도 80% 동일한 아미노산 서열을 가진다.
일부 구현예에서, 상기 Cas9 단백질의 아미노산 서열은 서열번호 1, 4, 8, 14, 84 또는 86에서 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개 또는 적어도 10개의 돌연변이를 포함한다.
일부 구현예에서, 상기 돌연변이는 아미노산 치환이다.
일부 구현예에서, 상기 Cas9 단백질은 닉카제 활성을 가진다.
일부 구현예에서, 야생형 SpCas9의 1개 이상의 아미노산 10, 12, 17, 762, 840, 854, 863, 982, 983, 984, 986, 987에 상응하는 아미노산 위치에서 닉카제 돌연변이를 포함하는 Cas9 단백질이 본원에 제공된다.
일부 구현예에서, 적어도 1개의 돌연변이가 불활성 Cas9(dCas9)를 초래한다.
일부 구현예에서, 상기 Cas9 단백질은 PAM 상호작용, HNH 및/또는 RuvC 도메인에 적어도 1개의 아미노산 돌연변이를 포함한다.
일부 구현예에서, 아미노산 위치에서 돌연변이는 SirCas9의 RuvC 도메인에서의 아미노산 14에 상응하는 Cas9 단백질이 본원에 제공된다.
일부 구현예에서, 아미노산 위치에서 돌연변이는 EpeCas9의 RuvC 도메인에서의 아미노산 12에 상응하는 Cas9 단백질이 본원에 제공된다.
일부 구현예에서, 아미노산 위치에서 돌연변이는 LfeCas9의 RuvC 도메인에서의 아미노산 9에 상응하는 Cas9 단백질이 본원에 제공된다.
일부 구현예에서, 아미노산 위치에서 돌연변이는 PmaCas9의 RuvC 도메인에서의 아미노산 12에 상응하는 Cas9 단백질이 본원에 제공된다.
일부 구현예에서, 상기 Cas9 단백질은 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함한다.
일 측면에서, 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 동일성을 갖는 Cas9 단백질을 포함하는 조작된 비천연 발생 Cas9 융합 단백질이 본원에 제공되고 상기 Cas9 단백질은 히스톤 데메틸라제, 전사 활성화인자 또는 데아미나제에 융합된다.
일부 구현예에서, 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는 조작된 비천연 발생 Cas9 융합 단백질이 본원에 제공된다.
일부 구현예에서, 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96과 적어도 80% 동일성을 갖는 조작된 비천연 발생 Cas9 융합 단백질이 본원에 제공된다.
일부 구현예에서, 상기 Cas9 단백질은 시토신 데아미나제 또는 아데노신 데아미나제에 융합된다.
일부 구현예에서, 상기 Cas9 단백질은 아데노신 데아미나제에 융합되고
(a) MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 20);
(b) MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGAKNKDIRYSIGLAIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 6);
(c)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 10);
(d) MPKKKRKVSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 11);
(e)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 16);
(f) MPKKKRKVTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 17);
(g) MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 88);
(h) MPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 89); 또는
(i)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 91);
(j) MPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 92)와 적어도 80% 동일한 아미노산 서열을 갖는다.
일부 구현예에서, Cas9 단백질은 시토신 데아미나제에 융합되고
(a) MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 21);
(b)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 12);
(c) MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 18);
(d) MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 90);
(e)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 93); 또는
(f)
MPAAKRVKLDTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 94)와 적어도 80% 동일한 아미노산 서열을 가진다.
일부 구현예에서, 스트렙토코커스 콘스텔라투스 Cas9 단백질은 5'-NGG-3'을 포함하는 PAM 서열을 인식한다.
일부 구현예에서, 스트렙토코커스 콘스텔라투스 Cas9 단백질은 5'-NGC-3'을 포함하는 PAM 서열을 인식한다.
일부 구현예에서, 본원에 개시된 Cas9 단백질(예: SirCas9, VapCas9, EpeCas9, LfeCas9 또는 PmaCas9)은 5'-NGC-3'을 포함하는 PAM 서열을 인식한다.
일부 구현예에서, 샤르페아 Cas9 단백질은 5'-NAGHC-3'을 포함하는 PAM 서열을 인식하고, H는 A, C 또는 T이다.
일부 구현예에서, 베일로넬라 파르불라 Cas9 단백질은 5'-NRHRRH-3'을 포함하는 PAM 서열을 인식하고, H는 아데닌, 시토신 또는 티민이고, R은 아데닌 또는 구아닌이다.
일부 구현예에서, 에자키엘라 페루엔시스 Cas9 단백질은 5'-NGG-3'을 포함하는 PAM 서열을 인식한다.
일부 구현예에서, 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9 단백질은 5'-NGG-3'을 포함하는 PAM 서열을 인식한다.
일부 구현예에서, 펩토니필러스 sp. 마르세유-P3761 Cas9 단백질은 5'-NNAAA-3'을 포함하는 PAM 서열을 인식한다.
일부 구현예에서, 상기 Cas9 단백질을 암호화하는 핵산이 제공된다.
일부 구현예에서, 상기 핵산은 포유동물 세포에서 발현되도록 코돈-최적화된다.
일부 구현예에서, 상기 핵산은 인간 세포에서 발현되도록 코돈-최적화된다.
일부 구현예에서, 상기 Cas9 단백질을 포함하는 진핵 세포가 제공된다.
일부 구현예에서, 상기 세포는 인간 세포이다. 일부 구현예에서, 상기 세포는 식물 세포이다.
일 측면에서, 세포를 본원에 기술된 바와 같은 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열의 파손을 유발할 수 있는, 진핵 세포에서 표적 핵산을 절단하는 방법이 제공된다.
일 측면에서, 세포를 본원에 기술된 바와 같은 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열의 파손을 유발할 수 있는, 진핵 세포에서 표적 핵산의 발현을 변경하는 방법이 제공된다.
일 측면에서, 세포를 본원에 기술된 바와 같은 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는, 진핵 세포에서 표적 핵산의 발현을 변경하는 방법이 제공된다.
일 측면에서, 세포를 본원에 기술된 바와 같은 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는, 진핵 세포에서 표적 핵산을 변형하는 방법이 제공된다.
일부 구현예에서, 상기 Cas9 단백질은 불활성 Cas9(dCas9)이다.
일부 구현예에서, 상기 dCas9는 데아미나제에 융합된다.
일부 구현예에서, 상기 RNA 가이드는 crRNA 및 tracrRNA를 포함한다.
일부 구현예에서, 상기 RNA 가이드는 sgRNA를 포함한다.
일부 구현예에서, 스트렙토코커스 콘스텔라투스 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUCAAGCUUGCAAAAGCGUGCACCGAUUCGGUGCU-3' (서열번호 3)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 구현예에서, 샤르페아 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3' (서열번호 7)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 구현예에서, 베일로넬라 파르불라 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3' (서열번호 13)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 구현예에서, 에자키엘라 페루엔시스 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3' (서열번호 19)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 구현예에서, 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9와 함께 사용하기 위한 sgRNA는 5'-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3' (서열번호 95)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 구현예에서, 펩토니필러스 sp. 마르세유-P3761 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3' (서열번호 96)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 구현예에서, 상기 crRNA는 약 16 내지 26개의 뉴클레오티드 길이의 가이드 서열을 포함한다.
일부 구현예에서, 상기 crRNA는 18 내지 24개의 뉴클레오티드 길이의 가이드 서열을 포함한다.
일부 구현예에서, 표적 핵산에서의 파손은 단일 가닥 또는 이중 가닥의 파손이다.
일부 구현예에서, 표적 핵산에서의 파손은 단일 가닥의 파손이다.
일부 구현예에서, Cas9 단백질은 상기 표적 핵산 서열의 두 가닥 모두를 절단하는 뉴클레아제이다. 일부 구현예에서, Cas9는 상기 표적 핵산 서열의 한 가닥을 절단하는 닉카제이다.
일부 구현예에서, 상기 표적 핵산은 5' 내지 프로토스페이서 인접 모티프(PAM)이다.
일부 구현예에서, 상기 Cas9는 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결되고, 상기 가이드 RNA는 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결된다.
일부 구현예에서, 상기 진핵 세포는 인간 세포이다.
일부 구현예에서, 상기 프로모터 서열은 진핵 또는 바이러스의 프로모터이다.
일 측면에서, RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산; 및 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 서열 동일성을 갖는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하는 조작된 비천연 발생 CRISPR-Cas 시스템이 본원에 제공되고, 상기 RNA 가이드는 직접 반복 서열, 및 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas 단백질은 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열에서의 파손을 유발할 수 있다.
일부 구현예에서, 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96과 적어도 80% 서열 동일성을 갖는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하는 조작된 비천연 발생 CRISPR-Cas 시스템이 본원에 제공되고, 상기 Cas 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열에서의 파손을 유발할 수 있다.
일 측면에서, RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산; 및 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 서열 동일성을 갖는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하는 조작된 비천연 발생 CRISPR-Cas 시스템이 본원에 제공되고, 상기 RNA 가이드는 직접 반복 서열, 및 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas 단백질은 데아미나제에 융합되고, Cas 단백질 융합은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있다.
일부 구현예에서, 조작된 비천연 발생 CRISPR-Cas 시스템은 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함한다.
일부 구현예에서, 조작된 비천연 발생 CRISPR-Cas 시스템은 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96과 적어도 80% 서열 동일성을 갖는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하고, 상기 Cas 단백질은 데아미나제에 융합되고, 상기 Cas 단백질 융합은 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있다.
일 구현예에서, 상기 Cas9 단백질은 불활성 Cas9(dCas9)이다.
일 구현예에서, 상기 RNA 가이드는 crRNA 및 tracrRNA를 포함한다.
일 구현예에서, 상기 RNA 가이드는 sgRNA를 포함한다.
일 구현예에서, 상기 Cas 단백질은 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결되고, 상기 가이드 RNA는 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결된다.
일 구현예에서, 상기 진핵 세포는 인간 세포이다.
일 구현예에서, 상기 프로모터 서열은 진핵 프로모터 서열이다.
일 구현예에서, 본원에 기술된 시스템을 암호화하는 핵산이 제공된다.
일 구현예에서, 본원에 기술된 시스템을 포함하는 벡터가 제공된다.
일 구현예에서, 상기 벡터는 플라스미드 벡터 또는 바이러스 벡터이다.
일 구현예에서, 상기 바이러스 벡터는 아데노 연관 바이러스(AAV) 벡터 또는 렌티바이러스 벡터이다.
일 구현예에서, 상기 바이러스 벡터는 AAV 벡터이다.
일 구현예에서, 1개 초과의 AAV 벡터는 상기 시스템을 패키징하기 위해 사용된다.
일 구현예에서, 장애 또는 질병 치료를 필요로 하는 대상체에서 장애 또는 질병을 치료하는 방법은 본원에 기술된 시스템을 상기 대상체에게 투여하는 것을 포함하고, 상기 가이드 RNA는 병태 또는 질병과 연관된 표적 핵산의 적어도 10개 뉴클레오티드에 상보적이고; 상기 Cas 단백질은 상기 가이드 RNA와 연관되고; 상기 가이드 RNA는 상기 표적 핵산에 결합하고; 상기 Cas 단백질은 표적 핵산에서의 파손을 유발하고, 선택적으로 상기 Cas9는 데아미나제에 융합된 불활성 Cas9(dCas9)이고 상기 표적 핵산에서 하나 이상의 염기 편집을 초래하여, 상기 장애 또는 질병을 치료한다.
일부 구현예에서, 상기 가이드 RNA는 약 18 내지 24개의 뉴클레오티드에 상보적이다.
일부 구현예에서, 상기 가이드 RNA는 20개의 뉴클레오티드에 상보적이다.
일부 구현예에서, 상기 염기 편집기는 융합 단백질을 포함한다.
일부 구현예에서, 상기 염기 편집기는 아데노신 데아미나제 도메인 또는 시티딘 데아미나제 도메인을 포함한다.
일부 구현예에서, 폴리뉴클레오티드의 핵염기를 편집하는 방법이 본원에 제공되고, 상기 방법은 1개 이상의 가이드 RNA와의 복합체에서 염기와 폴리뉴클레오티드를 접촉시키는 것을 포함하고, 상기 염기 편집기는 아데노신 데아미나제 도메인을 포함하고, 상기 1개 이상의 가이드 RNA는 폴리뉴클레오티드에서 A·T에서 G·C로 변경을 이루도록 염기 편집기를 표적으로 한다.
일부 구현예에서, 폴리뉴클레오티드의 핵염기를 편집하는 방법이 본원에 제공되고, 상기 방법은 1개 이상의 가이드 RNA와의 복합체에서 염기 편집기와 폴리뉴클레오티드를 접촉시키는 것을 포함하고, 상기 염기 편집기는 시티딘 데아미나제 도메인을 포함하고, 상기 1개 이상의 가이드 RNA는 폴리뉴클레오티드에서 G·C에서 T·A로 변경을 이루도록 염기 편집기를 표적으로 한다.
일부 구현예에서, 상기 편집이 표적 폴리뉴클레오티드 서열에서 50% 미만의 삽입결실 형성을 초래한다.
일부 구현예에서, 상기 편집이 점 돌연변이를 발생시킨다.
정의
본 발명이 보다 쉽게 이해되도록, 일부 용어가 다음에서 먼저 정의된다. 다음 용어 및 다른 용어에 대한 추가 정의가 명세서 전반에 명시되어 있다.
부정관사(A 또는 An); 부정관사는 하나 또는 1개 초과의(즉, 적어도 하나의) 문법상 물품 객체를 지칭하기 위해 본원에서 사용된다. 예를 들어, "하나의 요소"는 1개 요소 또는 1개보다 많은 요소를 의미한다.
대략 또는 약: 본원에서 사용될 때 용어 "대략" 또는 "약"은 1개 이상의 관심 값에 적용되는 경우에 명시된 참조 값과 유사한 값을 의미한다. 일부 구현예에서, 용어 "대략" 또는 "약"은 문맥에서 달리 명시하거나 달리 명백하지 않는 한, 명시된 참조 값의 한 방향으로(초과 또는 미만으로) 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 이하 이내에 속하는 값의 범위를 의미한다(해당 숫자가 가능한 값의 100%를 초과하는 경우는 예외).
연관된: 상기 용어가 본원에서 사용될 때 하나의 존재, 수치 및/또는 형태가 다른 것과 상관관계를 가지는 경우 2개의 사건 또는 단위체가 서로에 "연관된"다. 예를 들어, 특정 단위체(예: 폴리펩티드)는 그 존재, 수치 및/또는 형태가 질병, 장애 또는 병태의 발생률 및/또는 감수성과 상관관계를 가지는 경우(예: 관련 모집단 전체에 걸쳐) 특정 질병, 장애 또는 병태와 연관된 것으로 간주한다. 일부 구현예에서, 2개 이상의 단위체가 직접적으로 또는 간접적으로 상호작용하여 서로에 물리적으로 근접하게 유지되는 경우 서로에 물리적으로 "연관된"다. 일부 구현예에서, 서로에 물리적으로 연관된 2개 이상의 단위체는 서로 공유적으로 연결되며; 일부 구현예에서, 서로에 물리적으로 연관된 2개 이상의 단위체는 서로 공유적으로 연결되지 않지만 예를 들어 수소 결합, 반 데르 발스 상호작용, 소수성 상호작용, 자성 및 이들의 조합에 의해 비공유적으로 연관된다.
염기 편집기: "염기 편집기(BE)" 또는 "핵염기 편집기(NBE)"라 함은 폴리뉴클레오티드에 결합하고 핵염기 변형 활성을 갖는 작용제(agent)를 의미한다. 다양한 구현예에서, 염기 편집기는 핵염기 변형 폴리펩티드(예를 들어, 데아미나제) 및 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)와 함께 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함한다. 다양한 구현예에서, 작용제는 염기 편집 활성을 갖는 단백질 도메인, 즉 핵산 분자(예를 들어, DNA) 내에 염기(예를 들어, A, T, C, G 또는 U)를 변형시킬 수 있는 도메인을 포함하는 생체분자 복합체이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 데아미나제 도메인에 융합되거나 연결된다. 일 구현예에서, 작용제는 염기 편집 활성을 갖는 1개 이상의 도메인을 포함하는 융합 단백질이다. 또 다른 구현예에서, 염기 편집 활성을 갖는 단백질 도메인은 가이드 RNA에 연결된다(예를 들어, 가이드 RNA 상의 RNA 결합 모티프 및 데아미나제에 융합된 RNA 결합 도메인을 통함). 일부 구현예에서, 염기 편집 활성을 갖는 도메인은 핵산 분자 내의 염기를 탈아미노화할 수 있다. 일부 구현예에서, 염기 편집기는 DNA 분자 내의 1개 이상의 염기를 탈아미노화할 수 있다. 일부 구현예에서, 염기 편집기는 DNA 내의 시토신(C) 또는 아데노신(A)을 탈아미노화할 수 있다. 일부 구현예에서, 염기 편집기는 DNA 내의 시토신(C)과 아데노신(A)을 탈아미노화할 수 있다. 일부 구현예에서, 염기 편집기는 시티딘 염기 편집기(CBE)이다. 일부 구현예에서, 염기 편집기는 아데노신 염기 편집기(ABE)이다. 일부 구현예에서, 염기 편집기는 아데노신 염기 편집기(ABE) 및 시티딘 염기 편집기(CBE)이다. 일부 구현예에서, 염기 편집기는 아데노신 데아미나제에 융합된 뉴클레아제-불활성 Cas9(dCas9)이다. 일부 구현예에서, 염기 편집기는 염기 절제 복구 억제제, 예를 들어 UGI 도메인, 또는 dISN 도메인에 융합된다. 일부 구현예에서, 융합 단백질은 데아미나제 및 염기 절제 복구 억제제, 예컨대 UGI 또는 dISN 도메인에 융합된 Cas9 닉카제를 포함한다. 다른 구현예에서, 염기 편집기는 무염기 염기 편집기이다. 염기 편집기에 대한 상세한 설명은 국제 PCT 출원 PCT/2017/045381호(WO2018/027078호) 및 PCT/US2016/058344호(WO2017/070632호)에 기술되어 있으며, 이들 각각은 전체적으로 본원에 참고로 통합된다. 또한 Komor, A.C., 등, "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., 등, "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); Komor, A.C., 등, "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017), 및 Rees, H.A., 등, "Base editing: precision chemistry on the genome and transcriptome of living cells." Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1을 참조하며, 이들 전체 내용은 본원에 참고로 통합된다.
염기 편집 활성: "염기 편집 활성"이라 함은 폴리뉴클레오티드 내의 염기를 화학적으로 변경시키는 작용을 의미한다. 일 구현예에서, 제1 염기는 제2 염기로 전환된다. 일 구현예에서, 염기 편집 활성은 시티딘 데아미나제 활성으로, 예를 들어 표적 C·G를 T·A로 전환시킨다. 또 다른 구현예에서, 염기 편집 활성은 아데노신 또는 아데닌 데아미나제 활성으로, 예를 들어 A·T를 G·C로 전환시킨다. 또 다른 구현예에서, 염기 편집 활성은 시토신 또는 시티딘 데아미나제 활성으로, 예를 들어 표적 C·G를 T·A로 전환시키고 아데노신 또는 아데닌 데아미나제 활성으로, 예를 들어 A·T를 G·C로 전환시킨다.
염기 편집기 시스템: 용어 "염기 편집기 시스템"은 표적 뉴클레오티드 서열의 핵염기를 편집하기 위한 시스템을 의미한다. 다양한 구현예에서, 염기 편집기(BE) 시스템은 (1) 표적 뉴클레오티드 서열에서 핵염기를 탈아미노화하기 위한 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9), 데아미나제 도메인 및 시티딘 데아미나제 도메인; 및 (2) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인과 함께 1개 이상의 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)를 포함한다. 다양한 구현예에서, 염기 편집기(BE) 시스템은 아데노신 데아미나제 또는 시티딘 데아미나제로부터 선택된 핵염기 편집기 도메인, 및 핵산 서열 특이적 결합 활성을 갖는 도메인을 포함한다. 일부 구현예에서, 염기 편집기 시스템은 (1) 표적 뉴클레오티드 서열에서 1개 이상의 핵염기를 탈아미노화하기 위한 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 데아미나제 도메인을 포함하는 염기 편집기(BE); 및 (2) 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인과 함께 1개 이상의 가이드 RNA를 포함한다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인이다. 일부 구현예에서, 염기 편집기는 시티딘 염기 편집기(CBE)이다. 일부 구현예에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기(ABE)이다. 일부 구현예에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기(ABE) 또는 시티딘 염기 편집기(CBE)이다.
일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 데아미나제 도메인과 비공유적으로 상호작용하거나 연관됨으로써 데아미나제 도메인을 표적 뉴클레오티드 서열에 대해 표적으로 할 수 있다. 예를 들어, 일부 구현예에서, 핵염기 편집 구성요소, 예를 들어 데아미나제 구성요소는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오타이드 결합 도메인의 일부인 추가적인 이종 부분 또는 도메인과 상호작용할 수 있거나 연관될 수 있거나 복합체를 형성할 수 있는 추가적인 이종 부분 또는 도메인을 포함할 수 있다. 일부 구현예에서, 추가적인 이종 부분은 폴리펩티드와 결합하거나, 상호작용하거나, 연관되거나, 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종 부분은 폴리뉴클레오티드와 결합하거나, 상호작용하거나, 연관되거나, 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종 부분은 가이드 폴리뉴클레오티드와 결합할 수 있다. 일부 구현예에서, 추가적인 이종 부분은 폴리펩티드 링커와 결합할 수 있다. 일부 구현예에서, 추가적인 이종 부분은 폴리뉴클레오티드 링커와 결합할 수 있다. 추가적인 이종 부분은 단백질 도메인일 수 있다. 일부 구현예에서, 추가적인 이종 부분은 K 상동체(KH) 도메인, MS2 코트 단백질 도메인, PP7 코트 단백질 도메인, SfMu Com 코트 단백질 도메인, 스테릴 알파 모티프, 텔로머라제 Ku 결합 모티프 및 Ku 단백질, 텔로머라제 Sm7 결합 모티프 및 Sm7 단백질, 또는 RNA 인식 모티프일 수 있다.
생물학적 활성; 본원에서 사용될 때 "생물학적 활성" 문구는 생물학적 시스템에서, 및 특히 유기체에서 활성을 갖는 임의의 작용제의 특징을 의미한다. 예를 들어, 유기체에 투여될 때 해당 유기체에 생물학적 효과를 갖는 작용제는 생물학적 활성인 것으로 간주된다. 특정 구현예에서, 펩티드가 생물학적 활성인 경우, 펩티드의 적어도 하나의 생물학적 활성을 공유하는 펩티드 부분은 일반적으로 "생물학적 활성" 부분으로 지칭된다.
절단; 본원에서 사용될 때 절단은 본원에 기술된 CRISPR 시스템의 뉴클레아제에 의해 형성된 표적 핵산에서의 파손을 의미한다. 일부 구현예에서, 절단 사건은 이중 가닥 DNA의 파손이다. 일부 구현예에서, 절단 사건은 단일 가닥 DNA의 파손이다. 일부 구현예에서, 절단 사건은 단일 가닥 RNA의 파손이다. 일부 구현예에서, 절단 사건은 이중 가닥 RNA의 파손이다.
상보적: 본원에서 사용될 때 상보적은 왓슨-크릭 염기 쌍을 형성하여 A 염기가 T와 쌍을 이루고 C 염기가 G와 쌍을 이루거나 두 번째 핵산 가닥 상에서 염기와 비전형적인 염기 쌍을 형성하도록 하는 핵산 가닥을 의미한다. 즉, 이는 적절한 조건 하에서 서로 혼성화되는 핵산을 의미한다.
일정한 간격으로 놓인 짧은 회문 반복부 집합(CRISPR)-연관(Cas) 시스템: 본원에서 사용될 때 CRISPR-Cas9 시스템은 CRISPR 이펙터를 암호화하는 서열을 포함하는 CRISPR-이펙터, RNA 가이드, 및 CRISPR 유전자좌의 기타 서열 및 전사체의 발현에 수반되거나 그 활성을 지시하는 핵산 및/또는 단백질을 의미한다. 일부 구현예에서, CRISPR 시스템은 조작된 비천연 발생 CRISPR 시스템이다. 일부 구현예에서, CRISPR 시스템의 구성요소는 시스템의 1개 이상의 구성요소를 암호화하는 핵산(들)(예를 들어, 벡터), 단백질 형태의 구성요소(들) 또는 이들의 조합을 포함할 수 있다.
CRISPR 어레이: 본원에서 사용될 때 용어 "CRISPR 어레이"는 CRISPR 반복부, 및 첫 번째 CRISPR 반복부의 첫 번째 뉴클레오티드에서 시작하고 마지막(말단) CRISPR 반복부의 마지막 뉴클레오티드에서 끝나는 스페이서를 포함하는 핵산(예를 들어, DNA) 세그먼트를 의미한다. 일반적으로, CRISPR 어레이의 각 스페이서는 2개 반복부 사이에 위치한다. 본원에서 사용될 때 용어 "CRISPR 반복부" 또는 "CRISPR 직접 반복부" 또는 "직접 반복부"는 다수의 짧은 직접 반복 서열을 의미하며, 이는 CRISPR 어레이 내 서열 변이를 거의 또는 전혀 나타내지 않는다.
CRISPR-연관 단백질(Cas): 본원에서 사용될 때 용어 "CRISPR-연관 단백질", "CRISPR 이펙터", "이펙터" 또는 "CRISPR 효소"는 효소 활성을 수행하거나 RNA 가이드에 의해 지정된 핵산 상의 표적 부위에 결합하는 단백질을 의미한다. 다른 구현예에서, CRISPR 이펙터는 엔도뉴클레아제 활성, 닉카제 활성, 엑소뉴클레아제 활성, 트랜스포사제 활성 및/또는 절제 활성을 가진다. 일부 구현예에서, Cas는 고정밀 Cas이다. 일부 구현예에서, Cas는 고충실 Cas이다. 일부 구현예에서, Cas는 SuperFi-Cas이다. 일부 구현예에서, 고정밀, 고충실 및 SuperFi-Cas는 Bravo, J. 등 Structural basis for mismatch surveillance by CRISPR-Cas9 Nature, 603, March 2022에 기술된 바와 같다.
crRNA: 본원에서 사용될 때 용어 "CRISPR RNA" 또는 "crRNA"는 특정 핵산 서열을 표적으로 하기 위해 CRISPR 이펙터에 의해 사용되는 가이드 서열을 포함하는 RNA 분자를 의미한다. 일반적으로, crRNA는 표적 인식을 매개하는 서열과 tracrRNA와 이중구조를 형성하는 서열을 함유한다. 일부 구현예에서, crRNA:tracrRNA 이중구조는 CRISPR 이펙터에 결합한다.
생체외: 본원에서 사용될 때 용어 "생체외"는 다세포 유기체 내부가 아닌 외부에서 성장한 세포 또는 조직에서 발생한 사건을 의미한다.
기능적 등가물 또는 유사체: 본원에서 사용될 때 용어 "기능적 등가물" 또는 "기능적 유사체"는 아미노산 서열의 기능적 유도체와 관련하여 원래 서열과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적)을 유지하는 분자를 지칭한다. 기능적 유도체 또는 등가물은 천연 유도체일 수 있거나 합성으로 제조된다. 예시적인 기능적 유도체는 단백질의 생물학적 활성이 보존된다는 전제 하에 하나 이상의 아미노산의 치환, 결실 또는 추가가 있는 아미노산 서열을 포함한다. 아미노산 치환은 바람직하게는 치환된 아미노산과 유사한 화학적-물리적 특성을 가진다. 바람직한 유사한 화학적-물리적 특성에는 전하, 부피, 소수성, 친수성 등의 유사성이 포함된다.
반감기: 본원에서 사용될 때 용어 "반감기"는 단백질 농도 또는 활성과 같은 양이 기간 시작 시에 측정된 값의 절반으로 떨어지는 데 필요한 시간이다.
개선하다, 증가하다 또는 낮추다: 본원에서 사용될 때 용어 "개선하다", "증가하다" 또는 "낮추다" 또는 문법적 동등어는 본원에 기술된 치료를 시작하기 전의 동일 개체에서 측정치 또는 본원에 기술된 치료를 받지 않은 대조 대상체(또는 다수의 대조 대상체)에서 측정치와 같은 기준선 측정치와 비교한 값을 나타낸다. "대조 대상체"는 치료받는 대상체와 동일 형태의 질병을 갖고 치료받는 대상체와 거의 동일한 연령을 갖는 대상체이다.
억제: 본원에서 사용될 때 용어 "억제", "억제하다" 및 "억제함"은 관심 단백질 또는 유전자의 활성 및/또는 발현을 감소시키거나 낮추는 프로세스 또는 방법을 의미한다. 전형적으로, 단백질 또는 유전자를 억제함은 본원에 기술되거나 당업계에서 인식된 하나 이상의 방법에 의해 측정될 때 단백질 또는 유전자의 발현 또는 관련 활성을 적어도 10% 이상, 예를 들어 20%, 30%, 40% 또는 50%, 60%, 70%, 80%, 90% 이상 낮추거나 발현 또는 관련 활성을 1배, 2배, 3배, 4배, 5배, 10배, 50배, 100배 초과하여 감소시킴을 의미한다.
혼성화: 본원에서 사용될 때 용어 "혼성화"는 둘 이상의 핵산이 두 핵산의 염기 사이에 왓슨-크릭 쌍에 의한 수소 결합, 후그스타인(Hoogstein) 결합 또는 다른 서열-특이적 결합을 통해 서로 결합하는 반응을 의미한다. 다른 서열과 혼성화할 수 있는 서열은 서열의 "상보"라고 하며, "상보적"이라고 하거나 "상보성"을 보인다고 한다.
삽입결실: 본원에서 사용될 때 용어 "삽입결실"은 핵산 서열에서 염기의 삽입 또는 결실을 의미한다. 이는 일반적으로 돌연변이를 초래하고, 유전적 변이의 일반적인 형태이다.
시험관내: 본원에서 사용될 때 용어 "시험관내"는 다세포 유기체 내에서가 아니라 인위적 환경, 예를 들어 시험관이나 반응 용기 내에서, 세포 배양물 등에서 발생하는 사건을 의미한다.
생체내: 본원에서 사용될 때 용어 "생체내"는 인간 및 비인간 동물과 같은 다세포 유기체 내에서 발생하는 사건을 의미한다. 세포 기반 시스템의 맥락에서, 상기 용어는 살아있는 세포 내(예를 들어 시험관내 시스템과 반대임)에서 발생하는 사건을 지칭하기 위해 사용될 수 있다.
링커: 용어 "링커"는 둘 이상의 단위체를 연결하기 위해 사용되는 임의의 수단, 단위체 또는 모이어티를 의미한다. 일부 구현예에서, 링커는 공유 링커이다. 일부 구현예에서, 링커는 비공유 링커이다. 공유 링커의 예에는 공유 결합, 또는 연결될 단백질 또는 도메인의 하나 이상에 공유적으로 부착된 링커 모이어티가 포함된다. 일부 구현예에서, 링커는 비공유 결합, 예를 들어 백금 원자와 같은 금속 중심을 통한 유기금속 결합이다. 연결은 영구적 또는 가역적일 수 있다. 공유 연결의 경우 카본산 유도체를 포함한 아미드 기, 에테르, 유기 및 무기 에스테르를 포함한 에스테르, 아미노, 우레탄, 요소 등과 같은 다양한 작용기가 사용될 수 있다. 연결을 제공하기 위해 도메인은 산화, 수산화, 치환, 환원 등에 의해 변형되어 커플링을 위한 부위를 제공할 수 있다. 접합 방법은 당업자에게 잘 알려져 있고, 본 발명에서 사용을 위해 포함된다. 링커 모이어티는 화학적 링커 모이어티, 또는 예를 들어 펩티드 링커 모이어티(링커 서열)를 포함하지만 이에 국한되지는 않는다. RNA-결합 도메인 및 이펙터 도메인의 기능을 유의하게 감소시키지 않는 변형이 바람직하다는 것이 이해될 것이다.
돌연변이: 본원에서 사용될 때 용어 "돌연변이"는 당업계에서 일반적인 의미를 가지며, 예를 들어 점 돌연변이, 치환, 삽입, 결실, 역위 및 결실을 포함한다.
올리고뉴클레오티드: 본원에서 사용될 때 용어 "올리고뉴클레오티드"는 일반적으로 단일 또는 이중 가닥 DNA의 약 5 내지 약 100개 뉴클레오티드의 폴리뉴클레오티드를 의미한다. 올리고뉴클레오티드는 "올리고머" 또는 "올리고"라고도 알려져 있고, 유전자로부터 단리될 수 있거나 화학적으로 합성될 수 있다.
PAM: 용어 'PAM' 또는 '프로토스페이서 인접 모티프'는 CRISPR-Cas9와 같이 CRISPR 시스템에 의해 절단하도록 표적이 되는 핵산 영역이 잇따르는 짧은 핵산 서열(일반적으로 2 내지 6개 염기쌍 길이)을 의미한다. PAM은 Cas 뉴클레아제가 절단하는 데 필요하고, 일반적으로 절단 부위의 3 내지 4개 뉴클레오티드 다운스트림에서 발견된다.
폴리펩티드; 본원에서 사용될 때 용어 "폴리펩티드"는 펩티드 결합을 통해 함께 연결된 일련의 아미노산 사슬을 의미한다. 이 용어는 임의의 길이의 아미노산 사슬을 지칭하기 위해 사용되지만, 당업자는 이 용어가 긴 사슬에 제한되지 않고 펩티드 결합을 통해 연결된 2개 아미노산을 포함하는 최소 사슬을 지칭할 수 있음을 이해할 것이다. 당업자에게 알려진 바와 같이, 폴리펩티드는 처리 및/또는 변형될 수 있다. 본원에서 사용될 때 용어 "폴리펩티드" 및 "펩티드"는 상호교환적으로 사용된다.
예방하다; 본원에서 사용될 때 용어 "예방하다" 또는 "예방"은 질병, 장애 및/또는 병태의 발생과 관련하여 사용되는 경우 질병, 장애 및/또는 병태가 발생할 위험을 낮추는 것을 의미한다.
단백질; 본원에서 사용될 때 용어 "단백질"은 개별 단위체로 기능하는 1개 이상의 폴리펩티드를 의미한다. 단일 폴리펩티드가 개별 기능 단위체이고, 개별 기능 단위체를 형성하기 위해 다른 폴리펩티드와의 영구적인 또는 일시적인 물리적 연관을 필요로 하지 않는 경우, 용어 "폴리펩티드"와 "단백질"은 상호교환적으로 사용될 수 있다. 개별 기능 단위체가 서로 물리적으로 연관되는 1개보다 많은 폴리펩티드로 구성되는 경우, 용어 "단백질"은 물리적으로 커플링되어 개별 단위체로 함께 기능하는 다수의 폴리펩티드를 의미한다.
참조: "참조" 단위체, 시스템, 양, 조건 설정 등은 테스트 단위체, 시스템, 양, 조건 설정 등이 본원에 기술된 바와 같이 비교되는 대상이다. 예를 들어, 일부 구현예에서, "참조" 항체는 본원에 기술된 바와 같이 조작되지 않은 대조 항체이다.
RNA 가이드: 용어 RNA 가이드는 표적 핵산에 대해 본원에 기술된 단백질을 표적으로 하는 것을 촉진하는 RNA 분자를 의미한다. 예시적인 "RNA 가이드" 또는 "가이드 RNA"는 crRNA, 또는 동족 tracrRNA와 조합된 crRNA를 포함하지만 이에 국한되지는 않는다. 후자는 독립적인 RNA이거나 링커를 사용하여 단일 RNA로 융합될 수 있다(sgRNA). 일부 구현예에서, RNA 가이드는 화학적 또는 생화학적 변형을 포함하도록 조작되고, 일부 구현예에서, RNA 가이드는 1개 이상의 뉴클레오티드를 포함할 수 있다.
대상체: 본원에서 사용될 때 용어 "대상체"는 진단, 예후 또는 요법이 요구되는 임의의 대상체를 의미한다. 예를 들어, 대상체는 포유동물, 예를 들어 인간 또는 비인간 영장류(예컨대 유인원, 원숭이, 오랑우탄 또는 침팬지), 개, 고양이, 기니피그, 토끼, 랫트, 마우스, 말, 소 또는 암소일 수 있다.
sgRNA: 용어 "sgRNA" 또는 "단일 가이드 RNA"는 (i) 가이드 서열(crRNA 서열) 및 (ii) Cas9 뉴클레아제-모집 서열(tracrRNA)을 함유하는 단일 가이드 RNA를 의미한다.
실질적 동일: "실질적 동일" 문구는 아미노산 또는 핵산 서열 간의 비교를 지칭하기 위해 본원에서 사용된다. 당업자들이 인식하는 바와 같이 2개 서열이 상응하는 위치에 동일 잔기를 함유하는 경우 일반적으로 "실질적 동일"로 간주된다. 당업계에 잘 알려진 바와 같이, 아미노산 또는 핵산 서열은 뉴클레오티드 서열에 대한 BLASTN, 및 아미노산 서열에 대한 BLASTP, 갭 BLAST 및 PSI-BLAST와 같은 시판 컴퓨터 프로그램에서 이용 가능한 알고리즘을 포함하여 임의의 다양한 알고리즘을 사용하여 비교될 수 있다. 예시적인 이러한 프로그램은 Altschul, 등, Basic local alignment search tool, J. Mol. Biol., 215(3): 403-410, 1990; Altschul, 등, Methods in Enzymology; Altschul 등, Nucleic Acids Res. 25:3389-3402, 1997; Baxevanis 등, Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 및 Misener, 등, (eds.), Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999에 기술되어 있다. 동일 서열을 식별하는 것 외에, 상기에서 언급한 프로그램은 일반적으로 동일성 정도에 대한 지표를 제공한다. 일부 구현예에서, 두 서열이 상응하는 잔기의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상이 잔기의 관련 구간에 걸쳐 동일한 경우 실질적 동일로 간주된다. 일부 구현예에서, 관련 구간은 완전 서열이다. 일부 구현예에서, 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475 또는 500개 이상의 잔기이다.
표적 핵산: 본원에서 사용될 때 용어 "표적 핵산"은 CRISPR-Cas9 시스템이 결합되는 임의의 길이의 뉴클레오티드(올리고뉴클레오티드 또는 폴리뉴클레오티드)인 데옥시리보뉴클레오티드, 리보뉴클레오티드 또는 이들의 유사체를 의미한다. 표적 핵산은 암호화 또는 비암호화 영역을 포함하여 3차원 구조를 가질 수 있고, 엑손, 인트론, mRNA, tRNA, rRNA, siRNA, shRNA, miRNA, 리보자임, cDNA, 플라스미드, 벡터, 외인성 서열, 내인성 서열을 포함할 수 있다. 표적 핵산은 변형된 뉴클레오티드를 포함할 수 있고, 메틸화 뉴클레오티드 또는 뉴클레오티드 유사체를 포함할 수 있다. 표적 핵산은 비핵산 구성요소와 함께 배치될 수 있다. 표적 핵산은 단일-, 이중- 또는 다중-가닥의 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및 피리미딘 염기를 포함하는 중합체, 또는 기타 천연, 화학적 또는 생화학적 변형된, 비천연 또는 유도체화된 뉴클레오티드 염기에 제한되지 않는다.
치료적 유효량: 본원에서 사용될 때 용어 "치료적 유효량"은 임의의 의학적 치료에 적용될 수 있는 합리적인 이익/위험 비로 치료 효과를 치료 대상체에게 부여하는 치료 분자(예를 들어 본원에 기술된 조작된 항체)의 양을 의미한다. 치료 효과는 객관적(즉, 일부 테스트 또는 마커에 의해 측정 가능함) 또는 주관적(즉, 대상체가 효과의 조짐 또는 느낌을 제공함)일 수 있다. 특히, "치료적 유효량"은 특정 질병 또는 병태를 치료, 개선 또는 예방하는 데 효과적이거나 예컨대 질병과 연관된 증상을 개선시키고/거나 질병 발병을 예방 또는 지연시키고/거나 질병 증상의 중증도 또는 빈도를 저감시킴으로써 감지 가능한 치료 또는 예방 효과를 나타내는 데 효과적인 치료 분자 또는 조성물의 양을 의미한다. 치료적 유효량은 다수의 단위 용량을 포함할 수 있는 용량 섭생법으로 투여될 수 있다. 임의의 특정 치료 분자의 경우, 치료적 유효량(및/또는 유효한 용량 섭생법 내의 적절한 단위 용량)은 예를 들어 투여 경로, 다른 약제와의 조합에 따라 달라질 수 있다. 또한, 임의의 특정 대상체를 위한 구체적인 치료적 유효량(및/또는 단위 용량)은 치료되는 장애 및 장애 중증도; 사용되는 구체적인 약제의 활성; 사용되는 구체적인 조성; 대상체의 연령, 체중, 전반적인 건강, 성별 및 식이요법; 사용되는 구체적인 치료 분자의 투여 시간, 투여 경로 및/또는 배설률 또는 대사율; 치료 기간; 및 의학 분야에 잘 알려진 유사 요인을 포함한 다양한 요인에 따라 달라질 수 있다.
tracrRNA: 본원에서 사용될 때 용어 "tracrRNA" 또는 "트랜스-활성화 crRNA"는 CRISPR-연관 단백질이 명시된 표적 핵산에 결합하는 데 필요한 구조를 형성하는 서열을 포함하는 RNA를 의미한다.
치료: 본원에서 사용될 때 용어 "치료"(또한 "치료하다" 또는 "치료함")는 특정 질병, 장애 및/또는 병태의 하나 이상의 증상 또는 특징의 발병을 부분적으로 또는 완전히 완화, 개선, 경감, 억제, 지연시키고/거나 중증도를 낮추고/거나 발생률을 낮추는 치료 분자(예를 들어, 본원에 기술된 CRISPR-Cas 치료 단백질 또는 시스템)의 임의의 투여를 의미한다. 이러한 치료는 관련 질병, 장애 및/또는 병태의 징후를 나타내지 않는 대상체 및/또는 질병, 장애 및/또는 병태의 초기 징후만을 나타내는 대상체에 대한 것일 수 있다. 대안적으로 또는 추가적으로, 이러한 치료는 관련 질병, 장애 및/또는 병태의 하나 이상의 규명된 징후를 나타내는 대상체에 대한 것일 수 있다.
도면은 설명 목적으로만 제공되고 제한을 위한 것이 아니다.
도 1a는 인간 코돈-최적화된 스트렙토코커스 콘스텔라투스 Cas 9에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1b는 인간 코돈-최적화된 샤르페아 spp. 단리물 RUG017 Cas9에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1c는 인간 코돈-최적화된 베일로넬라 파르불라 Cas9에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1d는 인간 코돈-최적화된 에자키엘라 페루엔시스에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1e는 인간 코돈-최적화된 락토바실러스 퍼멘텀 균주 AF15-40LB에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1f는 인간 코돈-최적화된 펩토니필러스 sp. 마르세유-P3761에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다.
도 2a는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 스트렙토코커스 콘스텔라투스 ScoCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2a는 서열번호 3을 포함하는 sgRNA을 나타낸다. 도 2b는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 샤르페아 spp. 단리물 RUG017 SirCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2b는 서열번호 7을 포함하는 sgRNA을 나타낸다. 도 2c는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 베일로넬라 파르불라 VapCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2c는 서열번호 13을 포함하는 sgRNA을 나타낸다. 도 2d는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 에자키엘라 페루엔시스 EpeCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2d는 서열번호 19를 포함하는 sgRNA을 나타낸다. 도 2e는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 락토바실러스 퍼멘텀 균주 AF15-40LB LfeCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2d는 서열번호 95을 포함하는 sgRNA을 나타낸다. 도 2f는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 펩토니필러스 sp. 마르세유-P3761 PmaCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2d는 서열번호 96을 포함하는 sgRNA을 나타낸다.
도 3은 HEK293T 세포에서 인간 코돈-최적화된 ScoCas9의 생체외 절단 활성의 예시적인 결과를 보여주는 그래프이다. 그래프의 y축은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA를 사용하여 얻은 삽입결실 빈도를 보여준다(도 1a 참조).
도 4a는 아데닌 염기 편집기(ABE) 또는 시토신 염기 편집기(CBE)에 N-말단에서 융합된 ScoCas9 D10A 돌연변이체의 작제물을 보여주는 도면이다. 도 4b는 ScoCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 삽입결실 빈도 및 아데닌에서 구아닌 염기로(A에서 G로) 전환율의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 8)에 대해 도시되어 있다(도 1a 참조). 도 4c는 ScoCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 삽입결실 빈도 및 시토신에서 티민 염기로(C에서 T로) 전환율의 결과를 보여주는 그래프이다. C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 8)에 대해 도시되어 있다(도 1a 참조).
도 5a는 WT SirCas9 및 아데닌 염기 편집기(ABE)에 N-말단에서 융합된 SirCas9 D14A 돌연변이체의 작제물을 보여주는 도면이다. 도 5b는 SirCas9 D14A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 삽입결실 빈도 및 A에서 G로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 9)에 대해 도시되어 있다(도 1b 참조).
도 6a는 WT VapCas9 및 아데닌 염기 편집기(ABE) 또는 시토신 염기 편집기(CBE)에 N-말단에서 융합된 VapCas9 D38A 돌연변이체를 보여주는 작제물의 도면이다. 도 6b는 염기결실 빈도, VapCas9 D38A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환 및 VapCas9 D38A의 N-말단에 융합된 CBE를 포함하는 염기 편집기를 사용하여 달성된 C에서 T로 전환을 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 10)에 대해 도시되어 있다(도 1c 참조). C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 10)에 대해 도시되어 있다(도 1c 참조).
도 7a는 VapCas9의 N-말단 또는 VapCas9의 C 말단에 융합된 ABE를 보여주는 작제물의 도면이다. 도 7b는 VapCas9의 N-말단에 융합된 ABE 및 C-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환의 비교를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 11)에 대해 도시되어 있다(도 1c 참조).
도 8a는 WT EpeCas9 및 ABE와 CBE에 N-말단에서 융합된 EpeCas9 D38A 돌연변이체를 보여주는 작제물의 도면이다. 도 8b는 삽입결실 빈도, EpeCas9 D38A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환 및 EpeCas9 D38A의 N-말단에 융합된 CBE를 포함하는 염기 편집기를 사용하여 달성된 C에서 T로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 12)에 대해 도시되어 있다(도 1d 참조). C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 12)에 대해 도시되어 있다(도 1d 참조).
도 9a는 WT LfeCas9 및 ABE와 CBE에 N-말단에서 융합된 LfeCas9 D9A 돌연변이체를 보여주는 도면이다. 도 9b는 LfeCas9를 사용한 삽입결실 빈도의 결과를 보여주는 그래프이다. 도 9c는 LfeCas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 13)에 대해 도시되어 있다(도 1e 참조). 도 9d는 LfeCas9 D9A 돌연변이체의 N-말단에 융합된 CBE를 포함하는 염기 편집기를 사용하여 달성된 C에서 T로 전환의 결과를 보여주는 그래프이다. C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 13)에 대해 도시되어 있다(도 1e 참조).
도 10a는 WT PmaCas9 및 N-말단과 C-말단에서 ABE와 CBE에 융합된 PmaCas9 D12A 돌연변이체를 보여주는 도면이다. 도 10b는 PmaCas9 D12A 돌연변이체의 N-말단 또는 C-말단에 융합된 ABE 또는 CBE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 또는 C에서 T로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 14)에 대해 도시되어 있다(도 1f 참조). C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 14)에 대해 도시되어 있다(도 1f 참조).
도 11a는 2개의 ScoCas9-NGC 변이체인 ScoCas9-NGC-vl 및 ScoCas9-NGC-v2(x축)로 세포를 형질감염시킴으로써 측정한 삽입결실 빈도(y축; 삽입결실 빈도%)의 예시적인 결과를 보여주는 그래프이다. 미형질감염 세포 대조군도 표시된다.
도 11b는 NGC PAM 모티프를 인식하도록 조작된 ScoCas9-NGC 변이체인 ScoCas9-NGC-vl 및 ScoCas9-NGC-v2를 포함하는 A에서 G로 염기 편집기(ABE)로 형질감염된 HEK293T 세포(x축)에서 예시적인 A에서 G로 전환(y축; A에서 G로 전환%)을 보여주는 그래프이다. NGC를 인식하지 않는 ScoCas9-NGG 변이체는 A에서 G로 전환을 보여주지 않았다. SpyCas9-NGC 대조 벡터는 A에서 G로 편집을 보여주었다. 미형질감염 세포 대조군도 표시된다.
도 1a는 인간 코돈-최적화된 스트렙토코커스 콘스텔라투스 Cas 9에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1b는 인간 코돈-최적화된 샤르페아 spp. 단리물 RUG017 Cas9에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1c는 인간 코돈-최적화된 베일로넬라 파르불라 Cas9에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1d는 인간 코돈-최적화된 에자키엘라 페루엔시스에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1e는 인간 코돈-최적화된 락토바실러스 퍼멘텀 균주 AF15-40LB에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다. 도 1f는 인간 코돈-최적화된 펩토니필러스 sp. 마르세유-P3761에 의해 인식되는 공통 PAM 모티프를 보여주는 그래프이다.
도 2a는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 스트렙토코커스 콘스텔라투스 ScoCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2a는 서열번호 3을 포함하는 sgRNA을 나타낸다. 도 2b는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 샤르페아 spp. 단리물 RUG017 SirCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2b는 서열번호 7을 포함하는 sgRNA을 나타낸다. 도 2c는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 베일로넬라 파르불라 VapCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2c는 서열번호 13을 포함하는 sgRNA을 나타낸다. 도 2d는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 에자키엘라 페루엔시스 EpeCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2d는 서열번호 19를 포함하는 sgRNA을 나타낸다. 도 2e는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 락토바실러스 퍼멘텀 균주 AF15-40LB LfeCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2d는 서열번호 95을 포함하는 sgRNA을 나타낸다. 도 2f는 Geneious 소프트웨어를 사용하여 인간 코돈-최적화된 펩토니필러스 sp. 마르세유-P3761 PmaCas9에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 도면이다. 도 2d는 서열번호 96을 포함하는 sgRNA을 나타낸다.
도 3은 HEK293T 세포에서 인간 코돈-최적화된 ScoCas9의 생체외 절단 활성의 예시적인 결과를 보여주는 그래프이다. 그래프의 y축은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA를 사용하여 얻은 삽입결실 빈도를 보여준다(도 1a 참조).
도 4a는 아데닌 염기 편집기(ABE) 또는 시토신 염기 편집기(CBE)에 N-말단에서 융합된 ScoCas9 D10A 돌연변이체의 작제물을 보여주는 도면이다. 도 4b는 ScoCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 삽입결실 빈도 및 아데닌에서 구아닌 염기로(A에서 G로) 전환율의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 8)에 대해 도시되어 있다(도 1a 참조). 도 4c는 ScoCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 삽입결실 빈도 및 시토신에서 티민 염기로(C에서 T로) 전환율의 결과를 보여주는 그래프이다. C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 8)에 대해 도시되어 있다(도 1a 참조).
도 5a는 WT SirCas9 및 아데닌 염기 편집기(ABE)에 N-말단에서 융합된 SirCas9 D14A 돌연변이체의 작제물을 보여주는 도면이다. 도 5b는 SirCas9 D14A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 삽입결실 빈도 및 A에서 G로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 9)에 대해 도시되어 있다(도 1b 참조).
도 6a는 WT VapCas9 및 아데닌 염기 편집기(ABE) 또는 시토신 염기 편집기(CBE)에 N-말단에서 융합된 VapCas9 D38A 돌연변이체를 보여주는 작제물의 도면이다. 도 6b는 염기결실 빈도, VapCas9 D38A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환 및 VapCas9 D38A의 N-말단에 융합된 CBE를 포함하는 염기 편집기를 사용하여 달성된 C에서 T로 전환을 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 10)에 대해 도시되어 있다(도 1c 참조). C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 10)에 대해 도시되어 있다(도 1c 참조).
도 7a는 VapCas9의 N-말단 또는 VapCas9의 C 말단에 융합된 ABE를 보여주는 작제물의 도면이다. 도 7b는 VapCas9의 N-말단에 융합된 ABE 및 C-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환의 비교를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 11)에 대해 도시되어 있다(도 1c 참조).
도 8a는 WT EpeCas9 및 ABE와 CBE에 N-말단에서 융합된 EpeCas9 D38A 돌연변이체를 보여주는 작제물의 도면이다. 도 8b는 삽입결실 빈도, EpeCas9 D38A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환 및 EpeCas9 D38A의 N-말단에 융합된 CBE를 포함하는 염기 편집기를 사용하여 달성된 C에서 T로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 12)에 대해 도시되어 있다(도 1d 참조). C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 12)에 대해 도시되어 있다(도 1d 참조).
도 9a는 WT LfeCas9 및 ABE와 CBE에 N-말단에서 융합된 LfeCas9 D9A 돌연변이체를 보여주는 도면이다. 도 9b는 LfeCas9를 사용한 삽입결실 빈도의 결과를 보여주는 그래프이다. 도 9c는 LfeCas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 13)에 대해 도시되어 있다(도 1e 참조). 도 9d는 LfeCas9 D9A 돌연변이체의 N-말단에 융합된 CBE를 포함하는 염기 편집기를 사용하여 달성된 C에서 T로 전환의 결과를 보여주는 그래프이다. C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 13)에 대해 도시되어 있다(도 1e 참조).
도 10a는 WT PmaCas9 및 N-말단과 C-말단에서 ABE와 CBE에 융합된 PmaCas9 D12A 돌연변이체를 보여주는 도면이다. 도 10b는 PmaCas9 D12A 돌연변이체의 N-말단 또는 C-말단에 융합된 ABE 또는 CBE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 또는 C에서 T로 전환의 결과를 보여주는 그래프이다. A에서 G로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 A-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 14)에 대해 도시되어 있다(도 1f 참조). C에서 T로 전환율(y축)은 PAM 공통 모티프에 상응하는 서열에 인접한 C-풍부 게놈 테스트 부위를 표적으로 하는 다양한 가이드 RNA(x축; 표 14)에 대해 도시되어 있다(도 1f 참조).
도 11a는 2개의 ScoCas9-NGC 변이체인 ScoCas9-NGC-vl 및 ScoCas9-NGC-v2(x축)로 세포를 형질감염시킴으로써 측정한 삽입결실 빈도(y축; 삽입결실 빈도%)의 예시적인 결과를 보여주는 그래프이다. 미형질감염 세포 대조군도 표시된다.
도 11b는 NGC PAM 모티프를 인식하도록 조작된 ScoCas9-NGC 변이체인 ScoCas9-NGC-vl 및 ScoCas9-NGC-v2를 포함하는 A에서 G로 염기 편집기(ABE)로 형질감염된 HEK293T 세포(x축)에서 예시적인 A에서 G로 전환(y축; A에서 G로 전환%)을 보여주는 그래프이다. NGC를 인식하지 않는 ScoCas9-NGG 변이체는 A에서 G로 전환을 보여주지 않았다. SpyCas9-NGC 대조 벡터는 A에서 G로 편집을 보여주었다. 미형질감염 세포 대조군도 표시된다.
일정한 간격으로 놓인 짧은 회문 반복부 서열(CRISPR)은 박테리아와 고세균에서 적응형 면역 시스템으로 처음 발견된 후 살아있는 세포와 유기체에서 표적이 된 DNA 파손을 발생시키도록 조작되었다. 세포 DNA 복구 프로세스동안 다양한 DNA 변화가 도입될 수 있다. 다양한 확장성 CRISPR 도구상자를 사용하여 프로그래밍 가능한 게놈 편집, 후성유전체 편집 및 전사체 조절을 할 수 있다.
CRISPR-Cas 시스템은 Cas 유전자 조직과 구성요소 단백질의 서열 및 구조에 기반한 3가지 주요 유형(I, II 및 III)을 포함한다. 3가지 CRISPR 시스템 각각은 다음의 고유 Cas 유전자를 특징으로 한다: 유형 I에서 표적-열화성 뉴클레아제/헬리카제인 Cas3; 유형 II에서 RNA-결합 및 표적-열화성 뉴클레아제인 Cas9; 유형 III에서 다중 기능을 위한 대형 단백질인 Cas 10. 또한 3가지 CRISPR 유형은 연관된 이펙터 복합체에서 상이하다. 유형 I Cas 시스템은 캐스케이드 이펙터 복합체와 연관되고, 유형 II 이펙터 복합체는 단일 Cas9와 1개 이상의 RNA 분자로 이루어지고, 유형 III 간섭 복합체는 유형 III-A(DNA를 표적으로 하는 Csm 복합체)와 유형 III-B(RNA를 표적으로 하는 Cmr 복합체)로 더 나누어진다. Cas 단백질은 모든 CRISPR-Cas 시스템에서 이펙터 복합체의 중요 구성요소이다.
현재 게놈 편집 기술은 DNA 절단을 위한 단일-단백질 이펙터 뉴클레아제를 함유하는 클래스 II CRISPR-Cas 시스템에 초점을 두고 있으며, 구체적으로는 CRISPR RNA(crRNA)와 tracrRNA 둘 모두를 필요로 하고 HNH 및 RuvC 뉴클레아제 도메인 둘 모두를 함유하는 이중-RNA 가이드되는 뉴클레아제인 Cas9와, crRNA만을 필요로 하고 단일 RuvC 도메인을 함유하는 단일-RNA 가이드되는 뉴클레아제인 Cas 12a에 초점을 두고 있다.
본 발명의 다양한 측면은 다음 항에서 자세히 기술된다. 이러한 항의 사용은 본 발명을 제한하려는 것이 아니다. 각 항은 본 발명의 임의의 측면에 적용될 수 있다. 본 출원에서 "또는"의 사용은 달리 명시되지 않는 한 "및/또는"을 의미한다.
조작된 비천연 발생 Cas9 단백질
스트렙토코커스 콘스텔라투스(ScoCas9), 샤르페아 spp. 단리물 RUG017(SirCas9), 베일로넬라 파르불라(상호 교환적으로 사용되는 VapCas9 또는 VpaCas9), 에자키엘라 페루엔시스(EpeCas9), 락토바실러스 퍼멘텀(LfeCas9) 및 펩토니필러스 sp. 마르세유-P3761(PmaCas9) 박테리아에서 얻은 WT Cas9로부터 변형된 조작된 비천연 발생 Cas9 단백질이 본원에 기술되어 있다.
일부 구현예에서, 본원에 기술된 조작된 비천연 발생 Cas9 단백질은 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 60%(예를 들어, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 아미노산 서열을 포함한다. 일부 구현예에서, Cas9 단백질은 서열번호 1, 4, 8, 14, 84 또는 86과 80% 동일하다. 일부 구현예에서, Cas9 단백질의 아미노산 서열은 서열번호 1, 4, 8, 14, 84 또는 86과 동일하다. 예시적인 Cas9 아미노산 서열은 아래 표 1에 제공된다.
표 1. 예시적인 Cas9 아미노산 서열
NLS(굵은 글씨)는 다른 NLS로 대체될 수 있다.
링커(밑줄)는 제거되거나 연장될 수 있다.
3xHA 태그(이탤릭체)는 다른 태그로 대체될 수 있다.
일부 구현예에서, Cas9 단백질은 서열번호 1, 4, 8, 14, 84 또는 86에 대하여 1개 이상의 돌연변이를 포함한다. 예를 들어, Cas9 단백질의 아미노산 서열은 서열번호 1, 4, 8, 14, 84 또는 86에 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개의 돌연변이를 포함한다. 다양한 돌연변이가 당업계에 알려져 있으며, 예를 들어 아미노산 치환을 포함한다.
일부 구현예에서, Cas9의 2개 이상의 촉매 도메인(RuvC1, RuvCII, RuvCIII)이 돌연변이되어, 불활성 또는 핵산 절단 활성이 없는 "죽은" Cas9(dCas9)를 생성한다. 일부 구현예에서, 1개 이상의 돌연변이는 PAM 상호작용, HNH 및 또는 RuvC 도메인에 있다. 일부 구현예에서, Cas9는 비돌연변이 형태에 비해 DNA 절단 활성을 약 25%, 15%, 10%, 5%, 1%, 0.1%, 0.01% 이하로 낮추도록 돌연변이된다.
일부 구현예에서 Cas9의 닉카제-돌연변이체 버전이 제공된다. 일부 구현예에서, 닉카제 돌연변이체는 RuvC 및/또는 HNH 도메인에 1개 이상의 아미노산 치환을 가진다. 다양한 닉카제 돌연변이가 SpCas9(스트렙토코커스 피오게네스)와 관련하여 알려져 있으며, 예를 들어 야생형 SpCas9의 아미노산 위치 10, 12, 17, 762, 840, 854, 863, 982, 983, 984, 986, 987 중 하나 이상에 돌연변이를 포함한다. 예를 들어, SpCas9의 D10A에 상응하는 아스파르트산에서 알라닌으로 치환은 닉카제 형성을 초래한다. 일부 구현예에서, 본원에 기술된 Cas9는 닉카제 형성을 초래하는 1개 이상의 돌연변이를 가진다. 일부 구현예에서, 본원에 기술된 Cas9는 SpCas9의 아미노산 10, 12, 17, 762, 840, 854, 863, 982, 983, 984, 986, 987 중 하나 이상에 상응하는 아미노산 위치에 1개 이상의 돌연변이를 가진다.
일부 구현예에서, 돌연변이는 ScoCas9의 RuvC 도메인에서 아스파르트산에서 알라닌으로 치환(D10A)이다. 일부 구현예에서, 돌연변이는 SirCas9의 RuvC 도메인에서 아스파르트산에서 알라닌으로 치환(D14A)이다. 일부 구현예에서, 돌연변이는 VapCas9의 RuvC 도메인에서 아스파르트산에서 알라닌으로 치환(D38A)(예를 들어 SpCas9의 D10A에 상응)이다. 일부 구현예에서, 돌연변이는 EpeCas9의 RuvC 도메인에서 아스파르트산에서 알라닌으로 치환(D12A)이다. 일부 구현예에서, 돌연변이는 LfeCas9의 RuvC 도메인에서 아스파르트산에서 알라닌으로 치환(D9A)이다. 일부 구현예에서, 돌연변이는 PmaCas9의 RuvC 도메인에서 아스파르트산에서 알라닌으로 치환(D12A)이다.
일부 구현예에서, 돌연변이는 ScoCas9의 RuvC 도메인에서 아스파르트산에서 글리신으로 치환(D10G)이다. 일부 구현예에서, 돌연변이는 SirCas9의 RuvC 도메인에서 아스파르트산에서 글리신으로 치환(D14G)이다. 일부 구현예에서, 돌연변이는 VapCas9의 RuvC 도메인에서 아스파르트산에서 글리신으로 치환(D38G)이다(예를 들어 SpCas9의 D10G에 상응)이다. 일부 구현예에서, 돌연변이는 EpeCas9의 RuvC 도메인에서 아스파르트산에서 글리신으로 치환(D12G)이다. 일부 구현예에서, 돌연변이는 LfeCas9의 RuvC 도메인에서 아스파르트산에서 글리신으로 치환(D9A)이다. 일부 구현예에서, 돌연변이는 PmaCas9의 RuvC 도메인에서 아스파르트산에서 글리신으로 치환(D12G)이다.
일부 구현예에서, 본원에 기술된 이러한 1개 이상의 돌연변이는 Cas9를 Cas9의 불활성 또는 "죽은" 버전(dCas9)으로 전환시킨다. 따라서, 일부 구현예에서, Cas9 단백질은 Cas9가 DNA 이중구조의 두 가닥을 모두 절단하는 능력을 억제하는 1개 이상의 돌연변이를 포함한다.
일부 구현예에서, 가이드 RNA와 함께 공동발현될 때, 죽은 Cas9는 전사적 신장, RNA 폴리머라제 결합 또는 전사 인자 결합을 특이적으로 방해할 수 있는 DNA 인식 복합체를 발생시킨다. 일부 구현예에서, 죽은 Cas9는 특이적 핵산 표적 부위에 다양한 기능의 이펙터 단백질을 특이적으로 표적으로 하기 위해 사용된다.
일부 구현예에서, 고충실 Cas9 변이체는 증강된 특이성을 포함하여 표적외(off-target) 절단을 최소화한다. 일부 구현예에서, 조작된 변이체, 예를 들어 주로 REC3 도메인 내에 돌연변이를 포함하고 보다 높은 특이성과 충실성을 달성하는 '초정확 Cas9'(SpyCas9에 상응하는 N692A, M694A, Q695A 및/또는 H698A 돌연변이) 및/또는 '고충실 Cas9'(SpyCas9에 상응하는 N467A, R661A, Q695A 및/또는 Q926A 돌연변이)가 사용된다. 고충실 변이체는 Cas9가 미스매치를 안정화시키고 표적외 DNA 절단을 낮추는 능력을 낮춘다. 일부 구현예에서, 특이성 증가는 표적내(on-target) 절단 효율을 약 100배 감소시킴을 동반한다. 일부 구현예에서, 야생형 Cas9에 필적하는 표적내 절단율을 유지하는 고충실 변이체인 SuperFi-Cas9가 사용된다. 일부 구현예에서, SuperFi-Cas9는 RuvC 루프에 돌연변이를 포함한다. 일부 구현예에서, 돌연변이는 gRNA-TS 이중구조의 후속 절단을 촉진하는 꼬인 형태의 형성을 억제한다. 일부 구현예에서, SpyCas9에 상응하는 Y1016, R1019, Y1010, Y1013, K1031, Q1027 및/또는 V1018 잔기는 예를 들어, 아스파르트산으로 돌연변이된다.(Bravo, J. 등 Structural basis for mismatch surveillance by CRISPR-Cas9 Nature, 603, March 2022).
조작된 비천연 발생 Cas9는 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96에서 Cas9 아미노 서열과 적어도 80%(예를 들어, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 아미노산 서열을 가진다.
일부 구현예에서, 조작된 비천연 발생 Cas9는 인간 세포에 대해 코돈-최적화된(예를 들어, 발현, 안정성 등에 대해 코돈 최적화된) 핵산 분자에서 암호화된다.
핵 위치 신호(NLS) 및 링커가 있는 예시적인 Cas9 서열은 다음 표 2에 제공된다.
표 2. NLS 및 링커가 있는 예시적인 Cas9 서열
NLS(굵은 글씨)는 상이한 NLS로 대체될 수 있다.
링커(밑줄)는 제거되거나 연장될 수 있다.
일부 구현예에서, 조작된 비천연 발생 Cas9는 태그를 포함한다. 당업자에게 명백한 바와 같이, 목적에 따라 다양한 태그가 Cas9 변이체(예를 들어, 3xHA 태그)에 융합될 수 있다.
다양한 종은 특정 유기체에서 해당 코돈에 대한 tRNA 종의 풍부함에 상응하는 메신저 RNA(mRNA) 내 코돈을 활용함으로써 mRNA의 번역 효율과 상관관계가 있는 코돈 편향(즉, 유기체에 의한 코돈 사용의 차이)을 나타낸다. 예를 들어 소프트웨어 사용에 의하는 것을 포함하여 당업계의 다양한 방법이 컴퓨터 최적화를 위해 사용될 수 있다. 일부 구현예에서, 코돈 최적화는 천연 아미노산 서열을 유지하면서 천연 서열의 적어도 1개의 코돈(예를 들어 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을, 숙주 세포의 유전자에서 더 빈번하게 사용되거나 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 숙주 세포에서 증강되게 발현되도록 하기 위한 핵산 서열 변형을 의미한다.
일부 구현예에서, 본원에 기술된 Cas9 단백질은 코돈 최적화된다. 이러한 유형의 최적화는 당업계에 알려져 있고, 동일 단백질을 암호화하면서 의도된 숙주 유기체 또는 세포의 코돈 선호를 모방하도록 외래-유래의 DNA 돌연변이를 수반한다. 따라서, 코돈은 변하지만, 암호화된 단백질은 변하지 않은 상태로 유지된다. 코돈 최적화는 가용성 단백질 수준을 향상시키고, 특정 종의 활성과 편집 효율을 증가시킨다. 또한 코돈 최적화는 번역 및 단백질 발현의 증가를 초래한다.
일부 구현예에서, Cas9 단백질은 진핵 세포에서 발현되도록 코돈-최적화된다. 일부 구현예에서, Cas9 단백질은 인간 세포에서 발현되도록 코돈-최적화된다.
프로토스페이서 인접 모티브(PAM)
각 Cas 엔도뉴클레아제는 비표적화된, 즉, 상보적 DNA 가닥 상에 프로토스페이서 인접 모티프(PAM)로 알려진 특정 서열이 있는 경우에만 표적 서열에 결합한다. 다양한 박테리아 종으로부터 단리된 Cas 뉴클레아제는 상이한 PAM 서열을 인식한다. 예를 들어 SpCas9 뉴클레아제(스타필로코커스 피오게네스 유래)는 PAM 서열 5'-NGG-3'(여기서 "N"은 임의의 뉴클레오티드 염기일 수 있다)의 업스트림을 절단하고, SaCas9(스타필로코커스 아우레우스 유래)는 표적에서 PAM 서열 5'-NNGRR(N)-3'을 인식한다. 따라서, 상이한 Cas 단백질이 표적으로 할 수 있는 게놈 내 위치는 고유 PAM 서열의 위치에 의해 제한된다.
스트렙토코커스 콘스텔라투스 및 에자키엘라 페루엔시스 및 펩토니필러스 sp. 마르세유-P3761 종으로부터 조작된 본원에 개시된 Cas9 단백질이 공통 PAM 서열 5'-NGG-3'를 인식한다. 스트렙토코커스 콘스텔라투스 및 에자키엘라 페루엔시스 및 펩토니필러스 sp. 마르세유-P3761 종으로부터 조작된 본원에 개시된 Cas9 단백질이 공통 PAM 시퀀스 5'-NGG-3'를 인식한다. 일부 구현예에서, 본원에 개시된 Cas9 단백질은 공통 PAM 서열 5'-NGC-3'을 인식하도록 조작된다. 예시적인 구현예가 아래에 기술되어 있고, 비제한적이어야 한다. 일부 구현예에서, 스트렙토코커스 콘스텔라투스 유래의 Cas9 단백질은 공통 PAM 서열 5'-NGC-3'을 인식하도록 조작된다. 일부 구현예에서, NGC PAM 변이체는 ScoCas9(서열번호 1)와 관련하여 D1117M, S118Q, E1201F, A1299R, D1309A, R1312E 및 T1314R(총칭하여 "MQFRAER"라 함)로부터 선택되거나 이에 상응하는 1개 이상의 아미노산 치환을 포함한다. 일부 구현예에서, NGC PAM 변이체는 자연 발생 SpyCas9(서열번호 173)와 관련하여 D1135M, S1136Q, G1218K, E1219F, A1322R, D1332A, R1335E 및 T1337R(총칭하여 "MQKFRAER"라 함)로부터 선택되거나 이에 상응하는 1개 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 유사하거나 상응하는 아미노산 치환이 SirCas9, VapCas9, EpeCas9, LfeCas9 또는 PmaCas9에 대해 이루어질 수 있다.
스트렙토코커스 피오게네스 Cas9(SpyCasP; GenBank: QSG91308.1)
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 173).
일부 구현예에서, 본원에 기술된 Cas9 단백질은 임의의 다른 PAM 서열과 결합하지 않거나 활성을 나타내지 않는다.
RNA 가이드
RNA 가이드는 표적 서열에 대해 상보성을 갖는 폴리뉴클레오티드 서열을 포함한다. RNA 가이드는 표적 핵산 서열과 혼성화하고, 표적 핵산에 대한 CRISPR 복합체의 서열-특이적 결합을 지시한다. 일부 구현예에서, RNA 가이드는 표적 핵산 서열에 대해 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 상보성을 가진다.
일부 구현예에서, RNA 가이드는 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 또는 75개 이상의 뉴클레오티드 길이를 가진다. 일부 구현예에서, RNA 가이드는 약 18 내지 24개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, RNA 가이드는 표적 핵산 서열에서 약 18 내지 24개의 뉴클레오티드에 상보적이다. 예를 들어, RNA 가이드는 표적 핵산 서열에서 약 18, 19, 20, 21, 22, 23 또는 24개의 뉴클레오티드에 상보적이다. 일부 구현예에서, RNA 가이드는 약 18 내지 22개의 뉴클레오티드에 상보적이다. 일부 구현예에서, RNA 가이드는 약 18 내지 21개의 뉴클레오티드에 상보적이다. 일부 구현예에서, RNA 가이드는 약 18 내지 20개의 뉴클레오티드에 상보적이다. 일부 구현예에서, RNA 가이드는 표적 핵산 서열에서 20개의 뉴클레오티드에 상보적이다.
RNA 가이드는 임의의 표적 서열을 표적으로 하기 위해 설계될 수 있다. 최적의 정렬은 Needleman-Wunsch 알고리즘, Smith-Waterman 알고리즘, Burrows-Wheeler 알고리즘, ClustlW, ClustlX, BLAST, Novoalign, SOAP, Maq 및 ELAND를 포함하여 임의의 서열 정렬 알고리즘을 사용하여 결정된다.
일부 구현예에서, RNA 가이드는 세포 게놈 내의 고유 표적 서열에 대해 표적된다. 일부 구현예에서, RNA 가이드는 PAM 서열이 결여되도록 설계된다. 일부 구현예에서, RNA 가이드 서열은 mFold 또는 Geneious를 포함하는 접힘 알고리즘을 사용하여 최적의 이차 구조를 갖도록 설계된다. 일부 구현예에서, RNA 가이드의 발현은 유도성 프로모터, 예를 들어 호르몬 유도성, 테트라사이클린 또는 독시사이클린 유도성, 아라비노스 유도성 또는 광유도성 프로모터 하에서 이루어질 수 있다.
일부 구현예에서 CRISPR 시스템은 1개 이상의 RNA 가이드, 예를 들어 crRNA, tracrRNA 및/또는 sgRNA를 포함한다. 따라서, 일부 구현예에서 RNA 가이드는 crRNA를 포함한다. 일부 구현예에서, RNA 가이드는 tracrRNA를 포함한다. 일부 구현예에서, RNA 가이드는 sgRNA를 포함한다. 일부 구현예에서, CRISPR 시스템은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 15개 이상의 RNA 가이드를 포함하는 다수 RNA 가이드를 포함한다.
일부 구현예에서, RNA 가이드는 crRNA를 포함한다. 일부 구현예에서, CRISPR 시스템은 2 내지 15개의 crRNA를 포함하는 다수 crRNA를 포함한다. 일부 구현예에서, crRNA는 전구체 crRNA(pre-crRNA)이며, 이는 직접 반복 서열, 스페이서 서열 및 직접 반복 서열을 포함한다. 일부 구현예에서, crRNA는 첨두절단된 직접 반복 서열을 포함하는 처리된 또는 성숙 crRNA이다.
일부 구현예에서, CRISPR 연관 단백질은 pre-crRNA를 절단하여, 처리된 또는 성숙 crRNA를 형성한다.
일부 구현예에서, CRISPR 연관 단백질은 성숙 crRNA와 복합체를 형성하고, 스페이서 서열은 표적 핵산 내 상보적 서열에 대해 복합체를 표적으로 한다. 일부 구현예에서, RNA 가이드는 표적 핵산에 적합한 조건 하에서 혼성화할 수 있는 스페이서 서열 및 직접 반복 서열을 포함한다.
일부 구현예에서, crRNA의 스페이서 길이는 약 15 내지 50개의 뉴클레오티드 범위일 수 있다. 일부 구현예에서, RNA 가이드의 스페이서 길이는 적어도 16개의 뉴클레오티드, 적어도 17개의 뉴클레오티드, 적어도 18개의 뉴클레오티드, 적어도 19개의 뉴클레오티드, 적어도 20개의 뉴클레오티드, 적어도 21개의 뉴클레오티드 또는 적어도 22개의 뉴클레오티드이다. 일부 구현예에서, 스페이서 길이는 15 내지 17개의 뉴클레오티드(예를 들어, 15, 16 또는 17개의 뉴클레오티드), 17 내지 20개의 뉴클레오티드(예를 들어, 17, 18, 19 또는 20개의 뉴클레오티드), 20 내지 24개의 뉴클레오티드(예를 들어, 20, 21, 22, 23 또는 24개의 뉴클레오티드), 23 내지 25개의 뉴클레오티드(예를 들어, 23, 24 또는 25개의 뉴클레오티드), 24 내지 27개의 뉴클레오티드, 27 내지 30개의 뉴클레오티드, 30 내지 45개의 뉴클레오티드(예를 들어, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44 또는 45개의 뉴클레오티드), 30 또는 35 내지 40개의 뉴클레오티드, 41 내지 45개의 뉴클레오티드, 45 내지 50개의 뉴클레오티드(예를 들어, 45, 46, 47, 48, 49 또는 50개의 뉴클레오티드) 이상이다.
일부 구현예에서, RNA 가이드는 약 16 내지 26개의 뉴클레오티드 길이를 가지는 직접 반복(DR) 서열을 포함한다. 예를 들어, 일부 구현예에서, DR은 약 16개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 17개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 18개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 19개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 20개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 21개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 22개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 23개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 24개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 25개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, DR은 약 26개의 뉴클레오티드 길이를 가진다.
일부 구현예에서, crRNA는 뉴클레오티드 가이드 서열 및 DR 서열을 포함한다. 뉴클레오티드 가이드 서열은 약 18 내지 24개의 뉴클레오티드 길이를 가질 수 있다. 따라서, 일부 구현예에서, 뉴클레오티드 가이드 서열은 약 18개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, 뉴클레오티드 가이드 서열은 약 19개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, 뉴클레오티드 가이드 서열은 약 20개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, 뉴클레오티드 가이드 서열은 약 21개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, 뉴클레오티드 가이드 서열은 약 22개의 뉴클레오티드 길이를 가진다. 일부 구현예에서, crRNA는 약 22개 뉴클레오티드 길이의 뉴클레오티드 가이드 서열 및 약 22개의 뉴클레오티드 길이의 직접 반복부를 포함한다.
일부 구현예에서, crRNA 서열은, CRISPR-연관 단백질과 복합체를 형성할 수 있고 실질적인 뉴클레아제 활성 없이 특이적 표적에 결합할 수 있는 "죽은 crRNA", "죽은 가이드" 또는 "죽은 가이드 서열"로 변형될 수 있다.
일부 구현예에서, crRNA는 당 인산염 골격(backbone) 또는 염기에서 화학적으로 변형될 수 있다. 일부 구현예에서, crRNA는 2'O-메틸, 2'-F 또는 잠긴 핵산을 사용하여 변형되어, 뉴클레아제 저항성 또는 염기쌍 짝짓기를 향상시킬 수 있다. 일부 구현예에서, crRNA는 2-티오우리디엔 또는 N6-메틸아데노신과 같은 변형된 염기를 함유할 수 있다.
일부 구현예에서, crRNA는 다른 올리고뉴클레오티드, 펩티드, 단백질, 태그, 염료 또는 폴리에틸렌 글리콜과 접합된다.
일부 구현예에서, crRNA는 3차원 구조로 인해 특이적 표적 분자에 결합할 수 있는 앱타머 또는 리보스위치 서열을 포함할 수 있다.
일부 구현예에서, 트랜스-활성화 RNA(tracrRNA)는 crRNA와 연관되어, Cas9 단백질과의 복합체 형성을 촉진한다. 일부 구현예에서, tracrRNA 서열은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100개 이상 또는 이를 초과하는 뉴클레오티드 길이를 가진다. 일부 구현예에서, tracrRNA는 약 70개의 뉴클레오티드 길이를 가진다.
일부 구현예에서, tracrRNA 및 crRNA는 단일 가이드 RNA(sgRNA)라고 불리는 단일 전사체에 함유된다. 일부 구현예에서, sgRNA는 tracrRNA와 sgRNA 사이에 루프를 포함한다.
일부 구현예에서, 루프 형성 서열은 3, 4, 5개 이상의 뉴클레오티드 길이를 가진다. 일부 구현예에서, 루프는 서열 GAAA, AAAG, CAAA, AAAC, UUUU, UUAUAU, UUA, UUU 및/또는 AAUCA를 가진다. 일부 구현예에서, 루프는 서열 GAAA를 가진다. 일부 구현예에서, 루프는 서열 AAAG를 가진다. 일부 구현예에서, 루프는 서열 CAAA를 가진다. 일부 구현예에서, 루프는 서열 AAAC를 가진다. 일부 구현예에서, 루프는 서열 AAUCA를 가진다. 일부 구현예에서, 루프는 서열 UUUU를 가진다. 일부 구현예에서, 루프는 서열 UUAUAU를 가진다. 일부 구현예에서, 루프는 서열 UUA를 가진다. 일부 구현예에서, 루프는 서열 UUU를 가진다. 일부 구현예에서, 루프는 서열 AAUCA를 가진다.
일부 구현예에서, tracrRNA 및 crRNA는 헤어핀 루프를 형성한다. 일부 구현예에서, sgRNA는 적어도 2개 이상의 헤어핀을 가진다. 일부 구현예에서, sgRNA는 2개, 3개, 4개 또는 5개의 헤어핀을 가진다.
일부 구현예에서, sgRNA는 6개의 뉴클레오티드를 포함하는 폴리T 서열을 포함하는 전사 종결 서열을 포함한다.
일부 구현예에서, sgRNA는 ScoCas9에 대해
5'-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUC (서열번호 3),
SirCas9에 대해 5'-
GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3' (서열번호 7),
VapCas9에 대해 5'-
GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3' (서열번호 13),
EpeCas9에 대해 5'-
GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3' (서열번호 19),
LfeCas9에 대해 5'-
GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3' (서열번호 95) 및
PmaCas9에 대해 5'-
GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3' (서열번호 96)에 적어도 80% 동일성을 갖는 서열을 포함한다.
가이드 RNA는 Cas9의 5' 단부에 추가된다. 일부 구현예에서, sgRNA는 서열번호 3, 7, 13 19, 95 또는 96과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, sgRNA는 서열번호 3, 7, 13, 19, 95 또는 96과 동일한 서열을 포함한다.
일부 구현예에서, tracrRNA는 동일한 전사체에 crRNA 서열과 함께 함유되지 않은 별도의 전사체이다.
Cas9 융합 단백질
일부 구현예에서, Cas9 효소는 1개 이상의 이종 단백질 도메인에 융합된다. 일부 구현예에서, Cas9 효소는 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 단백질 도메인에 융합된다. 일부 구현예에서, 이종 단백질 도메인은 Cas9 효소의 C-말단에 융합된다. 일부 구현예에서, 이종 단백질 도메인은 Cas9 효소의 N-말단에 융합된다. 일부 구현예에서, 이종 단백질 도메인은 Cas9 효소의 C-말단과 N-말단 사이에 내부적으로 융합된다. 일부 구현예에서, 내부 융합은 Cas9 RuvCI, RuvC II, RuvCIII, HNH, REC I 또는 PAM 상호작용 도메인 내에서 이루어진다.
Cas9 단백질은 또 다른 단백질 도메인에 직접적으로 또는 간접적으로 연결될 수 있다. 일부 구현예에서, 적합한 CRISPR 시스템은 Cas9 단백질 및 이종 단백질을 연결하는 링커 또는 스페이서를 함유한다. 아미노산 링커 또는 스페이서는 일반적으로 2개 단백질 모이어티 사이에 알파 나선과 같은 구조를 개재시키도록 또는 유연하도록 설계된다. 링커 또는 스페이서는 상대적으로 짧을 수 있거나 길 수 있다. 일반적으로 링커 또는 스페이서는 예를 들어 1 내지 100개(예: 1 내지 100개, 5 내지 100개, 10 내지 100개, 20 내지 100개 30 내지 100개, 40 내지 100개, 50 내지 100개, 60 내지 100개, 70 내지 100개, 80 내지 100개, 90 내지 100개, 5 내지 55개, 10 내지 50개, 10 내지 45개, 10 내지 40개, 10 내지 35개, 10 내지 30개, 10 내지 25개, 10 내지 20개) 아미노산 길이를 함유한다. 일부 구현예에서, 링커 또는 스페이서는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100개 아미노산 길이와 동일하거나 이보다 길다. 일반적으로 링커가 길수록 입체 장애가 감소할 수 있다. 일부 구현예에서, 링커는 글리신과 세린 잔기의 혼합물을 포함한다. 일부 구현예에서, 링커는 트레오닌, 프롤린 및/또는 알라닌 잔기를 추가로 포함할 수 있다.
일부 구현예에서 Cas9 단백질은 세포 위치 신호, 에피토프 태그, 리포터 유전자, 및 효소 활성, 후성적 변형 활성, RNA 절단 활성, 핵산 결합 활성, 전사 조절 활성을 갖는 단백질 도메인에 융합된다. 일부 구현예에서, Cas9 단백질은 핵 위치 서열(NLS), FLAG 태그, HIS 태그 및/또는 HA 태그에 융합된다.
적합한 융합 파트너에는 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 데아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 탈미리스토일화 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합효소 활성, 폴리머라제 활성, 리가제 활성, 헬리카제 활성 또는 뉴클레아제 활성을 제공하는 폴리펩티드가 포함되지만 이에 국한되지는 않으며, 이들 중 임의의 것은 DNA 또는 DNA-연관 폴리펩티드(예: 히스톤 또는 DNA 결합 단백질)를 변형시킬 수 있다. 일부 구현예에서 Cas9 단백질은 히스톤 데메틸라제, 전사 활성화인자 또는 데아미나제에 융합된다.
추가의 적합한 융합 파트너에는 경계 요소(예: CTCF), 주변 동원을 제공하는 단백질 및 그의 단편(예: 라민(Lamin) A, 라민 B 등) 및 단백질 도킹 요소(예: FKBP/FRB, Pill/Abyl 등)가 포함되지만 이에 국한되지는 않는다.
특정 구현예에서, Cas9는 예를 들어 염기 편집에 사용하기 위해 시티딘 또는 아데노신 데아미나제 도메인에 융합된다. 일부 구현예에서, Cas9는 아데닌 및 시토신 염기 편집기(ACBE 또는 CASE)에 융합되고, ACBE 또는 CABE는 Cas9 닉카제(nCas9)의 N- 및 C-말단에 TadA 이종이량체 및 활성화-유도된 시티딘 데아미나제(AID)를 융합시킴으로써 발생된다. 일부 구현예에서, ACBE 또는 CABE는 동일 표적 부위에서 C에서 T로 및 A에서 G로 염기 편집을 동시에 유도한다. Xie, J 등 ACBE, a new base editor for simultaneous C-to-T and A-to-G substitutions in mammalian systems. BMC Biology (18: 131), 2020)
일부 구현예에서, 용어 "시티딘 데아미나제" 및 "시토신 데아미나제"는 상호 교환하여 사용될 수 있다. 특정 구현예에서, 시티딘 데아미나제 도메인은 본원에 기술된 임의의 시티딘 데아미나제와 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가질 수 있다. 일부 구현예에서, 시티딘 데아미나제 도메인은 시티딘 데아미나제 활성(예를 들어, C를 U로 전환)을 가진다. 특정 구현예에서, 아데노신 데아미나제 도메인은 본원에 기술된 임의의 아데노신 데아미나제와 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가질 수 있다. 일부 구현예에서, 아데노신 데아미나제 도메인은 아데노신 데아미나제 활성(예를 들어, A를 I로 전환)을 가진다. 일부 구현예에서, 용어 "아데노신 데아미나제" 및 "아데닌 데아미나제"는 상호 교환하여 사용될 수 있다.
일부 구현예에서, 시티딘 데아미나제는 아포지질단백질 B mRNA 편집 복합체(APOBEC) 계열 데아미나제의 전부 또는 일부를 포함할 수 있다. APOBEC은 진화적으로 보존된 시티딘 데아미나제 계열이다. 이 계열의 구성원은 C에서 U로 편집하는 효소이다. APOBEC 유사 단백질의 N-말단 도메인은 촉매 도메인인 반면, C-말단 도메인은 유사촉매 도메인이다. 보다 구체적으로, 촉매 도메인은 아연 의존성 시티딘 데아미나제 도메인이고, 시티딘 탈아미노화에 중요하다. APOBEC 계열 구성원에는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D(현재 "APOBEC3E"는 이를 지칭함), APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4 및 활성화-유도된(시티딘 또는 시토신) 데아미나제를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC1 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC2 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3A 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3B 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3C 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3D 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3E 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3F 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3G 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC3H 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 APOBEC4 데아미나제의 전부 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질에 혼입된 데아미나제는 활성화-유도된 데아미나제(AID)의 전부 또는 일부를 포함한다. 일부 구현예에서 융합 단백질에 혼입된 데아미나제는 시티딘 데아미나제 1(CDA1)의 전부 또는 일부를 포함한다. 융합 단백질은 임의의 적합한 유기체(예를 들어, 인간 또는 랫트)로부터의 데아미나제를 포함할 수 있음이 인식되어야 한다. 일부 구현예에서, 융합 단백질의 데아미나제 도메인은 인간, 침팬지, 고릴라, 원숭이, 소, 개, 랫트 또는 마우스에서 유래된다. 일부 구현예에서, 융합 단백질의 데아미나제 도메인은 랫트(예를 들어, 랫트 APOBEC1)로부터 유래된다. 일부 구현예에서, 데아미나제 도메인은 인간 APOBEC1이다. 일부 구현예에서, 데아미나제 도메인은 pmCDAl이다. 예시적인 시티딘 데아미나제의 서열이 아래에 제공된다.
pmCDA1 (페트로마이존 마리너스(Petromyzon marinus))
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV (서열번호 22)
인간 AID:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV (서열번호 23)
인간 AID:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL (밑줄: 핵 위치 서열; 이중 밑줄; 핵외 수송 신호) (서열번호 24)
마우스 AID:
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF (밑줄: 핵 위치 서열; 이중 밑줄: 핵외 수송 신호) (서열번호 25)
개 AID:
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL (밑줄: 핵 위치 서열; 이중 밑줄: 핵외 수송 신호) (서열번호 26)
소 AID:
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL (밑줄: 핵 위치 서열; 이중 밑줄: 핵외 수송 신호) (서열번호 27)
랫트 AID:
MAVGSKPKAALVGPHWERERIWCFLCSTGLGTQQTGQTSRWLRPAATQDPVSPPRSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGYLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLTGWGALPAGLMSPARPSDYFYCWNTFVENHERTFKAWEGLHENSVRLSRRLRRILLPLYEVDDLRDAFRTLGL (서열번호 28)
(밑줄: 핵 위치 서열; 이중 밑줄: 핵외 수송 신호)
clAID (카니스 루푸스 파밀리아리스(Canis lupus familiaris)):
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL (서열번호 29)
btAID (보스 타우루스(Bos taurus)):
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL (서열번호 30)
mAID (무스 무스쿨루스(Mis musculus)):
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL (서열번호 31)
rAPOBEC-1 (라투스 노르베기커스(Rattus Norvegicus)):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK (서열번호 32)
maAPOBEC-1 (메소크리세투스 아우라투스(Mesocricetus auratus)):
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI (서열번호 33)
ppAPOBEC-1 (퐁고 피그마에우스(Pongo pygmaeus)):
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR (서열번호 34)
ocAPOBEC1 (오리코라그 쿠니쿨러스(Oryctolagus cuniculus)):
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR (서열번호 35)
mdAPOBEC-1 (모노델피스 도메스티카(Monodelphis domestica)):
MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR (서열번호 36)
ppAPOBEC-2 (퐁고 피그마에우스):
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK (서열번호 37)
btAPOBEC-2 (보스 타우루스):
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK (서열번호 38)
mAPOBEC-3-(1) (무스 무스쿨루스):
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS (서열번호 39)
마우스 APOBEC-3-(2):
MGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYIPVPSSSSSTLSNICLTKGLPETRFCVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS (이탤릭체: 핵산 편집 도메인) (서열번호 40)
랫트 APOBEC-3:
MGPFCLGCSHRKCYSPIRNLISQETFKFHFKNRLRYAIDRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQVLRFLATHHNLSLDIFSSRLYNIRDPENQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKKLLTNFRYQDSKLQEILRPCYIPVPSSSSSTLSNICLTKGLPETRFCVERRRVHLLSEEEFYSQFYNQRVKHLCYYHGVKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVIITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLHRIKESWGLQDLVNDFGNLQLGPPMS (이탤릭체: 핵산 편집 도메인) (서열번호 41)
hAPOBEC-3A (호모 사피엔스(Homo sapiens)):
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN (서열번호 42)
hAPOBEC-3F (호모 사피엔스):
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE (서열번호 43)
레수스 마카쿠에 APOBEC-3G:
MVEPMDPRTFVSNFNNRPILSGLNTVWLCCEVKTKDPSGPPLDAKIFQGKVYSKAKYHPEMRFLRWFHKWRQLHHDQEYKVTWYVSWSPCTRCANSVATFLAKDPKVTLTIFVARLYYFWKPDYQQALRILCQKRGGPHATMKIMNYNEFQDCWNKFVDGRGKPFKPRNNLPKHYTLLQATLGELLRHLMDPGTFTSNFNNKPWVSGQHETYLCYKVERLHNDTWVPLNQHRGFLRNQAPNIHGFPKGRHAELCFLDLIPFWKLDGQQYRVTCFTSWSPCFSCAQEMAKFISNNEHVSLCIFAARIYDDQGRYQEGLRALHRDGAKIAMMNYSEFEYCWDTFVDRQGRPFQPWDGLDEHSQALSGRLRAI (이탤릭체: 핵산 편집 도메인: 세포질 위치 신호) (서열번호 44)
침팬지 APOBEC-3G:
MKPHFRNPVERMYQDTFSDNFYNRPILSHRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSKLKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDVATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTSNFNNELWVRGRHETYLCYEVERLHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLHQDYRVTCFTSWSPCFSCAQEMAKFISNNKHVSLCIFAARIYDDQGRCQEGLRTLAKAGAKISIMTYSEFKHCWDTFVDHQGCPFQPWDGLEEHSQALSGRLRAILQNQGN (서열번호 45) (이탤릭체: 핵산 편집 도메인: 세포질 위치 신호)
녹색 원숭이 APOBEC-3G:
MNPQIRNMVEQMEPDIFVYYFNNRPILSGRNTVWLCYEVKTKDPSGPPLDANIFQGKLYPEAKDHPEMKFLHWFRKWRQLHRDQEYEVTWYVSWSPCTRCANSVATFLAEDPKVTLTIFVARLYYFWKPDYQQALRILCQERGGPHATMKIMNYNEFQHCWNEFVDGQGKPFKPRKNLPKHYTLLHATLGELLRHVMDPGTFTSNFNNKPWVSGQRETYLCYKVERSHNDTWVLLNQHRGFLRNQAPDRHGFPKGRHAELCFLDLIPFWKLDDQQYRVTCFTSWSPCFSCAQKMAKFISNNKHVSLCIFAARIYDDQGRCQEGLRTLHRDGAKIAVMNYSEFEYCWDTFVDRQGRPFQPWDGLDEHSQALSGRLRAI (서열번호 46) (이탤릭체: 핵산 편집 도메인: 세포질 위치 신호)
인간 APOBEC-3G:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN (서열번호 47) (이탤릭체: 핵산 편집 도메인: 세포질 위치 신호)
인간 APOBEC-3F:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE (서열번호 48)(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-3B:
MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVYFKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQNQGN (서열번호 49) (이탤릭체: 핵산 편집 도메인)
랫트 APOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL (서열번호 50)
소 APOBEC-3B:
MDGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI (서열번호 51)
침팬지 APOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG (서열번호 52)
인간 APOBEC-3C:
MNPQIRNPMKAMYPGTFYFQFKNLWEANDRNETWLCFTVEGIKRRSVVSWKTGVFRNQVDSETHCHAERCFLSWFCDDILSPNTKYQVTWYTSWSPCPDCAGEVAEFLARHSNVNLTIFTARLYYFQYPCYQEGLRSLSQEGVAVEIMDYEDFKYCWENFVYNDNEPFKPWKGLKTNFRLLKRRLRESLQ (서열번호 53)
(이탤릭체: 핵산 편집 도메인)
고릴라 APOBEC-3C
MNPQIRNPMKAMYPGTFYFQFKNLWEANDRNETWLCFTVEGIKRRSVVSWKTGVFRNQVDSETHCHAERCFLSWECDDILSPNTNYQVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFQDTDYQEGLRSLSQEGVAVKIMDYKDFKYCWENFVYNDDEPFKPWKGLKYNFRFLKRRLQEILE (서열번호 54)
(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-3A:
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN (서열번호 55)
(이탤릭체: 핵산 편집 도메인)
레수스 마카쿠에 APOBEC-3A:
MDGSPASRPRHLMDPNTFTFNFNNDLSVRGRHQTYLCYEVERLDNGTWVPMDERRGFLCNKAKNVPCGDYGCHVELRFLCEVPSWQLDPAQTYRVTWFISWSPCFRRGCAGQVRVFLQENKHVRLRIFAARIYDYDPLYQEALRTLRDAGAQVSIMTYEEFKHCWDTFVDRQGRPFQPWDGLDEHSQALSGRLRAILQNQGN (서열번호 56)
(이탤릭체: 핵산 편집 도메인)
소 APOBEC-3A:
MDEYTFTENFNNQGWPSKTYLCYEMERLDGDATIPLDEYKGFVRNKGLDQPEKPCHAELYFLGKIHSWNLDRNQHYRLTCFISWSPCYDCAQKLTTFLKENHHISLHILASRIYTHNRFGCHQSGLCELQAAGARITIMTFEDFKHCWETFVDHKGKPFQPWEGLNVKSQALCTELQAILKTQQN (서열번호 57)
(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-3H:
MALLTAETFRLQFNNKRRLRRPYYPRKALLCYQLTPQNGSTPTRGYFENKKKCHAEICFINEIKSMGLDETQCYQVTCYLTWSPCSSCAWELVDFIKAHDHLNLGIFASRLYYHWCKPQQKGLRLLCGSQVPVEVMGFPKFADCWENFVDHEKPLSFNPYKMLEELDKNSRAIKRRLERIKIPGVRAQGRYMDILCDAEV (서열번호 58)
(이탤릭체: 핵산 편집 도메인)
레수스 마카쿠에 APOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR (서열번호 59)
인간 APOBEC-3D:
MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGPVLPKRQSNHRQEVYFRFENHAEMCFLSWFCGNRLPANRRFQITWFVSWNPCLPCVVKVTKFLAEHPNVTLTISAARLYYYRDRDWRWVLLRLHKAGARVKIMDYEDFAYCWENFVCNEGQPFMPWYKFDDNYASLHRTLKEILRNPMEAMYPHIFYFHFKNLLKACGRNESWLCFTMEVTKHHSAVFRKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLCYFWDTDYQEGLCSLSQEGASVKIMGYKDFVSCWKNFVYSDDEPFKPWKGLQTNFRLLKRRLREILQ (서열번호 60)
(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR (서열번호 61)
마우스 APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK (서열번호 62)
랫트 APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK (서열번호 63)
인간 APOBEC-2: MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK (서열번호 64)
마우스 APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK (서열번호 65)
랫트 APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK (서열번호 66)
소 APOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK (서열번호 67)
페트로마이존 마리너스 CDA1 (pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQ LNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV (서열번호 68)
인간 APOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN (서열번호 69)
인간 APOBEC3G 사슬 A:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLD EHSQDLSGRLRAILQ (서열번호 70)
인간 APOBEC3G 사슬 A D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ (서열번호 71)
hAPOBEC-4 (호모 사피엔스):
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK (서열번호 72)
mAPOBEC-4 (무스 무스쿨루스):
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF (서열번호 73)
rAPOBEC-4 (라투스 노르베기커스):
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV (서열번호 74)
mfAPOBEC-4 (마카카 퍼시쿨라리스(Macaca fascicularis)):
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK (서열번호 75)
pmCDA-1 (페트로마이존 마리너스):
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV (서열번호 76)
pmCDA-2 (페트로마이존 마리너스):
MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP (서열번호 77)
pmCDA-5 (페트로마이존 마리너스):
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT (서열번호 78)
yCD (사카로마이세스 세레비시아에):
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE (서열번호 79)
rAPOBEC-1 (델타 177-186):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK (서열번호 80)
rAPOBEC-1 (델타 202-213):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK (서열번호 81)
마우스 APOBEC-3:
MGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYIPVPSSSSSTLSNICLTKGLPETRFCVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS (서열번호 82)
(이탤릭체: 핵산 편집 도메인)
일부 구현예에서, 아데노신 데아미나제는 아데노신 데아미나제 ADAR(예를 들어, ADAR1 또는 ADAR2)의 전부 또는 일부를 포함할 수 있다. 또 다른 구현예에서, 아데노신 데아미나제는 아데노신 데아미나제 ADAT의 전부 또는 일부를 포함할 수 있다. 일부 구현예에서, 아데노신 데아미나제는 다음 돌연변이 중 하나 이상을 포함하는 대장균(EcTadA) 유래의 ADAT의 전부 또는 일부를 포함할 수 있다: D108N, A106V, D147Y, E155V, L84F, H123Y, I157F, 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이. 아데노신 데아미나제는 임의의 적합한 유기체(예를 들어, 대장균)로부터 유래될 수 있다. 일부 구현예에서, 아데노신 데아미나제는 대장균, 스타필로코커스 아우레우스, 살모넬라 타이피, 쉬와넬라 푸트리파시엔스, 헤모필루스 인플루엔자, 카울로박터 크레센투스 또는 바실러스 서브틸리스로부터 유래된다. 일부 구현예에서, 아데노신 데아미나제는 대장균으로부터 유래된다. 일부 구현예에서, 아데닌 데아미나제는 본원에 제공된 임의의 돌연변이(예를 들어, ecTadA의 돌연변이)에 상응하는 1개 이상의 돌연변이를 포함하는 자연-발생 아데노신 데아미나제이다. 임의의 상동성 단백질에서 상응하는 잔기는 예를 들어 서열 정렬 및 상동성 잔기 결정에 의해 식별될 수 있다. 이에 따라, 본원에 기술된 임의의 돌연변이(예를 들어, ecTadA에서 식별된 임의의 돌연변이)에 상응하는 임의의 자연-발생 아데노신 데아미나제(예를 들어, ecTadA와 상동성을 가짐)에서 돌연변이가 발생될 수 있다. 특정 구현예에서, TadA는 그 전체가 본원에 참고로 포함된 PCT/US2017/045381호(WO2018/027078호)에 기술된 TadA 중 임의의 하나이다. 돌연변이는 표 3에 나타낸 바와 같이 단일 가닥 DNA 상에서 바람직한 아데노신 데아미나제 활성을 갖는 진화 및 선택 횟수(예를 들어, TadA*7.10 = 7세대 진화로부터 변이체 10)를 통해 식별되었다.
표 3.TadA 변이체의 유전자형
일부 구현예에서, TadA는 단량체 또는 이량체(예를 들어, 야생형 대장균 TadA의 이종이량체 및 조작된 TadA 변이체)로 제공된다. 일부 구현예에서, 아데노신 데아미나제는 아래 표 4에 나타낸 바와 같은 8세대 TadA* 8 변이체이다.
표 4: TadA8* 아데노신 데아미나제 변이체
일부 구현예에서, 아데노신 데아미나제는 다음으로부터 선택된 아미노산 위치에서의 변경을 함유하는 9세대 TadA*9 변이체이다: 아래 참조 서열에 표시된 TadA 변이체의 21, 23, 25, 38, 51, 54, 70, 71, 72, 72, 94, 124, 133, 138, 139, 146 및 158:
일 구현예에서, 아데노신 데아미나제 변이체는 다음으로부터 선택된 2개 이상의 아미노산 위치에서 변경을 함유한다: 상기 TadA 참조 서열의 21, 23, 25, 38, 51, 54, 70, 71, 72, 94, 124, 133, 138, 139, 146 및 158. 또 다른 구현예에서, 아데노신 데아미나제 변이체는 다음으로부터 선택된 1개 이상(예를 들어, 2, 3, 4개)의 변경을 함유한다: 서열번호 1의 R21N, R23H, E25F, N38G, L51W, P54C, M70V, Q71M, N72K, Y73S, M94V, P124W, T133K, D139L, D139M, C146R 및 A158K. 다른 구현예에서, 아데노신 데아미나제 변이체는 다음 변경 중 1개 이상을 추가로 함유한다: Y147T, Y147R, Q154S, Y123H 및 Q154R. 또 다른 구현예에서, 아데노신 데아미나제 변이체는 다음으로부터 선택된 상기 TadA 참조 서열에 대한 변경의 조합을 함유한다: E25F + V82S + Y123H, T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; Q71M + V82S + Y123H + Y147R + Q154R; E25F + V82S + Y123H + T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; V82S + Y123H + P124W + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; R23H + V82S + Y123H + Y147R + Q154R; R21N + V82S + Y123H + Y147R + Q154R; V82S + Y123H + Y147R + Q154R + A158K; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; M70V + V82S + M94V + Y123H + Y147R + Q154R; Q71M + V82S + Y123H + Y147R + Q154R; E25F + I76Y+ V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D138M + Y147R + Q154R; Y72S + I76Y + V82S + Y123H + Y147R + Q154R; E25F + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D138M + Y147R + Q154R; Y72S + I76Y + V82S + Y123H + Y147R + Q154R; 및 V82S + Q154R; N72K V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; M70V +Q71M +N72K +V82S + Y123H + Y147R + Q154R; N72K V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; M70V +V82S + M94V + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; 및 M70V +Q71M +N72K +V82S + Y123H + Y147R + Q154R. 일부 구현예에서, 데아미나제 또는 다른 폴리펩티드 서열에는 예를 들어 융합 단백질의 구성요소로서 포함될 때 메티오닌이 결여되어 있다. 이는 위치 번호를 변경시킬 수 있다. 그러나, 당업자는 이러한 상응하는 돌연변이가 동일 돌연변이, 예를 들어 Y73S 및 Y72S 및 D139M 및 D138M을 의미함을 이해할 것이다.
일부 구현예에서, Cas9는 SV40 대형 T 항원의 NLS, 뉴클레오플라스민, c-myc, hRNPA1 M9, 임포틴-알파의 IBB 도메인, 근종 T 단백질의 NLS, 인간 p53, c-abl IV, 인플루엔자 바이러스 NS1, 간염 바이러스 델타 항원, 마우스 Mxl, 인간 폴리(ADP-리보스) 폴리머라제, 스테로이드 호르몬 수용체(인간) 글루코코르티코이드를 포함하는 핵 위치 서열에 융합된다.
일부 구현예에서, Cas9 단백질은 헤마글루티닌(HA) 태그, 히스티딘(His) 태그, FLAG 태그, Myc 태그, V5 태그, VSV-G 태그, SNAP 태그, 티오레독신(Trx) 태그를 포함하지만 이에 국한되지 않는 에피토프 태그에 융합된다.
일부 구현예에서 Cas9는 글루타티온-S-트랜스퍼라제(GST), 서양고추냉이 퍼옥시다제(HRP), 클로람페니콜 트랜스퍼라제(CAT), HcRed, DsRed, 시안색 형광 단백질, 황색 형광 단백질 및 청색 형광 단백질, 증강된 버전 또는 초접힘 녹색 형광 단백질(GFP)를 비롯한 GFP뿐만 아니라 기타 변형된 리포터 유전자 버전을 포함하지만 이에 국한되지 않는 리포터 유전자에 융합된다.
일부 구현예에서, 조작된 Cas9 단백질의 혈청 반감기는 이종 단백질, 예컨대 인간 혈청 알부민 단백질, 트랜스페린 단백질, 인간 IgG 및/또는 시알릴화 펩티드, 예컨대 카복시-말단 펩티드(융모성성선자극호르몬 β 사슬의 CTP)와의 융합에 의해 증가된다.
일부 구현예에서, 조작된 Cas9 단백질의 혈청 반감기는 제미닌, 유비퀴틴, FKBP12-L106P 및/또는 디히드로폴레이트 환원효소를 포함하지만 이에 국한되지 않는 불안정화 도메인과의 융합에 의해 감소된다.
증가된 또는 감소된 안정성을 제공하는 적합한 융합 파트너는 데그론 서열을 포함하지만 이에 국한되지는 않는다. 데그론은 이들이 일부에 해당하는 단백질의 안정성을 제어하는 아미노산 서열임을 당업자라면 쉽게 이해한다. 예를 들어, 데그론 서열을 포함하는 단백질의 안정성은 데그론 서열에 의해 적어도 부분적으로 제어된다. 일부 경우에, 적합한 데그론은 데그론이 실험 제어와 무관하게 단백질 안정성에 영향을 주도록 하는 구성요소이다(즉, 데그론은 약물 유도성, 온도 유도성 등이 아니다) 일부 경우에, 데그론은 변이체 Cas9 폴리펩티드가 원하는 조건에 따라 "켜짐"(즉, 안정함) 또는 "꺼짐(즉, 불안정함, 열화됨)으로 될 수 있도록 변이체 Cas9 폴리펩티드에 조절가능한 안정성을 제공한다. 예를 들어, 데그론이 온도 민감성 데그론인 경우, 변이체 Cas9 폴리펩티드는 역치 온도(예를 들어, 42℃, 41℃, 40℃, 39℃, 38℃, 37℃, 36℃, 35℃, 34℃, 33℃, 32℃, 31℃, 30℃ 등) 미만에서 기능적일 수 있지만(즉, "켜짐", 안정함), 임계 온도를 초과하는 온도에서는 비기능적일 수 있다(예: "꺼짐, 열화됨). 또 다른 예로서, 데그론이 약물 유도성 데그론인 경우, 약물의 존재 또는 부재는 단백질을 "꺼짐(즉, 불안정) 상태에서 "켜짐"(즉, 안정) 상태로 전환할 수 있거나 또는 그 반대일 수 있다. 예시적인 약물 유도성 데그론은 FKBP12 단백질로부터 유래된다. 데그론의 안정성은 데그론에 결합하는 소분자의 존재 또는 부재에 의해 조절된다.
적합한 데그론의 예는 Shield-1, DHFR, 옥신 및/또는 온도에 의해 조절되는 데그론을 포함하지만 이에 국한되지는 않는다. 적합한 데그론의 비제한적인 예는 당업계에 알려져 있다(예를 들어, Dohmen 등, Science, 1994. 263(5151): p. 1273-1276: Heat-inducible degron: a method for constructing temperature-sensitive mutants; Schoeber 등, Am J Physiol Renal Physiol. 2009 Jan;296(l):F204-l l: Conditional fast expression and function of multimeric TRPV5 channels using Shield-1; Chu 등, Bioorg Med Chem Lett. 2008 Nov 15;18(22):5941-4: Recent progress with FKBP-derived destabilizing domains; Kanemaki, Pflugers Arch. 2012 Dec 28: Frontiers of protein expression control with conditional degrons; Yang 등, Mol Cell. 2012 Nov 30;48(4):487-8: Titivated for destruction: the methyl degron; Barbour 등, Biosci Rep. 2013 Jan 18;33(1).: Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase; 및 Greussing 등, J Vis Exp. 2012 Nov 10;(69): Monitoring of ubiquitin-proteasome activity in living cells using a Degron (dgn)-destabilized green fluorescent protein (GFP)-based reporter protein; 이들 모두는 전체적으로 본원에 참고로 통합된다).
예시적인 데그론 서열은 세포와 동물 모두에서 잘 특징규명되었고 테스트되었다. 따라서 죽은 Cas9를 데그론 서열에 융합시키면 "조정 가능"하고 "유도성"인 죽은 Cas9 폴리펩티드를 생성시킨다.
본원에 기술된 임의의 융합 파트너는 임의의 바람직한 조합으로 사용될 수 있다. 이 점을 설명하기 위한 하나의 비제한적 예로서, Cas9 융합 단백질은 검출을 위한 YFP 서열, 안정성을 위한 데그론 서열 및 표적 DNA의 전사를 증가시키기 위한 전사 활성화인자 서열을 포함할 수 있다. 또한 dCas9 융합 단백질에서 사용될 수 있는 융합 파트너의 수는 제한되지 않는다. 일부 경우에, Cas9 융합 단백질은 1개 이상(예를 들어 2개 이상, 3개 이상, 4개 이상 또는 5개 이상)의 이종 서열을 포함한다.
표적 핵산
표적 핵산은 단일 가닥, 이중 가닥 또는 다중 가닥의 DNA 또는 RNA인 DNA 분자, RNA 분자, 게놈 DNA, cDNA, DNA-RNA 혼성, 또는 퓨린 및 피리미딘 염기 또는 기타 천연, 화학적으로 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오티드 염기인 데옥시리보뉴클레오티드, 리보뉴클레오티드 또는 이들의 유사체를 포함하는 중합체이다. 표적 핵산은 3차원 구조를 가질 수 있고, 암호화 또는 비암호화 영역을 포함할 수 있으며, 엑손, 인트론, mRNA, tRNA, rRNA, siRNA, shRNA, miRNA, 리보자임, cDNA, 플라스미드, 벡터, 외인성 서열, 내인성 서열을 포함할 수 있다. 표적 핵산은 변형된 뉴클레오티드를 포함할 수 있고, 메틸화 뉴클레오티드 또는 뉴클레오티드 유사체를 포함할 수 있다. 일부 구현예에서, 표적 핵산은 비핵산 구성요소와 함께 산재될 수 있다.
표적 핵산은 CRISPR-Cas9 시스템에 의해 인식되고, Cas9에 결합한다. 일부 구현예에서, 이는 Cas9의 결합으로 인해 변형되거나, 절단되거나, 변경 발현을 가진다. 표적 핵산은 특이적인 인식가능한 PAM 모티프, 예를 들어 5'-NGG-3', 5'-NGC-3', 5'-NAGHC-3', 5'-NRHRRH-3' 또는 5'-NNAAA-3'(H=A, C 또는 T; R=A 또는 G)를 함유한다.
재조합 유전자 기술
본 개시내용에 따르면, 당업계 기술 내에 이용된 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기술이 있을 수 있다. 이러한 기술은 문헌에 기술되어 있다(예를 들어 Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; DNA Cloning: A Practical Approach, Volumes I and II (D. N. Glover ed. 1985); Oligonucleotide Synthesis (M. J. Gait ed. 1984); Nucleic Acid Hybridization (B. D. Hames & S. J. Higgins eds. (1985)); Transcription And Translation (B. D. Hames & S. J. Higgins, eds. (1984)); Animal Cell Culture (R. I. Freshney, ed. (1986)); Immobilized Cells and Enzymes (IRL Press, (1986)); B. Perbal, A Practical Guide To Molecular Cloning (1984); F. M. Ausubel 등 (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994) 참조.
본원에 기술된 조작된 Cas9 효소와 같이 폴리펩티드를 암호화하는 핵산과 같은 유전자의 재조합 발현은 폴리펩티드를 암호화하는 핵산을 함유하는 발현 벡터의 작제를 포함할 수 있다. 일단 폴리뉴클레오티드가 얻어지면, 폴리펩티드 생성을 위한 벡터는 당업계에 알려진 기술을 사용하여 재조합 DNA 기술에 의해 생성될 수 있다. 폴리펩티드 암호화 서열 및 적절한 전사 및 번역 조절 신호를 함유하는 발현 벡터를 작제하기 위해 공지 방법이 사용될 수 있다. 이러한 방법은 예를 들어 시험관내 재조합 DNA 기술, 합성 기술 및 생체내 유전자 재조합을 포함한다.
발현 벡터는 통상적인 기술에 의해 숙주 세포로 전달될 수 있고, 그 다음, 형질감염된 세포는 통상적인 기술에 의해 배양되어 폴리펩티드를 생성할 수 있다.
일부 구현예에서, DNA-표적 RNA 및/또는 Cas9 단백질을 암호화하는 뉴클레오티드 서열은 조절 요소, 예를 들어 프로모터와 같은 전사 조절 요소에 작동가능하게 연결된다. 전사 조절 요소는 진핵 세포, 예를 들어 포유동물 세포; 또는 원핵 세포(예를 들어, 박테리아 또는 고세균 세포)에서 기능적일 수 있다. 일부 구현예에서, 진핵 세포는 인간 세포이다. 일부 구현예에서, DNA-표적 RNA 및/또는 신규 Cas9 단백질을 암호화하는 뉴클레오티드 서열은 원핵 세포 및 진핵 세포 모두에서 암호화된 뉴클레오티드 서열의 발현을 허용하는 다수의 조절 요소에 작동가능하게 연결된다.
프로모터는 구성요소적으로 활성인 프로모터(즉, 활성/"켜짐" 상태에서 구성요소인 프로모터)일 수 있고, 유도성 프로모터(즉, 외부 자극, 예를 들어 특정 온도, 화합물 또는 단백질의 존재에 의해 조절되는 활성/"켜짐" 또는 불활성/"꺼짐" 상태를 갖는 프로모터)일 수 있고, 공간적으로 제한된 프로모터(즉, 전사 조절 요소, 인핸서 등)(예: 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)일 수 있고, 일시적으로 제한된 프로모터일 수 있다(즉, 프로모터는 배아 발달의 특정 단계 동안 또는 생물학적 프로세스의 특정 단계, 예를 들어 마우스의 모낭 주기 동안 "켜짐" 상태 또는 "꺼짐" 상태에 있다).
적합한 프로모터는 바이러스로부터 유래될 수 있고 따라서 바이러스 프로모터로 지칭될 수 있거나, 원핵생물 또는 진핵생물 유기체를 포함하는 임의의 유기체로부터 유래될 수 있다. 임의의 RNA 폴리머라제(예를 들어, pol I, pol II, pol III)에 의한 발현을 구동시키기 위해 적합한 프로모터가 사용될 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유방 종양 바이러스 긴 말단 반복(LTR) 프로모터; 아데노바이러스 주요 후기 프로모터(Ad MLP); 단순 포진 바이러스(HSV) 프로모터, 거대세포바이러스(CMV) 프로모터, 예컨대 CMV 즉시 초기(immediate early) 프로모터 영역(CMVIE), 육종 바이러스(RSV) 프로모터, 인간 U6 소형 핵 프로모터(U6)(Miyagishi 등, Nature Biotechnology 20, 497-500 (2002)), 증강된 U6 프로모터(예를 들어, Xia 등, Nucleic Acids Res. 2003 Sep 1,31(17)) 및/또는 인간 HI 프로모터(HI)를 포함하지만, 이에 국한되지 않는다.
유도성 프로모터의 예는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노시드(IPTG)-조절된 프로모터, 락토스 유도된 프로모터, 열 충격 프로모터, 테트라사이클린-조절된 프로모터(예: Tet-켜짐, Tet-꺼짐 등), 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등을 포함하지만 이에 국한되지 않는다. 따라서 유도성 프로모터는 독시사이클린, RNA 폴리머라제, 예를 들어 T7 RNA 폴리머라제, 에스트로겐 수용체 및/또는 에스트로겐 수용체 융합을 포함하지만 이에 국한되지 않는 분자에 의해 조절될 수 있다.
일부 구현예에서, 프로모터는 공간적으로 제한된 프로모터(즉, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이어서, 다세포 유기체에서 프로모터는 특정 세포의 하위세트에서 활성(즉, "켜짐")이다. 또한 공간적으로 제한된 프로모터는 인핸서, 전사 조절 요소, 조절 서열 등으로도 지칭될 수 있다. 임의의 편의적인 공간적으로 제한된 프로모터가 사용될 수 있고, 적합한 프로모터(예를 들어, 뇌 특이적 프로모터, 뉴런 하위세트에서 발현을 구동시키는 프로모터, 생식계열에서 발현을 구동시키는 프로모터, 폐에서 발현을 구동시키는 프로모터, 근육에서 발현을 구동시키는 프로모터, 췌장 섬 세포에서 발현을 구동시키는 프로모터 등)의 선택은 유기체에 따라 달라진다. 따라서 공간적으로 제한된 프로모터는 유기체에 따라 광범위한 상이한 조직 및 세포 유형에서 대상체 부위-특이적 폴리펩티드를 암호화하는 핵산의 발현을 조절하기 위해 사용될 수 있다. 또한 일부 공간적으로 제한된 프로모터는 배아 발달의 특정 단계 동안 또는 생물학적 프로세스의 특정 단계(예를 들어 모낭 주기) 동안 프로모터가 "켜짐" 상태 또는 "꺼짐" 상태에 있도록 일시적으로 제한된다.
예시 목적으로, 공간적으로 제한된 프로모터의 예는 뉴런-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함하지만 이제 국한되지는 않는다. 뉴런-특이적이고 공간적으로 제한된 프로모터는 뉴런-특이적 에놀라제(NSE) 프로모터, 방향족 아미노산 데카복실라제(AADC) 프로모터, 신경필라멘트 프로모터, 시냅신 프로모터, thy-1 프로모터, 세로토닌 수용체 프로모터, 티로신 하이드록실라제 프로모터(TH), GnRH 프로모터, L7 프로모터, DNMT 프로모터, 엔케팔린 프로모터, 미엘린 염기성 단백질(MBP) 프로모터, Ca2+-칼모듈린-의존성 단백질 키나제 II-알파(CamKIIa) 프로모터 및/또는 CMV 인핸서/혈소판-유래된 성장 인자-β 프로모터를 포함하지만 이제 국한되지는 않는다.
지방세포-특이적이고 공간적으로 제한된 프로모터는 aP2 유전자 프로모터/인핸서, 예를 들어 인간 aP2 유전자의 -5.4kb 내지 +21bp 영역, 글루코스 수송체-4(GLUT4) 프로모터, 지방산 트랜스로카제(FAT/CD36) 프로모터, 스테아로일-CoA 불포화효소-1(SCD1) 프로모터, 렙틴 프로모터 및 아디포넥틴 프로모터, 아디프신 프로모터 및/또는 레지스틴 프로모터를 포함하지만, 이에 국한되지는 않는다.
심근세포-특이적이고 공간적으로 제한된 프로모터는 다음 유전자로부터 유래된 조절 서열을 포함하지만 이에 국한되지는 않는다: 미오신 경쇄-2, a-미오신 중쇄, AE3, 심장 트로포닌 C 및/또는 심장 액틴.
평활근-특이적이고 공간적으로 제한된 프로모터는 SM22a 프로모터, 스무델린 프로모터 및/또는 a-평활근 액틴 프로모터를 포함하지만 이에 국한되지는 않는다.
광수용체-특이적이고 공간적으로 제한된 프로모터는 로돕신 프로모터, 로돕신 키나제 프로모터, 베타 포스포디에스테라제 유전자 프로모터, 색소성 망막염 유전자 프로모터, 광수용기간 레티노이드-결합 단백질(IRBP) 유전자 인핸서 및/또는 IRBP 유전자 프로모터를 포함하지만, 이에 국한되지는 않는다.
CRISPR-Cas9의 유전자 편집 사용
본원에 기술된 CRISPR-Cas9 시스템은 유전자 침묵 사건 또는 원하는 표적 유전자 발현의 발현 변경(예를 들면, 증가 또는 감소)을 초래할 수 있는 유전자 편집을 위해 사용될 수 있다. 따라서, 일부 구현예에서, 본원에 기술된 CRISPR-Cas9 시스템은 표적 핵산의 발현을 변경하는 방법에서 사용된다. 일부 구현예에서, 본원에 기술된 CRISPR-Cas9 시스템은 원하는 표적 세포에서 표적 핵산을 변형하는 방법에서 사용된다. 일부 구현예에서, 본 발명은 유전자 발현에서 원하는 변형을 유발하기 위한 진핵 세포 내 표적 핵산의 부위-특이적 변형 방법을 제공한다.
일부 구현예에서, 본 발명은 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산; 및 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 서열 동일성을 갖는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하는 조작된 비천연 발생 CRISPR-Cas 시스템을 제공하고, 상기 RNA 가이드는 직접 반복 서열, 및 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열에서 파손을 유발할 수 있다.
일부 구현예에서, 본 발명은 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산; 및 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 서열 동일성을 갖는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하는 조작된 비천연 발생 CRISPR-Cas 시스템을 제공하고, 상기 RNA 가이드는 직접 반복 서열, 및 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas 단백질은 데아미나제에 융합하고, 상기 Cas 단백질 융합은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있다.
일부 구현예에서, 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하고 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는 조작된 비천연 발생 CRISPR-Cas 시스템이 본원에 제공된다.
일부 구현예에서, 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는 조작된 비천연 발생 Cas9 융합 단백질이 본원에 제공된다.
일부 구현예에서, 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96과 적어도 80% 동일성을 갖는 조작된 비천연 발생 Cas9 융합 단백질이 본원에 제공된다.
일부 구현예에서, 본 발명은 세포를, 본원에 기술된 Cas9 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하는, 진핵 세포 내 표적 핵산의 발현을 변경하는 방법으로, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열에서 파손을 유발할 수 있는 방법을 제공한다.
일부 구현예에서, 본 발명은 세포를, 본원에 기술된 Cas9 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하는, 진핵 세포 내 표적 핵산의 발현을 변경하는 방법으로, 상기 RNA 가이드는 직접 반복 서열, 및 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는 방법을 제공한다.
일부 구현예에서, 본 발명은 세포를, 본원에 기술된 Cas9 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하는, 진핵 세포 내 표적 핵산을 변형하는 방법으로, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고, 상기 Cas 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는 방법을 제공한다.
따라서, 일부 구현예에서, Cas 단백질은 서열번호 1, 4, 8, 14, 84 또는 86과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일성을 가진다. 일부 구현예에서, Cas 단백질은 서열번호 1, 4, 8, 14, 84 또는 86과 동일하다.
CRISPR-Cas9 시스템 및 방법에서 사용하기에 적합한 가이드 RNA, Cas9 돌연변이 및 융합 단백질은 본 개시내용 전반에 걸쳐 기술된 바와 같다.
일 측면에서, 방법은 CRISPR-Cas9를 표적 핵산에 결합시키고 표적 핵산 절단을 달성하는 것을 포함한다. 일부 구현예에서, CRISPR-Cas9 시스템은 이중 가닥의 파손을 도입함으로써 표적 DNA 또는 RNA 이중구조를 절단한다. 일부 구현예에서 CRISPR-Cas9 시스템은 단일 가닥의 파손 또는 틈(nick)을 도입함으로써 표적 DNA 또는 RNA를 절단한다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 부위-특이적 방식으로 표적 DNA를 변형하는 이펙터를 갖는 융합 단백질을 포함하며, 변형 활성에는 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 탈미리스토일화 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합효소 활성, 폴리머라제 활성, 리가제 활성, 헬리카제 활성 또는 뉴클레아제 활성이 포함되고, 이들 중 임의의 것은 DNA 또는 DNA-연관 폴리펩티드(예를 들어, 히스톤 또는 DNA 결합 단백질)를 변형시킬 수 있다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 아데노신 또는 시토신 염기를 변형시킬 수 있고 부위-특이적 염기 편집기로 기능할 수 있는 데아미나제 효소를 포함하여 뉴클레오티드 염기를 화학적으로 변형시킴으로써 DNA 서열을 편집할 수 있는 효소를 갖는 융합 단백질을 포함한다. 예를 들어, 일반적으로 RNA를 기질로 사용하는 APOBEC1 시티딘 데아미나제는 Cas9에 융합될 때 단일 가닥 및 이중 가닥의 DNA에 표적이 되어 시티딘을 유리딘으로 직접 전환시킬 수 있고, ADAR 효소는 아데노신을 이노신으로 탈아미노화한다. 따라서 데아미나제를 사용하는 '염기 편집'은 하나의 표적 DNA 염기를 다른 염기로 프로그래밍 가능한 전환을 가능하게 한다. 다양한 염기 편집기가 당업계에 알려져 있고, 본원에 기술된 방법 및 시스템에서 사용될 수 있다. 예시적인 염기 편집기는 예를 들어 Rees and Liu Nature Review Genetics, 2018, 19(12): 770-788에 기술되어 있고, 그 내용이 본원에 통합된다. 따라서, 일부 구현예에서, 본원에 기술된 Cas9 효소(ScoCas9, SirCas9, VapCas9, EpeCas9, LfeCas9, PmaCas9)는 핵염기 편집기의 구성요소이다. 일부 구현예에서, 염기 편집기는 아데닌 데아미나제 TadA8 또는 TadA9이다.
일부 구현예에서, 염기 편집은 침묵 유전자에 정지 코돈 도입을 초래한다. 일부 구현예에서, 염기 편집은 아미노산 서열 변경에 의해 단백질 기능 변경을 초래한다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 히스톤과의 융합에 의한 표적 DNA의 후성적 변형을 포함한다. 일부 구현예에서, CRISPR-Cas9 시스템은 판독기, 기록기 또는 지우개(eraser) 단백질과 같은 후성적 변형 효소와의 융합에 의한 표적 DNA의 후성적 변형을 포함한다. 일부 구현예에서, CRISPR-Cas9 시스템은 표적 DNA의 선택된 영역에서 히스톤 변형 패턴을 변경시키는 히스톤 변형 효소와의 융합을 포함한다. 히스톤 변형은 메틸화, 아세틸화, 유비퀴틴화, 인산화를 포함하는 많은 상이한 방식으로 그리고 많은 상이한 조합으로 발생하여 DNA의 구조적 변화를 초래할 수 있다. 일부 구현예에서, 히스톤 변형은 전사 억제 또는 활성화를 초래한다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 전사 활성화인자 단백질 또는 전사 억제인자 단백질, 소분자/약물-반응성 전사 조절인자, 유도성 전사 조절인자와의 융합을 통해 전사를 증가시키거나 감소시킴으로써 표적 DNA의 전사를 조절한다. 일부 구현예에서, CRISPR-Cas9 시스템은 결합으로 유전자 발현의 증가 또는 감소를 초래하는 표적 암호화 mRNA(즉, 단백질 암호화 유전자)의 발현을 조절하기 위해 사용된다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 프로모터 또는 인핸서와 같은 유전자 조절 요소를 편집함으로써 유전자 조절을 조절하기 위해 사용된다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 tRNA, rRNA, snoRNA, siRNA, miRNA 및 긴 ncRNA를 포함하는 표적 비암호화 RNA의 발현을 조절하기 위해 사용된다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 염색질 루프 구조의 표적화된 조작을 위해 사용된다. 조절 게놈 영역 사이의 염색질 루프의 표적화된 조작은, 내인성 염색질 구조를 조종하고 새로운 인핸서-프로모터 연결 형성이 유전적 결함을 극복하게 하거나 비정상적인 인핸서-프로모터 연결을 억제하도록 하는 수단을 제공한다.
일부 구현예에서, CRISPR-Cas9는 살아있는 세포 영상화를 위해 사용된다. 형광 표지된 Cas9는 동원체 및 텔로미어와 같은 반복적인 게놈 영역을 표적으로 하여 세포 주기 전반에 걸쳐 천연 염색질 유전자좌를 추적하고, 3D 핵 공간에서 전사적 활성 및 불활성 영역의 차등적 위치를 결정한다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 유익한 임상 변이체 또는 억제 돌연변이의 삽입에 의한 병원성 돌연변이 교정을 위해 사용된다.
핵염기 편집기
Cas9를 포함하는 폴리뉴클레오티드의 표적 뉴클레오티드 서열을 편집, 변형 또는 변경하기 위한 신규 염기 편집기 또는 핵염기 편집기가 본원에 개시된다. 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9) 및 핵염기 편집 도메인(예를 들어, 아데노신 데아미나제)을 포함하는 핵염기 편집기 또는 염기 편집기가 본원에 기술된다. 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9)은 결합된 가이드 폴리뉴클레오티드(예를 들어, gRNA)와 함께 있을 때 표적 폴리뉴클레오티드 서열에 특이적으로 결합할 수 있고(즉, 결합된 가이드 핵산의 염기와 표적 폴리뉴클레오티드 서열의 염기 사이의 상보적 염기 쌍 형성을 통해), 그에 의해 편집하고자 하는 표적 핵산 서열에 염기 편집기를 위치시킬 수 있다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 단일 가닥의 DNA 또는 이중 가닥의 DNA를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 RNA를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 DNA-RNA 혼성을 포함한다. 인간 질병과 연관하여 알려진 유전자 변이의 대부분은 점 돌연변이이므로, 정확한 점 돌연변이를 보다 효율적이고 깔끔하게 만들 수 있는 방법이 필요하다. 본원에 제공된 염기 편집 시스템은 이중 가닥 DNA 파손을 발생시키지 않고 공여체 DNA 주형을 요구하지 않고 과도한 확률론적 삽입 및 결실을 유도하지 않으면서 게놈 편집을 제공하는 신규 방법을 제공한다.
본원에 제공된 염기 편집기는 유의한 비율의 삽입결실을 발생시키지 않으면서 특정 뉴클레오티드 염기를 변형시킬 수 있다. 본원에서 사용될 때 용어 "삽입결실(들)"은 핵산 내 뉴클레오티드 염기의 삽입 또는 결실을 의미한다. 이러한 삽입 또는 결실은 유전자의 암호화 영역 내의 프레임 이동 돌연변이를 이끌 수 있다. 일부 구현예에서, 표적 뉴클레오티드 서열에서 다수의 삽입 또는 결실(즉, 삽입결실)을 발생시키지 않으면서 핵산 내 특정 뉴클레오티드를 효율적으로 변형(예를 들어, 돌연변이 또는 탈아미노화)시키는 염기 편집기를 발생시키는 것이 바람직하다. 특정 구현예에서, 본원에 제공된 임의의 염기 편집기는 삽입결실 대비 의도한 변형(예를 들어 점 돌연변이 또는 탈아미노화) 비율을 더 크게 생성시킬 수 있다.
일부 구현예에서, 본원에 제공된 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만 또는 0.01% 미만의 삽입결실 형성을 초래한다.
본 개시내용의 일부 측면은 본원에 제공된 임의의 염기 편집기가 의도하지 않은 점 돌연변이와 같은 상당 수의 의도하지 않은 돌연변이를 발생시키는 것없이 핵산(예를 들어 대상체의 게놈 내 핵산)에서 점 돌연변이와 같은 의도된 돌연변이를 효율적으로 발생시킬 수 있다는 인식에 기반한다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 의도된 돌연변이를 적어도 0.01%(즉, 적어도 0.01% 염기 편집 효율) 발생시킬 수 있다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 의도된 돌연변이를 적어도 0.01%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99%를 발생시킬 수 있다.
일부 구현예에서, 본원에 제공된 염기 편집기는 1:1보다 큰, 의도된 점 돌연변이 대 삽입결실의 비율을 발생시킬 수 있다. 일부 구현예에서, 본원에 제공된 염기 편집기는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 8.5:1, 적어도 9:1, 적어도 10:1, 적어도 11:1, 적어도 12:1, 적어도 13:1, 적어도 14:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 200:1, 적어도 300:1, 적어도 400:1, 적어도 500:1, 적어도 600:1, 적어도 700:1, 적어도 800:1, 적어도 900:1 또는 적어도 1000:1 이상의 의도된 점 돌연변이 대 삽입결실의 비율을 발생시킬 수 있다.
의도된 돌연변이 및 삽입결실의 수는 예를 들어 국제 PCT 출원 제PCT/2017/045381호(WO2018/027078호) 및 PCT/US2016/058344호(WO2017/070632호); Komor, A.C., 등, "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., 등, "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); 및 Komor, A.C., 등, "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017)에 기술된 바와 같은 임의의 적합한 방법을 사용하여 결정될 수 있으며, 이들 문헌의 전체 내용은 여기서 참고로 통합된다.
일부 구현예에서, 삽입결실 빈도를 계산하기 위해, 삽입결실이 발생할 수 있는 양쪽 허용범위의 측면에 위치한 2개의 10-bp 서열의 정확한 매치에 대하여 서열분석 판독을 스캐닝한다. 정확한 매치가 없으면 이 판독은 분석에서 제외된다. 이 삽입결실 허용범위의 길이가 참조 서열과 정확히 매치되는 경우 판독은 삽입결실을 함유하지 않은 것으로 분류된다. 삽입결실 허용범위가 참조 서열보다 2개 초과 염기만큼 길거나 짧은 경우 이 염기서열 판독은 각각 삽입 또는 결실로 분류된다. 일부 구현예에서, 본원에 제공된 염기 편집기는 핵산 영역에서 삽입결실 형성을 제한할 수 있다. 일부 구현예에서, 상기 영역은 염기 편집기에 의해 표적화된 뉴클레오티드 또는 염기 편집기에 의해 표적화된 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 뉴클레오티드 내 영역이다.
표적 뉴클레오티드 영역에서 형성된 삽입결실의 수는 핵산(예를 들어, 세포 게놈 내 핵산)이 염기 편집기에 노출되는 시간의 양에 따라 달라질 수 있다. 일부 구현예에서, 삽입결실의 수 또는 비율은 표적 뉴클레오티드 서열(예를 들어, 세포 게놈 내 핵산)을 염기 편집기에 노출시킨 후 적어도 1시간, 적어도 2시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 7일, 적어도 10일 또는 적어도 14일에 결정된다. 본원에 기술된 염기 편집기의 특징은 임의의 융합 단백질, 또는 본원에 제공된 융합 단백질을 사용하는 방법에 적용될 수 있음을 이해해야 한다.
치료적 적용분야
본원에 기술된 CRISPR-Cas9 방법 또는 시스템은 다양한 치료적 적용분야를 가질 수 있다. 따라서, 일부 구현예에서, 장애 또는 질병 치료를 필요로 하는 대상체에서 장애 또는 질병을 치료하는 방법이 제공되고, 상기 방법은 본원에 기술된 바와 같은 Cas9를 포함하는 CRISPR-Cas9 시스템을 대상체에게 투여하는 것을 포함하고, 상기 가이드 RNA는 병태 또는 질병과 연관된 표적 핵산의 적어도 10개의 뉴클레오티드에 상보적이고; 상기 Cas 단백질은 상기 가이드 RNA와 연관되고; 상기 가이드 RNA는 표적 핵산에 결합하고; 상기 Cas 단백질은 표적 핵산의 파손을 유발하고, 선택적으로 상기 Cas9는 데아미나제에 융합된 불활성 Cas9(dCas9)이고 표적 핵산에서 1개 이상의 염기 편집을 초래하여 상기 장애 또는 질병을 치료한다.
일부 구현예에서, CRISPR-Cas9 방법 또는 시스템은 다양한 질병 및 장애, 예를 들어 유전 장애(예를 들어 단일유전 질병), 뉴클레아제 활성에 의해 치료될 수 있는 질병 및 다양한 암 등을 치료하기 위해 사용될 수 있다.
일부 구현예에서, 본원에 기술된 CRISPR 방법 또는 시스템은 (예를 들어, 하나 이상의 핵산 잔기를 삽입, 결실 또는 돌연변이시킴으로써) 표적 핵산을 변형시키기 위해 표적 핵산을 편집하는 데 사용될 수 있다. 예를 들어, 일부 구현예에서 본원에 기술된 CRISPR 시스템은 바람직한 핵산 서열을 포함하는 외인성 공여체 주형 핵산(예를 들어, DNA 분자 또는 RNA 분자)을 포함한다. 본원에 기술된 CRISPR 시스템으로 유도된 절단 사건이 해결될 때 세포의 분자 기구는 절단 사건의 복구 및/또는 해결에서 외인성 공여체 주형 핵산을 활용한다. 대안적으로, 세포의 분자 기구는 절단 사건의 복구 및/또는 해결에서 내인성 주형을 활용할 수 있다. 일부 구현예에서, 본원에 기술된 CRISPR 시스템은 표적 핵산을 변경시키기 위해 사용되어 삽입, 결실 및/또는 점 돌연변이를 초래할 수 있다. 일부 구현예에서, 삽입은 무흔적 삽입(즉, 절단 사건이 해결될 때 표적 핵산 내로 의도된 핵산 서열 삽입으로 인해 추가의 의도하지 않은 핵산 서열이 없음)이다. 공여체 주형 핵산은 이중 가닥 또는 단일 가닥의 핵산 분자(예를 들어, DNA 또는 RNA)일 수 있다. 일부 구현예에서, 본원에 기술된 CRISPR 방법 또는 시스템은 핵염기 편집기를 포함한다. 예를 들어, 일부 구현예에서, 본원에 기술된 Cas9 단백질은 핵염기 편집 활성을 갖는 폴리펩티드에 융합된다.
일 측면에서, 본원에 기술된 CRISPR 방법 또는 시스템은 RNA, 독성 RNA 및/또는 돌연변이된 RNA(예를 들어, 스플라이싱 결함 또는 첨두절단)의 과발현으로 유발된 질병을 치료하기 위해 사용될 수 있다.
일부 구현예에서, 본원에 기술된 CRISPR 방법 또는 시스템은 또한 다양한 질병을 유발하는 RNA-의존적 기능에 영향을 주는 트랜스-작용(trans-acting) 돌연변이를 표적으로 할 수 있다.
일부 구현예에서, 본원에 기술된 CRISPR 방법 또는 시스템은 또한 스플라이싱 결함 및 질병을 유발할 수 있는 시스-작용(cis-acting) 스플라이싱 코드를 파손시키는 돌연변이를 표적으로 하기 위해 사용될 수 있다.
본원에 기술된 CRISPR 방법 또는 시스템은 특히 RNA 바이러스에 대항하는 항바이러스 활성을 위해 추가로 사용될 수 있다. CRISPR-연관 단백질은 바이러스 RNA 서열을 표적으로 하기 위해 선택된 적합한 RNA 가이드를 사용하여 바이러스 RNA를 표적으로 할 수 있다.
본원에 기술된 CRISPR 방법 또는 시스템은 또한 대상체(예를 들어, 인간 대상체)에서 암을 치료하기 위해 사용될 수 있다. 예를 들어, 본원에 기술된 CRISPR-연관 단백질은 비정상적인(예를 들어, 점 돌연변이를 포함하거나 선택적 스플라이싱된) RNA 분자를 표적으로 하는 crRNA에 의해 프로그래밍될 수 있고, 암세포에서 발견되어 암세포에서 세포사를 유도할 수 있다(예를 들어, 아포톱시스를 통해).
또한, 본원에 기술된 CRISPR 방법 또는 시스템은 대상체의 감염성 질병을 치료하기 위해 사용될 수 있다. 예를 들어, 본원에 기술된 CRISPR-연관 단백질은 감염원 세포에서 세포사를 표적으로 하고 유도하기 위해 감염원(예: 박테리아, 바이러스, 기생충 또는 원생동물)에 의해 발현되는 RNA 분자를 표적으로 하는 crRNA에 의해 프로그래밍될 수 있다. CRISPR 시스템은 세포내 감염원이 숙주 대상체의 세포를 감염시키는 질병을 치료하기 위해 사용될 수 있다. 감염원 유전자에 의해 암호화된 RNA 분자를 표적으로 하는 CRISPR-연관 단백질을 프로그래밍함으로써 감염원에 감염된 세포가 표적이 될 수 있고 세포사가 유도될 수 있다.
또한, 시험관 내 RNA 감지 검정이 사용되어 특정 RNA 기질을 검출할 수 있다. CRISPR-연관 단백질은 살아있는 세포에서 RNA-기반 감지를 위해 사용될 수 있다. 적용분야의 예에는 예를 들어 질병-특이적 RNA 감지에 의한 진단이 있다.
폴리뉴클레오티드 서열을 표적 DNA 서열 내로 삽입하는 것이 바람직한 적용분야에서, 삽입될 공여체 서열을 포함하는 폴리뉴클레오티드가 또한 세포에 제공된다. "공여체 서열" 또는 "공여체 폴리뉴클레오티드"라 함은 부위-특이적 변형 폴리펩티드에 의해 유도된 절단 부위에 삽입되는 핵산 서열을 의미한다. 공여체 폴리뉴클레오티드는 상기 공여체 폴리뉴클레오티드와 상기 공여체 폴리뉴클레오티드가 상동성을 구비한 대상인 게놈 서열과의 사이에 상동성-기반 복구를 뒷받침하기 위해 절단 부위에서 게놈 서열에 대해 충분한 상동성, 예컨대 절단 부위에서, 예컨대 절단 부위의 약 50개 이하의 염기 내에, 예컨대 약 30개 염기 내에, 약 15개 염기 내에, 약 10개 염기 내에, 약 5개 염기 내의 측면에 위치하거나 절단 부위의 바로 측면에 위치하는 뉴클레오티드 서열에 대해 예를 들어 70%, 80%, 85%, 90%, 95% 또는 100% 상동성을 함유한다. 공여체와 게놈 서열 사이의 서열 상동성의 대략 25, 50, 100 또는 200개의 뉴클레오티드, 또는 200개 초과의 뉴클레오티드(또는 10 내지 200개 이상의 뉴클레오티드의 임의의 적분 값)는 상동성-기반 복구를 뒷받침한다. 공여체 서열은 임의의 길이, 예컨대 10개 이상의 뉴클레오티드, 50개 이상의 뉴클레오티드, 100개 이상의 뉴클레오티드, 250개 이상의 뉴클레오티드, 500개 이상의 뉴클레오티드, 1000개 이상의 뉴클레오티드, 5000개 이상의 뉴클레오티드 등일 수 있다.
공여체 서열은 일반적으로 이것이 대체하는 게놈 서열과 동일하지 않다. 오히려, 상동성-기반 복구를 뒷받침하기에 충분한 상동성이 존재하는 한, 공여체 서열은 게놈 서열과 관련하여 적어도 1개 이상의 단일 염기 변화, 삽입, 결실, 역위 또는 재배열을 함유할 수 있다. 일부 구현예에서, 공여체 서열은 2개의 상동성 영역이 측면에 위치하는 비-상동성 서열을 포함하여, 표적 DNA 영역과 2개의 측면에 위치하는 서열 사이의 상동성-기반 복구는 표적 영역에 비-상동성 서열의 삽입을 초래한다. 또한 공여체 서열은, 관심 DNA 영역에 상동성이 아니고 관심 DNA 영역 내로 삽입되도록 의도되지 않은 서열을 함유하는 벡터 골격을 포함할 수 있다. 일반적으로, 공여체 서열의 상동성 영역(들)은 재조합이 요구되는 게놈 서열에 대해 적어도 50% 서열 동일성을 가진다. 특정 구현예에서, 60%, 70%, 80%, 90%, 95%, 98%, 99% 또는 99.9% 서열 동일성이 존재한다. 공여체 폴리뉴클레오티드의 길이에 따라 1% 내지 100%의 임의의 값의 서열 동일성이 존재할 수 있다.
공여체 서열은 게놈 서열과 비교할 때 특정 서열 차이, 예를 들어 제한 부위, 뉴클레오티드 다형성, 선택 가능한 마커(예: 약물 저항성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있으며, 이들은 예를 들어 절단 부위에 공여체 서열의 성공적 삽입을 평가하기 위해 사용될 수 있거나 일부 경우에 다른 목적(예: 표적으로 하는 게놈 유전자좌에서 발현을 보여줌)을 위해 사용될 수 있다. 일부 경우에, 암호화 영역에 위치하는 경우 이러한 뉴클레오티드 서열 차이는 아미노산 서열을 변화시키지 않거나 침묵 아미노산을 변화시킨다(즉, 단백질의 구조나 기능에 영향을 주지 않는 변화). 대안적으로, 이들 서열 차이는 마커 서열의 제거를 위해 나중에 활성화될 수 있는 FLP, loxP 서열 등과 같은 측면에 위치하는 재조합 서열을 포함할 수 있다.
공여체 서열은 단일 가닥 DNA, 단일 가닥 RNA, 이중 가닥 DNA 또는 이중 가닥 RNA로서 세포에 제공될 수 있다. 이는 선형 또는 원형 형태로 세포에 도입될 수 있다. 선형 형태로 도입되는 경우, 공여체 서열의 말단은 당업계에 알려진 방법으로 (예를 들어, 핵산외 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 추가되고/되거나 자기-상보적 올리고뉴클레오티드가 한쪽 또는 양쪽 말단에 결찰된다. 외인성 폴리뉴클레오티드를 분해로부터 보호하기 위한 추가 방법은 말단 아미노기(들)의 추가 및 예를 들어 포스포로티오에이트, 포스포 아미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기와 같은 변형된 뉴클레오티드간 연결의 사용을 포함하지만 이에 국한되지는 않는다. 선형 공여체 서열의 말단을 보호하는 대안으로서, 재조합에 영향을 주지 않으면서 열화될 수 있는 상동성 영역 외부에 추가 길이의 서열이 포함될 수 있다. 공여체 서열은 예를 들어 복제 기원, 프로모터 및 항생제 저항성을 암호화하는 유전자와 같은 추가 서열을 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 더욱이, 공여체 서열은 네이키드(naked) 핵산으로, 리포좀 또는 폴록사머와 같은 작용제와 복합화된 핵산으로 도입될 수 있거나, DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드를 암호화하는 핵산에 대해 전술한 바와같이 바이러스(예를 들어, 아데노바이러스, AAV)에 의해 전달될 수 있다.
상기에 기술된 방법에 따라, 관심 DNA 영역은 생체외에서 절단되고 변형, 즉 "유전적으로 변형"될 수 있다. 일부 구현예에서, 선택 가능한 마커가 관심 DNA 영역 내로 삽입된 경우, 세포 집단은 유전적으로 변형된 세포를 나머지 집단으로부터 분리시킴으로써 유전 변형을 포함하는 세포로 풍부해질 수 있다. 풍부해지기 전, "유전적으로 변형된" 세포는 세포 집단의 단지 약 1% 이상(예를 들어, 2% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 15% 이상 또는 20% 이상)을 구성할 수 있다. "유전적으로 변형된" 세포의 분리는 사용된 선택 가능한 마커에 적합한 임의의 편리한 분리 기술에 의해 달성될 수 있다. 예를 들어, 형광 마커가 삽입된 경우에 형광 활성화된 세포 분류를 통해 세포가 분리될 수 있는 반면, 세포 표면 마커가 삽입된 경우에는 친화도 분리 기술, 예를 들어 자기 분리, 친화도 크로마토그래피, 고체 매트릭스에 부착된 친화성 시약을 사용한 "패닝(panning)" 또는 기타 편리한 기술에 의해 세포가 이종 집단으로부터 분리될 수 있다. 정확한 분리를 제공하는 기술에는 다중 색상 채널, 예각 및 둔각 광산란 감지 채널, 임피던스 채널 등과 같이 다양한 수준의 정교함을 가질 수 있는 형광 활성화 세포 분류기가 포함된다. 죽은 세포와 연관된 염료(예를 들어, 요오드화 프로피듐)를 사용함으로써 세포를 죽은 세포에 대해 선택할 수 있다. 유전적으로 변형된 세포의 생존 가능성에 지나치게 해를 가하지 않는 임의의 기술이 사용될 수 있다. 변형된 DNA를 포함하는 세포가 매우 풍부한 세포 조성물은 이러한 방식으로 달성된다. "매우 풍부한"이라 함은 유전적으로 변형된 세포가 세포 조성물의 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 예를 들어 세포 조성물의 약 95% 이상 또는 98% 이상임을 의미한다. 즉, 조성물은 유전적으로 변형된 세포의 실질적으로 순수한 조성물일 수 있다.
본원에 기술된 방법에 의해 생산된 유전적으로 변형된 세포는 즉시 사용될 수 있다. 대안적으로, 세포는 액체 질소 온도에서 동결될 수 있고 장기간 보관되고 해동되고 재사용될 수 있다. 이러한 경우, 세포는 일반적으로 10% 디메틸술폭시드(DMSO), 50% 혈청, 40% 완충 배지, 또는 이러한 동결 온도에서 세포를 보존하기 위해 당업계에서 통상적으로 사용되는 일부 다른 용액에서 동결되고, 동결된 배양 세포를 해동하기 위해 당업계에 일반적으로 알려진 방식으로 해동된다.
유전적으로 변형된 세포는 다양한 배양 조건 하에 시험관내에서 배양될 수 있다. 세포는 배양을 통해 확장될 수 있다, 즉, 증식을 촉진하는 조건 하에서 성장할 수 있다. 배양 배지는 액체 또는 반고체, 예를 들어 한천, 메틸셀룰로오스 등을 함유하는 것일 수 있다. 세포 집단은 송아지 태아 혈청(약 5 내지 10%), L-글루타민, 티올, 특히 2-머캅토에탄올 및 항생제, 예를 들어 페니실린과 스트렙토마이신으로 보충된 Iscove의 변형 DMEM 또는 RPMI 1640과 같은 적절한 영양 배지에 현탁될 수 있다. 배양물에는 조절 T 세포가 반응하는 성장 인자가 함유될 수 있다. 본원에 정의된 성장 인자는 막횡단 수용체에 대한 특정 효과를 통해 배양물 또는 비손상 조직에서 세포의 생존, 성장 및/또는 분화를 촉진할 수 있는 분자이다. 성장 인자는 폴리펩티드 및 비폴리펩티드 인자를 포함한다.
이러한 방식으로 유전적으로 변형된 세포는 예를 들어 질병을 치료하기 위한 유전자 요법과 같은 목적을 위해 또는 항바이러스제, 항병원체 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해 또는 생물학적 연구를 위해 대상체에게 이식될 수 있다. 대상체는 신생아, 청소년 또는 성인일 수 있다. 포유동물 대상체가 특히 흥미롭다. 본 방법으로 치료될 수 있는 포유동물 종은 개와 고양이; 말; 소; 양 등과 영장류, 특히 인간을 포함한다. 동물 모델, 특히 작은 포유동물(예를 들어, 마우스, 랫트, 기니피그, 햄스터, 토류목(예: 토끼) 등)은 실험적 연구를 위해 사용될 수 있다.
세포는 단독으로 또는 적합한 기질 또는 매트릭스와 함께 대상체에게 제공되어, 예를 들어 세포가 이식되는 조직에서의 성장 및/또는 조직화를 뒷받침할 수 있다. 일반적으로 적어도 1x103개 세포, 예를 들어 5x103개 세포, 1x104개 세포, 5x104개 세포, 1x105개 세포, 1x106개 세포 이상이 투여된다. 세포는 비경구, 피하, 정맥내, 두개내, 척수내, 안구내 또는 척수액 경로 중 임의의 경로를 통해 대상체에게 도입될 수 있다. 세포는 주사, 카테터 등에 의해 도입될 수 있다. 또한 세포는 유전자이식 동물(예: 유전자이식 마우스)을 발생시킬 목적으로 배아(예: 배반포) 내에 도입될 수 있다.
대상체에 대한 치료 투여 횟수는 다를 수 있다. 유전적으로 변형된 세포를 대상체에게 도입하는 것은 일회성 사건일 수 있지만; 특정 상황에서 이러한 치료는 제한된 기간 동안 개선을 끌어낼 수 있으며 지속적인 반복 치료를 필요로 할 수 있다. 다른 상황에서, 효과가 관찰되기 전에 유전적으로 변형된 세포의 여러 번 투여가 필요할 수 있다. 정확한 프로토콜은 질병 또는 병태, 질병 단계 및 치료되는 개별 대상체의 매개변수에 따라 달라진다.
본 발명의 다른 측면에서, DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드가 사용되어, 예를 들어 질병을 치료하기 위한 유전자 요법과 같은 목적으로 또는 항바이러스제, 항병원체 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해 또는 생물학적 연구를 위해 생체 내 세포 DNA를 변형시킨다. 이들 생체내 구현예에서, DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드는 개체에 직접 투여된다. DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드는 펩티드, 소분자 및 핵산을 대상체에게 투여하기 위해 당업계에 잘 알려진 임의의 다수의 방법에 의해 투여될 수 있다. DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드는 다양한 제형 내에 통합될 수 있다. 보다 구체적으로, 본 발명의 DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드는 적절한 약제학적으로 허용 가능한 담체 또는 희석제와 조합하여 약제학적 조성물로 제형화될 수 있다.
약제학적 제조물은 약제학적으로 허용 가능한 비히클에 존재하는 하나 이상의 DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드를 포함하는 조성물이다. "약제학적으로 허용 가능한 비히클"은 인간과 같은 포유동물에 대한 사용을 위해 연방 또는 주 정부의 규제 기관에 의해 승인되거나 미국 약전 또는 기타 일반적으로 인정되는 약전에 등재된 비히클일 수 있다. 용어 "비히클"은 본 발명의 화합물이 포유동물에 투여하기 위해 함께 제형화되는 희석제, 아쥬반트, 부형제 또는 담체를 의미한다. 이러한 약제학적 비히클은 지질, 예를 들어 리포솜, 예를 들어 리포솜 덴드리머; 액체, 예컨대 물 및, 석유, 동물성, 식물성 또는 합성 기원의 오일을 포함한 오일, 예컨대 낙화생유, 대두유, 광유, 참기름 등, 식염수; 아카시아검, 젤라틴, 전분 페이스트, 활석, 케라틴, 콜로이드성 실리카, 요소 등일 수 있다. 또한, 보조제, 안정제, 증점제, 윤활제 및 착색제가 사용될 수 있다. 약제학적 조성물은 정제, 캡슐, 산제, 과립, 연고, 용제, 좌제, 주사제, 흡입제, 겔, 소구체 및 에어로졸과 같은 고체, 반고체, 액체 또는 기체 형태의 제조물 내에 제형화될 수 있다. 이와 같이, DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드의 투여는 경구, 협측, 직장, 비경구, 복강내, 피내, 경피, 기관내, 안구내 등 투여를 포함하는 다양한 방식으로 달성될 수 있다. 활성 작용제는 투여 후 전신용일 수 있거나 국소 투여, 벽내 투여, 또는 이식 부위에서 활성 용량을 유지하는 작용을 하는 이식 장치의 사용에 의해 국소화될 수 있다. 활성 작용제는 즉각적인 활성을 위해 제형화될 수 있거나 서방용으로 제형화될 수 있다.
일부 병태, 특히 중추신경계 병태의 경우, 혈액뇌장벽(BBB)을 통과하는 작용제를 제형화해야 할 수 있다. 혈액뇌장벽(BBB)을 통과하는 약물 전달의 한 가지 전략은 만니톨이나 류코트리엔과 같은 삼투압 수단에 의해 또는 브라디키닌과 같은 혈관활성 서브스턴스를 사용함으로써 생화학적으로 BBB 저해를 수반하는 것이다. 뇌 종양에 대해 특정 작용제를 표적으로 하기 위해 BBB 개구를 사용할 가능성 또한 선택안이다. BBB 저해제는 조성물이 혈관내 주사에 의해 투여될 때 본 발명의 치료 조성물과 함께 투여될 수 있다. BBB를 통과시키는 다른 전략은 Caveolin-1 매개 세포투과이동(trancytosis), 글루코스 및 아미노산 담체와 같은 담체-매개된 수송체, 인슐린 또는 트랜스페린에 대한 수용체-매개된 세포투과이동, 및 p-당단백질과 같은 활성 유출 수송체를 포함하는 내인성 수송체 시스템의 사용을 수반할 수 있다. 또한 활성 수송 모이어티는 혈관의 내피 벽을 가로지르는 수송을 촉진하기 위해 본 발명에서 사용하기 위한 치료 화합물에 접합될 수 있다.
대안적으로, BBB 뒤에 치료제의 약물 전달은 국소 전달에 의해, 예를 들어 척수강내 전달에 의해 이루어질 수 있다.
일반적으로, 유효량의 DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드가 제공된다. 생체외 방법과 관련하여 상기에서 검토된 바와 같이, 생체내 DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드의 유효량 또는 유효 용량은 음성 대조군, 예컨대 빈 벡터 또는 관련 없는 폴리펩티드와 접촉된 세포와 비교하여 2개 상동성 서열 사이에서 관찰된 재조합 양을 2배 이상의 증가하도록 유도하는 양이다. 재조합 양은 예를 들어 상기에 기재되고 당업계에 알려진 임의의 편리한 방법으로 측정할 수 있다. 투여될 DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드의 유효량 또는 유효 용량의 계산은 당업계의 기술 범위 내에 있고 당업자에게는 일상적이다. 투여될 최종 양은 투여 경로 및 치료될 장애 또는 병태의 특성에 따라 달라진다.
특정한 환자에게 제공되는 유효량은 다양한 요인에 따라 달라지며, 그 중 일부는 환자마다 다르다. 유능한 임상의는 필요에 따라 질병 병태를 중단시키거나 진행을 역전시키기 위해 환자에게 투여할 치료제의 유효량을 결정할 수 있다. LD50 동물 데이터 및 작용제에 대해 이용 가능한 다른 정보를 활용하여, 임상의는 투여 경로에 따라 개인에 대해 최대 안전 용량을 결정할 수 있다. 예를 들어, 치료 조성물이 투여되는 체액강이 큰 경우, 정맥내 투여 용량은 척수강내 투여 용량보다 많을 수 있다. 유사하게, 신체에서 빠르게 제거되는 조성물은 치료 농도를 유지하기 위해 더 높은 용량으로 또는 반복되는 용량으로 투여될 수 있다. 유능한 임상의는 통상의 기술을 활용하여 일상적인 임상 시험 과정에서 특정 치료제의 용량을 최적화할 수 있다.
의약에 혼입시키기 위해, DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드를 적합한 상업적 공급원으로부터 얻을 수 있다. 일반적인 제안으로서, 용량당 비경구로 투여되는 DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드의 총 약제학적 유효량은 용량 반응 곡선으로 측정될 수 있는 범위 내에 있다.
DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드에 기반한 요법, 즉 치료적 투여를 위해 사용될 DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드의 제조물은 무균이어야 한다. 멸균 여과막(예: 0.2μm 막)을 통한 여과를 통해 무균이 쉽게 달성된다. 치료 조성물은 일반적으로 멸균 접근 포트를 갖는 용기, 예를 들어 정맥 주사액 백 또는 피하 주사 바늘이 관통할 수 있는 마개가 있는 바이알 내에 놓인다. DNA-표적 RNA 및/또는 부위-특이적 변형 폴리펩티드 및/또는 공여체 폴리뉴클레오티드에 기반한 요법은 단위 또는 다중-용량 용기, 예를 들어 밀봉 앰플 또는 바이알에 수용액으로 또는 재구성을 위한 동결건조 제형으로 보관될 수 있다. 동결건조 제형의 예로서, 10mL 바이알에 멸균-여과된 1%(w/v) 화합물 수용액 5ml를 채우고, 생성된 혼합물은 동결건조된다. 주입 용액은 정균 주사용수를 사용하여 동결건조된 화합물을 재구성함으로써 제조된다.
약제학적 조성물은 동물 또는 인간 투여를 위한 약제학적 조성물을 제형화하기 위해 흔히 사용되는 비히클로 정의되는 약제학적으로 허용 가능한 무독성 희석제 담체를 원하는 제형에 따라 포함할 수 있다. 희석제는 조합의 생물학적 활성에 영향을 주지 않도록 선택된다. 이러한 희석제의 예는 증류수, 완충수, 생리식염수, PBS, 링거 용액, 덱스트로스 용액 및 행크 용액이다. 또한, 약제학적 조성물 또는 제형은 다른 담체, 아쥬반트 또는 비독성, 비치료적, 비면역원성 안정제, 부형제 등을 포함할 수 있다. 또한 조성물은 pH 조절제 및 완충제, 독성 조절제, 습윤제 및 청정제와 같은 생리학적 조건에 근접시키는 추가적인 서브스턴스를 포함할 수 있다.
또한 조성물은 예를 들어 항산화제와 같은 다양한 안정제 중 임의의 것을 포함할 수 있다. 약제학적 조성물이 폴리펩티드를 포함할 때, 폴리펩티드는 폴리펩티드의 생체내 안정성을 증강시키거나 그렇지 않으면 약리학적 특성을 증강시키는(예를 들어, 폴리펩티드의 반감기를 증가시키고 그의 독성을 낮추고 용해도 또는 흡수를 증강시키는) 잘 알려진 다양한 화합물과 복합체를 형성할 수 있다. 이러한 변형제 또는 복합화 작용제의 예는 황산염, 글루콘산염, 시트르산염 및 인산염을 포함한다. 또한 조성물의 핵산 또는 폴리펩티드는 생체내 속성을 증강시키는 분자와 복합체를 형성할 수 있다. 이러한 분자는 예를 들어 탄수화물, 폴리아민, 아미노산, 기타 펩티드, 이온(예: 나트륨, 칼륨, 칼슘, 마그네슘, 망간) 및 지질을 포함한다.
약제학적 조성물은 예방적 및/또는 요법적 치료를 위해 투여될 수 있다. 예를 들어 LD50(집단의 50%에서 치사가 이루어지는 용량) 및 ED50(집단의 50%에 치료적으로 유효한 용량) 결정을 포함하여 활성 성분의 독성 및 요법적 효능은 세포 배양물 및/또는 실험 동물에서 표준 약학 절차에 따라 결정될 수 있다. 독성 및 요법 효과 사이의 용량 비는 치료 계수이고, LD50/ED50 비로 표현될 수 있다. 큰 치료 계수를 나타내는 요법이 바람직하다.
세포 배양물 및/또는 동물 연구에서 얻은 데이터는 인간을 위한 투여량 범위를 제형화하기 위해 사용될 수 있다. 활성 성분의 투여량은 일반적으로 낮은 독성과 함께 ED50을 포함하는 순환 농도 범위 내에 있다. 투여량은 이용되는 투여 형태 및 활용되는 투여 경로에 따라 이 범위 내에서 다를 수 있다.
약제학적 조성물을 제형화하기 위해 사용되는 구성성분은 바람직하게는 고순도이고 잠재적으로 유해한 오염물질을 실질적으로 갖지 않는다(예를 들어, 적어도 국민 식품(NF) 등급, 일반적으로 최소한 분석 등급, 더 일반적으로는 최소한 약제 등급). 더욱이, 생체내 사용으로 의도된 조성물은 일반적으로 무균이다. 주어진 화합물이 사용 전에 합성되어야 하는 경우, 생성된 생성물은 일반적으로 임의의 잠재적 독성 작용제, 특히 합성 또는 정제 프로세스 동안에 존재할 수 있는 임의의 내독소를 실질적으로 갖지 않는다. 또한 비경구 투여를 위한 조성물은 무균이고 실질적으로 등장성이며 GMP 조건 하에서 제조된다.
전달 시스템
본원에 기술된 CRISPR 시스템 또는 이의 구성요소, 이의 핵산 분자, 및/또는 이의 구성요소를 암호화하거나 제공하는 핵산 분자, CRISPR-연관 단백질, 또는 RNA 가이드는 벡터, 예를 들어 플라스미드 및 전달 벡터와 같은 다양한 전달 시스템에 의해 전달될 수 있다. 예시적인 구현예가 아래에 기술된다. CRISPR 시스템(예를 들어, 본원에 기술된 핵염기 편집기를 포함하는 Cas9를 포함)은 바이러스 벡터에 함유된 핵산 상에서 암호화될 수 있다. 바이러스 벡터는 렌티바이러스, 아데노바이러스, 레트로바이러스 및 아데노-연관 바이러스(AAV)를 포함할 수 있다. 바이러스 벡터는 적용분야에 기반하여 선택될 수 있다. 예를 들어, AAV는 약한 면역원성으로 인해 생체내 유전자 전달을 위해 흔히 사용된다. 아데노바이러스는 이들이 유도하는 강력한 면역원성 반응 때문에 흔히 백신으로 사용된다. 바이러스 벡터의 패키징 용량은 벡터 내로 패키징될 수 있는 염기 편집기의 크기를 제한할 수 있다. 예를 들어, AAV의 패키징 용량은 2개의 145 염기 역위 말단 반복(ITR)을 포함하여 ~4.5kb이다.
AAV는 파보바이러스 계열에 속하는 작은 단일 가닥의 DNA 의존성 바이러스이다. 4.7kb 야생형(wt) AAV 게놈은 4개의 복제 단백질과 3개의 캡시드 단백질을 각각 암호화하는 2개의 유전자로 구성되고, 각 측면에는 145bp 역위 말단 반복(ITR)이 측면에 위치해 있다. 비리온은 차등 스플라이싱(Vpl) 및 선택적 번역 시작 부위(각각 Vp2 및 Vp3)를 제외하고 동일한 개방형 판독 프레임에서 1:1:10 비율로 생성된 3개의 캡시드 단백질인 Vpl, Vp2 및 Vp3로 구성된다. Vp3은 비리온에서 가장 풍부한 하위단위체이고 바이러스 향성을 정의하며 세포 표면에서 수용체 인식에 참여한다. 바이러스 감염성에서 기능하는 포스포리파제 도메인은 Vpl의 독특한 N 말단에서 식별되었다.
wt AAV와 유사하게, 재조합 AAV(rAAV)는 시스-작용 145-bp ITR을 활용하여 벡터 이식유전자 카세트의 측면에 위치하고 외래 DNA 패키징을 위해 최대 4.5kb를 제공한다. 감염에 이어, rAAV는 본 발명의 융합 단백질을 발현할 수 있고, 숙주 게놈 내로 통합되지 않으면서 머리에서 꼬리(head-to tail) 동일연쇄서열에 에피좀으로 존재함으로써 지속될 수 있다. 시험관내 및 생체내에서 이 시스템을 사용하는 rAAV 성공의 많은 예가 있지만, 유전자의 암호화 서열 길이가 크기가 wt AAV 게놈과 동일하거나 이보다 클 때 제한된 패키징 용량은 AAV-매개 유전자 전달의 사용을 제한하였다.
AAV 벡터의 작은 패키징 용량으로 인해 이 크기를 초과하는 다수의 유전자 전달 및/또는 큰 생리학적 조절 요소의 사용이 어려워진다. 이러한 어려움은 예를 들어 전달될 단백질(들)을 2개 이상의 단편으로 나눔으로써 해결될 수 있고, 상기 N-말단 단편은 분할된 인테인-N에 융합되고 C-말단 단편은 분할된 인테인-C에 융합된다. 그 다음, 이들 단편은 2개 이상의 AAV 벡터 내로 패키징된다. 본원에서 사용될 때 "인테인"은 측면에 위치한 N-말단 및 C-말단 엑스테인(예를 들어, 연결될 단편)을 결찰시키는 자가-스플라이싱 단백질 인트론(예를 들어, 펩티드)을 의미한다. 이종 단백질 단편을 연결하기 위한 특정 인테인의 사용이 예를 들어 Wood 등, J. Biol. Chem. 289(21); 14512-9 (2014)에 기술되어 있다. 예를 들어, 분리된 단백질 단편에 융합될 때 인테인 IntN과 IntC는 서로를 인식하고, 스스로 스플라이싱되고, 이들이 융합된 단백질 단편의 측면에 위치한 N- 및 C-말단 엑스테인을 동시에 결찰시켜, 2개 단백질 단편으로부터 전장 단백질을 재구성한다. 다른 적합한 인테인은 당업자에게 명백할 것이다.
일부 구현예에서, 본 발명의 CRISPR 시스템은 다양한 길이를 가질 수 있다. 일부 구현예에서, 단백질 단편은 2개 아미노산 내지 약 1000개 아미노산 범위의 길이를 가진다. 일부 구현예에서, 단백질 단편은 약 5개 아미노산 내지 약 500개 아미노산 범위의 길이를 가진다. 일부 구현예에서, 단백질 단편은 약 20개 아미노산 내지 약 200개 아미노산 범위의 길이를 가진다. 일부 구현예에서, 단백질 단편은 약 10개 아미노산 내지 약 100개 아미노산 범위의 길이를 가진다. 다른 길이의 적합한 단백질 단편이 당업자에게 명백할 것이다.
일부 구현예에서, 뉴클레아제(예를 들어, Cas9)의 일부 또는 단편은 인테인에 융합된다. 뉴클레아제는 인테인의 N-말단 또는 C-말단에 융합될 수 있다. 일부 구현예에서, 융합 단백질의 일부 또는 단편은 인테인에 융합되고 AAV 캡시드 단백질에 융합된다. 인테인, 뉴클레아제 및 캡시드 단백질은 임의의 배열(예를 들어, 뉴클레아제-인테인-캡시드, 인테인-뉴클레아제-캡시드, 캡시드-인테인-뉴클레아제 등)로 함께 융합될 수 있다. 일부 구현예에서, 인테인의 N-말단은 융합 단백질의 C-말단에 융합되고, 인테인의 C-말단은 AAV 캡시드 단백질의 N-말단에 융합된다.
일 구현예에서, 이중 AAV 벡터는 큰 이식유전자 발현 카세트를 2개의 별도 반쪽(5' 및 3' 말단, 또는 머리와 꼬리)으로 분할함으로써 발생되고, 상기 카세트의 각 반쪽은 단일 AAV 벡터(< 5kb)에 패키징된다. 그 다음, 전장 이식유전자 발현 카세트의 재조립은 이중 AAV 벡터 둘 모두에 의한 동일 세포의 동시 감염 이후 다음에 의해 달성된다: (1) 5'와 3' 게놈 사이의 상동성 재조합(HR)(이중 AAV 중첩 벡터); (2) 5' 및 3' 게놈의 ITR-매개의 꼬리에서 머리로 연쇄동일서열화(이중 AAV 트랜스-스플라이싱 벡터); 또는 (3) 이들 두 메커니즘의 조합(이중 AAV 하이브리드 벡터). 생체내 이중 AAV 벡터의 사용으로 인해 전장 단백질이 발현된다. 이중 AAV 벡터 플랫폼의 사용은 >4.7kb 크기의 이식유전자에 대한 효율적이고 실행 가능한 유전자 전달 전략을 나타낸다.
본원에 기술된 Cas9를 포함하는 CRISPR 시스템을 설계하기 위해 개시된 전략은 바이러스 벡터 내로 패키징될 수 있는 CRISPR 시스템의 발생에 유용할 수 있다. 염기 편집기 전달을 위해 RNA 또는 DNA 바이러스 기반 시스템을 사용하는 것은 배양물 또는 숙주에서 바이러스를 특정 세포에 대해 표적으로 하고 바이러스 페이로드를 핵 또는 숙주 세포 게놈에 전달하기 위해 고도로 진화된 프로세스를 활용한다. 바이러스 벡터는 배양물의 세포, 환자(생체 내)에게 직접 투여할 수 있거나 시험관내 세포를 치료하기 위해 사용될 수 있고, 변형된 세포는 선택적으로 환자(생체외)에게 투여될 수 있다. 종래의 바이러스 기반 시스템은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노 연관 및 단순 포진 바이러스 벡터를 포함할 수 있다. 레트로바이러스, 렌티바이러스 및 아데노 연관 바이러스 유전자 전달 방법을 사용하여 숙주 게놈 내 통합이 가능하여, 종종 삽입된 이식유전자의 장기 발현을 초래한다. 또한, 많은 상이한 세포 유형과 표적 조직에서 높은 형질도입 효율이 관찰되었다.
레트로바이러스의 향성은 외래 외피 단백질을 혼입함으로써 변경될 수 있으며, 표적 세포의 잠재적인 표적 집단을 확장할 수 있다. 렌티바이러스 벡터는, 비분할 세포를 형질도입하거나 감염시킬 수 있고 일반적으로 높은 바이러스 역가를 생성할 수 있는 레트로바이러스 벡터이다. 따라서 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 달라진다. 레트로바이러스 벡터는 최대 6 내지 10kb의 외래 서열에 대한 패키징 용량을 갖는 시스-작용 긴 말단 반복으로 구성된다. 최소 시스-작용 LTR은 벡터의 복제 및 패키징에 충분하고, 이는 이후 영구적인 이식유전자 발현을 제공하기 위해 치료 유전자를 표적 세포 내로 통합하기 위해 사용된다. 널리 사용되는 레트로바이러스 벡터는 쥣과 백혈병 바이러스(MuLV), 긴팔원숭이 백혈병 바이러스(GaLV), 유인원 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV) 및 이들의 조합에 기반한 것을 포함한다(예를 들어 Buchscher 등, J. Virol. 66:2731-2739 (1992); Johann 등, J. Virol. 66:1635-1640 (1992); Sommnerfelt 등, Virol. 176:58-59 (1990); Wilson 등, J. Virol. 63:2374-2378 (1989); Miller 등, J. Virol. 65:2220-2224 (1991); PCT/US94/05700 참조).
레트로바이러스 벡터, 특히 렌티바이러스 벡터는 표적 세포 내로 효율적인 통합을 위해 주어진 길이보다 작은 폴리뉴클레오티드 서열을 필요로 할 수 있다. 예를 들어, 9kb보다 큰 길이의 레트로바이러스 벡터는 더 작은 길이의 레트로바이러스 벡터에 비해 낮은 바이러스 역가를 초래할 수 있다. 일부 측면에서, 본 개시내용의 CRISPR 시스템(예를 들어, 본원에 개시된 Cas9 포함)은 레트로바이러스 벡터를 통한 표적 세포 내로 효율적인 패키징 및 전달이 가능하도록 하는 충분한 크기를 가진다. 일부 경우에 Cas9는 가이드 핵산 및/또는 표적화 가능한 뉴클레아제 시스템의 다른 구성요소와 함께 발현될 때에도 효율적인 패키징 및 전달을 허용하도록 하는 크기를 가진다.
일시적 발현이 바람직한 적용분야에서 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있고, 세포 분열을 필요로 하지 않는다. 이러한 벡터를 사용하면 높은 역가와 발현 수준이 얻어졌다. 이 벡터는 비교적 단순한 시스템에서 다량으로 생산될 수 있다. 또한 아데노 연관 바이러스("AAV") 벡터가 사용되어, 예를 들어 핵산 및 펩티드의 시험관내 생산을 위해 그리고 생체내 및 생체외 유전자 치료 절차를 위해 표적 핵산으로 세포를 형질도입할 수 있다(예를 들어, West 등, Virology 160:38-47 (1987); 미국 특허 제4,797,368호; WO 93/24641호; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994) 참조. 재조합 AAV 벡터의 작제는 미국 특허 제5,173,414호; Tratschin 등, Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, 등, Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); 및 Samulski 등, J. Virol. 63:03822-3828 (1989)을 포함하여 다수의 출판물에 기술되어 있다.
따라서 본원에 기술된 CRISPR 시스템(예를 들어, 본원에 개시된 Cas9 포함)은 바이러스 벡터와 함께 전달될 수 있다. 염기 편집기 시스템의 하나 이상의 구성 요소는 하나 이상의 바이러스 벡터 상에서 암호화될 수 있다. 예를 들어, 염기 편집기와 가이드 핵산은 단일 바이러스 벡터 상에서 암호화될 수 있다. 다른 경우에 염기 편집기와 가이드 핵산이 상이한 바이러스 벡터 상에서 암호화된다. 어느 한 경우에, 염기 편집기 및 가이드 핵산은 각각 프로모터 및 터미네이터에 작동 가능하게 연결될 수 있다.
바이러스 벡터 상에서 암호화되는 구성요소의 조합은 선택된 바이러스 벡터의 운반대상(cargo) 크기 제약에 의해 결정될 수 있다.
염기 편집기의 비바이러스 전달
CRISPR에 대한 비바이러스 전달 접근법도 사용할 수 있다. 비바이러스 핵산 벡터의 하나의 중요한 범주는 유기 또는 무기일 수 있는 나노입자이다. 나노입자는 당업계에 잘 알려져 있다. 임의의 적합한 나노입자 설계를 사용하여 게놈 편집 시스템 구성요소 또는 이러한 구성요소를 암호화하는 핵산을 전달할 수 있다. 예를 들어, 유기(예를 들어, 지질 및/또는 중합체) 나노입자는 본 개시내용의 특정 구현예에서 전달 비히클로서 사용하기에 적합할 수 있다. 나노입자 제형 및/또는 유전자 전달에 사용하기 위한 예시적인 지질은 표 5(아래)에 나와 있다.
표 5
표 6에는 유전자 전달 및/또는 나노입자 제형에 사용하기 위한 예시적인 중합체가 열거되어 있다.
표 6
표 7은 본원에 기술된 Cas9를 암호화하는 폴리뉴클레오티드에 대한 전달 방법을 요약한다.
표 7
또 다른 측면에서, 게놈 편집 시스템 구성요소 또는 이러한 구성요소를 암호화하는 핵산, 예를 들어 생물학적 활성을 갖는 폴리펩티드(예를 들어 핵염기 편집기)에 선택적으로 융합되는 Cas9 또는 이의 변이체와 같은 핵산 결합 단백질, 및 관심 게놈 핵산 서열을 표적으로 하는 gRNA의 전달은 리보핵단백질(RNP)을 세포에 전달함으로써 달성될 수 있다. RNP는 표적으로 하는 gRNA와 복합체를 형성하는 핵산 결합 단백질, 예를 들어 Cas9를 포함한다. RNP는 공지 방법, 예컨대 전기영동천공, 핵감염 또는 예를 들어 Zuris, J.A. 등, 2015, Nat. Biotechnology, 33(1):73-8에 보고된 바와 같은 양이온성 지질-매개 방법을 사용하여 세포에 전달될 수 있다. RNP는 CRISPR 염기 편집 시스템에서 사용하기에, 특히 일차 세포와 같이 형질감염이 어려운 세포에 유리한다. 또한, RNP는 특히 CRISPR 플라스미드에 사용될 수 있는 진핵생물 프로모터, 예를들어 CMV 또는 EF1A가 잘 발현되지 않을 때 세포 내 단백질 발현에서 발생할 수 있는 어려움을 완화시킬 수도 있다. 유리하게, RNP의 사용은 외래 DNA를 세포 내로 전달할 것을 요구하지 않는다. 더욱이, 핵산 결합 단백질과 gRNA 복합체를 포함하는 RNP는 시간이 지남에 따라 열화되기 때문에 RNP 사용에는 표적외 효과를 제한할 가능성이 있다. 플라스미드 기반 기술과 유사한 방식으로 RNP를 사용하여 결합 단백질(예: Cas9 변이체)을 전달하고 상동성 기반 복구(HDR)를 지시할 수 있다.
CRISPR 시스템(예를 들어, 본원에 기술된 Cas9 포함)을 구동시키기 위해 사용되는 프로모터는 AAV ITR을 포함할 수 있다. 이는 벡터에서 공간을 차지할 수 있는 추가 프로모터 요소를 필요로 하지 않기 때문에 유리할 수 있다. 추가적인 여유 공간은 가이드 핵산 또는 선택 가능한 마커와 같은 추가적인 요소의 발현을 구동하기 위해 사용될 수 있다. ITR 활성은 상대적으로 약하므로, 이는 선택된 뉴클레아제의 과발현으로 인한 잠재적 독성을 낮추기 위해 사용될 수 있다.
임의의 적합한 프로모터를 사용하여 Cas9 및 적절한 경우 가이드 핵산의 발현을 구동시킬 수 있다. 유비쿼터스 발현의 경우, 사용될 수 있는 프로모터는 CMV, CAG, CBh, PGK, SV40, 페리틴 중쇄 또는 경쇄 등을 포함한다. 뇌 또는 기타 CNS 세포 발현의 경우, 적합한 프로모터는 다음을 포함할 수 있다: 모든 뉴런의 경우 시냅신1, 흥분성 뉴런의 경우 CaMKII알파, GABA성 뉴런의 경우 GAD67 또는 GAD65 또는 VGAT 등을 포함할 수 있다. 간 세포 발현의 경우, 적합한 프로모터는 알부민 프로모터를 포함한다. 폐 세포 발현의 경우, 적합한 프로모터는 SP-B를 포함할 수 있다. 내피 세포의 경우, 적합한 프로모터는 ICAM을 포함할 수 있다. 조혈 세포의 경우, 적합한 프로모터는 IFN베타 또는 CD45를 포함할 수 있다. 조골세포의 경우, 적합한 프로모터는 OG-2를 포함할 수 있다.
일부 경우에, 본 개시내용의 Cas9는 별개의 프로모터가 동일 핵산 분자 내에서 염기 편집기 및 상용가능한 가이드 핵산의 발현을 구동할 수 있도록 하는 충분히 작은 크기를 가진다. 예를 들어, 벡터 또는 바이러스 벡터는 염기 편집기를 암호화하는 핵산에 작동 가능하게 연결된 제1 프로모터 및 가이드 핵산에 작동 가능하게 연결된 제2 프로모터를 포함할 수 있다.
가이드 핵산의 발현을 구동시키기 위해 사용되는 프로모터는 다음을 포함할 수 있다: U6와 같은 Pol III 프로모터 또는 Pol II 프로모터의 HI Use 및 gRNA 아데노 연관 바이러스(AAV)를 발현시키기 위한 인트론 카세트.
1개 이상의 가이드 핵산이 있거나 없는 본원에 기술된 Cas9는 아데노 연관 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 기타 플라스미드 또는 바이러스 벡터 유형을 사용하여, 특히 예를 들어 미국 특허 제8,454,972호(아데노바이러스에 대한 제형, 용량), 미국 특허 제8,404,658호(AAV에 대한 제형, 용량) 및 미국 특허 제5,846,946호(DNA 플라스미드에 대한 제형, 용량) 및 렌티바이러스, AAV 및 아데노바이러스를 수반하는 임상 시험 및 상기 임상 시험에 관한 출판물의 제형 및 용량을 사용하여 전달될 수 있다. 예를 들어, AAV의 경우 투여 경로, 제형 및 용량은 미국 특허 제8,454,972호 및 AAV를 수반하는 임상 시험에서와 같을 수 있다. 아데노바이러스의 경우, 투여 경로, 제형 및 용량은 미국 특허 제8,404,658호 및 아데노바이러스를 수반하는 임상 시험에서와 같을 수 있다. 플라스미드 전달의 경우, 투여 경로, 제형 및 용량은 미국 특허 제5,846,946호 및 플라스미드를 수반하는 임상 시험에서와 같을 수 있다. 용량은 평균 70kg 개체(성인 남성 인간)을 기준으로 하거나 이에 따라 추정될 수 있고, 상이한 체중 및 종의 환자, 대상체, 포유동물에 대해 조정될 수 있다. 투여 빈도는 연령, 성별, 전반적인 건강 상태, 환자 또는 대상체의 기타 병태, 및 해결되는 구체적인 병태 또는 증상을 포함한 일반적인 요인에 따라 의료 또는 가축병 담당자(예: 의사, 수의사)의 범위 내에 있다. 바이러스 벡터는 관심 조직에 주사될 수 있다. 세포-유형 특이적 염기 편집의 경우, 염기 편집기 및 선택적 가이드 핵산의 발현은 세포-유형 특이적 프로모터에 의해 구동될 수 있다.
생체내 전달의 경우, AAV는 다른 바이러스 벡터보다 유리할 수 있다. 일부 경우에 AAV가 낮은 독성을 허용하는데, 이는 면역 반응을 활성화시킬 수 있는 세포 입자의 초원심분리를 필요로 하지 않는 정제 방법 때문일 수 있다. 일부 경우에, AAV가 숙주 게놈 내로 통합되지 않기 때문에 삽입 돌연변이를 유발할 낮은 가능성을 가질 수 있다.
AAV는 4.5 또는 4.75Kb의 패키징 제한을 가진다. 4.5 또는 4.75Kb보다 큰 작제물은 유의하게 낮아진 바이러스 생성을 이끌 수 있다. 예를 들어 SpCas9는 상당히 크고 유전자 자체가 4.1Kb를 초과하므로 AAV 내로 채워지기가 어렵다. 따라서, 본 개시내용의 구현예는 종래의 Cas9보다 더 짧은 길이를 가지는 개시된 Cas9를 활용하는 것을 포함한다.
AAV는 AAV1, AAV2, AAV5 또는 이들의 임의의 조합일 수 있다. 표적으로 될 세포와 관련하여 AAV 유형을 선택할 수 있다: 예를 들어, 뇌 또는 신경 세포를 표적으로 하기 위해 AAV 혈청형 1, 2, 5 또는 혼성 캡시드 AAV1, AAV2, AAV5 또는 이들의 임의의 조합을 선택할 수 있고; 심장 조직을 표적으로 하기 위해 AAV4를 선택할 수 있다. AAV8은 간으로의 전달에 유용한다. 이들 세포에 관한 특정 AAV 혈청형의 도표는 Grimm, D. 등, J. Virol. 82: 5887-5911 (2008))에서 찾을 수 있다.
렌티바이러스는 유사분열 및 유사분열 후 세포 모두에서 유전자를 감염시키고 발현시키는 능력을 가지는 복합 레트로바이러스이다. 가장 흔히 알려진 렌티바이러스는 인간 면역결핍 바이러스(HIV)로, 이는 다른 바이러스의 외피 당단백질을 사용하여 광범위한 세포 유형을 표적으로 한다.
렌티바이러스는 다음과 같이 제조될 수 있다. pCasES10(렌티바이러스 전달 플라스미드 골격을 함유함)을 클로닝한 후, 낮은 계대(p=5)의 HEK293FT를 T-75 플라스크에서 10% 소 태아 혈청이 있고 항생제가 없는 DMEM에 형질감염 전날 50% 컨플루언스까지 씨딩했다. 20시간 후, 배지를 OptiMEM(무혈청) 배지로 교체하고 4시간 후에 형질감염을 수행했다. 세포는 10μg의 렌티바이러스 전달 플라스미드(pCasES10) 및 다음 패키징 플라스미드로 형질감염된다: 5μg의 pMD2.G(VSV-g 슈도타입) 및 7.5μg의 psPAX2(gag/pol/rev/tat). 형질감염은 양이온성 지질 전달제(50μl의 리포펙타민 2000 및 100ul 플러스 시약)가 있는 4mL OptiMEM에서 수행할 수 있다. 6시간 후, 배지를 10% 소 태아 혈청이 있는 무항생제 DMEM으로 교체한다. 이들 방법은 세포 배양 동안에 혈청을 사용하지만, 무혈청 방법이 바람직하다.
렌티바이러스는 다음과 같이 정제될 수 있다. 48시간 후에 바이러스 상등액이 수확된다. 먼저 상등액에서 잔해물을 제거하고 0.45μm 저단백질 결합(PVDF) 필터를 통해 여과한다. 그 다음, 이들은 초원심분리기에서 24,000rpm으로 2시간 동안 회전된다. 바이러스 펠릿을 4℃에서 하룻밤 동안 50μl의 DMEM에 재현탁한다. 그 다음, 이를 분취하고 즉시 -80℃에서 냉동한다.
또 다른 구현예에서, 말 감염성 빈혈 바이러스(EIAV)에 기반한 최소 비영장류 렌티바이러스 벡터도 고려된다. 또 다른 구현예에서, 망막하 주사를 통해 전달될 것으로 고려되는, 혈관신생억제 단백질 엔도스타틴 및 안지오스타틴을 발현하는 말 감염성 빈혈 바이러스 기반 렌티바이러스 유전자 요법 벡터인 RetinoStat®. 또 다른 구현예에서, 자가-불활성화 렌티바이러스 벡터의 사용이 고려된다.
시스템의 임의의 RNA, 예를 들어 가이드 RNA 또는 Cas9-암호화 mRNA는 RNA 형태로 전달될 수 있다. Cas9 암호화 mRNA는 시험관내 전사를 사용하여 발생될 수 있다. 예를 들어, Cas9 mRNA는 다음 요소를 함유하는 PCR 카세트를 사용하여 합성될 수 있다: T7 프로모터, 선택적 코작(kozak) 서열(GCCACC), 뉴클레아제 서열 및 3' UTR, 예컨대 베타 글로빈-폴리A 꼬리의 3' UTR. 카세트는 T7 폴리머라제에 의한 전사를 위해 사용될 수 있다. 가이드 폴리뉴클레오티드(예를 들어, gRNA)는 또한 T7 프로모터, 이어서 서열 "GG" 및 가이드 폴리뉴클레오티드 서열을 함유하는 카세트로부터 시험관내 전사를 사용하여 전사될 수 있다.
발현을 증강시키고 독성 가능성을 낮추기 위해 Cas9 서열 및/또는 가이드 핵산은 예를 들어 슈도-U 또는 5-메틸-C를 사용하여 하나 이상의 변형된 뉴클레오시드를 포함하도록 변형될 수 있다.
일부 구현예의 개시내용은 세포 또는 유기체를 변형시키는 방법을 이해한다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유동물 세포일 수 있다. 포유동물 세포는 인간이 아닌 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 본 개시내용의 염기 편집기, 조성물 및 방법에 의해 세포에 도입되는 변형은 항체, 전분, 알코올 또는 기타 원하는 세포 배출물과 같은 생물학적 생성물의 향상된 생산을 위해 세포 및 세포 자손이 변경되도록 하는 것일 수 있다. 본 개시내용의 방법에 의해 세포에 도입되는 변형은 생산된 생물학적 생성물을 변화시키는 변경을 세포 및 세포 자손이 포함하도록 하는 것일 수 있다.
시스템은 하나 이상의 상이한 벡터를 포함할 수 있다. 일 측면에서, Cas9는 원하는 세포 유형, 우선적으로는 진핵 세포, 바람직하게는 포유동물 세포 또는 인간 세포에서 발현되도록 코돈 최적화된다.
일반적으로, 코돈 최적화는 천연 서열의 적어도 1개의 코돈(예를 들어 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을, 천연 아미노산 서열을 유지하면서 해당 숙주 세포의 유전자에서 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 숙주 세포에서의 증강된 발현을 위해 핵산 서열을 변형시키는 프로세스를 의미한다. 다양한 종은 특정 아미노산의 일부 코돈에 대해 특정 편향을 나타낸다. 코돈 편향(유기체 간의 코돈 용도의 차이)은 특히 번역되는 코돈의 특성 및 특정 전달 RNA(tRNA) 분자의 가용성에 따라 달라지는 것으로 생각되는 메신저 RNA(mRNA)의 번역 효율성과 종종 관련된다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩티드 합성에서 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기반하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤형으로 될 수 있다. 코돈 용도 표는 예를 들어 www.kazusa.orjp/codon/(2002년 7월 9일 방문)에서 입수 가능한 "코돈 용도 데이터베이스(Codon Usage Database)"에서 쉽게 입수 가능할 수 있으며, 이들 표는 다양한 방식으로 각색될 수 있다. Nakamura, Y., 등 "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000) 참조. 특정 숙주 세포에서 발현을 위해 특정 서열을 코돈 최적화하기 위한 컴퓨터 알고리즘, 예를 들어 Gene Forge(Aptagen; Jacobus, PA)도 입수 가능한다. 일부 구현예에서, 조작된 뉴클레아제를 암호화하는 서열에서의 1개 이상의 코돈(예를 들어 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상 또는 모든 코돈)은 특정 아미노산에 대해 가장 빈번하게 사용되는 코돈에 해당한다.
패키징 세포는 일반적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하기 위해 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 및 레트로바이러스를 패키징하는 psi.2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용되는 바이러스 벡터는 일반적으로 핵산 벡터를 바이러스 입자 내로 패키징하는 세포주를 생성시킴으로써 발생된다. 벡터는 일반적으로 패키징 및 후속적인 숙주 내로의 통합에 필요한 최소 바이러스 서열을 함유하며, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)를 위한 발현 카세트로 대체된다. 누락된 바이러스 기능은 일반적으로 패키징 세포주에 의해 트랜스에서 공급된다. 예를 들어, 유전자 요법에서 사용되는 AAV 벡터는 일반적으로 패키징 및 숙주 게놈 내로의 통합에 필요한 AAV 게놈으로부터의 ITR 서열만을 보유한다. 바이러스 DNA는 다른 AAV 유전자를 암호화하는 헬퍼 플라스미드, 즉 rep 및 cap을 함유하지만 ITR 서열은 결여된 세포주에 패키징될 수 있다. 세포주는 헬퍼로서 아데노바이러스에 의해 감염될 수도 있다. 헬퍼 바이러스는 AAV 벡터의 복제와 헬퍼 플라스미드로부터 AAV 유전자 발현을 촉진할 수 있다. 일부 경우에서 헬퍼 플라스미드는 ITR 서열 결여로 인해 상당한 양으로 패키징되지 않는다. 아데노바이러스에 의한 오염은 예를 들어 열처리에 의해 낮아질 수 있으며, 아데노바이러스는 AAV보다 열처리에 더 민감하다.
약제학적 조성물
본 개시내용의 다른 측면은 CRISPR 시스템(예를 들어, 본원에 개시된 Cas9 포함)을 포함하는 약제학적 조성물에 관한 것이다. 본원에서 사용될 때 용어 "약제학적 조성물"은 약제학적 용도로 제형화된 조성물을 의미한다. 일부 구현예에서, 약제학적 조성물은 약제학적으로 허용 가능한 담체를 추가로 포함한다. 일부 구현예에서, 약제학적 조성물은 추가적인 작용제(예를 들어, 특이적 전달용, 반감기 증가 또는 기타 요법적 화합물)를 포함한다.
본원에서 사용될 때 용어 "약제학적으로 허용 가능한 담체"는 약제학적으로 허용가능한 물질, 조성물 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 제조 보조제(예: 윤활제, 활석 마그네슘, 칼슘 또는 아연 스테아레이트 또는 스테아르산), 또는 신체의 한 부위(예: 전달 부위)에서 다른 부위(예: 신체의 기관, 조직 또는 일부)로 화합물을 운반하거나 수송하는 데 관여하는 용매 캡슐화 물질을 의미한다. 약제학적으로 허용 가능한 담체는 제형의 다른 성분과 상용성이 있고 대상체의 조직에 해를 가하지 않는다는 의미에서 "허용 가능"하다(예를 들어, 생리학적으로 상용성, 무균성, 생리학적 pH 등).
약제학적으로 허용 가능한 담체로서 작용할 수 있는 물질의 일부 비제한적인 예는 다음을 포함한다: (1) 당, 예컨대 락토오스, 글루코스 및 수크로스; (2) 전분, 예컨대 옥수수 전분 및 감자 전분; (3) 셀룰로오스 및 그의 유도체, 예컨대 소듐 카복시메틸 셀룰로오스, 메틸셀룰로오스, 에틸 셀룰로오스, 미정질 셀룰로오스 및 셀룰로오스 아세테이트; (4) 분말 트라가칸트; (5) 맥아; (6) 젤라틴; (7) 윤활제, 예컨대 마그네슘 스테아레이트, 소듐 라우릴 설페이트 및 활석; (8) 부형제, 예컨대 코코아 버터 및 좌제 왁스; (9) 오일, 예컨대 낙화생유, 면실유, 홍화유, 참기름, 올리브유, 옥수수유 및 대두유; (10) 글리콜, 예컨대 프로필렌 글리콜; (11) 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜(PEG); (12) 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; (13) 한천; (14) 완충제, 예컨대 마그네슘 하이드록사이드 및 알루미늄 하이드록사이드; (15) 알긴산; (16) 발열원이 없는 물; (17) 등장성 식염수; (18) 링거 용액; (19) 에틸 알코올; (20) pH 완충 용액; (21) 폴리에스테르, 폴리카보네이트 및/또는 폴리무수물; (22) 증량제, 예컨대 폴리펩티드 및 아미노산 (23) 혈청 알코올, 예컨대 에탄올; 및 (23) 약제학적 제형에 이용되는 기타 무독성 상용성 물질. 습윤제, 착색제, 이형제, 코팅제, 감미제, 향미제, 향료, 보존제 및 항산화제도 제형에 존재할 수 있다. "부형제", "담체", "약제학적으로 허용 가능한 담체", "비히클" 등과 같은 용어는 본원에서 상호 교환적으로 사용된다.
약제학적 조성물은 약 5.0 내지 약 8.0 범위와 같은 생리학적 pH를 반영하는 사전 결정된 수준에서 제형의 pH를 유지하기 위해 하나 이상의 pH 완충 화합물을 포함할 수 있다. 수성 액체 제형에 사용되는 pH 완충 화합물은 아미노산 또는 아미노산 혼합물, 예컨대 히스티딘 또는 히스티딘과 글리신과 같은 아미노산의 혼합물일 수 있다. 대안적으로, pH 완충 화합물은 바람직하게는 제형의 pH를 사전 결정된 수준, 예컨대 약 5.0 내지 약 8.0 범위로 유지하고 칼슘 이온을 킬레이트화하지 않는 제형이다. 이러한 pH 완충 화합물의 예시적인 예는 이미다졸 및 아세테이트 이온을 포함하지만 이에 국한되지는 않는다. pH 완충 화합물은 제형의 pH를 사전 결정된 수준으로 유지하기 위해 적합한 임의의 양으로 존재할 수 있다.
또한 약제학적 조성물은 하나 이상의 삼투성 조절제, 즉 제형의 삼투 특성(예를 들어 긴장성, 삼투질농도 및/또는 삼투압)을 수령자 개체의 혈류 및 혈액 세포에 허용 가능한 수준으로 조절하는 화합물을 함유할 수 있다. 삼투성 조절제는 칼슘 이온을 킬레이트화하지 않는 작용제일 수 있다. 삼투성 조절제는 제형의 삼투 특성을 조절하는, 당업자에게 알려져 있거나 이용가능한 임의의 화합물일 수 있다. 당업자는 본 발명의 제형에 사용하기 위한 주어진 삼투성 조절제의 적합성을 실증적으로 결정할 수 있다. 삼투성 조절제의 적합한 유형의 예시적인 예는 다음을 포함하지만 이에 국한되지는 않는다: 염, 예컨대 염화나트륨 및 아세트산나트륨; 당, 수크로스, 덱스트로스 및 만니톨; 아미노산, 예컨대 글리신; 및 이들 작용제 및/또는 작용제 유형의 하나 이상의 혼합물. 삼투성 조절제(들)는 제형의 삼투 특성을 조절하기에 충분한 임의의 농도로 존재할 수 있다.
일부 구현예에서, 약제학적 조성물은 예를 들어 유전자 편집을 위해 대상체에게 전달하기 위해 제형화된다. 본원에 기술된 약제학적 조성물을 투여하는 적합한 경로는 국소, 피하, 경피, 피내, 병변내, 관절내, 복강내, 방광내, 점막경유, 치은, 치아내, 와우내, 고막경유, 기관내, 경막외, 척수강내, 근육내, 정맥내, 혈관내, 골내, 눈주위, 종양내, 뇌내 및 뇌실내 투여를 포함한다.
일부 구현예에서, 본원에 기술된 약제학적 조성물은 질병이 있는 부위에 국소 투여된다. 일부 구현예에서, 본원에 기술된 약제학적 조성물은 주사에 의해, 카테터에 의해, 좌제에 의해 또는 다공성, 비다공성 또는 젤라틴성 물질로 이루어지고 실라스틱 멤브레인과 같은 멤브레인 또는 섬유를 포함하는 임플란트에 의해 대상체에게 투여된다.
다른 구현예에서, 본원에 기술된 약제학적 조성물은 방출 조절 시스템으로 전달된다. 일 구현예에서, 펌프가 사용될 수 있다(예를 들어, Langer, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald 등, 1980, Surgery 88:507; Saudek 등, 1989, N. Engl. J. Med. 321:574 참조). 또 다른 구현예에서는 중합체 물질이 사용될 수 있다. (예를 들어, Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61 참조. 또한 Levy 등, 1985, Science 228: 190; During 등, 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105 참조.) 다른 방출 조절 시스템은 예를 들어 전술한 Langer에서 검토된다.
일부 구현예에서, 약제학적 조성물은 대상체, 예를 들어 인간에게 정맥내 또는 피하 투여하도록 적합화된 조성물로서 통상적인 절차에 따라 제형화된다. 일부 구현예에서, 주사 투여를 위한 약제학적 조성물은 가용화제 및 주사 부위의 통증을 완화시키는 리그노카인과 같은 국소마취제로서 무균 등장성으로 사용되는 용액이다. 일반적으로, 성분은 개별적으로 공급되거나 단위 투여 형태로 혼합되어, 예를 들어 활성제의 양을 나타내는 앰플 또는 봉지와 같이 완전 밀봉 용기에 담긴 건조 동결건조 분말 또는 물이 없는 농축물로서 공급된다. 약제가 주입에 의해 투여되는 경우, 무균의 의약품 등급 물이나 식염수를 함유하는 주입병(infusion bottle)과 함께 제공될 수 있다. 약제학적 조성물이 주사로 투여되는 경우, 투여 전에 성분이 혼합될 수 있도록 무균 주사용수 또는 식염수의 앰플이 제공될 수 있다.
전신 투여를 위한 약제학적 조성물은 액체, 예를 들어 무균 식염수, 젖산 링거액 또는 행크액일 수 있다. 또한, 약제학적 조성물은 고체 형태일 수 있으며, 사용 직전에 재용해되거나 현탁될 수 있다. 동결건조된 형태도 고려된다. 약제학적 조성물은 비경구 투여에도 적합한 리포솜 또는 미세결정과 같이 지질 입자 또는 소포 내에 함유될 수 있다. 조성물이 입자 내에 함유되어 있는 한, 입자는 단층 또는 다층과 같은 임의의 적합한 구조일 수 있다. 화합물은, 융합성 지질 디올레오일포스파티딜에탄올아민(DOPE), 낮은 수준(5 내지 10mol%)의 양이온성 지질을 함유하고 폴리에틸렌글리콜(PEG) 코팅에 의해 안정화되는 "안정화된 플라스미드-지질 입자"(SPLP)에 포획될 수 있다(Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47). N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸암모늄메틸설페이트 또는 "DOTAP"와 같은 양으로 하전된 지질이 이러한 입자 및 소포에 특히 바람직하다. 이러한 지질 입자의 제조는 잘 알려져 있다. 예를 들어, 미국 특허 제4,880,635호; 제4,906,477호; 제4,911,928호; 제4,917,951호; 제4,920,016호; 및 제4,921,757호를 참고하고, 이들 각각은 본원에 참고로 통합된다.
본원에 기술된 약제학적 조성물은 예를 들어 단위 용량으로 투여되거나 포장될 수 있다. 본 개시내용의 약제학적 조성물과 관련하여 사용될 때 용어 "단위 용량"은 대상체에 대한 단일 투여량으로 적합하게 물리적으로 구분된 단위를 의미하며, 각 단위는 필요한 희석제; 즉, 담체 또는 비히클과 연관되어 원하는 치료 효과를 생성시키도록 계산된 사전 결정된 양의 활성 물질을 함유한다.
추가로, 약제학적 조성물은 (a) 동결건조 형태의 본 발명의 화합물을 함유하는 용기 및 (b) (본 발명의 동결건조 화합물의 재구성 또는 희석을 위해 사용되는 무균의) 약제학적으로 허용 가능한 희석제를 함유하는 제2 용기를 포함하는 약제학적 키트로 제공될 수 있다. 의약품 또는 생물학적 제품의 제조, 사용 또는 판매를 규제하는 정부 기관이 규정한 양식의 안내문이 이러한 용기(들)과 선택적으로 연관될 수 있고, 이 안내문은 인간 투여용의 제조, 사용 또는 판매에 대한 기관 승인을 반영한다.
또 다른 측면에서, 상기에 기술된 질병 치료에 유용한 물질을 함유하는 제조 물품이 포함된다. 일부 구현예에서, 제조 물품은 용기와 라벨을 포함한다. 적합한 용기는 예를 들어 병, 바이알, 주사기 및 시험관을 포함한다. 용기는 유리 또는 플라스틱과 같은 다양한 물질로부터 형성될 수 있다. 일부 구현예에서, 용기는 본원에 기술된 질병을 치료하는 데 효과적인 조성물을 보유하고, 무균 접근 포트를 가질 수 있다. 예를 들어, 용기는 정맥 주사액 백 또는 피하 주사 바늘이 관통될 수 있는 마개가 있는 바이알일 수 있다. 조성물 중 활성제는 본 발명의 화합물이다. 일부 구현예에서, 용기 상에 있거나 용기와 연관된 라벨은 조성물이 선택된 질병을 치료하기 위해 사용됨을 나타낸다. 제조 물품은 인산염 완충 식염수, 링거액 또는 덱스트로스 용액과 같이 약제학적으로 허용 가능한 완충제를 포함하는 제2 용기를 추가로 포함할 수 있다. 이는 다른 완충제, 희석제, 필터, 바늘, 주사기 및 사용 설명서가 있는 포장 인서트를 포함하여 상업적 및 사용자 관점에서 바람직한 다른 물질을 추가로 포함할 수 있다.
일부 구현예에서, CRISPR 시스템(예를 들어, 본원에 기술된 Cas9 포함)은 약제학적 조성물의 일부로서 제공된다. 일부 구현예에서, 약제학적 조성물은 본원에 제공된 임의의 융합 단백질(예를 들어, LubCas9를 포함하는 본원에 기술된 핵염기 편집기 포함)을 포함한다. 일부 구현예에서, 약제학적 조성물은 본원에 제공된 임의의 복합체를 포함한다. 일부 구현예에서, 약제학적 조성물은 gRNA 및 양이온성 지질과의 복합체를 형성하는 RNA-가이드 뉴클레아제(예를 들어, Cas9)를 포함하는 리보핵단백질 복합체를 포함한다. 일부 구현예에서 약제학적 조성물은 gRNA, 핵산 프로그래밍 가능한 DNA 결합 단백질, 양이온성 지질 및 약제학적으로 허용 가능한 부형제를 포함한다. 약제학적 조성물은 하나 이상의 추가적인 치료적 활성 서브스턴스를 선택적으로 포함할 수 있다.
키트
일 측면에서, 본 발명은 상기 방법 및 조성물에 개시된 요소 중 임의의 하나 이상을 함유하는 키트를 제공한다. 일부 구현예에서, 키트는 벡터 시스템 및 키트 사용을 위한 설명서를 포함한다. 일부 구현예에서, 벡터 시스템은 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위를 포함하며, 상기 가이드 서열은 발현될 때 진핵 세포의 표적 서열에 대하여 CRISPR 복합체의 서열-특이적 결합을 지시하고, 상기 CRISPR 복합체는 (1) 표적 서열에 혼성화된 가이드 서열 및 (2) tracr 서열에 혼성화되는 서열과 복합체를 형성하는 CRISPR 효소; 및/또는 (b) 핵 위치 서열을 포함하는 상기 CRISPR 효소를 암호화하는 효소-암호화 서열에 작동 가능하게 연결된 제2 조절 요소를 포함한다. 요소는 개별적으로 또는 조합하여 제공될 수 있으며, 바이알, 병 또는 튜브와 같은 임의의 적합한 용기에서 제공될 수 있다. 일부 구현예에서, 키트는 하나 이상의 언어, 예를 들어 1개 초과의 언어로 작성된 설명서를 포함한다.
일부 구현예에서, 키트는 핵염기 편집기를 포함한다. 예를 들어, 일부 구현예에서, 키트는 본원에 기술된 Cas9 효소(ScoCas9, SirCas9, VapCas9, EpeCas9, LfeCas9, PmaCas9)를 포함하는 핵염기 편집기를 포함한다.
일부 구현예에서, 키트는 본원에 기술된 요소 중 하나 이상을 활용하는 프로세스에서 사용하기 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적합한 용기에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 저장 완충제를 제공할 수 있다. 시약은 특정 분석에 사용할 수 있는 형태로 또는 사용 전에 하나 이상의 다른 구성성분의 추가를 필요로 하는 형태(예: 농축물 또는 동결건조 형태)로 제공될 수 있다. 완충제는 탄산나트륨 완충제, 중탄산나트륨 완충제, 붕산염 완충제, 트리스 완충제, MOPS 완충제, HEPES 완충제 및 이들의 조합을 포함하지만 이에 국한되지 않는 임의의 완충제일 수 있다. 일부 구현예에서, 완충제는 알칼리성이다. 일부 구현예에서, 완충제는 약 7 내지 약 10의 pH를 가진다. 일부 구현예에서, 키트는 가이드 서열과 조절 요소를 작동 가능하게 연결하기 위해 벡터 내로 삽입하기 위한 가이드 서열에 상응하는 하나 이상의 올리고뉴클레오티드를 포함한다. 일부 구현예에서, 키트는 상동성 재조합 주형 폴리뉴클레오티드를 포함한다.
본원에 언급된 모든 출판물, 특허 출원, 특허 및 기타 참고 문헌은 전체적으로 참고로 통합된다. 또한, 물질, 방법 및 실시예는 예시일 뿐이고 제한하려는 의도는 아니다. 달리 정의하지 않는 한, 본원에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 가진다. 본원에 기술된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시 또는 테스트에서 사용될 수 있으며, 적합한 방법 및 물질이 본원에 기술되어 있다.
실시예
다음 실시예는 본 발명을 제조하고 실시하는 바람직한 방식 중 일부를 설명한다. 그러나, 이들 실시예는 단지 예시를 위한 것이며, 본 발명의 범위를 제한하려는 의도가 아닌 것으로 이해되어야 한다.
실시예 1.
신규 Cas9 효소 스크리닝, 신규 Cas9 효소의 발견 및 최적화
이 실시예는 신규 Cas9 효소를 발견하기 위한 스크리닝을 기술한다. 본원에 기술된 바와 같이, 이 스크리닝을 사용하여 스트렙토코커스 콘스텔라투스, 샤르페아 spp. 단리물 RUG017, 베일로넬라 파르불라, 에자키엘라 페루엔시스, 락토바실러스 퍼멘텀 균주 AF15-40LB 및 펩토니필러스 sp. 마르세유-P3761 박테리아 유래의 신규 Cas9 효소를 단리하고 최적화하였다.
신규 PAM 서열을 인식하는 신규 Cas9 효소를 발견하기 위한 검색에서 생물정보학 스크리닝을 사용하여 추가 효소를 검색하여서 CRISPR 표적 범위를 확장하였다. 스크리닝은 S. 파오게네스, S. 아우레우스, S. 써모필러스 및 F. 노비시다의 Cas9의 씨드 서열을 활용했다. BLAST 적중(hit)을 고려하기 위해 e-값 임계값이 le-6인 BLAST의 tblastn 변형을 사용하여 생물정보학을 수행했다. 즉, 테스트를 위해 선택된 유전자좌는 다른 종의 Cas9 단백질의 존재 하에서 완전하게 유지되는 유전자좌이었다. CRISPR 어레이 내에 3개보다 많은 스페이서를 갖고 Cas9의 1kb 내인성 서열 5'보다 크고 CRISPR 어레이의 300nt 3'보다 큰 유전자좌를 선택하였다. 이 접근법을 사용하여, 신규 Cas 효소는 인간 세포에서 발현되도록 최적화된 코돈 및 상이한 박테리아 종으로부터 식별하였다. 그 다음, 신규 조작된 Cas9 효소를 재조합에 의해 생성하였고 테스트하였다.
실시예 2. 스트렙토코커스 콘스텔라투스, 샤르페아 spp. 단리물 RUG017, 베일로넬라 파르불라, 에자키엘라 페루엔시스, 락토바실러스 퍼멘텀 균주 AF15-40LB 및 펩토니필러스 sp. 마르세유-P3761 박테리아 유래 신규 Cas9 효소에 대한 3'PAM 공통 모티프 식별
이 실시예는 스트렙토코커스 콘스텔라투스, 샤르페아 spp. 단리물 RUG017, 베일로넬라 파르불라, 에자키엘라 페루엔시스, 락토바실러스 퍼멘텀 균주 AF15-40LB 및 펩토니필러스 sp. 마르세유-P3761 균주로부터 최초 단리된 인간 코돈-최적화된 Cas9에 대한 프로토스페이서 인접 모티프(PAM) 서열의 식별을 예시한다.
시험관내 PAM 식별 분석을 사용하여 PAM 서열 인식에 대해 인간 코돈-최적화된 Cas9를 테스트하였다. 무작위 PAM 서열을 구비한 플라스미드 라이브러리를 상이한 박테리아에서 단리된 Cas9와 함께 항온처리했다. 절단되지 않은 플라스미드를 정제하고 서열 분석하여, 절단된 특정 PAM 모티프를 식별했다. 스트렙토코커스 콘스텔라투스 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NGG-3'으로 식별되었다(도 1a). 샤르페아 spp. 단리물 RUG017 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NAGHC-3'으로 식별되었다(도 1b). 베일로넬라 파르불라 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NRHRRH-3'(H=A, C 또는 T; R=A 또는 G)로 식별되었다(도 1c). 에자키엘라 페루엔시스 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NGG-3'으로 식별되었다(도 1d). 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9에 의해 인식되는 공통 PAM 서열은 5'-NNAAA-3'으로 식별되었다(도 1e). 펩토니필러스 sp. 마르세유-P3761 Cas9에 의해 인식되는 공통 PAM 서열은 5'-NGG-3'으로 식별되었다(도 1f).
실시예 3.
스트렙토코커스 콘스텔라투스, 샤르페아 spp. 단리물 RUG017, 베일로넬라 파르불라, 에자키엘라 페루엔시스, 락토바실러스 퍼멘텀 균주 AF15-40LB 및 펩토니필러스 sp. 마르세유-P3761 박테리아 유래 신규 Cas9 효소에 대한 sgRNA의 RNA 접힘 구조의 예측
이 실시예는 신규 Cas9 효소와 함께 사용하기 위한 crRNA 및 tracrRNA를 포함하는 예시적인 sgRNA의 예측된 RNA 접힘 구조를 입증한다.
Cas9 Crispr 유전자좌를 이종적으로 발현하는 대장균 균주로부터 유래된 RNA 상에서 소형 RNA 서열분석을 수행했다. 즉, 먼저 트리아졸에 대장균을 재현탁시킨 후 1분 주기로 3회 동안 균질화기에서 지르코니아/실리카 비드를 사용하여 박테리아를 균질화함으로써 정지상 박테리아로부터 RNA를 단리했다. 균질화된 샘플로부터 전체 RNA를 정제하고, DNAse를 처리하고, T4 폴리뉴클레오티드 키나제로 3' 탈인산화시키고, rRNA를 제거했다. rRNA가 고갈된 RNA로부터 RNA 라이브러리를 제조하고 소형 RNA에 대해 크기를 선택했다.
RNA 서열분석을 위해 전사체는 대장균 폴리(A) 폴리머라제 꼬리를 가진 폴리-A였으며, T4 RNA 리가제 1을 사용하여 5' RNA 어댑터와 결찰되었고, 역전사한 다음 바코드 프라이머로 cDNA를 PCR 증폭하고, MiSeq 상에서 서열분석했다. 각 샘플의 판독값은 연관된 바코드를 기반으로 식별했고, BWA를 사용하여 참조 서열에 대해 정렬시켰다. Picard 도구를 사용하여 전사체 서열을 추출하기 위해 쌍을 이룬 정렬을 사용했고, Geneious 소프트웨어를 사용하여 서열을 분석했다.
RNA 접힘은 Geneious 11.1.2 소프트웨어로부터의 예측을 기반으로 했다. 단일 sgRNA 전사체는 부위-특이적 Cas9 활성을 안내하기 위해 필요한 이중 RNA 구조를 모방하면서 crRNA를 tracrRNA에 융합시킨다. 스트렙토코커스 콘스텔라투스로부터의 ScoCas9와 함께 사용하기 위한 키메라 sgRNA에 대해 예측된 RNA 접힘 구조가 도 2a에 도시되어 있고, 샤르페아 spp. 단리물 RUG017로부터의 SirCas9와 함께 사용하기 위한 sgRNA가 도 2b에 도시되어 있고, 베일로넬라 파르불라로부터의 VasCas9와 함께 사용하기 위한 sgRNA가 도 2c에 도시되어 있고, 에자키엘라 페루엔시스로부터의 EpeCas9와 함께 사용하기 위한 sgRNA가 도 2d에 도시되어 있고, 락토바실러스 퍼멘텀 균주 AF15-40LB로부터의 LfeCas9와 함께 사용하기 위한 sgRNA가 도 2e에 도시되어 있고, 펩토니필러스 sp. 마르세유-P3761로부터의 PmaCas9와 함께 사용하기 위한 sgRNA가 도 2f에 도시되어 있다.
실시예 4.
HEK293T 세포에서 WT ScoCas9에 의한 생체외 절단 활성
이 실시예는 HEK293T 세포에서 스트렙토코커스 콘스텔라투스로부터 WT ScoCas9에 의한 생체외 핵산 절단 활성을 예시한다.
HEK293T 세포를 96웰 플레이트에 플레이팅했다. 플레이팅 후 24시간에 Cas9 및 가이드 RNA를 함유하는 발현 벡터(표 10)로 세포를 형질감염시켰다. 형질감염 후 72시간에 세포를 수확하고 전체 DNA를 추출했다.
HEK293T 세포에서 삽입결실 패턴을 특징규명하기 위해 심층 서열분석을 수행했다. 즉, Illumina 어댑터 및 표적 앰플리콘에 대한 고유 바코드를 추가하는 2회 PCR을 사용하여 예시적인 표적(표 8)을 증폭했다. PCR 산물을 2% 겔 상에서 실행하고 겔을 추출했다. 샘플을 모으고(pooled), 정량화하고, cDNA 라이브러리를 제조하고, MiSeq 상에서 서열분석했다. 삽입결실 빈도는 심층 서열분석에 의해 결정했다(도 3).
표 8. 예시적인 가이드 RNA 서열 및 PAM 서열
데이터는 WT ScoCas9가 2 내지 32% 삽입결실 빈도를 달성했음을 보여주었다. 가이드 RNA 2와 9는 30%를 초과하는 삽입결실 돌연변이를 초래한 반면, 가이드 RNA 11은 약 2%의 삽입결실 돌연변이를 초래했다.
실시예 5.
아데닌 염기 편집기(ABE) 또는 시티딘 염기 편집기(CBE)의 N-말단 융합
이 있는
Cas9 효소에 의한 염기 편집
이 실시예는 아데닌 염기 편집기(ABE) 또는 시티딘 염기 편집기(CBE)에 융합된 Cas9 효소의 염기 전환 효율을 예시한다.
즉, 96웰당 25,000개의 HEK293T 세포를 플레이팅했다. 100ng의 Cas9 발현 플라스미드 및 100ng의 가이드 발현 플라스미드를 플레이팅 후 24시간에 형질감염시켰다. 형질감염 후 5일에 세포를 수확하고 DNA를 추출했다.
HEK293T 세포에서 A에서 G로 전환 또는 C에서 T로 전환을 특징규명하기 위해 심층 서열분석을 수행했다. Illumina 어댑터 및 표적 앰플리콘에 대한 고유 바코드를 추가하는 2회 PCR 영역을 사용하여 예시적인 표적을 증폭했다. PCR 산물을 2% 겔 상에서 실행하고 겔을 추출했다. 샘플을 모으고, 정량화하고, cDNA 라이브러리를 제조하고, MiSeq 상에서 서열분석했다. N-말단 및 C-말단 TadA8 융합 작제물에 대한 심층 서열분석으로 A에서 G로 전환율을 결정했다. N-말단 및 C-말단 ppAPOBEC1 융합 작제물에 대한 심층 서열분석으로 C에서 T로의 전환율을 결정했다.
도 4a는 ABE 또는 CBE에 N-말단에서 융합된 ScoCas9 작제물의 개요를 보여준다. 표 9는 ScoCas9와 함께 사용되는 가이드 RNA 서열을 보여준다. 도 4b는 인간 세포주(HEK293T)에서 게놈 부위에 관한 아데닌 염기 편집기(ABE)에 대한 ScoCas9의 N-말단 융합으로 달성된 삽입결실 돌연변이 및 표적화된 아데닌에서 구아닌으로 전환율의 그래프를 보여준다(도 4b). 도 4c는 인간 세포주(HEK293T)에서 게놈 부위에 관한 시티딘 염기 편집기에 대한 ScoCas9의 N-말단 융합으로 달성된 삽입결실 돌연변이 및 표적화된 시토신에서 티민으로 전환율의 그래프를 보여준다(도 4c).
표 9. ScoCas9와 함께 사용되는 가이드 RNA 서열 및 PAM 서열
도 5a는 WT SirCas9뿐만 아니라 ABE에 N-말단에서 융합된 SirCas9("D14A" 돌연변이체)의 작제물의 개략도를 보여준다. 표 10은 SirCas9와 함께 사용되는 예시적인 NAGMC 가이드 RNA 서열을 보여준다. 도 5b는 인간 세포주(HEK293T)에서 게놈 부위에 관한 아데닌 염기 편집기(ABE)에 대한 SirCas9의 N-말단 융합으로 달성된 삽입결실 돌연변이 및 표적화된 아데닌에서 구아닌으로 전환율의 그래프를 보여준다(도 5b).
표 10. SirCa9와 함께 사용되는 가이드 RNA 서열 및 PAM 서열
도 6a는 WT VapCas9뿐만 아니라 ABE 또는 CBE에 N-말단에서 융합된 VapCas9("D38A" 돌연변이체)를 보여주는 작제물의 개략도를 보여준다. 표 11은 VapCas9와 함께 사용되는 예시적인 NRHRRH[여기서 H는 아데닌, 시토신 또는 티민이고, R은 아데닌 또는 구아닌임] 가이드 RNA 서열을 보여준다. 도 6b는 인간 세포주(HEK293T)에서 게놈 부위에 관한 아데닌 염기 편집기(ABE)에 대한 VapCas9의 N-말단 융합으로 달성된 삽입결실 돌연변이 및 표적화된 아데닌에서 구아닌으로 전환율뿐만 아니라 시티딘 염기 편집기(CBE)에 대한 VapCas9의 N-말단 융합으로 달성된 표적화된 시토신에서 티민으로 전환율의 그래프를 보여준다(도 6b).
표 11. VapCas9와 함께 사용하기 위한 가이드 RNA 서열 및 PAM 서열
도 7a는 VapCas9에 대한 ABE의 N-말단 융합 및 ABE의 C-말단 융합을 보여주는 작제물의 개략도를 보여준다. 도 7b는 아데닌 염기 편집기(ABE)에 대한 N-말단 융합 및 C-말단 융합으로 달성된 표적화된 아데닌에서 구아닌으로 전환율의 그래프를 보여준다.
도 8a는 EpeCas9에 대한 ABE 및 CBE의 N-말단 융합을 보여주는 작제물의 개략도를 보여준다. 표 12는 EpeCas9와 함께 사용되는 예시적인 가이드 RNA 서열을 보여준다. 도 8b는 삽입결실 돌연변이 그래프, ABE에 대한 N-말단 융합으로 달성된 표적화된 아데닌에서 티민으로 전환율 및 CBE에 대한 N-말단 융합으로 달성된 표적화된 시토신에서 티민으로 전환율의 그래프를 보여준다.
표 12. EpeCas9와 함께 사용하기 위한 가이드 RNA 서열 및 PAM 서열
도 9a는 WT LfeCas9 및 ABE와 CBE에 N-말단에서 융합된 LfeCas9 D9A 돌연변이체를 보여주는 작제물의 개략도를 보여준다. 표 13은 LfeCas9와 함께 사용되는 예시적인 가이드 RNA 서열을 보여준다. 도 9b는 LfeCas9를 사용하여 달성된 삽입결실 돌연변이 빈도의 결과를 보여주는 그래프를 보여준다. 도 9c는 아데닌 염기 편집기에 대한 LfeCas9의 N-말단 융합으로 달성된 표적화된 아데닌에서 구아닌으로 전환 그래프를 보여준다. 도 9d는 LfeCas9 D9A 돌연변이체의 N-말단에 융합된 CBE를 포함하는 염기 편집기를 사용하여 달성된 표적화된 시토신에서 티민으로 전환 그래프를 보여준다.
표 13. LfeCas9와 함께 사용하기 위한 가이드 RNA 서열 및 PAM 서열
도 10a는 WT PmaCas9 및 ABE와 CBE에 N-말단과 C-말단에서 융합된 PmaCas9 D12A 돌연변이체를 보여주는 작제물의 개략도를 보여준다. 도 10b는 PmaCas9 D12A 돌연변이체의 N-말단 또는 C-말단에 융합된 ABE 또는 CBE를 포함하는 염기 편집기를 사용하여 달성된 A에서 G로 또는 C에서 T로 전환 결과를 보여주는 그래프를 보여준다.
표 14. PmaCas9와 함께 사용하기 위한 가이드 RNA 서열 및 PAM 서열
표 15는 염기 편집 기능을 위한 예시적인 Cas9 아데노신 또는 아데닌 및 시토신 또는 시티딘 염기 편집기에 대한 서열을 개시한다.
표 15. 예시적인 Cas9 아데노신 또는 아데닌 및 시토신 또는 시티딘 염기 편집기의 서열
링커(밑줄, 이탤릭체나 굵은 글씨 없음)
TadA8(ABE) 또는 ppABOBECl(CBE)(이탤릭체 및 밑줄)
닉카제 돌연변이: ScoCas9에서의 D10A 돌연변이, SirCas9에서의 D14A 돌연변이, VapCas9에서의 D38A, EpeCas9에서의 D12A, LfeCas9에서의 D9A, PmaCas9에서의 D12A(굵은 글씨 및 이탤릭체) 2xUGI(굵은 글씨, 이탤릭체 및 밑줄)
3xHA 태그(이탤릭체)는 다른 태그로 대체 가능하다.
실시예 6. 조작된
스트렙토코커스 콘스텔라투스
(ScoCas9) NGC PAM 변이체
이 실시예는 NGC PAM 변이체를 인식하는 ScoCas9 변이체의 조작을 보여준다.
즉, NGC PAM 인식에 대한 아미노산 치환을 함유하는 ScoCas9-NGC-v1 및 NGC PAM 인식에 대한 아미노산 치환과 SpyCas9 활성을 증강시키는 추가 아미노산 치환을 함유하는 ScoCas9-NGC-v2라는 2가지 변이체를 조작했다. S. 피오게네스 SpyCas9와 S. 콘스텔라투스 ScoCas9 간의 구조적 비교를 통해 아미노산 잔기를 식별했다. ScoCas9-NGC-v1의 아미노산 서열(서열번호 95)은 야생형 ScoCas9 서열로부터 다음 돌연변이를 포함했다: D1117M, S118Q, E1201F, A1299R, D1309A, R1312E, T1314R. ScoCas9-NGC-v2의 아미노산 서열(서열번호 96)은 야생형 ScoCas9 서열로부터 다음 돌연변이를 포함했다: S409I, R655L, D1117M, S118Q, E1201F, A1299R, D1309A, R1312E, T1314R.
NLS(이탤릭체 굵은 글씨)
링커(밑줄있는 굵은 글씨)
렌티바이러스 매개 삽입에 의해 HEK293T 세포의 게놈 내로 무작위 통합되고 뉴클레아제 및 염기 편집 활성에 대해 테스트된 게놈 유전자좌를 표적으로 하기 위해 ScoCas9-NGC 변이체를 사용했다.
즉, HEK293T 세포를 96웰 플레이트에 플레이팅하였다. 플레이팅 후 24시간에 ScoCas9-NGC 변이체 및 가이드 RNA 서열 ATCGACAAGAAAGGGACTGA(서열번호 97)를 함유하는 발현 벡터로 세포를 형질감염시켰다. ScoCas9 변이체는 예시적인 NGC 3' PAM 서열인 AGC를 인식했다. 형질감염 후 72시간에 세포를 수확하고 전체 DNA를 추출했다.
HEK293T 세포 내 삽입결실 패턴을 특징규명하기 위해 심층 서열분석을 수행했다. Illumina 어댑터 및 표적 앰플리콘에 대한 고유 바코드를 추가하는 2회 PCR을 사용하여 예시적인 표적을 증폭했다. PCR 산물을 2% 겔 상에서 실행하고, 겔을 추출했다. 샘플을 모으고, 정량화하고, cDNA 라이브러리를 제조하고, MiSeq 상에서 서열분석했다. 삽입결실 빈도는 형질감염 후 4일에 심층 서열분석으로 결정했다.
결과는 ScoCas9-NGC 변이체 둘 모두의 뉴클레아제 활성을 보여주었다. ScoCas9-NGC-v1 및 ScoCas9-NGC-v2를 사용하여 약 20 내지 35%의 삽입결실 빈도를 달성했다(도 11a).
ABE 염기 편집기를 사용하여 ScoCas9-NGC 변이체의 융합이 작제되었다.
링커(밑줄있는 굵은 글씨)
TadA8(ABE)(이탤릭체)
NLS(굵은 이탤릭체)
HEK293T 세포에서 A에서 G로 전환을 특징규명하기 위해 심층 서열분석을 또한 수행했다(도 11b). 아데닌에서 구아닌으로(A에서 G로) 전환은 형질감염 후 4일에 NGS로 측정하였다. 결과는 ABE-nScoCas9-NGC 변이체 둘 모두에 의한 염기 편집 활동을 보여주었다. 변이체 둘 모두는 약 20 내지 30%의 A에서 G로 전환을 보여주었다. NGG를 인식하는 ScoCas9를 음성 대조군으로 사용했고 염기 편집을 나타내지 않았다. SpyCas9를 양성 대조군으로 사용했고 약 40%의 A에서 G로 전환을 보여주었다.
전반적으로, 결과는 NGC PAM 서열을 인식하도록 조작된 ScoCas9 변이체가 뉴클레아제 및 염기 편집 활동을 수행할 수 있음을 보여주었다.
균등물 및 범위
당업자는 단지 통상 실험을 사용하여 본원에 기술된 본 발명의 특정 구현예에 대한 많은 균등물을 인식하거나 식별할 수 있을 것이다. 본 발명의 범위는 상기 설명에 국한되는 것이 아니며, 다음의 청구범위에 기재된 바와 같다.
SEQUENCE LISTING
<110> BEAM THERAPEUTICS INC.
<120> NOVEL CRISPR ENZYMES, METHODS, SYSTEMS AND USES THEREOF
<130> BEM-004WO1
<140> PCT/US2022/021523
<141> 2022-03-23
<150> 63/164,798
<151> 2021-03-23
<160> 182
<170> PatentIn version 3.5
<210> 1
<211> 1345
<212> PRT
<213> Streptococcus constellatus
<400> 1
Met Gly Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Asp Lys Gln Ser Ile Lys Lys Asn Leu Leu
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Leu Arg
65 70 75 80
Tyr Leu Gln Glu Ile Phe Thr Gly Glu Met Asn Lys Val Asp Glu Asn
85 90 95
Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Asp Glu Asp Lys Arg
100 105 110
Gly Glu His His Pro Ile Phe Gly Asn Ile Ala Ala Glu Val Lys Tyr
115 120 125
His Asp Asp Phe Pro Thr Ile Tyr His Leu Arg Arg His Leu Ala Asp
130 135 140
Thr Ser Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Tyr Glu Gly Asp Leu Lys Ala
165 170 175
Glu Asn Thr Asp Val Gln Ala Leu Phe Lys Asp Phe Val Glu Glu Tyr
180 185 190
Asp Lys Thr Ile Glu Glu Ser His Leu Ser Glu Ile Thr Val Asp Ala
195 200 205
Leu Ser Ile Leu Thr Glu Lys Val Ser Lys Ser Ser Arg Leu Glu Asn
210 215 220
Leu Ile Ala His Tyr Pro Thr Glu Lys Lys Asn Thr Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Asp Leu His Pro Asn Phe Lys Thr Asn Phe
245 250 255
Gln Leu Ser Glu Asp Ala Lys Leu Gln Phe Ser Lys Asp Thr Tyr Glu
260 265 270
Glu Asp Leu Glu Gly Phe Leu Gly Glu Val Gly Asp Glu Tyr Ala Asp
275 280 285
Leu Phe Ala Ser Ala Lys Asn Leu Tyr Asp Ala Ile Leu Leu Ser Gly
290 295 300
Ile Leu Thr Val Asp Asp Asn Ser Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Val Lys Arg Tyr Glu Glu His Gln Lys Asp Leu Lys Lys Leu Lys
325 330 335
Asp Phe Ile Lys Val Asn Ala Pro Asp Gln Tyr Asn Ala Ile Phe Lys
340 345 350
Asp Lys Asn Lys Lys Gly Tyr Ala Ser Tyr Ile Glu Ser Gly Val Lys
355 360 365
Gln Asp Glu Phe Tyr Lys Tyr Leu Lys Gly Ile Leu Leu Lys Ile Asn
370 375 380
Gly Ser Gly Asp Phe Leu Asp Lys Ile Asp Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gln Glu Met His Ala Ile Leu Arg Arg Gln Gly Glu His Tyr Pro Phe
420 425 430
Leu Lys Glu Asn Gln Asp Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Lys Gly Ser Arg Phe Ala Trp
450 455 460
Ala Glu Tyr Lys Ala Asp Glu Lys Ile Thr Pro Trp Asn Phe Asp Asp
465 470 475 480
Ile Leu Asp Lys Glu Lys Ser Ala Glu Lys Phe Ile Thr Arg Met Thr
485 490 495
Leu Asn Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Pro Leu Tyr Glu Ala Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Asn Glu Gln Gly Glu Ala Lys Phe Phe Asp Thr Asn Met Lys
530 535 540
Gln Glu Ile Phe Asp His Val Phe Lys Glu Asn Arg Lys Val Thr Lys
545 550 555 560
Asp Lys Leu Leu Asn Tyr Leu Asn Lys Glu Phe Glu Glu Phe Arg Ile
565 570 575
Val Asn Leu Thr Gly Leu Asp Lys Glu Asn Lys Ala Phe Asn Ser Ser
580 585 590
Leu Gly Thr Tyr His Asp Leu Arg Lys Ile Leu Asp Lys Ser Phe Leu
595 600 605
Asp Asp Lys Ala Asn Glu Lys Thr Ile Glu Asp Ile Ile Gln Thr Leu
610 615 620
Thr Leu Phe Glu Asp Arg Glu Met Ile Arg Gln Arg Leu Gln Lys Tyr
625 630 635 640
Ser Asp Ile Phe Thr Lys Ala Gln Leu Lys Lys Leu Glu Arg Arg His
645 650 655
Tyr Thr Gly Trp Gly Arg Leu Ser Tyr Lys Leu Ile Asn Gly Ile Arg
660 665 670
Asn Lys Glu Asn Lys Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly
675 680 685
Tyr Ala Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser
690 695 700
Phe Lys Glu Glu Ile Ala Arg Ala Gln Ile Ile Asp Asp Val Asp Asp
705 710 715 720
Ile Ala Asn Val Val His Asp Leu Pro Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Val Lys Ile Val Asp Glu Leu Val Lys Val Met
740 745 750
Gly His Asn Pro Ala Asn Ile Ile Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Asp Lys Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys Leu Leu
770 775 780
Gln Asp Ser Leu Lys Asn Leu Asp Asn Pro Val Asn Ile Lys Asn Val
785 790 795 800
Glu Asn Gln Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Ile Gln
805 810 815
Asn Gly Lys Asp Met Tyr Thr Gly Glu Thr Leu Asp Ile Asn Asn Leu
820 825 830
Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp
835 840 845
Asn Ser Leu Asp Asn Arg Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asp Val Pro Ser Ile Glu Val Val His Glu Met Lys Ser
865 870 875 880
Phe Trp Ser Lys Leu Leu Ser Val Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Glu Glu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Glu Arg Phe Asn Thr Glu Phe Asp Gly
930 935 940
Asn Lys Arg Arg Ile Arg Asn Val Lys Ile Ile Thr Leu Lys Ser Asn
945 950 955 960
Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Asn Ala Leu Leu Leu Lys Tyr Pro Gln Leu Glu Pro Glu Phe Val
995 1000 1005
Tyr Gly Glu Tyr Pro Lys Tyr Asn Ser Tyr Arg Ser Arg Lys Ser
1010 1015 1020
Ala Thr Glu Lys Phe Leu Phe Tyr Ser Asn Ile Leu Arg Phe Phe
1025 1030 1035
Lys Lys Glu Asp Ile Gln Thr Asn Glu Asp Gly Glu Ile Ala Trp
1040 1045 1050
Asn Lys Glu Lys His Ile Lys Ile Leu Arg Lys Val Leu Ser Tyr
1055 1060 1065
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Glu Gln Thr Gly Gly
1070 1075 1080
Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Glu Ser Asp Lys Leu
1085 1090 1095
Ile Pro Arg Lys Thr Lys Asn Ser Tyr Trp Asp Pro Lys Lys Tyr
1100 1105 1110
Gly Gly Phe Asp Ser Pro Val Val Ala Tyr Ser Ile Leu Val Phe
1115 1120 1125
Ala Asp Val Glu Lys Gly Lys Ser Lys Lys Leu Arg Lys Val Gln
1130 1135 1140
Asp Met Val Gly Ile Thr Ile Met Glu Lys Lys Arg Phe Glu Lys
1145 1150 1155
Asn Pro Val Asp Phe Leu Glu Gln Arg Gly Tyr Arg Asn Val Arg
1160 1165 1170
Leu Glu Lys Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1175 1180 1185
Glu Asn Lys Arg Arg Arg Leu Leu Ala Ser Ala Lys Glu Leu Gln
1190 1195 1200
Lys Gly Asn Glu Leu Val Ile Pro Gln Arg Phe Thr Thr Leu Leu
1205 1210 1215
Tyr His Ser Tyr Arg Ile Glu Lys Asp Tyr Glu Pro Glu His Arg
1220 1225 1230
Glu Tyr Val Glu Lys His Lys Asp Glu Phe Lys Glu Leu Leu Glu
1235 1240 1245
Tyr Ile Ser Val Phe Ser Arg Lys Tyr Val Leu Ala Asp Asn Asn
1250 1255 1260
Leu Thr Lys Ile Glu Met Leu Phe Ser Lys Asn Lys Asp Ala Glu
1265 1270 1275
Val Ser Ser Leu Ala Lys Ser Phe Ile Ser Leu Leu Thr Phe Thr
1280 1285 1290
Ala Phe Gly Ala Pro Ala Ala Phe Asn Phe Phe Gly Glu Asn Ile
1295 1300 1305
Asp Arg Lys Arg Tyr Thr Ser Val Thr Glu Cys Leu Asn Ala Thr
1310 1315 1320
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1325 1330 1335
Leu Ser Lys Leu Gly Glu Asp
1340 1345
<210> 2
<211> 1399
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Lys Pro Tyr Ser Ile Gly
1 5 10 15
Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val Thr Asp Asp
20 25 30
Tyr Lys Val Pro Ala Lys Lys Met Lys Val Leu Gly Asn Thr Asp Lys
35 40 45
Gln Ser Ile Lys Lys Asn Leu Leu Gly Ala Leu Leu Phe Asp Ser Gly
50 55 60
Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr
65 70 75 80
Thr Arg Arg Lys Asn Arg Leu Arg Tyr Leu Gln Glu Ile Phe Thr Gly
85 90 95
Glu Met Asn Lys Val Asp Glu Asn Phe Phe Gln Arg Leu Asp Asp Ser
100 105 110
Phe Leu Val Asp Glu Asp Lys Arg Gly Glu His His Pro Ile Phe Gly
115 120 125
Asn Ile Ala Ala Glu Val Lys Tyr His Asp Asp Phe Pro Thr Ile Tyr
130 135 140
His Leu Arg Arg His Leu Ala Asp Thr Ser Lys Lys Ala Asp Leu Arg
145 150 155 160
Leu Val Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe
165 170 175
Leu Tyr Glu Gly Asp Leu Lys Ala Glu Asn Thr Asp Val Gln Ala Leu
180 185 190
Phe Lys Asp Phe Val Glu Glu Tyr Asp Lys Thr Ile Glu Glu Ser His
195 200 205
Leu Ser Glu Ile Thr Val Asp Ala Leu Ser Ile Leu Thr Glu Lys Val
210 215 220
Ser Lys Ser Ser Arg Leu Glu Asn Leu Ile Ala His Tyr Pro Thr Glu
225 230 235 240
Lys Lys Asn Thr Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Asp Leu
245 250 255
His Pro Asn Phe Lys Thr Asn Phe Gln Leu Ser Glu Asp Ala Lys Leu
260 265 270
Gln Phe Ser Lys Asp Thr Tyr Glu Glu Asp Leu Glu Gly Phe Leu Gly
275 280 285
Glu Val Gly Asp Glu Tyr Ala Asp Leu Phe Ala Ser Ala Lys Asn Leu
290 295 300
Tyr Asp Ala Ile Leu Leu Ser Gly Ile Leu Thr Val Asp Asp Asn Ser
305 310 315 320
Thr Lys Ala Pro Leu Ser Ala Ser Met Val Lys Arg Tyr Glu Glu His
325 330 335
Gln Lys Asp Leu Lys Lys Leu Lys Asp Phe Ile Lys Val Asn Ala Pro
340 345 350
Asp Gln Tyr Asn Ala Ile Phe Lys Asp Lys Asn Lys Lys Gly Tyr Ala
355 360 365
Ser Tyr Ile Glu Ser Gly Val Lys Gln Asp Glu Phe Tyr Lys Tyr Leu
370 375 380
Lys Gly Ile Leu Leu Lys Ile Asn Gly Ser Gly Asp Phe Leu Asp Lys
385 390 395 400
Ile Asp Arg Glu Asp Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
405 410 415
Ser Ile Pro His Gln Ile His Leu Gln Glu Met His Ala Ile Leu Arg
420 425 430
Arg Gln Gly Glu His Tyr Pro Phe Leu Lys Glu Asn Gln Asp Lys Ile
435 440 445
Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala
450 455 460
Arg Lys Gly Ser Arg Phe Ala Trp Ala Glu Tyr Lys Ala Asp Glu Lys
465 470 475 480
Ile Thr Pro Trp Asn Phe Asp Asp Ile Leu Asp Lys Glu Lys Ser Ala
485 490 495
Glu Lys Phe Ile Thr Arg Met Thr Leu Asn Asp Leu Tyr Leu Pro Glu
500 505 510
Glu Lys Val Leu Pro Lys His Ser Pro Leu Tyr Glu Ala Phe Thr Val
515 520 525
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Asn Glu Gln Gly Glu Ala
530 535 540
Lys Phe Phe Asp Thr Asn Met Lys Gln Glu Ile Phe Asp His Val Phe
545 550 555 560
Lys Glu Asn Arg Lys Val Thr Lys Asp Lys Leu Leu Asn Tyr Leu Asn
565 570 575
Lys Glu Phe Glu Glu Phe Arg Ile Val Asn Leu Thr Gly Leu Asp Lys
580 585 590
Glu Asn Lys Ala Phe Asn Ser Ser Leu Gly Thr Tyr His Asp Leu Arg
595 600 605
Lys Ile Leu Asp Lys Ser Phe Leu Asp Asp Lys Ala Asn Glu Lys Thr
610 615 620
Ile Glu Asp Ile Ile Gln Thr Leu Thr Leu Phe Glu Asp Arg Glu Met
625 630 635 640
Ile Arg Gln Arg Leu Gln Lys Tyr Ser Asp Ile Phe Thr Lys Ala Gln
645 650 655
Leu Lys Lys Leu Glu Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser
660 665 670
Tyr Lys Leu Ile Asn Gly Ile Arg Asn Lys Glu Asn Lys Lys Thr Ile
675 680 685
Leu Asp Tyr Leu Ile Asp Asp Gly Tyr Ala Asn Arg Asn Phe Met Gln
690 695 700
Leu Ile Asn Asp Asp Ala Leu Ser Phe Lys Glu Glu Ile Ala Arg Ala
705 710 715 720
Gln Ile Ile Asp Asp Val Asp Asp Ile Ala Asn Val Val His Asp Leu
725 730 735
Pro Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Ser Val Lys Ile
740 745 750
Val Asp Glu Leu Val Lys Val Met Gly His Asn Pro Ala Asn Ile Ile
755 760 765
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Asp Lys Gly Arg Arg Asn
770 775 780
Ser Gln Gln Arg Leu Lys Leu Leu Gln Asp Ser Leu Lys Asn Leu Asp
785 790 795 800
Asn Pro Val Asn Ile Lys Asn Val Glu Asn Gln Gln Leu Gln Asn Asp
805 810 815
Arg Leu Phe Leu Tyr Tyr Ile Gln Asn Gly Lys Asp Met Tyr Thr Gly
820 825 830
Glu Thr Leu Asp Ile Asn Asn Leu Ser Gln Tyr Asp Ile Asp His Ile
835 840 845
Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Leu Asp Asn Arg Val Leu
850 855 860
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Ile
865 870 875 880
Glu Val Val His Glu Met Lys Ser Phe Trp Ser Lys Leu Leu Ser Val
885 890 895
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Thr Glu Glu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Glu
930 935 940
Arg Phe Asn Thr Glu Phe Asp Gly Asn Lys Arg Arg Ile Arg Asn Val
945 950 955 960
Lys Ile Ile Thr Leu Lys Ser Asn Leu Val Ser Asn Phe Arg Lys Glu
965 970 975
Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Tyr His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Gly Asn Ala Leu Leu Leu Lys Tyr
995 1000 1005
Pro Gln Leu Glu Pro Glu Phe Val Tyr Gly Glu Tyr Pro Lys Tyr
1010 1015 1020
Asn Ser Tyr Arg Ser Arg Lys Ser Ala Thr Glu Lys Phe Leu Phe
1025 1030 1035
Tyr Ser Asn Ile Leu Arg Phe Phe Lys Lys Glu Asp Ile Gln Thr
1040 1045 1050
Asn Glu Asp Gly Glu Ile Ala Trp Asn Lys Glu Lys His Ile Lys
1055 1060 1065
Ile Leu Arg Lys Val Leu Ser Tyr Pro Gln Val Asn Ile Val Lys
1070 1075 1080
Lys Thr Glu Glu Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1085 1090 1095
Pro Lys Gly Glu Ser Asp Lys Leu Ile Pro Arg Lys Thr Lys Asn
1100 1105 1110
Ser Tyr Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Val
1115 1120 1125
Val Ala Tyr Ser Ile Leu Val Phe Ala Asp Val Glu Lys Gly Lys
1130 1135 1140
Ser Lys Lys Leu Arg Lys Val Gln Asp Met Val Gly Ile Thr Ile
1145 1150 1155
Met Glu Lys Lys Arg Phe Glu Lys Asn Pro Val Asp Phe Leu Glu
1160 1165 1170
Gln Arg Gly Tyr Arg Asn Val Arg Leu Glu Lys Ile Ile Lys Leu
1175 1180 1185
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Lys Arg Arg Arg Leu
1190 1195 1200
Leu Ala Ser Ala Lys Glu Leu Gln Lys Gly Asn Glu Leu Val Ile
1205 1210 1215
Pro Gln Arg Phe Thr Thr Leu Leu Tyr His Ser Tyr Arg Ile Glu
1220 1225 1230
Lys Asp Tyr Glu Pro Glu His Arg Glu Tyr Val Glu Lys His Lys
1235 1240 1245
Asp Glu Phe Lys Glu Leu Leu Glu Tyr Ile Ser Val Phe Ser Arg
1250 1255 1260
Lys Tyr Val Leu Ala Asp Asn Asn Leu Thr Lys Ile Glu Met Leu
1265 1270 1275
Phe Ser Lys Asn Lys Asp Ala Glu Val Ser Ser Leu Ala Lys Ser
1280 1285 1290
Phe Ile Ser Leu Leu Thr Phe Thr Ala Phe Gly Ala Pro Ala Ala
1295 1300 1305
Phe Asn Phe Phe Gly Glu Asn Ile Asp Arg Lys Arg Tyr Thr Ser
1310 1315 1320
Val Thr Glu Cys Leu Asn Ala Thr Leu Ile His Gln Ser Ile Thr
1325 1330 1335
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Lys Leu Gly Glu Asp
1340 1345 1350
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1355 1360 1365
Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro
1370 1375 1380
Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr
1385 1390 1395
Ala
<210> 3
<211> 92
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 3
guuuuagagc ugugcuguuu aaacaacaca gcaaguuaaa auaaggcuuu guccguacuc 60
aagcuugcaa aagcgugcac cgauucggug cu 92
<210> 4
<211> 1326
<212> PRT
<213> Sharpea sp.
<400> 4
Met Ala Lys Asn Lys Asp Ile Arg Tyr Ser Ile Gly Leu Asp Ile Gly
1 5 10 15
Thr Asn Ser Val Gly Trp Ala Val Met Asp Glu His Tyr Glu Leu Leu
20 25 30
Lys Lys Gly Asn His His Met Trp Gly Ser Arg Leu Phe Asp Ala Ala
35 40 45
Glu Pro Ala Ala Thr Arg Arg Ala Ser Arg Ser Ile Arg Arg Arg Tyr
50 55 60
Asn Lys Arg Arg Glu Arg Ile Arg Leu Leu Arg Asp Leu Leu Gly Asp
65 70 75 80
Met Val Met Glu Val Asp Pro Thr Phe Phe Ile Arg Leu Leu Asn Val
85 90 95
Ser Phe Leu Asp Glu Glu Asp Lys Gln Lys Asn Leu Gly Asn Asp Tyr
100 105 110
Lys Asp Asn Tyr Asn Leu Phe Ile Glu Lys Asp Phe Asn Asp Lys Thr
115 120 125
Tyr Tyr Asp Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Glu Leu Cys
130 135 140
Glu Asn Lys Glu Lys Ala Asp Pro Arg Leu Ile Tyr Leu Ala Leu His
145 150 155 160
His Ile Val Lys Tyr Arg Gly Asn Phe Leu Lys Glu Gly Gln Ser Phe
165 170 175
Ala Lys Val Tyr Glu Asp Ile Glu Glu Lys Leu Asp Asn Thr Leu Lys
180 185 190
Lys Phe Met Ser Leu Asn Asp Leu Asp Asn Leu Phe Val Asp Asn Asp
195 200 205
Ile Asn Ser Met Ile Thr Val Leu Ser Lys Ile Tyr Gln Arg Ser Lys
210 215 220
Lys Ala Asp Asp Leu Leu Lys Ile Met Asn Pro Thr Lys Glu Glu Arg
225 230 235 240
Ala Ala Tyr Lys Glu Phe Thr Lys Ala Leu Val Gly Leu Lys Phe Asn
245 250 255
Val Ser Lys Met Ile Leu Ala Gln Glu Val Lys Lys Asp Asp Lys Asp
260 265 270
Ile Glu Leu Asp Phe Ser Asn Val Asp Tyr Asp Ser Thr Val Asp Gly
275 280 285
Leu Gln Ala Glu Leu Gly Glu Tyr Ile Glu Phe Ile Glu Met Leu His
290 295 300
Ser Ile Asn Ser Trp Val Glu Leu Gln Asp Ile Leu Gly Asn Asn Ser
305 310 315 320
Thr Ile Ser Ala Ala Met Val Glu Arg Tyr Glu Glu His Lys Asn Asp
325 330 335
Leu Arg Val Leu Lys Lys Val Ile Arg Glu Glu Leu Pro Asp Lys Tyr
340 345 350
Asn Glu Val Phe Arg Glu Asp Asn Pro Lys Leu His Asn Tyr Leu Gly
355 360 365
Tyr Ile Lys Tyr Pro Lys Asn Thr Pro Val Glu Glu Phe Tyr Glu Tyr
370 375 380
Ile Lys Arg Leu Leu Ala Lys Val Asp Thr Gly Glu Ala Arg Glu Ile
385 390 395 400
Leu Glu Arg Ile Asp Leu Glu Lys Phe Met Leu Lys Gln Asn Ser Arg
405 410 415
Thr Asn Gly Ser Ile Pro Tyr Gln Met Gln Lys Asp Glu Met Ile Gln
420 425 430
Ile Ile Asp Asn Gln Ser Val Tyr Tyr Pro Gln Leu Lys Glu Asn Arg
435 440 445
Glu Lys Leu Ile Ser Ile Leu Glu Phe Arg Ile Pro Tyr Tyr Phe Gly
450 455 460
Pro Leu Asn Thr His Ser Glu Phe Ala Trp Ile Lys Lys Phe Glu Asp
465 470 475 480
Lys Gln Lys Glu Arg Ile Leu Pro Trp Asn Tyr Asp Gln Ile Val Asp
485 490 495
Ile Asp Ala Thr Ala Glu Gly Phe Ile Glu Arg Met Gln Asn Thr Gly
500 505 510
Thr Tyr Phe Pro Asp Lys Pro Val Met Ala Lys Asn Ser Leu Thr Val
515 520 525
Ser Lys Phe Glu Val Leu Asn Glu Leu Asn Lys Ile Arg Ile Asn Gly
530 535 540
Lys Leu Ile Pro Val Glu Thr Lys Lys Glu Leu Leu Ser Asp Leu Phe
545 550 555 560
Met Lys Asn Lys Thr Ile Thr Asp Lys Lys Leu Lys Asp Trp Leu Val
565 570 575
Thr His Gln Tyr Tyr Asp Thr Asn Glu Glu Leu Lys Ile Glu Gly Tyr
580 585 590
Gln Lys Asp Leu Gln Phe Ser Thr Ser Leu Ala Pro Trp Ile Asp Phe
595 600 605
Thr Lys Ile Phe Gly Glu Ile Asn Ala Ser Asn Tyr Gln Leu Ile Glu
610 615 620
Lys Ile Ile Tyr Asp Ile Ser Ile Phe Glu Asp Lys Lys Ile Leu Lys
625 630 635 640
Arg Arg Leu Lys Lys Val Tyr Gln Leu Asp Asp Leu Leu Val Asp Lys
645 650 655
Ile Leu Lys Leu Asn Tyr Thr Gly Trp Ser Arg Leu Ser Glu Lys Leu
660 665 670
Leu Thr Gly Ile Lys Ser Lys Asn Ser Lys Glu Thr Ile Leu Ser Ile
675 680 685
Leu Glu Asn Ser Asn Met Asn Leu Met Glu Ile Ile Asn Asp Glu Ser
690 695 700
Leu Gly Phe Lys Gln Ile Ile Glu Glu Ser Asn Lys Lys Asp Ile Glu
705 710 715 720
Gly Pro Phe Arg Tyr Asp Glu Val Lys Lys Leu Ala Gly Ser Pro Ala
725 730 735
Ile Lys Arg Gly Ile Trp Gln Ala Leu Leu Val Val Gln Glu Ile Thr
740 745 750
Lys Phe Met Lys His Glu Pro Ser His Ile Tyr Ile Glu Phe Ala Arg
755 760 765
Glu Glu Gln Glu Lys Val Arg Thr Glu Ser Arg Ile Ala Lys Leu Gln
770 775 780
Lys Ile Tyr Lys Asp Leu Asn Leu Gln Thr Lys Glu Asp Gln Leu Val
785 790 795 800
Tyr Glu Ser Leu Lys Lys Glu Asp Ala Lys Lys Lys Ile Asp Thr Asp
805 810 815
Ala Leu Tyr Leu Tyr Tyr Leu Gln Met Gly Lys Ser Met Tyr Ser Gly
820 825 830
Lys Pro Leu Asp Ile Asp Lys Leu Ser Thr Tyr His Ile Asp His Ile
835 840 845
Leu Pro Arg Ser Leu Ile Lys Asp Asp Ser Leu Asp Asn Arg Val Leu
850 855 860
Val Leu Pro Lys Glu Asn Glu Trp Lys Leu Asp Ser Glu Thr Val Pro
865 870 875 880
Phe Glu Ile Arg Asn Lys Met Met Gly Phe Trp Gln Lys Leu His Glu
885 890 895
Asn Gly Leu Met Ser Asn Lys Lys Phe Phe Ser Leu Ile Arg Thr Asp
900 905 910
Phe Asn Glu Lys Asp Lys Lys Arg Phe Ile Asn Arg Gln Leu Val Glu
915 920 925
Thr Arg Gln Ile Ile Lys Asn Val Ala Val Ile Ile Asn Asp His Tyr
930 935 940
Thr Asn Thr Asn Val Val Thr Val Arg Ala Glu Leu Ser His Gln Phe
945 950 955 960
Arg Glu Arg Tyr Lys Ile Tyr Lys Asn Arg Asp Leu Asn Asp Leu His
965 970 975
His Ala His Asp Ala Tyr Ile Ala Cys Ile Leu Gly Gln Phe Ile His
980 985 990
Gln Asn Phe Gly Asn Met Asp Val Asn Met Ile Tyr Gly Gln Tyr Lys
995 1000 1005
Lys Asn Tyr Lys Lys Asp Val Gln Glu His Asn Asn Tyr Gly Phe
1010 1015 1020
Ile Leu Asn Ser Met Asn His Ile His Phe Asn Asp Asp Asn Ser
1025 1030 1035
Val Ile Trp Asp Pro Ser Tyr Ile Gly Lys Ile Lys Ser Cys Phe
1040 1045 1050
Cys Tyr Lys Asp Val Tyr Val Thr Lys Lys Leu Glu Gln Asn Asp
1055 1060 1065
Ala Lys Leu Phe Asp Leu Thr Ile Leu Pro Ser Asp Lys Asn Ser
1070 1075 1080
Glu Asn Gly Val Thr Lys Ala Lys Ile Pro Val Asn Lys Tyr Arg
1085 1090 1095
Lys Asp Val Asn Lys Tyr Gly Gly Phe Ser Gly Asp Ala Pro Ile
1100 1105 1110
Met Leu Ala Ile Glu Ala Asp Lys Gly Lys Lys His Val Arg Gln
1115 1120 1125
Val Ile Ala Phe Pro Leu Arg Leu Lys Asn Tyr Asn Asp Glu Glu
1130 1135 1140
Arg Ile Lys Phe Ile Glu Lys Glu Lys Asn Leu Lys Asn Val Lys
1145 1150 1155
Ile Leu Thr Glu Val Lys Lys Asn Gln Leu Ile Leu Ile Asn His
1160 1165 1170
Gln Tyr Phe Phe Ile Thr Gly Thr Asn Glu Leu Val Asn Ala Thr
1175 1180 1185
Gln Leu Lys Leu Ser Ala Lys Asn Thr Lys Asn Leu Phe Asn Leu
1190 1195 1200
Val Asp Ala Asn Lys His Asn Lys Leu Glu Ser Ile Asp Asp Ala
1205 1210 1215
Asn Phe Asn Glu Val Ile Gln Glu Leu Ile Cys Lys Leu Gln Glu
1220 1225 1230
Pro Ile Tyr Ser Arg Tyr Asn Ser Ile Gly Lys Glu Phe Glu Asp
1235 1240 1245
Ser Tyr Glu Lys Ile Asn Ala Val Thr Lys Gln Asp Lys Leu Tyr
1250 1255 1260
Ile Ile Glu Tyr Leu Ile Ala Ile Met Ser Ala Lys Ala Thr Gln
1265 1270 1275
Gly Tyr Ile Lys Pro Glu Leu Ala Arg Glu Ile Gly Thr Asn Gly
1280 1285 1290
Lys Asn Lys Gly Arg Ile Lys Ser Phe Thr Ile Asp Leu Asn Lys
1295 1300 1305
Thr Thr Phe Ile Ser Thr Ser Val Thr Gly Leu Phe Ser Lys Lys
1310 1315 1320
Tyr Lys Leu
1325
<210> 5
<211> 1380
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 5
Met Pro Lys Lys Lys Arg Lys Val Gly Ala Lys Asn Lys Asp Ile Arg
1 5 10 15
Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val
20 25 30
Met Asp Glu His Tyr Glu Leu Leu Lys Lys Gly Asn His His Met Trp
35 40 45
Gly Ser Arg Leu Phe Asp Ala Ala Glu Pro Ala Ala Thr Arg Arg Ala
50 55 60
Ser Arg Ser Ile Arg Arg Arg Tyr Asn Lys Arg Arg Glu Arg Ile Arg
65 70 75 80
Leu Leu Arg Asp Leu Leu Gly Asp Met Val Met Glu Val Asp Pro Thr
85 90 95
Phe Phe Ile Arg Leu Leu Asn Val Ser Phe Leu Asp Glu Glu Asp Lys
100 105 110
Gln Lys Asn Leu Gly Asn Asp Tyr Lys Asp Asn Tyr Asn Leu Phe Ile
115 120 125
Glu Lys Asp Phe Asn Asp Lys Thr Tyr Tyr Asp Lys Tyr Pro Thr Ile
130 135 140
Tyr His Leu Arg Lys Glu Leu Cys Glu Asn Lys Glu Lys Ala Asp Pro
145 150 155 160
Arg Leu Ile Tyr Leu Ala Leu His His Ile Val Lys Tyr Arg Gly Asn
165 170 175
Phe Leu Lys Glu Gly Gln Ser Phe Ala Lys Val Tyr Glu Asp Ile Glu
180 185 190
Glu Lys Leu Asp Asn Thr Leu Lys Lys Phe Met Ser Leu Asn Asp Leu
195 200 205
Asp Asn Leu Phe Val Asp Asn Asp Ile Asn Ser Met Ile Thr Val Leu
210 215 220
Ser Lys Ile Tyr Gln Arg Ser Lys Lys Ala Asp Asp Leu Leu Lys Ile
225 230 235 240
Met Asn Pro Thr Lys Glu Glu Arg Ala Ala Tyr Lys Glu Phe Thr Lys
245 250 255
Ala Leu Val Gly Leu Lys Phe Asn Val Ser Lys Met Ile Leu Ala Gln
260 265 270
Glu Val Lys Lys Asp Asp Lys Asp Ile Glu Leu Asp Phe Ser Asn Val
275 280 285
Asp Tyr Asp Ser Thr Val Asp Gly Leu Gln Ala Glu Leu Gly Glu Tyr
290 295 300
Ile Glu Phe Ile Glu Met Leu His Ser Ile Asn Ser Trp Val Glu Leu
305 310 315 320
Gln Asp Ile Leu Gly Asn Asn Ser Thr Ile Ser Ala Ala Met Val Glu
325 330 335
Arg Tyr Glu Glu His Lys Asn Asp Leu Arg Val Leu Lys Lys Val Ile
340 345 350
Arg Glu Glu Leu Pro Asp Lys Tyr Asn Glu Val Phe Arg Glu Asp Asn
355 360 365
Pro Lys Leu His Asn Tyr Leu Gly Tyr Ile Lys Tyr Pro Lys Asn Thr
370 375 380
Pro Val Glu Glu Phe Tyr Glu Tyr Ile Lys Arg Leu Leu Ala Lys Val
385 390 395 400
Asp Thr Gly Glu Ala Arg Glu Ile Leu Glu Arg Ile Asp Leu Glu Lys
405 410 415
Phe Met Leu Lys Gln Asn Ser Arg Thr Asn Gly Ser Ile Pro Tyr Gln
420 425 430
Met Gln Lys Asp Glu Met Ile Gln Ile Ile Asp Asn Gln Ser Val Tyr
435 440 445
Tyr Pro Gln Leu Lys Glu Asn Arg Glu Lys Leu Ile Ser Ile Leu Glu
450 455 460
Phe Arg Ile Pro Tyr Tyr Phe Gly Pro Leu Asn Thr His Ser Glu Phe
465 470 475 480
Ala Trp Ile Lys Lys Phe Glu Asp Lys Gln Lys Glu Arg Ile Leu Pro
485 490 495
Trp Asn Tyr Asp Gln Ile Val Asp Ile Asp Ala Thr Ala Glu Gly Phe
500 505 510
Ile Glu Arg Met Gln Asn Thr Gly Thr Tyr Phe Pro Asp Lys Pro Val
515 520 525
Met Ala Lys Asn Ser Leu Thr Val Ser Lys Phe Glu Val Leu Asn Glu
530 535 540
Leu Asn Lys Ile Arg Ile Asn Gly Lys Leu Ile Pro Val Glu Thr Lys
545 550 555 560
Lys Glu Leu Leu Ser Asp Leu Phe Met Lys Asn Lys Thr Ile Thr Asp
565 570 575
Lys Lys Leu Lys Asp Trp Leu Val Thr His Gln Tyr Tyr Asp Thr Asn
580 585 590
Glu Glu Leu Lys Ile Glu Gly Tyr Gln Lys Asp Leu Gln Phe Ser Thr
595 600 605
Ser Leu Ala Pro Trp Ile Asp Phe Thr Lys Ile Phe Gly Glu Ile Asn
610 615 620
Ala Ser Asn Tyr Gln Leu Ile Glu Lys Ile Ile Tyr Asp Ile Ser Ile
625 630 635 640
Phe Glu Asp Lys Lys Ile Leu Lys Arg Arg Leu Lys Lys Val Tyr Gln
645 650 655
Leu Asp Asp Leu Leu Val Asp Lys Ile Leu Lys Leu Asn Tyr Thr Gly
660 665 670
Trp Ser Arg Leu Ser Glu Lys Leu Leu Thr Gly Ile Lys Ser Lys Asn
675 680 685
Ser Lys Glu Thr Ile Leu Ser Ile Leu Glu Asn Ser Asn Met Asn Leu
690 695 700
Met Glu Ile Ile Asn Asp Glu Ser Leu Gly Phe Lys Gln Ile Ile Glu
705 710 715 720
Glu Ser Asn Lys Lys Asp Ile Glu Gly Pro Phe Arg Tyr Asp Glu Val
725 730 735
Lys Lys Leu Ala Gly Ser Pro Ala Ile Lys Arg Gly Ile Trp Gln Ala
740 745 750
Leu Leu Val Val Gln Glu Ile Thr Lys Phe Met Lys His Glu Pro Ser
755 760 765
His Ile Tyr Ile Glu Phe Ala Arg Glu Glu Gln Glu Lys Val Arg Thr
770 775 780
Glu Ser Arg Ile Ala Lys Leu Gln Lys Ile Tyr Lys Asp Leu Asn Leu
785 790 795 800
Gln Thr Lys Glu Asp Gln Leu Val Tyr Glu Ser Leu Lys Lys Glu Asp
805 810 815
Ala Lys Lys Lys Ile Asp Thr Asp Ala Leu Tyr Leu Tyr Tyr Leu Gln
820 825 830
Met Gly Lys Ser Met Tyr Ser Gly Lys Pro Leu Asp Ile Asp Lys Leu
835 840 845
Ser Thr Tyr His Ile Asp His Ile Leu Pro Arg Ser Leu Ile Lys Asp
850 855 860
Asp Ser Leu Asp Asn Arg Val Leu Val Leu Pro Lys Glu Asn Glu Trp
865 870 875 880
Lys Leu Asp Ser Glu Thr Val Pro Phe Glu Ile Arg Asn Lys Met Met
885 890 895
Gly Phe Trp Gln Lys Leu His Glu Asn Gly Leu Met Ser Asn Lys Lys
900 905 910
Phe Phe Ser Leu Ile Arg Thr Asp Phe Asn Glu Lys Asp Lys Lys Arg
915 920 925
Phe Ile Asn Arg Gln Leu Val Glu Thr Arg Gln Ile Ile Lys Asn Val
930 935 940
Ala Val Ile Ile Asn Asp His Tyr Thr Asn Thr Asn Val Val Thr Val
945 950 955 960
Arg Ala Glu Leu Ser His Gln Phe Arg Glu Arg Tyr Lys Ile Tyr Lys
965 970 975
Asn Arg Asp Leu Asn Asp Leu His His Ala His Asp Ala Tyr Ile Ala
980 985 990
Cys Ile Leu Gly Gln Phe Ile His Gln Asn Phe Gly Asn Met Asp Val
995 1000 1005
Asn Met Ile Tyr Gly Gln Tyr Lys Lys Asn Tyr Lys Lys Asp Val
1010 1015 1020
Gln Glu His Asn Asn Tyr Gly Phe Ile Leu Asn Ser Met Asn His
1025 1030 1035
Ile His Phe Asn Asp Asp Asn Ser Val Ile Trp Asp Pro Ser Tyr
1040 1045 1050
Ile Gly Lys Ile Lys Ser Cys Phe Cys Tyr Lys Asp Val Tyr Val
1055 1060 1065
Thr Lys Lys Leu Glu Gln Asn Asp Ala Lys Leu Phe Asp Leu Thr
1070 1075 1080
Ile Leu Pro Ser Asp Lys Asn Ser Glu Asn Gly Val Thr Lys Ala
1085 1090 1095
Lys Ile Pro Val Asn Lys Tyr Arg Lys Asp Val Asn Lys Tyr Gly
1100 1105 1110
Gly Phe Ser Gly Asp Ala Pro Ile Met Leu Ala Ile Glu Ala Asp
1115 1120 1125
Lys Gly Lys Lys His Val Arg Gln Val Ile Ala Phe Pro Leu Arg
1130 1135 1140
Leu Lys Asn Tyr Asn Asp Glu Glu Arg Ile Lys Phe Ile Glu Lys
1145 1150 1155
Glu Lys Asn Leu Lys Asn Val Lys Ile Leu Thr Glu Val Lys Lys
1160 1165 1170
Asn Gln Leu Ile Leu Ile Asn His Gln Tyr Phe Phe Ile Thr Gly
1175 1180 1185
Thr Asn Glu Leu Val Asn Ala Thr Gln Leu Lys Leu Ser Ala Lys
1190 1195 1200
Asn Thr Lys Asn Leu Phe Asn Leu Val Asp Ala Asn Lys His Asn
1205 1210 1215
Lys Leu Glu Ser Ile Asp Asp Ala Asn Phe Asn Glu Val Ile Gln
1220 1225 1230
Glu Leu Ile Cys Lys Leu Gln Glu Pro Ile Tyr Ser Arg Tyr Asn
1235 1240 1245
Ser Ile Gly Lys Glu Phe Glu Asp Ser Tyr Glu Lys Ile Asn Ala
1250 1255 1260
Val Thr Lys Gln Asp Lys Leu Tyr Ile Ile Glu Tyr Leu Ile Ala
1265 1270 1275
Ile Met Ser Ala Lys Ala Thr Gln Gly Tyr Ile Lys Pro Glu Leu
1280 1285 1290
Ala Arg Glu Ile Gly Thr Asn Gly Lys Asn Lys Gly Arg Ile Lys
1295 1300 1305
Ser Phe Thr Ile Asp Leu Asn Lys Thr Thr Phe Ile Ser Thr Ser
1310 1315 1320
Val Thr Gly Leu Phe Ser Lys Lys Tyr Lys Leu Gly Lys Arg Pro
1325 1330 1335
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1340 1345 1350
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro
1355 1360 1365
Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1370 1375 1380
<210> 6
<211> 1576
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Glu Val Glu Phe
1 5 10 15
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
20 25 30
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
35 40 45
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
65 70 75 80
Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
85 90 95
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
100 105 110
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
115 120 125
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
130 135 140
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg
145 150 155 160
Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr
165 170 175
Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
180 185 190
Pro Glu Ser Ser Gly Pro Lys Lys Lys Arg Lys Val Gly Ala Lys Asn
195 200 205
Lys Asp Ile Arg Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
210 215 220
Gly Trp Ala Val Met Asp Glu His Tyr Glu Leu Leu Lys Lys Gly Asn
225 230 235 240
His His Met Trp Gly Ser Arg Leu Phe Asp Ala Ala Glu Pro Ala Ala
245 250 255
Thr Arg Arg Ala Ser Arg Ser Ile Arg Arg Arg Tyr Asn Lys Arg Arg
260 265 270
Glu Arg Ile Arg Leu Leu Arg Asp Leu Leu Gly Asp Met Val Met Glu
275 280 285
Val Asp Pro Thr Phe Phe Ile Arg Leu Leu Asn Val Ser Phe Leu Asp
290 295 300
Glu Glu Asp Lys Gln Lys Asn Leu Gly Asn Asp Tyr Lys Asp Asn Tyr
305 310 315 320
Asn Leu Phe Ile Glu Lys Asp Phe Asn Asp Lys Thr Tyr Tyr Asp Lys
325 330 335
Tyr Pro Thr Ile Tyr His Leu Arg Lys Glu Leu Cys Glu Asn Lys Glu
340 345 350
Lys Ala Asp Pro Arg Leu Ile Tyr Leu Ala Leu His His Ile Val Lys
355 360 365
Tyr Arg Gly Asn Phe Leu Lys Glu Gly Gln Ser Phe Ala Lys Val Tyr
370 375 380
Glu Asp Ile Glu Glu Lys Leu Asp Asn Thr Leu Lys Lys Phe Met Ser
385 390 395 400
Leu Asn Asp Leu Asp Asn Leu Phe Val Asp Asn Asp Ile Asn Ser Met
405 410 415
Ile Thr Val Leu Ser Lys Ile Tyr Gln Arg Ser Lys Lys Ala Asp Asp
420 425 430
Leu Leu Lys Ile Met Asn Pro Thr Lys Glu Glu Arg Ala Ala Tyr Lys
435 440 445
Glu Phe Thr Lys Ala Leu Val Gly Leu Lys Phe Asn Val Ser Lys Met
450 455 460
Ile Leu Ala Gln Glu Val Lys Lys Asp Asp Lys Asp Ile Glu Leu Asp
465 470 475 480
Phe Ser Asn Val Asp Tyr Asp Ser Thr Val Asp Gly Leu Gln Ala Glu
485 490 495
Leu Gly Glu Tyr Ile Glu Phe Ile Glu Met Leu His Ser Ile Asn Ser
500 505 510
Trp Val Glu Leu Gln Asp Ile Leu Gly Asn Asn Ser Thr Ile Ser Ala
515 520 525
Ala Met Val Glu Arg Tyr Glu Glu His Lys Asn Asp Leu Arg Val Leu
530 535 540
Lys Lys Val Ile Arg Glu Glu Leu Pro Asp Lys Tyr Asn Glu Val Phe
545 550 555 560
Arg Glu Asp Asn Pro Lys Leu His Asn Tyr Leu Gly Tyr Ile Lys Tyr
565 570 575
Pro Lys Asn Thr Pro Val Glu Glu Phe Tyr Glu Tyr Ile Lys Arg Leu
580 585 590
Leu Ala Lys Val Asp Thr Gly Glu Ala Arg Glu Ile Leu Glu Arg Ile
595 600 605
Asp Leu Glu Lys Phe Met Leu Lys Gln Asn Ser Arg Thr Asn Gly Ser
610 615 620
Ile Pro Tyr Gln Met Gln Lys Asp Glu Met Ile Gln Ile Ile Asp Asn
625 630 635 640
Gln Ser Val Tyr Tyr Pro Gln Leu Lys Glu Asn Arg Glu Lys Leu Ile
645 650 655
Ser Ile Leu Glu Phe Arg Ile Pro Tyr Tyr Phe Gly Pro Leu Asn Thr
660 665 670
His Ser Glu Phe Ala Trp Ile Lys Lys Phe Glu Asp Lys Gln Lys Glu
675 680 685
Arg Ile Leu Pro Trp Asn Tyr Asp Gln Ile Val Asp Ile Asp Ala Thr
690 695 700
Ala Glu Gly Phe Ile Glu Arg Met Gln Asn Thr Gly Thr Tyr Phe Pro
705 710 715 720
Asp Lys Pro Val Met Ala Lys Asn Ser Leu Thr Val Ser Lys Phe Glu
725 730 735
Val Leu Asn Glu Leu Asn Lys Ile Arg Ile Asn Gly Lys Leu Ile Pro
740 745 750
Val Glu Thr Lys Lys Glu Leu Leu Ser Asp Leu Phe Met Lys Asn Lys
755 760 765
Thr Ile Thr Asp Lys Lys Leu Lys Asp Trp Leu Val Thr His Gln Tyr
770 775 780
Tyr Asp Thr Asn Glu Glu Leu Lys Ile Glu Gly Tyr Gln Lys Asp Leu
785 790 795 800
Gln Phe Ser Thr Ser Leu Ala Pro Trp Ile Asp Phe Thr Lys Ile Phe
805 810 815
Gly Glu Ile Asn Ala Ser Asn Tyr Gln Leu Ile Glu Lys Ile Ile Tyr
820 825 830
Asp Ile Ser Ile Phe Glu Asp Lys Lys Ile Leu Lys Arg Arg Leu Lys
835 840 845
Lys Val Tyr Gln Leu Asp Asp Leu Leu Val Asp Lys Ile Leu Lys Leu
850 855 860
Asn Tyr Thr Gly Trp Ser Arg Leu Ser Glu Lys Leu Leu Thr Gly Ile
865 870 875 880
Lys Ser Lys Asn Ser Lys Glu Thr Ile Leu Ser Ile Leu Glu Asn Ser
885 890 895
Asn Met Asn Leu Met Glu Ile Ile Asn Asp Glu Ser Leu Gly Phe Lys
900 905 910
Gln Ile Ile Glu Glu Ser Asn Lys Lys Asp Ile Glu Gly Pro Phe Arg
915 920 925
Tyr Asp Glu Val Lys Lys Leu Ala Gly Ser Pro Ala Ile Lys Arg Gly
930 935 940
Ile Trp Gln Ala Leu Leu Val Val Gln Glu Ile Thr Lys Phe Met Lys
945 950 955 960
His Glu Pro Ser His Ile Tyr Ile Glu Phe Ala Arg Glu Glu Gln Glu
965 970 975
Lys Val Arg Thr Glu Ser Arg Ile Ala Lys Leu Gln Lys Ile Tyr Lys
980 985 990
Asp Leu Asn Leu Gln Thr Lys Glu Asp Gln Leu Val Tyr Glu Ser Leu
995 1000 1005
Lys Lys Glu Asp Ala Lys Lys Lys Ile Asp Thr Asp Ala Leu Tyr
1010 1015 1020
Leu Tyr Tyr Leu Gln Met Gly Lys Ser Met Tyr Ser Gly Lys Pro
1025 1030 1035
Leu Asp Ile Asp Lys Leu Ser Thr Tyr His Ile Asp His Ile Leu
1040 1045 1050
Pro Arg Ser Leu Ile Lys Asp Asp Ser Leu Asp Asn Arg Val Leu
1055 1060 1065
Val Leu Pro Lys Glu Asn Glu Trp Lys Leu Asp Ser Glu Thr Val
1070 1075 1080
Pro Phe Glu Ile Arg Asn Lys Met Met Gly Phe Trp Gln Lys Leu
1085 1090 1095
His Glu Asn Gly Leu Met Ser Asn Lys Lys Phe Phe Ser Leu Ile
1100 1105 1110
Arg Thr Asp Phe Asn Glu Lys Asp Lys Lys Arg Phe Ile Asn Arg
1115 1120 1125
Gln Leu Val Glu Thr Arg Gln Ile Ile Lys Asn Val Ala Val Ile
1130 1135 1140
Ile Asn Asp His Tyr Thr Asn Thr Asn Val Val Thr Val Arg Ala
1145 1150 1155
Glu Leu Ser His Gln Phe Arg Glu Arg Tyr Lys Ile Tyr Lys Asn
1160 1165 1170
Arg Asp Leu Asn Asp Leu His His Ala His Asp Ala Tyr Ile Ala
1175 1180 1185
Cys Ile Leu Gly Gln Phe Ile His Gln Asn Phe Gly Asn Met Asp
1190 1195 1200
Val Asn Met Ile Tyr Gly Gln Tyr Lys Lys Asn Tyr Lys Lys Asp
1205 1210 1215
Val Gln Glu His Asn Asn Tyr Gly Phe Ile Leu Asn Ser Met Asn
1220 1225 1230
His Ile His Phe Asn Asp Asp Asn Ser Val Ile Trp Asp Pro Ser
1235 1240 1245
Tyr Ile Gly Lys Ile Lys Ser Cys Phe Cys Tyr Lys Asp Val Tyr
1250 1255 1260
Val Thr Lys Lys Leu Glu Gln Asn Asp Ala Lys Leu Phe Asp Leu
1265 1270 1275
Thr Ile Leu Pro Ser Asp Lys Asn Ser Glu Asn Gly Val Thr Lys
1280 1285 1290
Ala Lys Ile Pro Val Asn Lys Tyr Arg Lys Asp Val Asn Lys Tyr
1295 1300 1305
Gly Gly Phe Ser Gly Asp Ala Pro Ile Met Leu Ala Ile Glu Ala
1310 1315 1320
Asp Lys Gly Lys Lys His Val Arg Gln Val Ile Ala Phe Pro Leu
1325 1330 1335
Arg Leu Lys Asn Tyr Asn Asp Glu Glu Arg Ile Lys Phe Ile Glu
1340 1345 1350
Lys Glu Lys Asn Leu Lys Asn Val Lys Ile Leu Thr Glu Val Lys
1355 1360 1365
Lys Asn Gln Leu Ile Leu Ile Asn His Gln Tyr Phe Phe Ile Thr
1370 1375 1380
Gly Thr Asn Glu Leu Val Asn Ala Thr Gln Leu Lys Leu Ser Ala
1385 1390 1395
Lys Asn Thr Lys Asn Leu Phe Asn Leu Val Asp Ala Asn Lys His
1400 1405 1410
Asn Lys Leu Glu Ser Ile Asp Asp Ala Asn Phe Asn Glu Val Ile
1415 1420 1425
Gln Glu Leu Ile Cys Lys Leu Gln Glu Pro Ile Tyr Ser Arg Tyr
1430 1435 1440
Asn Ser Ile Gly Lys Glu Phe Glu Asp Ser Tyr Glu Lys Ile Asn
1445 1450 1455
Ala Val Thr Lys Gln Asp Lys Leu Tyr Ile Ile Glu Tyr Leu Ile
1460 1465 1470
Ala Ile Met Ser Ala Lys Ala Thr Gln Gly Tyr Ile Lys Pro Glu
1475 1480 1485
Leu Ala Arg Glu Ile Gly Thr Asn Gly Lys Asn Lys Gly Arg Ile
1490 1495 1500
Lys Ser Phe Thr Ile Asp Leu Asn Lys Thr Thr Phe Ile Ser Thr
1505 1510 1515
Ser Val Thr Gly Leu Phe Ser Lys Lys Tyr Lys Leu Gly Lys Arg
1520 1525 1530
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1535 1540 1545
Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val
1550 1555 1560
Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1565 1570 1575
<210> 7
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
guuuuagagu uguguuauug aaaaauaaca caacgaguua aaauaaagcu uaugcuuaaa 60
ugccagcuuu gcugguguca uuuagaugac uuuacuaagg uugcuucggc aaccuuuuu 119
<210> 8
<211> 1409
<212> PRT
<213> Veillonella parvula
<400> 8
Met Ser Ile Ile Asn Phe Gln Arg Arg Gly Leu Met Glu Thr Gln Ala
1 5 10 15
Ser Asn Gln Leu Ile Ser Ser His Leu Lys Gly Tyr Pro Ile Lys Asp
20 25 30
Tyr Phe Val Gly Leu Asp Ile Gly Thr Ser Ser Val Gly Trp Ala Val
35 40 45
Thr Asn Lys Ala Tyr Glu Leu Leu Lys Phe Arg Ser His Lys Met Trp
50 55 60
Gly Ser Arg Leu Phe Asp Glu Gly Glu Ser Ala Val Ala Arg Arg Gly
65 70 75 80
Phe Arg Ser Met Arg Arg Arg Leu Glu Arg Arg Lys Leu Arg Leu Lys
85 90 95
Leu Leu Glu Glu Leu Phe Ala Asp Ala Met Ala Gln Val Asp Pro Thr
100 105 110
Phe Phe Met Arg Leu Arg Glu Ser Lys Tyr His Tyr Glu Asp Lys Thr
115 120 125
Thr Gly His Ser Ser Lys His Ile Leu Phe Ile Asp Lys Asn Tyr Asn
130 135 140
Asp Gln Asp Tyr Phe Lys Glu Tyr Pro Thr Val Tyr His Leu Arg Ser
145 150 155 160
Glu Leu Met Lys Ser Gly Thr Asp Asp Ile Arg Lys Leu Phe Leu Ala
165 170 175
Val His His Ile Leu Lys Tyr Arg Gly Asn Phe Leu Tyr Glu Gly Ala
180 185 190
Thr Phe Asp Ser Asn Ala Ser Thr Leu Asp Asp Val Ile Lys Gln Ala
195 200 205
Leu Glu Asn Ile Thr Phe Asn Cys Phe Asp Cys Asn Ser Ala Ile Ser
210 215 220
Ser Ile Gly Gln Ile Leu Met Glu Ala Gly Lys Thr Lys Ser Asp Lys
225 230 235 240
Ala Lys Ala Ile Glu His Leu Val Asp Thr Tyr Ile Ala Thr Asp Thr
245 250 255
Val Asp Thr Ser Ser Lys Thr Gln Lys Asp Gln Val Lys Glu Asp Lys
260 265 270
Lys Arg Leu Lys Ala Phe Ala Asn Leu Val Leu Gly Leu Asn Ala Ser
275 280 285
Leu Ile Asp Leu Phe Gly Ser Val Glu Glu Leu Glu Glu Asp Leu Lys
290 295 300
Lys Leu Gln Ile Thr Gly Asp Thr Tyr Asp Asp Lys Arg Asp Glu Leu
305 310 315 320
Ala Lys Ala Trp Ser Asp Glu Ile Tyr Ile Ile Asp Asp Cys Lys Ser
325 330 335
Val Tyr Asp Ala Ile Ile Leu Leu Ser Ile Lys Glu Pro Gly Leu Thr
340 345 350
Ile Ser Glu Ser Lys Val Lys Ala Phe Asn Lys His Lys Asp Asp Leu
355 360 365
Ala Ile Leu Lys Ser Leu Leu Lys Ser Asp Arg Ser Ile Tyr Asn Thr
370 375 380
Met Phe Lys Val Asp Glu Lys Gly Leu His Asn Tyr Val His Tyr Ile
385 390 395 400
Lys Gln Gly Arg Thr Glu Glu Thr Ser Cys Asn Arg Glu Asp Phe Tyr
405 410 415
Lys Tyr Thr Lys Lys Ile Val Glu Gly Leu Ser Asp Ser Lys Asp Lys
420 425 430
Glu Tyr Ile Leu Ser Gln Ile Glu Leu Gln Ile Leu Leu Pro Leu Gln
435 440 445
Arg Ile Lys Asp Asn Gly Val Ile Pro Tyr Gln Leu His Leu Glu Glu
450 455 460
Leu Lys Ala Ile Leu Ala Lys Cys Gly Pro Lys Phe Pro Phe Leu Asn
465 470 475 480
Glu Val Ala Asp Gly Phe Ser Val Ala Glu Lys Leu Ile Lys Met Leu
485 490 495
Glu Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Thr His His Asn
500 505 510
Val Asp Asn Gly Gly Phe Ala Trp Ala Val Arg Lys Ala Ser Gly Arg
515 520 525
Val Thr Pro Trp Asn Phe Asp Asp Lys Ile Asp Arg Glu Lys Ser Ala
530 535 540
Ala Ala Phe Ile Lys Asn Leu Thr Asn Lys Cys Thr Tyr Leu Leu Gly
545 550 555 560
Glu Asp Val Leu Pro Lys Ser Ser Leu Leu Tyr Ser Glu Phe Met Leu
565 570 575
Leu Asn Glu Leu Asn Asn Val Arg Ile Asp Gly Lys Pro Leu Glu Lys
580 585 590
Val Val Lys Glu His Leu Ile Glu Ala Val Phe Lys Gln Asp His Lys
595 600 605
Lys Met Thr Lys Asn Arg Ile Glu Gln Phe Leu Lys Asp Asn Gly Tyr
610 615 620
Ile Ser Glu Thr His Lys His Glu Ile Thr Gly Leu Asp Gly Glu Ile
625 630 635 640
Lys Asn Asp Leu Ala Ser Tyr Arg Asp Met Val Arg Ile Leu Gly Asp
645 650 655
Gly Phe Asp Arg Ser Met Ala Glu Glu Ile Ile Thr Asp Ile Thr Ile
660 665 670
Phe Gly Glu Ser Lys Lys Met Leu Arg Glu Thr Leu Arg Lys Lys Phe
675 680 685
Ala Ser Cys Leu Asp Asp Glu Ala Ile Lys Lys Leu Thr Lys Leu Arg
690 695 700
Tyr Arg Asp Trp Gly Arg Leu Ser Gln Lys Leu Leu Asn Gly Ile Glu
705 710 715 720
Gly Cys Asp Lys Ala Gly Asp Gly Thr Pro Glu Thr Ile Ile Ile Leu
725 730 735
Met Arg Asn Phe Ser Tyr Asn Leu Met Glu Leu Leu Gly Asp Lys Phe
740 745 750
Ser Phe Met Glu Arg Ile Gln Glu Ile Asn Ala Lys Leu Thr Glu Gly
755 760 765
Gln Ile Val Asn Pro His Asp Ile Ile Asp Asp Leu Ala Leu Ser Pro
770 775 780
Ala Val Lys Arg Ala Val Trp Gln Ala Leu Arg Ile Val Asp Glu Val
785 790 795 800
Ala His Ile Lys Lys Ala Leu Pro Ala Arg Ile Phe Val Glu Val Thr
805 810 815
Arg Ser Asn Lys Asn Glu Lys Lys Lys Lys Asp Ser Arg Gln Lys Arg
820 825 830
Leu Ser Asp Leu Tyr Ala Ala Ile Lys Lys Asp Asp Val Leu Leu Asn
835 840 845
Gly Leu Asn Asn Glu Ile Phe Gly Glu Leu Lys Ser Ser Leu Ala Lys
850 855 860
Tyr Asp Asp Ala Ala Leu Arg Ser Lys Lys Leu Tyr Leu Tyr Tyr Thr
865 870 875 880
Gln Met Gly Arg Cys Ala Tyr Thr Gly Glu Ile Ile Glu Leu Ser Leu
885 890 895
Leu Asn Thr Asp Asn Tyr Asp Ile Asp His Ile Tyr Pro Arg Ser Leu
900 905 910
Thr Lys Asp Asp Ser Phe Asp Asn Leu Val Leu Cys Lys Arg Thr Ala
915 920 925
Asn Ala Gln Lys Ser Asp Ala Tyr Pro Ile Ser Glu Glu Ile Gln Lys
930 935 940
Thr Gln Lys Pro Phe Trp Thr Phe Leu Lys Gln Gln Gly Leu Ile Ser
945 950 955 960
Glu Arg Lys Tyr Glu Arg Leu Thr Arg Ile Thr Pro Leu Thr Ala Asp
965 970 975
Asp Leu Ser Gly Phe Ile Ala Arg Gln Leu Val Glu Thr Asn Gln Ser
980 985 990
Val Lys Ala Ala Thr Thr Leu Leu Arg Arg Leu Tyr Pro Gly Val Asp
995 1000 1005
Val Val Phe Val Lys Ala Glu Asn Val Thr Asp Phe Arg His Asp
1010 1015 1020
Asn Asn Phe Ile Lys Val Arg Ser Leu Asn His His His His Ala
1025 1030 1035
Lys Asp Ala Tyr Leu Asn Ile Val Val Gly Asn Val Tyr His Glu
1040 1045 1050
Arg Phe Thr Arg Asn Phe Arg Ala Phe Phe Lys Lys Asn Gly Ala
1055 1060 1065
Asn Arg Thr Tyr Asn Leu Ala Lys Met Phe Asn Tyr Asp Val Asn
1070 1075 1080
Cys Thr Asn Ala Lys Asp Gly Lys Ala Trp Asp Val Lys Thr Ser
1085 1090 1095
Met Asp Thr Val Lys Lys Met Met Asp Ser Asn Asp Val Arg Val
1100 1105 1110
Thr Lys Arg Leu Leu Glu Gln Thr Gly Ala Leu Ala Asp Ala Thr
1115 1120 1125
Ile Tyr Lys Ala Thr Val Ala Gly Lys Ala Lys Asp Gly Ala Tyr
1130 1135 1140
Ile Gly Met Lys Thr Lys Ser Ser Val Phe Ala Asp Val Ser Lys
1145 1150 1155
Tyr Gly Gly Met Thr Lys Ile Lys Asn Ala Tyr Ser Ile Ile Val
1160 1165 1170
Gln Tyr Thr Gly Lys Lys Gly Glu Val Ile Lys Glu Ile Val Pro
1175 1180 1185
Leu Pro Ile Tyr Leu Thr Asn Arg Asn Thr Thr Asp Gln Asp Leu
1190 1195 1200
Ile Asn Tyr Val Ala Ser Ile Ile Pro Gln Ala Lys Asp Ile Ser
1205 1210 1215
Ile Ile Tyr Gly Lys Leu Cys Ile Asn Gln Leu Val Lys Val Asn
1220 1225 1230
Gly Phe Tyr Tyr Tyr Leu Gly Gly Lys Thr Asn Ser Lys Phe Cys
1235 1240 1245
Ile Asp Asn Ala Ile Gln Val Ile Val Ser Asn Glu Trp Ile Pro
1250 1255 1260
Tyr Leu Lys Val Leu Glu Lys Phe Asn Asn Met Arg Lys Asp Asn
1265 1270 1275
Lys Asp Leu Lys Ala Asn Val Val Ser Thr Arg Ala Leu Asp Asn
1280 1285 1290
Lys His Thr Ile Glu Val Arg Ile Val Glu Glu Lys Asn Ile Glu
1295 1300 1305
Phe Phe Asp Tyr Leu Val Ser Lys Leu Lys Met Pro Ile Tyr Gln
1310 1315 1320
Lys Met Lys Gly Asn Lys Ala Ala Glu Leu Ser Glu Lys Gly Tyr
1325 1330 1335
Gly Leu Phe Lys Lys Met Ser Leu Glu Glu Gln Ser Ile His Leu
1340 1345 1350
Ile Glu Leu Leu Asn Leu Leu Thr Asn Gln Lys Thr Thr Phe Glu
1355 1360 1365
Val Lys Pro Leu Gly Ile Thr Ala Ser Arg Ser Thr Val Gly Ser
1370 1375 1380
Lys Ile Ser Asn Gln Asp Glu Phe Lys Val Ile Asn Glu Ser Ile
1385 1390 1395
Thr Gly Leu Tyr Ser Asn Glu Val Thr Ile Val
1400 1405
<210> 9
<211> 1463
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 9
Met Pro Lys Lys Lys Arg Lys Val Gly Ser Ile Ile Asn Phe Gln Arg
1 5 10 15
Arg Gly Leu Met Glu Thr Gln Ala Ser Asn Gln Leu Ile Ser Ser His
20 25 30
Leu Lys Gly Tyr Pro Ile Lys Asp Tyr Phe Val Gly Leu Asp Ile Gly
35 40 45
Thr Ser Ser Val Gly Trp Ala Val Thr Asn Lys Ala Tyr Glu Leu Leu
50 55 60
Lys Phe Arg Ser His Lys Met Trp Gly Ser Arg Leu Phe Asp Glu Gly
65 70 75 80
Glu Ser Ala Val Ala Arg Arg Gly Phe Arg Ser Met Arg Arg Arg Leu
85 90 95
Glu Arg Arg Lys Leu Arg Leu Lys Leu Leu Glu Glu Leu Phe Ala Asp
100 105 110
Ala Met Ala Gln Val Asp Pro Thr Phe Phe Met Arg Leu Arg Glu Ser
115 120 125
Lys Tyr His Tyr Glu Asp Lys Thr Thr Gly His Ser Ser Lys His Ile
130 135 140
Leu Phe Ile Asp Lys Asn Tyr Asn Asp Gln Asp Tyr Phe Lys Glu Tyr
145 150 155 160
Pro Thr Val Tyr His Leu Arg Ser Glu Leu Met Lys Ser Gly Thr Asp
165 170 175
Asp Ile Arg Lys Leu Phe Leu Ala Val His His Ile Leu Lys Tyr Arg
180 185 190
Gly Asn Phe Leu Tyr Glu Gly Ala Thr Phe Asp Ser Asn Ala Ser Thr
195 200 205
Leu Asp Asp Val Ile Lys Gln Ala Leu Glu Asn Ile Thr Phe Asn Cys
210 215 220
Phe Asp Cys Asn Ser Ala Ile Ser Ser Ile Gly Gln Ile Leu Met Glu
225 230 235 240
Ala Gly Lys Thr Lys Ser Asp Lys Ala Lys Ala Ile Glu His Leu Val
245 250 255
Asp Thr Tyr Ile Ala Thr Asp Thr Val Asp Thr Ser Ser Lys Thr Gln
260 265 270
Lys Asp Gln Val Lys Glu Asp Lys Lys Arg Leu Lys Ala Phe Ala Asn
275 280 285
Leu Val Leu Gly Leu Asn Ala Ser Leu Ile Asp Leu Phe Gly Ser Val
290 295 300
Glu Glu Leu Glu Glu Asp Leu Lys Lys Leu Gln Ile Thr Gly Asp Thr
305 310 315 320
Tyr Asp Asp Lys Arg Asp Glu Leu Ala Lys Ala Trp Ser Asp Glu Ile
325 330 335
Tyr Ile Ile Asp Asp Cys Lys Ser Val Tyr Asp Ala Ile Ile Leu Leu
340 345 350
Ser Ile Lys Glu Pro Gly Leu Thr Ile Ser Glu Ser Lys Val Lys Ala
355 360 365
Phe Asn Lys His Lys Asp Asp Leu Ala Ile Leu Lys Ser Leu Leu Lys
370 375 380
Ser Asp Arg Ser Ile Tyr Asn Thr Met Phe Lys Val Asp Glu Lys Gly
385 390 395 400
Leu His Asn Tyr Val His Tyr Ile Lys Gln Gly Arg Thr Glu Glu Thr
405 410 415
Ser Cys Asn Arg Glu Asp Phe Tyr Lys Tyr Thr Lys Lys Ile Val Glu
420 425 430
Gly Leu Ser Asp Ser Lys Asp Lys Glu Tyr Ile Leu Ser Gln Ile Glu
435 440 445
Leu Gln Ile Leu Leu Pro Leu Gln Arg Ile Lys Asp Asn Gly Val Ile
450 455 460
Pro Tyr Gln Leu His Leu Glu Glu Leu Lys Ala Ile Leu Ala Lys Cys
465 470 475 480
Gly Pro Lys Phe Pro Phe Leu Asn Glu Val Ala Asp Gly Phe Ser Val
485 490 495
Ala Glu Lys Leu Ile Lys Met Leu Glu Phe Arg Ile Pro Tyr Tyr Val
500 505 510
Gly Pro Leu Asn Thr His His Asn Val Asp Asn Gly Gly Phe Ala Trp
515 520 525
Ala Val Arg Lys Ala Ser Gly Arg Val Thr Pro Trp Asn Phe Asp Asp
530 535 540
Lys Ile Asp Arg Glu Lys Ser Ala Ala Ala Phe Ile Lys Asn Leu Thr
545 550 555 560
Asn Lys Cys Thr Tyr Leu Leu Gly Glu Asp Val Leu Pro Lys Ser Ser
565 570 575
Leu Leu Tyr Ser Glu Phe Met Leu Leu Asn Glu Leu Asn Asn Val Arg
580 585 590
Ile Asp Gly Lys Pro Leu Glu Lys Val Val Lys Glu His Leu Ile Glu
595 600 605
Ala Val Phe Lys Gln Asp His Lys Lys Met Thr Lys Asn Arg Ile Glu
610 615 620
Gln Phe Leu Lys Asp Asn Gly Tyr Ile Ser Glu Thr His Lys His Glu
625 630 635 640
Ile Thr Gly Leu Asp Gly Glu Ile Lys Asn Asp Leu Ala Ser Tyr Arg
645 650 655
Asp Met Val Arg Ile Leu Gly Asp Gly Phe Asp Arg Ser Met Ala Glu
660 665 670
Glu Ile Ile Thr Asp Ile Thr Ile Phe Gly Glu Ser Lys Lys Met Leu
675 680 685
Arg Glu Thr Leu Arg Lys Lys Phe Ala Ser Cys Leu Asp Asp Glu Ala
690 695 700
Ile Lys Lys Leu Thr Lys Leu Arg Tyr Arg Asp Trp Gly Arg Leu Ser
705 710 715 720
Gln Lys Leu Leu Asn Gly Ile Glu Gly Cys Asp Lys Ala Gly Asp Gly
725 730 735
Thr Pro Glu Thr Ile Ile Ile Leu Met Arg Asn Phe Ser Tyr Asn Leu
740 745 750
Met Glu Leu Leu Gly Asp Lys Phe Ser Phe Met Glu Arg Ile Gln Glu
755 760 765
Ile Asn Ala Lys Leu Thr Glu Gly Gln Ile Val Asn Pro His Asp Ile
770 775 780
Ile Asp Asp Leu Ala Leu Ser Pro Ala Val Lys Arg Ala Val Trp Gln
785 790 795 800
Ala Leu Arg Ile Val Asp Glu Val Ala His Ile Lys Lys Ala Leu Pro
805 810 815
Ala Arg Ile Phe Val Glu Val Thr Arg Ser Asn Lys Asn Glu Lys Lys
820 825 830
Lys Lys Asp Ser Arg Gln Lys Arg Leu Ser Asp Leu Tyr Ala Ala Ile
835 840 845
Lys Lys Asp Asp Val Leu Leu Asn Gly Leu Asn Asn Glu Ile Phe Gly
850 855 860
Glu Leu Lys Ser Ser Leu Ala Lys Tyr Asp Asp Ala Ala Leu Arg Ser
865 870 875 880
Lys Lys Leu Tyr Leu Tyr Tyr Thr Gln Met Gly Arg Cys Ala Tyr Thr
885 890 895
Gly Glu Ile Ile Glu Leu Ser Leu Leu Asn Thr Asp Asn Tyr Asp Ile
900 905 910
Asp His Ile Tyr Pro Arg Ser Leu Thr Lys Asp Asp Ser Phe Asp Asn
915 920 925
Leu Val Leu Cys Lys Arg Thr Ala Asn Ala Gln Lys Ser Asp Ala Tyr
930 935 940
Pro Ile Ser Glu Glu Ile Gln Lys Thr Gln Lys Pro Phe Trp Thr Phe
945 950 955 960
Leu Lys Gln Gln Gly Leu Ile Ser Glu Arg Lys Tyr Glu Arg Leu Thr
965 970 975
Arg Ile Thr Pro Leu Thr Ala Asp Asp Leu Ser Gly Phe Ile Ala Arg
980 985 990
Gln Leu Val Glu Thr Asn Gln Ser Val Lys Ala Ala Thr Thr Leu Leu
995 1000 1005
Arg Arg Leu Tyr Pro Gly Val Asp Val Val Phe Val Lys Ala Glu
1010 1015 1020
Asn Val Thr Asp Phe Arg His Asp Asn Asn Phe Ile Lys Val Arg
1025 1030 1035
Ser Leu Asn His His His His Ala Lys Asp Ala Tyr Leu Asn Ile
1040 1045 1050
Val Val Gly Asn Val Tyr His Glu Arg Phe Thr Arg Asn Phe Arg
1055 1060 1065
Ala Phe Phe Lys Lys Asn Gly Ala Asn Arg Thr Tyr Asn Leu Ala
1070 1075 1080
Lys Met Phe Asn Tyr Asp Val Asn Cys Thr Asn Ala Lys Asp Gly
1085 1090 1095
Lys Ala Trp Asp Val Lys Thr Ser Met Asp Thr Val Lys Lys Met
1100 1105 1110
Met Asp Ser Asn Asp Val Arg Val Thr Lys Arg Leu Leu Glu Gln
1115 1120 1125
Thr Gly Ala Leu Ala Asp Ala Thr Ile Tyr Lys Ala Thr Val Ala
1130 1135 1140
Gly Lys Ala Lys Asp Gly Ala Tyr Ile Gly Met Lys Thr Lys Ser
1145 1150 1155
Ser Val Phe Ala Asp Val Ser Lys Tyr Gly Gly Met Thr Lys Ile
1160 1165 1170
Lys Asn Ala Tyr Ser Ile Ile Val Gln Tyr Thr Gly Lys Lys Gly
1175 1180 1185
Glu Val Ile Lys Glu Ile Val Pro Leu Pro Ile Tyr Leu Thr Asn
1190 1195 1200
Arg Asn Thr Thr Asp Gln Asp Leu Ile Asn Tyr Val Ala Ser Ile
1205 1210 1215
Ile Pro Gln Ala Lys Asp Ile Ser Ile Ile Tyr Gly Lys Leu Cys
1220 1225 1230
Ile Asn Gln Leu Val Lys Val Asn Gly Phe Tyr Tyr Tyr Leu Gly
1235 1240 1245
Gly Lys Thr Asn Ser Lys Phe Cys Ile Asp Asn Ala Ile Gln Val
1250 1255 1260
Ile Val Ser Asn Glu Trp Ile Pro Tyr Leu Lys Val Leu Glu Lys
1265 1270 1275
Phe Asn Asn Met Arg Lys Asp Asn Lys Asp Leu Lys Ala Asn Val
1280 1285 1290
Val Ser Thr Arg Ala Leu Asp Asn Lys His Thr Ile Glu Val Arg
1295 1300 1305
Ile Val Glu Glu Lys Asn Ile Glu Phe Phe Asp Tyr Leu Val Ser
1310 1315 1320
Lys Leu Lys Met Pro Ile Tyr Gln Lys Met Lys Gly Asn Lys Ala
1325 1330 1335
Ala Glu Leu Ser Glu Lys Gly Tyr Gly Leu Phe Lys Lys Met Ser
1340 1345 1350
Leu Glu Glu Gln Ser Ile His Leu Ile Glu Leu Leu Asn Leu Leu
1355 1360 1365
Thr Asn Gln Lys Thr Thr Phe Glu Val Lys Pro Leu Gly Ile Thr
1370 1375 1380
Ala Ser Arg Ser Thr Val Gly Ser Lys Ile Ser Asn Gln Asp Glu
1385 1390 1395
Phe Lys Val Ile Asn Glu Ser Ile Thr Gly Leu Tyr Ser Asn Glu
1400 1405 1410
Val Thr Ile Val Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1415 1420 1425
Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp
1430 1435 1440
Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp
1445 1450 1455
Val Pro Asp Tyr Ala
1460
<210> 10
<211> 1659
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 10
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Glu Val Glu Phe
1 5 10 15
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
20 25 30
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
35 40 45
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
65 70 75 80
Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
85 90 95
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
100 105 110
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
115 120 125
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
130 135 140
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg
145 150 155 160
Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr
165 170 175
Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
180 185 190
Pro Glu Ser Ser Gly Pro Lys Lys Lys Arg Lys Val Gly Ser Ile Ile
195 200 205
Asn Phe Gln Arg Arg Gly Leu Met Glu Thr Gln Ala Ser Asn Gln Leu
210 215 220
Ile Ser Ser His Leu Lys Gly Tyr Pro Ile Lys Asp Tyr Phe Val Gly
225 230 235 240
Leu Ala Ile Gly Thr Ser Ser Val Gly Trp Ala Val Thr Asn Lys Ala
245 250 255
Tyr Glu Leu Leu Lys Phe Arg Ser His Lys Met Trp Gly Ser Arg Leu
260 265 270
Phe Asp Glu Gly Glu Ser Ala Val Ala Arg Arg Gly Phe Arg Ser Met
275 280 285
Arg Arg Arg Leu Glu Arg Arg Lys Leu Arg Leu Lys Leu Leu Glu Glu
290 295 300
Leu Phe Ala Asp Ala Met Ala Gln Val Asp Pro Thr Phe Phe Met Arg
305 310 315 320
Leu Arg Glu Ser Lys Tyr His Tyr Glu Asp Lys Thr Thr Gly His Ser
325 330 335
Ser Lys His Ile Leu Phe Ile Asp Lys Asn Tyr Asn Asp Gln Asp Tyr
340 345 350
Phe Lys Glu Tyr Pro Thr Val Tyr His Leu Arg Ser Glu Leu Met Lys
355 360 365
Ser Gly Thr Asp Asp Ile Arg Lys Leu Phe Leu Ala Val His His Ile
370 375 380
Leu Lys Tyr Arg Gly Asn Phe Leu Tyr Glu Gly Ala Thr Phe Asp Ser
385 390 395 400
Asn Ala Ser Thr Leu Asp Asp Val Ile Lys Gln Ala Leu Glu Asn Ile
405 410 415
Thr Phe Asn Cys Phe Asp Cys Asn Ser Ala Ile Ser Ser Ile Gly Gln
420 425 430
Ile Leu Met Glu Ala Gly Lys Thr Lys Ser Asp Lys Ala Lys Ala Ile
435 440 445
Glu His Leu Val Asp Thr Tyr Ile Ala Thr Asp Thr Val Asp Thr Ser
450 455 460
Ser Lys Thr Gln Lys Asp Gln Val Lys Glu Asp Lys Lys Arg Leu Lys
465 470 475 480
Ala Phe Ala Asn Leu Val Leu Gly Leu Asn Ala Ser Leu Ile Asp Leu
485 490 495
Phe Gly Ser Val Glu Glu Leu Glu Glu Asp Leu Lys Lys Leu Gln Ile
500 505 510
Thr Gly Asp Thr Tyr Asp Asp Lys Arg Asp Glu Leu Ala Lys Ala Trp
515 520 525
Ser Asp Glu Ile Tyr Ile Ile Asp Asp Cys Lys Ser Val Tyr Asp Ala
530 535 540
Ile Ile Leu Leu Ser Ile Lys Glu Pro Gly Leu Thr Ile Ser Glu Ser
545 550 555 560
Lys Val Lys Ala Phe Asn Lys His Lys Asp Asp Leu Ala Ile Leu Lys
565 570 575
Ser Leu Leu Lys Ser Asp Arg Ser Ile Tyr Asn Thr Met Phe Lys Val
580 585 590
Asp Glu Lys Gly Leu His Asn Tyr Val His Tyr Ile Lys Gln Gly Arg
595 600 605
Thr Glu Glu Thr Ser Cys Asn Arg Glu Asp Phe Tyr Lys Tyr Thr Lys
610 615 620
Lys Ile Val Glu Gly Leu Ser Asp Ser Lys Asp Lys Glu Tyr Ile Leu
625 630 635 640
Ser Gln Ile Glu Leu Gln Ile Leu Leu Pro Leu Gln Arg Ile Lys Asp
645 650 655
Asn Gly Val Ile Pro Tyr Gln Leu His Leu Glu Glu Leu Lys Ala Ile
660 665 670
Leu Ala Lys Cys Gly Pro Lys Phe Pro Phe Leu Asn Glu Val Ala Asp
675 680 685
Gly Phe Ser Val Ala Glu Lys Leu Ile Lys Met Leu Glu Phe Arg Ile
690 695 700
Pro Tyr Tyr Val Gly Pro Leu Asn Thr His His Asn Val Asp Asn Gly
705 710 715 720
Gly Phe Ala Trp Ala Val Arg Lys Ala Ser Gly Arg Val Thr Pro Trp
725 730 735
Asn Phe Asp Asp Lys Ile Asp Arg Glu Lys Ser Ala Ala Ala Phe Ile
740 745 750
Lys Asn Leu Thr Asn Lys Cys Thr Tyr Leu Leu Gly Glu Asp Val Leu
755 760 765
Pro Lys Ser Ser Leu Leu Tyr Ser Glu Phe Met Leu Leu Asn Glu Leu
770 775 780
Asn Asn Val Arg Ile Asp Gly Lys Pro Leu Glu Lys Val Val Lys Glu
785 790 795 800
His Leu Ile Glu Ala Val Phe Lys Gln Asp His Lys Lys Met Thr Lys
805 810 815
Asn Arg Ile Glu Gln Phe Leu Lys Asp Asn Gly Tyr Ile Ser Glu Thr
820 825 830
His Lys His Glu Ile Thr Gly Leu Asp Gly Glu Ile Lys Asn Asp Leu
835 840 845
Ala Ser Tyr Arg Asp Met Val Arg Ile Leu Gly Asp Gly Phe Asp Arg
850 855 860
Ser Met Ala Glu Glu Ile Ile Thr Asp Ile Thr Ile Phe Gly Glu Ser
865 870 875 880
Lys Lys Met Leu Arg Glu Thr Leu Arg Lys Lys Phe Ala Ser Cys Leu
885 890 895
Asp Asp Glu Ala Ile Lys Lys Leu Thr Lys Leu Arg Tyr Arg Asp Trp
900 905 910
Gly Arg Leu Ser Gln Lys Leu Leu Asn Gly Ile Glu Gly Cys Asp Lys
915 920 925
Ala Gly Asp Gly Thr Pro Glu Thr Ile Ile Ile Leu Met Arg Asn Phe
930 935 940
Ser Tyr Asn Leu Met Glu Leu Leu Gly Asp Lys Phe Ser Phe Met Glu
945 950 955 960
Arg Ile Gln Glu Ile Asn Ala Lys Leu Thr Glu Gly Gln Ile Val Asn
965 970 975
Pro His Asp Ile Ile Asp Asp Leu Ala Leu Ser Pro Ala Val Lys Arg
980 985 990
Ala Val Trp Gln Ala Leu Arg Ile Val Asp Glu Val Ala His Ile Lys
995 1000 1005
Lys Ala Leu Pro Ala Arg Ile Phe Val Glu Val Thr Arg Ser Asn
1010 1015 1020
Lys Asn Glu Lys Lys Lys Lys Asp Ser Arg Gln Lys Arg Leu Ser
1025 1030 1035
Asp Leu Tyr Ala Ala Ile Lys Lys Asp Asp Val Leu Leu Asn Gly
1040 1045 1050
Leu Asn Asn Glu Ile Phe Gly Glu Leu Lys Ser Ser Leu Ala Lys
1055 1060 1065
Tyr Asp Asp Ala Ala Leu Arg Ser Lys Lys Leu Tyr Leu Tyr Tyr
1070 1075 1080
Thr Gln Met Gly Arg Cys Ala Tyr Thr Gly Glu Ile Ile Glu Leu
1085 1090 1095
Ser Leu Leu Asn Thr Asp Asn Tyr Asp Ile Asp His Ile Tyr Pro
1100 1105 1110
Arg Ser Leu Thr Lys Asp Asp Ser Phe Asp Asn Leu Val Leu Cys
1115 1120 1125
Lys Arg Thr Ala Asn Ala Gln Lys Ser Asp Ala Tyr Pro Ile Ser
1130 1135 1140
Glu Glu Ile Gln Lys Thr Gln Lys Pro Phe Trp Thr Phe Leu Lys
1145 1150 1155
Gln Gln Gly Leu Ile Ser Glu Arg Lys Tyr Glu Arg Leu Thr Arg
1160 1165 1170
Ile Thr Pro Leu Thr Ala Asp Asp Leu Ser Gly Phe Ile Ala Arg
1175 1180 1185
Gln Leu Val Glu Thr Asn Gln Ser Val Lys Ala Ala Thr Thr Leu
1190 1195 1200
Leu Arg Arg Leu Tyr Pro Gly Val Asp Val Val Phe Val Lys Ala
1205 1210 1215
Glu Asn Val Thr Asp Phe Arg His Asp Asn Asn Phe Ile Lys Val
1220 1225 1230
Arg Ser Leu Asn His His His His Ala Lys Asp Ala Tyr Leu Asn
1235 1240 1245
Ile Val Val Gly Asn Val Tyr His Glu Arg Phe Thr Arg Asn Phe
1250 1255 1260
Arg Ala Phe Phe Lys Lys Asn Gly Ala Asn Arg Thr Tyr Asn Leu
1265 1270 1275
Ala Lys Met Phe Asn Tyr Asp Val Asn Cys Thr Asn Ala Lys Asp
1280 1285 1290
Gly Lys Ala Trp Asp Val Lys Thr Ser Met Asp Thr Val Lys Lys
1295 1300 1305
Met Met Asp Ser Asn Asp Val Arg Val Thr Lys Arg Leu Leu Glu
1310 1315 1320
Gln Thr Gly Ala Leu Ala Asp Ala Thr Ile Tyr Lys Ala Thr Val
1325 1330 1335
Ala Gly Lys Ala Lys Asp Gly Ala Tyr Ile Gly Met Lys Thr Lys
1340 1345 1350
Ser Ser Val Phe Ala Asp Val Ser Lys Tyr Gly Gly Met Thr Lys
1355 1360 1365
Ile Lys Asn Ala Tyr Ser Ile Ile Val Gln Tyr Thr Gly Lys Lys
1370 1375 1380
Gly Glu Val Ile Lys Glu Ile Val Pro Leu Pro Ile Tyr Leu Thr
1385 1390 1395
Asn Arg Asn Thr Thr Asp Gln Asp Leu Ile Asn Tyr Val Ala Ser
1400 1405 1410
Ile Ile Pro Gln Ala Lys Asp Ile Ser Ile Ile Tyr Gly Lys Leu
1415 1420 1425
Cys Ile Asn Gln Leu Val Lys Val Asn Gly Phe Tyr Tyr Tyr Leu
1430 1435 1440
Gly Gly Lys Thr Asn Ser Lys Phe Cys Ile Asp Asn Ala Ile Gln
1445 1450 1455
Val Ile Val Ser Asn Glu Trp Ile Pro Tyr Leu Lys Val Leu Glu
1460 1465 1470
Lys Phe Asn Asn Met Arg Lys Asp Asn Lys Asp Leu Lys Ala Asn
1475 1480 1485
Val Val Ser Thr Arg Ala Leu Asp Asn Lys His Thr Ile Glu Val
1490 1495 1500
Arg Ile Val Glu Glu Lys Asn Ile Glu Phe Phe Asp Tyr Leu Val
1505 1510 1515
Ser Lys Leu Lys Met Pro Ile Tyr Gln Lys Met Lys Gly Asn Lys
1520 1525 1530
Ala Ala Glu Leu Ser Glu Lys Gly Tyr Gly Leu Phe Lys Lys Met
1535 1540 1545
Ser Leu Glu Glu Gln Ser Ile His Leu Ile Glu Leu Leu Asn Leu
1550 1555 1560
Leu Thr Asn Gln Lys Thr Thr Phe Glu Val Lys Pro Leu Gly Ile
1565 1570 1575
Thr Ala Ser Arg Ser Thr Val Gly Ser Lys Ile Ser Asn Gln Asp
1580 1585 1590
Glu Phe Lys Val Ile Asn Glu Ser Ile Thr Gly Leu Tyr Ser Asn
1595 1600 1605
Glu Val Thr Ile Val Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1610 1615 1620
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
1625 1630 1635
Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr
1640 1645 1650
Asp Val Pro Asp Tyr Ala
1655
<210> 11
<211> 1654
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 11
Met Pro Lys Lys Lys Arg Lys Val Ser Ile Ile Asn Phe Gln Arg Arg
1 5 10 15
Gly Leu Met Glu Thr Gln Ala Ser Asn Gln Leu Ile Ser Ser His Leu
20 25 30
Lys Gly Tyr Pro Ile Lys Asp Tyr Phe Val Gly Leu Ala Ile Gly Thr
35 40 45
Ser Ser Val Gly Trp Ala Val Thr Asn Lys Ala Tyr Glu Leu Leu Lys
50 55 60
Phe Arg Ser His Lys Met Trp Gly Ser Arg Leu Phe Asp Glu Gly Glu
65 70 75 80
Ser Ala Val Ala Arg Arg Gly Phe Arg Ser Met Arg Arg Arg Leu Glu
85 90 95
Arg Arg Lys Leu Arg Leu Lys Leu Leu Glu Glu Leu Phe Ala Asp Ala
100 105 110
Met Ala Gln Val Asp Pro Thr Phe Phe Met Arg Leu Arg Glu Ser Lys
115 120 125
Tyr His Tyr Glu Asp Lys Thr Thr Gly His Ser Ser Lys His Ile Leu
130 135 140
Phe Ile Asp Lys Asn Tyr Asn Asp Gln Asp Tyr Phe Lys Glu Tyr Pro
145 150 155 160
Thr Val Tyr His Leu Arg Ser Glu Leu Met Lys Ser Gly Thr Asp Asp
165 170 175
Ile Arg Lys Leu Phe Leu Ala Val His His Ile Leu Lys Tyr Arg Gly
180 185 190
Asn Phe Leu Tyr Glu Gly Ala Thr Phe Asp Ser Asn Ala Ser Thr Leu
195 200 205
Asp Asp Val Ile Lys Gln Ala Leu Glu Asn Ile Thr Phe Asn Cys Phe
210 215 220
Asp Cys Asn Ser Ala Ile Ser Ser Ile Gly Gln Ile Leu Met Glu Ala
225 230 235 240
Gly Lys Thr Lys Ser Asp Lys Ala Lys Ala Ile Glu His Leu Val Asp
245 250 255
Thr Tyr Ile Ala Thr Asp Thr Val Asp Thr Ser Ser Lys Thr Gln Lys
260 265 270
Asp Gln Val Lys Glu Asp Lys Lys Arg Leu Lys Ala Phe Ala Asn Leu
275 280 285
Val Leu Gly Leu Asn Ala Ser Leu Ile Asp Leu Phe Gly Ser Val Glu
290 295 300
Glu Leu Glu Glu Asp Leu Lys Lys Leu Gln Ile Thr Gly Asp Thr Tyr
305 310 315 320
Asp Asp Lys Arg Asp Glu Leu Ala Lys Ala Trp Ser Asp Glu Ile Tyr
325 330 335
Ile Ile Asp Asp Cys Lys Ser Val Tyr Asp Ala Ile Ile Leu Leu Ser
340 345 350
Ile Lys Glu Pro Gly Leu Thr Ile Ser Glu Ser Lys Val Lys Ala Phe
355 360 365
Asn Lys His Lys Asp Asp Leu Ala Ile Leu Lys Ser Leu Leu Lys Ser
370 375 380
Asp Arg Ser Ile Tyr Asn Thr Met Phe Lys Val Asp Glu Lys Gly Leu
385 390 395 400
His Asn Tyr Val His Tyr Ile Lys Gln Gly Arg Thr Glu Glu Thr Ser
405 410 415
Cys Asn Arg Glu Asp Phe Tyr Lys Tyr Thr Lys Lys Ile Val Glu Gly
420 425 430
Leu Ser Asp Ser Lys Asp Lys Glu Tyr Ile Leu Ser Gln Ile Glu Leu
435 440 445
Gln Ile Leu Leu Pro Leu Gln Arg Ile Lys Asp Asn Gly Val Ile Pro
450 455 460
Tyr Gln Leu His Leu Glu Glu Leu Lys Ala Ile Leu Ala Lys Cys Gly
465 470 475 480
Pro Lys Phe Pro Phe Leu Asn Glu Val Ala Asp Gly Phe Ser Val Ala
485 490 495
Glu Lys Leu Ile Lys Met Leu Glu Phe Arg Ile Pro Tyr Tyr Val Gly
500 505 510
Pro Leu Asn Thr His His Asn Val Asp Asn Gly Gly Phe Ala Trp Ala
515 520 525
Val Arg Lys Ala Ser Gly Arg Val Thr Pro Trp Asn Phe Asp Asp Lys
530 535 540
Ile Asp Arg Glu Lys Ser Ala Ala Ala Phe Ile Lys Asn Leu Thr Asn
545 550 555 560
Lys Cys Thr Tyr Leu Leu Gly Glu Asp Val Leu Pro Lys Ser Ser Leu
565 570 575
Leu Tyr Ser Glu Phe Met Leu Leu Asn Glu Leu Asn Asn Val Arg Ile
580 585 590
Asp Gly Lys Pro Leu Glu Lys Val Val Lys Glu His Leu Ile Glu Ala
595 600 605
Val Phe Lys Gln Asp His Lys Lys Met Thr Lys Asn Arg Ile Glu Gln
610 615 620
Phe Leu Lys Asp Asn Gly Tyr Ile Ser Glu Thr His Lys His Glu Ile
625 630 635 640
Thr Gly Leu Asp Gly Glu Ile Lys Asn Asp Leu Ala Ser Tyr Arg Asp
645 650 655
Met Val Arg Ile Leu Gly Asp Gly Phe Asp Arg Ser Met Ala Glu Glu
660 665 670
Ile Ile Thr Asp Ile Thr Ile Phe Gly Glu Ser Lys Lys Met Leu Arg
675 680 685
Glu Thr Leu Arg Lys Lys Phe Ala Ser Cys Leu Asp Asp Glu Ala Ile
690 695 700
Lys Lys Leu Thr Lys Leu Arg Tyr Arg Asp Trp Gly Arg Leu Ser Gln
705 710 715 720
Lys Leu Leu Asn Gly Ile Glu Gly Cys Asp Lys Ala Gly Asp Gly Thr
725 730 735
Pro Glu Thr Ile Ile Ile Leu Met Arg Asn Phe Ser Tyr Asn Leu Met
740 745 750
Glu Leu Leu Gly Asp Lys Phe Ser Phe Met Glu Arg Ile Gln Glu Ile
755 760 765
Asn Ala Lys Leu Thr Glu Gly Gln Ile Val Asn Pro His Asp Ile Ile
770 775 780
Asp Asp Leu Ala Leu Ser Pro Ala Val Lys Arg Ala Val Trp Gln Ala
785 790 795 800
Leu Arg Ile Val Asp Glu Val Ala His Ile Lys Lys Ala Leu Pro Ala
805 810 815
Arg Ile Phe Val Glu Val Thr Arg Ser Asn Lys Asn Glu Lys Lys Lys
820 825 830
Lys Asp Ser Arg Gln Lys Arg Leu Ser Asp Leu Tyr Ala Ala Ile Lys
835 840 845
Lys Asp Asp Val Leu Leu Asn Gly Leu Asn Asn Glu Ile Phe Gly Glu
850 855 860
Leu Lys Ser Ser Leu Ala Lys Tyr Asp Asp Ala Ala Leu Arg Ser Lys
865 870 875 880
Lys Leu Tyr Leu Tyr Tyr Thr Gln Met Gly Arg Cys Ala Tyr Thr Gly
885 890 895
Glu Ile Ile Glu Leu Ser Leu Leu Asn Thr Asp Asn Tyr Asp Ile Asp
900 905 910
His Ile Tyr Pro Arg Ser Leu Thr Lys Asp Asp Ser Phe Asp Asn Leu
915 920 925
Val Leu Cys Lys Arg Thr Ala Asn Ala Gln Lys Ser Asp Ala Tyr Pro
930 935 940
Ile Ser Glu Glu Ile Gln Lys Thr Gln Lys Pro Phe Trp Thr Phe Leu
945 950 955 960
Lys Gln Gln Gly Leu Ile Ser Glu Arg Lys Tyr Glu Arg Leu Thr Arg
965 970 975
Ile Thr Pro Leu Thr Ala Asp Asp Leu Ser Gly Phe Ile Ala Arg Gln
980 985 990
Leu Val Glu Thr Asn Gln Ser Val Lys Ala Ala Thr Thr Leu Leu Arg
995 1000 1005
Arg Leu Tyr Pro Gly Val Asp Val Val Phe Val Lys Ala Glu Asn
1010 1015 1020
Val Thr Asp Phe Arg His Asp Asn Asn Phe Ile Lys Val Arg Ser
1025 1030 1035
Leu Asn His His His His Ala Lys Asp Ala Tyr Leu Asn Ile Val
1040 1045 1050
Val Gly Asn Val Tyr His Glu Arg Phe Thr Arg Asn Phe Arg Ala
1055 1060 1065
Phe Phe Lys Lys Asn Gly Ala Asn Arg Thr Tyr Asn Leu Ala Lys
1070 1075 1080
Met Phe Asn Tyr Asp Val Asn Cys Thr Asn Ala Lys Asp Gly Lys
1085 1090 1095
Ala Trp Asp Val Lys Thr Ser Met Asp Thr Val Lys Lys Met Met
1100 1105 1110
Asp Ser Asn Asp Val Arg Val Thr Lys Arg Leu Leu Glu Gln Thr
1115 1120 1125
Gly Ala Leu Ala Asp Ala Thr Ile Tyr Lys Ala Thr Val Ala Gly
1130 1135 1140
Lys Ala Lys Asp Gly Ala Tyr Ile Gly Met Lys Thr Lys Ser Ser
1145 1150 1155
Val Phe Ala Asp Val Ser Lys Tyr Gly Gly Met Thr Lys Ile Lys
1160 1165 1170
Asn Ala Tyr Ser Ile Ile Val Gln Tyr Thr Gly Lys Lys Gly Glu
1175 1180 1185
Val Ile Lys Glu Ile Val Pro Leu Pro Ile Tyr Leu Thr Asn Arg
1190 1195 1200
Asn Thr Thr Asp Gln Asp Leu Ile Asn Tyr Val Ala Ser Ile Ile
1205 1210 1215
Pro Gln Ala Lys Asp Ile Ser Ile Ile Tyr Gly Lys Leu Cys Ile
1220 1225 1230
Asn Gln Leu Val Lys Val Asn Gly Phe Tyr Tyr Tyr Leu Gly Gly
1235 1240 1245
Lys Thr Asn Ser Lys Phe Cys Ile Asp Asn Ala Ile Gln Val Ile
1250 1255 1260
Val Ser Asn Glu Trp Ile Pro Tyr Leu Lys Val Leu Glu Lys Phe
1265 1270 1275
Asn Asn Met Arg Lys Asp Asn Lys Asp Leu Lys Ala Asn Val Val
1280 1285 1290
Ser Thr Arg Ala Leu Asp Asn Lys His Thr Ile Glu Val Arg Ile
1295 1300 1305
Val Glu Glu Lys Asn Ile Glu Phe Phe Asp Tyr Leu Val Ser Lys
1310 1315 1320
Leu Lys Met Pro Ile Tyr Gln Lys Met Lys Gly Asn Lys Ala Ala
1325 1330 1335
Glu Leu Ser Glu Lys Gly Tyr Gly Leu Phe Lys Lys Met Ser Leu
1340 1345 1350
Glu Glu Gln Ser Ile His Leu Ile Glu Leu Leu Asn Leu Leu Thr
1355 1360 1365
Asn Gln Lys Thr Thr Phe Glu Val Lys Pro Leu Gly Ile Thr Ala
1370 1375 1380
Ser Arg Ser Thr Val Gly Ser Lys Ile Ser Asn Gln Asp Glu Phe
1385 1390 1395
Lys Val Ile Asn Glu Ser Ile Thr Gly Leu Tyr Ser Asn Glu Val
1400 1405 1410
Thr Ile Val Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
1415 1420 1425
Lys Lys Lys Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
1430 1435 1440
Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu
1445 1450 1455
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp
1460 1465 1470
Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg
1475 1480 1485
Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
1490 1495 1500
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val
1505 1510 1515
Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe
1520 1525 1530
Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile
1535 1540 1545
Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala
1550 1555 1560
Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg
1565 1570 1575
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
1580 1585 1590
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln
1595 1600 1605
Lys Lys Ala Gln Ser Ser Thr Asp Pro Ala Ala Lys Arg Val Lys
1610 1615 1620
Leu Asp Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro
1625 1630 1635
Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr
1640 1645 1650
Ala
<210> 12
<211> 1919
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 12
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Thr Ser Glu Lys Gly Pro
1 5 10 15
Ser Thr Gly Asp Pro Thr Leu Arg Arg Arg Ile Glu Ser Trp Glu Phe
20 25 30
Asp Val Phe Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu
35 40 45
Tyr Glu Ile Lys Trp Gly Met Ser Arg Lys Ile Trp Arg Ser Ser Gly
50 55 60
Lys Asn Thr Thr Asn His Val Glu Val Asn Phe Ile Lys Lys Phe Thr
65 70 75 80
Ser Glu Arg Arg Phe His Ser Ser Ile Ser Cys Ser Ile Thr Trp Phe
85 90 95
Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser Gln Ala Ile Arg Glu Phe
100 105 110
Leu Ser Gln His Pro Gly Val Thr Leu Val Ile Tyr Val Ala Arg Leu
115 120 125
Phe Trp His Met Asp Gln Arg Asn Arg Gln Gly Leu Arg Asp Leu Val
130 135 140
Asn Ser Gly Val Thr Ile Gln Ile Met Arg Ala Ser Glu Tyr Tyr His
145 150 155 160
Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro Gly Asp Glu Ala His Trp
165 170 175
Pro Gln Tyr Pro Pro Leu Trp Met Met Leu Tyr Ala Leu Glu Leu His
180 185 190
Cys Ile Ile Leu Ser Leu Pro Pro Cys Leu Lys Ile Ser Arg Arg Trp
195 200 205
Gln Asn His Leu Ala Phe Phe Arg Leu His Leu Gln Asn Cys His Tyr
210 215 220
Gln Thr Ile Pro Pro His Ile Leu Leu Ala Thr Gly Leu Ile His Pro
225 230 235 240
Ser Val Thr Trp Arg Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
245 250 255
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
260 265 270
Gly Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser
275 280 285
Ile Ile Asn Phe Gln Arg Arg Gly Leu Met Glu Thr Gln Ala Ser Asn
290 295 300
Gln Leu Ile Ser Ser His Leu Lys Gly Tyr Pro Ile Lys Asp Tyr Phe
305 310 315 320
Val Gly Leu Ala Ile Gly Thr Ser Ser Val Gly Trp Ala Val Thr Asn
325 330 335
Lys Ala Tyr Glu Leu Leu Lys Phe Arg Ser His Lys Met Trp Gly Ser
340 345 350
Arg Leu Phe Asp Glu Gly Glu Ser Ala Val Ala Arg Arg Gly Phe Arg
355 360 365
Ser Met Arg Arg Arg Leu Glu Arg Arg Lys Leu Arg Leu Lys Leu Leu
370 375 380
Glu Glu Leu Phe Ala Asp Ala Met Ala Gln Val Asp Pro Thr Phe Phe
385 390 395 400
Met Arg Leu Arg Glu Ser Lys Tyr His Tyr Glu Asp Lys Thr Thr Gly
405 410 415
His Ser Ser Lys His Ile Leu Phe Ile Asp Lys Asn Tyr Asn Asp Gln
420 425 430
Asp Tyr Phe Lys Glu Tyr Pro Thr Val Tyr His Leu Arg Ser Glu Leu
435 440 445
Met Lys Ser Gly Thr Asp Asp Ile Arg Lys Leu Phe Leu Ala Val His
450 455 460
His Ile Leu Lys Tyr Arg Gly Asn Phe Leu Tyr Glu Gly Ala Thr Phe
465 470 475 480
Asp Ser Asn Ala Ser Thr Leu Asp Asp Val Ile Lys Gln Ala Leu Glu
485 490 495
Asn Ile Thr Phe Asn Cys Phe Asp Cys Asn Ser Ala Ile Ser Ser Ile
500 505 510
Gly Gln Ile Leu Met Glu Ala Gly Lys Thr Lys Ser Asp Lys Ala Lys
515 520 525
Ala Ile Glu His Leu Val Asp Thr Tyr Ile Ala Thr Asp Thr Val Asp
530 535 540
Thr Ser Ser Lys Thr Gln Lys Asp Gln Val Lys Glu Asp Lys Lys Arg
545 550 555 560
Leu Lys Ala Phe Ala Asn Leu Val Leu Gly Leu Asn Ala Ser Leu Ile
565 570 575
Asp Leu Phe Gly Ser Val Glu Glu Leu Glu Glu Asp Leu Lys Lys Leu
580 585 590
Gln Ile Thr Gly Asp Thr Tyr Asp Asp Lys Arg Asp Glu Leu Ala Lys
595 600 605
Ala Trp Ser Asp Glu Ile Tyr Ile Ile Asp Asp Cys Lys Ser Val Tyr
610 615 620
Asp Ala Ile Ile Leu Leu Ser Ile Lys Glu Pro Gly Leu Thr Ile Ser
625 630 635 640
Glu Ser Lys Val Lys Ala Phe Asn Lys His Lys Asp Asp Leu Ala Ile
645 650 655
Leu Lys Ser Leu Leu Lys Ser Asp Arg Ser Ile Tyr Asn Thr Met Phe
660 665 670
Lys Val Asp Glu Lys Gly Leu His Asn Tyr Val His Tyr Ile Lys Gln
675 680 685
Gly Arg Thr Glu Glu Thr Ser Cys Asn Arg Glu Asp Phe Tyr Lys Tyr
690 695 700
Thr Lys Lys Ile Val Glu Gly Leu Ser Asp Ser Lys Asp Lys Glu Tyr
705 710 715 720
Ile Leu Ser Gln Ile Glu Leu Gln Ile Leu Leu Pro Leu Gln Arg Ile
725 730 735
Lys Asp Asn Gly Val Ile Pro Tyr Gln Leu His Leu Glu Glu Leu Lys
740 745 750
Ala Ile Leu Ala Lys Cys Gly Pro Lys Phe Pro Phe Leu Asn Glu Val
755 760 765
Ala Asp Gly Phe Ser Val Ala Glu Lys Leu Ile Lys Met Leu Glu Phe
770 775 780
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Thr His His Asn Val Asp
785 790 795 800
Asn Gly Gly Phe Ala Trp Ala Val Arg Lys Ala Ser Gly Arg Val Thr
805 810 815
Pro Trp Asn Phe Asp Asp Lys Ile Asp Arg Glu Lys Ser Ala Ala Ala
820 825 830
Phe Ile Lys Asn Leu Thr Asn Lys Cys Thr Tyr Leu Leu Gly Glu Asp
835 840 845
Val Leu Pro Lys Ser Ser Leu Leu Tyr Ser Glu Phe Met Leu Leu Asn
850 855 860
Glu Leu Asn Asn Val Arg Ile Asp Gly Lys Pro Leu Glu Lys Val Val
865 870 875 880
Lys Glu His Leu Ile Glu Ala Val Phe Lys Gln Asp His Lys Lys Met
885 890 895
Thr Lys Asn Arg Ile Glu Gln Phe Leu Lys Asp Asn Gly Tyr Ile Ser
900 905 910
Glu Thr His Lys His Glu Ile Thr Gly Leu Asp Gly Glu Ile Lys Asn
915 920 925
Asp Leu Ala Ser Tyr Arg Asp Met Val Arg Ile Leu Gly Asp Gly Phe
930 935 940
Asp Arg Ser Met Ala Glu Glu Ile Ile Thr Asp Ile Thr Ile Phe Gly
945 950 955 960
Glu Ser Lys Lys Met Leu Arg Glu Thr Leu Arg Lys Lys Phe Ala Ser
965 970 975
Cys Leu Asp Asp Glu Ala Ile Lys Lys Leu Thr Lys Leu Arg Tyr Arg
980 985 990
Asp Trp Gly Arg Leu Ser Gln Lys Leu Leu Asn Gly Ile Glu Gly Cys
995 1000 1005
Asp Lys Ala Gly Asp Gly Thr Pro Glu Thr Ile Ile Ile Leu Met
1010 1015 1020
Arg Asn Phe Ser Tyr Asn Leu Met Glu Leu Leu Gly Asp Lys Phe
1025 1030 1035
Ser Phe Met Glu Arg Ile Gln Glu Ile Asn Ala Lys Leu Thr Glu
1040 1045 1050
Gly Gln Ile Val Asn Pro His Asp Ile Ile Asp Asp Leu Ala Leu
1055 1060 1065
Ser Pro Ala Val Lys Arg Ala Val Trp Gln Ala Leu Arg Ile Val
1070 1075 1080
Asp Glu Val Ala His Ile Lys Lys Ala Leu Pro Ala Arg Ile Phe
1085 1090 1095
Val Glu Val Thr Arg Ser Asn Lys Asn Glu Lys Lys Lys Lys Asp
1100 1105 1110
Ser Arg Gln Lys Arg Leu Ser Asp Leu Tyr Ala Ala Ile Lys Lys
1115 1120 1125
Asp Asp Val Leu Leu Asn Gly Leu Asn Asn Glu Ile Phe Gly Glu
1130 1135 1140
Leu Lys Ser Ser Leu Ala Lys Tyr Asp Asp Ala Ala Leu Arg Ser
1145 1150 1155
Lys Lys Leu Tyr Leu Tyr Tyr Thr Gln Met Gly Arg Cys Ala Tyr
1160 1165 1170
Thr Gly Glu Ile Ile Glu Leu Ser Leu Leu Asn Thr Asp Asn Tyr
1175 1180 1185
Asp Ile Asp His Ile Tyr Pro Arg Ser Leu Thr Lys Asp Asp Ser
1190 1195 1200
Phe Asp Asn Leu Val Leu Cys Lys Arg Thr Ala Asn Ala Gln Lys
1205 1210 1215
Ser Asp Ala Tyr Pro Ile Ser Glu Glu Ile Gln Lys Thr Gln Lys
1220 1225 1230
Pro Phe Trp Thr Phe Leu Lys Gln Gln Gly Leu Ile Ser Glu Arg
1235 1240 1245
Lys Tyr Glu Arg Leu Thr Arg Ile Thr Pro Leu Thr Ala Asp Asp
1250 1255 1260
Leu Ser Gly Phe Ile Ala Arg Gln Leu Val Glu Thr Asn Gln Ser
1265 1270 1275
Val Lys Ala Ala Thr Thr Leu Leu Arg Arg Leu Tyr Pro Gly Val
1280 1285 1290
Asp Val Val Phe Val Lys Ala Glu Asn Val Thr Asp Phe Arg His
1295 1300 1305
Asp Asn Asn Phe Ile Lys Val Arg Ser Leu Asn His His His His
1310 1315 1320
Ala Lys Asp Ala Tyr Leu Asn Ile Val Val Gly Asn Val Tyr His
1325 1330 1335
Glu Arg Phe Thr Arg Asn Phe Arg Ala Phe Phe Lys Lys Asn Gly
1340 1345 1350
Ala Asn Arg Thr Tyr Asn Leu Ala Lys Met Phe Asn Tyr Asp Val
1355 1360 1365
Asn Cys Thr Asn Ala Lys Asp Gly Lys Ala Trp Asp Val Lys Thr
1370 1375 1380
Ser Met Asp Thr Val Lys Lys Met Met Asp Ser Asn Asp Val Arg
1385 1390 1395
Val Thr Lys Arg Leu Leu Glu Gln Thr Gly Ala Leu Ala Asp Ala
1400 1405 1410
Thr Ile Tyr Lys Ala Thr Val Ala Gly Lys Ala Lys Asp Gly Ala
1415 1420 1425
Tyr Ile Gly Met Lys Thr Lys Ser Ser Val Phe Ala Asp Val Ser
1430 1435 1440
Lys Tyr Gly Gly Met Thr Lys Ile Lys Asn Ala Tyr Ser Ile Ile
1445 1450 1455
Val Gln Tyr Thr Gly Lys Lys Gly Glu Val Ile Lys Glu Ile Val
1460 1465 1470
Pro Leu Pro Ile Tyr Leu Thr Asn Arg Asn Thr Thr Asp Gln Asp
1475 1480 1485
Leu Ile Asn Tyr Val Ala Ser Ile Ile Pro Gln Ala Lys Asp Ile
1490 1495 1500
Ser Ile Ile Tyr Gly Lys Leu Cys Ile Asn Gln Leu Val Lys Val
1505 1510 1515
Asn Gly Phe Tyr Tyr Tyr Leu Gly Gly Lys Thr Asn Ser Lys Phe
1520 1525 1530
Cys Ile Asp Asn Ala Ile Gln Val Ile Val Ser Asn Glu Trp Ile
1535 1540 1545
Pro Tyr Leu Lys Val Leu Glu Lys Phe Asn Asn Met Arg Lys Asp
1550 1555 1560
Asn Lys Asp Leu Lys Ala Asn Val Val Ser Thr Arg Ala Leu Asp
1565 1570 1575
Asn Lys His Thr Ile Glu Val Arg Ile Val Glu Glu Lys Asn Ile
1580 1585 1590
Glu Phe Phe Asp Tyr Leu Val Ser Lys Leu Lys Met Pro Ile Tyr
1595 1600 1605
Gln Lys Met Lys Gly Asn Lys Ala Ala Glu Leu Ser Glu Lys Gly
1610 1615 1620
Tyr Gly Leu Phe Lys Lys Met Ser Leu Glu Glu Gln Ser Ile His
1625 1630 1635
Leu Ile Glu Leu Leu Asn Leu Leu Thr Asn Gln Lys Thr Thr Phe
1640 1645 1650
Glu Val Lys Pro Leu Gly Ile Thr Ala Ser Arg Ser Thr Val Gly
1655 1660 1665
Ser Lys Ile Ser Asn Gln Asp Glu Phe Lys Val Ile Asn Glu Ser
1670 1675 1680
Ile Thr Gly Leu Tyr Ser Asn Glu Val Thr Ile Val Gly Lys Arg
1685 1690 1695
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1700 1705 1710
Ser Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
1715 1720 1725
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu
1730 1735 1740
Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
1745 1750 1755
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
1760 1765 1770
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
1775 1780 1785
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
1790 1795 1800
Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr
1805 1810 1815
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1820 1825 1830
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
1835 1840 1845
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
1850 1855 1860
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
1865 1870 1875
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
1880 1885 1890
Glu Asn Lys Ile Lys Met Leu Tyr Pro Tyr Asp Val Pro Asp Tyr
1895 1900 1905
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1910 1915
<210> 13
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 13
guuugagagu agugugaaaa cauuacgagu ucaaauacaa auuaauuuac aaugccuucg 60
ggcugcccga cguagggcac cuacucucaa uucuucggaa uugaguu 107
<210> 14
<211> 1370
<212> PRT
<213> Ezakiella peruensis
<400> 14
Met Thr Lys Val Lys Asp Tyr Tyr Ile Gly Leu Asp Ile Gly Thr Ser
1 5 10 15
Ser Val Gly Trp Ala Val Thr Asp Glu Ala Tyr Asn Val Leu Lys Phe
20 25 30
Asn Ser Lys Lys Met Trp Gly Val Arg Leu Phe Asp Asp Ala Lys Thr
35 40 45
Ala Glu Glu Arg Arg Gly Gln Arg Gly Ala Arg Arg Arg Leu Asp Arg
50 55 60
Lys Lys Glu Arg Leu Ser Leu Leu Gln Asp Phe Phe Ala Glu Glu Val
65 70 75 80
Ala Lys Val Asp Pro Asn Phe Phe Leu Arg Leu Asp Asn Ser Asp Leu
85 90 95
Tyr Met Glu Asp Lys Asp Gln Lys Leu Lys Ser Lys Tyr Thr Leu Phe
100 105 110
Asn Asp Lys Asp Phe Lys Asp Lys Asn Phe His Lys Lys Tyr Pro Thr
115 120 125
Ile His His Leu Leu Met Asp Leu Ile Glu Asp Asp Ser Lys Lys Asp
130 135 140
Ile Arg Leu Val Tyr Leu Ala Cys His Tyr Leu Leu Lys Asn Arg Gly
145 150 155 160
His Phe Ile Phe Glu Gly Gln Lys Phe Asp Thr Lys Ser Ser Phe Glu
165 170 175
Asn Ser Leu Asn Glu Leu Lys Val His Leu Asn Asp Glu Tyr Gly Leu
180 185 190
Asp Leu Glu Phe Asp Asn Glu Asn Leu Ile Asn Ile Leu Thr Asp Pro
195 200 205
Lys Leu Asn Lys Thr Ala Lys Lys Lys Glu Leu Lys Ser Val Ile Gly
210 215 220
Asp Thr Lys Phe Leu Lys Ala Val Ser Ala Ile Met Ile Gly Ser Ser
225 230 235 240
Gln Lys Leu Val Asp Leu Phe Glu Asn Pro Glu Asp Phe Asp Asp Ser
245 250 255
Ala Ile Lys Ser Val Asp Phe Ser Thr Thr Ser Phe Asp Asp Lys Tyr
260 265 270
Ser Asp Tyr Glu Leu Ala Leu Gly Asp Lys Ile Ala Leu Val Asn Ile
275 280 285
Leu Lys Glu Ile Tyr Asp Ser Ser Ile Leu Glu Asn Leu Leu Lys Glu
290 295 300
Ala Asp Lys Ser Lys Asp Gly Asn Lys Tyr Ile Ser Asn Ala Phe Val
305 310 315 320
Lys Lys Tyr Asn Lys His Gly Gln Asp Leu Lys Glu Phe Lys Arg Leu
325 330 335
Val Arg Gln Tyr His Lys Ser Ala Tyr Phe Asp Ile Phe Arg Ser Glu
340 345 350
Lys Val Asn Asp Asn Tyr Val Ser Tyr Thr Lys Ser Ser Ile Ser Asn
355 360 365
Asn Lys Arg Val Lys Ala Asn Lys Phe Thr Asp Gln Glu Ala Phe Tyr
370 375 380
Lys Phe Ala Lys Lys His Leu Glu Thr Ile Lys Tyr Lys Ile Asn Lys
385 390 395 400
Val Asn Gly Ser Lys Ala Asp Leu Glu Leu Ile Asp Gly Met Leu Arg
405 410 415
Asp Met Glu Phe Lys Asn Phe Met Pro Lys Ile Lys Ser Ser Asp Asn
420 425 430
Gly Val Ile Pro Tyr Gln Leu Lys Leu Met Glu Leu Asn Lys Ile Leu
435 440 445
Glu Asn Gln Ser Lys His His Glu Phe Leu Asn Val Ser Asp Glu Tyr
450 455 460
Gly Ser Val Cys Asp Lys Ile Ala Ser Ile Met Glu Phe Arg Ile Pro
465 470 475 480
Tyr Tyr Val Gly Pro Leu Asn Pro Asn Ser Lys Tyr Ala Trp Ile Lys
485 490 495
Lys Gln Lys Asp Ser Glu Ile Thr Pro Trp Asn Phe Lys Asp Val Val
500 505 510
Asp Leu Asp Ser Ser Arg Glu Glu Phe Ile Asp Ser Leu Ile Gly Arg
515 520 525
Cys Thr Tyr Leu Lys Asp Glu Lys Val Leu Pro Lys Ala Ser Leu Leu
530 535 540
Tyr Asn Glu Tyr Met Val Leu Asn Glu Leu Asn Asn Leu Lys Leu Asn
545 550 555 560
Asp Leu Pro Ile Thr Glu Glu Met Lys Lys Lys Ile Phe Asp Gln Leu
565 570 575
Phe Lys Thr Arg Lys Lys Val Thr Leu Lys Ala Val Ala Asn Leu Leu
580 585 590
Lys Lys Glu Phe Asn Ile Asn Gly Glu Ile Leu Leu Ser Gly Thr Asp
595 600 605
Gly Asp Phe Lys Gln Gly Leu Asn Ser Tyr Asn Asp Phe Lys Ala Ile
610 615 620
Val Gly Asp Lys Val Asp Ser Asp Asp Tyr Arg Asp Lys Ile Glu Glu
625 630 635 640
Ile Ile Lys Leu Ile Val Leu Tyr Gly Asp Asp Lys Ser Tyr Leu Gln
645 650 655
Lys Lys Ile Lys Ala Gly Tyr Gly Lys Tyr Phe Thr Asp Ser Glu Ile
660 665 670
Lys Lys Met Ala Gly Leu Asn Tyr Lys Asp Trp Gly Arg Leu Ser Lys
675 680 685
Lys Leu Leu Thr Gly Leu Glu Gly Ala Asn Lys Ile Thr Gly Glu Arg
690 695 700
Gly Ser Ile Ile His Phe Met Arg Glu Tyr Asn Leu Asn Leu Met Glu
705 710 715 720
Leu Met Ser Ala Ser Phe Thr Phe Thr Glu Glu Ile Gln Lys Leu Asn
725 730 735
Pro Val Asp Asp Arg Lys Leu Ser Tyr Glu Met Val Asp Glu Leu Tyr
740 745 750
Leu Ser Pro Ser Val Lys Arg Met Leu Trp Gln Ser Leu Arg Ile Val
755 760 765
Asp Glu Ile Lys Asn Ile Met Gly Thr Asp Ser Lys Lys Ile Phe Ile
770 775 780
Glu Met Ala Arg Gly Lys Glu Glu Val Lys Ala Arg Lys Glu Ser Arg
785 790 795 800
Lys Asn Gln Leu Leu Lys Phe Tyr Lys Asp Gly Lys Lys Ala Phe Ile
805 810 815
Ser Glu Ile Gly Glu Glu Arg Tyr Ser Tyr Leu Leu Ser Glu Ile Glu
820 825 830
Gly Glu Glu Glu Asn Lys Phe Arg Trp Asp Asn Leu Tyr Leu Tyr Tyr
835 840 845
Thr Gln Leu Gly Arg Cys Met Tyr Ser Leu Glu Pro Ile Asp Ile Ser
850 855 860
Glu Leu Ser Ser Lys Asn Ile Tyr Asp Gln Asp His Ile Tyr Pro Lys
865 870 875 880
Ser Lys Ile Tyr Asp Asp Ser Ile Glu Asn Arg Val Leu Val Lys Lys
885 890 895
Asp Leu Asn Ser Lys Lys Gly Asn Ser Tyr Pro Ile Pro Asp Glu Ile
900 905 910
Leu Asn Lys Asn Cys Tyr Ala Tyr Trp Lys Ile Leu Tyr Asp Lys Gly
915 920 925
Leu Ile Gly Gln Lys Lys Tyr Thr Arg Leu Thr Arg Arg Thr Gly Phe
930 935 940
Thr Asp Asp Glu Leu Val Gln Phe Ile Ser Arg Gln Ile Val Glu Thr
945 950 955 960
Arg Gln Ala Thr Lys Glu Thr Ala Asn Leu Leu Lys Thr Ile Cys Lys
965 970 975
Asn Ser Glu Ile Val Tyr Ser Lys Ala Glu Asn Ala Ser Arg Phe Arg
980 985 990
Gln Glu Phe Asp Ile Val Lys Cys Arg Ala Val Asn Asp Leu His His
995 1000 1005
Met His Asp Ala Tyr Ile Asn Ile Ile Val Gly Asn Val Tyr Asn
1010 1015 1020
Thr Lys Phe Thr Lys Asp Pro Met Asn Phe Val Lys Lys Gln Glu
1025 1030 1035
Lys Ala Arg Ser Tyr Asn Leu Glu Asn Met Phe Lys Tyr Asp Val
1040 1045 1050
Lys Arg Gly Gly Tyr Thr Ala Trp Ile Ala Asp Asp Glu Lys Gly
1055 1060 1065
Thr Val Lys Asn Ala Ser Ile Lys Arg Ile Arg Lys Glu Leu Glu
1070 1075 1080
Gly Thr Asn Tyr Arg Phe Thr Arg Met Asn Tyr Ile Glu Ser Gly
1085 1090 1095
Ala Leu Phe Asn Ala Thr Leu Gln Arg Lys Asn Lys Gly Ser Arg
1100 1105 1110
Pro Leu Lys Asp Lys Gly Pro Lys Ser Ser Ile Glu Lys Tyr Gly
1115 1120 1125
Gly Tyr Thr Asn Ile Asn Lys Ala Cys Phe Ala Val Leu Asp Ile
1130 1135 1140
Lys Ser Lys Asn Lys Ile Glu Arg Lys Leu Met Pro Val Glu Arg
1145 1150 1155
Glu Ile Tyr Ala Lys Gln Lys Asn Asp Lys Lys Leu Ser Asp Glu
1160 1165 1170
Ile Phe Ser Lys Tyr Leu Lys Asp Arg Phe Gly Ile Glu Asp Tyr
1175 1180 1185
Arg Val Val Tyr Pro Val Val Lys Met Arg Thr Leu Leu Lys Ile
1190 1195 1200
Asp Gly Ser Tyr Tyr Phe Ile Thr Gly Gly Ser Asp Lys Thr Leu
1205 1210 1215
Glu Leu Arg Ser Ala Leu Gln Leu Ile Leu Pro Lys Lys Asn Glu
1220 1225 1230
Trp Ala Ile Lys Gln Ile Asp Lys Ser Ser Glu Asn Asp Tyr Leu
1235 1240 1245
Thr Ile Glu Arg Ile Gln Asp Leu Thr Glu Glu Leu Val Tyr Asn
1250 1255 1260
Thr Phe Asp Ile Ile Val Asn Lys Phe Lys Thr Ser Val Phe Lys
1265 1270 1275
Lys Ser Phe Leu Asn Leu Phe Gln Asp Asp Lys Ile Glu Asn Ile
1280 1285 1290
Asp Phe Lys Phe Lys Ser Met Asp Phe Lys Glu Lys Cys Lys Thr
1295 1300 1305
Leu Leu Met Leu Val Lys Ala Ile Arg Ala Ser Gly Val Arg Gln
1310 1315 1320
Asp Leu Lys Ser Ile Asp Leu Lys Ser Asp Tyr Gly Arg Leu Ser
1325 1330 1335
Ser Lys Thr Asn Asn Ile Gly Asn Tyr Gln Glu Phe Lys Ile Ile
1340 1345 1350
Asn Gln Ser Ile Thr Gly Leu Phe Glu Asn Glu Val Asp Leu Leu
1355 1360 1365
Lys Leu
1370
<210> 15
<211> 1424
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 15
Met Pro Lys Lys Lys Arg Lys Val Gly Thr Lys Val Lys Asp Tyr Tyr
1 5 10 15
Ile Gly Leu Asp Ile Gly Thr Ser Ser Val Gly Trp Ala Val Thr Asp
20 25 30
Glu Ala Tyr Asn Val Leu Lys Phe Asn Ser Lys Lys Met Trp Gly Val
35 40 45
Arg Leu Phe Asp Asp Ala Lys Thr Ala Glu Glu Arg Arg Gly Gln Arg
50 55 60
Gly Ala Arg Arg Arg Leu Asp Arg Lys Lys Glu Arg Leu Ser Leu Leu
65 70 75 80
Gln Asp Phe Phe Ala Glu Glu Val Ala Lys Val Asp Pro Asn Phe Phe
85 90 95
Leu Arg Leu Asp Asn Ser Asp Leu Tyr Met Glu Asp Lys Asp Gln Lys
100 105 110
Leu Lys Ser Lys Tyr Thr Leu Phe Asn Asp Lys Asp Phe Lys Asp Lys
115 120 125
Asn Phe His Lys Lys Tyr Pro Thr Ile His His Leu Leu Met Asp Leu
130 135 140
Ile Glu Asp Asp Ser Lys Lys Asp Ile Arg Leu Val Tyr Leu Ala Cys
145 150 155 160
His Tyr Leu Leu Lys Asn Arg Gly His Phe Ile Phe Glu Gly Gln Lys
165 170 175
Phe Asp Thr Lys Ser Ser Phe Glu Asn Ser Leu Asn Glu Leu Lys Val
180 185 190
His Leu Asn Asp Glu Tyr Gly Leu Asp Leu Glu Phe Asp Asn Glu Asn
195 200 205
Leu Ile Asn Ile Leu Thr Asp Pro Lys Leu Asn Lys Thr Ala Lys Lys
210 215 220
Lys Glu Leu Lys Ser Val Ile Gly Asp Thr Lys Phe Leu Lys Ala Val
225 230 235 240
Ser Ala Ile Met Ile Gly Ser Ser Gln Lys Leu Val Asp Leu Phe Glu
245 250 255
Asn Pro Glu Asp Phe Asp Asp Ser Ala Ile Lys Ser Val Asp Phe Ser
260 265 270
Thr Thr Ser Phe Asp Asp Lys Tyr Ser Asp Tyr Glu Leu Ala Leu Gly
275 280 285
Asp Lys Ile Ala Leu Val Asn Ile Leu Lys Glu Ile Tyr Asp Ser Ser
290 295 300
Ile Leu Glu Asn Leu Leu Lys Glu Ala Asp Lys Ser Lys Asp Gly Asn
305 310 315 320
Lys Tyr Ile Ser Asn Ala Phe Val Lys Lys Tyr Asn Lys His Gly Gln
325 330 335
Asp Leu Lys Glu Phe Lys Arg Leu Val Arg Gln Tyr His Lys Ser Ala
340 345 350
Tyr Phe Asp Ile Phe Arg Ser Glu Lys Val Asn Asp Asn Tyr Val Ser
355 360 365
Tyr Thr Lys Ser Ser Ile Ser Asn Asn Lys Arg Val Lys Ala Asn Lys
370 375 380
Phe Thr Asp Gln Glu Ala Phe Tyr Lys Phe Ala Lys Lys His Leu Glu
385 390 395 400
Thr Ile Lys Tyr Lys Ile Asn Lys Val Asn Gly Ser Lys Ala Asp Leu
405 410 415
Glu Leu Ile Asp Gly Met Leu Arg Asp Met Glu Phe Lys Asn Phe Met
420 425 430
Pro Lys Ile Lys Ser Ser Asp Asn Gly Val Ile Pro Tyr Gln Leu Lys
435 440 445
Leu Met Glu Leu Asn Lys Ile Leu Glu Asn Gln Ser Lys His His Glu
450 455 460
Phe Leu Asn Val Ser Asp Glu Tyr Gly Ser Val Cys Asp Lys Ile Ala
465 470 475 480
Ser Ile Met Glu Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Pro
485 490 495
Asn Ser Lys Tyr Ala Trp Ile Lys Lys Gln Lys Asp Ser Glu Ile Thr
500 505 510
Pro Trp Asn Phe Lys Asp Val Val Asp Leu Asp Ser Ser Arg Glu Glu
515 520 525
Phe Ile Asp Ser Leu Ile Gly Arg Cys Thr Tyr Leu Lys Asp Glu Lys
530 535 540
Val Leu Pro Lys Ala Ser Leu Leu Tyr Asn Glu Tyr Met Val Leu Asn
545 550 555 560
Glu Leu Asn Asn Leu Lys Leu Asn Asp Leu Pro Ile Thr Glu Glu Met
565 570 575
Lys Lys Lys Ile Phe Asp Gln Leu Phe Lys Thr Arg Lys Lys Val Thr
580 585 590
Leu Lys Ala Val Ala Asn Leu Leu Lys Lys Glu Phe Asn Ile Asn Gly
595 600 605
Glu Ile Leu Leu Ser Gly Thr Asp Gly Asp Phe Lys Gln Gly Leu Asn
610 615 620
Ser Tyr Asn Asp Phe Lys Ala Ile Val Gly Asp Lys Val Asp Ser Asp
625 630 635 640
Asp Tyr Arg Asp Lys Ile Glu Glu Ile Ile Lys Leu Ile Val Leu Tyr
645 650 655
Gly Asp Asp Lys Ser Tyr Leu Gln Lys Lys Ile Lys Ala Gly Tyr Gly
660 665 670
Lys Tyr Phe Thr Asp Ser Glu Ile Lys Lys Met Ala Gly Leu Asn Tyr
675 680 685
Lys Asp Trp Gly Arg Leu Ser Lys Lys Leu Leu Thr Gly Leu Glu Gly
690 695 700
Ala Asn Lys Ile Thr Gly Glu Arg Gly Ser Ile Ile His Phe Met Arg
705 710 715 720
Glu Tyr Asn Leu Asn Leu Met Glu Leu Met Ser Ala Ser Phe Thr Phe
725 730 735
Thr Glu Glu Ile Gln Lys Leu Asn Pro Val Asp Asp Arg Lys Leu Ser
740 745 750
Tyr Glu Met Val Asp Glu Leu Tyr Leu Ser Pro Ser Val Lys Arg Met
755 760 765
Leu Trp Gln Ser Leu Arg Ile Val Asp Glu Ile Lys Asn Ile Met Gly
770 775 780
Thr Asp Ser Lys Lys Ile Phe Ile Glu Met Ala Arg Gly Lys Glu Glu
785 790 795 800
Val Lys Ala Arg Lys Glu Ser Arg Lys Asn Gln Leu Leu Lys Phe Tyr
805 810 815
Lys Asp Gly Lys Lys Ala Phe Ile Ser Glu Ile Gly Glu Glu Arg Tyr
820 825 830
Ser Tyr Leu Leu Ser Glu Ile Glu Gly Glu Glu Glu Asn Lys Phe Arg
835 840 845
Trp Asp Asn Leu Tyr Leu Tyr Tyr Thr Gln Leu Gly Arg Cys Met Tyr
850 855 860
Ser Leu Glu Pro Ile Asp Ile Ser Glu Leu Ser Ser Lys Asn Ile Tyr
865 870 875 880
Asp Gln Asp His Ile Tyr Pro Lys Ser Lys Ile Tyr Asp Asp Ser Ile
885 890 895
Glu Asn Arg Val Leu Val Lys Lys Asp Leu Asn Ser Lys Lys Gly Asn
900 905 910
Ser Tyr Pro Ile Pro Asp Glu Ile Leu Asn Lys Asn Cys Tyr Ala Tyr
915 920 925
Trp Lys Ile Leu Tyr Asp Lys Gly Leu Ile Gly Gln Lys Lys Tyr Thr
930 935 940
Arg Leu Thr Arg Arg Thr Gly Phe Thr Asp Asp Glu Leu Val Gln Phe
945 950 955 960
Ile Ser Arg Gln Ile Val Glu Thr Arg Gln Ala Thr Lys Glu Thr Ala
965 970 975
Asn Leu Leu Lys Thr Ile Cys Lys Asn Ser Glu Ile Val Tyr Ser Lys
980 985 990
Ala Glu Asn Ala Ser Arg Phe Arg Gln Glu Phe Asp Ile Val Lys Cys
995 1000 1005
Arg Ala Val Asn Asp Leu His His Met His Asp Ala Tyr Ile Asn
1010 1015 1020
Ile Ile Val Gly Asn Val Tyr Asn Thr Lys Phe Thr Lys Asp Pro
1025 1030 1035
Met Asn Phe Val Lys Lys Gln Glu Lys Ala Arg Ser Tyr Asn Leu
1040 1045 1050
Glu Asn Met Phe Lys Tyr Asp Val Lys Arg Gly Gly Tyr Thr Ala
1055 1060 1065
Trp Ile Ala Asp Asp Glu Lys Gly Thr Val Lys Asn Ala Ser Ile
1070 1075 1080
Lys Arg Ile Arg Lys Glu Leu Glu Gly Thr Asn Tyr Arg Phe Thr
1085 1090 1095
Arg Met Asn Tyr Ile Glu Ser Gly Ala Leu Phe Asn Ala Thr Leu
1100 1105 1110
Gln Arg Lys Asn Lys Gly Ser Arg Pro Leu Lys Asp Lys Gly Pro
1115 1120 1125
Lys Ser Ser Ile Glu Lys Tyr Gly Gly Tyr Thr Asn Ile Asn Lys
1130 1135 1140
Ala Cys Phe Ala Val Leu Asp Ile Lys Ser Lys Asn Lys Ile Glu
1145 1150 1155
Arg Lys Leu Met Pro Val Glu Arg Glu Ile Tyr Ala Lys Gln Lys
1160 1165 1170
Asn Asp Lys Lys Leu Ser Asp Glu Ile Phe Ser Lys Tyr Leu Lys
1175 1180 1185
Asp Arg Phe Gly Ile Glu Asp Tyr Arg Val Val Tyr Pro Val Val
1190 1195 1200
Lys Met Arg Thr Leu Leu Lys Ile Asp Gly Ser Tyr Tyr Phe Ile
1205 1210 1215
Thr Gly Gly Ser Asp Lys Thr Leu Glu Leu Arg Ser Ala Leu Gln
1220 1225 1230
Leu Ile Leu Pro Lys Lys Asn Glu Trp Ala Ile Lys Gln Ile Asp
1235 1240 1245
Lys Ser Ser Glu Asn Asp Tyr Leu Thr Ile Glu Arg Ile Gln Asp
1250 1255 1260
Leu Thr Glu Glu Leu Val Tyr Asn Thr Phe Asp Ile Ile Val Asn
1265 1270 1275
Lys Phe Lys Thr Ser Val Phe Lys Lys Ser Phe Leu Asn Leu Phe
1280 1285 1290
Gln Asp Asp Lys Ile Glu Asn Ile Asp Phe Lys Phe Lys Ser Met
1295 1300 1305
Asp Phe Lys Glu Lys Cys Lys Thr Leu Leu Met Leu Val Lys Ala
1310 1315 1320
Ile Arg Ala Ser Gly Val Arg Gln Asp Leu Lys Ser Ile Asp Leu
1325 1330 1335
Lys Ser Asp Tyr Gly Arg Leu Ser Ser Lys Thr Asn Asn Ile Gly
1340 1345 1350
Asn Tyr Gln Glu Phe Lys Ile Ile Asn Gln Ser Ile Thr Gly Leu
1355 1360 1365
Phe Glu Asn Glu Val Asp Leu Leu Lys Leu Gly Lys Arg Pro Ala
1370 1375 1380
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr
1385 1390 1395
Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp
1400 1405 1410
Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1415 1420
<210> 16
<211> 1620
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 16
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Glu Val Glu Phe
1 5 10 15
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
20 25 30
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
35 40 45
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
65 70 75 80
Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
85 90 95
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
100 105 110
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
115 120 125
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
130 135 140
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg
145 150 155 160
Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr
165 170 175
Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
180 185 190
Pro Glu Ser Ser Gly Pro Lys Lys Lys Arg Lys Val Gly Thr Lys Val
195 200 205
Lys Asp Tyr Tyr Ile Gly Leu Ala Ile Gly Thr Ser Ser Val Gly Trp
210 215 220
Ala Val Thr Asp Glu Ala Tyr Asn Val Leu Lys Phe Asn Ser Lys Lys
225 230 235 240
Met Trp Gly Val Arg Leu Phe Asp Asp Ala Lys Thr Ala Glu Glu Arg
245 250 255
Arg Gly Gln Arg Gly Ala Arg Arg Arg Leu Asp Arg Lys Lys Glu Arg
260 265 270
Leu Ser Leu Leu Gln Asp Phe Phe Ala Glu Glu Val Ala Lys Val Asp
275 280 285
Pro Asn Phe Phe Leu Arg Leu Asp Asn Ser Asp Leu Tyr Met Glu Asp
290 295 300
Lys Asp Gln Lys Leu Lys Ser Lys Tyr Thr Leu Phe Asn Asp Lys Asp
305 310 315 320
Phe Lys Asp Lys Asn Phe His Lys Lys Tyr Pro Thr Ile His His Leu
325 330 335
Leu Met Asp Leu Ile Glu Asp Asp Ser Lys Lys Asp Ile Arg Leu Val
340 345 350
Tyr Leu Ala Cys His Tyr Leu Leu Lys Asn Arg Gly His Phe Ile Phe
355 360 365
Glu Gly Gln Lys Phe Asp Thr Lys Ser Ser Phe Glu Asn Ser Leu Asn
370 375 380
Glu Leu Lys Val His Leu Asn Asp Glu Tyr Gly Leu Asp Leu Glu Phe
385 390 395 400
Asp Asn Glu Asn Leu Ile Asn Ile Leu Thr Asp Pro Lys Leu Asn Lys
405 410 415
Thr Ala Lys Lys Lys Glu Leu Lys Ser Val Ile Gly Asp Thr Lys Phe
420 425 430
Leu Lys Ala Val Ser Ala Ile Met Ile Gly Ser Ser Gln Lys Leu Val
435 440 445
Asp Leu Phe Glu Asn Pro Glu Asp Phe Asp Asp Ser Ala Ile Lys Ser
450 455 460
Val Asp Phe Ser Thr Thr Ser Phe Asp Asp Lys Tyr Ser Asp Tyr Glu
465 470 475 480
Leu Ala Leu Gly Asp Lys Ile Ala Leu Val Asn Ile Leu Lys Glu Ile
485 490 495
Tyr Asp Ser Ser Ile Leu Glu Asn Leu Leu Lys Glu Ala Asp Lys Ser
500 505 510
Lys Asp Gly Asn Lys Tyr Ile Ser Asn Ala Phe Val Lys Lys Tyr Asn
515 520 525
Lys His Gly Gln Asp Leu Lys Glu Phe Lys Arg Leu Val Arg Gln Tyr
530 535 540
His Lys Ser Ala Tyr Phe Asp Ile Phe Arg Ser Glu Lys Val Asn Asp
545 550 555 560
Asn Tyr Val Ser Tyr Thr Lys Ser Ser Ile Ser Asn Asn Lys Arg Val
565 570 575
Lys Ala Asn Lys Phe Thr Asp Gln Glu Ala Phe Tyr Lys Phe Ala Lys
580 585 590
Lys His Leu Glu Thr Ile Lys Tyr Lys Ile Asn Lys Val Asn Gly Ser
595 600 605
Lys Ala Asp Leu Glu Leu Ile Asp Gly Met Leu Arg Asp Met Glu Phe
610 615 620
Lys Asn Phe Met Pro Lys Ile Lys Ser Ser Asp Asn Gly Val Ile Pro
625 630 635 640
Tyr Gln Leu Lys Leu Met Glu Leu Asn Lys Ile Leu Glu Asn Gln Ser
645 650 655
Lys His His Glu Phe Leu Asn Val Ser Asp Glu Tyr Gly Ser Val Cys
660 665 670
Asp Lys Ile Ala Ser Ile Met Glu Phe Arg Ile Pro Tyr Tyr Val Gly
675 680 685
Pro Leu Asn Pro Asn Ser Lys Tyr Ala Trp Ile Lys Lys Gln Lys Asp
690 695 700
Ser Glu Ile Thr Pro Trp Asn Phe Lys Asp Val Val Asp Leu Asp Ser
705 710 715 720
Ser Arg Glu Glu Phe Ile Asp Ser Leu Ile Gly Arg Cys Thr Tyr Leu
725 730 735
Lys Asp Glu Lys Val Leu Pro Lys Ala Ser Leu Leu Tyr Asn Glu Tyr
740 745 750
Met Val Leu Asn Glu Leu Asn Asn Leu Lys Leu Asn Asp Leu Pro Ile
755 760 765
Thr Glu Glu Met Lys Lys Lys Ile Phe Asp Gln Leu Phe Lys Thr Arg
770 775 780
Lys Lys Val Thr Leu Lys Ala Val Ala Asn Leu Leu Lys Lys Glu Phe
785 790 795 800
Asn Ile Asn Gly Glu Ile Leu Leu Ser Gly Thr Asp Gly Asp Phe Lys
805 810 815
Gln Gly Leu Asn Ser Tyr Asn Asp Phe Lys Ala Ile Val Gly Asp Lys
820 825 830
Val Asp Ser Asp Asp Tyr Arg Asp Lys Ile Glu Glu Ile Ile Lys Leu
835 840 845
Ile Val Leu Tyr Gly Asp Asp Lys Ser Tyr Leu Gln Lys Lys Ile Lys
850 855 860
Ala Gly Tyr Gly Lys Tyr Phe Thr Asp Ser Glu Ile Lys Lys Met Ala
865 870 875 880
Gly Leu Asn Tyr Lys Asp Trp Gly Arg Leu Ser Lys Lys Leu Leu Thr
885 890 895
Gly Leu Glu Gly Ala Asn Lys Ile Thr Gly Glu Arg Gly Ser Ile Ile
900 905 910
His Phe Met Arg Glu Tyr Asn Leu Asn Leu Met Glu Leu Met Ser Ala
915 920 925
Ser Phe Thr Phe Thr Glu Glu Ile Gln Lys Leu Asn Pro Val Asp Asp
930 935 940
Arg Lys Leu Ser Tyr Glu Met Val Asp Glu Leu Tyr Leu Ser Pro Ser
945 950 955 960
Val Lys Arg Met Leu Trp Gln Ser Leu Arg Ile Val Asp Glu Ile Lys
965 970 975
Asn Ile Met Gly Thr Asp Ser Lys Lys Ile Phe Ile Glu Met Ala Arg
980 985 990
Gly Lys Glu Glu Val Lys Ala Arg Lys Glu Ser Arg Lys Asn Gln Leu
995 1000 1005
Leu Lys Phe Tyr Lys Asp Gly Lys Lys Ala Phe Ile Ser Glu Ile
1010 1015 1020
Gly Glu Glu Arg Tyr Ser Tyr Leu Leu Ser Glu Ile Glu Gly Glu
1025 1030 1035
Glu Glu Asn Lys Phe Arg Trp Asp Asn Leu Tyr Leu Tyr Tyr Thr
1040 1045 1050
Gln Leu Gly Arg Cys Met Tyr Ser Leu Glu Pro Ile Asp Ile Ser
1055 1060 1065
Glu Leu Ser Ser Lys Asn Ile Tyr Asp Gln Asp His Ile Tyr Pro
1070 1075 1080
Lys Ser Lys Ile Tyr Asp Asp Ser Ile Glu Asn Arg Val Leu Val
1085 1090 1095
Lys Lys Asp Leu Asn Ser Lys Lys Gly Asn Ser Tyr Pro Ile Pro
1100 1105 1110
Asp Glu Ile Leu Asn Lys Asn Cys Tyr Ala Tyr Trp Lys Ile Leu
1115 1120 1125
Tyr Asp Lys Gly Leu Ile Gly Gln Lys Lys Tyr Thr Arg Leu Thr
1130 1135 1140
Arg Arg Thr Gly Phe Thr Asp Asp Glu Leu Val Gln Phe Ile Ser
1145 1150 1155
Arg Gln Ile Val Glu Thr Arg Gln Ala Thr Lys Glu Thr Ala Asn
1160 1165 1170
Leu Leu Lys Thr Ile Cys Lys Asn Ser Glu Ile Val Tyr Ser Lys
1175 1180 1185
Ala Glu Asn Ala Ser Arg Phe Arg Gln Glu Phe Asp Ile Val Lys
1190 1195 1200
Cys Arg Ala Val Asn Asp Leu His His Met His Asp Ala Tyr Ile
1205 1210 1215
Asn Ile Ile Val Gly Asn Val Tyr Asn Thr Lys Phe Thr Lys Asp
1220 1225 1230
Pro Met Asn Phe Val Lys Lys Gln Glu Lys Ala Arg Ser Tyr Asn
1235 1240 1245
Leu Glu Asn Met Phe Lys Tyr Asp Val Lys Arg Gly Gly Tyr Thr
1250 1255 1260
Ala Trp Ile Ala Asp Asp Glu Lys Gly Thr Val Lys Asn Ala Ser
1265 1270 1275
Ile Lys Arg Ile Arg Lys Glu Leu Glu Gly Thr Asn Tyr Arg Phe
1280 1285 1290
Thr Arg Met Asn Tyr Ile Glu Ser Gly Ala Leu Phe Asn Ala Thr
1295 1300 1305
Leu Gln Arg Lys Asn Lys Gly Ser Arg Pro Leu Lys Asp Lys Gly
1310 1315 1320
Pro Lys Ser Ser Ile Glu Lys Tyr Gly Gly Tyr Thr Asn Ile Asn
1325 1330 1335
Lys Ala Cys Phe Ala Val Leu Asp Ile Lys Ser Lys Asn Lys Ile
1340 1345 1350
Glu Arg Lys Leu Met Pro Val Glu Arg Glu Ile Tyr Ala Lys Gln
1355 1360 1365
Lys Asn Asp Lys Lys Leu Ser Asp Glu Ile Phe Ser Lys Tyr Leu
1370 1375 1380
Lys Asp Arg Phe Gly Ile Glu Asp Tyr Arg Val Val Tyr Pro Val
1385 1390 1395
Val Lys Met Arg Thr Leu Leu Lys Ile Asp Gly Ser Tyr Tyr Phe
1400 1405 1410
Ile Thr Gly Gly Ser Asp Lys Thr Leu Glu Leu Arg Ser Ala Leu
1415 1420 1425
Gln Leu Ile Leu Pro Lys Lys Asn Glu Trp Ala Ile Lys Gln Ile
1430 1435 1440
Asp Lys Ser Ser Glu Asn Asp Tyr Leu Thr Ile Glu Arg Ile Gln
1445 1450 1455
Asp Leu Thr Glu Glu Leu Val Tyr Asn Thr Phe Asp Ile Ile Val
1460 1465 1470
Asn Lys Phe Lys Thr Ser Val Phe Lys Lys Ser Phe Leu Asn Leu
1475 1480 1485
Phe Gln Asp Asp Lys Ile Glu Asn Ile Asp Phe Lys Phe Lys Ser
1490 1495 1500
Met Asp Phe Lys Glu Lys Cys Lys Thr Leu Leu Met Leu Val Lys
1505 1510 1515
Ala Ile Arg Ala Ser Gly Val Arg Gln Asp Leu Lys Ser Ile Asp
1520 1525 1530
Leu Lys Ser Asp Tyr Gly Arg Leu Ser Ser Lys Thr Asn Asn Ile
1535 1540 1545
Gly Asn Tyr Gln Glu Phe Lys Ile Ile Asn Gln Ser Ile Thr Gly
1550 1555 1560
Leu Phe Glu Asn Glu Val Asp Leu Leu Lys Leu Gly Lys Arg Pro
1565 1570 1575
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1580 1585 1590
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro
1595 1600 1605
Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1610 1615 1620
<210> 17
<211> 1615
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 17
Met Pro Lys Lys Lys Arg Lys Val Thr Lys Val Lys Asp Tyr Tyr Ile
1 5 10 15
Gly Leu Ala Ile Gly Thr Ser Ser Val Gly Trp Ala Val Thr Asp Glu
20 25 30
Ala Tyr Asn Val Leu Lys Phe Asn Ser Lys Lys Met Trp Gly Val Arg
35 40 45
Leu Phe Asp Asp Ala Lys Thr Ala Glu Glu Arg Arg Gly Gln Arg Gly
50 55 60
Ala Arg Arg Arg Leu Asp Arg Lys Lys Glu Arg Leu Ser Leu Leu Gln
65 70 75 80
Asp Phe Phe Ala Glu Glu Val Ala Lys Val Asp Pro Asn Phe Phe Leu
85 90 95
Arg Leu Asp Asn Ser Asp Leu Tyr Met Glu Asp Lys Asp Gln Lys Leu
100 105 110
Lys Ser Lys Tyr Thr Leu Phe Asn Asp Lys Asp Phe Lys Asp Lys Asn
115 120 125
Phe His Lys Lys Tyr Pro Thr Ile His His Leu Leu Met Asp Leu Ile
130 135 140
Glu Asp Asp Ser Lys Lys Asp Ile Arg Leu Val Tyr Leu Ala Cys His
145 150 155 160
Tyr Leu Leu Lys Asn Arg Gly His Phe Ile Phe Glu Gly Gln Lys Phe
165 170 175
Asp Thr Lys Ser Ser Phe Glu Asn Ser Leu Asn Glu Leu Lys Val His
180 185 190
Leu Asn Asp Glu Tyr Gly Leu Asp Leu Glu Phe Asp Asn Glu Asn Leu
195 200 205
Ile Asn Ile Leu Thr Asp Pro Lys Leu Asn Lys Thr Ala Lys Lys Lys
210 215 220
Glu Leu Lys Ser Val Ile Gly Asp Thr Lys Phe Leu Lys Ala Val Ser
225 230 235 240
Ala Ile Met Ile Gly Ser Ser Gln Lys Leu Val Asp Leu Phe Glu Asn
245 250 255
Pro Glu Asp Phe Asp Asp Ser Ala Ile Lys Ser Val Asp Phe Ser Thr
260 265 270
Thr Ser Phe Asp Asp Lys Tyr Ser Asp Tyr Glu Leu Ala Leu Gly Asp
275 280 285
Lys Ile Ala Leu Val Asn Ile Leu Lys Glu Ile Tyr Asp Ser Ser Ile
290 295 300
Leu Glu Asn Leu Leu Lys Glu Ala Asp Lys Ser Lys Asp Gly Asn Lys
305 310 315 320
Tyr Ile Ser Asn Ala Phe Val Lys Lys Tyr Asn Lys His Gly Gln Asp
325 330 335
Leu Lys Glu Phe Lys Arg Leu Val Arg Gln Tyr His Lys Ser Ala Tyr
340 345 350
Phe Asp Ile Phe Arg Ser Glu Lys Val Asn Asp Asn Tyr Val Ser Tyr
355 360 365
Thr Lys Ser Ser Ile Ser Asn Asn Lys Arg Val Lys Ala Asn Lys Phe
370 375 380
Thr Asp Gln Glu Ala Phe Tyr Lys Phe Ala Lys Lys His Leu Glu Thr
385 390 395 400
Ile Lys Tyr Lys Ile Asn Lys Val Asn Gly Ser Lys Ala Asp Leu Glu
405 410 415
Leu Ile Asp Gly Met Leu Arg Asp Met Glu Phe Lys Asn Phe Met Pro
420 425 430
Lys Ile Lys Ser Ser Asp Asn Gly Val Ile Pro Tyr Gln Leu Lys Leu
435 440 445
Met Glu Leu Asn Lys Ile Leu Glu Asn Gln Ser Lys His His Glu Phe
450 455 460
Leu Asn Val Ser Asp Glu Tyr Gly Ser Val Cys Asp Lys Ile Ala Ser
465 470 475 480
Ile Met Glu Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Pro Asn
485 490 495
Ser Lys Tyr Ala Trp Ile Lys Lys Gln Lys Asp Ser Glu Ile Thr Pro
500 505 510
Trp Asn Phe Lys Asp Val Val Asp Leu Asp Ser Ser Arg Glu Glu Phe
515 520 525
Ile Asp Ser Leu Ile Gly Arg Cys Thr Tyr Leu Lys Asp Glu Lys Val
530 535 540
Leu Pro Lys Ala Ser Leu Leu Tyr Asn Glu Tyr Met Val Leu Asn Glu
545 550 555 560
Leu Asn Asn Leu Lys Leu Asn Asp Leu Pro Ile Thr Glu Glu Met Lys
565 570 575
Lys Lys Ile Phe Asp Gln Leu Phe Lys Thr Arg Lys Lys Val Thr Leu
580 585 590
Lys Ala Val Ala Asn Leu Leu Lys Lys Glu Phe Asn Ile Asn Gly Glu
595 600 605
Ile Leu Leu Ser Gly Thr Asp Gly Asp Phe Lys Gln Gly Leu Asn Ser
610 615 620
Tyr Asn Asp Phe Lys Ala Ile Val Gly Asp Lys Val Asp Ser Asp Asp
625 630 635 640
Tyr Arg Asp Lys Ile Glu Glu Ile Ile Lys Leu Ile Val Leu Tyr Gly
645 650 655
Asp Asp Lys Ser Tyr Leu Gln Lys Lys Ile Lys Ala Gly Tyr Gly Lys
660 665 670
Tyr Phe Thr Asp Ser Glu Ile Lys Lys Met Ala Gly Leu Asn Tyr Lys
675 680 685
Asp Trp Gly Arg Leu Ser Lys Lys Leu Leu Thr Gly Leu Glu Gly Ala
690 695 700
Asn Lys Ile Thr Gly Glu Arg Gly Ser Ile Ile His Phe Met Arg Glu
705 710 715 720
Tyr Asn Leu Asn Leu Met Glu Leu Met Ser Ala Ser Phe Thr Phe Thr
725 730 735
Glu Glu Ile Gln Lys Leu Asn Pro Val Asp Asp Arg Lys Leu Ser Tyr
740 745 750
Glu Met Val Asp Glu Leu Tyr Leu Ser Pro Ser Val Lys Arg Met Leu
755 760 765
Trp Gln Ser Leu Arg Ile Val Asp Glu Ile Lys Asn Ile Met Gly Thr
770 775 780
Asp Ser Lys Lys Ile Phe Ile Glu Met Ala Arg Gly Lys Glu Glu Val
785 790 795 800
Lys Ala Arg Lys Glu Ser Arg Lys Asn Gln Leu Leu Lys Phe Tyr Lys
805 810 815
Asp Gly Lys Lys Ala Phe Ile Ser Glu Ile Gly Glu Glu Arg Tyr Ser
820 825 830
Tyr Leu Leu Ser Glu Ile Glu Gly Glu Glu Glu Asn Lys Phe Arg Trp
835 840 845
Asp Asn Leu Tyr Leu Tyr Tyr Thr Gln Leu Gly Arg Cys Met Tyr Ser
850 855 860
Leu Glu Pro Ile Asp Ile Ser Glu Leu Ser Ser Lys Asn Ile Tyr Asp
865 870 875 880
Gln Asp His Ile Tyr Pro Lys Ser Lys Ile Tyr Asp Asp Ser Ile Glu
885 890 895
Asn Arg Val Leu Val Lys Lys Asp Leu Asn Ser Lys Lys Gly Asn Ser
900 905 910
Tyr Pro Ile Pro Asp Glu Ile Leu Asn Lys Asn Cys Tyr Ala Tyr Trp
915 920 925
Lys Ile Leu Tyr Asp Lys Gly Leu Ile Gly Gln Lys Lys Tyr Thr Arg
930 935 940
Leu Thr Arg Arg Thr Gly Phe Thr Asp Asp Glu Leu Val Gln Phe Ile
945 950 955 960
Ser Arg Gln Ile Val Glu Thr Arg Gln Ala Thr Lys Glu Thr Ala Asn
965 970 975
Leu Leu Lys Thr Ile Cys Lys Asn Ser Glu Ile Val Tyr Ser Lys Ala
980 985 990
Glu Asn Ala Ser Arg Phe Arg Gln Glu Phe Asp Ile Val Lys Cys Arg
995 1000 1005
Ala Val Asn Asp Leu His His Met His Asp Ala Tyr Ile Asn Ile
1010 1015 1020
Ile Val Gly Asn Val Tyr Asn Thr Lys Phe Thr Lys Asp Pro Met
1025 1030 1035
Asn Phe Val Lys Lys Gln Glu Lys Ala Arg Ser Tyr Asn Leu Glu
1040 1045 1050
Asn Met Phe Lys Tyr Asp Val Lys Arg Gly Gly Tyr Thr Ala Trp
1055 1060 1065
Ile Ala Asp Asp Glu Lys Gly Thr Val Lys Asn Ala Ser Ile Lys
1070 1075 1080
Arg Ile Arg Lys Glu Leu Glu Gly Thr Asn Tyr Arg Phe Thr Arg
1085 1090 1095
Met Asn Tyr Ile Glu Ser Gly Ala Leu Phe Asn Ala Thr Leu Gln
1100 1105 1110
Arg Lys Asn Lys Gly Ser Arg Pro Leu Lys Asp Lys Gly Pro Lys
1115 1120 1125
Ser Ser Ile Glu Lys Tyr Gly Gly Tyr Thr Asn Ile Asn Lys Ala
1130 1135 1140
Cys Phe Ala Val Leu Asp Ile Lys Ser Lys Asn Lys Ile Glu Arg
1145 1150 1155
Lys Leu Met Pro Val Glu Arg Glu Ile Tyr Ala Lys Gln Lys Asn
1160 1165 1170
Asp Lys Lys Leu Ser Asp Glu Ile Phe Ser Lys Tyr Leu Lys Asp
1175 1180 1185
Arg Phe Gly Ile Glu Asp Tyr Arg Val Val Tyr Pro Val Val Lys
1190 1195 1200
Met Arg Thr Leu Leu Lys Ile Asp Gly Ser Tyr Tyr Phe Ile Thr
1205 1210 1215
Gly Gly Ser Asp Lys Thr Leu Glu Leu Arg Ser Ala Leu Gln Leu
1220 1225 1230
Ile Leu Pro Lys Lys Asn Glu Trp Ala Ile Lys Gln Ile Asp Lys
1235 1240 1245
Ser Ser Glu Asn Asp Tyr Leu Thr Ile Glu Arg Ile Gln Asp Leu
1250 1255 1260
Thr Glu Glu Leu Val Tyr Asn Thr Phe Asp Ile Ile Val Asn Lys
1265 1270 1275
Phe Lys Thr Ser Val Phe Lys Lys Ser Phe Leu Asn Leu Phe Gln
1280 1285 1290
Asp Asp Lys Ile Glu Asn Ile Asp Phe Lys Phe Lys Ser Met Asp
1295 1300 1305
Phe Lys Glu Lys Cys Lys Thr Leu Leu Met Leu Val Lys Ala Ile
1310 1315 1320
Arg Ala Ser Gly Val Arg Gln Asp Leu Lys Ser Ile Asp Leu Lys
1325 1330 1335
Ser Asp Tyr Gly Arg Leu Ser Ser Lys Thr Asn Asn Ile Gly Asn
1340 1345 1350
Tyr Gln Glu Phe Lys Ile Ile Asn Gln Ser Ile Thr Gly Leu Phe
1355 1360 1365
Glu Asn Glu Val Asp Leu Leu Lys Leu Lys Arg Pro Ala Ala Thr
1370 1375 1380
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser Gly Ser Glu Thr
1385 1390 1395
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu
1400 1405 1410
Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu
1415 1420 1425
Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
1430 1435 1440
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
1445 1450 1455
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu
1460 1465 1470
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala
1475 1480 1485
Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala
1490 1495 1500
Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn
1505 1510 1515
Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His
1520 1525 1530
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
1535 1540 1545
Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg Met Pro Arg
1550 1555 1560
Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Pro
1565 1570 1575
Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Tyr Pro Tyr Asp Val
1580 1585 1590
Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro
1595 1600 1605
Tyr Asp Val Pro Asp Tyr Ala
1610 1615
<210> 18
<211> 1880
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 18
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Thr Ser Glu Lys Gly Pro
1 5 10 15
Ser Thr Gly Asp Pro Thr Leu Arg Arg Arg Ile Glu Ser Trp Glu Phe
20 25 30
Asp Val Phe Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu
35 40 45
Tyr Glu Ile Lys Trp Gly Met Ser Arg Lys Ile Trp Arg Ser Ser Gly
50 55 60
Lys Asn Thr Thr Asn His Val Glu Val Asn Phe Ile Lys Lys Phe Thr
65 70 75 80
Ser Glu Arg Arg Phe His Ser Ser Ile Ser Cys Ser Ile Thr Trp Phe
85 90 95
Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser Gln Ala Ile Arg Glu Phe
100 105 110
Leu Ser Gln His Pro Gly Val Thr Leu Val Ile Tyr Val Ala Arg Leu
115 120 125
Phe Trp His Met Asp Gln Arg Asn Arg Gln Gly Leu Arg Asp Leu Val
130 135 140
Asn Ser Gly Val Thr Ile Gln Ile Met Arg Ala Ser Glu Tyr Tyr His
145 150 155 160
Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro Gly Asp Glu Ala His Trp
165 170 175
Pro Gln Tyr Pro Pro Leu Trp Met Met Leu Tyr Ala Leu Glu Leu His
180 185 190
Cys Ile Ile Leu Ser Leu Pro Pro Cys Leu Lys Ile Ser Arg Arg Trp
195 200 205
Gln Asn His Leu Ala Phe Phe Arg Leu His Leu Gln Asn Cys His Tyr
210 215 220
Gln Thr Ile Pro Pro His Ile Leu Leu Ala Thr Gly Leu Ile His Pro
225 230 235 240
Ser Val Thr Trp Arg Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
245 250 255
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
260 265 270
Gly Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Thr
275 280 285
Lys Val Lys Asp Tyr Tyr Ile Gly Leu Ala Ile Gly Thr Ser Ser Val
290 295 300
Gly Trp Ala Val Thr Asp Glu Ala Tyr Asn Val Leu Lys Phe Asn Ser
305 310 315 320
Lys Lys Met Trp Gly Val Arg Leu Phe Asp Asp Ala Lys Thr Ala Glu
325 330 335
Glu Arg Arg Gly Gln Arg Gly Ala Arg Arg Arg Leu Asp Arg Lys Lys
340 345 350
Glu Arg Leu Ser Leu Leu Gln Asp Phe Phe Ala Glu Glu Val Ala Lys
355 360 365
Val Asp Pro Asn Phe Phe Leu Arg Leu Asp Asn Ser Asp Leu Tyr Met
370 375 380
Glu Asp Lys Asp Gln Lys Leu Lys Ser Lys Tyr Thr Leu Phe Asn Asp
385 390 395 400
Lys Asp Phe Lys Asp Lys Asn Phe His Lys Lys Tyr Pro Thr Ile His
405 410 415
His Leu Leu Met Asp Leu Ile Glu Asp Asp Ser Lys Lys Asp Ile Arg
420 425 430
Leu Val Tyr Leu Ala Cys His Tyr Leu Leu Lys Asn Arg Gly His Phe
435 440 445
Ile Phe Glu Gly Gln Lys Phe Asp Thr Lys Ser Ser Phe Glu Asn Ser
450 455 460
Leu Asn Glu Leu Lys Val His Leu Asn Asp Glu Tyr Gly Leu Asp Leu
465 470 475 480
Glu Phe Asp Asn Glu Asn Leu Ile Asn Ile Leu Thr Asp Pro Lys Leu
485 490 495
Asn Lys Thr Ala Lys Lys Lys Glu Leu Lys Ser Val Ile Gly Asp Thr
500 505 510
Lys Phe Leu Lys Ala Val Ser Ala Ile Met Ile Gly Ser Ser Gln Lys
515 520 525
Leu Val Asp Leu Phe Glu Asn Pro Glu Asp Phe Asp Asp Ser Ala Ile
530 535 540
Lys Ser Val Asp Phe Ser Thr Thr Ser Phe Asp Asp Lys Tyr Ser Asp
545 550 555 560
Tyr Glu Leu Ala Leu Gly Asp Lys Ile Ala Leu Val Asn Ile Leu Lys
565 570 575
Glu Ile Tyr Asp Ser Ser Ile Leu Glu Asn Leu Leu Lys Glu Ala Asp
580 585 590
Lys Ser Lys Asp Gly Asn Lys Tyr Ile Ser Asn Ala Phe Val Lys Lys
595 600 605
Tyr Asn Lys His Gly Gln Asp Leu Lys Glu Phe Lys Arg Leu Val Arg
610 615 620
Gln Tyr His Lys Ser Ala Tyr Phe Asp Ile Phe Arg Ser Glu Lys Val
625 630 635 640
Asn Asp Asn Tyr Val Ser Tyr Thr Lys Ser Ser Ile Ser Asn Asn Lys
645 650 655
Arg Val Lys Ala Asn Lys Phe Thr Asp Gln Glu Ala Phe Tyr Lys Phe
660 665 670
Ala Lys Lys His Leu Glu Thr Ile Lys Tyr Lys Ile Asn Lys Val Asn
675 680 685
Gly Ser Lys Ala Asp Leu Glu Leu Ile Asp Gly Met Leu Arg Asp Met
690 695 700
Glu Phe Lys Asn Phe Met Pro Lys Ile Lys Ser Ser Asp Asn Gly Val
705 710 715 720
Ile Pro Tyr Gln Leu Lys Leu Met Glu Leu Asn Lys Ile Leu Glu Asn
725 730 735
Gln Ser Lys His His Glu Phe Leu Asn Val Ser Asp Glu Tyr Gly Ser
740 745 750
Val Cys Asp Lys Ile Ala Ser Ile Met Glu Phe Arg Ile Pro Tyr Tyr
755 760 765
Val Gly Pro Leu Asn Pro Asn Ser Lys Tyr Ala Trp Ile Lys Lys Gln
770 775 780
Lys Asp Ser Glu Ile Thr Pro Trp Asn Phe Lys Asp Val Val Asp Leu
785 790 795 800
Asp Ser Ser Arg Glu Glu Phe Ile Asp Ser Leu Ile Gly Arg Cys Thr
805 810 815
Tyr Leu Lys Asp Glu Lys Val Leu Pro Lys Ala Ser Leu Leu Tyr Asn
820 825 830
Glu Tyr Met Val Leu Asn Glu Leu Asn Asn Leu Lys Leu Asn Asp Leu
835 840 845
Pro Ile Thr Glu Glu Met Lys Lys Lys Ile Phe Asp Gln Leu Phe Lys
850 855 860
Thr Arg Lys Lys Val Thr Leu Lys Ala Val Ala Asn Leu Leu Lys Lys
865 870 875 880
Glu Phe Asn Ile Asn Gly Glu Ile Leu Leu Ser Gly Thr Asp Gly Asp
885 890 895
Phe Lys Gln Gly Leu Asn Ser Tyr Asn Asp Phe Lys Ala Ile Val Gly
900 905 910
Asp Lys Val Asp Ser Asp Asp Tyr Arg Asp Lys Ile Glu Glu Ile Ile
915 920 925
Lys Leu Ile Val Leu Tyr Gly Asp Asp Lys Ser Tyr Leu Gln Lys Lys
930 935 940
Ile Lys Ala Gly Tyr Gly Lys Tyr Phe Thr Asp Ser Glu Ile Lys Lys
945 950 955 960
Met Ala Gly Leu Asn Tyr Lys Asp Trp Gly Arg Leu Ser Lys Lys Leu
965 970 975
Leu Thr Gly Leu Glu Gly Ala Asn Lys Ile Thr Gly Glu Arg Gly Ser
980 985 990
Ile Ile His Phe Met Arg Glu Tyr Asn Leu Asn Leu Met Glu Leu Met
995 1000 1005
Ser Ala Ser Phe Thr Phe Thr Glu Glu Ile Gln Lys Leu Asn Pro
1010 1015 1020
Val Asp Asp Arg Lys Leu Ser Tyr Glu Met Val Asp Glu Leu Tyr
1025 1030 1035
Leu Ser Pro Ser Val Lys Arg Met Leu Trp Gln Ser Leu Arg Ile
1040 1045 1050
Val Asp Glu Ile Lys Asn Ile Met Gly Thr Asp Ser Lys Lys Ile
1055 1060 1065
Phe Ile Glu Met Ala Arg Gly Lys Glu Glu Val Lys Ala Arg Lys
1070 1075 1080
Glu Ser Arg Lys Asn Gln Leu Leu Lys Phe Tyr Lys Asp Gly Lys
1085 1090 1095
Lys Ala Phe Ile Ser Glu Ile Gly Glu Glu Arg Tyr Ser Tyr Leu
1100 1105 1110
Leu Ser Glu Ile Glu Gly Glu Glu Glu Asn Lys Phe Arg Trp Asp
1115 1120 1125
Asn Leu Tyr Leu Tyr Tyr Thr Gln Leu Gly Arg Cys Met Tyr Ser
1130 1135 1140
Leu Glu Pro Ile Asp Ile Ser Glu Leu Ser Ser Lys Asn Ile Tyr
1145 1150 1155
Asp Gln Asp His Ile Tyr Pro Lys Ser Lys Ile Tyr Asp Asp Ser
1160 1165 1170
Ile Glu Asn Arg Val Leu Val Lys Lys Asp Leu Asn Ser Lys Lys
1175 1180 1185
Gly Asn Ser Tyr Pro Ile Pro Asp Glu Ile Leu Asn Lys Asn Cys
1190 1195 1200
Tyr Ala Tyr Trp Lys Ile Leu Tyr Asp Lys Gly Leu Ile Gly Gln
1205 1210 1215
Lys Lys Tyr Thr Arg Leu Thr Arg Arg Thr Gly Phe Thr Asp Asp
1220 1225 1230
Glu Leu Val Gln Phe Ile Ser Arg Gln Ile Val Glu Thr Arg Gln
1235 1240 1245
Ala Thr Lys Glu Thr Ala Asn Leu Leu Lys Thr Ile Cys Lys Asn
1250 1255 1260
Ser Glu Ile Val Tyr Ser Lys Ala Glu Asn Ala Ser Arg Phe Arg
1265 1270 1275
Gln Glu Phe Asp Ile Val Lys Cys Arg Ala Val Asn Asp Leu His
1280 1285 1290
His Met His Asp Ala Tyr Ile Asn Ile Ile Val Gly Asn Val Tyr
1295 1300 1305
Asn Thr Lys Phe Thr Lys Asp Pro Met Asn Phe Val Lys Lys Gln
1310 1315 1320
Glu Lys Ala Arg Ser Tyr Asn Leu Glu Asn Met Phe Lys Tyr Asp
1325 1330 1335
Val Lys Arg Gly Gly Tyr Thr Ala Trp Ile Ala Asp Asp Glu Lys
1340 1345 1350
Gly Thr Val Lys Asn Ala Ser Ile Lys Arg Ile Arg Lys Glu Leu
1355 1360 1365
Glu Gly Thr Asn Tyr Arg Phe Thr Arg Met Asn Tyr Ile Glu Ser
1370 1375 1380
Gly Ala Leu Phe Asn Ala Thr Leu Gln Arg Lys Asn Lys Gly Ser
1385 1390 1395
Arg Pro Leu Lys Asp Lys Gly Pro Lys Ser Ser Ile Glu Lys Tyr
1400 1405 1410
Gly Gly Tyr Thr Asn Ile Asn Lys Ala Cys Phe Ala Val Leu Asp
1415 1420 1425
Ile Lys Ser Lys Asn Lys Ile Glu Arg Lys Leu Met Pro Val Glu
1430 1435 1440
Arg Glu Ile Tyr Ala Lys Gln Lys Asn Asp Lys Lys Leu Ser Asp
1445 1450 1455
Glu Ile Phe Ser Lys Tyr Leu Lys Asp Arg Phe Gly Ile Glu Asp
1460 1465 1470
Tyr Arg Val Val Tyr Pro Val Val Lys Met Arg Thr Leu Leu Lys
1475 1480 1485
Ile Asp Gly Ser Tyr Tyr Phe Ile Thr Gly Gly Ser Asp Lys Thr
1490 1495 1500
Leu Glu Leu Arg Ser Ala Leu Gln Leu Ile Leu Pro Lys Lys Asn
1505 1510 1515
Glu Trp Ala Ile Lys Gln Ile Asp Lys Ser Ser Glu Asn Asp Tyr
1520 1525 1530
Leu Thr Ile Glu Arg Ile Gln Asp Leu Thr Glu Glu Leu Val Tyr
1535 1540 1545
Asn Thr Phe Asp Ile Ile Val Asn Lys Phe Lys Thr Ser Val Phe
1550 1555 1560
Lys Lys Ser Phe Leu Asn Leu Phe Gln Asp Asp Lys Ile Glu Asn
1565 1570 1575
Ile Asp Phe Lys Phe Lys Ser Met Asp Phe Lys Glu Lys Cys Lys
1580 1585 1590
Thr Leu Leu Met Leu Val Lys Ala Ile Arg Ala Ser Gly Val Arg
1595 1600 1605
Gln Asp Leu Lys Ser Ile Asp Leu Lys Ser Asp Tyr Gly Arg Leu
1610 1615 1620
Ser Ser Lys Thr Asn Asn Ile Gly Asn Tyr Gln Glu Phe Lys Ile
1625 1630 1635
Ile Asn Gln Ser Ile Thr Gly Leu Phe Glu Asn Glu Val Asp Leu
1640 1645 1650
Leu Lys Leu Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1655 1660 1665
Ala Lys Lys Lys Lys Gly Ser Ser Gly Gly Ser Gly Gly Ser Gly
1670 1675 1680
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
1685 1690 1695
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
1700 1705 1710
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
1715 1720 1725
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
1730 1735 1740
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
1745 1750 1755
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly
1760 1765 1770
Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1775 1780 1785
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1790 1795 1800
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1805 1810 1815
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1820 1825 1830
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1835 1840 1845
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Tyr Pro
1850 1855 1860
Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr
1865 1870 1875
Ala Tyr
1880
<210> 19
<211> 112
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 19
guuugagagu uauguaauug aaaaauuaca ugacgaguuc aaauaaaaau uuauucaaac 60
cgccuauuua uaggccgcag auguucugca uuaugcuugc uauugcaagc uu 112
<210> 20
<211> 1595
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 20
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Glu Val Glu Phe
1 5 10 15
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
20 25 30
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
35 40 45
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
65 70 75 80
Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
85 90 95
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
100 105 110
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
115 120 125
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
130 135 140
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg
145 150 155 160
Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr
165 170 175
Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
180 185 190
Pro Glu Ser Ser Gly Pro Lys Lys Lys Arg Lys Val Gly Gly Lys Pro
195 200 205
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
210 215 220
Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met Lys Val Leu Gly
225 230 235 240
Asn Thr Asp Lys Gln Ser Ile Lys Lys Asn Leu Leu Gly Ala Leu Leu
245 250 255
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
260 265 270
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Leu Arg Tyr Leu Gln Glu
275 280 285
Ile Phe Thr Gly Glu Met Asn Lys Val Asp Glu Asn Phe Phe Gln Arg
290 295 300
Leu Asp Asp Ser Phe Leu Val Asp Glu Asp Lys Arg Gly Glu His His
305 310 315 320
Pro Ile Phe Gly Asn Ile Ala Ala Glu Val Lys Tyr His Asp Asp Phe
325 330 335
Pro Thr Ile Tyr His Leu Arg Arg His Leu Ala Asp Thr Ser Lys Lys
340 345 350
Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His Met Ile Lys Phe
355 360 365
Arg Gly His Phe Leu Tyr Glu Gly Asp Leu Lys Ala Glu Asn Thr Asp
370 375 380
Val Gln Ala Leu Phe Lys Asp Phe Val Glu Glu Tyr Asp Lys Thr Ile
385 390 395 400
Glu Glu Ser His Leu Ser Glu Ile Thr Val Asp Ala Leu Ser Ile Leu
405 410 415
Thr Glu Lys Val Ser Lys Ser Ser Arg Leu Glu Asn Leu Ile Ala His
420 425 430
Tyr Pro Thr Glu Lys Lys Asn Thr Leu Phe Gly Asn Leu Ile Ala Leu
435 440 445
Ser Leu Asp Leu His Pro Asn Phe Lys Thr Asn Phe Gln Leu Ser Glu
450 455 460
Asp Ala Lys Leu Gln Phe Ser Lys Asp Thr Tyr Glu Glu Asp Leu Glu
465 470 475 480
Gly Phe Leu Gly Glu Val Gly Asp Glu Tyr Ala Asp Leu Phe Ala Ser
485 490 495
Ala Lys Asn Leu Tyr Asp Ala Ile Leu Leu Ser Gly Ile Leu Thr Val
500 505 510
Asp Asp Asn Ser Thr Lys Ala Pro Leu Ser Ala Ser Met Val Lys Arg
515 520 525
Tyr Glu Glu His Gln Lys Asp Leu Lys Lys Leu Lys Asp Phe Ile Lys
530 535 540
Val Asn Ala Pro Asp Gln Tyr Asn Ala Ile Phe Lys Asp Lys Asn Lys
545 550 555 560
Lys Gly Tyr Ala Ser Tyr Ile Glu Ser Gly Val Lys Gln Asp Glu Phe
565 570 575
Tyr Lys Tyr Leu Lys Gly Ile Leu Leu Lys Ile Asn Gly Ser Gly Asp
580 585 590
Phe Leu Asp Lys Ile Asp Arg Glu Asp Phe Leu Arg Lys Gln Arg Thr
595 600 605
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gln Glu Met His
610 615 620
Ala Ile Leu Arg Arg Gln Gly Glu His Tyr Pro Phe Leu Lys Glu Asn
625 630 635 640
Gln Asp Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
645 650 655
Gly Pro Leu Ala Arg Lys Gly Ser Arg Phe Ala Trp Ala Glu Tyr Lys
660 665 670
Ala Asp Glu Lys Ile Thr Pro Trp Asn Phe Asp Asp Ile Leu Asp Lys
675 680 685
Glu Lys Ser Ala Glu Lys Phe Ile Thr Arg Met Thr Leu Asn Asp Leu
690 695 700
Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser Pro Leu Tyr Glu
705 710 715 720
Ala Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Asn Glu
725 730 735
Gln Gly Glu Ala Lys Phe Phe Asp Thr Asn Met Lys Gln Glu Ile Phe
740 745 750
Asp His Val Phe Lys Glu Asn Arg Lys Val Thr Lys Asp Lys Leu Leu
755 760 765
Asn Tyr Leu Asn Lys Glu Phe Glu Glu Phe Arg Ile Val Asn Leu Thr
770 775 780
Gly Leu Asp Lys Glu Asn Lys Ala Phe Asn Ser Ser Leu Gly Thr Tyr
785 790 795 800
His Asp Leu Arg Lys Ile Leu Asp Lys Ser Phe Leu Asp Asp Lys Ala
805 810 815
Asn Glu Lys Thr Ile Glu Asp Ile Ile Gln Thr Leu Thr Leu Phe Glu
820 825 830
Asp Arg Glu Met Ile Arg Gln Arg Leu Gln Lys Tyr Ser Asp Ile Phe
835 840 845
Thr Lys Ala Gln Leu Lys Lys Leu Glu Arg Arg His Tyr Thr Gly Trp
850 855 860
Gly Arg Leu Ser Tyr Lys Leu Ile Asn Gly Ile Arg Asn Lys Glu Asn
865 870 875 880
Lys Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Tyr Ala Asn Arg
885 890 895
Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser Phe Lys Glu Glu
900 905 910
Ile Ala Arg Ala Gln Ile Ile Asp Asp Val Asp Asp Ile Ala Asn Val
915 920 925
Val His Asp Leu Pro Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
930 935 940
Ser Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly His Asn Pro
945 950 955 960
Ala Asn Ile Ile Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Asp Lys
965 970 975
Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys Leu Leu Gln Asp Ser Leu
980 985 990
Lys Asn Leu Asp Asn Pro Val Asn Ile Lys Asn Val Glu Asn Gln Gln
995 1000 1005
Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Ile Gln Asn Gly Lys
1010 1015 1020
Asp Met Tyr Thr Gly Glu Thr Leu Asp Ile Asn Asn Leu Ser Gln
1025 1030 1035
Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp Asn
1040 1045 1050
Ser Leu Asp Asn Arg Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1055 1060 1065
Lys Ser Asp Asp Val Pro Ser Ile Glu Val Val His Glu Met Lys
1070 1075 1080
Ser Phe Trp Ser Lys Leu Leu Ser Val Lys Leu Ile Thr Gln Arg
1085 1090 1095
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Glu
1100 1105 1110
Glu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1115 1120 1125
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Glu Arg Phe Asn
1130 1135 1140
Thr Glu Phe Asp Gly Asn Lys Arg Arg Ile Arg Asn Val Lys Ile
1145 1150 1155
Ile Thr Leu Lys Ser Asn Leu Val Ser Asn Phe Arg Lys Glu Phe
1160 1165 1170
Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Tyr His His Ala His
1175 1180 1185
Asp Ala Tyr Leu Asn Ala Val Val Gly Asn Ala Leu Leu Leu Lys
1190 1195 1200
Tyr Pro Gln Leu Glu Pro Glu Phe Val Tyr Gly Glu Tyr Pro Lys
1205 1210 1215
Tyr Asn Ser Tyr Arg Ser Arg Lys Ser Ala Thr Glu Lys Phe Leu
1220 1225 1230
Phe Tyr Ser Asn Ile Leu Arg Phe Phe Lys Lys Glu Asp Ile Gln
1235 1240 1245
Thr Asn Glu Asp Gly Glu Ile Ala Trp Asn Lys Glu Lys His Ile
1250 1255 1260
Lys Ile Leu Arg Lys Val Leu Ser Tyr Pro Gln Val Asn Ile Val
1265 1270 1275
Lys Lys Thr Glu Glu Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1280 1285 1290
Leu Pro Lys Gly Glu Ser Asp Lys Leu Ile Pro Arg Lys Thr Lys
1295 1300 1305
Asn Ser Tyr Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Val Val Ala Tyr Ser Ile Leu Val Phe Ala Asp Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Arg Lys Val Gln Asp Met Val Gly Ile Thr
1340 1345 1350
Ile Met Glu Lys Lys Arg Phe Glu Lys Asn Pro Val Asp Phe Leu
1355 1360 1365
Glu Gln Arg Gly Tyr Arg Asn Val Arg Leu Glu Lys Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Lys Arg Arg Arg
1385 1390 1395
Leu Leu Ala Ser Ala Lys Glu Leu Gln Lys Gly Asn Glu Leu Val
1400 1405 1410
Ile Pro Gln Arg Phe Thr Thr Leu Leu Tyr His Ser Tyr Arg Ile
1415 1420 1425
Glu Lys Asp Tyr Glu Pro Glu His Arg Glu Tyr Val Glu Lys His
1430 1435 1440
Lys Asp Glu Phe Lys Glu Leu Leu Glu Tyr Ile Ser Val Phe Ser
1445 1450 1455
Arg Lys Tyr Val Leu Ala Asp Asn Asn Leu Thr Lys Ile Glu Met
1460 1465 1470
Leu Phe Ser Lys Asn Lys Asp Ala Glu Val Ser Ser Leu Ala Lys
1475 1480 1485
Ser Phe Ile Ser Leu Leu Thr Phe Thr Ala Phe Gly Ala Pro Ala
1490 1495 1500
Ala Phe Asn Phe Phe Gly Glu Asn Ile Asp Arg Lys Arg Tyr Thr
1505 1510 1515
Ser Val Thr Glu Cys Leu Asn Ala Thr Leu Ile His Gln Ser Ile
1520 1525 1530
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Lys Leu Gly Glu
1535 1540 1545
Asp Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1550 1555 1560
Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1565 1570 1575
Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp
1580 1585 1590
Tyr Ala
1595
<210> 21
<211> 1863
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 21
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Thr Ser Glu Lys Gly Pro
1 5 10 15
Ser Thr Gly Asp Pro Thr Leu Arg Arg Arg Ile Glu Ser Trp Glu Phe
20 25 30
Asp Val Phe Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu
35 40 45
Tyr Glu Ile Lys Trp Gly Met Ser Arg Lys Ile Trp Arg Ser Ser Gly
50 55 60
Lys Asn Thr Thr Asn His Val Glu Val Asn Phe Ile Lys Lys Phe Thr
65 70 75 80
Ser Glu Arg Arg Phe His Ser Ser Ile Ser Cys Ser Ile Thr Trp Phe
85 90 95
Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser Gln Ala Ile Arg Glu Phe
100 105 110
Leu Ser Gln His Pro Gly Val Thr Leu Val Ile Tyr Val Ala Arg Leu
115 120 125
Phe Trp His Met Asp Gln Arg Asn Arg Gln Gly Leu Arg Asp Leu Val
130 135 140
Asn Ser Gly Val Thr Ile Gln Ile Met Arg Ala Ser Glu Tyr Tyr His
145 150 155 160
Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro Gly Asp Glu Ala His Trp
165 170 175
Pro Gln Tyr Pro Pro Leu Trp Met Met Leu Tyr Ala Leu Glu Leu His
180 185 190
Cys Ile Ile Leu Ser Leu Pro Pro Cys Leu Lys Ile Ser Arg Arg Trp
195 200 205
Gln Asn His Leu Ala Phe Phe Arg Leu His Leu Gln Asn Cys His Tyr
210 215 220
Gln Thr Ile Pro Pro His Ile Leu Leu Ala Thr Gly Leu Ile His Pro
225 230 235 240
Ser Val Thr Trp Arg Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
245 250 255
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
260 265 270
Gly Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Gly
275 280 285
Lys Pro Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
290 295 300
Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met Lys Val
305 310 315 320
Leu Gly Asn Thr Asp Lys Gln Ser Ile Lys Lys Asn Leu Leu Gly Ala
325 330 335
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
340 345 350
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Leu Arg Tyr Leu
355 360 365
Gln Glu Ile Phe Thr Gly Glu Met Asn Lys Val Asp Glu Asn Phe Phe
370 375 380
Gln Arg Leu Asp Asp Ser Phe Leu Val Asp Glu Asp Lys Arg Gly Glu
385 390 395 400
His His Pro Ile Phe Gly Asn Ile Ala Ala Glu Val Lys Tyr His Asp
405 410 415
Asp Phe Pro Thr Ile Tyr His Leu Arg Arg His Leu Ala Asp Thr Ser
420 425 430
Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His Met Ile
435 440 445
Lys Phe Arg Gly His Phe Leu Tyr Glu Gly Asp Leu Lys Ala Glu Asn
450 455 460
Thr Asp Val Gln Ala Leu Phe Lys Asp Phe Val Glu Glu Tyr Asp Lys
465 470 475 480
Thr Ile Glu Glu Ser His Leu Ser Glu Ile Thr Val Asp Ala Leu Ser
485 490 495
Ile Leu Thr Glu Lys Val Ser Lys Ser Ser Arg Leu Glu Asn Leu Ile
500 505 510
Ala His Tyr Pro Thr Glu Lys Lys Asn Thr Leu Phe Gly Asn Leu Ile
515 520 525
Ala Leu Ser Leu Asp Leu His Pro Asn Phe Lys Thr Asn Phe Gln Leu
530 535 540
Ser Glu Asp Ala Lys Leu Gln Phe Ser Lys Asp Thr Tyr Glu Glu Asp
545 550 555 560
Leu Glu Gly Phe Leu Gly Glu Val Gly Asp Glu Tyr Ala Asp Leu Phe
565 570 575
Ala Ser Ala Lys Asn Leu Tyr Asp Ala Ile Leu Leu Ser Gly Ile Leu
580 585 590
Thr Val Asp Asp Asn Ser Thr Lys Ala Pro Leu Ser Ala Ser Met Val
595 600 605
Lys Arg Tyr Glu Glu His Gln Lys Asp Leu Lys Lys Leu Lys Asp Phe
610 615 620
Ile Lys Val Asn Ala Pro Asp Gln Tyr Asn Ala Ile Phe Lys Asp Lys
625 630 635 640
Asn Lys Lys Gly Tyr Ala Ser Tyr Ile Glu Ser Gly Val Lys Gln Asp
645 650 655
Glu Phe Tyr Lys Tyr Leu Lys Gly Ile Leu Leu Lys Ile Asn Gly Ser
660 665 670
Gly Asp Phe Leu Asp Lys Ile Asp Arg Glu Asp Phe Leu Arg Lys Gln
675 680 685
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gln Glu
690 695 700
Met His Ala Ile Leu Arg Arg Gln Gly Glu His Tyr Pro Phe Leu Lys
705 710 715 720
Glu Asn Gln Asp Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
725 730 735
Tyr Val Gly Pro Leu Ala Arg Lys Gly Ser Arg Phe Ala Trp Ala Glu
740 745 750
Tyr Lys Ala Asp Glu Lys Ile Thr Pro Trp Asn Phe Asp Asp Ile Leu
755 760 765
Asp Lys Glu Lys Ser Ala Glu Lys Phe Ile Thr Arg Met Thr Leu Asn
770 775 780
Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser Pro Leu
785 790 795 800
Tyr Glu Ala Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
805 810 815
Asn Glu Gln Gly Glu Ala Lys Phe Phe Asp Thr Asn Met Lys Gln Glu
820 825 830
Ile Phe Asp His Val Phe Lys Glu Asn Arg Lys Val Thr Lys Asp Lys
835 840 845
Leu Leu Asn Tyr Leu Asn Lys Glu Phe Glu Glu Phe Arg Ile Val Asn
850 855 860
Leu Thr Gly Leu Asp Lys Glu Asn Lys Ala Phe Asn Ser Ser Leu Gly
865 870 875 880
Thr Tyr His Asp Leu Arg Lys Ile Leu Asp Lys Ser Phe Leu Asp Asp
885 890 895
Lys Ala Asn Glu Lys Thr Ile Glu Asp Ile Ile Gln Thr Leu Thr Leu
900 905 910
Phe Glu Asp Arg Glu Met Ile Arg Gln Arg Leu Gln Lys Tyr Ser Asp
915 920 925
Ile Phe Thr Lys Ala Gln Leu Lys Lys Leu Glu Arg Arg His Tyr Thr
930 935 940
Gly Trp Gly Arg Leu Ser Tyr Lys Leu Ile Asn Gly Ile Arg Asn Lys
945 950 955 960
Glu Asn Lys Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Tyr Ala
965 970 975
Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser Phe Lys
980 985 990
Glu Glu Ile Ala Arg Ala Gln Ile Ile Asp Asp Val Asp Asp Ile Ala
995 1000 1005
Asn Val Val His Asp Leu Pro Gly Ser Pro Ala Ile Lys Lys Gly
1010 1015 1020
Ile Leu Gln Ser Val Lys Ile Val Asp Glu Leu Val Lys Val Met
1025 1030 1035
Gly His Asn Pro Ala Asn Ile Ile Ile Glu Met Ala Arg Glu Asn
1040 1045 1050
Gln Thr Thr Asp Lys Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys
1055 1060 1065
Leu Leu Gln Asp Ser Leu Lys Asn Leu Asp Asn Pro Val Asn Ile
1070 1075 1080
Lys Asn Val Glu Asn Gln Gln Leu Gln Asn Asp Arg Leu Phe Leu
1085 1090 1095
Tyr Tyr Ile Gln Asn Gly Lys Asp Met Tyr Thr Gly Glu Thr Leu
1100 1105 1110
Asp Ile Asn Asn Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro
1115 1120 1125
Gln Ala Phe Ile Lys Asp Asn Ser Leu Asp Asn Arg Val Leu Thr
1130 1135 1140
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Ile
1145 1150 1155
Glu Val Val His Glu Met Lys Ser Phe Trp Ser Lys Leu Leu Ser
1160 1165 1170
Val Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala
1175 1180 1185
Glu Arg Gly Gly Leu Thr Glu Glu Asp Lys Ala Gly Phe Ile Lys
1190 1195 1200
Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln
1205 1210 1215
Ile Leu Asp Glu Arg Phe Asn Thr Glu Phe Asp Gly Asn Lys Arg
1220 1225 1230
Arg Ile Arg Asn Val Lys Ile Ile Thr Leu Lys Ser Asn Leu Val
1235 1240 1245
Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg Glu Ile
1250 1255 1260
Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
1265 1270 1275
Gly Asn Ala Leu Leu Leu Lys Tyr Pro Gln Leu Glu Pro Glu Phe
1280 1285 1290
Val Tyr Gly Glu Tyr Pro Lys Tyr Asn Ser Tyr Arg Ser Arg Lys
1295 1300 1305
Ser Ala Thr Glu Lys Phe Leu Phe Tyr Ser Asn Ile Leu Arg Phe
1310 1315 1320
Phe Lys Lys Glu Asp Ile Gln Thr Asn Glu Asp Gly Glu Ile Ala
1325 1330 1335
Trp Asn Lys Glu Lys His Ile Lys Ile Leu Arg Lys Val Leu Ser
1340 1345 1350
Tyr Pro Gln Val Asn Ile Val Lys Lys Thr Glu Glu Gln Thr Gly
1355 1360 1365
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Glu Ser Asp Lys
1370 1375 1380
Leu Ile Pro Arg Lys Thr Lys Asn Ser Tyr Trp Asp Pro Lys Lys
1385 1390 1395
Tyr Gly Gly Phe Asp Ser Pro Val Val Ala Tyr Ser Ile Leu Val
1400 1405 1410
Phe Ala Asp Val Glu Lys Gly Lys Ser Lys Lys Leu Arg Lys Val
1415 1420 1425
Gln Asp Met Val Gly Ile Thr Ile Met Glu Lys Lys Arg Phe Glu
1430 1435 1440
Lys Asn Pro Val Asp Phe Leu Glu Gln Arg Gly Tyr Arg Asn Val
1445 1450 1455
Arg Leu Glu Lys Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1460 1465 1470
Leu Glu Asn Lys Arg Arg Arg Leu Leu Ala Ser Ala Lys Glu Leu
1475 1480 1485
Gln Lys Gly Asn Glu Leu Val Ile Pro Gln Arg Phe Thr Thr Leu
1490 1495 1500
Leu Tyr His Ser Tyr Arg Ile Glu Lys Asp Tyr Glu Pro Glu His
1505 1510 1515
Arg Glu Tyr Val Glu Lys His Lys Asp Glu Phe Lys Glu Leu Leu
1520 1525 1530
Glu Tyr Ile Ser Val Phe Ser Arg Lys Tyr Val Leu Ala Asp Asn
1535 1540 1545
Asn Leu Thr Lys Ile Glu Met Leu Phe Ser Lys Asn Lys Asp Ala
1550 1555 1560
Glu Val Ser Ser Leu Ala Lys Ser Phe Ile Ser Leu Leu Thr Phe
1565 1570 1575
Thr Ala Phe Gly Ala Pro Ala Ala Phe Asn Phe Phe Gly Glu Asn
1580 1585 1590
Ile Asp Arg Lys Arg Tyr Thr Ser Val Thr Glu Cys Leu Asn Ala
1595 1600 1605
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1610 1615 1620
Asp Leu Ser Lys Leu Gly Glu Asp Gly Lys Arg Pro Ala Ala Thr
1625 1630 1635
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Ser Gly Gly
1640 1645 1650
Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
1655 1660 1665
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met
1670 1675 1680
Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
1685 1690 1695
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn
1700 1705 1710
Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
1715 1720 1725
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
1730 1735 1740
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp
1745 1750 1755
Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
1760 1765 1770
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys
1775 1780 1785
Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
1790 1795 1800
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys
1805 1810 1815
Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
1820 1825 1830
Lys Met Leu Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr
1835 1840 1845
Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1850 1855 1860
<210> 22
<211> 208
<212> PRT
<213> Petromyzon marinus
<400> 22
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 23
<211> 145
<212> PRT
<213> Homo sapiens
<400> 23
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Ala Pro
130 135 140
Val
145
<210> 24
<211> 198
<212> PRT
<213> Homo sapiens
<400> 24
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 25
<211> 198
<212> PRT
<213> Mus sp.
<400> 25
Met Asp Ser Leu Leu Met Lys Gln Lys Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Cys Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Glu
85 90 95
Phe Leu Arg Trp Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Gly Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Thr Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Met Leu Gly Phe
195
<210> 26
<211> 198
<212> PRT
<213> Canis lupus familiaris
<400> 26
Met Asp Ser Leu Leu Met Lys Gln Arg Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Ala Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Lys Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 27
<211> 199
<212> PRT
<213> Bos sp.
<400> 27
Met Asp Ser Leu Leu Lys Lys Gln Arg Gln Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Pro Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ala Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Asp Lys Glu Arg Lys Ala Glu Pro Glu Gly Leu Arg
115 120 125
Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp
130 135 140
Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe
145 150 155 160
Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln
165 170 175
Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp
180 185 190
Ala Phe Arg Thr Leu Gly Leu
195
<210> 28
<211> 239
<212> PRT
<213> Rattus sp.
<400> 28
Met Ala Val Gly Ser Lys Pro Lys Ala Ala Leu Val Gly Pro His Trp
1 5 10 15
Glu Arg Glu Arg Ile Trp Cys Phe Leu Cys Ser Thr Gly Leu Gly Thr
20 25 30
Gln Gln Thr Gly Gln Thr Ser Arg Trp Leu Arg Pro Ala Ala Thr Gln
35 40 45
Asp Pro Val Ser Pro Pro Arg Ser Leu Leu Met Lys Gln Arg Lys Phe
50 55 60
Leu Tyr His Phe Lys Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr
65 70 75 80
Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser
85 90 95
Leu Asp Phe Gly Tyr Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu
100 105 110
Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys
115 120 125
Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala
130 135 140
Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg
145 150 155 160
Ile Phe Thr Ala Arg Leu Thr Gly Trp Gly Ala Leu Pro Ala Gly Leu
165 170 175
Met Ser Pro Ala Arg Pro Ser Asp Tyr Phe Tyr Cys Trp Asn Thr Phe
180 185 190
Val Glu Asn His Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu
195 200 205
Asn Ser Val Arg Leu Ser Arg Arg Leu Arg Arg Ile Leu Leu Pro Leu
210 215 220
Tyr Glu Val Asp Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu
225 230 235
<210> 29
<211> 198
<212> PRT
<213> Canis lupus familiaris
<400> 29
Met Asp Ser Leu Leu Met Lys Gln Arg Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Ala Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Lys Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 30
<211> 199
<212> PRT
<213> Bos taurus
<400> 30
Met Asp Ser Leu Leu Lys Lys Gln Arg Gln Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Pro Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ala Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Asp Lys Glu Arg Lys Ala Glu Pro Glu Gly Leu Arg
115 120 125
Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp
130 135 140
Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe
145 150 155 160
Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln
165 170 175
Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp
180 185 190
Ala Phe Arg Thr Leu Gly Leu
195
<210> 31
<211> 198
<212> PRT
<213> Mus musculus
<400> 31
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 32
<211> 229
<212> PRT
<213> Rattus norvegicus
<400> 32
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 33
<211> 229
<212> PRT
<213> Mesocricetus auratus
<400> 33
Met Ser Ser Glu Thr Gly Pro Val Val Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Asp Ala Phe Phe Asp Gln Gly Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Arg Trp Gly Gly Arg His
35 40 45
Asn Ile Trp Arg His Thr Gly Gln Asn Thr Ser Arg His Val Glu Ile
50 55 60
Asn Phe Ile Glu Lys Phe Thr Ser Glu Arg Tyr Phe Tyr Pro Ser Thr
65 70 75 80
Arg Cys Ser Ile Val Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Lys Ala Ile Thr Glu Phe Leu Ser Gly His Pro Asn Val Thr Leu
100 105 110
Phe Ile Tyr Ala Ala Arg Leu Tyr His His Thr Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Arg Gly Val Thr Ile Arg Ile Met
130 135 140
Thr Glu Gln Glu Tyr Cys Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Ser Asn Glu Val Tyr Trp Pro Arg Tyr Pro Asn Leu Trp Met Arg
165 170 175
Leu Tyr Ala Leu Glu Leu Tyr Cys Ile His Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Lys Arg Arg His Gln Tyr Pro Leu Thr Phe Phe Arg Leu
195 200 205
Asn Leu Gln Ser Cys His Tyr Gln Arg Ile Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Phe Ile
225
<210> 34
<211> 236
<212> PRT
<213> Pongo pygmaeus
<400> 34
Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Ser Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45
Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Arg Phe His Ser Ser Ile
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Gln Ala Ile Arg Glu Phe Leu Ser Gln His Pro Gly Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Ala Phe Phe Arg Leu
195 200 205
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220
Ala Thr Gly Leu Ile His Pro Ser Val Thr Trp Arg
225 230 235
<210> 35
<211> 236
<212> PRT
<213> Oryctolagus cuniculus
<400> 35
Met Ala Ser Glu Lys Gly Pro Ser Asn Lys Asp Tyr Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Glu Val Phe Phe Asp Pro Gln Glu Leu
20 25 30
Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Ala Ser Ser
35 40 45
Lys Thr Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Leu Glu Lys Leu Thr Ser Glu Gly Arg Leu Gly Pro Ser Thr
65 70 75 80
Cys Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Met Ala Ile Arg Glu Phe Leu Ser Gln His Pro Gly Val Thr Leu
100 105 110
Ile Ile Phe Val Ala Arg Leu Phe Gln His Met Asp Arg Arg Asn Arg
115 120 125
Gln Gly Leu Lys Asp Leu Val Thr Ser Gly Val Thr Val Arg Val Met
130 135 140
Ser Val Ser Glu Tyr Cys Tyr Cys Trp Glu Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Lys Ala Ala Gln Trp Pro Arg Tyr Pro Pro Arg Trp Met Leu
165 170 175
Met Tyr Ala Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg His Gln Lys Gln Leu Thr Phe Phe Ser Leu
195 200 205
Thr Pro Gln Tyr Cys His Tyr Lys Met Ile Pro Pro Tyr Ile Leu Leu
210 215 220
Ala Thr Gly Leu Leu Gln Pro Ser Val Pro Trp Arg
225 230 235
<210> 36
<211> 235
<212> PRT
<213> Monodelphis domestica
<400> 36
Met Asn Ser Lys Thr Gly Pro Ser Val Gly Asp Ala Thr Leu Arg Arg
1 5 10 15
Arg Ile Lys Pro Trp Glu Phe Val Ala Phe Phe Asn Pro Gln Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Asn Gln Asn
35 40 45
Ile Trp Arg His Ser Asn Gln Asn Thr Ser Gln His Ala Glu Ile Asn
50 55 60
Phe Met Glu Lys Phe Thr Ala Glu Arg His Phe Asn Ser Ser Val Arg
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser
85 90 95
Lys Ala Ile Arg Lys Phe Leu Asp His Tyr Pro Asn Val Thr Leu Ala
100 105 110
Ile Phe Ile Ser Arg Leu Tyr Trp His Met Asp Gln Gln His Arg Gln
115 120 125
Gly Leu Lys Glu Leu Val His Ser Gly Val Thr Ile Gln Ile Met Ser
130 135 140
Tyr Ser Glu Tyr His Tyr Cys Trp Arg Asn Phe Val Asp Tyr Pro Gln
145 150 155 160
Gly Glu Glu Asp Tyr Trp Pro Lys Tyr Pro Tyr Leu Trp Ile Met Leu
165 170 175
Tyr Val Leu Glu Leu His Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Lys Ile Ser Gly Ser His Ser Asn Gln Leu Ala Leu Phe Ser Leu Asp
195 200 205
Leu Gln Asp Cys His Tyr Gln Lys Ile Pro Tyr Asn Val Leu Val Ala
210 215 220
Thr Gly Leu Val Gln Pro Phe Val Thr Trp Arg
225 230 235
<210> 37
<211> 224
<212> PRT
<213> Pongo pygmaeus
<400> 37
Met Ala Gln Lys Glu Glu Ala Ala Ala Ala Thr Glu Ala Ala Ser Gln
1 5 10 15
Asn Gly Glu Asp Leu Glu Asn Leu Asp Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Gly Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Ala
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Ile Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Leu
145 150 155 160
Glu Ile Gln Asp Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Val Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Gln Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 38
<211> 224
<212> PRT
<213> Bos taurus
<400> 38
Met Ala Gln Lys Glu Glu Ala Ala Ala Ala Ala Glu Pro Ala Ser Gln
1 5 10 15
Asn Gly Glu Glu Val Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala His Tyr Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Thr
85 90 95
Asn His Ala Glu Glu Ala Phe Phe Asn Ser Ile Met Pro Thr Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Met Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Val Lys Thr Leu Asn Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Ile Gln Ala Ala Leu Arg Lys Leu Lys Glu Ala Gly Cys Arg Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 39
<211> 440
<212> PRT
<213> Mus musculus
<400> 39
Met Gln Pro Gln Arg Leu Gly Pro Arg Ala Gly Met Gly Pro Phe Cys
1 5 10 15
Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro Ile Arg Asn Leu Ile
20 25 30
Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn Leu Gly Tyr Ala Lys
35 40 45
Gly Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val Thr Arg Lys Asp Cys
50 55 60
Asp Ser Pro Val Ser Leu His His Gly Val Phe Lys Asn Lys Asp Asn
65 70 75 80
Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe His Asp Lys Val Leu
85 90 95
Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile Thr Trp Tyr Met Ser
100 105 110
Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Ile Val Arg Phe Leu Ala
115 120 125
Thr His His Asn Leu Ser Leu Asp Ile Phe Ser Ser Arg Leu Tyr Asn
130 135 140
Val Gln Asp Pro Glu Thr Gln Gln Asn Leu Cys Arg Leu Val Gln Glu
145 150 155 160
Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu Phe Lys Lys Cys Trp
165 170 175
Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe Arg Pro Trp Lys Arg
180 185 190
Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys Leu Gln Glu Ile Leu
195 200 205
Arg Pro Cys Tyr Ile Ser Val Pro Ser Ser Ser Ser Ser Thr Leu Ser
210 215 220
Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr Arg Phe Trp Val Glu
225 230 235 240
Gly Arg Arg Met Asp Pro Leu Ser Glu Glu Glu Phe Tyr Ser Gln Phe
245 250 255
Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr His Arg Met Lys Pro
260 265 270
Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly Gln Ala Pro Leu Lys
275 280 285
Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe
290 295 300
Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys
305 310 315 320
Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala
325 330 335
Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg
340 345 350
Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys Ser Leu
355 360 365
Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp Leu Pro Gln Phe Thr
370 375 380
Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg Pro Phe Trp Pro Trp
385 390 395 400
Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln Arg Arg Leu Arg Arg
405 410 415
Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val Asn Asp Phe Gly Asn
420 425 430
Leu Gln Leu Gly Pro Pro Met Ser
435 440
<210> 40
<211> 429
<212> PRT
<213> Mus sp.
<400> 40
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Leu Gly Tyr Ala Lys Gly Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val
35 40 45
Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val Phe
50 55 60
Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe
65 70 75 80
His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile
85 90 95
Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Ile
100 105 110
Val Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe Ser
115 120 125
Ser Arg Leu Tyr Asn Val Gln Asp Pro Glu Thr Gln Gln Asn Leu Cys
130 135 140
Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu
145 150 155 160
Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe
165 170 175
Arg Pro Trp Lys Arg Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys
180 185 190
Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser Ser
195 200 205
Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr
210 215 220
Arg Phe Cys Val Glu Gly Arg Arg Met Asp Pro Leu Ser Glu Glu Glu
225 230 235 240
Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr
245 250 255
His Arg Met Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly
260 265 270
Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His
275 280 285
Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln
290 295 300
Val Thr Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
305 310 315 320
Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His
325 330 335
Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys
340 345 350
Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp
355 360 365
Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg
370 375 380
Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln
385 390 395 400
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val
405 410 415
Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425
<210> 41
<211> 430
<212> PRT
<213> Rattus sp.
<400> 41
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Arg Leu Arg Tyr Ala Ile Asp Arg Lys Asp Thr Phe Leu Cys Tyr Glu
35 40 45
Val Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val
50 55 60
Phe Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp
65 70 75 80
Phe His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys
85 90 95
Ile Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln
100 105 110
Val Leu Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe
115 120 125
Ser Ser Arg Leu Tyr Asn Ile Arg Asp Pro Glu Asn Gln Gln Asn Leu
130 135 140
Cys Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr
145 150 155 160
Glu Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg
165 170 175
Phe Arg Pro Trp Lys Lys Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser
180 185 190
Lys Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser
195 200 205
Ser Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu
210 215 220
Thr Arg Phe Cys Val Glu Arg Arg Arg Val His Leu Leu Ser Glu Glu
225 230 235 240
Glu Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr
245 250 255
Tyr His Gly Val Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn
260 265 270
Gly Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln
275 280 285
His Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser
290 295 300
Gln Val Ile Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys
305 310 315 320
Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu
325 330 335
His Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln
340 345 350
Lys Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met
355 360 365
Asp Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys
370 375 380
Arg Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr
385 390 395 400
Gln Arg Arg Leu His Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu
405 410 415
Val Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425 430
<210> 42
<211> 199
<212> PRT
<213> Homo sapiens
<400> 42
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 43
<211> 373
<212> PRT
<213> Homo sapiens
<400> 43
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Arg
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln Pro Glu His
50 55 60
His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro
65 70 75 80
Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys
85 90 95
Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu His Pro Asn
100 105 110
Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg
115 120 125
Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg Val
130 135 140
Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe Val
145 150 155 160
Tyr Ser Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn
165 170 175
Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met
180 185 190
Glu Ala Met Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Arg
195 200 205
Lys Ala Tyr Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val
210 215 220
Val Lys His His Ser Pro Val Ser Trp Lys Arg Gly Val Phe Arg Asn
225 230 235 240
Gln Val Asp Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser
245 250 255
Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr
260 265 270
Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala
275 280 285
Glu Phe Leu Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala
290 295 300
Arg Leu Tyr Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Arg Ser
305 310 315 320
Leu Ser Gln Glu Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp Phe
325 330 335
Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Asp Asp Glu Pro Phe Lys
340 345 350
Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys Leu
355 360 365
Gln Glu Ile Leu Glu
370
<210> 44
<211> 370
<212> PRT
<213> Macaca mulatta
<400> 44
Met Val Glu Pro Met Asp Pro Arg Thr Phe Val Ser Asn Phe Asn Asn
1 5 10 15
Arg Pro Ile Leu Ser Gly Leu Asn Thr Val Trp Leu Cys Cys Glu Val
20 25 30
Lys Thr Lys Asp Pro Ser Gly Pro Pro Leu Asp Ala Lys Ile Phe Gln
35 40 45
Gly Lys Val Tyr Ser Lys Ala Lys Tyr His Pro Glu Met Arg Phe Leu
50 55 60
Arg Trp Phe His Lys Trp Arg Gln Leu His His Asp Gln Glu Tyr Lys
65 70 75 80
Val Thr Trp Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser
85 90 95
Val Ala Thr Phe Leu Ala Lys Asp Pro Lys Val Thr Leu Thr Ile Phe
100 105 110
Val Ala Arg Leu Tyr Tyr Phe Trp Lys Pro Asp Tyr Gln Gln Ala Leu
115 120 125
Arg Ile Leu Cys Gln Lys Arg Gly Gly Pro His Ala Thr Met Lys Ile
130 135 140
Met Asn Tyr Asn Glu Phe Gln Asp Cys Trp Asn Lys Phe Val Asp Gly
145 150 155 160
Arg Gly Lys Pro Phe Lys Pro Arg Asn Asn Leu Pro Lys His Tyr Thr
165 170 175
Leu Leu Gln Ala Thr Leu Gly Glu Leu Leu Arg His Leu Met Asp Pro
180 185 190
Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro Trp Val Ser Gly Gln
195 200 205
His Glu Thr Tyr Leu Cys Tyr Lys Val Glu Arg Leu His Asn Asp Thr
210 215 220
Trp Val Pro Leu Asn Gln His Arg Gly Phe Leu Arg Asn Gln Ala Pro
225 230 235 240
Asn Ile His Gly Phe Pro Lys Gly Arg His Ala Glu Leu Cys Phe Leu
245 250 255
Asp Leu Ile Pro Phe Trp Lys Leu Asp Gly Gln Gln Tyr Arg Val Thr
260 265 270
Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Met Ala
275 280 285
Lys Phe Ile Ser Asn Asn Glu His Val Ser Leu Cys Ile Phe Ala Ala
290 295 300
Arg Ile Tyr Asp Asp Gln Gly Arg Tyr Gln Glu Gly Leu Arg Ala Leu
305 310 315 320
His Arg Asp Gly Ala Lys Ile Ala Met Met Asn Tyr Ser Glu Phe Glu
325 330 335
Tyr Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
340 345 350
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
355 360 365
Ala Ile
370
<210> 45
<211> 384
<212> PRT
<213> Pan troglodytes
<400> 45
Met Lys Pro His Phe Arg Asn Pro Val Glu Arg Met Tyr Gln Asp Thr
1 5 10 15
Phe Ser Asp Asn Phe Tyr Asn Arg Pro Ile Leu Ser His Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Lys Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Glu Leu Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Leu His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu His Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Asn Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Lys Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser
355 360 365
Gln Ala Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 46
<211> 377
<212> PRT
<213> Chlorocebus sp.
<400> 46
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp Ile
1 5 10 15
Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser Gly Pro Pro
35 40 45
Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro Glu Ala Lys Asp
50 55 60
His Pro Glu Met Lys Phe Leu His Trp Phe Arg Lys Trp Arg Gln Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Val Ser Trp Ser Pro
85 90 95
Cys Thr Arg Cys Ala Asn Ser Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Lys
115 120 125
Pro Asp Tyr Gln Gln Ala Leu Arg Ile Leu Cys Gln Glu Arg Gly Gly
130 135 140
Pro His Ala Thr Met Lys Ile Met Asn Tyr Asn Glu Phe Gln His Cys
145 150 155 160
Trp Asn Glu Phe Val Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys
165 170 175
Asn Leu Pro Lys His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu
180 185 190
Leu Arg His Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Lys Pro Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val
210 215 220
Glu Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
225 230 235 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys Leu Asp
260 265 270
Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe
275 280 285
Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn Asn Lys His Val
290 295 300
Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys
305 310 315 320
Gln Glu Gly Leu Arg Thr Leu His Arg Asp Gly Ala Lys Ile Ala Val
325 330 335
Met Asn Tyr Ser Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Asp Arg
340 345 350
Gln Gly Arg Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln
355 360 365
Ala Leu Ser Gly Arg Leu Arg Ala Ile
370 375
<210> 47
<211> 384
<212> PRT
<213> Homo sapiens
<400> 47
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
195 200 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
355 360 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 48
<211> 373
<212> PRT
<213> Homo sapiens
<400> 48
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Arg
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln Pro Glu His
50 55 60
His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro
65 70 75 80
Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys
85 90 95
Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu His Pro Asn
100 105 110
Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg
115 120 125
Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg Val
130 135 140
Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe Val
145 150 155 160
Tyr Ser Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn
165 170 175
Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met
180 185 190
Glu Ala Met Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Arg
195 200 205
Lys Ala Tyr Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val
210 215 220
Val Lys His His Ser Pro Val Ser Trp Lys Arg Gly Val Phe Arg Asn
225 230 235 240
Gln Val Asp Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser
245 250 255
Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr
260 265 270
Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala
275 280 285
Glu Phe Leu Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala
290 295 300
Arg Leu Tyr Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Arg Ser
305 310 315 320
Leu Ser Gln Glu Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp Phe
325 330 335
Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Asp Asp Glu Pro Phe Lys
340 345 350
Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys Leu
355 360 365
Gln Glu Ile Leu Glu
370
<210> 49
<211> 382
<212> PRT
<213> Homo sapiens
<400> 49
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr Phe Lys Pro Gln
50 55 60
Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ser Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Thr Ile Met Asp Tyr Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Gln Phe Met Pro Trp Tyr Lys Phe Asp Glu
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Tyr Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg Arg Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Glu Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 50
<211> 395
<212> PRT
<213> Rattus sp.
<400> 50
Met Gln Pro Gln Gly Leu Gly Pro Asn Ala Gly Met Gly Pro Val Cys
1 5 10 15
Leu Gly Cys Ser His Arg Arg Pro Tyr Ser Pro Ile Arg Asn Pro Leu
20 25 30
Lys Lys Leu Tyr Gln Gln Thr Phe Tyr Phe His Phe Lys Asn Val Arg
35 40 45
Tyr Ala Trp Gly Arg Lys Asn Asn Phe Leu Cys Tyr Glu Val Asn Gly
50 55 60
Met Asp Cys Ala Leu Pro Val Pro Leu Arg Gln Gly Val Phe Arg Lys
65 70 75 80
Gln Gly His Ile His Ala Glu Leu Cys Phe Ile Tyr Trp Phe His Asp
85 90 95
Lys Val Leu Arg Val Leu Ser Pro Met Glu Glu Phe Lys Val Thr Trp
100 105 110
Tyr Met Ser Trp Ser Pro Cys Ser Lys Cys Ala Glu Gln Val Ala Arg
115 120 125
Phe Leu Ala Ala His Arg Asn Leu Ser Leu Ala Ile Phe Ser Ser Arg
130 135 140
Leu Tyr Tyr Tyr Leu Arg Asn Pro Asn Tyr Gln Gln Lys Leu Cys Arg
145 150 155 160
Leu Ile Gln Glu Gly Val His Val Ala Ala Met Asp Leu Pro Glu Phe
165 170 175
Lys Lys Cys Trp Asn Lys Phe Val Asp Asn Asp Gly Gln Pro Phe Arg
180 185 190
Pro Trp Met Arg Leu Arg Ile Asn Phe Ser Phe Tyr Asp Cys Lys Leu
195 200 205
Gln Glu Ile Phe Ser Arg Met Asn Leu Leu Arg Glu Asp Val Phe Tyr
210 215 220
Leu Gln Phe Asn Asn Ser His Arg Val Lys Pro Val Gln Asn Arg Tyr
225 230 235 240
Tyr Arg Arg Lys Ser Tyr Leu Cys Tyr Gln Leu Glu Arg Ala Asn Gly
245 250 255
Gln Glu Pro Leu Lys Gly Tyr Leu Leu Tyr Lys Lys Gly Glu Gln His
260 265 270
Val Glu Ile Leu Phe Leu Glu Lys Met Arg Ser Met Glu Leu Ser Gln
275 280 285
Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
290 295 300
Arg Gln Leu Ala Ala Phe Lys Lys Asp His Pro Asp Leu Ile Leu Arg
305 310 315 320
Ile Tyr Thr Ser Arg Leu Tyr Phe Trp Arg Lys Lys Phe Gln Lys Gly
325 330 335
Leu Cys Thr Leu Trp Arg Ser Gly Ile His Val Asp Val Met Asp Leu
340 345 350
Pro Gln Phe Ala Asp Cys Trp Thr Asn Phe Val Asn Pro Gln Arg Pro
355 360 365
Phe Arg Pro Trp Asn Glu Leu Glu Lys Asn Ser Trp Arg Ile Gln Arg
370 375 380
Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu
385 390 395
<210> 51
<211> 227
<212> PRT
<213> Bos sp.
<400> 51
Met Asp Gly Trp Glu Val Ala Phe Arg Ser Gly Thr Val Leu Lys Ala
1 5 10 15
Gly Val Leu Gly Val Ser Met Thr Glu Gly Trp Ala Gly Ser Gly His
20 25 30
Pro Gly Gln Gly Ala Cys Val Trp Thr Pro Gly Thr Arg Asn Thr Met
35 40 45
Asn Leu Leu Arg Glu Val Leu Phe Lys Gln Gln Phe Gly Asn Gln Pro
50 55 60
Arg Val Pro Ala Pro Tyr Tyr Arg Arg Lys Thr Tyr Leu Cys Tyr Gln
65 70 75 80
Leu Lys Gln Arg Asn Asp Leu Thr Leu Asp Arg Gly Cys Phe Arg Asn
85 90 95
Lys Lys Gln Arg His Ala Glu Arg Phe Ile Asp Lys Ile Asn Ser Leu
100 105 110
Asp Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile Thr Trp
115 120 125
Ser Pro Cys Pro Asn Cys Ala Asn Glu Leu Val Asn Phe Ile Thr Arg
130 135 140
Asn Asn His Leu Lys Leu Glu Ile Phe Ala Ser Arg Leu Tyr Phe His
145 150 155 160
Trp Ile Lys Ser Phe Lys Met Gly Leu Gln Asp Leu Gln Asn Ala Gly
165 170 175
Ile Ser Val Ala Val Met Thr His Thr Glu Phe Glu Asp Cys Trp Glu
180 185 190
Gln Phe Val Asp Asn Gln Ser Arg Pro Phe Gln Pro Trp Asp Lys Leu
195 200 205
Glu Gln Tyr Ser Ala Ser Ile Arg Arg Arg Leu Gln Arg Ile Leu Thr
210 215 220
Ala Pro Ile
225
<210> 52
<211> 490
<212> PRT
<213> Pan troglodytes
<400> 52
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Trp Met Tyr Gln Arg Thr
1 5 10 15
Phe Tyr Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly His Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Ser Gln Pro Glu
50 55 60
His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Ser Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Lys Phe Leu Ala Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Ile Arg His Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg His Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Gln Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Val Arg Ala Ser Ser Leu
370 375 380
Cys Met Val Pro His Arg Pro Pro Pro Pro Pro Gln Ser Pro Gly Pro
385 390 395 400
Cys Leu Pro Leu Cys Ser Glu Pro Pro Leu Gly Ser Leu Leu Pro Thr
405 410 415
Gly Arg Pro Ala Pro Ser Leu Pro Phe Leu Leu Thr Ala Ser Phe Ser
420 425 430
Phe Pro Pro Pro Ala Ser Leu Pro Pro Leu Pro Ser Leu Ser Leu Ser
435 440 445
Pro Gly His Leu Pro Val Pro Ser Phe His Ser Leu Thr Ser Cys Ser
450 455 460
Ile Gln Pro Pro Cys Ser Ser Arg Ile Arg Glu Thr Glu Gly Trp Ala
465 470 475 480
Ser Val Ser Lys Glu Gly Arg Asp Leu Gly
485 490
<210> 53
<211> 190
<212> PRT
<213> Homo sapiens
<400> 53
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Lys Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Asp Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Tyr
115 120 125
Pro Cys Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Glu Ile Met Asp Tyr Glu Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asn Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Thr
165 170 175
Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ser Leu Gln
180 185 190
<210> 54
<211> 190
<212> PRT
<213> Gorilla gorilla
<400> 54
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Glu Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Asn Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Asp
115 120 125
Thr Asp Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Lys Ile Met Asp Tyr Lys Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr
165 170 175
Asn Phe Arg Phe Leu Lys Arg Arg Leu Gln Glu Ile Leu Glu
180 185 190
<210> 55
<211> 199
<212> PRT
<213> Homo sapiens
<400> 55
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 56
<211> 202
<212> PRT
<213> Macaca mulatta
<400> 56
Met Asp Gly Ser Pro Ala Ser Arg Pro Arg His Leu Met Asp Pro Asn
1 5 10 15
Thr Phe Thr Phe Asn Phe Asn Asn Asp Leu Ser Val Arg Gly Arg His
20 25 30
Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Trp
35 40 45
Val Pro Met Asp Glu Arg Arg Gly Phe Leu Cys Asn Lys Ala Lys Asn
50 55 60
Val Pro Cys Gly Asp Tyr Gly Cys His Val Glu Leu Arg Phe Leu Cys
65 70 75 80
Glu Val Pro Ser Trp Gln Leu Asp Pro Ala Gln Thr Tyr Arg Val Thr
85 90 95
Trp Phe Ile Ser Trp Ser Pro Cys Phe Arg Arg Gly Cys Ala Gly Gln
100 105 110
Val Arg Val Phe Leu Gln Glu Asn Lys His Val Arg Leu Arg Ile Phe
115 120 125
Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Gln Glu Ala Leu Arg
130 135 140
Thr Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Glu Glu
145 150 155 160
Phe Lys His Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe
165 170 175
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg
180 185 190
Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
195 200
<210> 57
<211> 185
<212> PRT
<213> Bos sp.
<400> 57
Met Asp Glu Tyr Thr Phe Thr Glu Asn Phe Asn Asn Gln Gly Trp Pro
1 5 10 15
Ser Lys Thr Tyr Leu Cys Tyr Glu Met Glu Arg Leu Asp Gly Asp Ala
20 25 30
Thr Ile Pro Leu Asp Glu Tyr Lys Gly Phe Val Arg Asn Lys Gly Leu
35 40 45
Asp Gln Pro Glu Lys Pro Cys His Ala Glu Leu Tyr Phe Leu Gly Lys
50 55 60
Ile His Ser Trp Asn Leu Asp Arg Asn Gln His Tyr Arg Leu Thr Cys
65 70 75 80
Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Gln Lys Leu Thr Thr
85 90 95
Phe Leu Lys Glu Asn His His Ile Ser Leu His Ile Leu Ala Ser Arg
100 105 110
Ile Tyr Thr His Asn Arg Phe Gly Cys His Gln Ser Gly Leu Cys Glu
115 120 125
Leu Gln Ala Ala Gly Ala Arg Ile Thr Ile Met Thr Phe Glu Asp Phe
130 135 140
Lys His Cys Trp Glu Thr Phe Val Asp His Lys Gly Lys Pro Phe Gln
145 150 155 160
Pro Trp Glu Gly Leu Asn Val Lys Ser Gln Ala Leu Cys Thr Glu Leu
165 170 175
Gln Ala Ile Leu Lys Thr Gln Gln Asn
180 185
<210> 58
<211> 200
<212> PRT
<213> Homo sapiens
<400> 58
Met Ala Leu Leu Thr Ala Glu Thr Phe Arg Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Leu Arg Arg Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly Tyr Phe Glu
35 40 45
Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu Arg Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Phe Pro Lys Phe Ala Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Glu Lys Pro Leu Ser Phe Asn Pro Tyr
145 150 155 160
Lys Met Leu Glu Glu Leu Asp Lys Asn Ser Arg Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ile Pro Gly Val Arg Ala Gln Gly Arg Tyr Met
180 185 190
Asp Ile Leu Cys Asp Ala Glu Val
195 200
<210> 59
<211> 210
<212> PRT
<213> Macaca mulatta
<400> 59
Met Ala Leu Leu Thr Ala Lys Thr Phe Ser Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Val Asn Lys Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly His Leu Lys
35 40 45
Asn Lys Lys Lys Asp His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu Leu Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Leu Pro Glu Phe Thr Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Lys Glu Pro Pro Ser Phe Asn Pro Ser
145 150 155 160
Glu Lys Leu Glu Glu Leu Asp Lys Asn Ser Gln Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ser Arg Ser Val Asp Val Leu Glu Asn Gly Leu
180 185 190
Arg Ser Leu Gln Leu Gly Pro Val Thr Pro Ser Ser Ser Ile Arg Asn
195 200 205
Ser Arg
210
<210> 60
<211> 386
<212> PRT
<213> Homo sapiens
<400> 60
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu Pro Lys Arg Gln
50 55 60
Ser Asn His Arg Gln Glu Val Tyr Phe Arg Phe Glu Asn His Ala Glu
65 70 75 80
Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu Pro Ala Asn Arg
85 90 95
Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro Cys Leu Pro Cys
100 105 110
Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro Asn Val Thr Leu
115 120 125
Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp Arg Asp Trp Arg
130 135 140
Trp Val Leu Leu Arg Leu His Lys Ala Gly Ala Arg Val Lys Ile Met
145 150 155 160
Asp Tyr Glu Asp Phe Ala Tyr Cys Trp Glu Asn Phe Val Cys Asn Glu
165 170 175
Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn Tyr Ala Ser
180 185 190
Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met Glu Ala Met
195 200 205
Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Leu Lys Ala Cys
210 215 220
Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val Thr Lys His
225 230 235 240
His Ser Ala Val Phe Arg Lys Arg Gly Val Phe Arg Asn Gln Val Asp
245 250 255
Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys
260 265 270
Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr Trp Tyr Thr
275 280 285
Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu
290 295 300
Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Cys
305 310 315 320
Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Cys Ser Leu Ser Gln
325 330 335
Glu Gly Ala Ser Val Lys Ile Met Gly Tyr Lys Asp Phe Val Ser Cys
340 345 350
Trp Lys Asn Phe Val Tyr Ser Asp Asp Glu Pro Phe Lys Pro Trp Lys
355 360 365
Gly Leu Gln Thr Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ile
370 375 380
Leu Gln
385
<210> 61
<211> 236
<212> PRT
<213> Homo sapiens
<400> 61
Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45
Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Asp Phe His Pro Ser Met
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg His Pro Gly Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Thr Phe Phe Arg Leu
195 200 205
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220
Ala Thr Gly Leu Ile His Pro Ser Val Ala Trp Arg
225 230 235
<210> 62
<211> 229
<212> PRT
<213> Mus sp.
<400> 62
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Val Trp Arg His Thr Ser Gln Asn Thr Ser Asn His Val Glu Val
50 55 60
Asn Phe Leu Glu Lys Phe Thr Thr Glu Arg Tyr Phe Arg Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg His Pro Tyr Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Thr Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Tyr Cys Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Ser Asn Glu Ala Tyr Trp Pro Arg Tyr Pro His Leu Trp Val Lys
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Thr Leu Gln Thr Cys His Tyr Gln Arg Ile Pro Pro His Leu Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 63
<211> 229
<212> PRT
<213> Rattus sp.
<400> 63
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 64
<211> 224
<212> PRT
<213> Homo sapiens
<400> 64
Met Ala Gln Lys Glu Glu Ala Ala Val Ala Thr Glu Ala Ala Ser Gln
1 5 10 15
Asn Gly Glu Asp Leu Glu Asn Leu Asp Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Gly Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Ala
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Ile Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Ile Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Val Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Gln Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 65
<211> 224
<212> PRT
<213> Mus sp.
<400> 65
Met Ala Gln Lys Glu Glu Ala Ala Glu Ala Ala Ala Pro Ala Ser Gln
1 5 10 15
Asn Gly Asp Asp Leu Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Val Arg Leu Pro
35 40 45
Val Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Val Gln Ser Lys Gly
65 70 75 80
Gly Gln Ala Gln Ala Thr Gln Gly Tyr Leu Glu Asp Glu His Ala Gly
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Lys Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Leu Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Ser Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Val Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 66
<211> 224
<212> PRT
<213> Rattus sp.
<400> 66
Met Ala Gln Lys Glu Glu Ala Ala Glu Ala Ala Ala Pro Ala Ser Gln
1 5 10 15
Asn Gly Asp Asp Leu Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Val Arg Leu Pro
35 40 45
Val Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Thr Gln Gly Tyr Leu Glu Asp Glu His Ala Gly
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Lys Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Leu Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Ser Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Val Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Leu Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 67
<211> 224
<212> PRT
<213> Bos sp.
<400> 67
Met Ala Gln Lys Glu Glu Ala Ala Ala Ala Ala Glu Pro Ala Ser Gln
1 5 10 15
Asn Gly Glu Glu Val Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala His Tyr Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Thr
85 90 95
Asn His Ala Glu Glu Ala Phe Phe Asn Ser Ile Met Pro Thr Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Met Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Val Lys Thr Leu Asn Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Ile Gln Ala Ala Leu Arg Lys Leu Lys Glu Ala Gly Cys Arg Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 68
<211> 208
<212> PRT
<213> Petromyzon marinus
<400> 68
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Phe Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 69
<211> 381
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 69
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Phe Asn Tyr Asp Glu Phe Gln His Cys Trp
145 150 155 160
Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn
165 170 175
Leu Pro Lys Tyr Tyr Ile Leu Leu His Phe Met Leu Gly Glu Ile Leu
180 185 190
Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu
195 200 205
Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu
210 215 220
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe
225 230 235 240
Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His
245 250 255
Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu
260 265 270
Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe
275 280 285
Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Lys His Val Ser
290 295 300
Leu Cys Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg Cys Gln
305 310 315 320
Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Phe Thr
325 330 335
Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly
340 345 350
Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu
355 360 365
Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 70
<211> 182
<212> PRT
<213> Homo sapiens
<400> 70
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Trp
1 5 10 15
Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His Asn
20 25 30
Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn Gln
35 40 45
Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu Cys
50 55 60
Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp Tyr
65 70 75 80
Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln
85 90 95
Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys Ile
100 105 110
Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys Gln Glu Gly Leu
115 120 125
Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Phe Thr Tyr Ser Glu
130 135 140
Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe
145 150 155 160
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser Gly Arg
165 170 175
Leu Arg Ala Ile Leu Gln
180
<210> 71
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 71
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Phe Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln
180
<210> 72
<211> 367
<212> PRT
<213> Homo sapiens
<400> 72
Met Glu Pro Ile Tyr Glu Glu Tyr Leu Ala Asn His Gly Thr Ile Val
1 5 10 15
Lys Pro Tyr Tyr Trp Leu Ser Phe Ser Leu Asp Cys Ser Asn Cys Pro
20 25 30
Tyr His Ile Arg Thr Gly Glu Glu Ala Arg Val Ser Leu Thr Glu Phe
35 40 45
Cys Gln Ile Phe Gly Phe Pro Tyr Gly Thr Thr Phe Pro Gln Thr Lys
50 55 60
His Leu Thr Phe Tyr Glu Leu Lys Thr Ser Ser Gly Ser Leu Val Gln
65 70 75 80
Lys Gly His Ala Ser Ser Cys Thr Gly Asn Tyr Ile His Pro Glu Ser
85 90 95
Met Leu Phe Glu Met Asn Gly Tyr Leu Asp Ser Ala Ile Tyr Asn Asn
100 105 110
Asp Ser Ile Arg His Ile Ile Leu Tyr Ser Asn Asn Ser Pro Cys Asn
115 120 125
Glu Ala Asn His Cys Cys Ile Ser Lys Met Tyr Asn Phe Leu Ile Thr
130 135 140
Tyr Pro Gly Ile Thr Leu Ser Ile Tyr Phe Ser Gln Leu Tyr His Thr
145 150 155 160
Glu Met Asp Phe Pro Ala Ser Ala Trp Asn Arg Glu Ala Leu Arg Ser
165 170 175
Leu Ala Ser Leu Trp Pro Arg Val Val Leu Ser Pro Ile Ser Gly Gly
180 185 190
Ile Trp His Ser Val Leu His Ser Phe Ile Ser Gly Val Ser Gly Ser
195 200 205
His Val Phe Gln Pro Ile Leu Thr Gly Arg Ala Leu Ala Asp Arg His
210 215 220
Asn Ala Tyr Glu Ile Asn Ala Ile Thr Gly Val Lys Pro Tyr Phe Thr
225 230 235 240
Asp Val Leu Leu Gln Thr Lys Arg Asn Pro Asn Thr Lys Ala Gln Glu
245 250 255
Ala Leu Glu Ser Tyr Pro Leu Asn Asn Ala Phe Pro Gly Gln Phe Phe
260 265 270
Gln Met Pro Ser Gly Gln Leu Gln Pro Asn Leu Pro Pro Asp Leu Arg
275 280 285
Ala Pro Val Val Phe Val Leu Val Pro Leu Arg Asp Leu Pro Pro Met
290 295 300
His Met Gly Gln Asn Pro Asn Lys Pro Arg Asn Ile Val Arg His Leu
305 310 315 320
Asn Met Pro Gln Met Ser Phe Gln Glu Thr Lys Asp Leu Gly Arg Leu
325 330 335
Pro Thr Gly Arg Ser Val Glu Ile Val Glu Ile Thr Glu Gln Phe Ala
340 345 350
Ser Ser Lys Glu Ala Asp Glu Lys Lys Lys Lys Lys Gly Lys Lys
355 360 365
<210> 73
<211> 198
<212> PRT
<213> Mus musculus
<400> 73
Met Asp Ser Leu Leu Met Lys Gln Lys Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Cys Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Glu
85 90 95
Phe Leu Arg Trp Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Gly Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Thr Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Met Leu Gly Phe
195
<210> 74
<211> 388
<212> PRT
<213> Rattus norvegicus
<400> 74
Met Glu Pro Leu Tyr Glu Glu Tyr Leu Thr His Ser Gly Thr Ile Val
1 5 10 15
Lys Pro Tyr Tyr Trp Leu Ser Val Ser Leu Asn Cys Thr Asn Cys Pro
20 25 30
Tyr His Ile Arg Thr Gly Glu Glu Ala Arg Val Pro Tyr Thr Glu Phe
35 40 45
His Gln Thr Phe Gly Phe Pro Trp Ser Thr Tyr Pro Gln Thr Lys His
50 55 60
Leu Thr Phe Tyr Glu Leu Arg Ser Ser Ser Gly Asn Leu Ile Gln Lys
65 70 75 80
Gly Leu Ala Ser Asn Cys Thr Gly Ser His Thr His Pro Glu Ser Met
85 90 95
Leu Phe Glu Arg Asp Gly Tyr Leu Asp Ser Leu Ile Phe His Asp Ser
100 105 110
Asn Ile Arg His Ile Ile Leu Tyr Ser Asn Asn Ser Pro Cys Asp Glu
115 120 125
Ala Asn His Cys Cys Ile Ser Lys Met Tyr Asn Phe Leu Met Asn Tyr
130 135 140
Pro Glu Val Thr Leu Ser Val Phe Phe Ser Gln Leu Tyr His Thr Glu
145 150 155 160
Asn Gln Phe Pro Thr Ser Ala Trp Asn Arg Glu Ala Leu Arg Gly Leu
165 170 175
Ala Ser Leu Trp Pro Gln Val Thr Leu Ser Ala Ile Ser Gly Gly Ile
180 185 190
Trp Gln Ser Ile Leu Glu Thr Phe Val Ser Gly Ile Ser Glu Gly Leu
195 200 205
Thr Ala Val Arg Pro Phe Thr Ala Gly Arg Thr Leu Thr Asp Arg Tyr
210 215 220
Asn Ala Tyr Glu Ile Asn Cys Ile Thr Glu Val Lys Pro Tyr Phe Thr
225 230 235 240
Asp Ala Leu His Ser Trp Gln Lys Glu Asn Gln Asp Gln Lys Val Trp
245 250 255
Ala Ala Ser Glu Asn Gln Pro Leu His Asn Thr Thr Pro Ala Gln Trp
260 265 270
Gln Pro Asp Met Ser Gln Asp Cys Arg Thr Pro Ala Val Phe Met Leu
275 280 285
Val Pro Tyr Arg Asp Leu Pro Pro Ile His Val Asn Pro Ser Pro Gln
290 295 300
Lys Pro Arg Thr Val Val Arg His Leu Asn Thr Leu Gln Leu Ser Ala
305 310 315 320
Ser Lys Val Lys Ala Leu Arg Lys Ser Pro Ser Gly Arg Pro Val Lys
325 330 335
Lys Glu Glu Ala Arg Lys Gly Ser Thr Arg Ser Gln Glu Ala Asn Glu
340 345 350
Thr Asn Lys Ser Lys Trp Lys Lys Gln Thr Leu Phe Ile Lys Ser Asn
355 360 365
Ile Cys His Leu Leu Glu Arg Glu Gln Lys Lys Ile Gly Ile Leu Ser
370 375 380
Ser Trp Ser Val
385
<210> 75
<211> 363
<212> PRT
<213> Macaca fascicularis
<400> 75
Met Glu Pro Thr Tyr Glu Glu Tyr Leu Ala Asn His Gly Thr Ile Val
1 5 10 15
Lys Pro Tyr Tyr Trp Leu Ser Phe Ser Leu Asp Cys Ser Asn Cys Pro
20 25 30
Tyr His Ile Arg Thr Gly Glu Glu Ala Arg Val Ser Leu Thr Glu Phe
35 40 45
Cys Gln Ile Phe Gly Phe Pro Tyr Gly Thr Thr Tyr Pro Gln Thr Lys
50 55 60
His Leu Thr Phe Tyr Glu Leu Lys Thr Ser Ser Gly Ser Leu Val Gln
65 70 75 80
Lys Gly His Ala Ser Ser Cys Thr Gly Asn Tyr Ile His Pro Glu Ser
85 90 95
Met Leu Phe Glu Met Asn Gly Tyr Leu Asp Ser Ala Ile Tyr Asn Asn
100 105 110
Asp Ser Ile Arg His Ile Ile Leu Tyr Cys Asn Asn Ser Pro Cys Asn
115 120 125
Glu Ala Asn His Cys Cys Ile Ser Lys Val Tyr Asn Phe Leu Ile Thr
130 135 140
Tyr Pro Gly Ile Thr Leu Ser Ile Tyr Phe Ser Gln Leu Tyr His Thr
145 150 155 160
Glu Met Asp Phe Pro Ala Ser Ala Trp Asn Arg Glu Ala Leu Arg Ser
165 170 175
Leu Ala Ser Leu Trp Pro Arg Val Val Leu Ser Pro Ile Ser Gly Gly
180 185 190
Ile Trp His Ser Val Leu His Ser Phe Val Ser Gly Val Ser Gly Ser
195 200 205
His Val Phe Gln Pro Ile Leu Thr Gly Arg Ala Leu Thr Asp Arg Tyr
210 215 220
Asn Ala Tyr Glu Ile Asn Ala Ile Thr Gly Val Lys Pro Phe Phe Thr
225 230 235 240
Asp Val Leu Leu His Thr Lys Arg Asn Pro Asn Thr Lys Ala Gln Met
245 250 255
Ala Leu Glu Ser Tyr Pro Leu Asn Asn Ala Phe Pro Gly Gln Ser Phe
260 265 270
Gln Met Thr Ser Gly Ile Pro Pro Asp Leu Arg Ala Pro Val Val Phe
275 280 285
Val Leu Leu Pro Leu Arg Asp Leu Pro Pro Met His Met Gly Gln Asp
290 295 300
Pro Asn Lys Pro Arg Asn Ile Ile Arg His Leu Asn Met Pro Gln Met
305 310 315 320
Ser Phe Gln Glu Thr Lys Asp Leu Glu Arg Leu Pro Thr Arg Arg Ser
325 330 335
Val Glu Thr Val Glu Ile Thr Glu Arg Phe Ala Ser Ser Lys Gln Ala
340 345 350
Glu Glu Lys Thr Lys Lys Lys Lys Gly Lys Lys
355 360
<210> 76
<211> 224
<212> PRT
<213> Petromyzon marinus
<400> 76
Met Ala Gly Tyr Glu Cys Val Arg Val Ser Glu Lys Leu Asp Phe Asp
1 5 10 15
Thr Phe Glu Phe Gln Phe Glu Asn Leu His Tyr Ala Thr Glu Arg His
20 25 30
Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Ala Gly Gly Arg
35 40 45
Ser Arg Arg Leu Trp Gly Tyr Ile Ile Asn Asn Pro Asn Val Cys His
50 55 60
Ala Glu Leu Ile Leu Met Ser Met Ile Asp Arg His Leu Glu Ser Asn
65 70 75 80
Pro Gly Val Tyr Ala Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Ala
85 90 95
Asn Cys Ser Ser Lys Leu Asn Pro Trp Leu Lys Asn Leu Leu Glu Glu
100 105 110
Gln Gly His Thr Leu Thr Met His Phe Ser Arg Ile Tyr Asp Arg Asp
115 120 125
Arg Glu Gly Asp His Arg Gly Leu Arg Gly Leu Lys His Val Ser Asn
130 135 140
Ser Phe Arg Met Gly Val Val Gly Arg Ala Glu Val Lys Glu Cys Leu
145 150 155 160
Ala Glu Tyr Val Glu Ala Ser Arg Arg Thr Leu Thr Trp Leu Asp Thr
165 170 175
Thr Glu Ser Met Ala Ala Lys Met Arg Arg Lys Leu Phe Cys Ile Leu
180 185 190
Val Arg Cys Ala Gly Met Arg Glu Ser Gly Ile Pro Leu His Leu Phe
195 200 205
Thr Leu Gln Thr Pro Leu Leu Ser Gly Arg Val Val Trp Trp Arg Val
210 215 220
<210> 77
<211> 331
<212> PRT
<213> Petromyzon marinus
<400> 77
Met Glu Leu Arg Glu Val Val Asp Cys Ala Leu Ala Ser Cys Val Arg
1 5 10 15
His Glu Pro Leu Ser Arg Val Ala Phe Leu Arg Cys Phe Ala Ala Pro
20 25 30
Ser Gln Lys Pro Arg Gly Thr Val Ile Leu Phe Tyr Val Glu Gly Ala
35 40 45
Gly Arg Gly Val Thr Gly Gly His Ala Val Asn Tyr Asn Lys Gln Gly
50 55 60
Thr Ser Ile His Ala Glu Val Leu Leu Leu Ser Ala Val Arg Ala Ala
65 70 75 80
Leu Leu Arg Arg Arg Arg Cys Glu Asp Gly Glu Glu Ala Thr Arg Gly
85 90 95
Cys Thr Leu His Cys Tyr Ser Thr Tyr Ser Pro Cys Arg Asp Cys Val
100 105 110
Glu Tyr Ile Gln Glu Phe Gly Ala Ser Thr Gly Val Arg Val Val Ile
115 120 125
His Cys Cys Arg Leu Tyr Glu Leu Asp Val Asn Arg Arg Arg Ser Glu
130 135 140
Ala Glu Gly Val Leu Arg Ser Leu Ser Arg Leu Gly Arg Asp Phe Arg
145 150 155 160
Leu Met Gly Pro Arg Asp Ala Ile Ala Leu Leu Leu Gly Gly Arg Leu
165 170 175
Ala Asn Thr Ala Asp Gly Glu Ser Gly Ala Ser Gly Asn Ala Trp Val
180 185 190
Thr Glu Thr Asn Val Val Glu Pro Leu Val Asp Met Thr Gly Phe Gly
195 200 205
Asp Glu Asp Leu His Ala Gln Val Gln Arg Asn Lys Gln Ile Arg Glu
210 215 220
Ala Tyr Ala Asn Tyr Ala Ser Ala Val Ser Leu Met Leu Gly Glu Leu
225 230 235 240
His Val Asp Pro Asp Lys Phe Pro Phe Leu Ala Glu Phe Leu Ala Gln
245 250 255
Thr Ser Val Glu Pro Ser Gly Thr Pro Arg Glu Thr Arg Gly Arg Pro
260 265 270
Arg Gly Ala Ser Ser Arg Gly Pro Glu Ile Gly Arg Gln Arg Pro Ala
275 280 285
Asp Phe Glu Arg Ala Leu Gly Ala Tyr Gly Leu Phe Leu His Pro Arg
290 295 300
Ile Val Ser Arg Glu Ala Asp Arg Glu Glu Ile Lys Arg Asp Leu Ile
305 310 315 320
Val Val Met Arg Lys His Asn Tyr Gln Gly Pro
325 330
<210> 78
<211> 209
<212> PRT
<213> Petromyzon marinus
<400> 78
Met Ala Gly Asp Glu Asn Val Arg Val Ser Glu Lys Leu Asp Phe Asp
1 5 10 15
Thr Phe Glu Phe Gln Phe Glu Asn Leu His Tyr Ala Thr Glu Arg His
20 25 30
Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Ala Gly Gly Arg
35 40 45
Ser Arg Arg Leu Trp Gly Tyr Ile Ile Asn Asn Pro Asn Val Cys His
50 55 60
Ala Glu Leu Ile Leu Met Ser Met Ile Asp Arg His Leu Glu Ser Asn
65 70 75 80
Pro Gly Val Tyr Ala Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Ala
85 90 95
Asn Cys Ser Ser Lys Leu Asn Pro Trp Leu Lys Asn Leu Leu Glu Glu
100 105 110
Gln Gly His Thr Leu Met Met His Phe Ser Arg Ile Tyr Asp Arg Asp
115 120 125
Arg Glu Gly Asp His Arg Gly Leu Arg Gly Leu Lys His Val Ser Asn
130 135 140
Ser Phe Arg Met Gly Val Val Gly Arg Ala Glu Val Lys Glu Cys Leu
145 150 155 160
Ala Glu Tyr Val Glu Ala Ser Arg Arg Thr Leu Thr Trp Leu Asp Thr
165 170 175
Thr Glu Ser Met Ala Ala Lys Met Arg Arg Lys Leu Phe Cys Ile Leu
180 185 190
Val Arg Cys Ala Gly Met Arg Glu Ser Gly Met Pro Leu His Leu Phe
195 200 205
Thr
<210> 79
<211> 158
<212> PRT
<213> Saccharomyces cerevisiae
<400> 79
Met Val Thr Gly Gly Met Ala Ser Lys Trp Asp Gln Lys Gly Met Asp
1 5 10 15
Ile Ala Tyr Glu Glu Ala Ala Leu Gly Tyr Lys Glu Gly Gly Val Pro
20 25 30
Ile Gly Gly Cys Leu Ile Asn Asn Lys Asp Gly Ser Val Leu Gly Arg
35 40 45
Gly His Asn Met Arg Phe Gln Lys Gly Ser Ala Thr Leu His Gly Glu
50 55 60
Ile Ser Thr Leu Glu Asn Cys Gly Arg Leu Glu Gly Lys Val Tyr Lys
65 70 75 80
Asp Thr Thr Leu Tyr Thr Thr Leu Ser Pro Cys Asp Met Cys Thr Gly
85 90 95
Ala Ile Ile Met Tyr Gly Ile Pro Arg Cys Val Val Gly Glu Asn Val
100 105 110
Asn Phe Lys Ser Lys Gly Glu Lys Tyr Leu Gln Thr Arg Gly His Glu
115 120 125
Val Val Val Val Asp Asp Glu Arg Cys Lys Lys Ile Met Lys Gln Phe
130 135 140
Ile Asp Glu Arg Pro Gln Asp Trp Phe Glu Asp Ile Gly Glu
145 150 155
<210> 80
<211> 218
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 80
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu
180 185 190
Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro
195 200 205
Pro His Ile Leu Trp Ala Thr Gly Leu Lys
210 215
<210> 81
<211> 218
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 81
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln His Tyr Gln Arg Leu Pro
195 200 205
Pro His Ile Leu Trp Ala Thr Gly Leu Lys
210 215
<210> 82
<211> 429
<212> PRT
<213> Mus sp.
<400> 82
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Leu Gly Tyr Ala Lys Gly Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val
35 40 45
Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val Phe
50 55 60
Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe
65 70 75 80
His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile
85 90 95
Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Ile
100 105 110
Val Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe Ser
115 120 125
Ser Arg Leu Tyr Asn Val Gln Asp Pro Glu Thr Gln Gln Asn Leu Cys
130 135 140
Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu
145 150 155 160
Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe
165 170 175
Arg Pro Trp Lys Arg Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys
180 185 190
Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser Ser
195 200 205
Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr
210 215 220
Arg Phe Cys Val Glu Gly Arg Arg Met Asp Pro Leu Ser Glu Glu Glu
225 230 235 240
Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr
245 250 255
His Arg Met Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly
260 265 270
Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His
275 280 285
Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln
290 295 300
Val Thr Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
305 310 315 320
Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His
325 330 335
Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys
340 345 350
Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp
355 360 365
Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg
370 375 380
Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln
385 390 395 400
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val
405 410 415
Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425
<210> 83
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 83
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp
165
<210> 84
<211> 1378
<212> PRT
<213> Lactobacillus fermentum
<400> 84
Met Lys Glu Tyr His Ile Gly Leu Asp Ile Gly Thr Ser Ser Ile Gly
1 5 10 15
Trp Ala Val Thr Asp Ser Gln Phe Lys Leu Met Arg Ile Lys Gly Lys
20 25 30
Thr Ala Ile Gly Val Arg Leu Phe Glu Glu Gly Lys Thr Ala Ala Glu
35 40 45
Arg Arg Thr Phe Arg Thr Thr Arg Arg Arg Leu Lys Arg Arg Lys Trp
50 55 60
Arg Leu His Tyr Leu Asp Glu Ile Phe Ala Pro His Leu Gln Glu Val
65 70 75 80
Asp Glu Asn Phe Leu Arg Arg Leu Lys Gln Ser Asn Ile His Pro Glu
85 90 95
Asp Pro Ala Lys Asn Gln Ala Phe Ile Gly Lys Leu Leu Phe Pro Asp
100 105 110
Leu Leu Lys Lys Asn Glu Arg Gly Tyr Pro Thr Leu Ile Lys Met Arg
115 120 125
Asp Glu Leu Pro Val Glu Gln Arg Ala His Tyr Pro Val Thr Asn Ile
130 135 140
Tyr Lys Leu Arg Glu Ala Met Ile Asn Glu Asp Arg Gln Phe Asp Leu
145 150 155 160
Arg Glu Val Tyr Leu Ala Val His His Ile Val Lys Tyr Arg Gly His
165 170 175
Phe Leu Asn Asn Ala Ser Val Asp Lys Phe Lys Val Gly Arg Ile Asp
180 185 190
Phe Asp Lys Ser Phe Asn Val Leu Asn Glu Ala Tyr Glu Glu Leu Gln
195 200 205
Asn Gly Glu Gly Ser Phe Thr Ile Glu Pro Ser Lys Val Glu Lys Ile
210 215 220
Gly Gln Leu Leu Leu Asp Thr Lys Met Arg Lys Leu Asp Arg Gln Lys
225 230 235 240
Ala Val Ala Lys Leu Leu Glu Val Lys Val Ala Asp Lys Glu Glu Thr
245 250 255
Lys Arg Asn Lys Gln Ile Ala Thr Ala Met Ser Lys Leu Val Leu Gly
260 265 270
Tyr Lys Ala Asp Phe Ala Thr Val Ala Met Ala Asn Gly Asn Glu Trp
275 280 285
Lys Ile Asp Leu Ser Ser Glu Thr Ser Glu Asp Glu Ile Glu Lys Phe
290 295 300
Arg Glu Glu Leu Ser Asp Ala Gln Asn Asp Ile Leu Thr Glu Ile Thr
305 310 315 320
Ser Leu Phe Ser Gln Ile Met Leu Asn Glu Ile Val Pro Asn Gly Met
325 330 335
Ser Ile Ser Glu Ser Met Met Asp Arg Tyr Trp Thr His Glu Arg Gln
340 345 350
Leu Ala Glu Val Lys Glu Tyr Leu Ala Thr Gln Pro Ala Ser Ala Arg
355 360 365
Lys Glu Phe Asp Gln Val Tyr Asn Lys Tyr Ile Gly Gln Ala Pro Lys
370 375 380
Glu Lys Gly Phe Asp Leu Glu Lys Gly Leu Lys Lys Ile Leu Ser Lys
385 390 395 400
Lys Glu Asn Trp Lys Glu Ile Asp Glu Leu Leu Lys Ala Gly Asp Phe
405 410 415
Leu Pro Lys Gln Arg Thr Ser Ala Asn Gly Val Ile Pro His Gln Met
420 425 430
His Gln Gln Glu Leu Asp Arg Ile Ile Glu Lys Gln Ala Lys Tyr Tyr
435 440 445
Pro Trp Leu Ala Thr Glu Asn Pro Ala Thr Gly Glu Arg Asp Arg His
450 455 460
Gln Ala Lys Tyr Glu Leu Asp Gln Leu Val Ser Phe Arg Ile Pro Tyr
465 470 475 480
Tyr Val Gly Pro Leu Val Thr Pro Glu Val Gln Lys Ala Thr Ser Gly
485 490 495
Ala Lys Phe Ala Trp Ala Lys Arg Lys Glu Asp Gly Glu Ile Thr Pro
500 505 510
Trp Asn Leu Trp Asp Lys Ile Asp Arg Ala Glu Ser Ala Glu Ala Phe
515 520 525
Ile Lys Arg Met Thr Val Lys Asp Thr Tyr Leu Leu Asn Glu Asp Val
530 535 540
Leu Pro Ala Asn Ser Leu Leu Tyr Gln Lys Tyr Asn Val Leu Asn Glu
545 550 555 560
Leu Asn Asn Val Arg Val Asn Gly Arg Arg Leu Ser Val Gly Ile Lys
565 570 575
Gln Asp Ile Tyr Thr Glu Leu Phe Lys Lys Lys Lys Thr Val Lys Ala
580 585 590
Gly Asp Val Ala Ser Leu Val Met Ala Lys Thr Arg Gly Val Asn Lys
595 600 605
Pro Ser Val Glu Gly Leu Ser Asp Pro Lys Lys Phe Asn Ser Asn Leu
610 615 620
Ala Thr Tyr Leu Asp Leu Lys Ser Ile Val Gly Asp Lys Val Asp Asp
625 630 635 640
Asn Arg Tyr Gln Met Asp Leu Glu Asn Ile Ile Glu Trp Arg Ser Val
645 650 655
Phe Glu Asp Gly Glu Ile Phe Ala Asp Lys Leu Thr Glu Val Glu Trp
660 665 670
Leu Thr Asp Glu Gln Arg Ser Ala Leu Val Lys Lys Arg Tyr Lys Gly
675 680 685
Trp Gly Arg Leu Ser Lys Lys Leu Leu Thr Gly Ile Val Asp Glu Asn
690 695 700
Gly Gln Arg Ile Ile Asp Leu Met Trp Asn Thr Asp Gln Asn Phe Met
705 710 715 720
Gln Ile Val Asn Gln Pro Val Phe Lys Glu Gln Ile Asp Gln Leu Asn
725 730 735
Gln Lys Ala Ile Thr Asn Asp Gly Met Thr Leu Arg Glu Arg Val Glu
740 745 750
Ser Val Leu Asp Asp Ala Tyr Thr Ser Pro Gln Asn Lys Lys Ala Ile
755 760 765
Trp Gln Val Val Arg Val Val Glu Asp Ile Val Lys Ala Val Gly Asn
770 775 780
Ala Pro Lys Ser Ile Ser Ile Glu Phe Ala Arg Asn Glu Gly Asn Lys
785 790 795 800
Gly Glu Ile Thr Arg Ser Arg Arg Thr Gln Leu Gln Lys Leu Phe Glu
805 810 815
Asp Gln Ala His Glu Leu Val Lys Asp Thr Ser Leu Thr Glu Glu Leu
820 825 830
Glu Lys Ala Pro Asp Leu Ser Asp Arg Tyr Tyr Phe Tyr Phe Thr Gln
835 840 845
Gly Gly Lys Asp Met Tyr Thr Gly Asp Pro Ile Asn Phe Asp Glu Ile
850 855 860
Ser Thr Lys Tyr Asp Ile Asp His Ile Leu Pro Gln Ser Phe Val Lys
865 870 875 880
Asp Asp Ser Leu Asp Asn Arg Val Leu Val Ser Arg Ala Glu Asn Asn
885 890 895
Lys Lys Ser Asp Arg Val Pro Ala Lys Leu Tyr Ala Ala Lys Met Lys
900 905 910
Pro Tyr Trp Asn Gln Leu Leu Lys Gln Gly Leu Ile Thr Gln Arg Lys
915 920 925
Phe Glu Asn Leu Thr Met Asp Val Asp Gln Thr Ile Lys Tyr Arg Ser
930 935 940
Leu Gly Phe Val Lys Arg Gln Leu Val Glu Thr Arg Gln Val Ile Lys
945 950 955 960
Leu Thr Ala Asn Ile Leu Gly Ser Met Tyr Gln Glu Ala Gly Thr Asp
965 970 975
Ile Ile Glu Thr Arg Ala Gly Leu Thr Lys Gln Leu Arg Glu Glu Phe
980 985 990
Asp Leu Pro Lys Val Arg Glu Val Asn Asp Tyr His His Ala Val Asp
995 1000 1005
Ala Tyr Leu Thr Thr Phe Ala Gly Gln Tyr Leu Asn Arg Arg Tyr
1010 1015 1020
Pro Lys Leu Arg Ser Phe Phe Val Tyr Gly Glu Tyr Met Lys Phe
1025 1030 1035
Lys His Gly Ser Asp Leu Lys Leu Arg Asn Phe Asn Phe Phe His
1040 1045 1050
Glu Leu Met Glu Gly Asp Lys Ser Gln Gly Lys Val Val Asp Gln
1055 1060 1065
Gln Thr Gly Glu Leu Ile Thr Thr Arg Asp Glu Val Ala Asp Tyr
1070 1075 1080
Phe Asp Trp Val Ile Asn Leu Lys Val Met Leu Ile Ser Asn Glu
1085 1090 1095
Thr Tyr Glu Glu Thr Gly Lys Tyr Phe Asp Ala Ser His Glu Ser
1100 1105 1110
Ser Ser Leu Tyr Leu Lys Asn Gln Asn Lys Lys Ser Lys Leu Val
1115 1120 1125
Val Pro Leu Lys Asn Lys Leu Gln Pro Glu Tyr Tyr Gly Ala Tyr
1130 1135 1140
Thr Gly Ile Thr Gln Gly Tyr Met Val Ile Leu Lys Leu Leu Asp
1145 1150 1155
Lys Lys Gly Gly Phe Gly Val Tyr Arg Ile Pro Arg Tyr Ala Ala
1160 1165 1170
Asp Ile Leu Asn Lys Cys His Asp Glu Val Ala Tyr Arg Asn Lys
1175 1180 1185
Ile Ala Glu Ile Ile Ser Ser Asp Pro Arg Ala Pro Lys Ser Phe
1190 1195 1200
Glu Val Val Val Pro Arg Val Leu Lys Gly Thr Phe Leu Val Asp
1205 1210 1215
Gly Glu Glu Lys Phe Ile Leu Ser Ser Tyr Arg Tyr Lys Val Asn
1220 1225 1230
Ala Thr Gln Leu Ile Leu Pro Val Ser Asp Ile Lys Leu Ile Gln
1235 1240 1245
Asp Asn Phe Lys Ala Leu Lys Lys Leu Asn Val Glu Met Gln Thr
1250 1255 1260
Lys Lys Leu Ile Glu Ile Tyr Asp Asn Ile Leu Arg Gln Val Asp
1265 1270 1275
Lys Tyr Tyr Lys Leu Tyr Asp Ile Asn Lys Phe Arg Ala Lys Leu
1280 1285 1290
His Asp Gly Arg Ser Lys Phe Val Glu Leu Asp Asp Phe Gly Gln
1295 1300 1305
Asp Ala Ser Lys Glu Lys Val Ile Ile Lys Ile Leu Arg Gly Leu
1310 1315 1320
His Phe Gly Ser Asp Leu Gln Asn Leu Lys Glu Ile Gly Phe Gly
1325 1330 1335
Thr Thr Pro Leu Gly Gln Phe Gln Val Ser Glu Ala Gly Ile Arg
1340 1345 1350
Leu Ser Asn Thr Ala Phe Ile Ile Phe Lys Ser Pro Thr Gly Leu
1355 1360 1365
Phe Asn Arg Lys Leu Tyr Leu Lys Asn Leu
1370 1375
<210> 85
<211> 1432
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 85
Met Pro Lys Lys Lys Arg Lys Val Gly Lys Glu Tyr His Ile Gly Leu
1 5 10 15
Asp Ile Gly Thr Ser Ser Ile Gly Trp Ala Val Thr Asp Ser Gln Phe
20 25 30
Lys Leu Met Arg Ile Lys Gly Lys Thr Ala Ile Gly Val Arg Leu Phe
35 40 45
Glu Glu Gly Lys Thr Ala Ala Glu Arg Arg Thr Phe Arg Thr Thr Arg
50 55 60
Arg Arg Leu Lys Arg Arg Lys Trp Arg Leu His Tyr Leu Asp Glu Ile
65 70 75 80
Phe Ala Pro His Leu Gln Glu Val Asp Glu Asn Phe Leu Arg Arg Leu
85 90 95
Lys Gln Ser Asn Ile His Pro Glu Asp Pro Ala Lys Asn Gln Ala Phe
100 105 110
Ile Gly Lys Leu Leu Phe Pro Asp Leu Leu Lys Lys Asn Glu Arg Gly
115 120 125
Tyr Pro Thr Leu Ile Lys Met Arg Asp Glu Leu Pro Val Glu Gln Arg
130 135 140
Ala His Tyr Pro Val Thr Asn Ile Tyr Lys Leu Arg Glu Ala Met Ile
145 150 155 160
Asn Glu Asp Arg Gln Phe Asp Leu Arg Glu Val Tyr Leu Ala Val His
165 170 175
His Ile Val Lys Tyr Arg Gly His Phe Leu Asn Asn Ala Ser Val Asp
180 185 190
Lys Phe Lys Val Gly Arg Ile Asp Phe Asp Lys Ser Phe Asn Val Leu
195 200 205
Asn Glu Ala Tyr Glu Glu Leu Gln Asn Gly Glu Gly Ser Phe Thr Ile
210 215 220
Glu Pro Ser Lys Val Glu Lys Ile Gly Gln Leu Leu Leu Asp Thr Lys
225 230 235 240
Met Arg Lys Leu Asp Arg Gln Lys Ala Val Ala Lys Leu Leu Glu Val
245 250 255
Lys Val Ala Asp Lys Glu Glu Thr Lys Arg Asn Lys Gln Ile Ala Thr
260 265 270
Ala Met Ser Lys Leu Val Leu Gly Tyr Lys Ala Asp Phe Ala Thr Val
275 280 285
Ala Met Ala Asn Gly Asn Glu Trp Lys Ile Asp Leu Ser Ser Glu Thr
290 295 300
Ser Glu Asp Glu Ile Glu Lys Phe Arg Glu Glu Leu Ser Asp Ala Gln
305 310 315 320
Asn Asp Ile Leu Thr Glu Ile Thr Ser Leu Phe Ser Gln Ile Met Leu
325 330 335
Asn Glu Ile Val Pro Asn Gly Met Ser Ile Ser Glu Ser Met Met Asp
340 345 350
Arg Tyr Trp Thr His Glu Arg Gln Leu Ala Glu Val Lys Glu Tyr Leu
355 360 365
Ala Thr Gln Pro Ala Ser Ala Arg Lys Glu Phe Asp Gln Val Tyr Asn
370 375 380
Lys Tyr Ile Gly Gln Ala Pro Lys Glu Lys Gly Phe Asp Leu Glu Lys
385 390 395 400
Gly Leu Lys Lys Ile Leu Ser Lys Lys Glu Asn Trp Lys Glu Ile Asp
405 410 415
Glu Leu Leu Lys Ala Gly Asp Phe Leu Pro Lys Gln Arg Thr Ser Ala
420 425 430
Asn Gly Val Ile Pro His Gln Met His Gln Gln Glu Leu Asp Arg Ile
435 440 445
Ile Glu Lys Gln Ala Lys Tyr Tyr Pro Trp Leu Ala Thr Glu Asn Pro
450 455 460
Ala Thr Gly Glu Arg Asp Arg His Gln Ala Lys Tyr Glu Leu Asp Gln
465 470 475 480
Leu Val Ser Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Val Thr Pro
485 490 495
Glu Val Gln Lys Ala Thr Ser Gly Ala Lys Phe Ala Trp Ala Lys Arg
500 505 510
Lys Glu Asp Gly Glu Ile Thr Pro Trp Asn Leu Trp Asp Lys Ile Asp
515 520 525
Arg Ala Glu Ser Ala Glu Ala Phe Ile Lys Arg Met Thr Val Lys Asp
530 535 540
Thr Tyr Leu Leu Asn Glu Asp Val Leu Pro Ala Asn Ser Leu Leu Tyr
545 550 555 560
Gln Lys Tyr Asn Val Leu Asn Glu Leu Asn Asn Val Arg Val Asn Gly
565 570 575
Arg Arg Leu Ser Val Gly Ile Lys Gln Asp Ile Tyr Thr Glu Leu Phe
580 585 590
Lys Lys Lys Lys Thr Val Lys Ala Gly Asp Val Ala Ser Leu Val Met
595 600 605
Ala Lys Thr Arg Gly Val Asn Lys Pro Ser Val Glu Gly Leu Ser Asp
610 615 620
Pro Lys Lys Phe Asn Ser Asn Leu Ala Thr Tyr Leu Asp Leu Lys Ser
625 630 635 640
Ile Val Gly Asp Lys Val Asp Asp Asn Arg Tyr Gln Met Asp Leu Glu
645 650 655
Asn Ile Ile Glu Trp Arg Ser Val Phe Glu Asp Gly Glu Ile Phe Ala
660 665 670
Asp Lys Leu Thr Glu Val Glu Trp Leu Thr Asp Glu Gln Arg Ser Ala
675 680 685
Leu Val Lys Lys Arg Tyr Lys Gly Trp Gly Arg Leu Ser Lys Lys Leu
690 695 700
Leu Thr Gly Ile Val Asp Glu Asn Gly Gln Arg Ile Ile Asp Leu Met
705 710 715 720
Trp Asn Thr Asp Gln Asn Phe Met Gln Ile Val Asn Gln Pro Val Phe
725 730 735
Lys Glu Gln Ile Asp Gln Leu Asn Gln Lys Ala Ile Thr Asn Asp Gly
740 745 750
Met Thr Leu Arg Glu Arg Val Glu Ser Val Leu Asp Asp Ala Tyr Thr
755 760 765
Ser Pro Gln Asn Lys Lys Ala Ile Trp Gln Val Val Arg Val Val Glu
770 775 780
Asp Ile Val Lys Ala Val Gly Asn Ala Pro Lys Ser Ile Ser Ile Glu
785 790 795 800
Phe Ala Arg Asn Glu Gly Asn Lys Gly Glu Ile Thr Arg Ser Arg Arg
805 810 815
Thr Gln Leu Gln Lys Leu Phe Glu Asp Gln Ala His Glu Leu Val Lys
820 825 830
Asp Thr Ser Leu Thr Glu Glu Leu Glu Lys Ala Pro Asp Leu Ser Asp
835 840 845
Arg Tyr Tyr Phe Tyr Phe Thr Gln Gly Gly Lys Asp Met Tyr Thr Gly
850 855 860
Asp Pro Ile Asn Phe Asp Glu Ile Ser Thr Lys Tyr Asp Ile Asp His
865 870 875 880
Ile Leu Pro Gln Ser Phe Val Lys Asp Asp Ser Leu Asp Asn Arg Val
885 890 895
Leu Val Ser Arg Ala Glu Asn Asn Lys Lys Ser Asp Arg Val Pro Ala
900 905 910
Lys Leu Tyr Ala Ala Lys Met Lys Pro Tyr Trp Asn Gln Leu Leu Lys
915 920 925
Gln Gly Leu Ile Thr Gln Arg Lys Phe Glu Asn Leu Thr Met Asp Val
930 935 940
Asp Gln Thr Ile Lys Tyr Arg Ser Leu Gly Phe Val Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Val Ile Lys Leu Thr Ala Asn Ile Leu Gly Ser
965 970 975
Met Tyr Gln Glu Ala Gly Thr Asp Ile Ile Glu Thr Arg Ala Gly Leu
980 985 990
Thr Lys Gln Leu Arg Glu Glu Phe Asp Leu Pro Lys Val Arg Glu Val
995 1000 1005
Asn Asp Tyr His His Ala Val Asp Ala Tyr Leu Thr Thr Phe Ala
1010 1015 1020
Gly Gln Tyr Leu Asn Arg Arg Tyr Pro Lys Leu Arg Ser Phe Phe
1025 1030 1035
Val Tyr Gly Glu Tyr Met Lys Phe Lys His Gly Ser Asp Leu Lys
1040 1045 1050
Leu Arg Asn Phe Asn Phe Phe His Glu Leu Met Glu Gly Asp Lys
1055 1060 1065
Ser Gln Gly Lys Val Val Asp Gln Gln Thr Gly Glu Leu Ile Thr
1070 1075 1080
Thr Arg Asp Glu Val Ala Asp Tyr Phe Asp Trp Val Ile Asn Leu
1085 1090 1095
Lys Val Met Leu Ile Ser Asn Glu Thr Tyr Glu Glu Thr Gly Lys
1100 1105 1110
Tyr Phe Asp Ala Ser His Glu Ser Ser Ser Leu Tyr Leu Lys Asn
1115 1120 1125
Gln Asn Lys Lys Ser Lys Leu Val Val Pro Leu Lys Asn Lys Leu
1130 1135 1140
Gln Pro Glu Tyr Tyr Gly Ala Tyr Thr Gly Ile Thr Gln Gly Tyr
1145 1150 1155
Met Val Ile Leu Lys Leu Leu Asp Lys Lys Gly Gly Phe Gly Val
1160 1165 1170
Tyr Arg Ile Pro Arg Tyr Ala Ala Asp Ile Leu Asn Lys Cys His
1175 1180 1185
Asp Glu Val Ala Tyr Arg Asn Lys Ile Ala Glu Ile Ile Ser Ser
1190 1195 1200
Asp Pro Arg Ala Pro Lys Ser Phe Glu Val Val Val Pro Arg Val
1205 1210 1215
Leu Lys Gly Thr Phe Leu Val Asp Gly Glu Glu Lys Phe Ile Leu
1220 1225 1230
Ser Ser Tyr Arg Tyr Lys Val Asn Ala Thr Gln Leu Ile Leu Pro
1235 1240 1245
Val Ser Asp Ile Lys Leu Ile Gln Asp Asn Phe Lys Ala Leu Lys
1250 1255 1260
Lys Leu Asn Val Glu Met Gln Thr Lys Lys Leu Ile Glu Ile Tyr
1265 1270 1275
Asp Asn Ile Leu Arg Gln Val Asp Lys Tyr Tyr Lys Leu Tyr Asp
1280 1285 1290
Ile Asn Lys Phe Arg Ala Lys Leu His Asp Gly Arg Ser Lys Phe
1295 1300 1305
Val Glu Leu Asp Asp Phe Gly Gln Asp Ala Ser Lys Glu Lys Val
1310 1315 1320
Ile Ile Lys Ile Leu Arg Gly Leu His Phe Gly Ser Asp Leu Gln
1325 1330 1335
Asn Leu Lys Glu Ile Gly Phe Gly Thr Thr Pro Leu Gly Gln Phe
1340 1345 1350
Gln Val Ser Glu Ala Gly Ile Arg Leu Ser Asn Thr Ala Phe Ile
1355 1360 1365
Ile Phe Lys Ser Pro Thr Gly Leu Phe Asn Arg Lys Leu Tyr Leu
1370 1375 1380
Lys Asn Leu Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr
1400 1405 1410
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val
1415 1420 1425
Pro Asp Tyr Ala
1430
<210> 86
<211> 1359
<212> PRT
<213> Peptoniphilus sp.
<400> 86
Met Glu Lys Lys Thr Asn Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asp
1 5 10 15
Ser Val Gly Trp Ala Val Val Lys Asp Asp Leu Glu Leu Val Lys Lys
20 25 30
Arg Met Lys Val Leu Gly Asn Thr Glu Thr Asn Tyr Ile Lys Lys Asn
35 40 45
Leu Trp Gly Ser Leu Leu Phe Glu Ser Gly Gln Thr Ala Lys Asp Arg
50 55 60
Arg Leu Lys Arg Val Ala Arg Arg Arg Tyr Glu Arg Arg Arg Asn Arg
65 70 75 80
Leu Thr Glu Leu Gln Lys Ile Phe Ala Pro Ala Ile Asp Glu Val Asp
85 90 95
Glu Asn Phe Phe Phe Arg Leu Asn Glu Ser Phe Leu Val Pro Glu Asp
100 105 110
Lys Ala Phe Ser Lys Asn Pro Ile Phe Gly Thr Leu Gly Glu Asp Lys
115 120 125
Thr Tyr Tyr Lys Thr Tyr Pro Thr Ile Tyr His Leu Arg Gln His Leu
130 135 140
Ala Asp Ser Glu Glu Lys Ala Asp Val Arg Leu Ile Tyr Leu Ala Leu
145 150 155 160
Ala His Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Lys Leu
165 170 175
Asp Thr Glu His Ile Ala Ile Asn Glu Asn Leu Glu Gln Phe Phe Glu
180 185 190
Ser Tyr Asn Ala Leu Phe Ser Glu Glu Pro Ile Glu Leu Arg Lys Glu
195 200 205
Glu Leu Ile Ala Ile Glu Asn Ile Leu Arg Glu Lys Asn Ser Arg Thr
210 215 220
Val Lys Glu Lys Arg Ile Thr Ser Phe Leu Lys Asp Ile Gly Arg Ala
225 230 235 240
Asn Lys Gln Ser Pro Met Met Ala Phe Ile Thr Leu Ile Val Gly Lys
245 250 255
Lys Ala Lys Phe Lys Ala Ala Phe Asn Leu Glu Glu Glu Ile Ser Leu
260 265 270
Asn Leu Thr Asp Asp Ser Tyr Asp Glu Asn Leu Glu Ile Leu Leu Asn
275 280 285
Thr Ile Gly Ser Asp Phe Ala Asp Leu Phe Asp His Ala Gln Arg Val
290 295 300
Tyr Asn Ala Val Glu Leu Ala Gly Ile Leu Ser Gly Asp Val Lys Asn
305 310 315 320
Thr His Ala Lys Leu Ser Ala Gln Met Val Ala Met Tyr Glu Arg His
325 330 335
Lys Glu Gln Leu Lys Glu Tyr Lys Ser Phe Ile Lys Ala Asn Leu Pro
340 345 350
Asp Gln Tyr Asp Met Thr Phe Val Ala Pro Lys Asp Ala Gln Lys Lys
355 360 365
Asp Leu Lys Gly Tyr Ala Gly Tyr Ile Asp Gly Asn Met Ser Gln Asp
370 375 380
Ser Phe Tyr Lys Phe Val Lys Asp Gln Leu Lys Glu Val Pro Gly Ser
385 390 395 400
Glu Lys Phe Leu Asp Ser Ile Glu Lys Glu Asp Phe Leu Arg Lys Gln
405 410 415
Arg Ser Phe Tyr Asn Gly Val Ile Pro Asn Gln Val His Leu Ala Glu
420 425 430
Met Glu Ala Ile Leu Asp Arg Gln Glu Asn Tyr Tyr Pro Trp Leu Lys
435 440 445
Glu Asn Arg Glu Lys Ile Ile Ser Leu Leu Thr Phe Arg Ile Pro Tyr
450 455 460
Tyr Val Gly Pro Leu Ala Asp Gly Gln Ser Glu Phe Ala Trp Leu Glu
465 470 475 480
Arg Lys Ser Asp Glu Lys Ile Lys Pro Trp Asn Phe Ser Asp Val Val
485 490 495
Asp Leu Asp Arg Ser Ala Glu Lys Phe Ile Glu Gln Leu Ile Gly Arg
500 505 510
Asp Thr Tyr Leu Pro Asp Glu Tyr Val Leu Pro Lys Lys Ser Leu Ile
515 520 525
Tyr Gln Lys Tyr Met Val Phe Asn Glu Leu Thr Lys Ile Ala Tyr Leu
530 535 540
Asp Glu Arg Gln Lys Arg Met Asn Leu Ser Ser Val Glu Lys Lys Glu
545 550 555 560
Ile Phe Glu Thr Leu Phe Lys Lys Arg Ser Lys Val Thr Glu Lys Gln
565 570 575
Leu Val Lys Phe Phe Glu Asn Tyr Leu Gln Ile Asp Asn Pro Thr Ile
580 585 590
Phe Gly Ile Glu Asp Ala Phe Asn Ala Asp Tyr Ser Thr Tyr Val Glu
595 600 605
Leu Ala Lys Val Pro Gly Met Lys Ser Met Met Asp Asp Pro Asp Asn
610 615 620
Glu Asp Leu Met Glu Glu Ile Val Lys Ile Leu Thr Val Phe Glu Asp
625 630 635 640
Arg Lys Met Arg Arg Lys Gln Leu Glu Lys Tyr Lys Glu Arg Leu Ser
645 650 655
Pro Glu Gln Ile Lys Glu Leu Ala Lys Lys His Tyr Thr Gly Trp Gly
660 665 670
Arg Leu Ser Lys Lys Leu Leu Val Gly Ile Arg Asp Lys Glu Thr Gln
675 680 685
Lys Thr Ile Leu Asp Tyr Leu Val Glu Asp Asp Asn His Ser Gly Gly
690 695 700
Arg Gln His Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Asp Arg
705 710 715 720
Leu Ser Phe Lys Lys Thr Ile Ala Glu Leu Gln Met Ile Asp Pro Ser
725 730 735
Ala Asp Leu Tyr Ala Gln Val Gln Glu Ile Ala Gly Ser Pro Ala Ile
740 745 750
Lys Lys Gly Ile Leu Leu Gly Leu Lys Ile Val Asp Glu Ile Ile Arg
755 760 765
Val Met Gly Glu Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
770 775 780
Asn Gln Thr Thr Ala Arg Gly Lys Ala Leu Ser Lys Arg Arg Glu Ala
785 790 795 800
Lys Ile Lys Glu Gly Leu Ala Ala Leu Gly Ser Ser Leu Leu Lys Glu
805 810 815
Asn Leu Pro Gly Asn Ala Asp Leu Ser Gln Arg Lys Ile Tyr Leu Tyr
820 825 830
Tyr Thr Gln Asn Gly Lys Asp Ile Tyr Leu Asp Glu Pro Leu Asp Phe
835 840 845
Asp Arg Leu Ser Gln Tyr Asp Glu Asp His Ile Ile Pro Gln Ser Phe
850 855 860
Thr Val Asp Asn Ser Leu Asp Asn Leu Val Leu Thr Asn Ser Ser Gln
865 870 875 880
Asn Arg Gly Asn Lys Lys Asp Asp Val Pro Ser Leu Glu Val Val Asn
885 890 895
Arg Gln Leu Ala Tyr Trp Arg Ser Leu Lys Asp Ala Gly Leu Met Thr
900 905 910
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Met Arg Gly Gly Leu Thr
915 920 925
Asp Lys Asp Arg Glu Arg Phe Ile Gln Arg Gln Leu Val Glu Thr Arg
930 935 940
Gln Ile Thr Lys Asn Val Ala Lys Leu Leu Asp Met Arg Leu Asn Asp
945 950 955 960
Lys Lys Asp Glu Ala Gly Asn Lys Ile Arg Glu Thr Asn Ile Val Leu
965 970 975
Leu Lys Ser Ala Met Ala Ser Glu Phe Arg Lys Met Phe Arg Leu Tyr
980 985 990
Lys Val Arg Glu Leu Asn Asp Tyr His His Ala His Asp Ala Tyr Leu
995 1000 1005
Asn Ala Ala Ile Ala Ile Asn Leu Leu Ala Leu Tyr Pro Tyr Met
1010 1015 1020
Ala Asp Asp Phe Val Tyr Gly Glu Phe Arg Tyr Lys Lys Lys Pro
1025 1030 1035
Gln Ala Glu Lys Ala Thr Tyr Glu Lys Leu Arg Gln Trp Asn Leu
1040 1045 1050
Ile Lys Arg Phe Gly Glu Lys Gln Leu Phe Thr Pro Asp His Glu
1055 1060 1065
Asp Cys Trp Asn Lys Glu Arg Asp Ile Lys Thr Ile Lys Lys Val
1070 1075 1080
Met Gly Tyr Arg Gln Val Asn Val Val Lys Lys Ala Glu Glu Arg
1085 1090 1095
Thr Gly Met Leu Phe Lys Glu Thr Ile Asn Gly Lys Thr Asn Lys
1100 1105 1110
Gly Ser Arg Ile Pro Ile Lys Lys Asp Leu Asp Pro Ser Lys Tyr
1115 1120 1125
Gly Gly Tyr Ile Glu Glu Lys Met Ala Tyr Tyr Ala Val Ile Ser
1130 1135 1140
Tyr Glu Asp Lys Lys Lys Lys Pro Gly Lys Thr Ile Val Gly Ile
1145 1150 1155
Ser Ile Met Asp Lys Lys Glu Phe Glu Tyr Asp Ser Ile Ser Tyr
1160 1165 1170
Leu Gly Lys Leu Gly Phe Ser Asn Pro Val Val Gln Ile Ile Leu
1175 1180 1185
Lys Asn Tyr Ser Leu Ile Ala Tyr Pro Asp Gly Arg Arg Arg Tyr
1190 1195 1200
Ile Thr Gly Ala Thr Lys Thr Thr Lys Gly Lys Val Glu Leu Gln
1205 1210 1215
Lys Ala Asn Gln Ile Ala Met Glu Gln Asp Leu Val Asn Phe Ile
1220 1225 1230
Tyr His Leu Lys Asn Tyr Asp Glu Ile Ser His Pro Glu Ser Tyr
1235 1240 1245
Ala Phe Val Gln Ser His Thr Asp Tyr Phe Asp Arg Leu Phe Asp
1250 1255 1260
Ser Ile Glu His Tyr Thr Arg Arg Phe Leu Asp Ala Glu Thr Asn
1265 1270 1275
Ile Asn Arg Leu Arg Arg Ile Tyr Glu Glu Glu Lys Lys Lys Asp
1280 1285 1290
Pro Val Asp Ile Glu Ala Leu Val Ala Ser Phe Ile Glu Leu Leu
1295 1300 1305
Lys Leu Thr Ser Ala Gly Ala Pro Ala Asp Phe Ile Phe Met Gly
1310 1315 1320
Glu Ala Ile Ser Arg Arg Arg Tyr Asn Ser Met Thr Gly Leu Phe
1325 1330 1335
Asp Gly Gln Val Ile Tyr Gln Ser Leu Thr Gly Leu Tyr Glu Thr
1340 1345 1350
Arg Met Arg Phe Glu Asp
1355
<210> 87
<211> 1413
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 87
Met Pro Lys Lys Lys Arg Lys Val Gly Glu Lys Lys Thr Asn Tyr Thr
1 5 10 15
Ile Gly Leu Asp Ile Gly Thr Asp Ser Val Gly Trp Ala Val Val Lys
20 25 30
Asp Asp Leu Glu Leu Val Lys Lys Arg Met Lys Val Leu Gly Asn Thr
35 40 45
Glu Thr Asn Tyr Ile Lys Lys Asn Leu Trp Gly Ser Leu Leu Phe Glu
50 55 60
Ser Gly Gln Thr Ala Lys Asp Arg Arg Leu Lys Arg Val Ala Arg Arg
65 70 75 80
Arg Tyr Glu Arg Arg Arg Asn Arg Leu Thr Glu Leu Gln Lys Ile Phe
85 90 95
Ala Pro Ala Ile Asp Glu Val Asp Glu Asn Phe Phe Phe Arg Leu Asn
100 105 110
Glu Ser Phe Leu Val Pro Glu Asp Lys Ala Phe Ser Lys Asn Pro Ile
115 120 125
Phe Gly Thr Leu Gly Glu Asp Lys Thr Tyr Tyr Lys Thr Tyr Pro Thr
130 135 140
Ile Tyr His Leu Arg Gln His Leu Ala Asp Ser Glu Glu Lys Ala Asp
145 150 155 160
Val Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Tyr Arg Gly
165 170 175
His Phe Leu Ile Glu Gly Lys Leu Asp Thr Glu His Ile Ala Ile Asn
180 185 190
Glu Asn Leu Glu Gln Phe Phe Glu Ser Tyr Asn Ala Leu Phe Ser Glu
195 200 205
Glu Pro Ile Glu Leu Arg Lys Glu Glu Leu Ile Ala Ile Glu Asn Ile
210 215 220
Leu Arg Glu Lys Asn Ser Arg Thr Val Lys Glu Lys Arg Ile Thr Ser
225 230 235 240
Phe Leu Lys Asp Ile Gly Arg Ala Asn Lys Gln Ser Pro Met Met Ala
245 250 255
Phe Ile Thr Leu Ile Val Gly Lys Lys Ala Lys Phe Lys Ala Ala Phe
260 265 270
Asn Leu Glu Glu Glu Ile Ser Leu Asn Leu Thr Asp Asp Ser Tyr Asp
275 280 285
Glu Asn Leu Glu Ile Leu Leu Asn Thr Ile Gly Ser Asp Phe Ala Asp
290 295 300
Leu Phe Asp His Ala Gln Arg Val Tyr Asn Ala Val Glu Leu Ala Gly
305 310 315 320
Ile Leu Ser Gly Asp Val Lys Asn Thr His Ala Lys Leu Ser Ala Gln
325 330 335
Met Val Ala Met Tyr Glu Arg His Lys Glu Gln Leu Lys Glu Tyr Lys
340 345 350
Ser Phe Ile Lys Ala Asn Leu Pro Asp Gln Tyr Asp Met Thr Phe Val
355 360 365
Ala Pro Lys Asp Ala Gln Lys Lys Asp Leu Lys Gly Tyr Ala Gly Tyr
370 375 380
Ile Asp Gly Asn Met Ser Gln Asp Ser Phe Tyr Lys Phe Val Lys Asp
385 390 395 400
Gln Leu Lys Glu Val Pro Gly Ser Glu Lys Phe Leu Asp Ser Ile Glu
405 410 415
Lys Glu Asp Phe Leu Arg Lys Gln Arg Ser Phe Tyr Asn Gly Val Ile
420 425 430
Pro Asn Gln Val His Leu Ala Glu Met Glu Ala Ile Leu Asp Arg Gln
435 440 445
Glu Asn Tyr Tyr Pro Trp Leu Lys Glu Asn Arg Glu Lys Ile Ile Ser
450 455 460
Leu Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Asp Gly
465 470 475 480
Gln Ser Glu Phe Ala Trp Leu Glu Arg Lys Ser Asp Glu Lys Ile Lys
485 490 495
Pro Trp Asn Phe Ser Asp Val Val Asp Leu Asp Arg Ser Ala Glu Lys
500 505 510
Phe Ile Glu Gln Leu Ile Gly Arg Asp Thr Tyr Leu Pro Asp Glu Tyr
515 520 525
Val Leu Pro Lys Lys Ser Leu Ile Tyr Gln Lys Tyr Met Val Phe Asn
530 535 540
Glu Leu Thr Lys Ile Ala Tyr Leu Asp Glu Arg Gln Lys Arg Met Asn
545 550 555 560
Leu Ser Ser Val Glu Lys Lys Glu Ile Phe Glu Thr Leu Phe Lys Lys
565 570 575
Arg Ser Lys Val Thr Glu Lys Gln Leu Val Lys Phe Phe Glu Asn Tyr
580 585 590
Leu Gln Ile Asp Asn Pro Thr Ile Phe Gly Ile Glu Asp Ala Phe Asn
595 600 605
Ala Asp Tyr Ser Thr Tyr Val Glu Leu Ala Lys Val Pro Gly Met Lys
610 615 620
Ser Met Met Asp Asp Pro Asp Asn Glu Asp Leu Met Glu Glu Ile Val
625 630 635 640
Lys Ile Leu Thr Val Phe Glu Asp Arg Lys Met Arg Arg Lys Gln Leu
645 650 655
Glu Lys Tyr Lys Glu Arg Leu Ser Pro Glu Gln Ile Lys Glu Leu Ala
660 665 670
Lys Lys His Tyr Thr Gly Trp Gly Arg Leu Ser Lys Lys Leu Leu Val
675 680 685
Gly Ile Arg Asp Lys Glu Thr Gln Lys Thr Ile Leu Asp Tyr Leu Val
690 695 700
Glu Asp Asp Asn His Ser Gly Gly Arg Gln His Leu Asn Arg Asn Leu
705 710 715 720
Met Gln Leu Ile Asn Asp Asp Arg Leu Ser Phe Lys Lys Thr Ile Ala
725 730 735
Glu Leu Gln Met Ile Asp Pro Ser Ala Asp Leu Tyr Ala Gln Val Gln
740 745 750
Glu Ile Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Leu Gly Leu
755 760 765
Lys Ile Val Asp Glu Ile Ile Arg Val Met Gly Glu Lys Pro Glu Asn
770 775 780
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Ala Arg Gly Lys
785 790 795 800
Ala Leu Ser Lys Arg Arg Glu Ala Lys Ile Lys Glu Gly Leu Ala Ala
805 810 815
Leu Gly Ser Ser Leu Leu Lys Glu Asn Leu Pro Gly Asn Ala Asp Leu
820 825 830
Ser Gln Arg Lys Ile Tyr Leu Tyr Tyr Thr Gln Asn Gly Lys Asp Ile
835 840 845
Tyr Leu Asp Glu Pro Leu Asp Phe Asp Arg Leu Ser Gln Tyr Asp Glu
850 855 860
Asp His Ile Ile Pro Gln Ser Phe Thr Val Asp Asn Ser Leu Asp Asn
865 870 875 880
Leu Val Leu Thr Asn Ser Ser Gln Asn Arg Gly Asn Lys Lys Asp Asp
885 890 895
Val Pro Ser Leu Glu Val Val Asn Arg Gln Leu Ala Tyr Trp Arg Ser
900 905 910
Leu Lys Asp Ala Gly Leu Met Thr Gln Arg Lys Phe Asp Asn Leu Thr
915 920 925
Lys Ala Met Arg Gly Gly Leu Thr Asp Lys Asp Arg Glu Arg Phe Ile
930 935 940
Gln Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys Asn Val Ala Lys
945 950 955 960
Leu Leu Asp Met Arg Leu Asn Asp Lys Lys Asp Glu Ala Gly Asn Lys
965 970 975
Ile Arg Glu Thr Asn Ile Val Leu Leu Lys Ser Ala Met Ala Ser Glu
980 985 990
Phe Arg Lys Met Phe Arg Leu Tyr Lys Val Arg Glu Leu Asn Asp Tyr
995 1000 1005
His His Ala His Asp Ala Tyr Leu Asn Ala Ala Ile Ala Ile Asn
1010 1015 1020
Leu Leu Ala Leu Tyr Pro Tyr Met Ala Asp Asp Phe Val Tyr Gly
1025 1030 1035
Glu Phe Arg Tyr Lys Lys Lys Pro Gln Ala Glu Lys Ala Thr Tyr
1040 1045 1050
Glu Lys Leu Arg Gln Trp Asn Leu Ile Lys Arg Phe Gly Glu Lys
1055 1060 1065
Gln Leu Phe Thr Pro Asp His Glu Asp Cys Trp Asn Lys Glu Arg
1070 1075 1080
Asp Ile Lys Thr Ile Lys Lys Val Met Gly Tyr Arg Gln Val Asn
1085 1090 1095
Val Val Lys Lys Ala Glu Glu Arg Thr Gly Met Leu Phe Lys Glu
1100 1105 1110
Thr Ile Asn Gly Lys Thr Asn Lys Gly Ser Arg Ile Pro Ile Lys
1115 1120 1125
Lys Asp Leu Asp Pro Ser Lys Tyr Gly Gly Tyr Ile Glu Glu Lys
1130 1135 1140
Met Ala Tyr Tyr Ala Val Ile Ser Tyr Glu Asp Lys Lys Lys Lys
1145 1150 1155
Pro Gly Lys Thr Ile Val Gly Ile Ser Ile Met Asp Lys Lys Glu
1160 1165 1170
Phe Glu Tyr Asp Ser Ile Ser Tyr Leu Gly Lys Leu Gly Phe Ser
1175 1180 1185
Asn Pro Val Val Gln Ile Ile Leu Lys Asn Tyr Ser Leu Ile Ala
1190 1195 1200
Tyr Pro Asp Gly Arg Arg Arg Tyr Ile Thr Gly Ala Thr Lys Thr
1205 1210 1215
Thr Lys Gly Lys Val Glu Leu Gln Lys Ala Asn Gln Ile Ala Met
1220 1225 1230
Glu Gln Asp Leu Val Asn Phe Ile Tyr His Leu Lys Asn Tyr Asp
1235 1240 1245
Glu Ile Ser His Pro Glu Ser Tyr Ala Phe Val Gln Ser His Thr
1250 1255 1260
Asp Tyr Phe Asp Arg Leu Phe Asp Ser Ile Glu His Tyr Thr Arg
1265 1270 1275
Arg Phe Leu Asp Ala Glu Thr Asn Ile Asn Arg Leu Arg Arg Ile
1280 1285 1290
Tyr Glu Glu Glu Lys Lys Lys Asp Pro Val Asp Ile Glu Ala Leu
1295 1300 1305
Val Ala Ser Phe Ile Glu Leu Leu Lys Leu Thr Ser Ala Gly Ala
1310 1315 1320
Pro Ala Asp Phe Ile Phe Met Gly Glu Ala Ile Ser Arg Arg Arg
1325 1330 1335
Tyr Asn Ser Met Thr Gly Leu Phe Asp Gly Gln Val Ile Tyr Gln
1340 1345 1350
Ser Leu Thr Gly Leu Tyr Glu Thr Arg Met Arg Phe Glu Asp Gly
1355 1360 1365
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1370 1375 1380
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr
1385 1390 1395
Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1400 1405 1410
<210> 88
<211> 1628
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 88
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Glu Val Glu Phe
1 5 10 15
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
20 25 30
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
35 40 45
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
65 70 75 80
Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
85 90 95
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
100 105 110
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
115 120 125
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
130 135 140
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg
145 150 155 160
Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr
165 170 175
Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
180 185 190
Pro Glu Ser Ser Gly Pro Lys Lys Lys Arg Lys Val Gly Lys Glu Tyr
195 200 205
His Ile Gly Leu Ala Ile Gly Thr Ser Ser Ile Gly Trp Ala Val Thr
210 215 220
Asp Ser Gln Phe Lys Leu Met Arg Ile Lys Gly Lys Thr Ala Ile Gly
225 230 235 240
Val Arg Leu Phe Glu Glu Gly Lys Thr Ala Ala Glu Arg Arg Thr Phe
245 250 255
Arg Thr Thr Arg Arg Arg Leu Lys Arg Arg Lys Trp Arg Leu His Tyr
260 265 270
Leu Asp Glu Ile Phe Ala Pro His Leu Gln Glu Val Asp Glu Asn Phe
275 280 285
Leu Arg Arg Leu Lys Gln Ser Asn Ile His Pro Glu Asp Pro Ala Lys
290 295 300
Asn Gln Ala Phe Ile Gly Lys Leu Leu Phe Pro Asp Leu Leu Lys Lys
305 310 315 320
Asn Glu Arg Gly Tyr Pro Thr Leu Ile Lys Met Arg Asp Glu Leu Pro
325 330 335
Val Glu Gln Arg Ala His Tyr Pro Val Thr Asn Ile Tyr Lys Leu Arg
340 345 350
Glu Ala Met Ile Asn Glu Asp Arg Gln Phe Asp Leu Arg Glu Val Tyr
355 360 365
Leu Ala Val His His Ile Val Lys Tyr Arg Gly His Phe Leu Asn Asn
370 375 380
Ala Ser Val Asp Lys Phe Lys Val Gly Arg Ile Asp Phe Asp Lys Ser
385 390 395 400
Phe Asn Val Leu Asn Glu Ala Tyr Glu Glu Leu Gln Asn Gly Glu Gly
405 410 415
Ser Phe Thr Ile Glu Pro Ser Lys Val Glu Lys Ile Gly Gln Leu Leu
420 425 430
Leu Asp Thr Lys Met Arg Lys Leu Asp Arg Gln Lys Ala Val Ala Lys
435 440 445
Leu Leu Glu Val Lys Val Ala Asp Lys Glu Glu Thr Lys Arg Asn Lys
450 455 460
Gln Ile Ala Thr Ala Met Ser Lys Leu Val Leu Gly Tyr Lys Ala Asp
465 470 475 480
Phe Ala Thr Val Ala Met Ala Asn Gly Asn Glu Trp Lys Ile Asp Leu
485 490 495
Ser Ser Glu Thr Ser Glu Asp Glu Ile Glu Lys Phe Arg Glu Glu Leu
500 505 510
Ser Asp Ala Gln Asn Asp Ile Leu Thr Glu Ile Thr Ser Leu Phe Ser
515 520 525
Gln Ile Met Leu Asn Glu Ile Val Pro Asn Gly Met Ser Ile Ser Glu
530 535 540
Ser Met Met Asp Arg Tyr Trp Thr His Glu Arg Gln Leu Ala Glu Val
545 550 555 560
Lys Glu Tyr Leu Ala Thr Gln Pro Ala Ser Ala Arg Lys Glu Phe Asp
565 570 575
Gln Val Tyr Asn Lys Tyr Ile Gly Gln Ala Pro Lys Glu Lys Gly Phe
580 585 590
Asp Leu Glu Lys Gly Leu Lys Lys Ile Leu Ser Lys Lys Glu Asn Trp
595 600 605
Lys Glu Ile Asp Glu Leu Leu Lys Ala Gly Asp Phe Leu Pro Lys Gln
610 615 620
Arg Thr Ser Ala Asn Gly Val Ile Pro His Gln Met His Gln Gln Glu
625 630 635 640
Leu Asp Arg Ile Ile Glu Lys Gln Ala Lys Tyr Tyr Pro Trp Leu Ala
645 650 655
Thr Glu Asn Pro Ala Thr Gly Glu Arg Asp Arg His Gln Ala Lys Tyr
660 665 670
Glu Leu Asp Gln Leu Val Ser Phe Arg Ile Pro Tyr Tyr Val Gly Pro
675 680 685
Leu Val Thr Pro Glu Val Gln Lys Ala Thr Ser Gly Ala Lys Phe Ala
690 695 700
Trp Ala Lys Arg Lys Glu Asp Gly Glu Ile Thr Pro Trp Asn Leu Trp
705 710 715 720
Asp Lys Ile Asp Arg Ala Glu Ser Ala Glu Ala Phe Ile Lys Arg Met
725 730 735
Thr Val Lys Asp Thr Tyr Leu Leu Asn Glu Asp Val Leu Pro Ala Asn
740 745 750
Ser Leu Leu Tyr Gln Lys Tyr Asn Val Leu Asn Glu Leu Asn Asn Val
755 760 765
Arg Val Asn Gly Arg Arg Leu Ser Val Gly Ile Lys Gln Asp Ile Tyr
770 775 780
Thr Glu Leu Phe Lys Lys Lys Lys Thr Val Lys Ala Gly Asp Val Ala
785 790 795 800
Ser Leu Val Met Ala Lys Thr Arg Gly Val Asn Lys Pro Ser Val Glu
805 810 815
Gly Leu Ser Asp Pro Lys Lys Phe Asn Ser Asn Leu Ala Thr Tyr Leu
820 825 830
Asp Leu Lys Ser Ile Val Gly Asp Lys Val Asp Asp Asn Arg Tyr Gln
835 840 845
Met Asp Leu Glu Asn Ile Ile Glu Trp Arg Ser Val Phe Glu Asp Gly
850 855 860
Glu Ile Phe Ala Asp Lys Leu Thr Glu Val Glu Trp Leu Thr Asp Glu
865 870 875 880
Gln Arg Ser Ala Leu Val Lys Lys Arg Tyr Lys Gly Trp Gly Arg Leu
885 890 895
Ser Lys Lys Leu Leu Thr Gly Ile Val Asp Glu Asn Gly Gln Arg Ile
900 905 910
Ile Asp Leu Met Trp Asn Thr Asp Gln Asn Phe Met Gln Ile Val Asn
915 920 925
Gln Pro Val Phe Lys Glu Gln Ile Asp Gln Leu Asn Gln Lys Ala Ile
930 935 940
Thr Asn Asp Gly Met Thr Leu Arg Glu Arg Val Glu Ser Val Leu Asp
945 950 955 960
Asp Ala Tyr Thr Ser Pro Gln Asn Lys Lys Ala Ile Trp Gln Val Val
965 970 975
Arg Val Val Glu Asp Ile Val Lys Ala Val Gly Asn Ala Pro Lys Ser
980 985 990
Ile Ser Ile Glu Phe Ala Arg Asn Glu Gly Asn Lys Gly Glu Ile Thr
995 1000 1005
Arg Ser Arg Arg Thr Gln Leu Gln Lys Leu Phe Glu Asp Gln Ala
1010 1015 1020
His Glu Leu Val Lys Asp Thr Ser Leu Thr Glu Glu Leu Glu Lys
1025 1030 1035
Ala Pro Asp Leu Ser Asp Arg Tyr Tyr Phe Tyr Phe Thr Gln Gly
1040 1045 1050
Gly Lys Asp Met Tyr Thr Gly Asp Pro Ile Asn Phe Asp Glu Ile
1055 1060 1065
Ser Thr Lys Tyr Asp Ile Asp His Ile Leu Pro Gln Ser Phe Val
1070 1075 1080
Lys Asp Asp Ser Leu Asp Asn Arg Val Leu Val Ser Arg Ala Glu
1085 1090 1095
Asn Asn Lys Lys Ser Asp Arg Val Pro Ala Lys Leu Tyr Ala Ala
1100 1105 1110
Lys Met Lys Pro Tyr Trp Asn Gln Leu Leu Lys Gln Gly Leu Ile
1115 1120 1125
Thr Gln Arg Lys Phe Glu Asn Leu Thr Met Asp Val Asp Gln Thr
1130 1135 1140
Ile Lys Tyr Arg Ser Leu Gly Phe Val Lys Arg Gln Leu Val Glu
1145 1150 1155
Thr Arg Gln Val Ile Lys Leu Thr Ala Asn Ile Leu Gly Ser Met
1160 1165 1170
Tyr Gln Glu Ala Gly Thr Asp Ile Ile Glu Thr Arg Ala Gly Leu
1175 1180 1185
Thr Lys Gln Leu Arg Glu Glu Phe Asp Leu Pro Lys Val Arg Glu
1190 1195 1200
Val Asn Asp Tyr His His Ala Val Asp Ala Tyr Leu Thr Thr Phe
1205 1210 1215
Ala Gly Gln Tyr Leu Asn Arg Arg Tyr Pro Lys Leu Arg Ser Phe
1220 1225 1230
Phe Val Tyr Gly Glu Tyr Met Lys Phe Lys His Gly Ser Asp Leu
1235 1240 1245
Lys Leu Arg Asn Phe Asn Phe Phe His Glu Leu Met Glu Gly Asp
1250 1255 1260
Lys Ser Gln Gly Lys Val Val Asp Gln Gln Thr Gly Glu Leu Ile
1265 1270 1275
Thr Thr Arg Asp Glu Val Ala Asp Tyr Phe Asp Trp Val Ile Asn
1280 1285 1290
Leu Lys Val Met Leu Ile Ser Asn Glu Thr Tyr Glu Glu Thr Gly
1295 1300 1305
Lys Tyr Phe Asp Ala Ser His Glu Ser Ser Ser Leu Tyr Leu Lys
1310 1315 1320
Asn Gln Asn Lys Lys Ser Lys Leu Val Val Pro Leu Lys Asn Lys
1325 1330 1335
Leu Gln Pro Glu Tyr Tyr Gly Ala Tyr Thr Gly Ile Thr Gln Gly
1340 1345 1350
Tyr Met Val Ile Leu Lys Leu Leu Asp Lys Lys Gly Gly Phe Gly
1355 1360 1365
Val Tyr Arg Ile Pro Arg Tyr Ala Ala Asp Ile Leu Asn Lys Cys
1370 1375 1380
His Asp Glu Val Ala Tyr Arg Asn Lys Ile Ala Glu Ile Ile Ser
1385 1390 1395
Ser Asp Pro Arg Ala Pro Lys Ser Phe Glu Val Val Val Pro Arg
1400 1405 1410
Val Leu Lys Gly Thr Phe Leu Val Asp Gly Glu Glu Lys Phe Ile
1415 1420 1425
Leu Ser Ser Tyr Arg Tyr Lys Val Asn Ala Thr Gln Leu Ile Leu
1430 1435 1440
Pro Val Ser Asp Ile Lys Leu Ile Gln Asp Asn Phe Lys Ala Leu
1445 1450 1455
Lys Lys Leu Asn Val Glu Met Gln Thr Lys Lys Leu Ile Glu Ile
1460 1465 1470
Tyr Asp Asn Ile Leu Arg Gln Val Asp Lys Tyr Tyr Lys Leu Tyr
1475 1480 1485
Asp Ile Asn Lys Phe Arg Ala Lys Leu His Asp Gly Arg Ser Lys
1490 1495 1500
Phe Val Glu Leu Asp Asp Phe Gly Gln Asp Ala Ser Lys Glu Lys
1505 1510 1515
Val Ile Ile Lys Ile Leu Arg Gly Leu His Phe Gly Ser Asp Leu
1520 1525 1530
Gln Asn Leu Lys Glu Ile Gly Phe Gly Thr Thr Pro Leu Gly Gln
1535 1540 1545
Phe Gln Val Ser Glu Ala Gly Ile Arg Leu Ser Asn Thr Ala Phe
1550 1555 1560
Ile Ile Phe Lys Ser Pro Thr Gly Leu Phe Asn Arg Lys Leu Tyr
1565 1570 1575
Leu Lys Asn Leu Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1580 1585 1590
Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp
1595 1600 1605
Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp
1610 1615 1620
Val Pro Asp Tyr Ala
1625
<210> 89
<211> 1624
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 89
Met Pro Lys Lys Lys Arg Lys Val Gly Lys Glu Tyr His Ile Gly Leu
1 5 10 15
Ala Ile Gly Thr Ser Ser Ile Gly Trp Ala Val Thr Asp Ser Gln Phe
20 25 30
Lys Leu Met Arg Ile Lys Gly Lys Thr Ala Ile Gly Val Arg Leu Phe
35 40 45
Glu Glu Gly Lys Thr Ala Ala Glu Arg Arg Thr Phe Arg Thr Thr Arg
50 55 60
Arg Arg Leu Lys Arg Arg Lys Trp Arg Leu His Tyr Leu Asp Glu Ile
65 70 75 80
Phe Ala Pro His Leu Gln Glu Val Asp Glu Asn Phe Leu Arg Arg Leu
85 90 95
Lys Gln Ser Asn Ile His Pro Glu Asp Pro Ala Lys Asn Gln Ala Phe
100 105 110
Ile Gly Lys Leu Leu Phe Pro Asp Leu Leu Lys Lys Asn Glu Arg Gly
115 120 125
Tyr Pro Thr Leu Ile Lys Met Arg Asp Glu Leu Pro Val Glu Gln Arg
130 135 140
Ala His Tyr Pro Val Thr Asn Ile Tyr Lys Leu Arg Glu Ala Met Ile
145 150 155 160
Asn Glu Asp Arg Gln Phe Asp Leu Arg Glu Val Tyr Leu Ala Val His
165 170 175
His Ile Val Lys Tyr Arg Gly His Phe Leu Asn Asn Ala Ser Val Asp
180 185 190
Lys Phe Lys Val Gly Arg Ile Asp Phe Asp Lys Ser Phe Asn Val Leu
195 200 205
Asn Glu Ala Tyr Glu Glu Leu Gln Asn Gly Glu Gly Ser Phe Thr Ile
210 215 220
Glu Pro Ser Lys Val Glu Lys Ile Gly Gln Leu Leu Leu Asp Thr Lys
225 230 235 240
Met Arg Lys Leu Asp Arg Gln Lys Ala Val Ala Lys Leu Leu Glu Val
245 250 255
Lys Val Ala Asp Lys Glu Glu Thr Lys Arg Asn Lys Gln Ile Ala Thr
260 265 270
Ala Met Ser Lys Leu Val Leu Gly Tyr Lys Ala Asp Phe Ala Thr Val
275 280 285
Ala Met Ala Asn Gly Asn Glu Trp Lys Ile Asp Leu Ser Ser Glu Thr
290 295 300
Ser Glu Asp Glu Ile Glu Lys Phe Arg Glu Glu Leu Ser Asp Ala Gln
305 310 315 320
Asn Asp Ile Leu Thr Glu Ile Thr Ser Leu Phe Ser Gln Ile Met Leu
325 330 335
Asn Glu Ile Val Pro Asn Gly Met Ser Ile Ser Glu Ser Met Met Asp
340 345 350
Arg Tyr Trp Thr His Glu Arg Gln Leu Ala Glu Val Lys Glu Tyr Leu
355 360 365
Ala Thr Gln Pro Ala Ser Ala Arg Lys Glu Phe Asp Gln Val Tyr Asn
370 375 380
Lys Tyr Ile Gly Gln Ala Pro Lys Glu Lys Gly Phe Asp Leu Glu Lys
385 390 395 400
Gly Leu Lys Lys Ile Leu Ser Lys Lys Glu Asn Trp Lys Glu Ile Asp
405 410 415
Glu Leu Leu Lys Ala Gly Asp Phe Leu Pro Lys Gln Arg Thr Ser Ala
420 425 430
Asn Gly Val Ile Pro His Gln Met His Gln Gln Glu Leu Asp Arg Ile
435 440 445
Ile Glu Lys Gln Ala Lys Tyr Tyr Pro Trp Leu Ala Thr Glu Asn Pro
450 455 460
Ala Thr Gly Glu Arg Asp Arg His Gln Ala Lys Tyr Glu Leu Asp Gln
465 470 475 480
Leu Val Ser Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Val Thr Pro
485 490 495
Glu Val Gln Lys Ala Thr Ser Gly Ala Lys Phe Ala Trp Ala Lys Arg
500 505 510
Lys Glu Asp Gly Glu Ile Thr Pro Trp Asn Leu Trp Asp Lys Ile Asp
515 520 525
Arg Ala Glu Ser Ala Glu Ala Phe Ile Lys Arg Met Thr Val Lys Asp
530 535 540
Thr Tyr Leu Leu Asn Glu Asp Val Leu Pro Ala Asn Ser Leu Leu Tyr
545 550 555 560
Gln Lys Tyr Asn Val Leu Asn Glu Leu Asn Asn Val Arg Val Asn Gly
565 570 575
Arg Arg Leu Ser Val Gly Ile Lys Gln Asp Ile Tyr Thr Glu Leu Phe
580 585 590
Lys Lys Lys Lys Thr Val Lys Ala Gly Asp Val Ala Ser Leu Val Met
595 600 605
Ala Lys Thr Arg Gly Val Asn Lys Pro Ser Val Glu Gly Leu Ser Asp
610 615 620
Pro Lys Lys Phe Asn Ser Asn Leu Ala Thr Tyr Leu Asp Leu Lys Ser
625 630 635 640
Ile Val Gly Asp Lys Val Asp Asp Asn Arg Tyr Gln Met Asp Leu Glu
645 650 655
Asn Ile Ile Glu Trp Arg Ser Val Phe Glu Asp Gly Glu Ile Phe Ala
660 665 670
Asp Lys Leu Thr Glu Val Glu Trp Leu Thr Asp Glu Gln Arg Ser Ala
675 680 685
Leu Val Lys Lys Arg Tyr Lys Gly Trp Gly Arg Leu Ser Lys Lys Leu
690 695 700
Leu Thr Gly Ile Val Asp Glu Asn Gly Gln Arg Ile Ile Asp Leu Met
705 710 715 720
Trp Asn Thr Asp Gln Asn Phe Met Gln Ile Val Asn Gln Pro Val Phe
725 730 735
Lys Glu Gln Ile Asp Gln Leu Asn Gln Lys Ala Ile Thr Asn Asp Gly
740 745 750
Met Thr Leu Arg Glu Arg Val Glu Ser Val Leu Asp Asp Ala Tyr Thr
755 760 765
Ser Pro Gln Asn Lys Lys Ala Ile Trp Gln Val Val Arg Val Val Glu
770 775 780
Asp Ile Val Lys Ala Val Gly Asn Ala Pro Lys Ser Ile Ser Ile Glu
785 790 795 800
Phe Ala Arg Asn Glu Gly Asn Lys Gly Glu Ile Thr Arg Ser Arg Arg
805 810 815
Thr Gln Leu Gln Lys Leu Phe Glu Asp Gln Ala His Glu Leu Val Lys
820 825 830
Asp Thr Ser Leu Thr Glu Glu Leu Glu Lys Ala Pro Asp Leu Ser Asp
835 840 845
Arg Tyr Tyr Phe Tyr Phe Thr Gln Gly Gly Lys Asp Met Tyr Thr Gly
850 855 860
Asp Pro Ile Asn Phe Asp Glu Ile Ser Thr Lys Tyr Asp Ile Asp His
865 870 875 880
Ile Leu Pro Gln Ser Phe Val Lys Asp Asp Ser Leu Asp Asn Arg Val
885 890 895
Leu Val Ser Arg Ala Glu Asn Asn Lys Lys Ser Asp Arg Val Pro Ala
900 905 910
Lys Leu Tyr Ala Ala Lys Met Lys Pro Tyr Trp Asn Gln Leu Leu Lys
915 920 925
Gln Gly Leu Ile Thr Gln Arg Lys Phe Glu Asn Leu Thr Met Asp Val
930 935 940
Asp Gln Thr Ile Lys Tyr Arg Ser Leu Gly Phe Val Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Val Ile Lys Leu Thr Ala Asn Ile Leu Gly Ser
965 970 975
Met Tyr Gln Glu Ala Gly Thr Asp Ile Ile Glu Thr Arg Ala Gly Leu
980 985 990
Thr Lys Gln Leu Arg Glu Glu Phe Asp Leu Pro Lys Val Arg Glu Val
995 1000 1005
Asn Asp Tyr His His Ala Val Asp Ala Tyr Leu Thr Thr Phe Ala
1010 1015 1020
Gly Gln Tyr Leu Asn Arg Arg Tyr Pro Lys Leu Arg Ser Phe Phe
1025 1030 1035
Val Tyr Gly Glu Tyr Met Lys Phe Lys His Gly Ser Asp Leu Lys
1040 1045 1050
Leu Arg Asn Phe Asn Phe Phe His Glu Leu Met Glu Gly Asp Lys
1055 1060 1065
Ser Gln Gly Lys Val Val Asp Gln Gln Thr Gly Glu Leu Ile Thr
1070 1075 1080
Thr Arg Asp Glu Val Ala Asp Tyr Phe Asp Trp Val Ile Asn Leu
1085 1090 1095
Lys Val Met Leu Ile Ser Asn Glu Thr Tyr Glu Glu Thr Gly Lys
1100 1105 1110
Tyr Phe Asp Ala Ser His Glu Ser Ser Ser Leu Tyr Leu Lys Asn
1115 1120 1125
Gln Asn Lys Lys Ser Lys Leu Val Val Pro Leu Lys Asn Lys Leu
1130 1135 1140
Gln Pro Glu Tyr Tyr Gly Ala Tyr Thr Gly Ile Thr Gln Gly Tyr
1145 1150 1155
Met Val Ile Leu Lys Leu Leu Asp Lys Lys Gly Gly Phe Gly Val
1160 1165 1170
Tyr Arg Ile Pro Arg Tyr Ala Ala Asp Ile Leu Asn Lys Cys His
1175 1180 1185
Asp Glu Val Ala Tyr Arg Asn Lys Ile Ala Glu Ile Ile Ser Ser
1190 1195 1200
Asp Pro Arg Ala Pro Lys Ser Phe Glu Val Val Val Pro Arg Val
1205 1210 1215
Leu Lys Gly Thr Phe Leu Val Asp Gly Glu Glu Lys Phe Ile Leu
1220 1225 1230
Ser Ser Tyr Arg Tyr Lys Val Asn Ala Thr Gln Leu Ile Leu Pro
1235 1240 1245
Val Ser Asp Ile Lys Leu Ile Gln Asp Asn Phe Lys Ala Leu Lys
1250 1255 1260
Lys Leu Asn Val Glu Met Gln Thr Lys Lys Leu Ile Glu Ile Tyr
1265 1270 1275
Asp Asn Ile Leu Arg Gln Val Asp Lys Tyr Tyr Lys Leu Tyr Asp
1280 1285 1290
Ile Asn Lys Phe Arg Ala Lys Leu His Asp Gly Arg Ser Lys Phe
1295 1300 1305
Val Glu Leu Asp Asp Phe Gly Gln Asp Ala Ser Lys Glu Lys Val
1310 1315 1320
Ile Ile Lys Ile Leu Arg Gly Leu His Phe Gly Ser Asp Leu Gln
1325 1330 1335
Asn Leu Lys Glu Ile Gly Phe Gly Thr Thr Pro Leu Gly Gln Phe
1340 1345 1350
Gln Val Ser Glu Ala Gly Ile Arg Leu Ser Asn Thr Ala Phe Ile
1355 1360 1365
Ile Phe Lys Ser Pro Thr Gly Leu Phe Asn Arg Lys Leu Tyr Leu
1370 1375 1380
Lys Asn Leu Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
1385 1390 1395
Lys Lys Lys Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
1400 1405 1410
Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu
1415 1420 1425
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp
1430 1435 1440
Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg
1445 1450 1455
Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
1460 1465 1470
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val
1475 1480 1485
Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe
1490 1495 1500
Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile
1505 1510 1515
Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala
1520 1525 1530
Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg
1535 1540 1545
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
1550 1555 1560
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln
1565 1570 1575
Lys Lys Ala Gln Ser Ser Thr Asp Pro Ala Ala Lys Arg Val Lys
1580 1585 1590
Leu Asp Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro
1595 1600 1605
Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr
1610 1615 1620
Ala
<210> 90
<211> 1888
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 90
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Thr Ser Glu Lys Gly Pro
1 5 10 15
Ser Thr Gly Asp Pro Thr Leu Arg Arg Arg Ile Glu Ser Trp Glu Phe
20 25 30
Asp Val Phe Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu
35 40 45
Tyr Glu Ile Lys Trp Gly Met Ser Arg Lys Ile Trp Arg Ser Ser Gly
50 55 60
Lys Asn Thr Thr Asn His Val Glu Val Asn Phe Ile Lys Lys Phe Thr
65 70 75 80
Ser Glu Arg Arg Phe His Ser Ser Ile Ser Cys Ser Ile Thr Trp Phe
85 90 95
Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser Gln Ala Ile Arg Glu Phe
100 105 110
Leu Ser Gln His Pro Gly Val Thr Leu Val Ile Tyr Val Ala Arg Leu
115 120 125
Phe Trp His Met Asp Gln Arg Asn Arg Gln Gly Leu Arg Asp Leu Val
130 135 140
Asn Ser Gly Val Thr Ile Gln Ile Met Arg Ala Ser Glu Tyr Tyr His
145 150 155 160
Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro Gly Asp Glu Ala His Trp
165 170 175
Pro Gln Tyr Pro Pro Leu Trp Met Met Leu Tyr Ala Leu Glu Leu His
180 185 190
Cys Ile Ile Leu Ser Leu Pro Pro Cys Leu Lys Ile Ser Arg Arg Trp
195 200 205
Gln Asn His Leu Ala Phe Phe Arg Leu His Leu Gln Asn Cys His Tyr
210 215 220
Gln Thr Ile Pro Pro His Ile Leu Leu Ala Thr Gly Leu Ile His Pro
225 230 235 240
Ser Val Thr Trp Arg Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
245 250 255
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
260 265 270
Gly Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Lys
275 280 285
Glu Tyr His Ile Gly Leu Ala Ile Gly Thr Ser Ser Ile Gly Trp Ala
290 295 300
Val Thr Asp Ser Gln Phe Lys Leu Met Arg Ile Lys Gly Lys Thr Ala
305 310 315 320
Ile Gly Val Arg Leu Phe Glu Glu Gly Lys Thr Ala Ala Glu Arg Arg
325 330 335
Thr Phe Arg Thr Thr Arg Arg Arg Leu Lys Arg Arg Lys Trp Arg Leu
340 345 350
His Tyr Leu Asp Glu Ile Phe Ala Pro His Leu Gln Glu Val Asp Glu
355 360 365
Asn Phe Leu Arg Arg Leu Lys Gln Ser Asn Ile His Pro Glu Asp Pro
370 375 380
Ala Lys Asn Gln Ala Phe Ile Gly Lys Leu Leu Phe Pro Asp Leu Leu
385 390 395 400
Lys Lys Asn Glu Arg Gly Tyr Pro Thr Leu Ile Lys Met Arg Asp Glu
405 410 415
Leu Pro Val Glu Gln Arg Ala His Tyr Pro Val Thr Asn Ile Tyr Lys
420 425 430
Leu Arg Glu Ala Met Ile Asn Glu Asp Arg Gln Phe Asp Leu Arg Glu
435 440 445
Val Tyr Leu Ala Val His His Ile Val Lys Tyr Arg Gly His Phe Leu
450 455 460
Asn Asn Ala Ser Val Asp Lys Phe Lys Val Gly Arg Ile Asp Phe Asp
465 470 475 480
Lys Ser Phe Asn Val Leu Asn Glu Ala Tyr Glu Glu Leu Gln Asn Gly
485 490 495
Glu Gly Ser Phe Thr Ile Glu Pro Ser Lys Val Glu Lys Ile Gly Gln
500 505 510
Leu Leu Leu Asp Thr Lys Met Arg Lys Leu Asp Arg Gln Lys Ala Val
515 520 525
Ala Lys Leu Leu Glu Val Lys Val Ala Asp Lys Glu Glu Thr Lys Arg
530 535 540
Asn Lys Gln Ile Ala Thr Ala Met Ser Lys Leu Val Leu Gly Tyr Lys
545 550 555 560
Ala Asp Phe Ala Thr Val Ala Met Ala Asn Gly Asn Glu Trp Lys Ile
565 570 575
Asp Leu Ser Ser Glu Thr Ser Glu Asp Glu Ile Glu Lys Phe Arg Glu
580 585 590
Glu Leu Ser Asp Ala Gln Asn Asp Ile Leu Thr Glu Ile Thr Ser Leu
595 600 605
Phe Ser Gln Ile Met Leu Asn Glu Ile Val Pro Asn Gly Met Ser Ile
610 615 620
Ser Glu Ser Met Met Asp Arg Tyr Trp Thr His Glu Arg Gln Leu Ala
625 630 635 640
Glu Val Lys Glu Tyr Leu Ala Thr Gln Pro Ala Ser Ala Arg Lys Glu
645 650 655
Phe Asp Gln Val Tyr Asn Lys Tyr Ile Gly Gln Ala Pro Lys Glu Lys
660 665 670
Gly Phe Asp Leu Glu Lys Gly Leu Lys Lys Ile Leu Ser Lys Lys Glu
675 680 685
Asn Trp Lys Glu Ile Asp Glu Leu Leu Lys Ala Gly Asp Phe Leu Pro
690 695 700
Lys Gln Arg Thr Ser Ala Asn Gly Val Ile Pro His Gln Met His Gln
705 710 715 720
Gln Glu Leu Asp Arg Ile Ile Glu Lys Gln Ala Lys Tyr Tyr Pro Trp
725 730 735
Leu Ala Thr Glu Asn Pro Ala Thr Gly Glu Arg Asp Arg His Gln Ala
740 745 750
Lys Tyr Glu Leu Asp Gln Leu Val Ser Phe Arg Ile Pro Tyr Tyr Val
755 760 765
Gly Pro Leu Val Thr Pro Glu Val Gln Lys Ala Thr Ser Gly Ala Lys
770 775 780
Phe Ala Trp Ala Lys Arg Lys Glu Asp Gly Glu Ile Thr Pro Trp Asn
785 790 795 800
Leu Trp Asp Lys Ile Asp Arg Ala Glu Ser Ala Glu Ala Phe Ile Lys
805 810 815
Arg Met Thr Val Lys Asp Thr Tyr Leu Leu Asn Glu Asp Val Leu Pro
820 825 830
Ala Asn Ser Leu Leu Tyr Gln Lys Tyr Asn Val Leu Asn Glu Leu Asn
835 840 845
Asn Val Arg Val Asn Gly Arg Arg Leu Ser Val Gly Ile Lys Gln Asp
850 855 860
Ile Tyr Thr Glu Leu Phe Lys Lys Lys Lys Thr Val Lys Ala Gly Asp
865 870 875 880
Val Ala Ser Leu Val Met Ala Lys Thr Arg Gly Val Asn Lys Pro Ser
885 890 895
Val Glu Gly Leu Ser Asp Pro Lys Lys Phe Asn Ser Asn Leu Ala Thr
900 905 910
Tyr Leu Asp Leu Lys Ser Ile Val Gly Asp Lys Val Asp Asp Asn Arg
915 920 925
Tyr Gln Met Asp Leu Glu Asn Ile Ile Glu Trp Arg Ser Val Phe Glu
930 935 940
Asp Gly Glu Ile Phe Ala Asp Lys Leu Thr Glu Val Glu Trp Leu Thr
945 950 955 960
Asp Glu Gln Arg Ser Ala Leu Val Lys Lys Arg Tyr Lys Gly Trp Gly
965 970 975
Arg Leu Ser Lys Lys Leu Leu Thr Gly Ile Val Asp Glu Asn Gly Gln
980 985 990
Arg Ile Ile Asp Leu Met Trp Asn Thr Asp Gln Asn Phe Met Gln Ile
995 1000 1005
Val Asn Gln Pro Val Phe Lys Glu Gln Ile Asp Gln Leu Asn Gln
1010 1015 1020
Lys Ala Ile Thr Asn Asp Gly Met Thr Leu Arg Glu Arg Val Glu
1025 1030 1035
Ser Val Leu Asp Asp Ala Tyr Thr Ser Pro Gln Asn Lys Lys Ala
1040 1045 1050
Ile Trp Gln Val Val Arg Val Val Glu Asp Ile Val Lys Ala Val
1055 1060 1065
Gly Asn Ala Pro Lys Ser Ile Ser Ile Glu Phe Ala Arg Asn Glu
1070 1075 1080
Gly Asn Lys Gly Glu Ile Thr Arg Ser Arg Arg Thr Gln Leu Gln
1085 1090 1095
Lys Leu Phe Glu Asp Gln Ala His Glu Leu Val Lys Asp Thr Ser
1100 1105 1110
Leu Thr Glu Glu Leu Glu Lys Ala Pro Asp Leu Ser Asp Arg Tyr
1115 1120 1125
Tyr Phe Tyr Phe Thr Gln Gly Gly Lys Asp Met Tyr Thr Gly Asp
1130 1135 1140
Pro Ile Asn Phe Asp Glu Ile Ser Thr Lys Tyr Asp Ile Asp His
1145 1150 1155
Ile Leu Pro Gln Ser Phe Val Lys Asp Asp Ser Leu Asp Asn Arg
1160 1165 1170
Val Leu Val Ser Arg Ala Glu Asn Asn Lys Lys Ser Asp Arg Val
1175 1180 1185
Pro Ala Lys Leu Tyr Ala Ala Lys Met Lys Pro Tyr Trp Asn Gln
1190 1195 1200
Leu Leu Lys Gln Gly Leu Ile Thr Gln Arg Lys Phe Glu Asn Leu
1205 1210 1215
Thr Met Asp Val Asp Gln Thr Ile Lys Tyr Arg Ser Leu Gly Phe
1220 1225 1230
Val Lys Arg Gln Leu Val Glu Thr Arg Gln Val Ile Lys Leu Thr
1235 1240 1245
Ala Asn Ile Leu Gly Ser Met Tyr Gln Glu Ala Gly Thr Asp Ile
1250 1255 1260
Ile Glu Thr Arg Ala Gly Leu Thr Lys Gln Leu Arg Glu Glu Phe
1265 1270 1275
Asp Leu Pro Lys Val Arg Glu Val Asn Asp Tyr His His Ala Val
1280 1285 1290
Asp Ala Tyr Leu Thr Thr Phe Ala Gly Gln Tyr Leu Asn Arg Arg
1295 1300 1305
Tyr Pro Lys Leu Arg Ser Phe Phe Val Tyr Gly Glu Tyr Met Lys
1310 1315 1320
Phe Lys His Gly Ser Asp Leu Lys Leu Arg Asn Phe Asn Phe Phe
1325 1330 1335
His Glu Leu Met Glu Gly Asp Lys Ser Gln Gly Lys Val Val Asp
1340 1345 1350
Gln Gln Thr Gly Glu Leu Ile Thr Thr Arg Asp Glu Val Ala Asp
1355 1360 1365
Tyr Phe Asp Trp Val Ile Asn Leu Lys Val Met Leu Ile Ser Asn
1370 1375 1380
Glu Thr Tyr Glu Glu Thr Gly Lys Tyr Phe Asp Ala Ser His Glu
1385 1390 1395
Ser Ser Ser Leu Tyr Leu Lys Asn Gln Asn Lys Lys Ser Lys Leu
1400 1405 1410
Val Val Pro Leu Lys Asn Lys Leu Gln Pro Glu Tyr Tyr Gly Ala
1415 1420 1425
Tyr Thr Gly Ile Thr Gln Gly Tyr Met Val Ile Leu Lys Leu Leu
1430 1435 1440
Asp Lys Lys Gly Gly Phe Gly Val Tyr Arg Ile Pro Arg Tyr Ala
1445 1450 1455
Ala Asp Ile Leu Asn Lys Cys His Asp Glu Val Ala Tyr Arg Asn
1460 1465 1470
Lys Ile Ala Glu Ile Ile Ser Ser Asp Pro Arg Ala Pro Lys Ser
1475 1480 1485
Phe Glu Val Val Val Pro Arg Val Leu Lys Gly Thr Phe Leu Val
1490 1495 1500
Asp Gly Glu Glu Lys Phe Ile Leu Ser Ser Tyr Arg Tyr Lys Val
1505 1510 1515
Asn Ala Thr Gln Leu Ile Leu Pro Val Ser Asp Ile Lys Leu Ile
1520 1525 1530
Gln Asp Asn Phe Lys Ala Leu Lys Lys Leu Asn Val Glu Met Gln
1535 1540 1545
Thr Lys Lys Leu Ile Glu Ile Tyr Asp Asn Ile Leu Arg Gln Val
1550 1555 1560
Asp Lys Tyr Tyr Lys Leu Tyr Asp Ile Asn Lys Phe Arg Ala Lys
1565 1570 1575
Leu His Asp Gly Arg Ser Lys Phe Val Glu Leu Asp Asp Phe Gly
1580 1585 1590
Gln Asp Ala Ser Lys Glu Lys Val Ile Ile Lys Ile Leu Arg Gly
1595 1600 1605
Leu His Phe Gly Ser Asp Leu Gln Asn Leu Lys Glu Ile Gly Phe
1610 1615 1620
Gly Thr Thr Pro Leu Gly Gln Phe Gln Val Ser Glu Ala Gly Ile
1625 1630 1635
Arg Leu Ser Asn Thr Ala Phe Ile Ile Phe Lys Ser Pro Thr Gly
1640 1645 1650
Leu Phe Asn Arg Lys Leu Tyr Leu Lys Asn Leu Gly Lys Arg Pro
1655 1660 1665
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1670 1675 1680
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp
1685 1690 1695
Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
1700 1705 1710
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys
1715 1720 1725
Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
1730 1735 1740
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys
1745 1750 1755
Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
1760 1765 1770
Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn
1775 1780 1785
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
1790 1795 1800
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1805 1810 1815
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
1820 1825 1830
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
1835 1840 1845
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
1850 1855 1860
Asn Lys Ile Lys Met Leu Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1865 1870 1875
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1880 1885
<210> 91
<211> 1609
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 91
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Glu Val Glu Phe
1 5 10 15
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
20 25 30
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
35 40 45
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
65 70 75 80
Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
85 90 95
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
100 105 110
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
115 120 125
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
130 135 140
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg
145 150 155 160
Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr
165 170 175
Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
180 185 190
Pro Glu Ser Ser Gly Pro Lys Lys Lys Arg Lys Val Gly Glu Lys Lys
195 200 205
Thr Asn Tyr Thr Ile Gly Leu Ala Ile Gly Thr Asp Ser Val Gly Trp
210 215 220
Ala Val Val Lys Asp Asp Leu Glu Leu Val Lys Lys Arg Met Lys Val
225 230 235 240
Leu Gly Asn Thr Glu Thr Asn Tyr Ile Lys Lys Asn Leu Trp Gly Ser
245 250 255
Leu Leu Phe Glu Ser Gly Gln Thr Ala Lys Asp Arg Arg Leu Lys Arg
260 265 270
Val Ala Arg Arg Arg Tyr Glu Arg Arg Arg Asn Arg Leu Thr Glu Leu
275 280 285
Gln Lys Ile Phe Ala Pro Ala Ile Asp Glu Val Asp Glu Asn Phe Phe
290 295 300
Phe Arg Leu Asn Glu Ser Phe Leu Val Pro Glu Asp Lys Ala Phe Ser
305 310 315 320
Lys Asn Pro Ile Phe Gly Thr Leu Gly Glu Asp Lys Thr Tyr Tyr Lys
325 330 335
Thr Tyr Pro Thr Ile Tyr His Leu Arg Gln His Leu Ala Asp Ser Glu
340 345 350
Glu Lys Ala Asp Val Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
355 360 365
Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Lys Leu Asp Thr Glu His
370 375 380
Ile Ala Ile Asn Glu Asn Leu Glu Gln Phe Phe Glu Ser Tyr Asn Ala
385 390 395 400
Leu Phe Ser Glu Glu Pro Ile Glu Leu Arg Lys Glu Glu Leu Ile Ala
405 410 415
Ile Glu Asn Ile Leu Arg Glu Lys Asn Ser Arg Thr Val Lys Glu Lys
420 425 430
Arg Ile Thr Ser Phe Leu Lys Asp Ile Gly Arg Ala Asn Lys Gln Ser
435 440 445
Pro Met Met Ala Phe Ile Thr Leu Ile Val Gly Lys Lys Ala Lys Phe
450 455 460
Lys Ala Ala Phe Asn Leu Glu Glu Glu Ile Ser Leu Asn Leu Thr Asp
465 470 475 480
Asp Ser Tyr Asp Glu Asn Leu Glu Ile Leu Leu Asn Thr Ile Gly Ser
485 490 495
Asp Phe Ala Asp Leu Phe Asp His Ala Gln Arg Val Tyr Asn Ala Val
500 505 510
Glu Leu Ala Gly Ile Leu Ser Gly Asp Val Lys Asn Thr His Ala Lys
515 520 525
Leu Ser Ala Gln Met Val Ala Met Tyr Glu Arg His Lys Glu Gln Leu
530 535 540
Lys Glu Tyr Lys Ser Phe Ile Lys Ala Asn Leu Pro Asp Gln Tyr Asp
545 550 555 560
Met Thr Phe Val Ala Pro Lys Asp Ala Gln Lys Lys Asp Leu Lys Gly
565 570 575
Tyr Ala Gly Tyr Ile Asp Gly Asn Met Ser Gln Asp Ser Phe Tyr Lys
580 585 590
Phe Val Lys Asp Gln Leu Lys Glu Val Pro Gly Ser Glu Lys Phe Leu
595 600 605
Asp Ser Ile Glu Lys Glu Asp Phe Leu Arg Lys Gln Arg Ser Phe Tyr
610 615 620
Asn Gly Val Ile Pro Asn Gln Val His Leu Ala Glu Met Glu Ala Ile
625 630 635 640
Leu Asp Arg Gln Glu Asn Tyr Tyr Pro Trp Leu Lys Glu Asn Arg Glu
645 650 655
Lys Ile Ile Ser Leu Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
660 665 670
Leu Ala Asp Gly Gln Ser Glu Phe Ala Trp Leu Glu Arg Lys Ser Asp
675 680 685
Glu Lys Ile Lys Pro Trp Asn Phe Ser Asp Val Val Asp Leu Asp Arg
690 695 700
Ser Ala Glu Lys Phe Ile Glu Gln Leu Ile Gly Arg Asp Thr Tyr Leu
705 710 715 720
Pro Asp Glu Tyr Val Leu Pro Lys Lys Ser Leu Ile Tyr Gln Lys Tyr
725 730 735
Met Val Phe Asn Glu Leu Thr Lys Ile Ala Tyr Leu Asp Glu Arg Gln
740 745 750
Lys Arg Met Asn Leu Ser Ser Val Glu Lys Lys Glu Ile Phe Glu Thr
755 760 765
Leu Phe Lys Lys Arg Ser Lys Val Thr Glu Lys Gln Leu Val Lys Phe
770 775 780
Phe Glu Asn Tyr Leu Gln Ile Asp Asn Pro Thr Ile Phe Gly Ile Glu
785 790 795 800
Asp Ala Phe Asn Ala Asp Tyr Ser Thr Tyr Val Glu Leu Ala Lys Val
805 810 815
Pro Gly Met Lys Ser Met Met Asp Asp Pro Asp Asn Glu Asp Leu Met
820 825 830
Glu Glu Ile Val Lys Ile Leu Thr Val Phe Glu Asp Arg Lys Met Arg
835 840 845
Arg Lys Gln Leu Glu Lys Tyr Lys Glu Arg Leu Ser Pro Glu Gln Ile
850 855 860
Lys Glu Leu Ala Lys Lys His Tyr Thr Gly Trp Gly Arg Leu Ser Lys
865 870 875 880
Lys Leu Leu Val Gly Ile Arg Asp Lys Glu Thr Gln Lys Thr Ile Leu
885 890 895
Asp Tyr Leu Val Glu Asp Asp Asn His Ser Gly Gly Arg Gln His Leu
900 905 910
Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Asp Arg Leu Ser Phe Lys
915 920 925
Lys Thr Ile Ala Glu Leu Gln Met Ile Asp Pro Ser Ala Asp Leu Tyr
930 935 940
Ala Gln Val Gln Glu Ile Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
945 950 955 960
Leu Leu Gly Leu Lys Ile Val Asp Glu Ile Ile Arg Val Met Gly Glu
965 970 975
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
980 985 990
Ala Arg Gly Lys Ala Leu Ser Lys Arg Arg Glu Ala Lys Ile Lys Glu
995 1000 1005
Gly Leu Ala Ala Leu Gly Ser Ser Leu Leu Lys Glu Asn Leu Pro
1010 1015 1020
Gly Asn Ala Asp Leu Ser Gln Arg Lys Ile Tyr Leu Tyr Tyr Thr
1025 1030 1035
Gln Asn Gly Lys Asp Ile Tyr Leu Asp Glu Pro Leu Asp Phe Asp
1040 1045 1050
Arg Leu Ser Gln Tyr Asp Glu Asp His Ile Ile Pro Gln Ser Phe
1055 1060 1065
Thr Val Asp Asn Ser Leu Asp Asn Leu Val Leu Thr Asn Ser Ser
1070 1075 1080
Gln Asn Arg Gly Asn Lys Lys Asp Asp Val Pro Ser Leu Glu Val
1085 1090 1095
Val Asn Arg Gln Leu Ala Tyr Trp Arg Ser Leu Lys Asp Ala Gly
1100 1105 1110
Leu Met Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Met Arg
1115 1120 1125
Gly Gly Leu Thr Asp Lys Asp Arg Glu Arg Phe Ile Gln Arg Gln
1130 1135 1140
Leu Val Glu Thr Arg Gln Ile Thr Lys Asn Val Ala Lys Leu Leu
1145 1150 1155
Asp Met Arg Leu Asn Asp Lys Lys Asp Glu Ala Gly Asn Lys Ile
1160 1165 1170
Arg Glu Thr Asn Ile Val Leu Leu Lys Ser Ala Met Ala Ser Glu
1175 1180 1185
Phe Arg Lys Met Phe Arg Leu Tyr Lys Val Arg Glu Leu Asn Asp
1190 1195 1200
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Ala Ile Ala Ile
1205 1210 1215
Asn Leu Leu Ala Leu Tyr Pro Tyr Met Ala Asp Asp Phe Val Tyr
1220 1225 1230
Gly Glu Phe Arg Tyr Lys Lys Lys Pro Gln Ala Glu Lys Ala Thr
1235 1240 1245
Tyr Glu Lys Leu Arg Gln Trp Asn Leu Ile Lys Arg Phe Gly Glu
1250 1255 1260
Lys Gln Leu Phe Thr Pro Asp His Glu Asp Cys Trp Asn Lys Glu
1265 1270 1275
Arg Asp Ile Lys Thr Ile Lys Lys Val Met Gly Tyr Arg Gln Val
1280 1285 1290
Asn Val Val Lys Lys Ala Glu Glu Arg Thr Gly Met Leu Phe Lys
1295 1300 1305
Glu Thr Ile Asn Gly Lys Thr Asn Lys Gly Ser Arg Ile Pro Ile
1310 1315 1320
Lys Lys Asp Leu Asp Pro Ser Lys Tyr Gly Gly Tyr Ile Glu Glu
1325 1330 1335
Lys Met Ala Tyr Tyr Ala Val Ile Ser Tyr Glu Asp Lys Lys Lys
1340 1345 1350
Lys Pro Gly Lys Thr Ile Val Gly Ile Ser Ile Met Asp Lys Lys
1355 1360 1365
Glu Phe Glu Tyr Asp Ser Ile Ser Tyr Leu Gly Lys Leu Gly Phe
1370 1375 1380
Ser Asn Pro Val Val Gln Ile Ile Leu Lys Asn Tyr Ser Leu Ile
1385 1390 1395
Ala Tyr Pro Asp Gly Arg Arg Arg Tyr Ile Thr Gly Ala Thr Lys
1400 1405 1410
Thr Thr Lys Gly Lys Val Glu Leu Gln Lys Ala Asn Gln Ile Ala
1415 1420 1425
Met Glu Gln Asp Leu Val Asn Phe Ile Tyr His Leu Lys Asn Tyr
1430 1435 1440
Asp Glu Ile Ser His Pro Glu Ser Tyr Ala Phe Val Gln Ser His
1445 1450 1455
Thr Asp Tyr Phe Asp Arg Leu Phe Asp Ser Ile Glu His Tyr Thr
1460 1465 1470
Arg Arg Phe Leu Asp Ala Glu Thr Asn Ile Asn Arg Leu Arg Arg
1475 1480 1485
Ile Tyr Glu Glu Glu Lys Lys Lys Asp Pro Val Asp Ile Glu Ala
1490 1495 1500
Leu Val Ala Ser Phe Ile Glu Leu Leu Lys Leu Thr Ser Ala Gly
1505 1510 1515
Ala Pro Ala Asp Phe Ile Phe Met Gly Glu Ala Ile Ser Arg Arg
1520 1525 1530
Arg Tyr Asn Ser Met Thr Gly Leu Phe Asp Gly Gln Val Ile Tyr
1535 1540 1545
Gln Ser Leu Thr Gly Leu Tyr Glu Thr Arg Met Arg Phe Glu Asp
1550 1555 1560
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1565 1570 1575
Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro
1580 1585 1590
Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr
1595 1600 1605
Ala
<210> 92
<211> 1604
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 92
Met Pro Lys Lys Lys Arg Lys Val Glu Lys Lys Thr Asn Tyr Thr Ile
1 5 10 15
Gly Leu Ala Ile Gly Thr Asp Ser Val Gly Trp Ala Val Val Lys Asp
20 25 30
Asp Leu Glu Leu Val Lys Lys Arg Met Lys Val Leu Gly Asn Thr Glu
35 40 45
Thr Asn Tyr Ile Lys Lys Asn Leu Trp Gly Ser Leu Leu Phe Glu Ser
50 55 60
Gly Gln Thr Ala Lys Asp Arg Arg Leu Lys Arg Val Ala Arg Arg Arg
65 70 75 80
Tyr Glu Arg Arg Arg Asn Arg Leu Thr Glu Leu Gln Lys Ile Phe Ala
85 90 95
Pro Ala Ile Asp Glu Val Asp Glu Asn Phe Phe Phe Arg Leu Asn Glu
100 105 110
Ser Phe Leu Val Pro Glu Asp Lys Ala Phe Ser Lys Asn Pro Ile Phe
115 120 125
Gly Thr Leu Gly Glu Asp Lys Thr Tyr Tyr Lys Thr Tyr Pro Thr Ile
130 135 140
Tyr His Leu Arg Gln His Leu Ala Asp Ser Glu Glu Lys Ala Asp Val
145 150 155 160
Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Tyr Arg Gly His
165 170 175
Phe Leu Ile Glu Gly Lys Leu Asp Thr Glu His Ile Ala Ile Asn Glu
180 185 190
Asn Leu Glu Gln Phe Phe Glu Ser Tyr Asn Ala Leu Phe Ser Glu Glu
195 200 205
Pro Ile Glu Leu Arg Lys Glu Glu Leu Ile Ala Ile Glu Asn Ile Leu
210 215 220
Arg Glu Lys Asn Ser Arg Thr Val Lys Glu Lys Arg Ile Thr Ser Phe
225 230 235 240
Leu Lys Asp Ile Gly Arg Ala Asn Lys Gln Ser Pro Met Met Ala Phe
245 250 255
Ile Thr Leu Ile Val Gly Lys Lys Ala Lys Phe Lys Ala Ala Phe Asn
260 265 270
Leu Glu Glu Glu Ile Ser Leu Asn Leu Thr Asp Asp Ser Tyr Asp Glu
275 280 285
Asn Leu Glu Ile Leu Leu Asn Thr Ile Gly Ser Asp Phe Ala Asp Leu
290 295 300
Phe Asp His Ala Gln Arg Val Tyr Asn Ala Val Glu Leu Ala Gly Ile
305 310 315 320
Leu Ser Gly Asp Val Lys Asn Thr His Ala Lys Leu Ser Ala Gln Met
325 330 335
Val Ala Met Tyr Glu Arg His Lys Glu Gln Leu Lys Glu Tyr Lys Ser
340 345 350
Phe Ile Lys Ala Asn Leu Pro Asp Gln Tyr Asp Met Thr Phe Val Ala
355 360 365
Pro Lys Asp Ala Gln Lys Lys Asp Leu Lys Gly Tyr Ala Gly Tyr Ile
370 375 380
Asp Gly Asn Met Ser Gln Asp Ser Phe Tyr Lys Phe Val Lys Asp Gln
385 390 395 400
Leu Lys Glu Val Pro Gly Ser Glu Lys Phe Leu Asp Ser Ile Glu Lys
405 410 415
Glu Asp Phe Leu Arg Lys Gln Arg Ser Phe Tyr Asn Gly Val Ile Pro
420 425 430
Asn Gln Val His Leu Ala Glu Met Glu Ala Ile Leu Asp Arg Gln Glu
435 440 445
Asn Tyr Tyr Pro Trp Leu Lys Glu Asn Arg Glu Lys Ile Ile Ser Leu
450 455 460
Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Asp Gly Gln
465 470 475 480
Ser Glu Phe Ala Trp Leu Glu Arg Lys Ser Asp Glu Lys Ile Lys Pro
485 490 495
Trp Asn Phe Ser Asp Val Val Asp Leu Asp Arg Ser Ala Glu Lys Phe
500 505 510
Ile Glu Gln Leu Ile Gly Arg Asp Thr Tyr Leu Pro Asp Glu Tyr Val
515 520 525
Leu Pro Lys Lys Ser Leu Ile Tyr Gln Lys Tyr Met Val Phe Asn Glu
530 535 540
Leu Thr Lys Ile Ala Tyr Leu Asp Glu Arg Gln Lys Arg Met Asn Leu
545 550 555 560
Ser Ser Val Glu Lys Lys Glu Ile Phe Glu Thr Leu Phe Lys Lys Arg
565 570 575
Ser Lys Val Thr Glu Lys Gln Leu Val Lys Phe Phe Glu Asn Tyr Leu
580 585 590
Gln Ile Asp Asn Pro Thr Ile Phe Gly Ile Glu Asp Ala Phe Asn Ala
595 600 605
Asp Tyr Ser Thr Tyr Val Glu Leu Ala Lys Val Pro Gly Met Lys Ser
610 615 620
Met Met Asp Asp Pro Asp Asn Glu Asp Leu Met Glu Glu Ile Val Lys
625 630 635 640
Ile Leu Thr Val Phe Glu Asp Arg Lys Met Arg Arg Lys Gln Leu Glu
645 650 655
Lys Tyr Lys Glu Arg Leu Ser Pro Glu Gln Ile Lys Glu Leu Ala Lys
660 665 670
Lys His Tyr Thr Gly Trp Gly Arg Leu Ser Lys Lys Leu Leu Val Gly
675 680 685
Ile Arg Asp Lys Glu Thr Gln Lys Thr Ile Leu Asp Tyr Leu Val Glu
690 695 700
Asp Asp Asn His Ser Gly Gly Arg Gln His Leu Asn Arg Asn Leu Met
705 710 715 720
Gln Leu Ile Asn Asp Asp Arg Leu Ser Phe Lys Lys Thr Ile Ala Glu
725 730 735
Leu Gln Met Ile Asp Pro Ser Ala Asp Leu Tyr Ala Gln Val Gln Glu
740 745 750
Ile Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Leu Gly Leu Lys
755 760 765
Ile Val Asp Glu Ile Ile Arg Val Met Gly Glu Lys Pro Glu Asn Ile
770 775 780
Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Ala Arg Gly Lys Ala
785 790 795 800
Leu Ser Lys Arg Arg Glu Ala Lys Ile Lys Glu Gly Leu Ala Ala Leu
805 810 815
Gly Ser Ser Leu Leu Lys Glu Asn Leu Pro Gly Asn Ala Asp Leu Ser
820 825 830
Gln Arg Lys Ile Tyr Leu Tyr Tyr Thr Gln Asn Gly Lys Asp Ile Tyr
835 840 845
Leu Asp Glu Pro Leu Asp Phe Asp Arg Leu Ser Gln Tyr Asp Glu Asp
850 855 860
His Ile Ile Pro Gln Ser Phe Thr Val Asp Asn Ser Leu Asp Asn Leu
865 870 875 880
Val Leu Thr Asn Ser Ser Gln Asn Arg Gly Asn Lys Lys Asp Asp Val
885 890 895
Pro Ser Leu Glu Val Val Asn Arg Gln Leu Ala Tyr Trp Arg Ser Leu
900 905 910
Lys Asp Ala Gly Leu Met Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
915 920 925
Ala Met Arg Gly Gly Leu Thr Asp Lys Asp Arg Glu Arg Phe Ile Gln
930 935 940
Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys Asn Val Ala Lys Leu
945 950 955 960
Leu Asp Met Arg Leu Asn Asp Lys Lys Asp Glu Ala Gly Asn Lys Ile
965 970 975
Arg Glu Thr Asn Ile Val Leu Leu Lys Ser Ala Met Ala Ser Glu Phe
980 985 990
Arg Lys Met Phe Arg Leu Tyr Lys Val Arg Glu Leu Asn Asp Tyr His
995 1000 1005
His Ala His Asp Ala Tyr Leu Asn Ala Ala Ile Ala Ile Asn Leu
1010 1015 1020
Leu Ala Leu Tyr Pro Tyr Met Ala Asp Asp Phe Val Tyr Gly Glu
1025 1030 1035
Phe Arg Tyr Lys Lys Lys Pro Gln Ala Glu Lys Ala Thr Tyr Glu
1040 1045 1050
Lys Leu Arg Gln Trp Asn Leu Ile Lys Arg Phe Gly Glu Lys Gln
1055 1060 1065
Leu Phe Thr Pro Asp His Glu Asp Cys Trp Asn Lys Glu Arg Asp
1070 1075 1080
Ile Lys Thr Ile Lys Lys Val Met Gly Tyr Arg Gln Val Asn Val
1085 1090 1095
Val Lys Lys Ala Glu Glu Arg Thr Gly Met Leu Phe Lys Glu Thr
1100 1105 1110
Ile Asn Gly Lys Thr Asn Lys Gly Ser Arg Ile Pro Ile Lys Lys
1115 1120 1125
Asp Leu Asp Pro Ser Lys Tyr Gly Gly Tyr Ile Glu Glu Lys Met
1130 1135 1140
Ala Tyr Tyr Ala Val Ile Ser Tyr Glu Asp Lys Lys Lys Lys Pro
1145 1150 1155
Gly Lys Thr Ile Val Gly Ile Ser Ile Met Asp Lys Lys Glu Phe
1160 1165 1170
Glu Tyr Asp Ser Ile Ser Tyr Leu Gly Lys Leu Gly Phe Ser Asn
1175 1180 1185
Pro Val Val Gln Ile Ile Leu Lys Asn Tyr Ser Leu Ile Ala Tyr
1190 1195 1200
Pro Asp Gly Arg Arg Arg Tyr Ile Thr Gly Ala Thr Lys Thr Thr
1205 1210 1215
Lys Gly Lys Val Glu Leu Gln Lys Ala Asn Gln Ile Ala Met Glu
1220 1225 1230
Gln Asp Leu Val Asn Phe Ile Tyr His Leu Lys Asn Tyr Asp Glu
1235 1240 1245
Ile Ser His Pro Glu Ser Tyr Ala Phe Val Gln Ser His Thr Asp
1250 1255 1260
Tyr Phe Asp Arg Leu Phe Asp Ser Ile Glu His Tyr Thr Arg Arg
1265 1270 1275
Phe Leu Asp Ala Glu Thr Asn Ile Asn Arg Leu Arg Arg Ile Tyr
1280 1285 1290
Glu Glu Glu Lys Lys Lys Asp Pro Val Asp Ile Glu Ala Leu Val
1295 1300 1305
Ala Ser Phe Ile Glu Leu Leu Lys Leu Thr Ser Ala Gly Ala Pro
1310 1315 1320
Ala Asp Phe Ile Phe Met Gly Glu Ala Ile Ser Arg Arg Arg Tyr
1325 1330 1335
Asn Ser Met Thr Gly Leu Phe Asp Gly Gln Val Ile Tyr Gln Ser
1340 1345 1350
Leu Thr Gly Leu Tyr Glu Thr Arg Met Arg Phe Glu Asp Lys Arg
1355 1360 1365
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser
1370 1375 1380
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1385 1390 1395
Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His
1400 1405 1410
Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro
1415 1420 1425
Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly
1430 1435 1440
Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu
1445 1450 1455
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
1460 1465 1470
Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
1475 1480 1485
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe
1490 1495 1500
Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
1505 1510 1515
Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
1520 1525 1530
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe
1535 1540 1545
Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser
1550 1555 1560
Ser Thr Asp Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Ser Tyr
1565 1570 1575
Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp
1580 1585 1590
Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1595 1600
<210> 93
<211> 1869
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 93
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Thr Ser Glu Lys Gly Pro
1 5 10 15
Ser Thr Gly Asp Pro Thr Leu Arg Arg Arg Ile Glu Ser Trp Glu Phe
20 25 30
Asp Val Phe Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu
35 40 45
Tyr Glu Ile Lys Trp Gly Met Ser Arg Lys Ile Trp Arg Ser Ser Gly
50 55 60
Lys Asn Thr Thr Asn His Val Glu Val Asn Phe Ile Lys Lys Phe Thr
65 70 75 80
Ser Glu Arg Arg Phe His Ser Ser Ile Ser Cys Ser Ile Thr Trp Phe
85 90 95
Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser Gln Ala Ile Arg Glu Phe
100 105 110
Leu Ser Gln His Pro Gly Val Thr Leu Val Ile Tyr Val Ala Arg Leu
115 120 125
Phe Trp His Met Asp Gln Arg Asn Arg Gln Gly Leu Arg Asp Leu Val
130 135 140
Asn Ser Gly Val Thr Ile Gln Ile Met Arg Ala Ser Glu Tyr Tyr His
145 150 155 160
Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro Gly Asp Glu Ala His Trp
165 170 175
Pro Gln Tyr Pro Pro Leu Trp Met Met Leu Tyr Ala Leu Glu Leu His
180 185 190
Cys Ile Ile Leu Ser Leu Pro Pro Cys Leu Lys Ile Ser Arg Arg Trp
195 200 205
Gln Asn His Leu Ala Phe Phe Arg Leu His Leu Gln Asn Cys His Tyr
210 215 220
Gln Thr Ile Pro Pro His Ile Leu Leu Ala Thr Gly Leu Ile His Pro
225 230 235 240
Ser Val Thr Trp Arg Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
245 250 255
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
260 265 270
Gly Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Glu
275 280 285
Lys Lys Thr Asn Tyr Thr Ile Gly Leu Ala Ile Gly Thr Asp Ser Val
290 295 300
Gly Trp Ala Val Val Lys Asp Asp Leu Glu Leu Val Lys Lys Arg Met
305 310 315 320
Lys Val Leu Gly Asn Thr Glu Thr Asn Tyr Ile Lys Lys Asn Leu Trp
325 330 335
Gly Ser Leu Leu Phe Glu Ser Gly Gln Thr Ala Lys Asp Arg Arg Leu
340 345 350
Lys Arg Val Ala Arg Arg Arg Tyr Glu Arg Arg Arg Asn Arg Leu Thr
355 360 365
Glu Leu Gln Lys Ile Phe Ala Pro Ala Ile Asp Glu Val Asp Glu Asn
370 375 380
Phe Phe Phe Arg Leu Asn Glu Ser Phe Leu Val Pro Glu Asp Lys Ala
385 390 395 400
Phe Ser Lys Asn Pro Ile Phe Gly Thr Leu Gly Glu Asp Lys Thr Tyr
405 410 415
Tyr Lys Thr Tyr Pro Thr Ile Tyr His Leu Arg Gln His Leu Ala Asp
420 425 430
Ser Glu Glu Lys Ala Asp Val Arg Leu Ile Tyr Leu Ala Leu Ala His
435 440 445
Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Lys Leu Asp Thr
450 455 460
Glu His Ile Ala Ile Asn Glu Asn Leu Glu Gln Phe Phe Glu Ser Tyr
465 470 475 480
Asn Ala Leu Phe Ser Glu Glu Pro Ile Glu Leu Arg Lys Glu Glu Leu
485 490 495
Ile Ala Ile Glu Asn Ile Leu Arg Glu Lys Asn Ser Arg Thr Val Lys
500 505 510
Glu Lys Arg Ile Thr Ser Phe Leu Lys Asp Ile Gly Arg Ala Asn Lys
515 520 525
Gln Ser Pro Met Met Ala Phe Ile Thr Leu Ile Val Gly Lys Lys Ala
530 535 540
Lys Phe Lys Ala Ala Phe Asn Leu Glu Glu Glu Ile Ser Leu Asn Leu
545 550 555 560
Thr Asp Asp Ser Tyr Asp Glu Asn Leu Glu Ile Leu Leu Asn Thr Ile
565 570 575
Gly Ser Asp Phe Ala Asp Leu Phe Asp His Ala Gln Arg Val Tyr Asn
580 585 590
Ala Val Glu Leu Ala Gly Ile Leu Ser Gly Asp Val Lys Asn Thr His
595 600 605
Ala Lys Leu Ser Ala Gln Met Val Ala Met Tyr Glu Arg His Lys Glu
610 615 620
Gln Leu Lys Glu Tyr Lys Ser Phe Ile Lys Ala Asn Leu Pro Asp Gln
625 630 635 640
Tyr Asp Met Thr Phe Val Ala Pro Lys Asp Ala Gln Lys Lys Asp Leu
645 650 655
Lys Gly Tyr Ala Gly Tyr Ile Asp Gly Asn Met Ser Gln Asp Ser Phe
660 665 670
Tyr Lys Phe Val Lys Asp Gln Leu Lys Glu Val Pro Gly Ser Glu Lys
675 680 685
Phe Leu Asp Ser Ile Glu Lys Glu Asp Phe Leu Arg Lys Gln Arg Ser
690 695 700
Phe Tyr Asn Gly Val Ile Pro Asn Gln Val His Leu Ala Glu Met Glu
705 710 715 720
Ala Ile Leu Asp Arg Gln Glu Asn Tyr Tyr Pro Trp Leu Lys Glu Asn
725 730 735
Arg Glu Lys Ile Ile Ser Leu Leu Thr Phe Arg Ile Pro Tyr Tyr Val
740 745 750
Gly Pro Leu Ala Asp Gly Gln Ser Glu Phe Ala Trp Leu Glu Arg Lys
755 760 765
Ser Asp Glu Lys Ile Lys Pro Trp Asn Phe Ser Asp Val Val Asp Leu
770 775 780
Asp Arg Ser Ala Glu Lys Phe Ile Glu Gln Leu Ile Gly Arg Asp Thr
785 790 795 800
Tyr Leu Pro Asp Glu Tyr Val Leu Pro Lys Lys Ser Leu Ile Tyr Gln
805 810 815
Lys Tyr Met Val Phe Asn Glu Leu Thr Lys Ile Ala Tyr Leu Asp Glu
820 825 830
Arg Gln Lys Arg Met Asn Leu Ser Ser Val Glu Lys Lys Glu Ile Phe
835 840 845
Glu Thr Leu Phe Lys Lys Arg Ser Lys Val Thr Glu Lys Gln Leu Val
850 855 860
Lys Phe Phe Glu Asn Tyr Leu Gln Ile Asp Asn Pro Thr Ile Phe Gly
865 870 875 880
Ile Glu Asp Ala Phe Asn Ala Asp Tyr Ser Thr Tyr Val Glu Leu Ala
885 890 895
Lys Val Pro Gly Met Lys Ser Met Met Asp Asp Pro Asp Asn Glu Asp
900 905 910
Leu Met Glu Glu Ile Val Lys Ile Leu Thr Val Phe Glu Asp Arg Lys
915 920 925
Met Arg Arg Lys Gln Leu Glu Lys Tyr Lys Glu Arg Leu Ser Pro Glu
930 935 940
Gln Ile Lys Glu Leu Ala Lys Lys His Tyr Thr Gly Trp Gly Arg Leu
945 950 955 960
Ser Lys Lys Leu Leu Val Gly Ile Arg Asp Lys Glu Thr Gln Lys Thr
965 970 975
Ile Leu Asp Tyr Leu Val Glu Asp Asp Asn His Ser Gly Gly Arg Gln
980 985 990
His Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Asp Arg Leu Ser
995 1000 1005
Phe Lys Lys Thr Ile Ala Glu Leu Gln Met Ile Asp Pro Ser Ala
1010 1015 1020
Asp Leu Tyr Ala Gln Val Gln Glu Ile Ala Gly Ser Pro Ala Ile
1025 1030 1035
Lys Lys Gly Ile Leu Leu Gly Leu Lys Ile Val Asp Glu Ile Ile
1040 1045 1050
Arg Val Met Gly Glu Lys Pro Glu Asn Ile Val Ile Glu Met Ala
1055 1060 1065
Arg Glu Asn Gln Thr Thr Ala Arg Gly Lys Ala Leu Ser Lys Arg
1070 1075 1080
Arg Glu Ala Lys Ile Lys Glu Gly Leu Ala Ala Leu Gly Ser Ser
1085 1090 1095
Leu Leu Lys Glu Asn Leu Pro Gly Asn Ala Asp Leu Ser Gln Arg
1100 1105 1110
Lys Ile Tyr Leu Tyr Tyr Thr Gln Asn Gly Lys Asp Ile Tyr Leu
1115 1120 1125
Asp Glu Pro Leu Asp Phe Asp Arg Leu Ser Gln Tyr Asp Glu Asp
1130 1135 1140
His Ile Ile Pro Gln Ser Phe Thr Val Asp Asn Ser Leu Asp Asn
1145 1150 1155
Leu Val Leu Thr Asn Ser Ser Gln Asn Arg Gly Asn Lys Lys Asp
1160 1165 1170
Asp Val Pro Ser Leu Glu Val Val Asn Arg Gln Leu Ala Tyr Trp
1175 1180 1185
Arg Ser Leu Lys Asp Ala Gly Leu Met Thr Gln Arg Lys Phe Asp
1190 1195 1200
Asn Leu Thr Lys Ala Met Arg Gly Gly Leu Thr Asp Lys Asp Arg
1205 1210 1215
Glu Arg Phe Ile Gln Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1220 1225 1230
Lys Asn Val Ala Lys Leu Leu Asp Met Arg Leu Asn Asp Lys Lys
1235 1240 1245
Asp Glu Ala Gly Asn Lys Ile Arg Glu Thr Asn Ile Val Leu Leu
1250 1255 1260
Lys Ser Ala Met Ala Ser Glu Phe Arg Lys Met Phe Arg Leu Tyr
1265 1270 1275
Lys Val Arg Glu Leu Asn Asp Tyr His His Ala His Asp Ala Tyr
1280 1285 1290
Leu Asn Ala Ala Ile Ala Ile Asn Leu Leu Ala Leu Tyr Pro Tyr
1295 1300 1305
Met Ala Asp Asp Phe Val Tyr Gly Glu Phe Arg Tyr Lys Lys Lys
1310 1315 1320
Pro Gln Ala Glu Lys Ala Thr Tyr Glu Lys Leu Arg Gln Trp Asn
1325 1330 1335
Leu Ile Lys Arg Phe Gly Glu Lys Gln Leu Phe Thr Pro Asp His
1340 1345 1350
Glu Asp Cys Trp Asn Lys Glu Arg Asp Ile Lys Thr Ile Lys Lys
1355 1360 1365
Val Met Gly Tyr Arg Gln Val Asn Val Val Lys Lys Ala Glu Glu
1370 1375 1380
Arg Thr Gly Met Leu Phe Lys Glu Thr Ile Asn Gly Lys Thr Asn
1385 1390 1395
Lys Gly Ser Arg Ile Pro Ile Lys Lys Asp Leu Asp Pro Ser Lys
1400 1405 1410
Tyr Gly Gly Tyr Ile Glu Glu Lys Met Ala Tyr Tyr Ala Val Ile
1415 1420 1425
Ser Tyr Glu Asp Lys Lys Lys Lys Pro Gly Lys Thr Ile Val Gly
1430 1435 1440
Ile Ser Ile Met Asp Lys Lys Glu Phe Glu Tyr Asp Ser Ile Ser
1445 1450 1455
Tyr Leu Gly Lys Leu Gly Phe Ser Asn Pro Val Val Gln Ile Ile
1460 1465 1470
Leu Lys Asn Tyr Ser Leu Ile Ala Tyr Pro Asp Gly Arg Arg Arg
1475 1480 1485
Tyr Ile Thr Gly Ala Thr Lys Thr Thr Lys Gly Lys Val Glu Leu
1490 1495 1500
Gln Lys Ala Asn Gln Ile Ala Met Glu Gln Asp Leu Val Asn Phe
1505 1510 1515
Ile Tyr His Leu Lys Asn Tyr Asp Glu Ile Ser His Pro Glu Ser
1520 1525 1530
Tyr Ala Phe Val Gln Ser His Thr Asp Tyr Phe Asp Arg Leu Phe
1535 1540 1545
Asp Ser Ile Glu His Tyr Thr Arg Arg Phe Leu Asp Ala Glu Thr
1550 1555 1560
Asn Ile Asn Arg Leu Arg Arg Ile Tyr Glu Glu Glu Lys Lys Lys
1565 1570 1575
Asp Pro Val Asp Ile Glu Ala Leu Val Ala Ser Phe Ile Glu Leu
1580 1585 1590
Leu Lys Leu Thr Ser Ala Gly Ala Pro Ala Asp Phe Ile Phe Met
1595 1600 1605
Gly Glu Ala Ile Ser Arg Arg Arg Tyr Asn Ser Met Thr Gly Leu
1610 1615 1620
Phe Asp Gly Gln Val Ile Tyr Gln Ser Leu Thr Gly Leu Tyr Glu
1625 1630 1635
Thr Arg Met Arg Phe Glu Asp Gly Lys Arg Pro Ala Ala Thr Lys
1640 1645 1650
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Ser Gly Gly Ser
1655 1660 1665
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys
1670 1675 1680
Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
1685 1690 1695
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp
1700 1705 1710
Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
1715 1720 1725
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu
1730 1735 1740
Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser
1745 1750 1755
Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile
1760 1765 1770
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile
1775 1780 1785
Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
1790 1795 1800
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp
1805 1810 1815
Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
1820 1825 1830
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys
1835 1840 1845
Met Leu Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp
1850 1855 1860
Val Pro Asp Tyr Ala Tyr
1865
<210> 94
<211> 1873
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 94
Met Pro Ala Ala Lys Arg Val Lys Leu Asp Thr Asn Leu Ser Asp Ile
1 5 10 15
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
20 25 30
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
35 40 45
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
50 55 60
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
65 70 75 80
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly
85 90 95
Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys
100 105 110
Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
115 120 125
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu
130 135 140
Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu
145 150 155 160
Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
165 170 175
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly
180 185 190
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Lys Lys Thr Asn
195 200 205
Tyr Thr Ile Gly Leu Ala Ile Gly Thr Asp Ser Val Gly Trp Ala Val
210 215 220
Val Lys Asp Asp Leu Glu Leu Val Lys Lys Arg Met Lys Val Leu Gly
225 230 235 240
Asn Thr Glu Thr Asn Tyr Ile Lys Lys Asn Leu Trp Gly Ser Leu Leu
245 250 255
Phe Glu Ser Gly Gln Thr Ala Lys Asp Arg Arg Leu Lys Arg Val Ala
260 265 270
Arg Arg Arg Tyr Glu Arg Arg Arg Asn Arg Leu Thr Glu Leu Gln Lys
275 280 285
Ile Phe Ala Pro Ala Ile Asp Glu Val Asp Glu Asn Phe Phe Phe Arg
290 295 300
Leu Asn Glu Ser Phe Leu Val Pro Glu Asp Lys Ala Phe Ser Lys Asn
305 310 315 320
Pro Ile Phe Gly Thr Leu Gly Glu Asp Lys Thr Tyr Tyr Lys Thr Tyr
325 330 335
Pro Thr Ile Tyr His Leu Arg Gln His Leu Ala Asp Ser Glu Glu Lys
340 345 350
Ala Asp Val Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Tyr
355 360 365
Arg Gly His Phe Leu Ile Glu Gly Lys Leu Asp Thr Glu His Ile Ala
370 375 380
Ile Asn Glu Asn Leu Glu Gln Phe Phe Glu Ser Tyr Asn Ala Leu Phe
385 390 395 400
Ser Glu Glu Pro Ile Glu Leu Arg Lys Glu Glu Leu Ile Ala Ile Glu
405 410 415
Asn Ile Leu Arg Glu Lys Asn Ser Arg Thr Val Lys Glu Lys Arg Ile
420 425 430
Thr Ser Phe Leu Lys Asp Ile Gly Arg Ala Asn Lys Gln Ser Pro Met
435 440 445
Met Ala Phe Ile Thr Leu Ile Val Gly Lys Lys Ala Lys Phe Lys Ala
450 455 460
Ala Phe Asn Leu Glu Glu Glu Ile Ser Leu Asn Leu Thr Asp Asp Ser
465 470 475 480
Tyr Asp Glu Asn Leu Glu Ile Leu Leu Asn Thr Ile Gly Ser Asp Phe
485 490 495
Ala Asp Leu Phe Asp His Ala Gln Arg Val Tyr Asn Ala Val Glu Leu
500 505 510
Ala Gly Ile Leu Ser Gly Asp Val Lys Asn Thr His Ala Lys Leu Ser
515 520 525
Ala Gln Met Val Ala Met Tyr Glu Arg His Lys Glu Gln Leu Lys Glu
530 535 540
Tyr Lys Ser Phe Ile Lys Ala Asn Leu Pro Asp Gln Tyr Asp Met Thr
545 550 555 560
Phe Val Ala Pro Lys Asp Ala Gln Lys Lys Asp Leu Lys Gly Tyr Ala
565 570 575
Gly Tyr Ile Asp Gly Asn Met Ser Gln Asp Ser Phe Tyr Lys Phe Val
580 585 590
Lys Asp Gln Leu Lys Glu Val Pro Gly Ser Glu Lys Phe Leu Asp Ser
595 600 605
Ile Glu Lys Glu Asp Phe Leu Arg Lys Gln Arg Ser Phe Tyr Asn Gly
610 615 620
Val Ile Pro Asn Gln Val His Leu Ala Glu Met Glu Ala Ile Leu Asp
625 630 635 640
Arg Gln Glu Asn Tyr Tyr Pro Trp Leu Lys Glu Asn Arg Glu Lys Ile
645 650 655
Ile Ser Leu Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala
660 665 670
Asp Gly Gln Ser Glu Phe Ala Trp Leu Glu Arg Lys Ser Asp Glu Lys
675 680 685
Ile Lys Pro Trp Asn Phe Ser Asp Val Val Asp Leu Asp Arg Ser Ala
690 695 700
Glu Lys Phe Ile Glu Gln Leu Ile Gly Arg Asp Thr Tyr Leu Pro Asp
705 710 715 720
Glu Tyr Val Leu Pro Lys Lys Ser Leu Ile Tyr Gln Lys Tyr Met Val
725 730 735
Phe Asn Glu Leu Thr Lys Ile Ala Tyr Leu Asp Glu Arg Gln Lys Arg
740 745 750
Met Asn Leu Ser Ser Val Glu Lys Lys Glu Ile Phe Glu Thr Leu Phe
755 760 765
Lys Lys Arg Ser Lys Val Thr Glu Lys Gln Leu Val Lys Phe Phe Glu
770 775 780
Asn Tyr Leu Gln Ile Asp Asn Pro Thr Ile Phe Gly Ile Glu Asp Ala
785 790 795 800
Phe Asn Ala Asp Tyr Ser Thr Tyr Val Glu Leu Ala Lys Val Pro Gly
805 810 815
Met Lys Ser Met Met Asp Asp Pro Asp Asn Glu Asp Leu Met Glu Glu
820 825 830
Ile Val Lys Ile Leu Thr Val Phe Glu Asp Arg Lys Met Arg Arg Lys
835 840 845
Gln Leu Glu Lys Tyr Lys Glu Arg Leu Ser Pro Glu Gln Ile Lys Glu
850 855 860
Leu Ala Lys Lys His Tyr Thr Gly Trp Gly Arg Leu Ser Lys Lys Leu
865 870 875 880
Leu Val Gly Ile Arg Asp Lys Glu Thr Gln Lys Thr Ile Leu Asp Tyr
885 890 895
Leu Val Glu Asp Asp Asn His Ser Gly Gly Arg Gln His Leu Asn Arg
900 905 910
Asn Leu Met Gln Leu Ile Asn Asp Asp Arg Leu Ser Phe Lys Lys Thr
915 920 925
Ile Ala Glu Leu Gln Met Ile Asp Pro Ser Ala Asp Leu Tyr Ala Gln
930 935 940
Val Gln Glu Ile Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Leu
945 950 955 960
Gly Leu Lys Ile Val Asp Glu Ile Ile Arg Val Met Gly Glu Lys Pro
965 970 975
Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Ala Arg
980 985 990
Gly Lys Ala Leu Ser Lys Arg Arg Glu Ala Lys Ile Lys Glu Gly Leu
995 1000 1005
Ala Ala Leu Gly Ser Ser Leu Leu Lys Glu Asn Leu Pro Gly Asn
1010 1015 1020
Ala Asp Leu Ser Gln Arg Lys Ile Tyr Leu Tyr Tyr Thr Gln Asn
1025 1030 1035
Gly Lys Asp Ile Tyr Leu Asp Glu Pro Leu Asp Phe Asp Arg Leu
1040 1045 1050
Ser Gln Tyr Asp Glu Asp His Ile Ile Pro Gln Ser Phe Thr Val
1055 1060 1065
Asp Asn Ser Leu Asp Asn Leu Val Leu Thr Asn Ser Ser Gln Asn
1070 1075 1080
Arg Gly Asn Lys Lys Asp Asp Val Pro Ser Leu Glu Val Val Asn
1085 1090 1095
Arg Gln Leu Ala Tyr Trp Arg Ser Leu Lys Asp Ala Gly Leu Met
1100 1105 1110
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Met Arg Gly Gly
1115 1120 1125
Leu Thr Asp Lys Asp Arg Glu Arg Phe Ile Gln Arg Gln Leu Val
1130 1135 1140
Glu Thr Arg Gln Ile Thr Lys Asn Val Ala Lys Leu Leu Asp Met
1145 1150 1155
Arg Leu Asn Asp Lys Lys Asp Glu Ala Gly Asn Lys Ile Arg Glu
1160 1165 1170
Thr Asn Ile Val Leu Leu Lys Ser Ala Met Ala Ser Glu Phe Arg
1175 1180 1185
Lys Met Phe Arg Leu Tyr Lys Val Arg Glu Leu Asn Asp Tyr His
1190 1195 1200
His Ala His Asp Ala Tyr Leu Asn Ala Ala Ile Ala Ile Asn Leu
1205 1210 1215
Leu Ala Leu Tyr Pro Tyr Met Ala Asp Asp Phe Val Tyr Gly Glu
1220 1225 1230
Phe Arg Tyr Lys Lys Lys Pro Gln Ala Glu Lys Ala Thr Tyr Glu
1235 1240 1245
Lys Leu Arg Gln Trp Asn Leu Ile Lys Arg Phe Gly Glu Lys Gln
1250 1255 1260
Leu Phe Thr Pro Asp His Glu Asp Cys Trp Asn Lys Glu Arg Asp
1265 1270 1275
Ile Lys Thr Ile Lys Lys Val Met Gly Tyr Arg Gln Val Asn Val
1280 1285 1290
Val Lys Lys Ala Glu Glu Arg Thr Gly Met Leu Phe Lys Glu Thr
1295 1300 1305
Ile Asn Gly Lys Thr Asn Lys Gly Ser Arg Ile Pro Ile Lys Lys
1310 1315 1320
Asp Leu Asp Pro Ser Lys Tyr Gly Gly Tyr Ile Glu Glu Lys Met
1325 1330 1335
Ala Tyr Tyr Ala Val Ile Ser Tyr Glu Asp Lys Lys Lys Lys Pro
1340 1345 1350
Gly Lys Thr Ile Val Gly Ile Ser Ile Met Asp Lys Lys Glu Phe
1355 1360 1365
Glu Tyr Asp Ser Ile Ser Tyr Leu Gly Lys Leu Gly Phe Ser Asn
1370 1375 1380
Pro Val Val Gln Ile Ile Leu Lys Asn Tyr Ser Leu Ile Ala Tyr
1385 1390 1395
Pro Asp Gly Arg Arg Arg Tyr Ile Thr Gly Ala Thr Lys Thr Thr
1400 1405 1410
Lys Gly Lys Val Glu Leu Gln Lys Ala Asn Gln Ile Ala Met Glu
1415 1420 1425
Gln Asp Leu Val Asn Phe Ile Tyr His Leu Lys Asn Tyr Asp Glu
1430 1435 1440
Ile Ser His Pro Glu Ser Tyr Ala Phe Val Gln Ser His Thr Asp
1445 1450 1455
Tyr Phe Asp Arg Leu Phe Asp Ser Ile Glu His Tyr Thr Arg Arg
1460 1465 1470
Phe Leu Asp Ala Glu Thr Asn Ile Asn Arg Leu Arg Arg Ile Tyr
1475 1480 1485
Glu Glu Glu Lys Lys Lys Asp Pro Val Asp Ile Glu Ala Leu Val
1490 1495 1500
Ala Ser Phe Ile Glu Leu Leu Lys Leu Thr Ser Ala Gly Ala Pro
1505 1510 1515
Ala Asp Phe Ile Phe Met Gly Glu Ala Ile Ser Arg Arg Arg Tyr
1520 1525 1530
Asn Ser Met Thr Gly Leu Phe Asp Gly Gln Val Ile Tyr Gln Ser
1535 1540 1545
Leu Thr Gly Leu Tyr Glu Thr Arg Met Arg Phe Glu Asp Lys Arg
1550 1555 1560
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1565 1570 1575
Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1580 1585 1590
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
1595 1600 1605
Gly Gly Ser Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr
1610 1615 1620
Leu Arg Arg Arg Ile Glu Ser Trp Glu Phe Asp Val Phe Tyr Asp
1625 1630 1635
Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys
1640 1645 1650
Trp Gly Met Ser Arg Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr
1655 1660 1665
Thr Asn His Val Glu Val Asn Phe Ile Lys Lys Phe Thr Ser Glu
1670 1675 1680
Arg Arg Phe His Ser Ser Ile Ser Cys Ser Ile Thr Trp Phe Leu
1685 1690 1695
Ser Trp Ser Pro Cys Trp Glu Cys Ser Gln Ala Ile Arg Glu Phe
1700 1705 1710
Leu Ser Gln His Pro Gly Val Thr Leu Val Ile Tyr Val Ala Arg
1715 1720 1725
Leu Phe Trp His Met Asp Gln Arg Asn Arg Gln Gly Leu Arg Asp
1730 1735 1740
Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met Arg Ala Ser Glu
1745 1750 1755
Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro Gly Asp
1760 1765 1770
Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met Leu Tyr
1775 1780 1785
Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys Leu
1790 1795 1800
Lys Ile Ser Arg Arg Trp Gln Asn His Leu Ala Phe Phe Arg Leu
1805 1810 1815
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu
1820 1825 1830
Leu Ala Thr Gly Leu Ile His Pro Ser Val Thr Trp Arg Tyr Pro
1835 1840 1845
Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr
1850 1855 1860
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1865 1870
<210> 95
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 95
gucuuggaug agugugaaaa cacucauagu caagaucaaa cgagugguuu uccacgaguu 60
auuacuuuug aggucuuaua uggcccauac auaaaaagga gucggaauuu ccggcuccuu 120
uucuu 125
<210> 96
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 96
guuuuagagc cauguagaaa uacauugcaa guuaaaauaa ggcuuugucc guaaucaacu 60
ugaaaaagug gcgcuguuuc ggcgcuuu 88
<210> 97
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 97
gaaacaatga taacaagacc 20
<210> 98
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 98
gtggcccctg tgcccagccc 20
<210> 99
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 99
gtcccaaata tgtagctgtt 20
<210> 100
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 100
gctcccatca catcaaccgg 20
<210> 101
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 101
gatgtcacct ccaatgacta 20
<210> 102
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 102
gttgaagatg aagcccagag 20
<210> 103
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 103
gccaacacca accagaactt 20
<210> 104
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 104
tgctgcacac agcaggcctt 20
<210> 105
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 105
gaacacaaag catagactgc 20
<210> 106
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 106
gaaacaatga taacaagacc 20
<210> 107
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 107
gtggcccctg tgcccagccc 20
<210> 108
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 108
gtcccaaata tgtagctgtt 20
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 109
agagggacac acagatctat 20
<210> 110
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 110
gctcccatca catcaaccgg 20
<210> 111
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 111
gatgtcacct ccaatgacta 20
<210> 112
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 112
gggcaaccac aaacccacga 20
<210> 113
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 113
gttgaagatg aagcccagag 20
<210> 114
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 114
gccaacacca accagaactt 20
<210> 115
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 115
tgctgcacac agcaggcctt 20
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 116
gtgccagaaa caggggtgac 20
<210> 117
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 117
cctgcctcag ctgctcactt 20
<210> 118
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 118
aaacggtccc cagagggttc 20
<210> 119
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 119
gccaccggtt gatgtgatgg 20
<210> 120
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 120
aagtggtccc aggcctcagc 20
<210> 121
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 121
agagaaaatg aaactttcaa 20
<210> 122
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 122
ccaaacccaa ctccatctac 20
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 123
ggtccttgaa ttgcagtatc 20
<210> 124
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 124
gcatagactg cggggcgggc 20
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 125
ggaaactgga acacaaagca 20
<210> 126
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 126
gacagcatgt ggtaattttc 20
<210> 127
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 127
gcccccggaa actctgtcca 20
<210> 128
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 128
tcgaccccca ccaaggttca 20
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 129
tgttaacagc tgacccaata 20
<210> 130
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 130
gttactcgcc tgtcaagtgg 20
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 131
gggctcccat cacatcaacc 20
<210> 132
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 132
gctttgggga ggcctggagt 20
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 133
tagctgccaa tgactatagc 20
<210> 134
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 134
ttaaaatagg atctacatca 20
<210> 135
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 135
gaatcctgcc atacactttg 20
<210> 136
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 136
ctgcggggcg ggccagcctg 20
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 137
acattgtcag agggacacac 20
<210> 138
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 138
agcaactcca gtcccaaata 20
<210> 139
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 139
gtggtggccg agcgccccct 20
<210> 140
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 140
cattcaccca gcttccctgt 20
<210> 141
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 141
gaacacaaag catagactgc 20
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 142
gaaacaatga taacaagacc 20
<210> 143
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 143
gtggcccctg tgcccagccc 20
<210> 144
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 144
gtcccaaata tgtagctgtt 20
<210> 145
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 145
agagggacac acagatctat 20
<210> 146
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 146
gctcccatca catcaaccgg 20
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 147
gatgtcacct ccaatgacta 20
<210> 148
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 148
gggcaaccac aaacccacga 20
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 149
gttgaagatg aagcccagag 20
<210> 150
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 150
gccaacacca accagaactt 20
<210> 151
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 151
tgctgcacac agcaggcctt 20
<210> 152
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 152
gtgccagaaa caggggtgac 20
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 153
tcacggagac tgaacactcc 20
<210> 154
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 154
gtaacagaca tggaccatca 20
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 155
gggagggagg ggcacagatg 20
<210> 156
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 156
tgtggttcca gaaccggagg 20
<210> 157
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 157
aatgagagaa aatgaaactt 20
<210> 158
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 158
ggccatcaag gatgcccacg 20
<210> 159
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 159
aaattgtcca gccccatctg 20
<210> 160
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 160
cctgtaaagg aaactggaac 20
<210> 161
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 161
tacatgaagc aactccagtc 20
<210> 162
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 162
aaactccccc cacccccttt 20
<210> 163
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 163
gagttgggtt tggtgctcaa 20
<210> 164
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 164
gcgggccagc ctgaatagct 20
<210> 165
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 165
gaaacaatga taacaagacc 20
<210> 166
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 166
gtggcccctg tgcccagccc 20
<210> 167
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 167
gtcccaaata tgtagctgtt 20
<210> 168
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 168
gctcccatca catcaaccgg 20
<210> 169
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 169
gatgtcacct ccaatgacta 20
<210> 170
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 170
gttgaagatg aagcccagag 20
<210> 171
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 171
gccaacacca accagaactt 20
<210> 172
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 172
tgctgcacac agcaggcctt 20
<210> 173
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 173
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 174
<211> 60
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 174
guuuuagagc ugugcuguuu aaacaacaca gcaaguuaaa auaaggcuuu guccguacuc 60
<210> 175
<211> 1377
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 175
Met Pro Lys Lys Lys Arg Lys Val Gly Met Gly Lys Pro Tyr Ser Ile
1 5 10 15
Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val Thr Asp
20 25 30
Asp Tyr Lys Val Pro Ala Lys Lys Met Lys Val Leu Gly Asn Thr Asp
35 40 45
Lys Gln Ser Ile Lys Lys Asn Leu Leu Gly Ala Leu Leu Phe Asp Ser
50 55 60
Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg
65 70 75 80
Tyr Thr Arg Arg Lys Asn Arg Leu Arg Tyr Leu Gln Glu Ile Phe Thr
85 90 95
Gly Glu Met Asn Lys Val Asp Glu Asn Phe Phe Gln Arg Leu Asp Asp
100 105 110
Ser Phe Leu Val Asp Glu Asp Lys Arg Gly Glu His His Pro Ile Phe
115 120 125
Gly Asn Ile Ala Ala Glu Val Lys Tyr His Asp Asp Phe Pro Thr Ile
130 135 140
Tyr His Leu Arg Arg His Leu Ala Asp Thr Ser Lys Lys Ala Asp Leu
145 150 155 160
Arg Leu Val Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His
165 170 175
Phe Leu Tyr Glu Gly Asp Leu Lys Ala Glu Asn Thr Asp Val Gln Ala
180 185 190
Leu Phe Lys Asp Phe Val Glu Glu Tyr Asp Lys Thr Ile Glu Glu Ser
195 200 205
His Leu Ser Glu Ile Thr Val Asp Ala Leu Ser Ile Leu Thr Glu Lys
210 215 220
Val Ser Lys Ser Ser Arg Leu Glu Asn Leu Ile Ala His Tyr Pro Thr
225 230 235 240
Glu Lys Lys Asn Thr Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Asp
245 250 255
Leu His Pro Asn Phe Lys Thr Asn Phe Gln Leu Ser Glu Asp Ala Lys
260 265 270
Leu Gln Phe Ser Lys Asp Thr Tyr Glu Glu Asp Leu Glu Gly Phe Leu
275 280 285
Gly Glu Val Gly Asp Glu Tyr Ala Asp Leu Phe Ala Ser Ala Lys Asn
290 295 300
Leu Tyr Asp Ala Ile Leu Leu Ser Gly Ile Leu Thr Val Asp Asp Asn
305 310 315 320
Ser Thr Lys Ala Pro Leu Ser Ala Ser Met Val Lys Arg Tyr Glu Glu
325 330 335
His Gln Lys Asp Leu Lys Lys Leu Lys Asp Phe Ile Lys Val Asn Ala
340 345 350
Pro Asp Gln Tyr Asn Ala Ile Phe Lys Asp Lys Asn Lys Lys Gly Tyr
355 360 365
Ala Ser Tyr Ile Glu Ser Gly Val Lys Gln Asp Glu Phe Tyr Lys Tyr
370 375 380
Leu Lys Gly Ile Leu Leu Lys Ile Asn Gly Ser Gly Asp Phe Leu Asp
385 390 395 400
Lys Ile Asp Arg Glu Asp Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn
405 410 415
Gly Ser Ile Pro His Gln Ile His Leu Gln Glu Met His Ala Ile Leu
420 425 430
Arg Arg Gln Gly Glu His Tyr Pro Phe Leu Lys Glu Asn Gln Asp Lys
435 440 445
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu
450 455 460
Ala Arg Lys Gly Ser Arg Phe Ala Trp Ala Glu Tyr Lys Ala Asp Glu
465 470 475 480
Lys Ile Thr Pro Trp Asn Phe Asp Asp Ile Leu Asp Lys Glu Lys Ser
485 490 495
Ala Glu Lys Phe Ile Thr Arg Met Thr Leu Asn Asp Leu Tyr Leu Pro
500 505 510
Glu Glu Lys Val Leu Pro Lys His Ser Pro Leu Tyr Glu Ala Phe Thr
515 520 525
Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Asn Glu Gln Gly Glu
530 535 540
Ala Lys Phe Phe Asp Thr Asn Met Lys Gln Glu Ile Phe Asp His Val
545 550 555 560
Phe Lys Glu Asn Arg Lys Val Thr Lys Asp Lys Leu Leu Asn Tyr Leu
565 570 575
Asn Lys Glu Phe Glu Glu Phe Arg Ile Val Asn Leu Thr Gly Leu Asp
580 585 590
Lys Glu Asn Lys Ala Phe Asn Ser Ser Leu Gly Thr Tyr His Asp Leu
595 600 605
Arg Lys Ile Leu Asp Lys Ser Phe Leu Asp Asp Lys Ala Asn Glu Lys
610 615 620
Thr Ile Glu Asp Ile Ile Gln Thr Leu Thr Leu Phe Glu Asp Arg Glu
625 630 635 640
Met Ile Arg Gln Arg Leu Gln Lys Tyr Ser Asp Ile Phe Thr Lys Ala
645 650 655
Gln Leu Lys Lys Leu Glu Arg Arg His Tyr Thr Gly Trp Gly Arg Leu
660 665 670
Ser Tyr Lys Leu Ile Asn Gly Ile Arg Asn Lys Glu Asn Lys Lys Thr
675 680 685
Ile Leu Asp Tyr Leu Ile Asp Asp Gly Tyr Ala Asn Arg Asn Phe Met
690 695 700
Gln Leu Ile Asn Asp Asp Ala Leu Ser Phe Lys Glu Glu Ile Ala Arg
705 710 715 720
Ala Gln Ile Ile Asp Asp Val Asp Asp Ile Ala Asn Val Val His Asp
725 730 735
Leu Pro Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Ser Val Lys
740 745 750
Ile Val Asp Glu Leu Val Lys Val Met Gly His Asn Pro Ala Asn Ile
755 760 765
Ile Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Asp Lys Gly Arg Arg
770 775 780
Asn Ser Gln Gln Arg Leu Lys Leu Leu Gln Asp Ser Leu Lys Asn Leu
785 790 795 800
Asp Asn Pro Val Asn Ile Lys Asn Val Glu Asn Gln Gln Leu Gln Asn
805 810 815
Asp Arg Leu Phe Leu Tyr Tyr Ile Gln Asn Gly Lys Asp Met Tyr Thr
820 825 830
Gly Glu Thr Leu Asp Ile Asn Asn Leu Ser Gln Tyr Asp Ile Asp His
835 840 845
Ile Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Leu Asp Asn Arg Val
850 855 860
Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asp Val Pro Ser
865 870 875 880
Ile Glu Val Val His Glu Met Lys Ser Phe Trp Ser Lys Leu Leu Ser
885 890 895
Val Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
900 905 910
Arg Gly Gly Leu Thr Glu Glu Asp Lys Ala Gly Phe Ile Lys Arg Gln
915 920 925
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
930 935 940
Glu Arg Phe Asn Thr Glu Phe Asp Gly Asn Lys Arg Arg Ile Arg Asn
945 950 955 960
Val Lys Ile Ile Thr Leu Lys Ser Asn Leu Val Ser Asn Phe Arg Lys
965 970 975
Glu Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Tyr His His Ala
980 985 990
His Asp Ala Tyr Leu Asn Ala Val Val Gly Asn Ala Leu Leu Leu Lys
995 1000 1005
Tyr Pro Gln Leu Glu Pro Glu Phe Val Tyr Gly Glu Tyr Pro Lys
1010 1015 1020
Tyr Asn Ser Tyr Arg Ser Arg Lys Ser Ala Thr Glu Lys Phe Leu
1025 1030 1035
Phe Tyr Ser Asn Ile Leu Arg Phe Phe Lys Lys Glu Asp Ile Gln
1040 1045 1050
Thr Asn Glu Asp Gly Glu Ile Ala Trp Asn Lys Glu Lys His Ile
1055 1060 1065
Lys Ile Leu Arg Lys Val Leu Ser Tyr Pro Gln Val Asn Ile Val
1070 1075 1080
Lys Lys Thr Glu Glu Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1085 1090 1095
Leu Pro Lys Gly Glu Ser Asp Lys Leu Ile Pro Arg Lys Thr Lys
1100 1105 1110
Asn Ser Tyr Trp Asp Pro Lys Lys Tyr Gly Gly Phe Met Gln Pro
1115 1120 1125
Val Val Ala Tyr Ser Ile Leu Val Phe Ala Asp Val Glu Lys Gly
1130 1135 1140
Lys Ser Lys Lys Leu Arg Lys Val Gln Asp Met Val Gly Ile Thr
1145 1150 1155
Ile Met Glu Lys Lys Arg Phe Glu Lys Asn Pro Val Asp Phe Leu
1160 1165 1170
Glu Gln Arg Gly Tyr Arg Asn Val Arg Leu Glu Lys Ile Ile Lys
1175 1180 1185
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Lys Arg Arg Arg
1190 1195 1200
Leu Leu Ala Ser Ala Lys Phe Leu Gln Lys Gly Asn Glu Leu Val
1205 1210 1215
Ile Pro Gln Arg Phe Thr Thr Leu Leu Tyr His Ser Tyr Arg Ile
1220 1225 1230
Glu Lys Asp Tyr Glu Pro Glu His Arg Glu Tyr Val Glu Lys His
1235 1240 1245
Lys Asp Glu Phe Lys Glu Leu Leu Glu Tyr Ile Ser Val Phe Ser
1250 1255 1260
Arg Lys Tyr Val Leu Ala Asp Asn Asn Leu Thr Lys Ile Glu Met
1265 1270 1275
Leu Phe Ser Lys Asn Lys Asp Ala Glu Val Ser Ser Leu Ala Lys
1280 1285 1290
Ser Phe Ile Ser Leu Leu Thr Phe Thr Ala Phe Gly Ala Pro Arg
1295 1300 1305
Ala Phe Asn Phe Phe Gly Glu Asn Ile Ala Arg Lys Glu Tyr Arg
1310 1315 1320
Ser Val Thr Glu Cys Leu Asn Ala Thr Leu Ile His Gln Ser Ile
1325 1330 1335
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Lys Leu Gly Glu
1340 1345 1350
Asp Gly Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu Phe
1355 1360 1365
Glu Ser Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 176
<211> 1377
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 176
Met Pro Lys Lys Lys Arg Lys Val Gly Met Gly Lys Pro Tyr Ser Ile
1 5 10 15
Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val Thr Asp
20 25 30
Asp Tyr Lys Val Pro Ala Lys Lys Met Lys Val Leu Gly Asn Thr Asp
35 40 45
Lys Gln Ser Ile Lys Lys Asn Leu Leu Gly Ala Leu Leu Phe Asp Ser
50 55 60
Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg
65 70 75 80
Tyr Thr Arg Arg Lys Asn Arg Leu Arg Tyr Leu Gln Glu Ile Phe Thr
85 90 95
Gly Glu Met Asn Lys Val Asp Glu Asn Phe Phe Gln Arg Leu Asp Asp
100 105 110
Ser Phe Leu Val Asp Glu Asp Lys Arg Gly Glu His His Pro Ile Phe
115 120 125
Gly Asn Ile Ala Ala Glu Val Lys Tyr His Asp Asp Phe Pro Thr Ile
130 135 140
Tyr His Leu Arg Arg His Leu Ala Asp Thr Ser Lys Lys Ala Asp Leu
145 150 155 160
Arg Leu Val Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His
165 170 175
Phe Leu Tyr Glu Gly Asp Leu Lys Ala Glu Asn Thr Asp Val Gln Ala
180 185 190
Leu Phe Lys Asp Phe Val Glu Glu Tyr Asp Lys Thr Ile Glu Glu Ser
195 200 205
His Leu Ser Glu Ile Thr Val Asp Ala Leu Ser Ile Leu Thr Glu Lys
210 215 220
Val Ser Lys Ser Ser Arg Leu Glu Asn Leu Ile Ala His Tyr Pro Thr
225 230 235 240
Glu Lys Lys Asn Thr Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Asp
245 250 255
Leu His Pro Asn Phe Lys Thr Asn Phe Gln Leu Ser Glu Asp Ala Lys
260 265 270
Leu Gln Phe Ser Lys Asp Thr Tyr Glu Glu Asp Leu Glu Gly Phe Leu
275 280 285
Gly Glu Val Gly Asp Glu Tyr Ala Asp Leu Phe Ala Ser Ala Lys Asn
290 295 300
Leu Tyr Asp Ala Ile Leu Leu Ser Gly Ile Leu Thr Val Asp Asp Asn
305 310 315 320
Ser Thr Lys Ala Pro Leu Ser Ala Ser Met Val Lys Arg Tyr Glu Glu
325 330 335
His Gln Lys Asp Leu Lys Lys Leu Lys Asp Phe Ile Lys Val Asn Ala
340 345 350
Pro Asp Gln Tyr Asn Ala Ile Phe Lys Asp Lys Asn Lys Lys Gly Tyr
355 360 365
Ala Ser Tyr Ile Glu Ser Gly Val Lys Gln Asp Glu Phe Tyr Lys Tyr
370 375 380
Leu Lys Gly Ile Leu Leu Lys Ile Asn Gly Ser Gly Asp Phe Leu Asp
385 390 395 400
Lys Ile Asp Arg Glu Asp Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn
405 410 415
Gly Ile Ile Pro His Gln Ile His Leu Gln Glu Met His Ala Ile Leu
420 425 430
Arg Arg Gln Gly Glu His Tyr Pro Phe Leu Lys Glu Asn Gln Asp Lys
435 440 445
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu
450 455 460
Ala Arg Lys Gly Ser Arg Phe Ala Trp Ala Glu Tyr Lys Ala Asp Glu
465 470 475 480
Lys Ile Thr Pro Trp Asn Phe Asp Asp Ile Leu Asp Lys Glu Lys Ser
485 490 495
Ala Glu Lys Phe Ile Thr Arg Met Thr Leu Asn Asp Leu Tyr Leu Pro
500 505 510
Glu Glu Lys Val Leu Pro Lys His Ser Pro Leu Tyr Glu Ala Phe Thr
515 520 525
Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Asn Glu Gln Gly Glu
530 535 540
Ala Lys Phe Phe Asp Thr Asn Met Lys Gln Glu Ile Phe Asp His Val
545 550 555 560
Phe Lys Glu Asn Arg Lys Val Thr Lys Asp Lys Leu Leu Asn Tyr Leu
565 570 575
Asn Lys Glu Phe Glu Glu Phe Arg Ile Val Asn Leu Thr Gly Leu Asp
580 585 590
Lys Glu Asn Lys Ala Phe Asn Ser Ser Leu Gly Thr Tyr His Asp Leu
595 600 605
Arg Lys Ile Leu Asp Lys Ser Phe Leu Asp Asp Lys Ala Asn Glu Lys
610 615 620
Thr Ile Glu Asp Ile Ile Gln Thr Leu Thr Leu Phe Glu Asp Arg Glu
625 630 635 640
Met Ile Arg Gln Arg Leu Gln Lys Tyr Ser Asp Ile Phe Thr Lys Ala
645 650 655
Gln Leu Lys Lys Leu Glu Arg Leu His Tyr Thr Gly Trp Gly Arg Leu
660 665 670
Ser Tyr Lys Leu Ile Asn Gly Ile Arg Asn Lys Glu Asn Lys Lys Thr
675 680 685
Ile Leu Asp Tyr Leu Ile Asp Asp Gly Tyr Ala Asn Arg Asn Phe Met
690 695 700
Gln Leu Ile Asn Asp Asp Ala Leu Ser Phe Lys Glu Glu Ile Ala Arg
705 710 715 720
Ala Gln Ile Ile Asp Asp Val Asp Asp Ile Ala Asn Val Val His Asp
725 730 735
Leu Pro Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Ser Val Lys
740 745 750
Ile Val Asp Glu Leu Val Lys Val Met Gly His Asn Pro Ala Asn Ile
755 760 765
Ile Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Asp Lys Gly Arg Arg
770 775 780
Asn Ser Gln Gln Arg Leu Lys Leu Leu Gln Asp Ser Leu Lys Asn Leu
785 790 795 800
Asp Asn Pro Val Asn Ile Lys Asn Val Glu Asn Gln Gln Leu Gln Asn
805 810 815
Asp Arg Leu Phe Leu Tyr Tyr Ile Gln Asn Gly Lys Asp Met Tyr Thr
820 825 830
Gly Glu Thr Leu Asp Ile Asn Asn Leu Ser Gln Tyr Asp Ile Asp His
835 840 845
Ile Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Leu Asp Asn Arg Val
850 855 860
Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asp Val Pro Ser
865 870 875 880
Ile Glu Val Val His Glu Met Lys Ser Phe Trp Ser Lys Leu Leu Ser
885 890 895
Val Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
900 905 910
Arg Gly Gly Leu Thr Glu Glu Asp Lys Ala Gly Phe Ile Lys Arg Gln
915 920 925
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
930 935 940
Glu Arg Phe Asn Thr Glu Phe Asp Gly Asn Lys Arg Arg Ile Arg Asn
945 950 955 960
Val Lys Ile Ile Thr Leu Lys Ser Asn Leu Val Ser Asn Phe Arg Lys
965 970 975
Glu Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Tyr His His Ala
980 985 990
His Asp Ala Tyr Leu Asn Ala Val Val Gly Asn Ala Leu Leu Leu Lys
995 1000 1005
Tyr Pro Gln Leu Glu Pro Glu Phe Val Tyr Gly Glu Tyr Pro Lys
1010 1015 1020
Tyr Asn Ser Tyr Arg Ser Arg Lys Ser Ala Thr Glu Lys Phe Leu
1025 1030 1035
Phe Tyr Ser Asn Ile Leu Arg Phe Phe Lys Lys Glu Asp Ile Gln
1040 1045 1050
Thr Asn Glu Asp Gly Glu Ile Ala Trp Asn Lys Glu Lys His Ile
1055 1060 1065
Lys Ile Leu Arg Lys Val Leu Ser Tyr Pro Gln Val Asn Ile Val
1070 1075 1080
Lys Lys Thr Glu Glu Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1085 1090 1095
Leu Pro Lys Gly Glu Ser Asp Lys Leu Ile Pro Arg Lys Thr Lys
1100 1105 1110
Asn Ser Tyr Trp Asp Pro Lys Lys Tyr Gly Gly Phe Met Gln Pro
1115 1120 1125
Val Val Ala Tyr Ser Ile Leu Val Phe Ala Asp Val Glu Lys Gly
1130 1135 1140
Lys Ser Lys Lys Leu Arg Lys Val Gln Asp Met Val Gly Ile Thr
1145 1150 1155
Ile Met Glu Lys Lys Arg Phe Glu Lys Asn Pro Val Asp Phe Leu
1160 1165 1170
Glu Gln Arg Gly Tyr Arg Asn Val Arg Leu Glu Lys Ile Ile Lys
1175 1180 1185
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Lys Arg Arg Arg
1190 1195 1200
Leu Leu Ala Ser Ala Lys Phe Leu Gln Lys Gly Asn Glu Leu Val
1205 1210 1215
Ile Pro Gln Arg Phe Thr Thr Leu Leu Tyr His Ser Tyr Arg Ile
1220 1225 1230
Glu Lys Asp Tyr Glu Pro Glu His Arg Glu Tyr Val Glu Lys His
1235 1240 1245
Lys Asp Glu Phe Lys Glu Leu Leu Glu Tyr Ile Ser Val Phe Ser
1250 1255 1260
Arg Lys Tyr Val Leu Ala Asp Asn Asn Leu Thr Lys Ile Glu Met
1265 1270 1275
Leu Phe Ser Lys Asn Lys Asp Ala Glu Val Ser Ser Leu Ala Lys
1280 1285 1290
Ser Phe Ile Ser Leu Leu Thr Phe Thr Ala Phe Gly Ala Pro Arg
1295 1300 1305
Ala Phe Asn Phe Phe Gly Glu Asn Ile Ala Arg Lys Glu Tyr Arg
1310 1315 1320
Ser Val Thr Glu Cys Leu Asn Ala Thr Leu Ile His Gln Ser Ile
1325 1330 1335
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Lys Leu Gly Glu
1340 1345 1350
Asp Gly Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu Phe
1355 1360 1365
Glu Ser Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 177
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 177
atcgacaaga aagggactga 20
<210> 178
<211> 1566
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 178
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Gly Lys Pro Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val Thr Asp Asp Tyr Lys
210 215 220
Val Pro Ala Lys Lys Met Lys Val Leu Gly Asn Thr Asp Lys Gln Ser
225 230 235 240
Ile Lys Lys Asn Leu Leu Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Leu Arg Tyr Leu Gln Glu Ile Phe Thr Gly Glu Met
275 280 285
Asn Lys Val Asp Glu Asn Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu
290 295 300
Val Asp Glu Asp Lys Arg Gly Glu His His Pro Ile Phe Gly Asn Ile
305 310 315 320
Ala Ala Glu Val Lys Tyr His Asp Asp Phe Pro Thr Ile Tyr His Leu
325 330 335
Arg Arg His Leu Ala Asp Thr Ser Lys Lys Ala Asp Leu Arg Leu Val
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Tyr
355 360 365
Glu Gly Asp Leu Lys Ala Glu Asn Thr Asp Val Gln Ala Leu Phe Lys
370 375 380
Asp Phe Val Glu Glu Tyr Asp Lys Thr Ile Glu Glu Ser His Leu Ser
385 390 395 400
Glu Ile Thr Val Asp Ala Leu Ser Ile Leu Thr Glu Lys Val Ser Lys
405 410 415
Ser Ser Arg Leu Glu Asn Leu Ile Ala His Tyr Pro Thr Glu Lys Lys
420 425 430
Asn Thr Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Asp Leu His Pro
435 440 445
Asn Phe Lys Thr Asn Phe Gln Leu Ser Glu Asp Ala Lys Leu Gln Phe
450 455 460
Ser Lys Asp Thr Tyr Glu Glu Asp Leu Glu Gly Phe Leu Gly Glu Val
465 470 475 480
Gly Asp Glu Tyr Ala Asp Leu Phe Ala Ser Ala Lys Asn Leu Tyr Asp
485 490 495
Ala Ile Leu Leu Ser Gly Ile Leu Thr Val Asp Asp Asn Ser Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Val Lys Arg Tyr Glu Glu His Gln Lys
515 520 525
Asp Leu Lys Lys Leu Lys Asp Phe Ile Lys Val Asn Ala Pro Asp Gln
530 535 540
Tyr Asn Ala Ile Phe Lys Asp Lys Asn Lys Lys Gly Tyr Ala Ser Tyr
545 550 555 560
Ile Glu Ser Gly Val Lys Gln Asp Glu Phe Tyr Lys Tyr Leu Lys Gly
565 570 575
Ile Leu Leu Lys Ile Asn Gly Ser Gly Asp Phe Leu Asp Lys Ile Asp
580 585 590
Arg Glu Asp Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gln Glu Met His Ala Ile Leu Arg Arg Gln
610 615 620
Gly Glu His Tyr Pro Phe Leu Lys Glu Asn Gln Asp Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Lys
645 650 655
Gly Ser Arg Phe Ala Trp Ala Glu Tyr Lys Ala Asp Glu Lys Ile Thr
660 665 670
Pro Trp Asn Phe Asp Asp Ile Leu Asp Lys Glu Lys Ser Ala Glu Lys
675 680 685
Phe Ile Thr Arg Met Thr Leu Asn Asp Leu Tyr Leu Pro Glu Glu Lys
690 695 700
Val Leu Pro Lys His Ser Pro Leu Tyr Glu Ala Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Asn Glu Gln Gly Glu Ala Lys Phe
725 730 735
Phe Asp Thr Asn Met Lys Gln Glu Ile Phe Asp His Val Phe Lys Glu
740 745 750
Asn Arg Lys Val Thr Lys Asp Lys Leu Leu Asn Tyr Leu Asn Lys Glu
755 760 765
Phe Glu Glu Phe Arg Ile Val Asn Leu Thr Gly Leu Asp Lys Glu Asn
770 775 780
Lys Ala Phe Asn Ser Ser Leu Gly Thr Tyr His Asp Leu Arg Lys Ile
785 790 795 800
Leu Asp Lys Ser Phe Leu Asp Asp Lys Ala Asn Glu Lys Thr Ile Glu
805 810 815
Asp Ile Ile Gln Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Arg
820 825 830
Gln Arg Leu Gln Lys Tyr Ser Asp Ile Phe Thr Lys Ala Gln Leu Lys
835 840 845
Lys Leu Glu Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Tyr Lys
850 855 860
Leu Ile Asn Gly Ile Arg Asn Lys Glu Asn Lys Lys Thr Ile Leu Asp
865 870 875 880
Tyr Leu Ile Asp Asp Gly Tyr Ala Asn Arg Asn Phe Met Gln Leu Ile
885 890 895
Asn Asp Asp Ala Leu Ser Phe Lys Glu Glu Ile Ala Arg Ala Gln Ile
900 905 910
Ile Asp Asp Val Asp Asp Ile Ala Asn Val Val His Asp Leu Pro Gly
915 920 925
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Ser Val Lys Ile Val Asp
930 935 940
Glu Leu Val Lys Val Met Gly His Asn Pro Ala Asn Ile Ile Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Asp Lys Gly Arg Arg Asn Ser Gln
965 970 975
Gln Arg Leu Lys Leu Leu Gln Asp Ser Leu Lys Asn Leu Asp Asn Pro
980 985 990
Val Asn Ile Lys Asn Val Glu Asn Gln Gln Leu Gln Asn Asp Arg Leu
995 1000 1005
Phe Leu Tyr Tyr Ile Gln Asn Gly Lys Asp Met Tyr Thr Gly Glu
1010 1015 1020
Thr Leu Asp Ile Asn Asn Leu Ser Gln Tyr Asp Ile Asp His Ile
1025 1030 1035
Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Leu Asp Asn Arg Val
1040 1045 1050
Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asp Val Pro
1055 1060 1065
Ser Ile Glu Val Val His Glu Met Lys Ser Phe Trp Ser Lys Leu
1070 1075 1080
Leu Ser Val Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr
1085 1090 1095
Lys Ala Glu Arg Gly Gly Leu Thr Glu Glu Asp Lys Ala Gly Phe
1100 1105 1110
Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
1115 1120 1125
Ala Gln Ile Leu Asp Glu Arg Phe Asn Thr Glu Phe Asp Gly Asn
1130 1135 1140
Lys Arg Arg Ile Arg Asn Val Lys Ile Ile Thr Leu Lys Ser Asn
1145 1150 1155
Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg
1160 1165 1170
Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
1175 1180 1185
Val Val Gly Asn Ala Leu Leu Leu Lys Tyr Pro Gln Leu Glu Pro
1190 1195 1200
Glu Phe Val Tyr Gly Glu Tyr Pro Lys Tyr Asn Ser Tyr Arg Ser
1205 1210 1215
Arg Lys Ser Ala Thr Glu Lys Phe Leu Phe Tyr Ser Asn Ile Leu
1220 1225 1230
Arg Phe Phe Lys Lys Glu Asp Ile Gln Thr Asn Glu Asp Gly Glu
1235 1240 1245
Ile Ala Trp Asn Lys Glu Lys His Ile Lys Ile Leu Arg Lys Val
1250 1255 1260
Leu Ser Tyr Pro Gln Val Asn Ile Val Lys Lys Thr Glu Glu Gln
1265 1270 1275
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Glu Ser
1280 1285 1290
Asp Lys Leu Ile Pro Arg Lys Thr Lys Asn Ser Tyr Trp Asp Pro
1295 1300 1305
Lys Lys Tyr Gly Gly Phe Met Gln Pro Val Val Ala Tyr Ser Ile
1310 1315 1320
Leu Val Phe Ala Asp Val Glu Lys Gly Lys Ser Lys Lys Leu Arg
1325 1330 1335
Lys Val Gln Asp Met Val Gly Ile Thr Ile Met Glu Lys Lys Arg
1340 1345 1350
Phe Glu Lys Asn Pro Val Asp Phe Leu Glu Gln Arg Gly Tyr Arg
1355 1360 1365
Asn Val Arg Leu Glu Lys Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1370 1375 1380
Phe Glu Leu Glu Asn Lys Arg Arg Arg Leu Leu Ala Ser Ala Lys
1385 1390 1395
Phe Leu Gln Lys Gly Asn Glu Leu Val Ile Pro Gln Arg Phe Thr
1400 1405 1410
Thr Leu Leu Tyr His Ser Tyr Arg Ile Glu Lys Asp Tyr Glu Pro
1415 1420 1425
Glu His Arg Glu Tyr Val Glu Lys His Lys Asp Glu Phe Lys Glu
1430 1435 1440
Leu Leu Glu Tyr Ile Ser Val Phe Ser Arg Lys Tyr Val Leu Ala
1445 1450 1455
Asp Asn Asn Leu Thr Lys Ile Glu Met Leu Phe Ser Lys Asn Lys
1460 1465 1470
Asp Ala Glu Val Ser Ser Leu Ala Lys Ser Phe Ile Ser Leu Leu
1475 1480 1485
Thr Phe Thr Ala Phe Gly Ala Pro Arg Ala Phe Asn Phe Phe Gly
1490 1495 1500
Glu Asn Ile Ala Arg Lys Glu Tyr Arg Ser Val Thr Glu Cys Leu
1505 1510 1515
Asn Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1520 1525 1530
Arg Ile Asp Leu Ser Lys Leu Gly Glu Asp Gly Glu Gly Ala Asp
1535 1540 1545
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1550 1555 1560
Arg Lys Val
1565
<210> 179
<211> 1566
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 179
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Gly Lys Pro Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val Thr Asp Asp Tyr Lys
210 215 220
Val Pro Ala Lys Lys Met Lys Val Leu Gly Asn Thr Asp Lys Gln Ser
225 230 235 240
Ile Lys Lys Asn Leu Leu Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Leu Arg Tyr Leu Gln Glu Ile Phe Thr Gly Glu Met
275 280 285
Asn Lys Val Asp Glu Asn Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu
290 295 300
Val Asp Glu Asp Lys Arg Gly Glu His His Pro Ile Phe Gly Asn Ile
305 310 315 320
Ala Ala Glu Val Lys Tyr His Asp Asp Phe Pro Thr Ile Tyr His Leu
325 330 335
Arg Arg His Leu Ala Asp Thr Ser Lys Lys Ala Asp Leu Arg Leu Val
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Tyr
355 360 365
Glu Gly Asp Leu Lys Ala Glu Asn Thr Asp Val Gln Ala Leu Phe Lys
370 375 380
Asp Phe Val Glu Glu Tyr Asp Lys Thr Ile Glu Glu Ser His Leu Ser
385 390 395 400
Glu Ile Thr Val Asp Ala Leu Ser Ile Leu Thr Glu Lys Val Ser Lys
405 410 415
Ser Ser Arg Leu Glu Asn Leu Ile Ala His Tyr Pro Thr Glu Lys Lys
420 425 430
Asn Thr Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Asp Leu His Pro
435 440 445
Asn Phe Lys Thr Asn Phe Gln Leu Ser Glu Asp Ala Lys Leu Gln Phe
450 455 460
Ser Lys Asp Thr Tyr Glu Glu Asp Leu Glu Gly Phe Leu Gly Glu Val
465 470 475 480
Gly Asp Glu Tyr Ala Asp Leu Phe Ala Ser Ala Lys Asn Leu Tyr Asp
485 490 495
Ala Ile Leu Leu Ser Gly Ile Leu Thr Val Asp Asp Asn Ser Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Val Lys Arg Tyr Glu Glu His Gln Lys
515 520 525
Asp Leu Lys Lys Leu Lys Asp Phe Ile Lys Val Asn Ala Pro Asp Gln
530 535 540
Tyr Asn Ala Ile Phe Lys Asp Lys Asn Lys Lys Gly Tyr Ala Ser Tyr
545 550 555 560
Ile Glu Ser Gly Val Lys Gln Asp Glu Phe Tyr Lys Tyr Leu Lys Gly
565 570 575
Ile Leu Leu Lys Ile Asn Gly Ser Gly Asp Phe Leu Asp Lys Ile Asp
580 585 590
Arg Glu Asp Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ile Ile
595 600 605
Pro His Gln Ile His Leu Gln Glu Met His Ala Ile Leu Arg Arg Gln
610 615 620
Gly Glu His Tyr Pro Phe Leu Lys Glu Asn Gln Asp Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Lys
645 650 655
Gly Ser Arg Phe Ala Trp Ala Glu Tyr Lys Ala Asp Glu Lys Ile Thr
660 665 670
Pro Trp Asn Phe Asp Asp Ile Leu Asp Lys Glu Lys Ser Ala Glu Lys
675 680 685
Phe Ile Thr Arg Met Thr Leu Asn Asp Leu Tyr Leu Pro Glu Glu Lys
690 695 700
Val Leu Pro Lys His Ser Pro Leu Tyr Glu Ala Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Asn Glu Gln Gly Glu Ala Lys Phe
725 730 735
Phe Asp Thr Asn Met Lys Gln Glu Ile Phe Asp His Val Phe Lys Glu
740 745 750
Asn Arg Lys Val Thr Lys Asp Lys Leu Leu Asn Tyr Leu Asn Lys Glu
755 760 765
Phe Glu Glu Phe Arg Ile Val Asn Leu Thr Gly Leu Asp Lys Glu Asn
770 775 780
Lys Ala Phe Asn Ser Ser Leu Gly Thr Tyr His Asp Leu Arg Lys Ile
785 790 795 800
Leu Asp Lys Ser Phe Leu Asp Asp Lys Ala Asn Glu Lys Thr Ile Glu
805 810 815
Asp Ile Ile Gln Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Arg
820 825 830
Gln Arg Leu Gln Lys Tyr Ser Asp Ile Phe Thr Lys Ala Gln Leu Lys
835 840 845
Lys Leu Glu Arg Leu His Tyr Thr Gly Trp Gly Arg Leu Ser Tyr Lys
850 855 860
Leu Ile Asn Gly Ile Arg Asn Lys Glu Asn Lys Lys Thr Ile Leu Asp
865 870 875 880
Tyr Leu Ile Asp Asp Gly Tyr Ala Asn Arg Asn Phe Met Gln Leu Ile
885 890 895
Asn Asp Asp Ala Leu Ser Phe Lys Glu Glu Ile Ala Arg Ala Gln Ile
900 905 910
Ile Asp Asp Val Asp Asp Ile Ala Asn Val Val His Asp Leu Pro Gly
915 920 925
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Ser Val Lys Ile Val Asp
930 935 940
Glu Leu Val Lys Val Met Gly His Asn Pro Ala Asn Ile Ile Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Asp Lys Gly Arg Arg Asn Ser Gln
965 970 975
Gln Arg Leu Lys Leu Leu Gln Asp Ser Leu Lys Asn Leu Asp Asn Pro
980 985 990
Val Asn Ile Lys Asn Val Glu Asn Gln Gln Leu Gln Asn Asp Arg Leu
995 1000 1005
Phe Leu Tyr Tyr Ile Gln Asn Gly Lys Asp Met Tyr Thr Gly Glu
1010 1015 1020
Thr Leu Asp Ile Asn Asn Leu Ser Gln Tyr Asp Ile Asp His Ile
1025 1030 1035
Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Leu Asp Asn Arg Val
1040 1045 1050
Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asp Val Pro
1055 1060 1065
Ser Ile Glu Val Val His Glu Met Lys Ser Phe Trp Ser Lys Leu
1070 1075 1080
Leu Ser Val Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr
1085 1090 1095
Lys Ala Glu Arg Gly Gly Leu Thr Glu Glu Asp Lys Ala Gly Phe
1100 1105 1110
Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
1115 1120 1125
Ala Gln Ile Leu Asp Glu Arg Phe Asn Thr Glu Phe Asp Gly Asn
1130 1135 1140
Lys Arg Arg Ile Arg Asn Val Lys Ile Ile Thr Leu Lys Ser Asn
1145 1150 1155
Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg
1160 1165 1170
Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
1175 1180 1185
Val Val Gly Asn Ala Leu Leu Leu Lys Tyr Pro Gln Leu Glu Pro
1190 1195 1200
Glu Phe Val Tyr Gly Glu Tyr Pro Lys Tyr Asn Ser Tyr Arg Ser
1205 1210 1215
Arg Lys Ser Ala Thr Glu Lys Phe Leu Phe Tyr Ser Asn Ile Leu
1220 1225 1230
Arg Phe Phe Lys Lys Glu Asp Ile Gln Thr Asn Glu Asp Gly Glu
1235 1240 1245
Ile Ala Trp Asn Lys Glu Lys His Ile Lys Ile Leu Arg Lys Val
1250 1255 1260
Leu Ser Tyr Pro Gln Val Asn Ile Val Lys Lys Thr Glu Glu Gln
1265 1270 1275
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Glu Ser
1280 1285 1290
Asp Lys Leu Ile Pro Arg Lys Thr Lys Asn Ser Tyr Trp Asp Pro
1295 1300 1305
Lys Lys Tyr Gly Gly Phe Met Gln Pro Val Val Ala Tyr Ser Ile
1310 1315 1320
Leu Val Phe Ala Asp Val Glu Lys Gly Lys Ser Lys Lys Leu Arg
1325 1330 1335
Lys Val Gln Asp Met Val Gly Ile Thr Ile Met Glu Lys Lys Arg
1340 1345 1350
Phe Glu Lys Asn Pro Val Asp Phe Leu Glu Gln Arg Gly Tyr Arg
1355 1360 1365
Asn Val Arg Leu Glu Lys Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1370 1375 1380
Phe Glu Leu Glu Asn Lys Arg Arg Arg Leu Leu Ala Ser Ala Lys
1385 1390 1395
Phe Leu Gln Lys Gly Asn Glu Leu Val Ile Pro Gln Arg Phe Thr
1400 1405 1410
Thr Leu Leu Tyr His Ser Tyr Arg Ile Glu Lys Asp Tyr Glu Pro
1415 1420 1425
Glu His Arg Glu Tyr Val Glu Lys His Lys Asp Glu Phe Lys Glu
1430 1435 1440
Leu Leu Glu Tyr Ile Ser Val Phe Ser Arg Lys Tyr Val Leu Ala
1445 1450 1455
Asp Asn Asn Leu Thr Lys Ile Glu Met Leu Phe Ser Lys Asn Lys
1460 1465 1470
Asp Ala Glu Val Ser Ser Leu Ala Lys Ser Phe Ile Ser Leu Leu
1475 1480 1485
Thr Phe Thr Ala Phe Gly Ala Pro Arg Ala Phe Asn Phe Phe Gly
1490 1495 1500
Glu Asn Ile Ala Arg Lys Glu Tyr Arg Ser Val Thr Glu Cys Leu
1505 1510 1515
Asn Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1520 1525 1530
Arg Ile Asp Leu Ser Lys Leu Gly Glu Asp Gly Glu Gly Ala Asp
1535 1540 1545
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1550 1555 1560
Arg Lys Val
1565
<210> 180
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 180
guuuuagagc ugugcuguuu aaacaacaca gcaaguuaaa auaaggcuuu guccguacuc 60
aagcuugcaa aagcgugcac cgauucggug cuuuuuuu 98
<210> 181
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<400> 181
guuugagagu agugugaaaa cauuacgagu ucaaauacaa auuaauuuac aaugccuucg 60
ggcugcccga cguagggcac cuacucucaa uucuucggaa uugagtt 107
<210> 182
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 182
gucuuggaug agugugaaaa cacucauagu caagaucaaa cgagugguuu uccacgaguu 60
auuacuuuug aggucuuaua uggcccauac auaaaaagga gucggaauuu ccggcuccuu 120
uucuuuuu 128
Claims (86)
- 스트렙토코커스 콘스텔라투스(Streptococcus constellatus) Cas9, 샤르페아(Sharpea) Cas9, 베일로넬라 파르불라(Veillonella parvula) Cas9, 에자키엘라 페루엔시스(Ezakiella peruensis) Cas9, 락토바실러스 퍼멘텀 균주(Lactobacillus fermentum strain) AF15-40LB Cas9 또는 펩토니필러스 sp. 마르세유(Peptoniphilus sp. Marseille)-P3761 Cas9로부터 변형되는 조작된, 비천연 발생 Cas9 단백질.
- 제1항에 있어서, 상기 스트렙토코커스 콘스텔라투스 Cas9는
MGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGED (서열번호 1)와 적어도 80% 서열 동일성을 갖는, Cas9 단백질. - 제1항에 있어서, 상기 샤르페아 Cas9는
MAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKL (서열번호 4)와 적어도 80% 서열 동일성을 갖는, Cas9 단백질. - 제1항에 있어서, 상기 베일로넬라 파르불라 Cas9는 MSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIV (서열번호 8)와 적어도 80% 서열 동일성을 갖는, Cas9 단백질.
- 제1항에 있어서, 상기 에자키엘라 페루엔시스 Cas9는 MTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKL (서열번호 14)와 적어도 80% 서열 동일성을 갖는, Cas9 단백질.
- 제1항에 있어서, 상기 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9는
MKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNL (서열번호 84)와 적어도 80% 서열 동일성을 갖는, Cas9 단백질. - 제1항에 있어서, 상기 펩토니필러스 sp. 마르세유-P3761 Cas9는
MEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFED (서열번호 86)와 적어도 80% 서열 동일성을 갖는, Cas9 단백질. - 제2항 내지 제7항 중 어느 한 항에 있어서, 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열을 포함하는 Cas9 단백질.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는 Cas9 단백질.
- 제9항에 있어서, 상기 스트렙토코커스 콘스텔라투스 Cas9는
MPKKKRKVGGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 2)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질.
[청구항 10b]
제9항에 있어서, 상기 스트렙토코커스 콘스텔라투스 Cas9는
MPKKKRKVGMGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFMQPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKFLQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPRAFNFFGENIARKEYRSVTECLNATLIHQSITGLYETRIDLSKLGEDGEGADKRTADGSEFESPKKKRKV (서열번호 95)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질.
[청구항 10c]
제9항에 있어서, 상기 스트렙토코커스 콘스텔라투스 Cas9는
MPKKKRKVGMGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGIIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERLHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFMQPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKFLQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPRAFNFFGENIARKEYRSVTECLNATLIHQSITGLYETRIDLSKLGEDGEGADKRTADGSEFESPKKKRKV (서열번호 96)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질. - 제9항에 있어서, 상기 샤르페아 Cas9가
MPKKKRKVGAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 5)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질. - 제9항에 있어서, 상기 베일로넬라 파르불라 Cas9는
MPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 9)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas 단백질. - 제9항에 있어서, 상기 에자키엘라 페루엔시스 Cas9는
MPKKKRKVGTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 15) (D12A 돌연변이체는 굵은 글씨)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질. - 제9항에 있어서, 상기 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9는
MPKKKRKVGKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 85)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질. - 제9항에 있어서, 상기 펩토니필러스 sp. 마르세유-P3761 Cas9가
MPKKKRKVGEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 87)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질. - 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 Cas9 단백질의 아미노산 서열은 서열번호 1, 4, 8, 14, 84 또는 86에서 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 적어도 10개의 돌연변이를 포함하는, Cas9 단백질.
- 제16항에 있어서, 상기 돌연변이는 아미노산 치환인, Cas9 단백질.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 Cas9 단백질이 닉카제 활성을 갖는, Cas9 단백질.
[청구항 18b]
제18항에 있어서, 아미노산 위치에서의 닉카제 돌연변이가 야생형 SpCas9의 1개 이상의 아미노산 10, 12, 17, 762, 840, 854, 863, 982, 983, 984, 986, 987에 상응하는, Cas9 단백질. - 제16항에 있어서, 적어도 1개의 돌연변이가 불활성 Cas9(dCas9)를 초래하는, Cas9 단백질.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 Cas9 단백질은 PAM 상호작용, HNH 및/또는 RuvC 도메인에 적어도 1개의 아미노산 돌연변이를 포함하는, Cas9 단백질.
[청구항 20b]
제20항에 있어서, 아미노산 위치에서의 돌연변이는 SirCas9의 RuvC 도메인에서 아미노산 14에 상응하는, Cas9 단백질.
[청구항 20c]
제20항에 있어서, 아미노산 위치에서의 돌연변이는 EpeCas9의 RuvC 도메인에서 아미노산 12에 상응하는, Cas9 단백질.
[청구항 20d]
제20항에 있어서, 아미노산 위치에서의 돌연변이는 LfeCas9의 RuvC 도메인에서 아미노산 9에 상응하는, Cas9 단백질.
[청구항 20e]
제20항에 있어서, 아미노산 위치에서의 돌연변이는 PmaCas9의 RuvC 도메인에서 아미노산 12에 상응하는, Cas9 단백질.
[청구항 20f]
제20항에 있어서, 상기 Cas9 단백질은 초정밀 Cas9인, Cas9 단백질.
[청구항 20g]
제20항에 있어서, 상기 Cas9 단백질은 SpyCas9(서열번호 173)에 관하여 N692A, M694A, Q695A 및/또는 H698A에 상응하는 돌연변이를 포함하는, Cas9 단백질.
[청구항 20h]
제20항에 있어서, 상기 Cas9 단백질은 고충실 Cas9인, Cas9 단백질.
[청구항 20i]
제20항에 있어서, 상기 Cas9 단백질은 SpyCas9(서열번호 173)에 관하여 N467A, R661A, Q695A 및/또는 Q926A에 상응하는 돌연변이를 포함하는, Cas9 단백질.
[청구항 20j]
제20항에 있어서, 상기 Cas9 단백질은 SuperFi-Cas9인, Cas9 단백질.
[청구항 20k]
제20항에 있어서, SpyCas9에 상응하는 Y1016, R1019, Y1010, Y1013, K1031, Q1027 및/또는 VI018 잔기가 아스파르트산으로 돌연변이되는, Cas9 단백질. - 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 동일성을 갖는 Cas9 단백질을 포함하고, 상기 Cas9 단백질은 히스톤 데메틸라제, 전사 활성화인자 또는 데아미나제에 융합되는, 조작된 비천연 발생 Cas9 융합 단백질.
[청구항 21b]
제21항에 있어서, 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는 조작된 비천연 발생 Cas9 융합 단백질.
[청구항 21c]
제22항에 있어서, 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96과 적어도 80% 동일성을 갖는 조작된 비-천연 발생 Cas9 융합 단백질. - 제21항에 있어서, 상기 Cas9 단백질은 시토신 데아미나제 또는 아데노신 데아미나제에 융합되는, Cas9 단백질.
- 제22항에 있어서, 상기 Cas9 단백질은 아데노신 데아미나제에 융합되고
(a) MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 20);
(b) MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGAKNKDIRYSIGLAIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 6);
(c)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 10);
(d) MPKKKRKVSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 11);
(e)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 16);
(f) MPKKKRKVTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 17);
(g) MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 88);
(h) MPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 89); 또는
(i)
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFMQPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKFLQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPRAFNFFGENIARKEYRSVTECLNATLIHQSITGLYETRIDLSKLGEDGEGADKRTADGSEFESPKKKRKV (서열번호 98);
(j)
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGIIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERLHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFMQPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKFLQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPRAFNFFGENIARKEYRSVTECLNATLIHQSITGLYETRIDLSKLGEDGEGADKRTADGSEFESPKKKRKV (서열번호 99)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질. - 제22항에 있어서, 상기 Cas9 단백질은 시토신 데아미나제에 융합되고
(a) MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 21);
(b)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 12);
(c) MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 18);
(d) MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 90);
(e)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY (서열번호 93);
(f)
MPAAKRVKLDTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRYPYDVPDYAYPYDVPDYAYPYDVPDYA (서열번호 94)와 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질. - 제2항에 있어서, 상기 Cas9 단백질은 5'-NGG-3'을 포함하는 PAM 서열을 인식하는, Cas9 단백질.
- 제3항에 있어서, 상기 Cas9 단백질은 5'-NAGHC-3'을 포함하는 PAM 서열을 인식하고, H는 아데닌, 시토신 또는 티민인, Cas9 단백질.
- 제4항에 있어서, 상기 Cas9 단백질은 5'-NRHRRH-3'을 포함하는 PAM 서열을 인식하고, H는 아데닌, 시토신 또는 티민이고, R은 아데닌 또는 구아닌인, Cas9 단백질.
- 제5항 또는 제7항에 있어서, 상기 Cas9 단백질은 5'-NGG-3'을 포함하는 PAM 서열을 인식하는, Cas9 단백질.
- 제6항에 있어서, 상기 Cas9 단백질은 5'-NNAAA-3'을 포함하는 PAM 서열을 인식하는, Cas9 단백질.
[청구항 29b]
제10b항 또는 제10c항에 있어서, 상기 Cas9 단백질은 5'-NGG-3'을 포함하는 PAM 서열을 인식하는, Cas9 단백질. - 제1항 내지 제29항 중 어느 한 항의 Cas9 단백질을 암호화하는 핵산.
- 제30항에 있어서, 상기 핵산은 포유동물 세포에서 발현되도록 코돈-최적화되는, 핵산.
- 제31항에 있어서, 상기 핵산은 인간 세포에서 발현되도록 코돈-최적화되는, 핵산.
- 제29항의 Cas9 단백질을 포함하는 진핵 세포.
- 제33항에 있어서, 상기 세포는 인간 세포인, 진핵 세포.
- 진핵 세포에서 표적 핵산을 절단하는 방법으로,
상기 세포를 제1항 내지 제29항 중 어느 한 항의 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고,
상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열의 파손을 유발할 수 있는, 방법. - 진핵 세포에서 표적 핵산의 발현을 변경(altering)하는 방법으로,
상기 세포를 제1항 내지 제29항 중 어느 한 항의 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고,
상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열의 파손을 유발할 수 있는, 방법. - 진핵 세포에서 표적 핵산의 발현을 변경하는 방법으로,
상기 세포를 제1항 내지 제29항 중 어느 한 항의 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고,
상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는, 방법. - 진핵 세포에서 표적 핵산을 변형하는 방법으로,
상기 세포를 제1항 내지 제29항 중 어느 한 항의 Cas9, 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 것을 포함하고, 상기 RNA 가이드는 직접 반복 서열, 및 상기 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하고,
상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는, 방법. - 제37항 또는 제38항에 있어서, 상기 Cas9 단백질은 불활성 Cas9(dCas9)인, 방법.
- 제39항에 있어서, 상기 dCas9는 데아미나제에 융합되는, 방법.
- 제35항 내지 제40항 중 어느 한 항에 있어서, 상기 RNA 가이드는 crRNA 및 tracrRNA를 포함하는, 방법.
- 제35항 내지 제39항 중 어느 한 항에 있어서, 상기 RNA 가이드는 sgRNA를 포함하는, 방법.
- 제42항에 있어서, 스트렙토코커스 콘스텔라투스 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUCAAGCUUGCAAAAGCGUGCACCGAUUCGGUGCU-3' (서열번호 3)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
- 제42항에 있어서, 샤르페아 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3' (서열번호 7)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
- 제42항에 있어서, 베일로넬라 파르불라 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3' (서열번호 13)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
- 제42항에 있어서, 에자키엘라 페루엔시스 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3' (서열번호 19)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
- 제42항에 있어서, 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9와 함께 사용하기 위한 sgRNA는 5'-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3' (서열번호 95)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
- 제42항에 있어서, 펩토니필러스 sp. 마르세유-P3761 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3' (서열번호 96)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
- 제41항에 있어서, 상기 crRNA는 약 16 내지 26개의 뉴클레오티드 길이의 가이드 서열을 포함하는, 방법.
- 제49항에 있어서, 상기 crRNA는 18 내지 24개의 뉴클레오티드 길이의 가이드 서열을 포함하는, 방법.
- 제35항 또는 제36항에 있어서, 상기 표적 핵산의 파손은 단일 가닥 또는 이중 가닥의 파손인, 방법.
- 제51항에 있어서, 상기 표적 핵산의 파손은 단일 가닥의 파손인, 방법.
- 제34항 또는 제35항에 있어서, 상기 Cas9 단백질은 상기 표적 핵산 서열의 두 가닥 모두를 절단하는 뉴클레아제이거나, 상기 표적 핵산 서열의 한 가닥을 절단하는 닉카제인, 방법.
- 제34항 내지 제53항 중 어느 한 항에 있어서, 상기 표적 핵산은 5' 내지 프로토스페이서 인접 모티프(PAM) 서열인, 방법.
- 제34항 내지 제54항 중 어느 한 항에 있어서, 상기 Cas9가 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결되고, 상기 가이드 RNA가 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결되는, 방법.
- 제55항에 있어서, 상기 진핵 세포는 인간 세포인, 방법.
- 제55항에 있어서, 상기 프로모터 서열은 진핵 또는 바이러스의 프로모터인, 방법.
- 조작된 비천연 발생 CRISPR-Cas 시스템으로,
RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산으로, 상기 RNA 가이드는 직접 반복 서열, 및 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하는 것인, 상기 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산; 및
코돈-최적화된 CRISPR-연관(Cas) 단백질로, 서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 서열 동일성을 갖고, 상기 Cas 단백질은 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열에서 파손을 유발할 수 있는 것인, 코돈-최적화된 CRISPR-연관(Cas) 단백질
을 포함하는, 조작된 비천연 발생 CRISPR-Cas 시스템.
[청구항 58b]
제58항에 있어서, 상기 코돈-최적화된 CRISPR-연관(Cas) 단백질은 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는, 조작된 비천연 발생 CRISPR-Cas 시스템.
[청구항 58c]
제59항에 있어서, 상기 코돈-최적화된 CRISPR-연관(Cas) 단백질은 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96과 적어도 80% 서열 동일성을 갖고, 상기 Cas 단백질은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열의 파손을 유발할 수 있는, 조작된 비천연 발생 CRISPR-Cas 시스템. - 조작된 비천연 발생 CRISPR-Cas 시스템으로,
RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산으로, 상기 RNA 가이드는 직접 반복 서열, 및 표적 핵산에 혼성화할 수 있는 스페이서 서열을 포함하는 것인, 상기 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산; 및
서열번호 1, 4, 8, 14, 84 또는 86과 적어도 80% 서열 동일성을 갖는 코돈-최적화된 CRISPR-연관(Cas) 단백질을 포함하고,
상기 Cas 단백질은 데아미나제에 융합되고, Cas 단백질 융합은 상기 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는, 조작된 비천연 발생 CRISPR-Cas 시스템.
[청구항 59b]
제59항에 있어서, 상기 코돈-최적화된 CRISPR-연관(Cas) 단백질은 핵 위치 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함하는, 조작된 비천연 발생 CRISPR-Cas 시스템.
[청구항 59c]
제59b항에 있어서, 상기 코돈-최적화된 CRISPR-연관(Cas) 단백질은 서열번호 2, 5, 9, 15, 85, 87, 95 또는 96과 적어도 80% 서열 동일성을 갖고, 상기 Cas 단백질은 데아미나제에 융합되고, Cas 단백질 융합은 RNA 가이드에 결합할 수 있고, 상기 RNA 가이드에 상보적인 표적 핵산 서열을 편집할 수 있는, 조작된 비천연 발생 CRISPR-Cas 시스템. - 제59항에 있어서, 상기 Cas9 단백질은 불활성 Cas9(dCas9)인, 시스템.
- 제58항 내지 제60항 중 어느 한 항에 있어서, 상기 RNA 가이드는 crRNA 및 tracrRNA를 포함하는, 시스템.
- 제58항 내지 제60항 중 어느 한 항에 있어서, 상기 RNA 가이드는 sgRNA를 포함하는, 시스템.
- 제62항에 있어서, 스트렙토코커스 콘스텔라투스 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUCAAGCUUGCAAAAGCGUGCACCGAUUCGGUGCU-3' (서열번호 3)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
- 제62항에 있어서, 샤르페아 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3' (서열번호 7)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
- 제62항에 있어서, 베일로넬라 파르불라 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3' (서열번호 13)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
- 제62항에 있어서, 에자키엘라 페루엔시스 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3' (서열번호 19)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
- 제62항에 있어서, 락토바실러스 퍼멘텀 균주 AF15-40LB Cas9와 함께 사용하기 위한 sgRNA는 5'-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3' (서열번호 95)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
- 제62항에 있어서, 펩토니필러스 sp. 마르세유-P3761 Cas9와 함께 사용하기 위한 sgRNA는 5'-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3' (서열번호 96)와 적어도 약 80% 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
- 제58항 내지 제68항 중 어느 한 항에 있어서, 상기 Cas 단백질은 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결되고, 상기 가이드 RNA는 진핵 세포에서 발현되도록 프로모터 서열에 작동 가능하게 연결되는, 시스템.
- 제69항에 있어서, 상기 진핵 세포는 인간 세포인, 시스템.
- 제70항에 있어서, 상기 프로모터 서열은 진핵 프로모터 서열인, 시스템.
- 제58항 내지 제71항 중 어느 한 항의 시스템을 암호화하는 핵산.
- 제58항 내지 제72항 중 어느 한 항의 시스템을 포함하는 벡터.
- 제73항에 있어서, 상기 벡터는 플라스미드 벡터 또는 바이러스 벡터인, 벡터.
- 제74항에 있어서, 상기 바이러스 벡터는 아데노 연관 바이러스(AAV) 벡터 또는 렌티바이러스 벡터인, 벡터.
- 제75항에 있어서, 상기 바이러스 벡터는 AAV 벡터인, 벡터.
- 제76항에 있어서, 1개 초과의 AAV 벡터는 제59항 내지 제71항 중 어느 한 항의 시스템을 패키징하기 위해 사용되는, 벡터.
- 장애 또는 질병 치료를 필요로 하는 대상체에서 장애 또는 질병을 치료하는 방법으로, 상기 방법은 제58항 내지 제71항 중 어느 한 항의 시스템을 상기 대상체에게 투여하는 것을 포함하고,
상기 가이드 RNA는 병태 또는 질병과 연관된 표적 핵산의 적어도 10개 뉴클레오티드에 상보적이고;
상기 Cas 단백질은 상기 가이드 RNA와 연관되고;
상기 가이드 RNA는 상기 표적 핵산에 결합하고;
상기 Cas 단백질은 표적 핵산의 파손을 유발하고, 선택적으로 상기 Cas9는 데아미나제에 융합된 불활성 Cas9(dCas9)이고 상기 표적 핵산에서 1개 이상의 염기 편집을 초래하여 상기 장애 또는 질병을 치료하는, 방법. - 제78항에 있어서, 상기 가이드 RNA는 약 18 내지 24개의 뉴클레오티드에 상보적인, 방법.
- 제79항에 있어서, 상기 가이드 RNA는 20개의 뉴클레오티드에 상보적인, 방법.
- 제16항 내지 제19항 중 어느 한 항의 융합 단백질을 포함하는 염기 편집기.
- 제81항에 있어서, 아데노신 데아미나제 도메인 또는 시티딘 데아미나제 도메인을 포함하는 염기 편집기.
[청구항 82b]
제81항에 있어서, 아데노신 데아미나제 도메인 및 시티딘 데아미나제 도메인을 포함하는 염기 편집기. - 폴리뉴클레오티드의 핵염기를 편집하는 방법으로, 상기 방법은 1개 이상의 가이드 RNA와의 복합체에서 제81항의 염기 편집기와 상기 폴리뉴클레오티드를 접촉시키는 것을 포함하고, 상기 염기 편집기는 아데노신 데아미나제 도메인을 포함하고, 상기 1개 이상의 가이드 RNA는 상기 폴리뉴클레오티드에서 A·T에서 G·C로 변경을 이루도록 염기 편집기를 표적으로 하는, 방법.
- 폴리뉴클레오티드의 핵염기를 편집하는 방법으로, 상기 방법은 1개 이상의 가이드 RNA와의 복합체에서 제81항의 염기 편집기와 상기 폴리뉴클레오티드를 접촉시키는 것을 포함하고, 상기 염기 편집기는 시티딘 데아미나제 도메인을 포함하고, 상기 1개 이상의 가이드 RNA는 상기 폴리뉴클레오티드에서 G·C에서 T·A로 변경을 이루도록 염기 편집기를 표적으로 하는, 방법.
- 제83항 또는 제84항에 있어서, 상기 편집이 표적 폴리뉴클레오티드 서열에서 50% 미만의 삽입결실 형성을 초래하는, 방법.
- 제83항 내지 제85항 중 어느 한 항에 있어서, 상기 편집이 점 돌연변이를 발생시키는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163164798P | 2021-03-23 | 2021-03-23 | |
US63/164,798 | 2021-03-23 | ||
PCT/US2022/021523 WO2022204268A2 (en) | 2021-03-23 | 2022-03-23 | Novel crispr enzymes, methods, systems and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230158531A true KR20230158531A (ko) | 2023-11-20 |
Family
ID=81326585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237034367A KR20230158531A (ko) | 2021-03-23 | 2022-03-23 | 신규 crispr 효소, 방법, 시스템 및 그 용도 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20240167008A1 (ko) |
EP (1) | EP4314265A2 (ko) |
JP (1) | JP2024511621A (ko) |
KR (1) | KR20230158531A (ko) |
CN (1) | CN117529555A (ko) |
AU (1) | AU2022245243A1 (ko) |
CA (1) | CA3211495A1 (ko) |
WO (1) | WO2022204268A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117866926B (zh) * | 2024-03-07 | 2024-08-16 | 珠海舒桐医疗科技有限公司 | 一种CRISPR-FrCas9蛋白突变体及应用 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4880635B1 (en) | 1984-08-08 | 1996-07-02 | Liposome Company | Dehydrated liposomes |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4921757A (en) | 1985-04-26 | 1990-05-01 | Massachusetts Institute Of Technology | System for delayed and pulsed release of biologically active substances |
US4920016A (en) | 1986-12-24 | 1990-04-24 | Linear Technology, Inc. | Liposomes with enhanced circulation time |
JPH0825869B2 (ja) | 1987-02-09 | 1996-03-13 | 株式会社ビタミン研究所 | 抗腫瘍剤包埋リポソ−ム製剤 |
US4911928A (en) | 1987-03-13 | 1990-03-27 | Micro-Pak, Inc. | Paucilamellar lipid vesicles |
US4917951A (en) | 1987-07-28 | 1990-04-17 | Micro-Pak, Inc. | Lipid vesicles formed of surfactants and steroids |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US5846946A (en) | 1996-06-14 | 1998-12-08 | Pasteur Merieux Serums Et Vaccins | Compositions and methods for administering Borrelia DNA |
ATE527281T1 (de) | 2004-07-16 | 2011-10-15 | Us Gov Health & Human Serv | Impfstoffe gegen aids umfassend cmv/r nucleinsäurekonstrukte |
NZ587060A (en) | 2007-12-31 | 2012-09-28 | Nanocor Therapeutics Inc | Rna interference for the treatment of heart failure |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
CN105139759B (zh) | 2015-09-18 | 2017-10-10 | 京东方科技集团股份有限公司 | 一种拼接屏 |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11898179B2 (en) * | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
US20220307001A1 (en) * | 2018-02-27 | 2022-09-29 | President And Fellows Of Harvard College | Evolved cas9 variants and uses thereof |
-
2022
- 2022-03-23 KR KR1020237034367A patent/KR20230158531A/ko unknown
- 2022-03-23 WO PCT/US2022/021523 patent/WO2022204268A2/en active Application Filing
- 2022-03-23 AU AU2022245243A patent/AU2022245243A1/en active Pending
- 2022-03-23 CA CA3211495A patent/CA3211495A1/en active Pending
- 2022-03-23 JP JP2023558369A patent/JP2024511621A/ja active Pending
- 2022-03-23 US US18/283,148 patent/US20240167008A1/en active Pending
- 2022-03-23 EP EP22715917.5A patent/EP4314265A2/en active Pending
- 2022-03-23 CN CN202280036959.3A patent/CN117529555A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240167008A1 (en) | 2024-05-23 |
WO2022204268A2 (en) | 2022-09-29 |
CN117529555A (zh) | 2024-02-06 |
CA3211495A1 (en) | 2022-09-29 |
WO2022204268A3 (en) | 2022-10-20 |
JP2024511621A (ja) | 2024-03-14 |
EP4314265A2 (en) | 2024-02-07 |
AU2022245243A1 (en) | 2023-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220123398A (ko) | 합성 가이드 rna, 이의 조성물, 방법 및 용도 | |
EP4349979A1 (en) | Engineered cas12i nuclease, effector protein and use thereof | |
CA3237337A1 (en) | Novel crispr-cas12i systems and uses thereof | |
US20230279373A1 (en) | Novel crispr enzymes, methods, systems and uses thereof | |
KR20230158531A (ko) | 신규 crispr 효소, 방법, 시스템 및 그 용도 | |
WO2022081890A1 (en) | Compositions and methods for treating glycogen storage disease type 1a | |
US20240327813A1 (en) | Crispr enzymes, methods, systems and uses thereof | |
US20240252550A1 (en) | Genetic modification of hepatocytes | |
WO2023138685A9 (en) | Novel crispr-cas12i systems and uses thereof | |
WO2023196772A1 (en) | Novel rna base editing compositions, systems, methods and uses thereof | |
KR20240037299A (ko) | Crispr/cas 편집 시스템용 가이드 rna | |
EP4347830A2 (en) | Circular guide rnas for crispr/cas editing systems | |
WO2024108092A1 (en) | Prime editor delivery by aav | |
CN117916373A (zh) | 用于crispr/cas编辑系统的引导rna |