KR20230148416A - 인간 시토메갈로바이러스 당단백질 b 폴리펩티드 내의 신규 약물표적화가능한 영역및 그의 사용 방법 - Google Patents
인간 시토메갈로바이러스 당단백질 b 폴리펩티드 내의 신규 약물표적화가능한 영역및 그의 사용 방법 Download PDFInfo
- Publication number
- KR20230148416A KR20230148416A KR1020237032170A KR20237032170A KR20230148416A KR 20230148416 A KR20230148416 A KR 20230148416A KR 1020237032170 A KR1020237032170 A KR 1020237032170A KR 20237032170 A KR20237032170 A KR 20237032170A KR 20230148416 A KR20230148416 A KR 20230148416A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- hcmv
- polypeptide
- amino acid
- fusion
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 569
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 539
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 516
- 241000701024 Human betaherpesvirus 5 Species 0.000 title claims abstract description 463
- 239000003814 drug Substances 0.000 title claims abstract description 214
- 238000000034 method Methods 0.000 title claims abstract description 201
- 229940079593 drug Drugs 0.000 title claims abstract description 141
- 108010029389 Simplexvirus glycoprotein B Proteins 0.000 title description 3
- 230000027455 binding Effects 0.000 claims abstract description 96
- 150000001875 compounds Chemical class 0.000 claims abstract description 96
- 229940124597 therapeutic agent Drugs 0.000 claims abstract description 71
- 230000000694 effects Effects 0.000 claims abstract description 61
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 51
- 239000003112 inhibitor Substances 0.000 claims abstract description 45
- 201000010099 disease Diseases 0.000 claims abstract description 43
- 208000015181 infectious disease Diseases 0.000 claims abstract description 41
- 102000003886 Glycoproteins Human genes 0.000 claims abstract description 36
- 108090000288 Glycoproteins Proteins 0.000 claims abstract description 36
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 18
- 108090000623 proteins and genes Proteins 0.000 claims description 183
- 102000004169 proteins and genes Human genes 0.000 claims description 179
- 230000004927 fusion Effects 0.000 claims description 160
- 150000007523 nucleic acids Chemical class 0.000 claims description 35
- 206010011831 Cytomegalovirus infection Diseases 0.000 claims description 34
- -1 antibodies Proteins 0.000 claims description 34
- 230000003612 virological effect Effects 0.000 claims description 33
- 241000700605 Viruses Species 0.000 claims description 32
- 102000039446 nucleic acids Human genes 0.000 claims description 30
- 108020004707 nucleic acids Proteins 0.000 claims description 30
- 150000003384 small molecules Chemical class 0.000 claims description 20
- 239000013638 trimer Substances 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 12
- 230000005764 inhibitory process Effects 0.000 claims description 12
- 239000001394 sodium malate Substances 0.000 claims description 11
- 239000000816 peptidomimetic Substances 0.000 claims description 9
- 208000035475 disorder Diseases 0.000 claims description 8
- 230000033001 locomotion Effects 0.000 claims description 7
- 238000005462 in vivo assay Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000000099 in vitro assay Methods 0.000 claims description 5
- 208000024891 symptom Diseases 0.000 claims description 5
- 238000001308 synthesis method Methods 0.000 claims description 5
- 101710167605 Spike glycoprotein Proteins 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 254
- 230000035772 mutation Effects 0.000 description 187
- 235000018102 proteins Nutrition 0.000 description 174
- 239000000203 mixture Substances 0.000 description 109
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 97
- 102000040430 polynucleotide Human genes 0.000 description 84
- 108091033319 polynucleotide Proteins 0.000 description 84
- 239000002157 polynucleotide Substances 0.000 description 84
- 238000006467 substitution reaction Methods 0.000 description 77
- 241000701022 Cytomegalovirus Species 0.000 description 75
- 239000012634 fragment Substances 0.000 description 75
- 235000001014 amino acid Nutrition 0.000 description 66
- 210000004027 cell Anatomy 0.000 description 58
- 239000000126 substance Substances 0.000 description 58
- 229920002477 rna polymer Polymers 0.000 description 56
- 150000001413 amino acids Chemical class 0.000 description 49
- 230000002163 immunogen Effects 0.000 description 46
- 238000012360 testing method Methods 0.000 description 46
- 238000003556 assay Methods 0.000 description 45
- 235000018417 cysteine Nutrition 0.000 description 44
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 39
- 230000028993 immune response Effects 0.000 description 38
- 230000015572 biosynthetic process Effects 0.000 description 30
- 230000000890 antigenic effect Effects 0.000 description 29
- 241000124008 Mammalia Species 0.000 description 27
- 230000003993 interaction Effects 0.000 description 27
- 239000000427 antigen Substances 0.000 description 26
- 108091007433 antigens Proteins 0.000 description 26
- 102000036639 antigens Human genes 0.000 description 26
- 238000006243 chemical reaction Methods 0.000 description 25
- 239000012528 membrane Substances 0.000 description 25
- 101150088904 UL130 gene Proteins 0.000 description 24
- 150000005829 chemical entities Chemical class 0.000 description 23
- 238000007385 chemical modification Methods 0.000 description 21
- 239000003795 chemical substances by application Substances 0.000 description 21
- 101150082158 UL128 gene Proteins 0.000 description 20
- 238000013461 design Methods 0.000 description 20
- 239000002245 particle Substances 0.000 description 20
- 102000053602 DNA Human genes 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 19
- 150000002632 lipids Chemical class 0.000 description 18
- 230000003472 neutralizing effect Effects 0.000 description 18
- 229960005486 vaccine Drugs 0.000 description 18
- 230000000295 complement effect Effects 0.000 description 17
- 239000000523 sample Substances 0.000 description 17
- 241001465754 Metazoa Species 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 238000002360 preparation method Methods 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 16
- 239000002105 nanoparticle Substances 0.000 description 15
- 239000007787 solid Substances 0.000 description 15
- 241000699670 Mus sp. Species 0.000 description 14
- 108700026244 Open Reading Frames Proteins 0.000 description 14
- 108010001267 Protein Subunits Proteins 0.000 description 14
- 102000002067 Protein Subunits Human genes 0.000 description 14
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 14
- 239000002671 adjuvant Substances 0.000 description 13
- 239000003153 chemical reaction reagent Substances 0.000 description 13
- 239000003599 detergent Substances 0.000 description 13
- 238000012216 screening Methods 0.000 description 13
- 238000004519 manufacturing process Methods 0.000 description 12
- 239000003607 modifier Substances 0.000 description 12
- 238000000746 purification Methods 0.000 description 12
- 241000894007 species Species 0.000 description 12
- 125000000539 amino acid group Chemical group 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- 210000002845 virion Anatomy 0.000 description 11
- 101100315698 Human cytomegalovirus (strain Merlin) UL131A gene Proteins 0.000 description 10
- 239000013078 crystal Substances 0.000 description 10
- 238000009510 drug design Methods 0.000 description 10
- 229920000642 polymer Polymers 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 108020003589 5' Untranslated Regions Proteins 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- 101150010313 UL123 gene Proteins 0.000 description 9
- 238000005094 computer simulation Methods 0.000 description 9
- 230000002209 hydrophobic effect Effects 0.000 description 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 238000007792 addition Methods 0.000 description 8
- UMGDCJDMYOKAJW-UHFFFAOYSA-N aminothiocarboxamide Natural products NC(N)=S UMGDCJDMYOKAJW-UHFFFAOYSA-N 0.000 description 8
- 230000004071 biological effect Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 229940125777 fusion inhibitor Drugs 0.000 description 8
- 108020001507 fusion proteins Proteins 0.000 description 8
- 102000037865 fusion proteins Human genes 0.000 description 8
- 125000001165 hydrophobic group Chemical group 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 8
- 210000002966 serum Anatomy 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 7
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 7
- 241000238631 Hexapoda Species 0.000 description 7
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 7
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 7
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 7
- 101150022492 UL83 gene Proteins 0.000 description 7
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Natural products NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 230000001086 cytosolic effect Effects 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 238000011049 filling Methods 0.000 description 7
- 238000009472 formulation Methods 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 238000000386 microscopy Methods 0.000 description 7
- 239000012071 phase Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000007790 solid phase Substances 0.000 description 7
- 239000002904 solvent Substances 0.000 description 7
- 229940035893 uracil Drugs 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 6
- AMMRPAYSYYGRKP-BGZDPUMWSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-ethylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 AMMRPAYSYYGRKP-BGZDPUMWSA-N 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 6
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 230000005875 antibody response Effects 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 125000002091 cationic group Chemical group 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 229920002521 macromolecule Polymers 0.000 description 6
- 238000003032 molecular docking Methods 0.000 description 6
- 238000000159 protein binding assay Methods 0.000 description 6
- 230000000087 stabilizing effect Effects 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- 241000724252 Cucumber mosaic virus Species 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- 229940022005 RNA vaccine Drugs 0.000 description 5
- 229930182558 Sterol Chemical class 0.000 description 5
- 208000036142 Viral infection Diseases 0.000 description 5
- 210000003719 b-lymphocyte Anatomy 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 210000000170 cell membrane Anatomy 0.000 description 5
- 238000004587 chromatography analysis Methods 0.000 description 5
- 239000003431 cross linking reagent Substances 0.000 description 5
- 150000001945 cysteines Chemical class 0.000 description 5
- 238000001493 electron microscopy Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000003018 immunoassay Methods 0.000 description 5
- 230000005847 immunogenicity Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 108700021021 mRNA Vaccine Proteins 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 5
- 230000002265 prevention Effects 0.000 description 5
- 239000000376 reactant Substances 0.000 description 5
- 108010071207 serylmethionine Proteins 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 238000010186 staining Methods 0.000 description 5
- 239000007858 starting material Substances 0.000 description 5
- 150000003432 sterols Chemical class 0.000 description 5
- 235000003702 sterols Nutrition 0.000 description 5
- 230000009385 viral infection Effects 0.000 description 5
- 230000007485 viral shedding Effects 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- LRFJOIPOPUJUMI-KWXKLSQISA-N 2-[2,2-bis[(9z,12z)-octadeca-9,12-dienyl]-1,3-dioxolan-4-yl]-n,n-dimethylethanamine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC1(CCCCCCCC\C=C/C\C=C/CCCCC)OCC(CCN(C)C)O1 LRFJOIPOPUJUMI-KWXKLSQISA-N 0.000 description 4
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 4
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 4
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 4
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 4
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 4
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 4
- CFGHCPUPFHWMCM-FDARSICLSA-N Arg-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N CFGHCPUPFHWMCM-FDARSICLSA-N 0.000 description 4
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 4
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 4
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 4
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 4
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 4
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 4
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 4
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 4
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 4
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 4
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 4
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 4
- SYIPVNMWBZXKMU-HJPIBITLSA-N His-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N SYIPVNMWBZXKMU-HJPIBITLSA-N 0.000 description 4
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 4
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 4
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 4
- NUEHSWNAFIEBCQ-NAKRPEOUSA-N Ile-Val-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUEHSWNAFIEBCQ-NAKRPEOUSA-N 0.000 description 4
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 4
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 4
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 4
- JZXKNNOWPBVZEV-XIRDDKMYSA-N Met-Trp-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JZXKNNOWPBVZEV-XIRDDKMYSA-N 0.000 description 4
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 4
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 4
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 4
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 4
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 4
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 4
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 4
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 4
- 230000005867 T cell response Effects 0.000 description 4
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 4
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 4
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 4
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 4
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 4
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 4
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 4
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 4
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 4
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 4
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 4
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 4
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 4
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 4
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 4
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 4
- 238000010171 animal model Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 230000036755 cellular response Effects 0.000 description 4
- 125000003636 chemical group Chemical group 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000010494 dissociation reaction Methods 0.000 description 4
- 230000005593 dissociations Effects 0.000 description 4
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 4
- 239000003937 drug carrier Substances 0.000 description 4
- 238000007876 drug discovery Methods 0.000 description 4
- 239000003596 drug target Substances 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 4
- 210000002950 fibroblast Anatomy 0.000 description 4
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 4
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 238000006386 neutralization reaction Methods 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000001681 protective effect Effects 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 230000008707 rearrangement Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 230000006641 stabilisation Effects 0.000 description 4
- 238000011105 stabilization Methods 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 238000005829 trimerization reaction Methods 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 241000701447 unidentified baculovirus Species 0.000 description 4
- 230000035899 viability Effects 0.000 description 4
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 3
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 3
- MUSPKJVFRAYWAR-XVFCMESISA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)thiolan-2-yl]pyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)S[C@H]1N1C(=O)NC(=O)C=C1 MUSPKJVFRAYWAR-XVFCMESISA-N 0.000 description 3
- SXUXMRMBWZCMEN-UHFFFAOYSA-N 2'-O-methyl uridine Natural products COC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-UHFFFAOYSA-N 0.000 description 3
- SXUXMRMBWZCMEN-ZOQUXTDFSA-N 2'-O-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-ZOQUXTDFSA-N 0.000 description 3
- JCNGYIGHEUKAHK-DWJKKKFUSA-N 2-Thio-1-methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O JCNGYIGHEUKAHK-DWJKKKFUSA-N 0.000 description 3
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 3
- CWXIOHYALLRNSZ-JWMKEVCDSA-N 2-Thiodihydropseudouridine Chemical compound C1C(C(=O)NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O CWXIOHYALLRNSZ-JWMKEVCDSA-N 0.000 description 3
- JUMHLCXWYQVTLL-KVTDHHQDSA-N 2-thio-5-aza-uridine Chemical compound [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=S)NC(=O)N=C1 JUMHLCXWYQVTLL-KVTDHHQDSA-N 0.000 description 3
- VRVXMIJPUBNPGH-XVFCMESISA-N 2-thio-dihydrouridine Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)N1CCC(=O)NC1=S VRVXMIJPUBNPGH-XVFCMESISA-N 0.000 description 3
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 3
- FGFVODMBKZRMMW-XUTVFYLZSA-N 4-Methoxy-2-thiopseudouridine Chemical compound COC1=C(C=NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O FGFVODMBKZRMMW-XUTVFYLZSA-N 0.000 description 3
- HOCJTJWYMOSXMU-XUTVFYLZSA-N 4-Methoxypseudouridine Chemical compound COC1=C(C=NC(=O)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O HOCJTJWYMOSXMU-XUTVFYLZSA-N 0.000 description 3
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 3
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 3
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 3
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 3
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 3
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 3
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 3
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 3
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 3
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 3
- IDLBLNBDLCTPGC-HERUPUMHSA-N Ala-Trp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N IDLBLNBDLCTPGC-HERUPUMHSA-N 0.000 description 3
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 3
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 3
- 101100107610 Arabidopsis thaliana ABCF4 gene Proteins 0.000 description 3
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 3
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 3
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 3
- QQJSJIBESHAJPM-IHRRRGAJSA-N Arg-Cys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QQJSJIBESHAJPM-IHRRRGAJSA-N 0.000 description 3
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 3
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 3
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 3
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 3
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 3
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 3
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 3
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 3
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 3
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 3
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 3
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 3
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 3
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 3
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 3
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 3
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 3
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 3
- JRBVWZLHBGYZNY-QEJZJMRPSA-N Asp-Gln-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRBVWZLHBGYZNY-QEJZJMRPSA-N 0.000 description 3
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 3
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 3
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 3
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 3
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 3
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 3
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 3
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 3
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 3
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108010039939 Cell Wall Skeleton Proteins 0.000 description 3
- 206010010356 Congenital anomaly Diseases 0.000 description 3
- RWVBNRYBHAGYSG-GUBZILKMSA-N Cys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N RWVBNRYBHAGYSG-GUBZILKMSA-N 0.000 description 3
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 3
- 102000004127 Cytokines Human genes 0.000 description 3
- 108090000695 Cytokines Proteins 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- YKWUPFSEFXSGRT-JWMKEVCDSA-N Dihydropseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1C(=O)NC(=O)NC1 YKWUPFSEFXSGRT-JWMKEVCDSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 3
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 3
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 3
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 3
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 3
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 3
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 3
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 3
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 3
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 3
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 3
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 3
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 3
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 3
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 3
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 3
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 3
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 3
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 3
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 3
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 3
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 3
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 3
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 3
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 3
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 3
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 3
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 3
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 3
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 3
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 3
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 3
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 3
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 3
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 3
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 3
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 3
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 3
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 239000007995 HEPES buffer Substances 0.000 description 3
- QZAFGJNKLMNDEM-DCAQKATOSA-N His-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 QZAFGJNKLMNDEM-DCAQKATOSA-N 0.000 description 3
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 3
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 3
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 3
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 3
- 241000701031 Human herpesvirus 5 strain AD169 Species 0.000 description 3
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 3
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 3
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 3
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 3
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 3
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 3
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 3
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 3
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 3
- 102100034349 Integrase Human genes 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 3
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 3
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 3
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 3
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 3
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 3
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 3
- VFQOCUQGMUXTJR-DCAQKATOSA-N Leu-Cys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)O)N VFQOCUQGMUXTJR-DCAQKATOSA-N 0.000 description 3
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 3
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 3
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 3
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 3
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 3
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 3
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 3
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 3
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 3
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 3
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 3
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 3
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 3
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 3
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 3
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 3
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 3
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 3
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 3
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 3
- UXQFHEKRGHYJRA-STQMWFEESA-N Phe-Met-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O UXQFHEKRGHYJRA-STQMWFEESA-N 0.000 description 3
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 3
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 3
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 3
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 3
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 3
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 3
- 102000001253 Protein Kinase Human genes 0.000 description 3
- 229930185560 Pseudouridine Natural products 0.000 description 3
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 3
- 101100068078 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GCN4 gene Proteins 0.000 description 3
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 3
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 3
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 3
- MAWSJXHRLWVJEZ-ACZMJKKPSA-N Ser-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N MAWSJXHRLWVJEZ-ACZMJKKPSA-N 0.000 description 3
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 3
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 3
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 3
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 3
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 3
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 3
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 3
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 3
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 3
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 3
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 3
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 3
- UTCFSBBXPWKLTG-XKBZYTNZSA-N Thr-Cys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O UTCFSBBXPWKLTG-XKBZYTNZSA-N 0.000 description 3
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 3
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 3
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 3
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 3
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 3
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 3
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 3
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 3
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 3
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 3
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 3
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 3
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 3
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 3
- DXUVJJRTVACXSO-KKUMJFAQSA-N Tyr-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DXUVJJRTVACXSO-KKUMJFAQSA-N 0.000 description 3
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 3
- ARSHSYUZHSIYKR-ACRUOGEOSA-N Tyr-His-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ARSHSYUZHSIYKR-ACRUOGEOSA-N 0.000 description 3
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 3
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 3
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 3
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 3
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 3
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 3
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 3
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 3
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 3
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 3
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 3
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 3
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 3
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 3
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 3
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 3
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 3
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 3
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 3
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 3
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 3
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 3
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 3
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 3
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 3
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 3
- 108010081404 acein-2 Proteins 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 125000001931 aliphatic group Chemical group 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 3
- 230000031018 biological processes and functions Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 210000004520 cell wall skeleton Anatomy 0.000 description 3
- 230000009918 complex formation Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 239000003636 conditioned culture medium Substances 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- NLEBIOOXCVAHBD-QKMCSOCLSA-N dodecyl beta-D-maltoside Chemical compound O[C@@H]1[C@@H](O)[C@H](OCCCCCCCCCCCC)O[C@H](CO)[C@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 NLEBIOOXCVAHBD-QKMCSOCLSA-N 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 229930014626 natural product Natural products 0.000 description 3
- 210000004738 parenchymal cell Anatomy 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 108010084572 phenylalanyl-valine Proteins 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 3
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 3
- 229920000053 polysorbate 80 Polymers 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 108060006633 protein kinase Proteins 0.000 description 3
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 238000001542 size-exclusion chromatography Methods 0.000 description 3
- 238000010532 solid phase synthesis reaction Methods 0.000 description 3
- 238000005063 solubilization Methods 0.000 description 3
- 230000007928 solubilization Effects 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 108010029384 tryptophyl-histidine Proteins 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 2
- OWSWOWLMQKUWTE-UHFFFAOYSA-N 1-[5-(2,5-dioxo-3-sulfopyrrolidin-1-yl)oxy-5-oxopentanoyl]oxy-2,5-dioxopyrrolidine-3-sulfonic acid Chemical compound O=C1C(S(=O)(=O)O)CC(=O)N1OC(=O)CCCC(=O)ON1C(=O)C(S(O)(=O)=O)CC1=O OWSWOWLMQKUWTE-UHFFFAOYSA-N 0.000 description 2
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 2
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241000700198 Cavia Species 0.000 description 2
- 241000725619 Dengue virus Species 0.000 description 2
- 238000009007 Diagnostic Kit Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101710121417 Envelope glycoprotein Proteins 0.000 description 2
- 101710189104 Fibritin Proteins 0.000 description 2
- 108010024636 Glutathione Proteins 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 101710170453 Glycoprotein 55 Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 2
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 2
- 101710110377 Immediate early protein IE1 Proteins 0.000 description 2
- 101710205424 Immediate-early protein 1 Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 2
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 238000002820 assay format Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 230000006287 biotinylation Effects 0.000 description 2
- 238000007413 biotinylation Methods 0.000 description 2
- DGNMJYUPWDTKJB-ZDSKVHJSSA-N bis[(z)-non-2-enyl] 9-[4-(dimethylamino)butanoyloxy]heptadecanedioate Chemical compound CCCCCC\C=C/COC(=O)CCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC(=O)OC\C=C/CCCCCC DGNMJYUPWDTKJB-ZDSKVHJSSA-N 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000007910 cell fusion Effects 0.000 description 2
- 210000004671 cell-free system Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000010382 chemical cross-linking Methods 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229920001577 copolymer Polymers 0.000 description 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 238000007877 drug screening Methods 0.000 description 2
- 238000000635 electron micrograph Methods 0.000 description 2
- 230000009881 electrostatic interaction Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 238000002875 fluorescence polarization Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 229960003180 glutathione Drugs 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 238000012203 high throughput assay Methods 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 208000024697 human cytomegalovirus infection Diseases 0.000 description 2
- 230000028996 humoral immune response Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000010255 intramuscular injection Methods 0.000 description 2
- 239000007927 intramuscular injection Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 230000021633 leukocyte mediated immunity Effects 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 210000004779 membrane envelope Anatomy 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 210000004896 polypeptide structure Anatomy 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- BBEAQIROQSPTKN-UHFFFAOYSA-N pyrene Chemical compound C1=CC=C2C=CC3=CC=CC4=CC=C1C2=C43 BBEAQIROQSPTKN-UHFFFAOYSA-N 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 102220258031 rs912159589 Human genes 0.000 description 2
- 239000012146 running buffer Substances 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000012488 sample solution Substances 0.000 description 2
- 229930182490 saponin Natural products 0.000 description 2
- 150000007949 saponins Chemical class 0.000 description 2
- 238000007423 screening assay Methods 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 229940031439 squalene Drugs 0.000 description 2
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- XETCRXVKJHBPMK-MJSODCSWSA-N trehalose 6,6'-dimycolate Chemical compound C([C@@H]1[C@H]([C@H](O)[C@@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](COC(=O)C(CCCCCCCCCCC3C(C3)CCCCCCCCCCCCCCCCCC)C(O)CCCCCCCCCCCCCCCCCCCCCCCCC)O2)O)O1)O)OC(=O)C(C(O)CCCCCCCCCCCCCCCCCCCCCCCCC)CCCCCCCCCCC1CC1CCCCCCCCCCCCCCCCCC XETCRXVKJHBPMK-MJSODCSWSA-N 0.000 description 2
- 102000003390 tumor necrosis factor Human genes 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000005570 vertical transmission Effects 0.000 description 2
- 238000002424 x-ray crystallography Methods 0.000 description 2
- UAOUIVVJBYDFKD-XKCDOFEDSA-N (1R,9R,10S,11R,12R,15S,18S,21R)-10,11,21-trihydroxy-8,8-dimethyl-14-methylidene-4-(prop-2-enylamino)-20-oxa-5-thia-3-azahexacyclo[9.7.2.112,15.01,9.02,6.012,18]henicosa-2(6),3-dien-13-one Chemical compound C([C@@H]1[C@@H](O)[C@@]23C(C1=C)=O)C[C@H]2[C@]12C(N=C(NCC=C)S4)=C4CC(C)(C)[C@H]1[C@H](O)[C@]3(O)OC2 UAOUIVVJBYDFKD-XKCDOFEDSA-N 0.000 description 1
- YMXHPSHLTSZXKH-RVBZMBCESA-N (2,5-dioxopyrrolidin-1-yl) 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoate Chemical compound C([C@H]1[C@H]2NC(=O)N[C@H]2CS1)CCCC(=O)ON1C(=O)CCC1=O YMXHPSHLTSZXKH-RVBZMBCESA-N 0.000 description 1
- 238000004834 15N NMR spectroscopy Methods 0.000 description 1
- 238000004294 195Pt NMR spectroscopy Methods 0.000 description 1
- 238000005160 1H NMR spectroscopy Methods 0.000 description 1
- LVSPDZAGCBEQAV-UHFFFAOYSA-N 4-chloronaphthalen-1-ol Chemical compound C1=CC=C2C(O)=CC=C(Cl)C2=C1 LVSPDZAGCBEQAV-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- CVHJIWVKTFNGHT-ACZMJKKPSA-N Ala-Gln-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N CVHJIWVKTFNGHT-ACZMJKKPSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- 239000012103 Alexa Fluor 488 Substances 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 241000252095 Congridae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- VYZAHLCBVHPDDF-UHFFFAOYSA-N Dinitrochlorobenzene Chemical compound [O-][N+](=O)C1=CC=C(Cl)C([N+]([O-])=O)=C1 VYZAHLCBVHPDDF-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000272186 Falco columbarius Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010010369 HIV Protease Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- 101900312130 Human cytomegalovirus Envelope glycoprotein O Proteins 0.000 description 1
- 101900039244 Human cytomegalovirus Envelope glycoprotein UL130 Proteins 0.000 description 1
- 101900003124 Human cytomegalovirus Envelope protein UL128 Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 238000004566 IR spectroscopy Methods 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 1
- 108700020354 N-acetylmuramyl-threonyl-isoglutamine Proteins 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 208000001388 Opportunistic Infections Diseases 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 108010007568 Protamines Proteins 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- PRXRUNOAOLTIEF-ADSICKODSA-N Sorbitan trioleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@@H](OC(=O)CCCCCCC\C=C/CCCCCCCC)[C@H]1OC[C@H](O)[C@H]1OC(=O)CCCCCCC\C=C/CCCCCCCC PRXRUNOAOLTIEF-ADSICKODSA-N 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- FZWLAAWBMGSTSO-UHFFFAOYSA-N Thiazole Chemical group C1=CSC=N1 FZWLAAWBMGSTSO-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 101150081415 UL55 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 229940037003 alum Drugs 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- DIZPMCHEQGEION-UHFFFAOYSA-H aluminium sulfate (anhydrous) Chemical compound [Al+3].[Al+3].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O DIZPMCHEQGEION-UHFFFAOYSA-H 0.000 description 1
- 210000002821 alveolar epithelial cell Anatomy 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 210000000628 antibody-producing cell Anatomy 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 238000013476 bayesian approach Methods 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 125000004057 biotinyl group Chemical group [H]N1C(=O)N([H])[C@]2([H])[C@@]([H])(SC([H])([H])[C@]12[H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C(*)=O 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 239000012876 carrier material Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000000423 cell based assay Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- WLNARFZDISHUGS-MIXBDBMTSA-N cholesteryl hemisuccinate Chemical compound C1C=C2C[C@@H](OC(=O)CCC(O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 WLNARFZDISHUGS-MIXBDBMTSA-N 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 238000012875 competitive assay Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000006957 competitive inhibition Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000002508 compound effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000002872 contrast media Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000002447 crystallographic data Methods 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- MYRTYDVEIRVNKP-UHFFFAOYSA-N divinylbenzene Substances C=CC1=CC=CC=C1C=C MYRTYDVEIRVNKP-UHFFFAOYSA-N 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- GVEPBJHOBDJJJI-UHFFFAOYSA-N fluoranthrene Natural products C1=CC(C2=CC=CC=C22)=C3C2=CC=CC3=C1 GVEPBJHOBDJJJI-UHFFFAOYSA-N 0.000 description 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000000799 fusogenic effect Effects 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000011577 humanized mouse model Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000005661 hydrophobic surface Effects 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000007373 indentation Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007919 intrasynovial administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 229940125425 inverse agonist Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000003367 kinetic assay Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000012900 molecular simulation Methods 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 1
- JXTPJDDICSTXJX-UHFFFAOYSA-N n-Triacontane Natural products CCCCCCCCCCCCCCCCCCCCCCCCCCCCCC JXTPJDDICSTXJX-UHFFFAOYSA-N 0.000 description 1
- NKTPIWMJHDVAPY-NSHDSACASA-N n-[4-[[(1s)-1-[3,5-bis(trifluoromethyl)phenyl]ethyl]carbamothioylamino]phenyl]-1,3-thiazole-4-carboxamide Chemical compound N([C@@H](C)C=1C=C(C=C(C=1)C(F)(F)F)C(F)(F)F)C(=S)NC(C=C1)=CC=C1NC(=O)C1=CSC=N1 NKTPIWMJHDVAPY-NSHDSACASA-N 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 244000039328 opportunistic pathogen Species 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000004031 partial agonist Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000000902 placebo Substances 0.000 description 1
- 229940068196 placebo Drugs 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 239000004633 polyglycolic acid Substances 0.000 description 1
- 239000004626 polylactic acid Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 208000026881 post-infectious disease Diseases 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 229940048914 protamine Drugs 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 230000010322 reactivation of latent virus Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 102220032988 rs281865408 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 239000006104 solid solution Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 229940032094 squalane Drugs 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 150000003557 thiazoles Chemical class 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014599 transmission of virus Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 108700001624 vesicular stomatitis virus G Proteins 0.000 description 1
- 230000007502 viral entry Effects 0.000 description 1
- 244000052613 viral pathogen Species 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6845—Methods of identifying protein-protein interactions in protein mixtures
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6893—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/02—Screening involving studying the effect of compounds C on the interaction between interacting molecules A and B (e.g. A = enzyme and B = substrate for A, or A = receptor and B = ligand for the receptor)
Abstract
본 발명은 약물표적화가능한 영역을 포함하는 인간 시토메갈로바이러스 (HCMV) 당단백질 B (gB) 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, gB 폴리펩티드를 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법으로서, 여기서 상기 화합물의 결합은 후보 치료제를 표시하는 것인 방법에 관한 것이다. 본 발명은 또한 HCMV 활성의 조정제 및 억제제를 포함하는 후보 치료제 및 상기 조정제 및 억제제를 포함하는 제약 조성물 및 그의 사용 방법에 관한 것이다.
Description
관련 출원
본 출원은 2021년 2월 24일에 출원된 미국 가출원 번호 63/153,164 및 2022년 2월 4일에 출원된 미국 가출원 번호 63/306,669를 우선권 주장한다. 각각의 상기 출원의 전체 내용은 그 전문이 본원에 참조로 포함된다.
서열 목록에 대한 참조
본 출원은 EFS-웹을 통해 전자 출원되고, .txt 포맷의 전자 제출된 서열 목록을 포함한다. .txt 파일은 2022년 2월 3일에 생성되고 1,374 KB의 크기를 갖는 "PC72715_Feb2022_ST25.txt"이라는 명칭의 서열 목록을 함유한다. 이러한 .txt 파일에 함유된 서열 목록은 본 명세서의 일부이고, 그 전문이 본원에 참조로 포함된다.
발명의 분야
본 발명은 인간 시토메갈로바이러스 (HCMV) 당단백질 B (gB) 폴리펩티드에서의 신규 약물표적화가능한(druggable) 영역, 및 예를 들어 약물 발견을 위한 그의 사용 방법에 관한 것이다.
발명의 배경
인간 시토메갈로바이러스 (HCMV)는 β-헤르페스바이러스 패밀리의 이중 가닥 DNA 바이러스이다. HCMV는 임신한 여성에서의 감염 또는 잠재성 바이러스의 재활성화 후의 수직 바이러스 전달로부터 초래되는 선천성 및 신생아 청력 상실의 주요 원인이다. 또한, HCMV는 면역억제된 환자, 예컨대 실질 기관 및 줄기 세포 이식 환자, AIDS 환자 등에 영향을 미치는 흔한 기회 병원체이다. HCMV에 대한 백신의 개발이 의학 연구소(Institute of Medicine)에 의해 최상위 우선순위로서 열거되었지만, 지금까지 허가된 것은 없다.
HCMV 게놈은 여러 외피 당단백질을 코딩하며, 그 중 하나는 당단백질 B (gB)이다. 당단백질 B는 세포 내로의 바이러스 진입에 필요한 푸소겐이고, 감염에 대한 중화 항체 (nAb) 반응을 위한 중요한 표적이다. gB 서브유닛 항원을 합체시킨 HCMV 백신이 개발 중에 있다.
융합이 바이러스 감염성의 핵심 단계이기 때문에, gB 단백질 내의 약물표적화가능한 영역의 확인은 융합을 특이적으로 억제함으로써 HCMV에 의한 바이러스 감염을 억제할 수 있는 치료제를 추가로 확인 및 개발하게 한다.
발명의 개요
HCMV gB 단백질 구조는 그의 융합-전 및 융합-후 입체형태 둘 다에 있어서 하기에 상세하게 기재된 바와 같이 해석되었고, 그에 의해 폴리펩티드의 구조, 및 그 안에 함유된 약물표적화가능한 영역, 도메인 등에 대한 정보를 제공하며, 이들 모두는 합리적-기반 약물 설계 노력에 사용될 수 있다.
따라서, 본 발명은 부분적으로 HCMV gB 단백질에서의 신규 약물표적화가능한 영역을 제공한다. 화합물과 이러한 영역의 상호작용, 또는 화합물로의 이러한 영역의 활성의 조정은 바이러스 융합 및 따라서 바이러스 감염성을 억제할 수 있다. 한 측면에서, 본 발명은 gB 단백질을 갖는 HCMV에 의해 유발되는 HCMV 감염에 대한 후보 치료제, 예컨대 예를 들어 바이러스 융합 억제제를 발견하기 위해 이들 약물표적화가능한 영역에 대해 화합물을 스크리닝하는 방법을 제공한다.
또한, 본 발명은 약물표적화가능한 영역을 포함하는 당단백질 B (gB) 폴리펩티드를 갖는 HCMV를 화합물과 접촉시키는 것을 포함하며, 여기서 상기 화합물의 결합은 후보 치료제를 나타내는 것인, HCMV 감염에 의해 유발되는 질환을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법을 제공한다. 화합물은 특정 실시양태에서 하기 부류의 화합물: 단백질, 펩티드, 폴리펩티드, 펩티드모방체, 항체, 핵산 및 소분자로부터 선택될 수 있거나, 또는 화합물의 라이브러리로부터 선택될 수 있다. 이러한 라이브러리는 조합 합성 방법에 의해 생성될 수 있다. 결합은 시험관내 또는 생체내에서 검정될 수 있다. 이러한 방법의 특정 실시양태에서, 단백질은 HCMV gB 단백질이고, HCMV gB 단백질의 약물표적화가능한 영역으로부터의 적어도 1개의 잔기, 바람직하게는 3개의 잔기를 포함한다. 이러한 약물표적화가능한 영역은 또한 구조 결정, 약물 스크리닝, 약물 설계, 및 본원에 기재되고 청구된 다른 방법에 이용될 수 있다.
한 실시양태에서, 약물표적화가능한 영역은 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함한다. 이들 잔기는 융합후 입체형태의 HCMV gB 단백질의 도메인 V에 대한 결합 포켓을 형성한다.
또 다른 실시양태에서, 약물표적화가능한 영역은 융합후 입체형태의 HCMV gB 단백질의 융합 루프 또는 그의 일부를 포함한다.
또 다른 측면에서, 본 발명은 gB 단백질을 갖는 HCMV에 의해 유발되는 감염을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법을 제공한다. 특정 실시양태에서, 이러한 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 gB 단백질의 활성의 조정은 후보 치료제를 나타낸다. 다른 실시양태에서, 이러한 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 약물표적화가능한 영역의 이동 또는 상호작용의 배제는 후보 치료제를 나타낸다. 또 다른 실시양태에서, 상기 gB 단백질의 기능 또는 활성의 조정은 융합후 입체형태적 변화의 완료를 배제하는 것을 수반한다. 또 다른 실시양태에서, 상기 gB 단백질의 기능 또는 활성의 조정은 입체형태 변화의 제1 단계를 방해하는 것을 수반한다. 또 다른 실시양태에서, 이러한 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 바이러스의 융합의 억제는 후보 치료제를 나타낸다. 또 다른 실시양태에서, 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 HCMV의 바이러스 감염성의 억제는 후보 치료제를 나타낸다. 또 다른 실시양태에서, 대상체에서 HCMV 감염에 의해 유발되는 질환의 적어도 하나의 증상의 감소는 후보 치료제를 나타낸다.
추가 실시양태에서, 본 발명은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 화합물은 gB 단백질의 도메인 V 또는 그의 단편이 그의 결합 포켓에서 결합하는 것을 방지하는 것인, gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법을 제공한다. 한 실시양태에서, gB 단백질의 도메인 V에 대한 결합 포켓은 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함한다.
또 다른 측면에서, gB 단백질에 대해 본원에 학습되고 기재된 모든 정보는 그의 생물학적 활성의 조정제를 설계하는 방법에 사용될 수 있다. 한 실시양태에서, gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환의 예방 또는 치료를 위한 조정제를 설계하는 방법은 (a) gB 단백질에 대한 3차원 구조를 제공하는 단계; (b) 3차원 구조를 참조하여 gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환의 예방 또는 치료를 위한 잠재적 조정제를 확인하는 단계; (c) gB 단백질을 잠재적 조정제와 접촉시키는 단계; 및 (d) 조정제와의 접촉 후에 gB 단백질의 활성을 검정하거나 또는 상기 gB 단백질을 갖는 바이러스의 생존율을 결정하는 단계를 포함하며, 여기서 단백질의 활성 또는 바이러스의 생존율의 변화는 조정제가 바이러스-관련 질환 또는 장애의 예방 또는 치료에 유용할 수 있음을 나타낸다. 특정 실시양태에서, 잠재적 조정제는 gB 단백질을 갖는 HCMV의 3차원 구조를 참조하여 확인된다. 다른 실시양태에서, 잠재적 조정제는 gB 단백질 또는 그의 단편의 약물표적화가능한 영역의 3차원 구조를 참조하여 확인된다.
추가 측면에서, 본 발명은 HCMV 감염의 조정제 (특정 실시양태에서, 억제제), 뿐만 아니라 그를 포함하는 제약 조성물 및 키트를 제공한다. 이러한 조정제는 특정 실시양태에서 본 발명의 약물표적화가능한 영역과 상호작용할 수 있다. 또 다른 측면에서, 본 발명은 HCMV gB 단백질의 도메인 V의 단편 (또는 이러한 단편의 상동체 또는 이러한 단편의 모방체)이며, 해당 약물표적화가능한 영역에 대하여 경쟁하는 조정제에 관한 것이다. 임의의 상기 기재된 약물표적화가능한 영역의 조정제는 HCMV에 의한 감염을 치료 또는 예방하기 위해 단독으로 또는 상보적 접근법으로 사용될 수 있다.
마지막으로, 본 발명은 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함하는 HCMV gB의 약물표적화가능한 영역을 제공한다. 한 측면에서, 약물표적화가능한 영역의 잔기는 융합후 입체형태이다.
본 발명의 실시양태 및 실시, 다른 실시양태, 및 그의 특색 및 특징은 하기 설명, 도면 및 청구범위로부터 명백할 것이며, 여기서 모든 청구범위는 본 발명의 내용란에 참조로 포함된다.
도 1a - 1b는 gB 이형태체의 2차원 (2D) 부류 평균을 기재한다. 도 1a는 융합후 gB 구조로부터의 2D 투사도를 도시한다. 항체 Fab와 결합된 융합후 gB의 전자 극저온 현미경검사 구조의 투사 영상이 제시된다. 도 1b는 2D 부류 평균을 도시한다. 융합 억제제 및 가교제로의 처리 및 항체 단편의 결합 후에 CMV 비리온으로부터 추출된 gB의 제제로부터 수득된 전자 극저온 현미경검사 영상으로부터의 2차원 부류 평균이 우측에 제시된다. 참조 융합후 gB 2차원 투사도 중 어느 것과도 유사하지 않은 부류 평균화된 영상은 원에 의해 확인된다.
도 2는 본 발명자들의 전자 극저온 현미경검사 구조로부터의 융합전 및 융합후 gB-Fab 복합체 모델에 포함된 당단백질 B 아미노산을 기재한다. 전자 극저온 현미경검사 밀도 맵에서 모델링될 수 있는 아미노산은 도메인 코드로 강조된다 (도메인 I (이탤릭체 단독, 즉 상부 서열 (융합전) 잔기 133-344; 하부 서열 (융합후) 잔기 133-344); 도메인 II (볼드체 및 밑줄표시, 즉 상부 서열 (융합전) 잔기 121-132 및 345-436; 하부 서열 (융합후) 잔기 121-132 및 345-439); 도메인 III (볼드체 단독, 즉 상부 서열 (융합전) 잔기 86-120 및 483-550; 하부 서열 (융합후) 잔기 86-120 및 474-550); 도메인 IV (이탤릭체 및 밑줄표시, 즉 상부 서열 (융합전) 잔기 551-641; 하부 서열 (융합후) 잔기 551-641); 도메인 V (이탤릭체 및 볼드체, 즉 상부 서열 (융합전) 잔기 642-724; 하부 서열 (융합후) 잔기 642-697); MPR (밑줄표시 단독, 즉 상부 서열 (융합전) 잔기 25-7507; 하부 서열 (융합후) 잔기 없음); TM (이탤릭체, 볼드체 및 밑줄표시, 즉 상부 서열 (융합전) 잔기 751-769; 하부 서열 (융합후) 잔기 없음)). 상부 및 하부 서열은 각각 융합전 및 융합후 구조 모델에 대한 것이다.
도 3a - 3b는 밀도 맵으로의 모델의 피팅을 도시한다. 억제제 화합물 안정화된 융합전 (도 3a) 및 융합후 gB 입체형태 (도 3b)의 모델을 밝은 회색 밀도 맵에 피팅한다. gB 성분은 암회색이고, SM5-1 fab 성분은 흑색이다. 융합전 구조 내의 TM 영역의 위치에 의해 결정된 바와 같은 바이러스 외피의 대략적인 위치는 흑색 수평선에 의해 표시된다.
도 4a - 4b는 2가지 입체형태의 gB의 구조의 비교를 도시한다. gB 안정화된 융합전 구조 (도 4a) 및 융합후 구조 (도 4b)는 도메인: I, II, III, IV, V, MPR 및 TM을 나타내는 하나의 프로토머와 함께 제시된다. 융합전 구조물의 상부로부터 연장되는 수직 흑색 파선은 덜 한정된 밀도 맵으로 인해 모델로부터 누락된 잔기를 나타낸다. 구조의 구축가능한 엑토도메인 부분의 전체 치수는 파선 직사각형에 의해 표시된다. 화살표는 각각의 입체형태의 도메인 III 내의 중심 3-나선 다발의 C-말단이 가리키는 방향을 나타낸다. 융합전 구조 상의 115Å 치수 (도 4a)는 엑토도메인의 모델링된 부분의 높이를 나타낸다.
도 5a - 5d: 도 5a는 융합전 gB 모델에서의 융합 억제제 화합물 N-{4-[({(1S)-1-[3,5-비스(트리플루오로메틸)페닐]에틸}카르바모티오일)아미노]페닐}-1,3-티아졸-4-카르복스아미드의 위치가 흑색으로 나타나 있음을 도시한다. 화합물의 화학 구조를 도 5d에 나타냈다. 도 5b: 화합물 주위의 전자 밀도의 근접도 (회색 투명 표면). 인근의 아미노산 잔기가 제시되고, 도메인이 표지된다. 도 5c: 화합물 주위의 상호작용 잔기가 제시된다.
도 6a - 6c는 막 융합 동안 gB의 구조적 재배열의 모델을 도시한다. FL (및 별표) - 융합 루프. DI - 도메인 1. DII - 도메인 2. DV - 도메인 5. TM - 막횡단 영역. 실선은 막: 숙주 세포 및 바이러스 막을 도시한다. 도 6a (융합전)는 융합전 입체형태를 도시하고; 도 6b (연장된 중간체)는 확장된 중간 입체형태를 도시하고; 도 6c (융합후)는 융합후 입체형태를 도시한다.
도 7a - 7b는 융합전 입체형태에서 gB를 안정화시키기 위한 예시적인 디술피드 결합 돌연변이를 도시한다. 디술피드 결합에 참여하는 잔기의 위치는 융합전 입체형태 (도 7a) 및 융합후 입체형태 (도 7b)의 회색 구체로서 도시된다.
도 8은 구조 생물정보학 단백질 데이터 은행에 대한 연구 협회 (RCSB PDB) 파일: 5CXF, 인간 시토메갈로바이러스 (균주 AD169)로부터, 인간 시토메갈로바이러스로부터의 당단백질 B의 세포외 도메인의 결정 구조, 2015-07-28에 기탁됨; DOI: 10.2210/pdb5CXF/ pdb로부터의 정보를 도시한다.
단위 셀:
도 9는 임상 및 실험실-적합화된 HCMV 균주로부터의 gB의 서열 (서열식별번호: 110 - 서열식별번호: 111)을 도시한다. 추가의 서열은 문헌 [Burke et al., PLoS Pathog. 2015 Oct 20;11(10): e1005227]으로부터의 S4 도면에서 발견되는 임상 및 실험실-적합화된 HCMV로부터의 gB의 아미노산 서열 정렬에서 발견될 수 있다. 문헌 [Burke et al.]에 따라, NCBI의 RefSeq 데이터 베이스로부터 다운로드된 임상 및 실험실-적합화된 균주로부터의 60개의 HCMV gB 서열을 정렬하고, 클러스탈W2 및 ESPript 3.x를 사용하여 분석하였다. 동일한 잔기는 적색 배경 상에 백색 텍스트로 제시되고, 유사한 잔기는 버크(Burke) 등의 S4 도면에서 황색으로 강조되고, 상기 S4 도면 및 그의 설명은 그 전문이 본원에 참조로 포함된다.
도 10은 서열식별번호: 1-43 및 서열식별번호: 47-106에 대한 아미노산 서열을 도시한다.
도 11은 gB1666 및 야생형 gB (타운(Towne)) 면역화된 마우스 둘 다에서의 용량-의존성 IgG 반응을 도시한다. 그래프는 야생형 gB DNA로 면역화된 10마리 마우스 중 10마리, 및 gB1666 DNA로 면역화된 10마리 마우스 중 9마리가 검출가능한 항-gB IgG 역가를 생성하였다는 것을 보여준다. 평균 ± SD, LLOQ = 25.
도 12는 조작된 gB1666 (연회색, 구조 코드:P-GB-002)의 구조 모델이 야생형 HCMV gB (암회색, 구조 코드:P-GB-001)의 구조 모델과 중첩되어 있음을 도시한다. 새로운 구조는 분자의 막 원위 말단에서 추가의 잔기 437-448 및 478-482 및 막횡단 도메인에서 770-779의 모델링을 허용한다.
도 13은 융합전 gB를 추가로 안정화시킬 수 있는 pSB1666 배경 상의 추가의 돌연변이 조합의 예를 도시한다. M371, W506에서의 디술피드 결합은 도메인 II 및 III를 연결할 수 있다. N524, M684 및 F541, E681에서의 디술피드 결합은 도메인 IV 및 V를 연결할 수 있다. E686에서의 음으로 하전된 패치의 소수성 잔기로의 돌연변이는 융합전 입체형태에서 gB를 추가로 안정화시킬 수 있다. 각각의 도메인이 확인된다. 약어: 막 근위 영역 (MPR), 및 막횡단 도메인 (TMD).
도 14는 재조합 gB2459 단백질의 발현 및 정제를 입증하는 SDS-PAGE를 도시한다. pSB2459 발현 플라스미드를 Expi293F 세포 내로 일시적으로 형질감염시켰다. 세포 펠릿을 형질감염 68시간 후에 수거하고, 당단백질 생성물 gB2459를 25 mM HEPES pH 7.5, 250 mM NaCl, 0.02% n-도데실 β-D-말토시드 (DDM), 0.002% 콜레스테릴 헤미-숙시네이트 (CHS) 중에서 일련의 가용화, 친화도 및 크기 배제 크로마토그래피 공정을 통해 정제하였다. 본 도면은 환원 조건 하에 무염색 4-20% SDS-PAGE에 의해 분석된 정제된 단백질을 보여준다. 단백질 밴드의 스미어링은 gB2459가 고도로 글리코실화된 것과 일치한다. 레인 M: 단백질 마커; 레인 1: gB2457; 및 레인 2: gB2459.
도 15는 pSB1666 배경 상에 N524C 및 M684C 돌연변이를 함유하는 구축물 pSB2459를 도시한다. 단백질 생성물 gB2459를 임의의 융합 억제제의 존재 없이 친화성 태그를 통해 정제하였다. 2D 부류 평균화된 영상에서 관찰된 융합전 부류가 있다 (명백한 융합전 특색이 있는 2개의 부류가 숫자 1 및 2로 지시됨). 또한, 융합전 gB2459는 수일의 기간에 걸쳐 안정하다. gB2459의 샘플 용액을 4℃에서 저장하고, 샘플의 분취물을 제1일 및 제7일에 수득하여 음성 염색된 그리드를 제조하였다. 영상 데이터세트를 수집하고, 이들 2개의 그리드 상에서 처리하였다. 각각의 데이터세트에 대해, 융합전 및 융합후 2D 부류 내의 입자 집단을 계수하였다: 융합전 및 융합후 입체형태 사이의 비는 제1일에 샘플에 대해 5:1이고, 제7일에 3:1이었다.
도 16a - 16d는 가용성, 세제-무함유 gB 엑토도메인의 설계를 도시한다. 도 16a는 MPR, TM 및 CT 영역이 제거된 gB 엑토도메인 (1-707)을 나타낸다. 도 16b는 도메인 V에서 추가의 시스테인 돌연변이, 예를 들어 D703C 및 P704C로 안정화된 gB 엑토도메인을 보여준다.
도 16c는 C-말단 GCN4 삼량체화 모티프에 융합된 gB 엑토도메인을 보여준다. 도 16d는 C-말단 T4 피브리틴 폴드온 도메인에 융합된 gB 엑토도메인을 보여준다. 범례: 도메인 I (잔기 134-344) - 암회색 3D 부피 구조; 도메인 II (잔기 121-133 및 345-436) - 담회색 3D 부피 구조; 도메인 III (잔기 97-111, 475-539 및 640-648) - 상부 중심 담회색 수직 코일; 도메인 V (잔기 649-707) - 하부 내부 암회색 코일 (화살표 도 16b 참조); 및 직사각형 - 삼량체화 위치.
도 17은 20 mM HEPES pH 7.5, 250 mM NaCl 중에서 슈퍼로스(Superose) 6 인크리즈 10/300에 의해 분석된 정제된 gB 엑토도메인, gB2264-gB2269의 겔-여과 프로파일을 도시한다.
도 18a - 18b는 결합된 융합 억제제가 없는 재조합 gB2555의 음성 염색 EM으로부터의 음성 염색 EM 영상 (도 18a) 및 대표적인 2D 부류 평균 (도 18b)을 도시하며, 이는 단분산 gB 단백질이 억제제 및 세제의 부재 하에 융합전 형태의 gB에 대해 보다 많은 안정화 돌연변이를 부가하기 위한 프레임워크로서 사용하기에 적합함을 보여준다.
도 19a - 19b는 결합된 융합 억제제가 없는 재조합 gB2556의 음성 염색 EM으로부터의 음성 염색 EM 영상 (도 19a) 및 대표적인 2D 부류 평균 (도 19b)을 도시하며, 이는 단분산 gB 단백질이 억제제 및 세제의 부재 하에 융합전 형태의 gB에 대해 보다 많은 안정화 돌연변이를 부가하기 위한 프레임워크로서 사용하기에 적합함을 보여준다.
도 20a - 20b는 융합전 (도 20a) 및 융합후 (도 20b) 구조에서 HCMV (타운 균주) 도메인 V (잔기 I642-V697 (서열식별번호: 281))의 공간-충전 모델을 도시한다. 소수성 잔기는 표지된다.
도 21a - 21c는 (도 21a) 융합후 입체형태의 HCMV gB (타운 균주) 도메인 V (연회색) 및 그의 결합 포켓 (암회색)을 도시하고; (도 21b) 도메인 V가 없는 포켓의 공간-충전 모델이 제시되고; (도 21c) 특정 잔기가 표지된, 도 21a에서와 동일한 구조의 리본 표현이다.
도 2는 본 발명자들의 전자 극저온 현미경검사 구조로부터의 융합전 및 융합후 gB-Fab 복합체 모델에 포함된 당단백질 B 아미노산을 기재한다. 전자 극저온 현미경검사 밀도 맵에서 모델링될 수 있는 아미노산은 도메인 코드로 강조된다 (도메인 I (이탤릭체 단독, 즉 상부 서열 (융합전) 잔기 133-344; 하부 서열 (융합후) 잔기 133-344); 도메인 II (볼드체 및 밑줄표시, 즉 상부 서열 (융합전) 잔기 121-132 및 345-436; 하부 서열 (융합후) 잔기 121-132 및 345-439); 도메인 III (볼드체 단독, 즉 상부 서열 (융합전) 잔기 86-120 및 483-550; 하부 서열 (융합후) 잔기 86-120 및 474-550); 도메인 IV (이탤릭체 및 밑줄표시, 즉 상부 서열 (융합전) 잔기 551-641; 하부 서열 (융합후) 잔기 551-641); 도메인 V (이탤릭체 및 볼드체, 즉 상부 서열 (융합전) 잔기 642-724; 하부 서열 (융합후) 잔기 642-697); MPR (밑줄표시 단독, 즉 상부 서열 (융합전) 잔기 25-7507; 하부 서열 (융합후) 잔기 없음); TM (이탤릭체, 볼드체 및 밑줄표시, 즉 상부 서열 (융합전) 잔기 751-769; 하부 서열 (융합후) 잔기 없음)). 상부 및 하부 서열은 각각 융합전 및 융합후 구조 모델에 대한 것이다.
도 3a - 3b는 밀도 맵으로의 모델의 피팅을 도시한다. 억제제 화합물 안정화된 융합전 (도 3a) 및 융합후 gB 입체형태 (도 3b)의 모델을 밝은 회색 밀도 맵에 피팅한다. gB 성분은 암회색이고, SM5-1 fab 성분은 흑색이다. 융합전 구조 내의 TM 영역의 위치에 의해 결정된 바와 같은 바이러스 외피의 대략적인 위치는 흑색 수평선에 의해 표시된다.
도 4a - 4b는 2가지 입체형태의 gB의 구조의 비교를 도시한다. gB 안정화된 융합전 구조 (도 4a) 및 융합후 구조 (도 4b)는 도메인: I, II, III, IV, V, MPR 및 TM을 나타내는 하나의 프로토머와 함께 제시된다. 융합전 구조물의 상부로부터 연장되는 수직 흑색 파선은 덜 한정된 밀도 맵으로 인해 모델로부터 누락된 잔기를 나타낸다. 구조의 구축가능한 엑토도메인 부분의 전체 치수는 파선 직사각형에 의해 표시된다. 화살표는 각각의 입체형태의 도메인 III 내의 중심 3-나선 다발의 C-말단이 가리키는 방향을 나타낸다. 융합전 구조 상의 115Å 치수 (도 4a)는 엑토도메인의 모델링된 부분의 높이를 나타낸다.
도 5a - 5d: 도 5a는 융합전 gB 모델에서의 융합 억제제 화합물 N-{4-[({(1S)-1-[3,5-비스(트리플루오로메틸)페닐]에틸}카르바모티오일)아미노]페닐}-1,3-티아졸-4-카르복스아미드의 위치가 흑색으로 나타나 있음을 도시한다. 화합물의 화학 구조를 도 5d에 나타냈다. 도 5b: 화합물 주위의 전자 밀도의 근접도 (회색 투명 표면). 인근의 아미노산 잔기가 제시되고, 도메인이 표지된다. 도 5c: 화합물 주위의 상호작용 잔기가 제시된다.
도 6a - 6c는 막 융합 동안 gB의 구조적 재배열의 모델을 도시한다. FL (및 별표) - 융합 루프. DI - 도메인 1. DII - 도메인 2. DV - 도메인 5. TM - 막횡단 영역. 실선은 막: 숙주 세포 및 바이러스 막을 도시한다. 도 6a (융합전)는 융합전 입체형태를 도시하고; 도 6b (연장된 중간체)는 확장된 중간 입체형태를 도시하고; 도 6c (융합후)는 융합후 입체형태를 도시한다.
도 7a - 7b는 융합전 입체형태에서 gB를 안정화시키기 위한 예시적인 디술피드 결합 돌연변이를 도시한다. 디술피드 결합에 참여하는 잔기의 위치는 융합전 입체형태 (도 7a) 및 융합후 입체형태 (도 7b)의 회색 구체로서 도시된다.
도 8은 구조 생물정보학 단백질 데이터 은행에 대한 연구 협회 (RCSB PDB) 파일: 5CXF, 인간 시토메갈로바이러스 (균주 AD169)로부터, 인간 시토메갈로바이러스로부터의 당단백질 B의 세포외 도메인의 결정 구조, 2015-07-28에 기탁됨; DOI: 10.2210/pdb5CXF/ pdb로부터의 정보를 도시한다.
단위 셀:
도 9는 임상 및 실험실-적합화된 HCMV 균주로부터의 gB의 서열 (서열식별번호: 110 - 서열식별번호: 111)을 도시한다. 추가의 서열은 문헌 [Burke et al., PLoS Pathog. 2015 Oct 20;11(10): e1005227]으로부터의 S4 도면에서 발견되는 임상 및 실험실-적합화된 HCMV로부터의 gB의 아미노산 서열 정렬에서 발견될 수 있다. 문헌 [Burke et al.]에 따라, NCBI의 RefSeq 데이터 베이스로부터 다운로드된 임상 및 실험실-적합화된 균주로부터의 60개의 HCMV gB 서열을 정렬하고, 클러스탈W2 및 ESPript 3.x를 사용하여 분석하였다. 동일한 잔기는 적색 배경 상에 백색 텍스트로 제시되고, 유사한 잔기는 버크(Burke) 등의 S4 도면에서 황색으로 강조되고, 상기 S4 도면 및 그의 설명은 그 전문이 본원에 참조로 포함된다.
도 10은 서열식별번호: 1-43 및 서열식별번호: 47-106에 대한 아미노산 서열을 도시한다.
도 11은 gB1666 및 야생형 gB (타운(Towne)) 면역화된 마우스 둘 다에서의 용량-의존성 IgG 반응을 도시한다. 그래프는 야생형 gB DNA로 면역화된 10마리 마우스 중 10마리, 및 gB1666 DNA로 면역화된 10마리 마우스 중 9마리가 검출가능한 항-gB IgG 역가를 생성하였다는 것을 보여준다. 평균 ± SD, LLOQ = 25.
도 12는 조작된 gB1666 (연회색, 구조 코드:P-GB-002)의 구조 모델이 야생형 HCMV gB (암회색, 구조 코드:P-GB-001)의 구조 모델과 중첩되어 있음을 도시한다. 새로운 구조는 분자의 막 원위 말단에서 추가의 잔기 437-448 및 478-482 및 막횡단 도메인에서 770-779의 모델링을 허용한다.
도 13은 융합전 gB를 추가로 안정화시킬 수 있는 pSB1666 배경 상의 추가의 돌연변이 조합의 예를 도시한다. M371, W506에서의 디술피드 결합은 도메인 II 및 III를 연결할 수 있다. N524, M684 및 F541, E681에서의 디술피드 결합은 도메인 IV 및 V를 연결할 수 있다. E686에서의 음으로 하전된 패치의 소수성 잔기로의 돌연변이는 융합전 입체형태에서 gB를 추가로 안정화시킬 수 있다. 각각의 도메인이 확인된다. 약어: 막 근위 영역 (MPR), 및 막횡단 도메인 (TMD).
도 14는 재조합 gB2459 단백질의 발현 및 정제를 입증하는 SDS-PAGE를 도시한다. pSB2459 발현 플라스미드를 Expi293F 세포 내로 일시적으로 형질감염시켰다. 세포 펠릿을 형질감염 68시간 후에 수거하고, 당단백질 생성물 gB2459를 25 mM HEPES pH 7.5, 250 mM NaCl, 0.02% n-도데실 β-D-말토시드 (DDM), 0.002% 콜레스테릴 헤미-숙시네이트 (CHS) 중에서 일련의 가용화, 친화도 및 크기 배제 크로마토그래피 공정을 통해 정제하였다. 본 도면은 환원 조건 하에 무염색 4-20% SDS-PAGE에 의해 분석된 정제된 단백질을 보여준다. 단백질 밴드의 스미어링은 gB2459가 고도로 글리코실화된 것과 일치한다. 레인 M: 단백질 마커; 레인 1: gB2457; 및 레인 2: gB2459.
도 15는 pSB1666 배경 상에 N524C 및 M684C 돌연변이를 함유하는 구축물 pSB2459를 도시한다. 단백질 생성물 gB2459를 임의의 융합 억제제의 존재 없이 친화성 태그를 통해 정제하였다. 2D 부류 평균화된 영상에서 관찰된 융합전 부류가 있다 (명백한 융합전 특색이 있는 2개의 부류가 숫자 1 및 2로 지시됨). 또한, 융합전 gB2459는 수일의 기간에 걸쳐 안정하다. gB2459의 샘플 용액을 4℃에서 저장하고, 샘플의 분취물을 제1일 및 제7일에 수득하여 음성 염색된 그리드를 제조하였다. 영상 데이터세트를 수집하고, 이들 2개의 그리드 상에서 처리하였다. 각각의 데이터세트에 대해, 융합전 및 융합후 2D 부류 내의 입자 집단을 계수하였다: 융합전 및 융합후 입체형태 사이의 비는 제1일에 샘플에 대해 5:1이고, 제7일에 3:1이었다.
도 16a - 16d는 가용성, 세제-무함유 gB 엑토도메인의 설계를 도시한다. 도 16a는 MPR, TM 및 CT 영역이 제거된 gB 엑토도메인 (1-707)을 나타낸다. 도 16b는 도메인 V에서 추가의 시스테인 돌연변이, 예를 들어 D703C 및 P704C로 안정화된 gB 엑토도메인을 보여준다.
도 16c는 C-말단 GCN4 삼량체화 모티프에 융합된 gB 엑토도메인을 보여준다. 도 16d는 C-말단 T4 피브리틴 폴드온 도메인에 융합된 gB 엑토도메인을 보여준다. 범례: 도메인 I (잔기 134-344) - 암회색 3D 부피 구조; 도메인 II (잔기 121-133 및 345-436) - 담회색 3D 부피 구조; 도메인 III (잔기 97-111, 475-539 및 640-648) - 상부 중심 담회색 수직 코일; 도메인 V (잔기 649-707) - 하부 내부 암회색 코일 (화살표 도 16b 참조); 및 직사각형 - 삼량체화 위치.
도 17은 20 mM HEPES pH 7.5, 250 mM NaCl 중에서 슈퍼로스(Superose) 6 인크리즈 10/300에 의해 분석된 정제된 gB 엑토도메인, gB2264-gB2269의 겔-여과 프로파일을 도시한다.
도 18a - 18b는 결합된 융합 억제제가 없는 재조합 gB2555의 음성 염색 EM으로부터의 음성 염색 EM 영상 (도 18a) 및 대표적인 2D 부류 평균 (도 18b)을 도시하며, 이는 단분산 gB 단백질이 억제제 및 세제의 부재 하에 융합전 형태의 gB에 대해 보다 많은 안정화 돌연변이를 부가하기 위한 프레임워크로서 사용하기에 적합함을 보여준다.
도 19a - 19b는 결합된 융합 억제제가 없는 재조합 gB2556의 음성 염색 EM으로부터의 음성 염색 EM 영상 (도 19a) 및 대표적인 2D 부류 평균 (도 19b)을 도시하며, 이는 단분산 gB 단백질이 억제제 및 세제의 부재 하에 융합전 형태의 gB에 대해 보다 많은 안정화 돌연변이를 부가하기 위한 프레임워크로서 사용하기에 적합함을 보여준다.
도 20a - 20b는 융합전 (도 20a) 및 융합후 (도 20b) 구조에서 HCMV (타운 균주) 도메인 V (잔기 I642-V697 (서열식별번호: 281))의 공간-충전 모델을 도시한다. 소수성 잔기는 표지된다.
도 21a - 21c는 (도 21a) 융합후 입체형태의 HCMV gB (타운 균주) 도메인 V (연회색) 및 그의 결합 포켓 (암회색)을 도시하고; (도 21b) 도메인 V가 없는 포켓의 공간-충전 모델이 제시되고; (도 21c) 특정 잔기가 표지된, 도 21a에서와 동일한 구조의 리본 표현이다.
서열 식별자
서열식별번호: 1은 천연 HCMV gB (균주 타운)로부터 유래된 아미노산 서열을 제시한다.
서열식별번호: 2는 하기 돌연변이: Q98C, G271C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 3은 하기 돌연변이: Q98C, I653C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 4는 하기 돌연변이: G99C, A267C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 5는 하기 돌연변이: T100C, A267C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 6은 하기 돌연변이: T100C, S269C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 7은 하기 돌연변이: T100C, L651C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 8은 하기 돌연변이: D217C, F584C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 9는 하기 돌연변이: Y218C, A585C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 10은 하기 돌연변이: S219C, D654C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 11은 하기 돌연변이: N220C, D652C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 12는 하기 돌연변이: T221C, D652C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 13은 하기 돌연변이: W240C, G718C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 14는 하기 돌연변이: Y242C, K710C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 15는 하기 돌연변이: Y242C, D714C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 16은 하기 돌연변이: S269C, I653C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 17은 하기 돌연변이: G271C, P614C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 18은 하기 돌연변이: S367C, L499C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 19는 하기 돌연변이: T372C, W506C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 20은 하기 돌연변이: F541C, Q669C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 21은 하기 돌연변이: L548C, A650C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 22는 하기 돌연변이: A549C, I653C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 23은 하기 돌연변이: S550C, D652C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 24는 하기 돌연변이: G604C, F661C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 25는 하기 돌연변이: N605C, E665C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 26은 하기 돌연변이: R607C, S675C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 27은 하기 돌연변이: T608C, D679C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 28은 하기 돌연변이: E609C, F678C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 29는 하기 돌연변이: R673C, S674C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 30은 하기 돌연변이: N676C, V677C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 31은 하기 돌연변이: L680C, E681C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 32는 하기 돌연변이: I683C, M684C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 33은 하기 돌연변이: F687C, N688C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 34는 하기 돌연변이: Y690C, K691C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 35는 하기 돌연변이: K695C, K724C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 36은 하기 돌연변이: T746C, F747C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 37은 하기 돌연변이: K749C, N750C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 38은 하기 돌연변이: K670L이 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 39는 하기 돌연변이: K670F가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 40은 하기 돌연변이: R673L이 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 41은 하기 돌연변이: R673F가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 42는 하기 돌연변이: K691L이 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 43은 하기 돌연변이: K691F가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 44는 발현되었을 때 융합후 입체형태로 폴딩되는 천연 HCMV gB (AD169; PDB: 5CXF)에 대한 아미노산 서열을 제시한다.
서열식별번호: 45는 발현되었을 때 융합후 입체형태로 폴딩되는 HCMV gB 변이체 (gB705)에 대한 아미노산 서열을 제시한다.
서열식별번호: 46은 발현되었을 때 융합후 입체형태로 폴딩되는 천연 HCMV gB (메를린(Merlin) 균주)에 대한 아미노산 서열을 제시한다.
서열식별번호: 47은 하기 돌연변이: M96C 및 D660C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 48은 하기 돌연변이: Q98C 및 N658C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 49는 하기 돌연변이: T100C 및 R258C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 50은 하기 돌연변이: T100C 및 L656C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 51은 하기 돌연변이: T100C 및 N658C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 52는 하기 돌연변이: I117C 및 T406C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 53은 하기 돌연변이: I117C 및 S407C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 54는 하기 돌연변이: Y153C 및 L712C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 55는 하기 돌연변이: L162C 및 M716C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 56은 하기 돌연변이: D217C 및 S587C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 57은 하기 돌연변이: D217C 및 Y589C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 58은 하기 돌연변이: S219C 및 F584C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 59는 하기 돌연변이: S219C 및 A585C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 60은 하기 돌연변이: S219C 및 N586C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 61은 하기 돌연변이: N220C 및 T659C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 62는 하기 돌연변이: S223C 및 T659C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 63은 하기 돌연변이: W240C 및 A732A가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 64는 하기 돌연변이: W240C 및 G735C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 65는 하기 돌연변이: Y242C 및 V728C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 66은 하기 돌연변이: Y242C 및 G731C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 67은 하기 돌연변이: R258C 및 L656C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 68은 하기 돌연변이: S269C 및 L656C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 69는 하기 돌연변이: S269C 및 N658C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 70은 하기 돌연변이: D272C 및 P614C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 71은 하기 돌연변이: V273C 및 V629C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 72는 하기 돌연변이: W349C 및 A650C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 73은 하기 돌연변이: S367C 및 A500C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 74는 하기 돌연변이: S367C 및 A503C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 75는 하기 돌연변이: K370C 및 Q501C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 76은 하기 돌연변이: K522C 및 I683C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 77은 하기 돌연변이: I523C 및 I683C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 78은 하기 돌연변이: I523C 및 M684C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 79는 하기 돌연변이: N524C 및 M684C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 80은 하기 돌연변이: P525C 및 E681C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 81은 하기 돌연변이: R540C 및 L680C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 82는 하기 돌연변이: F541C 및 L680C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 83은 하기 돌연변이: L548C 및 P655C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 84는 하기 돌연변이: A549C 및 N658C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 85는 하기 돌연변이: S550C 및 P655C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 86은 하기 돌연변이: S550C 및 E657C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 87은 하기 돌연변이: Q591C 및 S668C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 88은 하기 돌연변이: L603C 및 Y667C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 89는 하기 돌연변이: G604C 및 L672C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 90은 하기 돌연변이: R607C 및 N688C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 91은 하기 돌연변이: T608C 및 Q692C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 92는 하기 돌연변이: E609C 및 K691C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 93은 하기 돌연변이: E610C 및 S674C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 94는 하기 돌연변이: E610C 및 S675C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 95는 하기 돌연변이: Q612C 및 V663C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 96은 하기 돌연변이: V737C 및 F755C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 97은 하기 돌연변이: V741C 및 A754C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 98은 하기 돌연변이: V741C 및 F755C가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 99는 하기 돌연변이: D679S가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 100은 하기 돌연변이: D679N이 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 101은 하기 돌연변이: E682S가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 102는 하기 돌연변이: E682Q가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 103은 하기 돌연변이: E686S가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 104는 하기 돌연변이: E686Q가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 105는 하기 돌연변이: N118P가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 106은 하기 돌연변이: D646P가 포함된 서열식별번호: 1의 아미노산 서열을 제시한다.
서열식별번호: 107은 도 8로부터의 >5CXF:A|PDBID|쇄|서열에 대한 아미노산 서열을 제시한다.
서열식별번호: 108은 도 8로부터의 >5CXF:B|PDBID|쇄|서열에 대한 아미노산 서열을 제시한다.
서열식별번호: 109는 도 8로부터의 >5CXF:C|PDBID|쇄|서열에 대한 아미노산 서열을 제시한다.
서열식별번호: 110은 HAN13 gi|242345614|gb|GQ221973.1|:81988-84705 인간 헤르페스바이러스 5 균주 HAN13, 완전 게놈 역 상보체로부터의 gB 폴리펩티드에 대한 아미노산 서열을 제시하며, 이는 도 9에 대한 설명에서 언급된다.
서열식별번호: 111은 VR1814 gi|270355759|gb|GU179289.1|:81925-84642 인간 헤르페스바이러스 5 균주 VR1814, 완전 게놈 역 상보체로부터의 gB 폴리펩티드에 대한 아미노산 서열을 제시하며, 이는 도 9에 대한 설명에서 언급된다.
서열식별번호: 112-140은 도 9에 기재된 다양한 CMV gB 균주로부터의 gB 폴리펩티드에 대한 아미노산 서열을 제시한다.
서열식별번호: 141 - 서열식별번호: 210은 HCMV로부터 유래하는 폴리펩티드, 예컨대 예를 들어 gH, gL, UL128, UL130, UL131, gB 또는 pp65를 코딩하는 폴리뉴클레오티드 서열을 제시한다.
서열식별번호: 211 - 서열식별번호: 223은 HCMV로부터 유래하는 폴리펩티드, 예컨대 예를 들어 gH, gL, UL128, UL130, UL131, gB 또는 pp65에 대한 아미노산 서열을 제시한다.
서열식별번호: 224는 HCMV로부터 유래하는 폴리펩티드에 대한 아미노산 서열을 제시한다.
서열식별번호: 225 - 서열식별번호: 254는 HCMV로부터 유래하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 제시한다.
서열식별번호: 255 - 서열식별번호: 259는 표 9에 제시된 다양한 gB 엑토도메인 단백질의 C-말단 융합 서열을 제시한다.
서열식별번호: 260 - 서열식별번호: 280은 다양한 융합 억제 펩티드의 아미노산 서열을 제시한다.
서열식별번호: 281은 gB 폴리펩티드 (타운)의 도메인 V의 아미노산 서열을 제시한다.
서열식별번호: 282 - 서열식별번호: 284는 도 20a-20b에 나타낸 바와 같은 HCMV gB 단백질의 상호작용 영역의 아미노산 서열을 제시한다.
서열식별번호: 285 - 서열식별번호: 289는 (서열식별번호: 1의 R258-K260, R327-D329, 및 W349-E350에 추가로) HCMV gB 단백질의 도메인 V에 대한 결합 포켓을 형성하는 아미노산 잔기를 제시한다.
상세한 설명
본원에 기재된 바와 같이, 본 발명자들은 융합후 입체형태와 상이하고 본 발명자들이 융합전 입체형태로 지칭하는 입체형태의 HCMV 당단백질 B (gB) 폴리펩티드의 3차원 구조를 밝혔다. 융합전 입체형태의 폴리펩티드를 안정화시키는 돌연변이가 또한 발견되었다. 상기 구조를 사용하여 선행 HCMV gB-기반 면역원으로 달성된 것에 비해 더 큰 HCMV 중화 항체 반응을 생성할 수 있다. 본원에 기재된 폴리펩티드, 및 폴리펩티드를 코딩하는 핵산은 다른 용도들 보다도, 예를 들어 HCMV에 대한 백신에서의 잠재적 면역원으로서, 그리고 진단 도구로서 사용될 수 있다.
본 발명자들은 특히 융합전 입체형태에서 안정화된 gB 항원의 생산 및 후속 정제를 크게 용이하게 하고/거나; 융합전 입체형태에서 gB 폴리펩티드의 생산 효율을 유의하게 개선시키고/거나; 야생형 gB 폴리펩티드와 비교하여 gB 폴리펩티드의 항원성을 변경시키고/거나; 융합전 gB에 대한 집중 면역 반응을 용이하게 하고/거나; gB의 중화 에피토프의 입체 폐쇄를 감소시키고/거나 제거할 수 있는, 시토메갈로바이러스 (CMV) gB 폴리펩티드에 도입될 수 있는 돌연변이를 추가로 발견하였다.
융합이 바이러스 감염성의 핵심 단계이기 때문에, gB 단백질 내의 약물표적화가능한 영역의 확인은 HCMV에 의한 바이러스 감염을 특이적으로 억제할 수 있는 치료제를 추가로 개발하게 한다.
A. 천연 HCMV gB
천연 HCMV gB는 N- 및 O-연결 부위에서의 글리코실화 및 편재성 세포 엔도프로테아제에 의한 아미노- 및 카르복시-말단 단편으로의 절단을 포함한 광범위한 번역후 변형을 겪은 906 또는 907개 아미노산 폴리펩티드 (CMV의 균주에 따름)로서 합성된다. gB, gp116 및 gp55의 N- 및 C-말단 단편은 각각 디술피드 결합에 의해 공유 연결되고, 성숙한 글리코실화된 gB는 삼량체 배위를 취한다. gB 폴리펩티드는 큰 엑토도메인 (이는 gp116 및 gp55의 엑토도메인으로 절단됨), 막횡단 도메인 (TM), 및 바이러스내 (또는 세포질) 도메인 (세포도메인)을 함유한다.
다양한 균주로부터의 천연 HCMV gB가 공지되어 있다. 예를 들어, 임상 및 실험실-적합화된 균주로부터의 적어도 60개의 HCMV gB 서열은 NCBI의 RefSeq 데이터베이스로부터 이용가능하다. 도 9를 또한 참조한다.
따라서, 본원에 사용된 용어 "CMV gB" 폴리펩티드 또는 "HCMV gB" 폴리펩티드는 임의의 인간 HCMV 균주 (타운 균주에 제한되지 않음) 유래의 천연 HCMV gB 폴리펩티드로 이해되어야 한다. 실제 잔기 위치 번호는 실제 서열 정렬에 따라 다른 인간 CMV 균주로부터의 gB에 대해 조정이 필요할 수 있다.
HCMV gB는 HCMV 게놈의 UL55 유전자에 의해 코딩된다. 이는 HCMV 바이러스 막과 숙주 세포 막의 융합을 매개하는 외피 당단백질이다. 단백질은 융합전 형태로부터 융합후 형태로의 일련의 입체형태적 변화를 겪는다. 융합후 형태의 gB의 결정 구조가 이용가능하고 (PDB 수탁 코드 5CXF), 융합전 입체형태가 하기 기재된다.
B. 입체형태
HCMV gB 융합후 입체형태는 숙주 세포 막과 바이러스 외피의 융합에 후속하여 HCMV gB에 의해 채택되는 구조적 입체형태를 지칭한다. 천연 HCMV gB는 또한 예를 들어 열에 대한 노출, 막으로부터의 추출, 엑토도메인으로서의 발현 또는 저장과 같은 스트레스 조건하에서의 융합 사건의 맥락 외에서 융합후 입체형태를 취할 수 있다. 보다 구체적으로, gB 융합후 입체형태는, 예를 들어 문헌 [Burke et al., Crystal Structure of the Human Cytomegalovirus Glycoprotein B. PLoS Pathog. 2015 Oct 20;11(10): e1005227]에 기재되어 있다. 또한, 구조 생물정보학 단백질 데이터 은행에 대한 연구 협회 (RCSB PDB): 5CXF, 인간 시토메갈로바이러스 (균주 AD169)로부터, 인간 시토메갈로바이러스로부터의 당단백질 B의 세포외 도메인의 결정 구조, 2015-07-28에 기탁됨; DOI: 10.2210/pdb5CXF/pdb; 및 도 9를 참조한다. 발현될 때 융합후 입체형태로 폴딩될 수 있는 단백질의 서열은 서열식별번호: 44로서 제공된다. 발현될 때 융합후 입체형태로 폴딩되는 단백질의 또 다른 예는 서열식별번호: 45로서 제공된다. 융합후 입체형태는 약 165Å 높이 및 65Å 폭이다.
본원에 사용된 "융합전 입체형태"는 적어도 분자 치수 또는 3차원 좌표의 관점에서 HCMV gB 융합후 입체형태와 상이한, 폴리펩티드에 의해 채택된 구조적 입체형태를 지칭한다. 융합전 입체형태는 gB의 융합후 입체형태로의 전이로 이어지는 융합생성 사건의 촉발 전에 HCMV gB에 의해 채택된 구조적 입체형태를 지칭한다. HCMV gB를 안정한 융합전 입체형태로 단리하는 것은 시토메갈로바이러스 감염의 중요한 공중 보건 문제를 해결하기 위해 개선된 백신 및 면역원성 조성물의 개발을 통지하고 지시하는 데 유용할 수 있다. 일부 실시양태에서, 융합전 입체형태는 융합전-특이적 항체에 결합할 수 있는 입체형태를 포함한다. 일부 실시양태에서, 융합전 입체형태는 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1A에 제시된 좌표를 특징으로 하는 입체형태를 포함한다. 일부 실시양태에서, 폴리펩티드는 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1A의 구조 좌표에 의해 기재된 백본 원자 상에 중첩될 때 보존된 잔기 백본 원자의 제곱 평균 제곱근 편차 (RMSD)를 포함하는 구조 좌표를 특징으로 한다. 일부 실시양태에서, 융합전 입체형태는 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1B에 제시된 좌표를 특징으로 하는 입체형태를 포함한다. 일부 실시양태에서, 폴리펩티드는 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1B의 구조 좌표에 의해 기재된 백본 원자 상에 중첩될 때 보존된 잔기 백본 원자의 제곱 평균 제곱근 편차 (RMSD)를 포함하는 구조 좌표를 특징으로 한다. 일부 실시양태에서, HCMV gB 융합전 입체형태를 갖는 폴리펩티드는 삼량체의 3-폴드 축 상에 중심을 두고 각각의 프로토머의 잔기 L479 내지 K522를 포함하는 삼량체 나선 다발을 포함하는 폴리펩티드를 지칭하며, 여기서 3-폴드 축 (도 4a & 4b에서 화살표로 제시됨)을 따른 N-말단에서 C-말단으로의 다발의 방향은 삼량체의 각각의 도메인 I의 팁 근처의 융합 루프 내에 있는 각각의 프로토머의 잔기 W240에 의해 한정된 평면에 의해 교차되는 3-폴드 축 상의 지점을 향한다. 일부 실시양태에서, 나선 다발은 서열식별번호: 1의 넘버링에 따른 L479와 K522 사이의 잔기를 포함한다.
C. 야생형 HCMV gB의 돌연변이체
본 발명은 상응하는 야생형 HCMV gB의 아미노산 서열에 비해 아미노산 돌연변이를 포함하는 폴리펩티드를 포함한다. 아미노산 돌연변이는 야생형 HCMV gB에 비해 아미노산 치환, 결실 또는 부가를 포함한다. 따라서, 폴리펩티드는 야생형 HCMV gB의 돌연변이체이다.
일부 실시양태에서, 폴리펩티드는 특정의 유익한 특징, 예컨대 면역원성을 보유한다. 일부 실시양태에서, 폴리펩티드는 상응하는 야생형 HCMV gB와 비교하여 융합전 입체형태에서 증가된 면역원성 특성 또는 개선된 안정성을 보유한다. 안정성은 융합전으로부터 융합후로의 HCMV gB 입체형태의 전이가 방해 또는 방지되는 정도를 지칭한다. 또 다른 실시양태에서, 본 개시내용은 융합전 입체형태에서 개선된 안정성을 또한 발생시킬 수 있는, 본원에 기재된 바와 같은 1개 이상의 도입된 돌연변이를 나타내는 폴리펩티드를 제공한다. HCMV gB에 도입된 아미노산 돌연변이는 아미노산 치환, 결실 또는 부가를 포함한다. 일부 실시양태에서, 돌연변이체의 아미노산 서열에서의 유일한 돌연변이는 야생형 HCMV gB 대비 아미노산 치환이다.
폴리펩티드 입체형태를 안정화시키는 몇 가지 양식은, 천연 HCMV gB와 비교하여 디술피드 결합을 도입하고, 정전기적 돌연변이를 도입하고, 공동을 채우고, 잔기의 패킹을 변경하고, N-연결된 글리코실화 부위를 도입하는 아미노산 치환, 및 그의 조합을 포함한다.
한 측면에서, 본 발명은 융합후 입체형태가 아닌 입체형태를 나타내는 폴리펩티드에 관한 것이다. 즉, 폴리펩티드는 상기 기재된 바와 같은 융합전 입체형태를 나타내고, 융합후 입체형태를 나타내지 않는다. 예를 들어, 도 3b에 도시된 융합후 입체형태와 비교한 도 3a에 도시된 융합전 입체형태; 도 4b에 도시된 융합후 입체형태와 비교한 도 4a에 도시된 융합전 입체형태; 및 도 6c에 도시된 융합후 입체형태와 비교한 도 6a에 도시된 융합전 입체형태를 참조한다. 일부 실시양태에서, 폴리펩티드는 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1A의 구조 좌표에 의해 기재된 백본 원자 상에 중첩된 경우에 보존된 잔기 백본 원자의 제곱 평균 제곱근 편차 (RMSD)를 포함하는 구조 좌표를 특징으로 한다. 일부 실시양태에서, 폴리펩티드는 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1B의 구조 좌표에 의해 기재된 백본 원자 상에 중첩된 경우에 보존된 잔기 백본 원자의 제곱 평균 제곱근 편차 (RMSD)를 포함하는 구조 좌표를 특징으로 한다.
일부 실시양태에서, 폴리펩티드는 단리되며, 즉 융합후 입체형태를 갖는 HCMV gB 폴리펩티드로부터 분리된다. 따라서, 폴리펩티드는 예를 들어 융합후 입체형태의 HCMV gB 폴리펩티드로부터 적어도 80% 단리되거나, 적어도 90%, 95%, 98%, 99%, 또는 심지어 99.9% 단리될 수 있다. 한 측면에서, 본 발명은 HCMV gB 융합전-특이적 항체에 특이적으로 결합하는 폴리펩티드에 관한 것이다.
특정한 입체형태의 폴리펩티드의 균질 집단은 폴리펩티드의 입체형태 상태를 변경시키지 않는 변이 (예컨대 폴리펩티드 변형 변이, 예를 들어 글리코실화 상태)를 포함할 수 있는 것으로 이해될 것이다. 여러 실시양태에서, 폴리펩티드의 집단은 시간 경과에 따라 균질하게 유지된다. 예를 들어, 일부 실시양태에서, 폴리펩티드는 수용액에 용해될 때 적어도 12시간, 예컨대 적어도 24시간, 적어도 48시간, 적어도 1주, 적어도 2주, 또는 그 초과 동안 융합전 입체형태에서 안정화된 폴리펩티드의 집단을 형성한다.
이론에 얽매이지는 않지만, 본원에 개시된 폴리펩티드는 HCMV gB 폴리펩티드의 안정화된 융합전 입체형태를 용이하게 하는 것으로 여겨진다. 폴리펩티드는 상응하는 천연 HCMV gB 폴리펩티드와 비교하여 적어도 1개의 돌연변이를 포함한다. 관련 기술분야의 통상의 기술자는 폴리펩티드가 포유동물에서 CMV에 대한 면역 반응을 도출하는 데 유용하다는 것을 이해할 것이다.
천연 HCMV gB는 HCMV 진입 당단백질 사이에서 보존되며, 모든 세포 유형으로의 진입에 요구된다. HCMV gB 서열의 실질적인 보존의 관점에서, 상이한 천연 HCMV gB 서열 사이의 아미노산 위치를 비교하여 상이한 HCMV 균주 사이의 상응하는 HCMV gB 아미노산 위치를 확인할 수 있다. 따라서, 균주에 걸친 천연 HCMV gB 서열의 보존은 HCMV gB 폴리펩티드 중 특정 위치에서의 아미노산의 비교를 위한 참조 HCMV gB 서열의 사용을 허용한다. 따라서, 달리 명백하게 나타내지 않는 한, 본원에 제공되는 폴리펩티드 아미노산 위치는 서열식별번호: 1에 제시된 HCMV gB 폴리펩티드의 참조 서열을 지칭한다.
그러나, 상이한 천연 HCMV gB 서열은 서열식별번호: 1과 상이한 넘버링 시스템을 가질 수 있으며, 예를 들어 타운 이외의 균주로부터 유래된 천연 HCMV gB 서열에서 서열식별번호: 1과 비교하여 부가 또는 제거된 추가의 아미노산 잔기가 존재할 수 있음을 주목해야 한다. 이에 따라, 특정 아미노산 잔기가 그의 번호로 지칭되는 경우, 상기 기재는 주어진 아미노산 서열의 시작부로부터 계수하였을 때 정확하게 그 번호지정된 위치에 위치하는 아미노산으로만 제한되는 것이 아니라, 임의의 및 모든 HCMV gB 서열에서의 등가의 또는 상응하는 아미노산 잔기가 그 잔기가 동일한 정확한 번호지정된 위치에 있지 않더라도, 예를 들어 HCMV 서열이 서열식별번호: 1보다 더 짧거나 (예를 들어, 단편) 또는 더 길거나, 또는 서열식별번호: 1과 비교하여 삽입 또는 결실을 가지더라도 의도되는 것으로 이해되어야 한다.
일부 실시양태에서, 폴리펩티드는 전장이며, 여기서 폴리펩티드는 성숙 전장 야생형 HCMV gB와 동일한 수의 아미노산 잔기를 포함한다. 일부 실시양태에서, 폴리펩티드는 단편이며, 여기서 폴리펩티드는 성숙 전장 야생형 HCMV gB로서 아미노산 잔기의 총 수 미만을 포함한다. 일부 실시양태에서, 말단절단된 gB 폴리펩티드는 엑토도메인 서열만을 포함한다.
C.1. 시스테인 (C) 치환
일부 실시양태에서, 폴리펩티드는 천연 HCMV gB와 비교하여 도입되는 시스테인 치환을 포함한다. 일부 실시양태에서, 폴리펩티드는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 시스테인 치환 중 어느 하나를 포함한다. 이론 또는 메카니즘에 얽매이지는 않지만, 본원에 기재된 시스테인 치환은 HCMV gB 융합후 입체형태가 아닌 입체형태에서 폴리펩티드의 안정성을 용이하게 하는 것으로 여겨진다. 도입된 시스테인 치환은 단백질 조작에 의해, 예를 들어 디술피드 결합을 형성하는 1개 이상의 치환된 시스테인 잔기를 포함시킴으로써 도입될 수 있다. 여러 실시양태에서, 시스테인의 아미노산 위치는 HCMV gB의 융합전 입체형태에서 디술피드 결합의 형성을 위해 충분히 가까운 거리 내에 있으며, 융합후 입체형태에서는 그렇지 않다.
디술피드 결합을 형성하는 시스테인 잔기는 2개 이상의 아미노산 치환에 의해 천연 HCMV gB 서열로 도입될 수 있다. 예를 들어, 일부 실시양태에서, 2개의 시스테인 잔기가 천연 HCMV gB 서열에 도입되어 디술피드 결합을 형성한다.
일부 실시양태에서, 폴리펩티드는 융합전 입체형태에서 서로 가깝고 융합후 입체형태에서 더 먼 한 쌍의 아미노산 위치에 도입된 시스테인 사이의 디술피드 결합에 의해 융합전 입체형태에서 안정화된 재조합 HCMV gB를 포함한다.
천연 HCMV gB와 비교하여 예시적인 시스테인 치환은 그의 넘버링이 서열식별번호: 1의 넘버링에 기초하는 표 2에서 선택되는 임의의 돌연변이를 포함한다.
표 2. 디술피드 결합 안정화를 위한 예시적인 시스테인 쌍
일부 실시양태에서, 폴리펩티드는 표 2의 열 (ii)의 행 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 또는 36 중 하나 이상에 열거된 위치 중 어느 하나에서 1개 이상 (예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 시스테인 치환을 포함하며, 여기서 생성된 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
일부 실시양태에서, 폴리펩티드는 표 2의 열 (ii)의 행 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87 또는 88 중 하나 이상에 열거된 위치 중 어느 하나에서 1개 이상 (예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 시스테인 치환을 포함하며, 여기서 생성된 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 98 및 653 (표 2의 열 (ii), 행 2에 열거됨)에서 시스테인 치환을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 100 및 269 (표 2의 열 (ii), 행 5에 열거됨)에서 시스테인 치환을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 217 및 584 (표 2의 열 (ii), 행 7에 열거됨)에서 시스테인 치환을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 242 및 710 (표 2의 열 (ii), 행 13에 열거됨)에서 시스테인 치환을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 242 및 714 (표 2의 열 (ii), 행 14에 열거됨)에서 시스테인 치환을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 367 및 499 (표 2의 열 (ii), 행 17에 열거됨)에서 시스테인 치환을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 372 및 506 (표 2의 열 (ii), 행 18에 열거됨)에서 시스테인 치환을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 550 및 652 (표 2의 열 (ii), 행 22에 열거됨)에서 시스테인 치환을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 608 및 679 (표 2의 열 (ii), 행 26에 열거됨)에서 시스테인 치환을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 695 및 724 (표 2의 열 (ii), 행 34에 열거됨)에서 시스테인 치환을 포함한다.
일부 실시양태에서, 폴리펩티드는 표 2의 열 (ii)의 행 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87 및 88 중 하나 이상에 열거된 위치 쌍 중 어느 하나에서 치환된 시스테인 잔기의 쌍 사이에 1개 이상 (예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 디술피드 결합을 포함한다.
바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 98 및 653 (표 2의 열 (ii), 행 2에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 100 및 269 (표 2의 열 (ii), 행 5에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 217 및 584 (표 2의 열 (ii), 행 7에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 242 및 710 (표 2의 열 (ii), 행 13에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 242 및 714 (표 2의 열 (ii), 행 14에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 367 및 499 (표 2의 열 (ii), 행 17에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 372 및 506 (표 2의 열 (ii), 행 18에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 550 및 652 (표 2의 열 (ii), 행 22에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 608 및 679 (표 2의 열 (ii), 행 26에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 695 및 724 (표 2의 열 (ii), 행 34에 열거됨)에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다.
추가 실시양태에서, 폴리펩티드는 표 2의 열 (iii)의 행 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 또는 36 중 하나 이상에 열거된 위치 쌍 중 어느 하나에서 시스테인 아미노산 치환에 의해 도입된 시스테인 잔기 쌍 사이에 1개 이상 (예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 디술피드 결합을 포함하며, 여기서 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
추가 실시양태에서, 폴리펩티드는 표 2의 열 (iii)의 행 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 70, 71 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87 또는 88 중 하나 이상에 열거된 위치 쌍 중 어느 하나에서 시스테인 아미노산 치환에 의해 도입된 시스테인 잔기 쌍 사이에 1개 이상 (예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 디술피드 결합을 포함하며, 여기서 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 Q98C 및 I653C (표 2의 열 (iii), 행 2에 열거됨)에서 시스테인 치환을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 T100C 및 S269C (표 2의 열 (iii), 행 5에 열거됨)에서 시스테인 치환을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 D217C 및 F584C (표 2의 열 (iii), 행 7에 열거됨)에서 시스테인 치환을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 Y242C 및 K710C (표 2의 열 (iii), 행 13에 열거됨)에서 시스테인 치환을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 Y242C 및 D714C (표 2의 열 (iii), 행 14에 열거됨)에서 시스테인 치환을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 S367C 및 L499C (표 2의 열 (iii), 행 17에 열거됨)에서 시스테인 치환을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 T372C 및 W506C (표 2의 열 (iii), 행 18에 열거됨)에서 시스테인 치환을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 S550C 및 D652C (표 2의 열 (iii), 행 22에 열거됨)에서 시스테인 치환을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 T608C 및 D679C (표 2의 열 (iii), 행 26에 열거됨)에서 시스테인 치환을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 K695C 및 K724C (표 2의 열 (iii), 행 34에 열거됨)에서 시스테인 치환을 포함한다.
바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 96 및 660에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 98 및 658에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 100 및 258에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 100 및 656에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 100 및 658에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 117 및 406에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 117 및 407에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 153 및 712에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 162 및 716에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 217 및 587에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 217 및 589에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 219 및 584에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 219 및 585에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 219 및 586에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 220 및 659에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 223 및 659에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 240 및 732에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 240 및 735에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 242 및 728에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 242 및 731에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 258 및 656에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 269 및 656에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 269 및 658에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 272 및 614에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 273 및 629에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 349 및 650에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 367 및 500에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 367 및 503에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 370 및 501에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 522 및 683에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 523 및 683에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 523 및 684에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 524 및 684에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 525 및 681에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 540 및 680에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 541 및 680에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 548 및 655에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 549 및 658에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 550 및 655에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 550 및 657에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 591 및 668에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 603 및 667에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 604 및 672에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 607 및 688에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 608 및 692에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 609 및 691에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 610 및 674에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 610 및 675에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 612 및 663에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 737 및 755에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 741 및 754에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 야생형 HCMV gB의 아미노산 서열에 비해 서열식별번호: 1의 넘버링에 따른 위치 741 및 755에서 치환된 한 쌍의 시스테인 잔기 사이에 디술피드 결합을 포함한다.
일부 실시양태에서, 폴리펩티드는 표 2에 열거된 시스테인 잔기 사이의 디술피드 결합 중 2개 이상의 조합을 포함한다.
일부 실시양태에서, 폴리펩티드는 서열식별번호: 2; 서열식별번호: 3; 서열식별번호: 4; 서열식별번호: 5; 서열식별번호: 6; 서열식별번호: 7; 서열식별번호: 8; 서열식별번호: 9; 서열식별번호: 10; 서열식별번호: 11; 서열식별번호: 12; 서열식별번호: 13; 서열식별번호: 14; 서열식별번호: 15; 서열식별번호: 16; 서열식별번호: 17; 서열식별번호: 18; 서열식별번호: 19; 서열식별번호: 20; 서열식별번호: 21; 서열식별번호: 22; 서열식별번호: 23; 서열식별번호: 24; 서열식별번호: 25; 서열식별번호: 26; 서열식별번호: 27; 서열식별번호: 28; 서열식별번호: 29; 서열식별번호: 30; 서열식별번호: 31; 서열식별번호: 32; 서열식별번호: 33; 서열식별번호: 34; 서열식별번호: 35; 서열식별번호: 36; 및 서열식별번호: 37로부터 선택된 임의의 서열에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 폴리펩티드는 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 58, 서열식별번호: 59, 서열식별번호: 60, 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 서열식별번호: 81, 서열식별번호: 82, 서열식별번호: 83, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 97 및 서열식별번호: 98로부터 선택된 임의의 서열에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 폴리펩티드는 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 58 및 서열식별번호: 60으로부터 선택된 임의의 서열에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 바람직하게는 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 폴리펩티드는 서열식별번호: 51, 서열식별번호: 73, 서열식별번호: 70 및 서열식별번호: 78로부터 선택된 임의의 서열에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 바람직하게는 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 조성물은 바람직하게는 서열식별번호: 59, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 71, 서열식별번호: 52, 서열식별번호: 96 및 서열식별번호: 50 중 어느 하나에 제시된 서열을 갖는 폴리펩티드를 포함하지 않는다.
추가의 실시양태에서, 폴리펩티드는 표 2의 열 (iv)에 열거된 서열식별번호 중 어느 하나에 제시된 바와 같은 아미노산 서열을 포함한다. 즉, 예시적인 폴리펩티드는 서열식별번호: 2; 서열식별번호: 3; 서열식별번호: 4; 서열식별번호: 5; 서열식별번호: 6; 서열식별번호: 7; 서열식별번호: 8; 서열식별번호: 9; 서열식별번호: 10; 서열식별번호: 11; 서열식별번호: 12; 서열식별번호: 13; 서열식별번호: 14; 서열식별번호: 15; 서열식별번호: 16; 서열식별번호: 17; 서열식별번호: 18; 서열식별번호: 19; 서열식별번호: 20; 서열식별번호: 21; 서열식별번호: 22; 서열식별번호: 23; 서열식별번호: 24; 서열식별번호: 25; 서열식별번호: 26; 서열식별번호: 27; 서열식별번호: 28; 서열식별번호: 29; 서열식별번호: 30; 서열식별번호: 31; 서열식별번호: 32; 서열식별번호: 33; 서열식별번호: 34; 서열식별번호: 35; 서열식별번호: 36; 및 서열식별번호: 37 중 어느 하나로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 58, 서열식별번호: 59, 서열식별번호: 60, 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 서열식별번호: 81, 서열식별번호: 82, 서열식별번호: 83, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 97 및 서열식별번호: 98 중 어느 하나로부터 선택된 아미노산 서열을 갖는다.
바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 3; 서열식별번호: 6; 서열식별번호: 8; 서열식별번호: 14; 서열식별번호: 15; 서열식별번호: 18; 서열식별번호: 19; 서열식별번호: 23; 서열식별번호: 27; 및 서열식별번호: 35 중 어느 하나에 제시된 아미노산 서열을 포함한다.
일부 실시양태에서, 특정한 잔기 쌍이 융합전 입체형태에서 디술피드 결합을 형성하기에 충분히 가까운 거리 내에 있지만 융합후 입체형태에서는 그렇지 않도록 폴리펩티드 구조에서의 잔기의 정렬을 조정하기 위해 천연 HCMV gB 서열로부터 아미노산이 삽입 (또는 결실)될 수 있다. 여러 이러한 실시양태에서, 폴리펩티드는 적어도 1개의 아미노산 삽입을 포함하는 것에 추가로, 표 2의 열 (ii)의 행 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87 또는 88 중 하나 이상에 열거된 위치의 쌍 중 임의의 것에 위치한 시스테인 잔기 사이에 디술피드 결합을 포함한다.
일부 실시양태에서, 폴리펩티드는 천연 HCMV gB와 비교하여 페닐알라닌 치환을 포함한다. 일부 실시양태에서, 폴리펩티드는 천연 HCMV gB와 비교하여 류신 치환을 포함한다. 일부 실시양태에서, 폴리펩티드는 융합후 입체형태의 HCMV gB 폴리펩티드와 비교하여, 폴리펩티드의 폴딩된 구조에서 서로 근접한 잔기 사이의 이온 반발을 감소시키는 아미노산 돌연변이 (예컨대, 예를 들어 페닐알라닌 (F) 및 류신 (L) 치환)에 의해 안정화될 수 있다. 일부 실시양태에서, 폴리펩티드는 융합후 입체형태의 HCMV gB와 비교하여, 폴리펩티드의 폴딩된 구조에서 서로 근접한 잔기들 사이의 이온성 인력을 증가시키는 아미노산 돌연변이에 의해 안정화될 수 있다.
예시적인 돌연변이는 천연 HCMV gB와 비교하여 서열식별번호: 1의 넘버링에 따라 표 3으로부터 선택되는 임의의 돌연변이를 포함한다.
표 3. 예시적인 페닐알라닌 (F) 및 류신 (L) 치환
표 4. 추가의 예시적인 치환
일부 실시양태에서, 폴리펩티드는 표 3의 열 (ii)의 행 1, 2, 3, 4, 5 또는 6 중 하나 이상에 열거된 위치 중 어느 하나에서 치환된 1개 이상 (예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 잔기를 포함하며, 여기서 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
일부 실시양태에서, 폴리펩티드는 표 4의 열 (ii)의 행 1, 2, 3, 4, 5, 6, 7 및 8 중 하나 이상에 열거된 위치 중 어느 하나에서 치환된 1개 이상 (예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 잔기를 포함하며, 여기서 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 670 (표 3의 열 (ii), 행 1 및 2에 열거됨)에서 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 673 (표 3의 열 (ii), 행 3 및 4에 열거됨)에서 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 691 (표 3의 열 (ii), 행 5 및 6에 열거됨)에서 돌연변이를 포함한다.
일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 670에서 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 682에서 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 686에서 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 118에서 돌연변이를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 위치 646에서 돌연변이를 포함한다.
추가 실시양태에서, 폴리펩티드는 표 3의 열 (iii)의 행 1, 2, 3, 4, 5 또는 6 중 하나 이상에 열거된 위치 중 어느 하나에서 치환에 의해 도입된 정전기적 돌연변이를 포함하며, 여기서 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 K670L (표 3의 열 (iii), 행 1에 열거됨)을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 K670F (표 3의 열 (iii), 행 2에 열거됨)를 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 R673L (표 3의 열 (iii), 행 3에 열거됨)을 포함한다. 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 R673F (표 3의 열 (iii), 행 4에 열거됨)를 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 K691L (표 3의 열 (iii), 행 5에 열거됨)을 포함한다. 추가의 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 K691F (표 3의 열 (iii), 행 6에 열거됨)를 포함한다.
일부 실시양태에서, 폴리펩티드는 표 3에 열거된 페닐알라닌 (F) 및 류신 (L) 치환 중 2개 이상의 조합을 포함한다.
바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 D679S를 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 D679N을 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 E682S를 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 E682Q를 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 E686S를 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 E686Q를 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 N118P를 포함한다. 또 다른 바람직한 실시양태에서, 폴리펩티드는 서열식별번호: 1의 넘버링에 따른 치환 D646P를 포함한다.
일부 실시양태에서, 폴리펩티드는 표 4에 열거된 페닐알라닌 (F) 및 류신 (L) 치환 중 2개 이상의 조합을 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 38; 서열식별번호: 39; 서열식별번호: 40; 서열식별번호: 41; 서열식별번호: 42; 및 서열식별번호: 43으로부터 선택된 임의의 서열에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 폴리펩티드는 서열식별번호: 99; 서열식별번호: 100, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105 및 서열식별번호: 106으로부터 선택된 임의의 서열에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함한다.
추가의 실시양태에서, 폴리펩티드는 표 3의 열 (iv)에 열거된 서열식별번호 중 어느 하나에 제시된 아미노산 서열을 포함한다. 즉, 예시적인 폴리펩티드는 서열식별번호: 38; 서열식별번호: 39; 서열식별번호: 40; 서열식별번호: 41; 서열식별번호: 42; 및 서열식별번호: 43 중 어느 하나로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호: 99; 서열식별번호: 100, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105 및 서열식별번호: 106 중 어느 하나로부터 선택된 아미노산 서열을 갖는다.
일부 실시양태에서, 특정 잔기 쌍이 융합전 입체형태에서 원하는 정전기적 상호작용을 형성하기에 충분히 가까운 거리 내에 있지만 융합후 입체형태에서는 그렇지 않도록 폴리펩티드 구조에서의 잔기의 정렬을 조정하기 위해 천연 HCMV gB 서열로부터 아미노산이 삽입 (또는 결실)될 수 있다. 여러 이러한 실시양태에서, 폴리펩티드는 표 3의 열 (ii)의 행 1, 2, 3, 4, 5 또는 6 중 하나 이상에 열거된 위치 중 임의의 것에서 목적하는 정전기적 상호작용을 포함하며, 여기서 폴리펩티드는 HCMV 융합후 입체형태를 나타내지 않는다.
C.2. 폴리펩티드의 추가 실시양태
일부 실시양태에서, 폴리펩티드는 참조 서열 서열식별번호: 46의 넘버링에 따른 하기 아미노산 위치: 280, 281, 283, 284, 285, 286, 290, 292, 295, 297, 298, 299 또는 그의 임의의 조합 중 어느 하나에서 돌연변이를 포함하지 않는다. 일부 예시적인 실시양태에서, 폴리펩티드는 참조 서열 서열식별번호: 46의 넘버링에 따라 하기 잔기: Y280; N281; T283; N284; R285; N286; F290; E292; N293; F297; F298; I299; F298; 및 그의 임의의 조합 중 어느 하나의 치환을 포함하지 않는다. 이론 또는 메카니즘에 얽매이지는 않지만, 중화 항체에 중요한 잔기는 Y280/N284 및 Y280/N293/D295를 포함할 수 있다. 따라서, 바람직한 실시양태에서, 폴리펩티드는 참조 서열 서열식별번호: 46과 비교하여 Y280, N293, N284, 및 D295에 돌연변이를 포함하지 않는다.
일부 실시양태에서, 폴리펩티드는 참조 서열 서열식별번호: 44의 넘버링에 따른 하기 아미노산 위치: R562, P577, S587, Y588, G592, G595, L601/H605, C610, L612, P613, Y625, Y627, F632, 및 K633, 및 그의 임의의 조합 중 어느 하나에서 돌연변이를 포함하지 않는다. 일부 실시양태에서, 폴리펩티드는 참조 서열 서열식별번호: 44의 넘버링에 따른 하기 아미노산 돌연변이: R562C, P577L, S587L, Y588C, G592S, G595D, L601P/H605N, C610Y, L612F, P613Y, Y625C, Y627C, F632L 및 K633T 또는 그의 임의의 조합 중 어느 하나를 포함하지 않는다. 이론 또는 메카니즘에 얽매이지는 않지만, P577 및 Y627은 도메인 IV 코어 내에서 서로의 옆에 위치하는 반면, C610은 보존된 디술피드 결합에 참여하는 것으로 여겨진다. 따라서, 3개의 잔기 모두가 융합전 구조 내의 도메인 IV의 위치, 및 따라서 전체 항원 부위 AD-1의 안정성을 유지하는 것을 도울 수 있다. 또한, 이론 또는 메카니즘에 얽매이지는 않지만, F632 및 G595는 gB의 융합전 형태의 표면 상에 노출되는 것으로 생각된다. 따라서, 바람직한 실시양태에서, 폴리펩티드는 참조 서열 서열식별번호: 44의 넘버링에 따라 P577, Y627, C610, F632, 및 G595, 또는 그의 임의의 조합에서 돌연변이를 포함하지 않는다.
C.3. 공동 충전 돌연변이
또 다른 실시양태에서, 폴리펩티드는 1개 이상의 공동 충전 돌연변이인 아미노산 돌연변이를 포함한다. 공동 충전의 목표로 대체될 수 있는 아미노산의 예는 소형 지방족 (예를 들어 Gly, Ala 및 Val) 또는 소형 극성 아미노산 (예를 들어 Ser 및 Thr), 및 융합전 입체형태에서 매립되지만 융합후 입체형태에서 용매에 노출된 아미노산을 포함한다. 대체 아미노산의 예는 대형 지방족 아미노산 (Ile, Leu 및 Met) 또는 대형 방향족 아미노산 (His, Phe, Tyr 및 Trp)을 포함한다.
C.4. 돌연변이의 조합
또 다른 측면에서, 본 발명은 각각 상기 본원에 기재된 바와 같은 조작된 디술피드 결합 돌연변이, 공동 충전 돌연변이 및 정전기적 돌연변이로부터 선택된 2종 이상의 상이한 유형의 돌연변이의 조합을 포함하는 폴리펩티드에 관한 것이다. 일부 실시양태에서, 폴리펩티드는 적어도 1개의 디술피드 결합 돌연변이 및 적어도 정전기적 돌연변이를 포함한다. 보다 구체적으로, 일부 실시양태에서, 폴리펩티드는 적어도 1개의 시스테인 치환 및 적어도 1개의 페닐알라닌 치환을 포함한다. 일부 실시양태에서, 폴리펩티드는 적어도 1개의 시스테인 치환 및 적어도 1개의 류신 치환을 포함한다.
일부 추가 실시양태에서, 폴리펩티드는 표 2의 돌연변이 중 어느 하나로부터 선택된 적어도 하나의 돌연변이 및 표 3의 돌연변이 중 어느 하나로부터 선택된 적어도 하나의 돌연변이를 포함한다. 일부 추가 실시양태에서, 폴리펩티드는 표 2의 돌연변이 중 어느 하나로부터 선택된 적어도 하나의 돌연변이 및 표 4의 돌연변이 중 어느 하나로부터 선택된 적어도 하나의 돌연변이를 포함한다. 일부 추가 실시양태에서, 폴리펩티드는 표 3에서의 돌연변이 중 어느 하나로부터 선택된 적어도 하나의 돌연변이 및 표 4에서의 돌연변이 중 어느 하나로부터 선택된 적어도 하나의 돌연변이를 포함한다.
D. HCMV gB 폴리펩티드의 약물표적화가능한 영역
본 발명은 부분적으로, HCMV gB 단백질에서의 신규 약물표적화가능한 영역을 제공한다. 약물과 이러한 영역의 상호작용, 또는 약물로의 이러한 영역의 활성의 조정은 바이러스 융합 및 따라서 바이러스 감염성을 억제할 수 있다. 한 측면에서, 본 발명은 gB 단백질을 갖는 HCMV에 의해 유발되는 HCMV 감염에 대한 후보 치료제, 예를 들어 예컨대 소분자 바이러스 융합 억제제를 발견하기 위해 이들 약물표적화가능한 영역에 대해 화합물을 스크리닝하는 방법을 제공한다. 한 실시양태에서, gB 단백질을 갖는 HCMV에 의해 유발되는 HCMV 감염에 대한 후보 치료제를 확인하는 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 화합물의 결합은 후보 치료제를 나타낸다. 화합물은 특정 실시양태에서 하기 부류: 펩티드, 폴리펩티드, 펩티드모방체 또는 소분자로부터 선택될 수 있거나, 또는 화합물의 라이브러리로부터 선택될 수 있다. 이러한 라이브러리는 조합 합성 방법에 의해 생성될 수 있다. 결합은 시험관내 또는 생체내에서 검정될 수 있다. 이러한 방법의 특정 실시양태에서, 단백질은 HCMV gB 단백질이고, HCMV gB 단백질의 약물표적화가능한 영역으로부터의 적어도 1개의 잔기, 바람직하게는 3개의 잔기를 포함한다. 이러한 약물표적화가능한 영역은 또한 구조 결정, 약물 스크리닝, 약물 설계, 및 본원에 기재되고 청구된 다른 방법에 이용될 수 있다.
용어 "약물표적화가능한 영역"은, 폴리펩티드, 핵산, 복합체 등과 관련하여 사용되는 경우에, 바이러스 감염성을 감소시키거나 억제하는 작용제에 결합하기 위한 표적이거나 또는 가능한 표적인 HCMV gB 단백질의 영역을 지칭한다. 폴리펩티드의 경우, 약물표적화가능한 영역은 일반적으로 폴리펩티드의 여러 아미노산이 작용제와 상호작용할 수 있는 영역을 지칭한다. 폴리펩티드 또는 그의 복합체에 대해, 예시적인 약물표적화가능한 영역은 결합 포켓 및 부위, 폴리펩티드 또는 복합체의 도메인 사이의 계면, 또 다른 분자, 예컨대 세포 막과의 상호작용에 참여할 수 있는 폴리펩티드 또는 복합체의 표면 홈 또는 윤곽 또는 표면을 포함한다.
약물표적화가능한 영역은 다수의 방식으로 기재되고 특징화될 수 있다. 예를 들어, 약물표적화가능한 영역은 영역을 구성하는 아미노산의 일부 또는 전부, 또는 그의 백본 원자, 또는 그의 측쇄 원자 (임의로 Ca 원자를 갖거나 갖지 않음)를 특징으로 할 수 있다. 대안적으로, 약물표적화가능한 영역은 동일한 또는 다른 분자 상의 다른 영역과 비교하여 특징화될 수 있다. 예를 들어, 용어 "친화성 영역"은 동일한 친화성 영역의 구조가 충분히 동일하여 동일하거나 관련된 구조적 유사체에 결합할 것으로 예상되는 한, 여러 다른 분자에 존재하는 분자 (예컨대 HCMV gB 단백질) 상의 약물표적화가능한 영역을 지칭한다. 친화성 영역의 예는 여러 단백질 키나제 (동일한 기원의 것이든 아니든)에서 발견되는 단백질 키나제의 ATP-결합 부위이다. 용어 "선택성-영역"은 상이한 선택성 영역의 구조가 충분히 상이하여 동일하거나 관련된 구조적 유사체에 결합할 것으로 예상되지 않는 한, 다른 분자 상에서 발견되지 않을 수 있는 분자의 약물표적화가능한 영역을 지칭한다. 예시적인 선택성 영역은 하나의 기질에 대한 특이성을 나타내는 단백질 키나제의 촉매 도메인이다. 특정 예에서, 단일 조정제는 실질적으로 유사한 생물학적 기능을 갖는 다수의 단백질에 걸쳐 동일한 친화도 영역에 결합할 수 있는 반면, 동일한 조정제는 이들 단백질 중 하나의 오직 하나의 선택성 영역에만 결합할 수 있다.
상이한 약물표적화가능한 영역의 예를 계속하면, 용어 "바람직하지 않은 영역"은 또 다른 분자와 상호작용 시에 바람직하지 않은 효과를 생성하는 분자의 약물표적화가능한 영역을 지칭한다. 예를 들어, 상호작용 분자를 산화시켜 (예컨대 P-450 활성) 산화된 분자에 대한 독성을 증가시키는 결합 부위는 "바람직하지 않은 영역"으로 간주될 수 있다. 잠재적인 바람직하지 않은 영역의 다른 예는 약물과의 상호작용 시 약물의 막 투과성을 감소시키거나, 약물의 배설을 증가시키거나, 또는 약물의 혈액 뇌 수송을 증가시키는 영역을 포함한다. 특정 상황에서는, 바람직하지 않은 영역은 더 이상 바람직하지 못한 영역으로 간주되지 않을 것인데, 이는 이러한 영역의 영향이 유리할 것이기 때문이며, 예를 들어 뇌 상태를 치료하고자 하는 약물이 증가된 혈액 뇌 수송을 초래하는 영역과 상호작용하는 것으로부터 이익을 얻을 것이기 때문이며, 반면 상기 영역은 뇌로 전달되도록 의도되지 않은 약물에 대해서는 바람직하지 않은 것으로 간주될 수 있다.
약물표적화가능한 영역과 관련하여 사용되는 경우에, 약물표적화가능한 영역에 대한 분자, 예컨대 조정제의 "선택성" 또는 "특이성"은 분자와 약물표적화가능한 영역 사이의 결합을 기재하는 데 사용될 수 있다. 예를 들어, 약물표적화가능한 영역에 대한 조정제의 선택성은 각각의 Kd 값 (즉, 각각의 조정제-약물표적화가능한 영역 복합체에 대한 해리 상수)을 사용하거나, 또는 생물학적 효과가 Kd 미만에서 관찰되는 경우에는 각각의 EC50의 비 (즉, 각각의 약물표적화가능한 영역과 상호작용하는 조정제에 대한 최대 반응의 50%를 생성하는 농도)를 사용하여 또 다른 조정제와 비교하여 표현될 수 있다.
용어 "조정"은, 기능적 특성 또는 생물학적 활성 또는 과정 (예를 들어, 효소 활성 또는 수용체 결합)과 관련하여 사용되는 경우에, 이러한 특성, 활성 또는 과정의 품질을 상향 조절 (예를 들어, 활성화 또는 자극), 하향 조절 (예를 들어, 억제 또는 저해) 또는 달리 변화시키는 능력을 지칭한다. 특정 경우에, 이러한 조절은 특이적 사건, 예컨대 신호 전달 경로의 활성화의 발생에 따를 수 있고/거나, 단지 특정한 세포 유형에서만 나타날 수 있다.
용어 "조정제"는 조정을 유발할 수 있는 펩티드, 폴리펩티드, 핵산, 거대분자, 복합체, 분자, 소분자, 화합물, 종 등 (자연-발생 또는 비-자연-발생), 또는 생물학적 물질, 예컨대 박테리아, 식물, 진균, 또는 동물 세포 또는 조직으로부터 제조된 추출물을 지칭한다. 조정제는 검정에 포함시킴으로써 기능적 특성, 생물학적 활성 또는 과정 또는 그의 조합의 조정제 또는 활성화제 (직접적으로 또는 간접적으로) (예를 들어, 효능제, 부분 길항제, 부분 효능제, 역 효능제, 길항제, 항미생물제, 미생물 감염 또는 증식의 조정제 등)로서의 잠재적 활성에 대해 평가될 수 있다. 이러한 검정에서, 많은 조정제를 한번에 스크리닝할 수 있다. 조정제의 활성은 공지되거나, 공지되지 않거나 또는 부분적으로 공지될 수 있다. 용어 "억제제"는 기능적 특성 또는 생물학적 활성 또는 과정을 하향-조절 또는 억제할 수 있는 펩티드, 폴리펩티드, 핵산, 거대분자, 복합체, 분자, 소분자, 화합물, 종 등 (자연-발생 또는 비-자연-발생), 또는 생물학적 물질, 예컨대 박테리아, 식물, 진균 또는 동물 세포 또는 조직으로부터 제조된 추출물을 지칭한다.
용어 "모티프"는 특정 구조 또는 기능의 단백질에서 통상적으로 발견되는 아미노산 서열을 지칭한다. 전형적으로, 컨센서스 서열은 특정 모티프를 나타내는 것으로 정의된다. 컨센서스 서열은 엄격하게 정의될 필요는 없고, 가변성의 위치, 축중성, 길이 가변성 등을 함유할 수 있다. 컨센서스 서열은 그의 아미노산 서열 내의 모티프의 존재로 인해 유사한 구조 또는 기능을 가질 수 있는 다른 단백질을 확인하기 위해 데이터베이스를 검색하는 데 사용될 수 있다. 예를 들어, 온라인 데이터베이스는 특정한 모티프를 함유하는 다른 단백질을 확인하기 위해 컨센서스 서열로 검색될 수 있다. FASTA, BLAST 또는 ENTREZ를 포함한 다양한 검색 알고리즘 및/또는 프로그램이 사용될 수 있다. FASTA 및 BLAST는 GCG 서열 분석 패키지 (위스콘신 대학교(University of Wisconsin), 위스콘신주 매디슨)의 일부로서 이용가능하다. ENTREZ는 미국 국립 보건원 국립 의학 도서관 국립 생물 정보 센터 (미국 메릴랜드주 베데스다)를 통해 이용가능하다.
용어 "소분자"는 약 5 kD 미만, 약 2.5 kD 미만, 약 1.5 kD 미만, 또는 약 0.9 kD 미만의 분자량을 갖는 화합물을 지칭한다. 소분자는, 예를 들어 핵산, 펩티드, 폴리펩티드, 펩티드 핵산, 펩티드모방체, 탄수화물, 지질 또는 다른 유기 (탄소 함유) 또는 무기 분자일 수 있다. 많은 제약 회사는 본 발명의 임의의 검정으로 스크리닝될 수 있는 화학적 및/또는 생물학적 혼합물, 종종 진균, 박테리아 또는 조류 추출물의 광범위한 라이브러리를 갖는다. 용어 "유기 소분자"는 종종 유기 또는 의약 화합물인 것으로 확인되는 소분자를 지칭하고, 오로지 핵산, 펩티드 또는 폴리펩티드인 분자를 포함하지 않는다.
한 실시양태에서, 약물표적화가능한 영역은 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함하며, 이들 잔기는 융합후 입체형태의 HCMV gB 단백질의 도메인 V에 대한 결합 포켓을 형성한다.
또 다른 실시양태에서, 약물표적화가능한 영역은 융합 루프 또는 그의 부분을 포함한다.
또 다른 측면에서, 본 발명은 gB 단백질을 갖는 HCMV에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법에 관한 것이다. 특정 실시양태에서, 이러한 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 gB 단백질의 활성의 조정은 후보 치료제를 나타낸다. 다른 실시양태에서, 이러한 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 약물표적화가능한 영역의 이동 또는 상호작용의 배제는 후보 치료제를 나타낸다. 또 다른 실시양태에서, 상기 gB 단백질의 기능 또는 활성의 조정은 융합후 입체형태적 변화의 완료를 배제하는 것을 수반한다. 또 다른 실시양태에서, 상기 gB 단백질의 기능 또는 활성의 조정은 입체형태 변화의 제1 단계를 방해하는 것을 수반한다. 또 다른 실시양태에서, gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 바이러스에서의 융합의 억제는 후보 치료제를 나타낸다. 또 다른 실시양태에서, gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 상기 HCMV의 바이러스 감염성의 억제는 후보 치료제를 나타낸다. 또 다른 실시양태에서, gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 대상체에서 상기 질환의 적어도 하나의 증상의 감소는 후보 치료제를 나타낸다.
추가 실시양태에서, 본 발명은 약물표적화가능한 영역을 포함하는 gB 단백질을 화합물과 접촉시키는 것을 포함하며, 여기서 화합물은 gB 단백질의 도메인 V 또는 그의 단편이 그의 결합 포켓에서 결합하는 것을 방지하는 것인, gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법을 제공한다. 한 실시양태에서, gB 단백질의 도메인 V에 대한 결합 포켓은 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함한다.
또 다른 측면에서, gB 단백질에 대해 본원에 학습되고 기재된 모든 정보는 그의 생물학적 활성 중 1종 이상의 조정제를 설계하는 방법에 사용될 수 있다. 한 실시양태에서, gB 단백질을 갖는 HCMV에 의한 감염에 의해 유발되는 질환의 예방 또는 치료를 위한 조정제를 설계하는 방법은 (a) gB 단백질에 대한 3차원 구조를 제공하는 단계; (b) 3차원 구조를 참조하여 gB 단백질을 갖는 HCMV에 의해 유발되는 질환의 예방 또는 치료를 위한 잠재적 조정제를 확인하는 단계; (c) gB 단백질을 잠재적 조정제와 접촉시키는 단계; 및 (d) 조정제와의 접촉 후에 gB 단백질의 활성을 검정하거나 또는 상기 gB 단백질을 갖는 바이러스의 생존율을 결정하는 단계를 포함하며, 여기서 폴리펩티드의 활성 또는 바이러스의 생존율의 변화는 조정제가 바이러스-관련 질환 또는 장애의 예방 또는 치료에 유용할 수 있음을 나타낸다. 특정 실시양태에서, 잠재적 조정제는 gB 단백질을 갖는 HCMV의 3차원 구조를 참조하여 확인된다. 다른 실시양태에서, 잠재적 조정제는 gB 단백질의 약물표적화가능한 영역 또는 단편을 포함하는 3차원 구조를 참조하여 확인된다.
또 다른 측면에서, 본 발명은 gB 단백질 활성의 조정제 (특정 실시양태에서, 억제제), 뿐만 아니라 그를 포함하는 제약 조성물 및 키트를 제공한다. 이러한 조정제는 특정 실시양태에서 본 발명의 약물표적화가능한 영역과 상호작용할 수 있다. 또 다른 측면에서, 본 발명은 HCMV gB 단백질의 약물표적화가능한 영역의 단편 (또는 이러한 단편의 상동체 또는 이러한 단편의 모방체)이며, 그 약물표적화가능한 영역과 경쟁하는 조정제에 관한 것이다. 임의의 상기 기재된 약물표적화가능한 영역의 조정제는 HCMV에 의한 감염을 치료하기 위해 단독으로 또는 상보적 접근법으로 사용될 수 있다.
마지막으로, 본 발명은 HCMV gB 폴리펩티드의 활성 또는 결합 부위에 결합하거나, 그와 상호작용하거나, 또는 그의 기능 또는 활성을 조정하는 조정제를 확인 및 설계하는 방법에 관한 것이다.
본원에 사용된 용어 "화합물"은 조정제, 억제제, 치료제, 치료 약물, 예방제, 약물 또는 작용제를 포함하나 이에 제한되지는 않는다. 본원에 사용된 용어 "후보 치료제" ("후보 작용제" 또는 "시험 작용제"로도 공지됨)는 화합물, 세제, 단백질, 펩티드, 펩티드모방체, 항체, 핵산, 소분자, 시토카인 또는 호르몬을 포함하나 이에 제한되지는 않는다.
관련 기술분야의 통상의 기술자에 의한 본 발명의 실시에 유용한 약물 발견의 측면이 하기 제시된다.
D.1. 약물표적화가능한 영역
한 실시양태에서, 약물표적화가능한 영역은 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690 또는 그의 단편을 포함한다. 이들 잔기는 융합후 입체형태에서 gB 단백질의 도메인 V 또는 그의 부분에 대한 결합 포켓을 형성한다. 본원에 사용된 용어 "결합 포켓" 및 "결합 홈"은 동일한 의미를 가질 것이고 상호교환가능하다.
또 다른 실시양태에서, 약물표적화가능한 영역은 융합 루프 또는 그의 부분을 포함한다.
또 다른 측면에서, 본 발명은 HCMV gB 단백질의 활성 또는 결합 부위에 결합하거나, 그와 상호작용하거나, 또는 그의 기능 또는 활성을 조정하는 조정제를 확인 및 설계하는 방법에 관한 것이다.
D.2. 대상 약물표적화가능한 영역을 사용한 조정제, 조정제 설계 및 스크리닝
한 측면에서, 본 발명은 대상 약물표적화가능한 영역의 잠재적 조정제를 스크리닝하는 방법, 뿐만 아니라 이러한 조정제를 설계하는 방법을 제공한다. 본 발명의 HCMV gB 폴리펩티드 및 다른 구조적으로 관련된 분자, 및 그를 함유하는 복합체에 대한 조정제는 하기 제시된 바와 같이, 그리고 다르게는 관련 기술분야의 통상의 기술자에게 공지된 기술 및 방법을 사용하여 확인 및 개발될 수 있다. 본 발명의 조정제는 예를 들어 HCMV에 의해 유발되는 질환을 억제 및 치료하는 데 사용될 수 있다.
한 측면에서, 본 발명은 HCMV의 활성을 감소시키기 위하여 대상 약물표적화가능한 영역과 상호작용하는 조정제에 관한 것이다. 이러한 조정제는 특정 실시양태에서 바이러스의 약물표적화가능한 영역과 상호작용할 수 있다. 특정 실시양태에서, 조정제는 gB 폴리펩티드의 도메인 V에 대한 결합 포켓과 상호작용하여 도메인 V가 포켓에서 결합하는 것을 방지함으로써 HCMV의 활성을 조정한다. 또 다른 측면에서, 본 발명은 HCMV gB 단백질의 도메인 V의 단편 (또는 이러한 단편의 상동체 또는 이러한 단편의 모방체)이며, 도메인 V에 대한 결합 포켓인 약물표적화가능한 영역과 경쟁하는 조정제에 관한 것이다. 한 측면에서, 조정제는 서열식별번호: 1 (타운 균주)의 잔기 M648-K700, M648-V697, S647-V697, S647-V663, I653-V697, I653-Q692, I653-L680, I653-S675, I653-Y667, R662-V697, R662-Q692, R662-L680, R662-S675, L664-F678, S668-V697, S668-Q692, S668-V677, D679-V697, L680-V697, L680-Q692, 및 R693-K700을 갖는 단편으로 이루어진 군으로부터 선택된 도메인 V의 단편을 포함한다. 보다 구체적으로, 조정제는 잔기 M648-K700 (서열식별번호: 260), M648-V697 (서열식별번호: 261), S647-V697 (서열식별번호: 262), S647-V663 (서열식별번호: 263), I653-V697 (서열식별번호: 264), I653-Q692 (서열식별번호: 265), I653-L680 (서열식별번호: 266), I653-S675 (서열식별번호: 267), I653-Y667 (서열식별번호: 268), R662-V697 (서열식별번호: 269), R662-Q692 (서열식별번호: 270), R662-L680 (서열식별번호: 271), R662-S675 (서열식별번호: 272), L664-F678 (서열식별번호: 273), S668-V697 (서열식별번호: 274), S668-Q692 (서열식별번호: 275), S668-V677 (서열식별번호: 276), D679-V697 (서열식별번호: 277), L680-V697 (서열식별번호: 278), L680-Q692 (서열식별번호: 279) 및 R693-K700 (서열식별번호: 280)을 갖는 서열식별번호: 1의 단편이다.
임의의 상기 기재된 약물표적화가능한 영역의 조정제는 HCMV 감염을 치료 또는 예방하기 위해 단독으로 또는 상보적 접근법으로 사용될 수 있다.
조정제를 사용하여 HCMV의 성장 또는 감염성을 억제하는 다양한 방법이 본 발명에 의해 고려된다. 예를 들어, 예시적인 방법은 HCMV gB 단백질을 이러한 병원체에 대해 효과적인 것으로 생각되거나 밝혀진 조정제와 접촉시키는 것을 수반한다.
예를 들어, 한 측면에서, 본 발명은 HCMV의 발현 및/또는 활성을 조정하는 데 유효한 양의 조정제를 HCMV의 감염을 앓고 있는 대상체에게 투여하는 것을 포함하는, 상기 대상체를 치료하는 방법을 고려한다. 본 발명은 HCMV 감염에 걸린 대상체에게 본 발명의 방법 중 하나를 사용하여 확인된 분자의 치료 유효량을 투여하는 것을 포함하는, HCMV 감염에 걸린 대상체를 치료하는 방법을 추가로 고려한다.
또 다른 실시양태에서, 본 발명은 HCMV에 대한 면역 반응을 자극함으로써 대상체에서 HCMV의 감염을 예방하는 방법을 고려한다. 면역 반응은 HCMV의 발현 및/또는 활성을 조정하는 데 유효한 양의 조정제를 대상체에게 투여하는 것에 의해 자극될 수 있다. 일부 실시양태에서, 유도된 면역 반응은 보호성 면역 반응이고, 즉, 반응은 CMV 감염의 위험 또는 중증도 또는 임상 결과를 감소시킨다. 보호성 면역 반응의 자극은 특히 CMV 감염 및 질환의 위험이 있는 일부 집단에서 특히 바람직하다. 예를 들어, 위험이 있는 집단은 실질 기관 이식 (SOT) 환자, 골수 이식 환자, 및 조혈 줄기 세포 이식 (HSCT) 환자를 포함한다. 조정제는 이식 공여자에게 이식전, 또는 이식 수용자에게 이식전 및/또는 이식후 투여될 수 있다. 엄마로부터 아기로의 수직 전파가 영아 감염의 흔한 공급원이기 때문에, 임신하거나 임신할 수 있는 여성에게 조정제를 투여하는 것이 특히 유용하다.
특정 예에서, 대상체는 포유동물이다. 일부 실시양태에서, 포유동물은 인간이다. 일부 실시양태에서, 인간은 소아, 예컨대 영아이다. 일부 다른 실시양태에서, 인간은 청소년기 여성, 가임 연령의 여성, 임신 계획 중인 여성, 임신한 여성, 및 최근에 출산한 여성을 포함한 여성이다. 일부 실시양태에서, 인간은 이식 환자이다.
비인간 포유동물, 예컨대 레서스 원숭이, 기니 피그, 또는 마우스의 CMV의 경우, 상동성 서열 및 그의 모방체는 동일한 특성을 갖고, 이들 비인간 포유동물에서 실험, 예방, 또는 치료 목적을 위해 사용될 것으로 예상된다. CMV는 고도로 종 특이적이기 때문에, HCMV 도메인 V의 동물 CMV (마우스 CMV, 기니 피그 CMV 및 레서스 CMV를 포함하나 이에 제한되지는 않음) 상동체를 구축하고, 이들을 gB의 동물 CMV 상동체의 결합 및 활성 억제, 및 MCMV, gpCMV 및 rhCMV에 의한 동물의 감염 억제에 대해 시험하는 것이 또한 본 발명에서 고려된다.
또 다른 실시양태에서, HCMV의 조정제 또는 억제제, 또는 그를 함유하는 생물학적 복합체는, 예를 들어 대상체 (인간 및 동물 포함)의 임의의 질환 또는 다른 치료가능한 상태, 특히 HCMV 감염에 의해 유발되는 질환을 예방 또는 치료하는 것을 포함한 임의의 수의 용도를 위한 의약의 제조에 사용될 수 있다.
(i) 조정제 설계
HCMV gB 폴리펩티드, 구조적으로 상동인 분자, 및 다른 분자와 회합할 수 있는 화학 물질을 스크리닝, 확인, 선택 및 설계하기 위해 다수의 기술이 사용될 수 있다. 본원에 기재된 방법에 따라 결정된 HCMV gB 폴리펩티드에 대한 구조에 대한 지식은 HCMV gB 폴리펩티드, 또는 보다 특히 그의 약물표적화가능한 영역의 입체형태에 상보적인 형상을 갖는 분자 및/또는 다른 조정제의 설계 및/또는 확인을 가능하게 한다. 이러한 기술 및 방법은 HCMV gB 폴리펩티드에 대한 정확한 구조 좌표 및 다른 정보 이외에도, 상기 기재된 그의 구조 등가물 (예를 들어, 상기 기재된 바와 같은 약물표적화가능한 영역에 함유된 아미노산의 구조 좌표로부터 유래된 구조 좌표 포함)을 사용할 수 있는 것으로 이해된다.
본원에 사용된 용어 "화학 물질"은 화학적 화합물, 2종 이상의 화학적 화합물의 복합체, 및 이러한 화합물 또는 복합체의 단편을 지칭한다. 특정 경우에, 광범위한 구조적 및 기능적 다양성을 나타내는 화학 물질, 예컨대 상이한 형상 (예를 들어, 편평 방향족 고리(들), 퍼커링된 지방족 고리(들), 단일, 이중 또는 삼중 결합을 갖는 직쇄 및 분지쇄 지방족) 및 다양한 관능기 (예를 들어, 카르복실산, 에스테르, 에테르, 아민, 알데히드, 케톤, 및 다양한 헤테로시클릭 고리)를 나타내는 화합물을 사용하는 것이 바람직하다.
한 측면에서, 약물 설계 방법은 일반적으로 본 발명의 임의의 분자 또는 복합체 (또는 그의 부분)와 회합하는 선택된 화학 물질의 잠재력을 컴퓨터에 의해 평가하는 것을 포함한다. 예를 들어, 이 방법은 (a) 컴퓨터 수단을 사용하여 선택된 화학 물질과 분자 또는 복합체의 약물표적화가능한 영역 사이의 피팅 작업을 수행하는 단계; 및 (b) 상기 피팅 작업의 결과를 분석하여 화학 물질과 약물표적화가능한 영역 사이의 회합을 정량화하는 단계를 포함할 수 있다.
화학 물질은 육안 검사를 통해 또는 도킹 프로그램, 예컨대 GRAM, DOCK 또는 AUTODOCK를 사용한 컴퓨터 모델링의 사용을 통해 검사될 수 있다 (Dunbrack et al., Folding & Design, 2:27-42 (1997)). 이 절차는 각각의 화학 물질의 형상 및 화학 구조가 HCMV gB 폴리펩티드의 구조를 얼마나 잘 보완하거나 방해할 것인지를 확인하기 위해 화학 물질을 표적에 컴퓨터 피팅하는 것을 포함할 수 있다 (Bugg et al., Scientific American, December: 92-98 (1993); West et al., TIPS, 16:67-74 (1995)). 컴퓨터 프로그램은 또한, 예를 들어 약물표적화가능한 영역에 대한 화학 물질의 유인, 반발 및 입체 장애를 추정하는 데 사용될 수 있다. 일반적으로, 핏이 더 치밀할수록 (예를 들어, 입체 장애가 더 낮을수록 및/또는 인력이 더 클수록), 화학 물질은 이들 특성이 더 치밀한 결합 상수와 일치하기 때문에 더 강력할 것이다. 또한, 화학 물질의 설계에서의 특이성이 더 클수록, 화학 물질이 관련 단백질을 방해하지 않을 가능성이 더 클 것이고, 이는 원치 않는 상호작용으로 인한 잠재적 부작용을 최소화할 수 있다.
약물표적화가능한 영역의 입체 및 전자 특성이 화학 물질의 설계를 안내하기 위해 사용되는, 분자 설계를 위한 다양한 컴퓨터 방법이 공지되어 있다: 문헌 [Cohen et al. (1990) J. Med. Cam. 33: 883-894; Kuntz et al. (1982) J. Mol. Biol. 161: 269-288; DesJarlais (1988) J. Med. Cam. 31: 722-729; Bartlett et al. (1989) Spec. Publ., Roy. Soc. Chem. 78: 182-196; Goodford et al. (1985) J. Med. Cam. 28: 849-857; and DesJarlais et al. J. Med. Cam. 29: 2149-2153]. 지시된 방법은 일반적으로 2개의 카테고리에 속한다: (1) 공지된 화학 물질의 3-D 구조 (예컨대, 결정학적 데이터베이스로부터의 것)가 약물표적화가능한 영역에 도킹되고 적합도에 대해 점수화되는 유사성에 의한 설계; 및 (2) 화학 물질이 약물표적화가능한 영역에서 조각별로 구축되는 신생 설계. 화학 물질은 분자의 라이브러리 또는 데이터베이스의 일부로서 스크리닝될 수 있다. 사용될 수 있는 데이터베이스는 ACD (몰레큘라 디자인즈 리미티드(Molecular Designs Limited)), NCI (내셔널 캔서 인스티튜트(National Cancer Institute)), CCDC (캠브리지 크리스탈로그래픽 데이터 센터(Cambridge Crystallographic Data Center)), CAST (케미칼 앱스트랙트 서비스(Chemical Abstract Service)), 더웬트(Derwent) (더웬트 인포메이션 리미티드(Derwent Information Limited)), 메이브리지(Maybridge) (메이브리지 케미칼 캄파니 리미티드(Maybridge Chemical Company Ltd)), 알드리치(Aldrich) (알드리치 케미칼 캄파니(Aldrich Chemical Company)), DOCK (캘리포니아 대학교(University of California), 샌프란시스코), 및 내츄럴 프로덕츠 디렉토리(Directory of Natural Products) (채프만 앤드 홀(Chapman & Hall))를 포함한다. 컴퓨터 프로그램, 예컨대 CONCORD (트리포스 어소시에이츠(Tripos Associates)) 또는 DB-컨버터 (몰레큘라 시뮬레이션즈 리미티드(Molecular Simulations Limited))를 사용하여 2차원으로 나타낸 데이터 세트를 3차원으로 나타낸 것으로 전환시킬 수 있다.
화학 물질은 약물표적화가능한 영역 또는 표적 단백질의 다른 부분에 공간적으로 맞는 그의 능력에 대해 시험될 수 있다. 본원에 사용된 용어 "공간적으로 맞는"은 화학 물질의 3차원 구조가 약물표적화가능한 영역에 의해 기하학적으로 수용됨을 의미한다. 화학 물질의 표면적이 바람직하지 않은 상호작용을 형성하지 않으면서 약물표적화가능한 영역의 표면적과 매우 근접할 때 유리한 기하학적 핏이 발생한다. 화학 물질이 소수성, 방향족, 이온성, 쌍극성 또는 수소 공여력 및 수용력에 의해 상호작용하는 경우에 유리한 상보적 상호작용이 발생한다. 불리한 상호작용은 화학 물질 내의 원자와 약물표적화가능한 영역 내의 원자 사이의 입체 장애일 수 있다.
본 발명의 모델이 컴퓨터 모델인 경우, 화학 물질은 컴퓨터 도킹을 통해 약물표적화가능한 영역에 위치할 수 있다. 한편, 본 발명의 모델이 구조적 모델인 경우, 화학 물질은 예를 들어 수동 도킹에 의해 약물표적화가능한 영역에 위치할 수 있다. 본원에 사용된 용어 "도킹"은 화학 물질을 약물표적화가능한 영역과 매우 근접하게 위치시키는 과정, 또는 화학 물질/약물표적화가능한 영역 복합체의 저에너지 입체형태를 찾는 과정을 지칭한다.
예시적인 실시양태에서, 잠재적 조정제의 설계는 HCMV gB 폴리펩티드의 약물표적화가능한 영역에 대해 상보적인 형상의 일반적 관점으로부터 시작되고, 표적 약물표적화가능한 영역에 기하학적으로 적합한 화학 물질에 대한 공지된 3차원 구조의 소분자의 데이터베이스를 스캐닝할 수 있는 검색 알고리즘이 사용된다. 이러한 유형의 대부분의 알고리즘은 HCMV gB 폴리펩티드의 약물표적화가능한 영역의 형상에 상보적인 광범위한 종류의 화학 물질을 찾는 방법을 제공한다. 특정한 데이터베이스, 예컨대 캠브리지 결정학적 데이터 뱅크(Cambridge Crystallographic Data Bank) (CCDB) (문헌 [Allen et al. (1973) J. Chem. Doc. 13: 119])로부터의 화학 물질의 세트 각각은 도킹 알고리즘의 사용으로 다수의 기하학적으로 허용되는 배향으로 HCMV gB 폴리펩티드의 약물표적화가능한 영역에 개별적으로 도킹된다. 특정 실시양태에서, DOCK로 불리는 컴퓨터 알고리즘의 세트는 약물표적화가능한 영역의 활성 부위 및 인식 표면을 형성하는 함입 및 홈의 형상을 특징화하는 데 사용될 수 있다 (Kuntz et al. (1982) J. Mol. Biol. 161: 269-288). 프로그램은 또한 HCMV gB 폴리펩티드의 특정한 결합 부위에 상보적인 형상을 갖는 주형에 대한 소분자의 데이터베이스를 검색할 수 있다 (DesJarlais et al. (1988) J Med Chem 31: 722-729).
배향은 적합도(goodness-of-fit)에 대해 평가되고, 최상은 분자 역학 프로그램, 예컨대 AMBER 또는 CHARMM을 사용한 추가의 검사를 위해 유지된다. 이러한 알고리즘은 약물표적화가능한 영역에 대해 형상이 상보적인 다양한 화학 물질을 발견하는 데 성공적인 것으로 이전에 입증되었다.
문헌 [Goodford (1985, J Med Chem 28:849-857)] 및 [Boobbyer et al. (1989, J Med Chem 32:1083-1094)]은 약물표적화가능한 영역의 상이한 화학적 기 (프로브로 지칭됨)에 대한 영역 또는 고친화도를 결정하고자 하는 컴퓨터 프로그램 (GRID)을 생성하였다. 따라서, GRID는 결합을 증진시킬 수 있는 공지된 화학 물질에 대한 변형을 시사하기 위한 도구를 제공한다. GRID에 의해 고친화도의 영역으로서 확인된 부위 중 일부는 일련의 공지된 리간드로부터 간섭적으로 결정된 "약물작용발생단 패턴"에 상응하는 것으로 예상될 수 있다. 본원에 사용된 "약물작용발생단 패턴"은 결합에 중요한 것으로 여겨지는 화학 물질의 특징의 기하학적 배열이다. 신규 리간드에 대한 검색 스크린으로서 약물작용발생단 패턴을 사용하려는 시도가 있었다 (Jakes et al. (1987) J Mol Graph 5:41-48; Brint et al. (1987) J Graph 5:49-56; Jakes et al. (1986) J Mol Graph 4:12-20).
본 발명의 또 다른 추가의 실시양태는 입체적으로 허용되고 또한 화학 물질과 주변 아미노산 잔기 사이의 유리한 화학적 상호작용을 달성할 가능성이 높은 방식으로 약물표적화가능한 영역으로 배향될 수 있는 화학 물질에 대해 CCDB와 같은 데이터베이스를 검색하는 컴퓨터 알고리즘, 예컨대 CLIX를 이용한다. 상기 방법은 상이한 화학 기에 대한 유리한 결합 위치의 앙상블(ensemble) 면에서 영역을 특징화한 다음, 개별 후보 화학 기와 앙상블의 구성원과의 최대 공간 일치를 유발하는 화학 물질의 배향을 조사하는 것을 기반으로 한다. CLIX의 알고리즘적 세부사항은 문헌 [Lawrence et al. (1992) Proteins 12:31-41]에 기재되어 있다.
이러한 방식으로, 화학 물질이 약물표적화가능한 영역에 결합하거나 이를 방해할 수 있는 효율을 컴퓨터 평가에 의해 시험하고 최적화할 수 있다. 예를 들어, 약물표적화가능한 영역과의 유리한 회합을 위해, 화학 물질은 바람직하게는 그의 결합된 상태와 미세(fine) 상태 사이의 에너지에서 비교적 작은 차이 (즉, 결합의 작은 변형 에너지)를 나타내야 한다. 따라서, 특정의 보다 바람직한 화학 물질은 약 10 kcal/mol 이하, 보다 바람직하게는 7 kcal/mol 이하의 결합의 변형 에너지를 갖도록 설계될 것이다. 화학 물질은 전체 결합 에너지가 유사한 하나 초과의 입체형태로 약물표적화가능한 영역과 상호작용할 수 있다. 이들 경우에, 결합의 변형 에너지는 유리 물질의 에너지와 화학 물질이 표적에 결합할 때 관찰된 입체형태의 평균 에너지 사이의 차이로 간주된다.
이러한 방식으로, 본 발명은 HCMV gB 폴리펩티드로부터의 약물표적화가능한 영역의 적어도 일부분을 포함하는 분자 또는 복합체의 구조 좌표의 세트를 컴퓨터 모델링 애플리케이션에 공급하는 단계; 화학 물질의 구조 좌표의 세트를 컴퓨터 모델링 애플리케이션에 공급하는 단계; 및 화학 물질이 분자 또는 복합체에 결합할 것으로 예상되는지 여부를 결정하는 단계를 포함하며, 여기서 분자 또는 복합체에의 결합은 HCMV gB 폴리펩티드의 활성의 잠재적 조정을 나타내는 것인, HCMV gB 폴리펩티드의 활성의 잠재적 조정제를 확인 또는 설계하기 위한 컴퓨터-보조 방법을 제공한다.
또 다른 측면에서, 본 발명은 HCMV gB 폴리펩티드의 약물표적화가능한 영역의 적어도 일부분을 포함하는 분자 또는 복합체의 구조 좌표의 세트를 컴퓨터 모델링 애플리케이션에 공급하는 단계; 화학 물질에 대한 구조 좌표의 세트를 컴퓨터 모델링 애플리케이션에 공급하는 단계; 화학 물질과 분자 또는 분자 복합체의 활성 부위 사이의 잠재적 결합 상호작용을 평가하는 단계; 화학 물질을 구조적으로 변형시켜 변형된 화학 물질에 대한 구조 좌표의 세트를 생성하는 단계; 변형된 화학 물질이 분자 또는 복합체에 결합할 것으로 예상되는지 여부를 결정하는 단계를 포함하며, 여기서 분자 또는 복합체에의 결합은 HCMV gB 폴리펩티드의 잠재적 조정을 나타내는 것인, HCMV gB 폴리펩티드에 대한 잠재적 조정제를 확인 또는 설계하기 위한 컴퓨터-보조 방법을 제공한다.
한 실시양태에서, 잠재적 조정제는 펩티드 또는 다른 화합물 또는 화학물질 라이브러리를 스크리닝함으로써 수득될 수 있다 (Scott and Smith, Science, 249:386-390 (1990); Cwirla et al., Proc. Natl. Acad. Sci., 87:6378-6382 (1990); Devlin et al., Science, 249:404-406 (1990)). 이어서, 이러한 방식으로 선택된 잠재적 조정제는 하나 이상의 유망한 잠재적 약물이 확인될 때까지 컴퓨터 모델링 프로그램에 의해 체계적으로 변형될 수 있다. 이러한 분석은 HIV 프로테아제 조정제의 개발에 효과적인 것으로 나타났다 (Lam et al., Science 263:380-384 (1994); Wlodawer et al., Ann. Rev. Biochem. 62:543-585 (1993); Appelt, Perspectives in Drug Discovery and Design 1:23-48 (1993); Erickson, Perspectives in Drug Discovery and Design 1:109-128 (1993)). 대안적으로, 잠재적 조정제는 화학물질의 라이브러리, 예컨대 제3자, 예컨대 화학 및 제약 회사로부터 허가될 수 있는 것으로부터 선택될 수 있다. 제3 대안은 잠재적 조정제를 신생 합성하는 것이다.
예를 들어, 특정 실시양태에서, 본 발명은 HCMV gB 폴리펩티드에 대한 잠재적 조정제를 제조하는 방법을 제공하며, 상기 방법은 화학 물질 또는 상기 화학 물질을 함유하는 분자를 합성하여 HCMV gB 폴리펩티드의 잠재적 조정제를 수득하는 것을 포함하며, 상기 화학 물질은 HCMV gB 폴리펩티드의 적어도 하나의 약물표적화가능한 영역을 포함하는 분자 또는 복합체의 구조 좌표의 세트를 컴퓨터 모델링 애플리케이션에 공급하는 단계; 화학 물질에 대한 구조 좌표의 세트를 컴퓨터 모델링 애플리케이션에 공급하는 단계; 및 화학 물질이 활성 부위, 예를 들어 약물표적화가능한 영역에서 분자 또는 복합체에 결합할 것으로 예상되는지 여부를 결정하는 단계 (여기서 상기 분자 또는 복합체에의 결합은 잠재적 조정을 나타냄)를 포함하는 컴퓨터-보조 과정 동안 확인되었다. 이 방법은 화학 물질과 분자 또는 분자 복합체의 활성 부위, 예를 들어 약물표적화가능한 영역사이의 잠재적 결합 상호작용을 평가하는 단계 및 화학 물질을 구조적으로 변형시켜 변형된 화학 물질에 대한 구조 좌표의 세트를 생성하는 단계를 추가로 포함할 수 있으며, 상기 단계는 1회 이상 반복될 수 있다.
일단 잠재적 조정제가 확인되면, 이는 이어서 고처리량 검정을 비롯하여, 물론 거대분자에 따라 거대분자에 대한 임의의 표준 검정에서 시험될 수 있다. 조정제의 구조에 대한 추가의 개선은 일반적으로 필요할 것이며, 특정한 스크리닝 검정, 특히 예를 들어 15N NMR 이완율 결정 또는 HCMV gB 폴리펩티드에 결합된 조정제를 사용한 X선 결정학에 의한 추가의 구조 분석에 의해 제공된 임의의 및/또는 모든 단계의 연속 반복에 의해 이루어질 수 있다. 이들 연구는 생화학적 검정과 함께 수행될 수 있다.
일단 확인되면, 잠재적 조정제를 모델 구조로서 사용할 수 있고, 화합물에 대한 유사체를 수득할 수 있다. 이어서, 유사체를 HCMV gB 폴리펩티드에 결합하는 그의 능력에 대해 스크리닝한다. 잠재적 조정제의 유사체는 선행자 조정제보다 더 높은 결합 친화도로 HCMV gB 폴리펩티드에 결합하는 경우에 조정제로서 선택될 수 있다.
관련 접근법에서, 반복 약물 설계는 표적 단백질의 조정제를 확인하는 데 사용된다. 반복 약물 설계는 단백질/조정제 복합체의 연속 세트의 3차원 구조를 결정하고 평가함으로써 단백질과 조정제 사이의 회합을 최적화하는 방법이다. 반복 약물 설계에서, 일련의 단백질/조정제 복합체의 결정을 수득한 다음, 각각의 복합체의 3차원 구조를 해석한다. 이러한 접근법은 각각의 복합체의 단백질과 조정제 사이의 회합에 대한 통찰을 제공한다. 예를 들어, 이러한 접근법은 조정 활성을 갖는 조정제를 선택하고, 이러한 새로운 단백질/조정제 복합체의 결정을 수득하고, 복합체의 3차원 구조를 해석하고, 새로운 단백질/조정제 복합체와 이전에 해석된 단백질/조정제 복합체 사이의 회합을 비교함으로써 달성될 수 있다. 조정제의 변화가 단백질/조정제 회합에 어떻게 영향을 미치는지를 관찰함으로써, 이들 회합을 최적화할 수 있다.
상기 기재된 바와 같이, 약물표적화가능한 영역과 회합하는 화학 물질을 설계 및/또는 확인하는 것 이외에도, 동일한 기술 및 방법을 사용하여 단백질 표적의 친화성 영역, 선택성 영역 또는 바람직하지 않은 영역과 회합하거나 또는 회합하지 않는 화학 물질을 설계 및/또는 확인할 수 있다. 이러한 방법에 의해, 동일한 종 또는 다중 종으로부터의 하나 또는 소수의 표적에 대한, 또는 대안적으로 다중 표적에 대한 선택성이 달성될 수 있다.
예를 들어, 하나의 약물표적화가능한 영역, 예를 들어 친화도 영역 또는 선택성 영역에 대한 결합 에너지가 또 다른 영역, 예를 들어 바람직하지 않은 영역에 대한 결합 에너지보다 약 20%, 30%, 50% 내지 약 60% 또는 그 초과만큼 더 유리한 화학 물질이 설계되고/거나 확인될 수 있다. (a) 2개 초과의 영역 사이에서, (b) 동일한 표적으로부터의 상이한 영역 (선택성, 친화성 또는 바람직하지 않음) 사이에서, (c) 상이한 표적의 영역 사이에서, (d) 상이한 종으로부터의 상동체의 영역 사이에서, 또는 (e) 다른 조합 사이에서 차이가 관찰되는 경우가 있을 수 있다. 대안적으로, 비교는 2개 이상의 해당 영역을 갖는 상기 화학 물질의 Kd, 통상적으로 겉보기 Kd를 참조하여 이루어질 수 있다.
또 다른 측면에서, 전향적 조정제는 표적 단백질 상의 2개의 인근의 약물표적화가능한 영역에 대한 결합에 대해 스크리닝된다. 예를 들어, 표적 폴리펩티드의 제1 영역에 결합하는 조정제는 제2 인접 영역에 결합하지 않는다. 제2 영역에 대한 결합은 제1 영역에 대한 조정제 (또는 잠재적 조정제)의 존재 하에 수행된 원래 스크린 또는 제2 스크린에서 상이한 세트의 아미드 화학적 이동의 변화를 모니터링함으로써 결정될 수 있다. 화학적 이동 변화의 분석으로부터, 제2 영역에 대한 잠재적 조정제의 대략적인 위치가 확인된다. 이어서, 영역에 대한 결합을 위한 제2 조정제의 최적화는 구조적으로 관련된 화합물 (예를 들어, 상기 기재된 바와 같은 유사체)을 스크리닝함으로써 수행된다. 제1 영역 및 제2 영역에 대한 조정제가 확인되는 경우에, 3원 복합체에서의 그의 위치 및 배향은 실험적으로 결정될 수 있다. 이러한 구조적 정보에 기초하여, 제1 영역에 대한 조정제 및 제2 영역에 대한 조정제가 연결된, 연결된 화합물, 예를 들어 통합된 조정제가 합성된다. 특정 실시양태에서, 2종의 조정제는 공유 연결되어 통합된 조정제를 형성한다. 이러한 통합된 조정제는 2종의 개별 조정제 중 어느 하나보다 표적에 대해 더 높은 결합 친화도를 갖는지를 결정하기 위해 시험될 수 있다. 통합된 조정제는 2종의 조정제 중 어느 하나보다 표적에 대해 더 높은 결합 친화도를 갖는 경우에 조정제로서 선택된다. 더 큰 통합된 조정제는 유사한 방식으로, 예를 들어 표적 상의 3개의 인근 영역에 결합하는 3개의 조정제를 연결하여, 연결된 조정제보다 표적에 대해 훨씬 더 높은 친화도를 갖는 다중연결된 통합된 조정제를 형성하도록 구축될 수 있다. 본 실시예에서, 조정제가 모든 약물표적화가능한 영역에 결합하는 것이 바람직한 것으로 가정된다. 그러나, 특정 약물표적화가능한 영역에 대한 결합이 바람직하지 않아서, 표적의 모든 약물표적화가능한 영역은 아니지만 적어도 1개의 약물표적화가능한 영역에 대한 결합에 기초하여 증가된 특이성을 나타내는 조정제 및 통합된 조정제를 확인하는 데 동일한 기술이 사용될 수 있는 경우가 있을 수 있다.
본 발명은 상기 기재된 바와 같은 약물 설계를 사용하는 다수의 방법을 제공한다. 예를 들어, 한 측면에서, 본 발명은 (a) 결정화된 HCMV gB 폴리펩티드 또는 그의 단편의 3차원 구조를 결정하는 단계; 및 (b) 결정화된 폴리펩티드 또는 단편의 3차원 구조에 기초하여 후보 치료제를 설계하는 단계를 포함하는, HCMV gB 폴리펩티드의 조정제에 대해 스크리닝하기 위한 후보 치료제를 설계하는 방법을 고려한다.
(ii) 조정제 라이브러리
조합 라이브러리의 합성 및 스크리닝은 관심 유기 분자의 확인 및 연구를 위한 검증된 전략이다. 본 발명에 따르면, 대상 약물표적화가능한 영역에 결합하거나, 그와 상호작용하거나, 또는 그의 활성/기능을 조정하는 분자를 함유하는 라이브러리의 합성은 용액 상, 고체 상, 또는 용액 상과 고체 상 합성 기술의 조합을 위한 확립된 조합 방법을 사용하여 수행될 수 있다. 조합 라이브러리의 합성은 관련 기술분야에 널리 공지되어 있고, 검토되었다 (예를 들어, 문헌 ["Combinatorial Chemistry", Chemical and Engineering News, Feb. 24, 1997, p. 43; Thompson et al., Chem. Rev. (1996) 96:555] 참조). 많은 라이브러리가 상업적으로 입수가능하다. 관련 기술분야의 통상의 기술자는 임의의 특정한 실시양태에 대한 방법의 선택이 합성될 분자의 특정 수, 특정 반응 화학, 및 특정 기기, 예컨대 본 발명의 라이브러리의 제조 및 분석을 위한 로봇 기기의 이용가능성에 좌우될 것임을 인지할 것이다. 특정 실시양태에서, 라이브러리를 생성하기 위해 수행되는 반응은 고수율로, 및 적용가능한 경우에 입체선택적 및 위치선택적 방식으로 진행되는 그의 능력에 대해 선택된다.
본 발명의 한 측면에서, 본 발명의 라이브러리는 용액 상 기술을 사용하여 생성된다. 조합 라이브러리의 합성을 위한 용액상 기술의 전통적인 이점은 훨씬 더 넓은 범위의 반응의 이용가능성, 및 생성물이 특징화될 수 있는 상대적 용이성, 및 하기 논의된 바와 같은 라이브러리 구성원의 용이한 확인을 포함한다. 예를 들어, 특정 실시양태에서, 용액 상 조합 라이브러리의 생성을 위해, 병행 합성 기술이 이용되며, 여기서 모든 생성물은 그 자체의 반응 용기에서 개별적으로 어셈블리된다. 특정한 병행 합성 절차에서, 반응이 발생할 수 밀리리터의 용매를 보유할 수 있는 n개 행 및 m개 열의 작은 웰을 함유하는 마이크로타이터 플레이트가 이용된다. 이어서, 반응물 A, 예컨대 리간드의 n종의 변이체, 및 반응물 B, 예컨대 제2 리간드의 m종의 변이체를 사용하여 nxm개 웰에서 nxm종의 변이체를 수득하는 것이 가능하다. 관련 기술분야의 통상의 기술자는 이러한 특정한 절차가 보다 작은 라이브러리를 원하는 경우에 가장 유용하고, 특이적 웰이 특정한 웰에서 라이브러리 구성원을 확인하기 위한 준비된 수단을 제공할 수 있음을 인식할 것이다.
본 발명의 다른 실시양태에서, 고체 상 합성 기술이 이용된다. 고체 상 기술은 반응이 완료되도록 하는데, 이는 과량의 시약이 이용될 수 있고 미반응 시약이 세척 제거될 수 있기 때문이다. 고체 상 합성은 또한 푸르카(Furka)에 의해 개발된 병행 합성 기술 이외에도, "분할 및 풀(split and pool)"로 불리는 기술을 사용할 수 있게 한다. 예를 들어, 문헌 [Furka et al., Abstr. 14th Int. Congr. Biochem., (Prague, Czechoslovakia (1988) 5:47; Furka et al., Int. J. Pept. Protein Res. (1991) 37:487; Sebestyen et al., Bioorg. Med. Chem. Lett. (1993) 3:413]을 참조한다. 이러한 기술에서, 관련 분자의 혼합물이 동일한 반응 용기에서 제조될 수 있고, 따라서 매우 큰 라이브러리의 합성에 요구되는 용기, 예컨대 1백만개 또는 1백만개 초과의 라이브러리 구성원을 함유하는 것의 수를 실질적으로 감소시킨다. 예로서, 출발 물질이 부착된 고체 지지체는 n개의 용기로 분할될 수 있으며, 여기서 n은 이러한 출발 물질과 반응할 시약 A의 종의 수를 나타낸다. 반응 후, n개의 용기로부터의 내용물은 합한 다음, m개의 용기로 분할되며, 여기서 m은 이제 개질된 출발 물질과 반응할 시약 B의 종의 수를 나타낸다. 목적하는 수의 시약이 출발 물질과 반응하여 본 발명의 라이브러리를 생성할 때까지 이 절차가 반복된다.
본 발명에서 고체상 기술의 사용은 또한 특정 코딩 기술의 사용을 포함할 수 있다. 구체적인 코딩 기술은 문헌 [Czarnik in Current Opinion in Chemical Biology (1997) 1:60]에서 검토되었다. 관련 기술분야의 통상의 기술자는 또한 보다 작은 고체 상 라이브러리가 특이적 반응 웰, 예컨대 96 웰 플레이트에서, 또는 플라스틱 핀 상에서 생성되는 경우에, 이들 라이브러리 구성원의 반응 이력이 또한 특정한 플레이트에서의 그의 공간 좌표에 의해 확인될 수 있고, 따라서 공간적으로 코딩된다는 것을 인식할 것이다. 다른 실시양태에서, 코딩 기술은 고체 지지체에 부착된 특정 "확인 작용제"의 사용을 수반하며, 이는 특정 라이브러리 구성원의 공간 좌표를 참조하지 않고 그의 구조의 결정을 가능하게 한다. 이러한 코딩 기술의 예는 공간 코딩 기술, "티백" 방법을 포함한 그래픽 코딩 기술, 화학적 코딩 방법, 및 분광광도 코딩 방법을 포함하나 이에 제한되지는 않는다. 관련 기술분야의 통상의 기술자는 본 발명에 사용될 특정한 코딩 방법이 목적하는 라이브러리 구성원의 수 및 사용된 반응 화학에 기초하여 선택되어야 함을 인지할 것이다.
특정 실시양태에서, 본 발명의 분자는 관련 기술분야에 공지된 고체 지지체 화학을 사용하여 제조될 수 있다. 예를 들어, 최대 20개 또는 그 초과의 아미노산을 갖는 폴리펩티드는 상업적으로 입수가능한 장비 (예컨대 어드밴스드 켐테크(Advanced Chemtech) 다중 유기 합성기) 상에서 표준 고체 상 기술을 사용하여 생성될 수 있다. 특정 실시양태에서, 출발 물질 또는 이후의 반응물은 연결 유닛을 통해, 또는 직접 고체 상에 부착되고, 후속적으로 목적하는 분자의 합성에 사용될 수 있다. 연결의 선택은 분자 및 고체 지지체 단위의 반응성 및 이들 연결의 안정성에 좌우될 것이다. 링커 분자를 통한 고체 지지체에 대한 직접적인 부착은 라이브러리 구성원을 고체 지지체로부터 탈착시키지 않기를 원하는 경우에 유용할 수 있다. 예를 들어, 생물학적 활성의 직접적인 온-비드 분석을 위해, 라이브러리 구성원과 고체 지지체 사이의 보다 강한 상호작용이 바람직할 수 있다. 대안적으로, 연결 시약의 사용은 고체 지지체로부터의 본 발명의 라이브러리 구성원의 보다 용이한 절단이 요구되는 경우에 유용할 수 있다.
본 발명의 대상 방법의 자동화와 관련하여, 다양한 기기를 사용하여 본 발명의 화학물질 라이브러리의 용이하고 효율적인 제조, 및 이러한 라이브러리의 구성원을 검정하는 방법을 가능하게 할 수 있다. 일반적으로, 대상 화학물질 라이브러리의 합성 및 제조와 관련하여 사용된 바와 같은 자동화는, 단일 분자 대신 라이브러리가 제조되기 때문에 다수의 횟수로 반복되어야 하는 1개 이상의 작동적 단계를 기기가 완료하게 하는 것을 수반한다. 자동화의 예는, 비제한적으로, 기기가 시약의 첨가, 이들의 혼합 및 반응, 반응 혼합물의 여과, 용매를 사용한 고체의 세척, 용매의 제거 및 첨가 등을 완료하게 하는 것을 포함한다. 자동화는 본 발명의 조성물에 사용하기 위한 분자를 제조, 정제 및 검정하기 위한 것을 포함한, 반응 체계의 임의의 단계에 적용될 수 있다.
가능한 자동화 범위가 존재한다. 예를 들어, 대상 라이브러리의 합성은 완전히 자동화되거나 또는 단지 부분적으로 자동화될 수 있다. 완전히 자동화된 경우에, 대상 라이브러리는 합성 공정을 개시한 후에 시약 병을 재충전하거나 또는 필요에 따라 기기를 모니터링 또는 프로그램화하는 것 이외에, 임의의 인간 개입 없이 기기에 의해 제조될 수 있다. 대상 라이브러리의 합성이 완전히 자동화될 수 있지만, 라이브러리 구성원의 정제, 확인 등을 위한 인간 개입이 존재할 필요가 있을 수 있다.
대조적으로, 대상 라이브러리의 합성의 부분 자동화는 라이브러리를 생성하는 반응 스키마의 물리적 단계, 예컨대 혼합, 교반, 여과 등에 대한 일부 로봇 보조를 수반하지만, 단지 시약 병을 재충전하거나 또는 기기를 모니터링 또는 프로그램화하는 것 이외의 일부 인간 개입을 여전히 필요로 한다. 이러한 유형의 로봇 자동화는 통상의 유기 합성 및 생물학적 기술에 의해 제공되는 보조와 구별되는데, 이는 부분 자동화에서도, 분자의 라이브러리가 제조되고 있기 때문에 기기가 다수의 횟수로 완료되도록 요구되는 임의의 스키마의 단계 중 하나 이상을 여전히 완료하기 때문이다.
특정 실시양태에서, 대상 라이브러리는 다중 반응 용기 (예를 들어, 마이크로타이터 플레이트 등)에서 제조될 수 있고, 라이브러리의 특정한 구성원의 정체는 각각의 용기의 위치에 의해 결정될 수 있다. 다른 실시양태에서, 대상 라이브러리는 용액 중에서 합성될 수 있고, 디컨볼루션(deconvolution) 기술을 사용하여 특정 구성원의 정체를 결정할 수 있다.
본 발명의 한 측면에서, 대상 스크리닝 방법은 고정된 라이브러리를 이용하여 수행될 수 있다. 특정 실시양태에서, 고정된 라이브러리는 상기 기재된 바와 같은 미생물에 결합하는 능력을 가질 것이다. 적합한 지지체의 선택은 관련 기술분야의 통상의 기술자에게 일상적일 것이다. 중요한 기준은 지지체의 반응성이 라이브러리를 제조하는 데 필요한 반응을 방해하지 않는다는 것을 포함할 수 있다. 불용성 중합체 지지체는 폴리스티렌, 폴리스티렌/디비닐벤젠 공중합체 등을 기재로 하는 관능화 중합체, 예컨대 본원에 기재된 임의의 입자를 포함한다. 중합체 지지체는 다른 고체 지지체에 코팅, 그라프팅 또는 달리 결합될 수 있음이 이해될 것이다.
또 다른 실시양태에서, 중합체 지지체는 가역적 가용성 중합체에 의해 제공될 수 있다. 이러한 중합체 지지체는 폴리비닐 알콜 또는 폴리에틸렌 글리콜 (PEG)을 기재로 하는 관능화 중합체를 포함한다. 가용성 지지체는 적합한 불활성 비용매의 첨가에 의해 불용성이 될 수 있다 (예를 들어, 침전될 수 있다). 가용성 중합체 지지체를 사용하여 수행되는 반응의 한 이점은 용액 중에서의 반응이 불용성 중합체 지지체 상에서 수행되는 반응보다 더 신속하고, 수율이 더 높고, 더 완전할 수 있다는 것이다.
목적하는 용액 상 또는 고체 지지체 결합된 주형의 합성이 완료되면, 주형은 이어서 목적하는 용액 상 또는 고체 지지체 결합된 구조를 생성하는 추가의 반응에 이용가능하다. 고체 지지체 결합된 주형의 사용은 보다 신속한 분할 및 풀 기술의 사용을 가능하게 한다.
라이브러리 구성원의 특징화는 표준 분석 기술, 예컨대 질량 분광측정법, 195Pt 및 1H NMR을 포함한 핵 자기 공명 분광분석법, 크로마토그래피 (예를 들어, 액체 등) 및 적외선 분광분석법을 사용하여 수행될 수 있다. 관련 기술분야의 통상의 기술자는 특정한 분석 기술의 선택이 본 발명의 라이브러리 구성원이 용액 상인지 또는 고체 상인지에 좌우될 것임을 인식할 것이다. 이러한 특징화 이외에도, 라이브러리 구성원은 보다 용이한 확인이 가능하도록 별도로 합성될 수 있다.
(iii) 시험관내 검정
임의의 형태의 HCMV gB 폴리펩티드, 예를 들어 표적 약물표적화가능한 영역을 포함하는 전장 폴리펩티드 또는 그의 단편은 시험관내 검정에서 후보 치료제의 활성을 평가하는 데 사용될 수 있다. 이러한 검정의 한 실시양태에서, 약물표적화가능한 영역의 생물학적 활성, 관심 단백질-단백질 상호작용 또는 대상 약물표적화가능한 영역을 수반하는 단백질 복합체의 형성을 조정하는 작용제가 확인된다. 이러한 검정의 또 다른 실시양태에서, 대상 약물표적화가능한 영역에 결합하거나 그와 상호작용하는 작용제가 확인된다. 특정 실시양태에서, 시험 작용제는 유기 소분자이다. 후보 작용제는, 예를 들어 하기 부류의 화합물로부터 선택될 수 있다: 세제, 단백질, 펩티드, 펩티드모방체, 항체, 소분자, 시토카인 또는 호르몬. 일부 실시양태에서, 후보 치료제 ("후보 작용제" 또는 "시험 작용제"로도 공지됨)는 화합물의 라이브러리에 있을 수 있다. 이들 라이브러리는 상기 기재된 바와 같은 조합 합성 방법을 사용하여 생성될 수 있다. 본 발명의 특정 실시양태에서, 표적 약물표적화가능한 영역에 결합하는 상기 후보 치료제의 능력은 시험관내 검정에 의해 평가될 수 있다. 다음 섹션에서 논의되는 어느 한 실시양태에서, 결합 검정은 또한 생체내일 수 있다.
본 발명은 또한 본 발명의 펩티드 또는 폴리펩티드, 또는 이를 코딩하는 폴리뉴클레오티드의 작용을 조정하는 화합물을 확인하기 위해 다수의 화합물을 스크리닝하는 방법을 제공한다. 스크리닝 방법은 고처리량 기술을 수반할 수 있다. 예를 들어, 조정제에 대해 스크리닝하기 위해, HCMV gB 폴리펩티드 및 이러한 폴리펩티드의 표지된 기질 또는 리간드를 포함하는 합성 반응 믹스, 공동세포 구획, 예컨대 막, 세포 외피 또는 세포 벽, 또는 그의 임의의 제제, 전체 세포 또는 조직, 또는 심지어 전체 유기체를 HCMV gB 폴리펩티드의 조정제일 수 있는 후보 치료제의 부재 또는 존재 하에 인큐베이션한다. HCMV gB 폴리펩티드를 조정하는 후보 치료제의 능력은 표지된 리간드의 감소된 결합 또는 이러한 기질로부터의 생성물의 감소된 생산에 반영된다. 기질로부터 생성물의 생산 속도 또는 수준의 검출은 리포터 시스템을 사용함으로써 증진될 수 있다. 이와 관련하여 유용할 수 있는 리포터 시스템은 생성물로 전환된 비색 표지된 기질, 본 발명의 핵산 또는 폴리펩티드 활성의 변화에 반응성인 리포터 유전자, 및 관련 기술분야에 공지된 결합 검정을 포함하나 이에 제한되지는 않는다. 예를 들어, 한 실시양태에서, 조정제 또는 억제제 펩티드는 FITC에 접합되고, 표적 결합 포켓에 대한 FITC-표지된 펩티드의 친화도는 형광 편광 검정을 사용하여 측정된다. 표적 결합 포켓에 대한 조정제 또는 억제제의 특이성은 문헌 [Schmidt et al. ((2010) PLoS Pathog 6(4): e1000851)]에 기재된 "풀 다운" 방법을 사용하여 조정제 또는 억제제의 비오티닐화 유도체를 사용함으로써 제시될 수 있다. 비리온과의 조정제 또는 억제제 회합을 검출하기 위해, 비오티닐-표지된 조정제 또는 억제제를 비리온과 함께 인큐베이션하고, 스트렙타비딘 수지를 첨가하여 이뮤노블롯팅에 의해 검출한다. 비리온과의 조정제 또는 억제제 회합을 추가로 확인하기 위해, 조정제 또는 억제제의 존재 하에 피렌 표지된 비리온을 사용하고, 엑시머 강도를 체크한다. 바람직한 실시양태에서, 형광 편광 및 FRET는 도메인 V 펩티드의 결합 및 그 결합의 억제를 검출하는 방법이다. 추가 실시양태에서, 표면 플라즈몬 공명은 약물표적화가능한 영역에 대한 조정제 또는 억제제의 결합에 대해 스크리닝하는 데 사용된다.
HCMV gB 폴리펩티드의 조정제에 대한 검정의 또 다른 예는 경쟁적 억제 검정에 적절한 조건 하에 HCMV gB 펩티드 또는 폴리펩티드 및 잠재적 조정제를 HCMV gB 폴리펩티드에 결합하는 분자, HCMV gB 폴리펩티드에 결합하는 재조합 분자, 천연 기질 또는 리간드, 또는 기질 또는 리간드 모방체와 조합하는 경쟁적 검정이다. 본 발명의 펩티드 또는 폴리펩티드는 예컨대 방사능 또는 비색 화합물에 의해 표지됨으로써, 결합 분자에 결합되거나 생성물로 전환되는 HCMV gB 펩티드 또는 폴리펩티드의 분자의 수가 잠재적 조정제의 유효성을 평가하기 위해 정확하게 측정될 수 있다. 한 측면에서, HCMV gB 펩티드는 잔기 M648-K700 (서열식별번호: 260), M648-V697 (서열식별번호: 261), S647-V697 (서열식별번호: 262), S647-V663 (서열식별번호: 263), I653-V697 (서열식별번호: 264), I653-Q692 (서열식별번호: 265), I653-L680 (서열식별번호: 266), I653-S675 (서열식별번호: 267), I653-Y667 (서열식별번호: 268), R662-V697 (서열식별번호: 269), R662-Q692 (서열식별번호: 270), R662-L680 (서열식별번호: 271), R662-S675 (서열식별번호: 272), L664-F678 (서열식별번호: 273), S668-V697 (서열식별번호: 274), S668-Q692 (서열식별번호: 275), S668-V677 (서열식별번호: 276), D679-V697 (서열식별번호: 277), L680-V697 (서열식별번호: 278), L680-Q692 (서열식별번호: 279) 및 R693-K700 (서열식별번호: 280)을 갖는 서열식별번호: 1의 단편이다.
폴리펩티드의 활성을 조정하는 분자를 확인하는 다수의 방법이 관련 기술분야에 공지되어 있다. 예를 들어, 하나의 이러한 방법에서, HCMV gB 폴리펩티드를 시험 화합물과 접촉시키고, 시험 화합물의 존재 하에 HCMV gB 폴리펩티드의 활성을 결정하며, 여기서 HCMV gB 폴리펩티드의 활성의 변화는 시험 화합물이 HCMV gB 폴리펩티드의 활성을 조정한다는 것을 나타낸다. 특정 예에서, 시험 화합물은 HCMV gB 폴리펩티드의 활성에 대해 효능작용하고, 다른 예에서, 시험 화합물은 HCMV gB 폴리펩티드의 활성에 대해 길항작용한다.
또 다른 예에서, HCMV의 HCMV gB 폴리펩티드 의존성 성장 또는 감염성을 조정하는 화합물은 (a) HCMV gB 폴리펩티드를 시험 화합물과 접촉시키고; (b) 시험 화합물의 존재 하에 폴리펩티드의 활성을 결정함으로써 확인될 수 있으며, 여기서 폴리펩티드의 활성의 변화는 시험 화합물이 HCMV의 성장 또는 감염성을 조정할 수 있음을 나타낸다.
특정 대상 검정에서, 대상 조성물을 사용하여 결과를 평가하기 위해, 공지된 분자, 예컨대 표적에 대해 공지된 결합 친화도를 갖는 분자와 비교할 수 있다. 예를 들어, 공지된 분자 및 새로운 관심 분자를 검정할 수 있다. 대상 복합체에 대한 검정의 결과는 공지된 분자에 대한 결과와 비교될 수 있는 유형 및 크기일 것이다. 대상 복합체가 검정에서 공지된 분자의 반응과 정량적으로 상이한 반응 유형을 나타내는 경우에, 검정에서의 이러한 복합체에 대한 결과는 양성 또는 음성 결과로 간주될 것이다. 특정 검정에서, 반응의 크기는 공지된 분자 결과에 대한 반응 백분율로서, 예를 들어 이들이 동일한 경우에는 공지된 결과의 100%로서 표현될 수 있다.
관련 기술분야의 통상의 기술자가 이해할 바와 같이, 본 설명에 기초하여, 결합 검정은 폴리펩티드에 결합하는 작용제를 검출하는 데 사용될 수 있다. 무세포 검정을 사용하여 폴리펩티드와 상호작용할 수 있는 분자를 확인할 수 있다. 바람직한 실시양태에서, 이러한 분자를 확인하기 위한 무세포 검정은 표적 및 시험 분자 또는 시험 분자의 라이브러리를 함유하는 반응 혼합물로 본질적으로 구성된다. 시험 분자는, 예를 들어 표적의 공지된 결합 파트너의 유도체, 예를 들어 생물학적 불활성 펩티드, 또는 소분자일 수 있다. 결합 능력에 대해 시험될 작용제는, 예를 들어 박테리아, 효모 또는 다른 유기체 (예를 들어 천연 생성물)에 의해 생산되거나, 화학적으로 생산되거나 (예를 들어 펩티드모방체를 포함한 소분자), 또는 재조합적으로 생산될 수 있다. 특정 실시양태에서, 시험 분자는 지질, 탄수화물, 펩티드, 펩티드모방체, 펩티드-핵산 (PNA), 단백질 (항체 포함), 소분자, 천연 생성물, 압타머 및 올리고뉴클레오티드로 이루어진 군으로부터 선택된다. 본 발명의 다른 실시양태에서, 결합 검정은 무세포가 아니다. 바람직한 실시양태에서, 표적에 결합하는 분자를 확인하기 위한 이러한 검정은 표적 미생물 및 시험 분자 또는 시험 분자의 라이브러리를 함유하는 반응 혼합물을 포함한다.
분자 및 천연 추출물의 라이브러리를 시험하는 많은 후보 스크리닝 프로그램에서, 주어진 기간 내에 조사된 분자의 수를 최대화하기 위해 고처리량 검정이 바람직하다. 정제된 또는 반-정제된 단백질 또는 용해물로 유래될 수 있는 것과 같은 무세포 시스템에서 수행되는 본 발명의 검정은 표적과 시험 분자 사이의 결합의 신속한 개발 및 비교적 용이한 검출을 허용하도록 생성될 수 있다는 점에서 종종 "1차" 스크린으로서 바람직하다. 더욱이, 시험 분자의 세포 독성 및/또는 생체이용률의 효과는 일반적으로 시험관내 시스템에서 무시될 수 있으며, 대신 검정은 표적에 결합하는 분자의 능력에 주로 초점을 맞춘다. 따라서, 잠재적 결합 분자는 세포 용해물에서 관심 기능적 상호작용의 구성에 의해 생성된 무세포 검정에서 검출될 수 있다. 대안적 포맷에서, 검정은 하기 기재된 바와 같이 용해물-기반 검정에 비해 다수의 이익을 제공하는 재구성된 단백질 혼합물로서 유래될 수 있다.
한 측면에서, 본 발명은 HCMV gB 폴리펩티드 약물표적화가능한 영역에 결합하는 분자를 스크리닝하는 데 사용될 수 있는 검정을 제공한다. 예시적인 결합 검정에서, 관심 분자는 표적 세포 표면 폴리펩티드로부터 생성된 혼합물과 접촉된다. 표적 폴리펩티드에 대한 예상된 결합의 검출 및 정량화는 표적에 대한 결합에 대한 분자의 효능을 결정하기 위한 수단을 제공한다. 분자의 효능은 다양한 농도의 시험 분자를 사용하여 수득된 데이터로부터 용량 반응 곡선을 생성함으로써 평가될 수 있다. 또한, 대조군 검정을 또한 수행하여 비교를 위한 기준선을 제공할 수 있다. 대조군 검정에서, 복합체의 형성은 시험 분자의 부재 하에 정량화된다.
분자와 표적 HCMV gB 폴리펩티드 또는 HCMV gB 폴리펩티드를 함유하는 미생물 사이의 복합체 형성은 다양한 기술에 의해 검출될 수 있으며, 이들 중 다수는 상기에 효과적으로 기재되어 있다. 예를 들어, 복합체의 형성에서의 조정은, 예를 들어 검출가능하게 표지된 (예를 들어 방사성표지된, 형광 표지된, 또는 효소적으로 표지된) 단백질을 사용하여, 면역검정에 의해, 또는 크로마토그래피 검출에 의해 정량화될 수 있다.
따라서, 본 발명의 한 예시적인 스크리닝 검정은 HCMV gB 폴리펩티드 또는 그의 기능적 단편을 시험 분자 또는 시험 분자의 라이브러리와 접촉시키는 단계 및 복합체의 형성을 검출하는 단계를 포함한다. 검출 목적을 위해, 예를 들어 분자는 특이적 마커로 표지될 수 있고, 시험 분자 또는 시험 분자의 라이브러리는 상이한 마커로 표지될 수 있다. 이어서, 인큐베이션 단계 및 세척 단계 후에 2개의 표지의 수준을 결정함으로써 시험 분자와 폴리펩티드 또는 그의 단편의 상호작용을 검출할 수 있다. 세척 단계 후 2개의 표지의 존재는 상호작용을 나타낸다. 이러한 검정은 또한 전체 표적 세포와 함께 작용하도록 변형될 수 있다.
HCMV gB 폴리펩티드 표적과 분자 사이의 상호작용은 또한 광학 현상인 표면 플라즈몬 공명 (SPR)을 검출하는 실시간 BIA (바이오몰레큘라 인터랙션 애널리시스(Biomolecular Interaction Analysis), 파마시아 바이오센서 아베(Pharmacia Biosensor AB))를 사용하여 확인될 수 있다. 검출은 생체특이적 계면에서의 거대분자의 질량 농도의 변화에 좌우되고, 상호작용물의 어떠한 표지화도 요구하지 않는다. 한 실시양태에서, 시험 분자의 라이브러리는 예를 들어 미세유동 세포의 하나의 벽을 형성하는 센서 표면 상에 고정될 수 있다. 이어서, 표적을 함유하는 용액을 센서 표면 위로 연속적으로 유동시킨다. 신호 기록에 나타난 바와 같은 공명각의 변화는 상호작용이 일어났음을 나타낸다. 이러한 기술은, 예를 들어 문헌 [BIAtechnology Handbook by Pharmacia]에 추가로 기재되어 있다.
바람직한 실시양태에서, 비복합체화된 형태로부터의 복합체의 분리를 용이하게 하기 위해, 뿐만 아니라 검정의 자동화를 수용하기 위해 표적을 고정시키는 것이 바람직할 것이다. 시험 분자에 대한 폴리펩티드의 결합은 반응물을 함유하기에 적합한 임의의 용기에서 달성될 수 있다. 예는 마이크로타이터 플레이트, 시험 튜브 및 마이크로-원심분리 튜브를 포함한다. 한 실시양태에서, 표적이 매트릭스에 결합되도록 하는 도메인을 부가하는 융합 단백질이 제공될 수 있다. 예를 들어, 글루타티온-S-트랜스퍼라제/폴리펩티드 (GST/폴리펩티드) 융합 단백질은 글루타티온 세파로스 비드 (시그마 케미칼(Sigma Chemical), 미주리주 세인트 루이스) 또는 글루타티온 유도체화된 마이크로타이터 플레이트 상에 흡착될 수 있고, 이어서 이를 표지된 시험 분자 (예를 들어, S35 표지됨, P33 표지됨 등)와 조합하고, 혼합물을 복합체 형성에 도움이 되는 조건 하에, 예를 들어 염 및 pH에 대한 생리학적 조건 하에 인큐베이션하지만, 약간 더 엄격한 조건이 바람직할 수 있다. 인큐베이션 후에, 비드를 세척하여 임의의 미결합 표지를 제거하고, 매트릭스를 고정하고, 방사성표지를 직접 결정하거나 (예를 들어, 비드를 섬광체에 넣음), 또는 복합체를 후속적으로 해리시킨 후에 상청액에서 결정한다. 대안적으로, 복합체는 매트릭스로부터 해리되고, SDS-PAGE에 의해 분리되고, 비드 분획에서 발견된 폴리펩티드 또는 결합 파트너의 수준은 첨부된 실시예에 기재된 바와 같은 표준 전기영동 기술을 사용하여 겔로부터 정량화될 수 있다. 시험 분자가 고정되고, 표지된 표적이 고정된 시험 분자와 함께 인큐베이션되는 상기 기술이 또한 변형될 수 있다. 본 발명의 한 실시양태에서, 시험 분자는 예를 들어 최종 조성물을 생성하기 위해 임의로 링커를 통해 본 발명의 입자에 고정된다.
매트릭스 상에 표적 또는 분자를 고정하기 위한 다른 기술이 대상 검정에 사용될 수 있다. 예를 들어, 표적 또는 분자는 비오틴 및 스트렙타비딘의 접합을 이용하여 고정될 수 있다. 예를 들어, 비오티닐화 폴리펩티드 분자는 관련 기술분야에 널리 공지된 기술 (예를 들어, 비오티닐화 키트, 피어스 케미칼스(Pierce Chemicals), 일리노이주 록포드)을 사용하여 비오틴-NHS (N-히드록시-숙신이미드)로부터 제조되고, 스트렙타비딘-코팅된 96 웰 플레이트 (피어스 케미칼)의 웰에 고정될 수 있다. 대안적으로, 표적 또는 분자와 반응성인 항체는 플레이트의 웰로 유도체화될 수 있고, 표적 또는 분자는 항체 접합에 의해 웰에 포획될 수 있다. 상기와 같이, 시험 분자의 제제를 플레이트의 폴리펩티드 제시 웰에서 인큐베이션하고, 웰에 포획된 복합체의 양을 정량화할 수 있다. GST-고정된 복합체에 대해 상기 설명된 것 이외에, 상기 복합체를 검출하기 위한 예시적인 방법은 복합체와 반응성이거나 복합체 성분 중의 하나와 반응성인 항체를 사용한 복합체의 면역검출; 및 표적 또는 분자와 연관된 효소 활성 (내인성 또는 외인성 활성)의 검출에 의존하는 효소-연결 검정을 포함한다. 후자의 경우에, 효소는 표적 또는 분자와 화학적으로 접합되거나 융합 단백질로서 제공될 수 있다. 예시를 위해, 표적 폴리펩티드는 화학적으로 가교되거나 또는 양고추냉이 퍼옥시다제와 유전적으로 융합될 수 있고, 분자와의 복합체에 포획된 폴리펩티드의 양은 효소의 발색원성 기질, 예를 들어 3,3'-디아미노-벤자딘 테트라히드로클로라이드 또는 4-클로로-1-나프톨로 평가될 수 있다. 마찬가지로, 폴리펩티드 및 글루타티온-S-트랜스퍼라제를 포함하는 융합 단백질이 제공될 수 있고, 복합체 형성은 1-클로로-2,4-디니트로벤젠을 사용하여 GST 활성을 검출함으로써 정량화될 수 있다 (Habig et al. (1974) J Biol Chem 249:7130).
복합체에 포획된 성분 중 하나를 정량화하기 위해 면역검출에 의존하는 과정의 경우, 성분에 대한 항체, 예컨대 항-폴리펩티드 항체가 사용될 수 있다. 대안적으로, 복합체에서 검출하고자 하는 성분은 폴리펩티드 서열 이외에도, 항체가 (예를 들어, 상업적 공급원으로부터) 용이하게 이용가능한 제2 폴리펩티드를 포함하는 융합 단백질 형태로 "에피토프 태그부착"될 수 있다. 예를 들어, 상기 기재된 GST 융합 단백질은 또한 GST 모이어티에 대한 항체를 사용한 결합의 정량화에 사용될 수 있다. 다른 유용한 에피토프 태그는 c-myc로부터의 10-잔기 서열을 포함하는 myc-에피토프 (예를 들어, 문헌 [Ellison et al. (1991) J Biol Chem 266:21150-21157] 참조), 뿐만 아니라 pFLAG 시스템 (인터내셔널 바이오테크놀로지스, 인크.) 또는 pEZZ-단백질 A 시스템 (파마시아(Pharmacia), 뉴저지주)을 포함한다.
본 검정의 특정 시험관내 실시양태에서, 표적을 함유하는 용액은 적어도 반정제된 단백질의 재구성된 단백질 혼합물을 포함한다. 반정제란, 재구성된 혼합물에 사용된 성분이 다른 세포성 또는 바이러스성 단백질로부터 미리 분리되었다는 것을 의미한다. 예를 들어, 세포 용해물과 달리, 표적 단백질은 혼합물 내의 모든 다른 단백질에 비해 적어도 50% 순도로 혼합물 내에 존재하고, 보다 바람직하게는 90-95% 순도로 존재한다. 대상 방법의 특정 실시양태에서, 재구성된 단백질 혼합물은 고도로 정제된 단백질을 혼합하여, 재구성된 혼합물에 결합 활성을 측정하는 능력을 방해하거나 달리 변경시킬 수 있는 다른 단백질 (예컨대 세포 또는 바이러스 기원의 것)이 실질적으로 결여되도록 함으로써 유래된다. 한 실시양태에서, 재구성된 단백질 혼합물의 사용은 표적:분자 상호작용 조건의 보다 신중한 제어를 가능하게 한다.
본 발명의 또 다른 실시양태에서, HCMV gB 폴리펩티드를 발현하는 바이러스가 세포에 결합하거나, 그와 융합하거나, 또는 그를 감염시키는 것을 방지하는 시험 분자의 능력을 결정하기 위하여, 바이러스 융합 또는 바이러스 감염성 검정의 변이가 이용될 수 있다. 융합, 결합 또는 감염이 방지되면, 분자 또는 조성물은 치료제로서 유용할 수 있다.
모든 스크리닝 방법은 다양한 검정 포맷을 사용함으로써 달성될 수 있다. 본 개시내용에 비추어, 본원에 명백하게 기재되지 않은 것은 그럼에도 불구하고 관련 기술분야의 통상의 기술자에 의해 공지되고 이해될 것이다. 단백질 복합체 또는 단백질-핵산 복합체의 형성, 및 효소적 활성과 같은 조건에 근접하는 검정 포맷은 많은 상이한 형태로 생성될 수 있으며, 이는 관련 기술분야의 통상의 기술자가 본 설명에 기초하여 인지할 것이고, 무세포 시스템, 예를 들어 정제된 단백질 또는 세포 용해물에 기초한 검정, 뿐만 아니라 무손상 세포를 이용하는 세포-기반 검정을 포함하나 이에 제한되지는 않는다. 주어진 표적:분자 상호작용으로부터 생성된 결합을 검정하는 것은 반응물을 함유하기에 적합한 임의의 용기에서 달성될 수 있다. 예는 마이크로타이터 플레이트, 시험 튜브 및 마이크로-원심분리 튜브를 포함한다. 임의의 검정은 키트 포맷으로 제공될 수 있고, 자동화될 수 있다. 하기 구체화된 검정 중 다수는 다른 특정한 검정에 적용될 수 있는 일반적 원리, 예컨대 융합의 차단 또는 방지에 의존한다.
(iv) 생체내 검정
바이러스 감염 및/또는 질환의 동물 모델은 HCMV 감염을 치료 또는 예방하는 데 있어서 잠재적 약물 표적의 유효성을 평가하기 위한 생체내 검정으로서 사용될 수 있다. 다수의 적합한 동물 모델이 하기에 간략하게 기재되지만, 이들 모델은 단지 예이고, 변형이거나 또는 완전히 상이한 동물 모델이 본 발명의 방법에 따라 사용될 수 있다. 동물 모델은 관련 기술분야에 공지된 방법에 의해, 예를 들어 동물을 HCMV로 감염시킴으로써, 또는 이러한 감염에 취약하도록 동물을 유전자 조작함으로써 개발될 수 있다 (예를 들어, 문헌 [Maidji, E. et al. Impaired Surfactant Production by Alveolar Epithelial Cells in a SCID-hu Lung Mouse Model of Congenital Human Cytomegalovirus Infection. J Virol. 2012 Dec; 86(23): 12795-12805; Crawford, L.B. et al. Humanized Mouse Models of Human Cytomegalovirus Infection. Curr Opin Virol. 2015 Aug; 13: 86-92] 참조).
추가로, 바이러스 감염성 검정은 HCMV 감염을 치료 또는 예방하는 데 있어서 잠재적 약물 표적의 유효성을 평가하기 위한 생체내 검정으로서 사용될 수 있다. 예를 들어, 예컨대 바이러스 항원을 측정하는 경쟁적, 비대칭 리버스 트랜스크립타제-매개 PCR (RT-PCR) 검정 및 유동 세포측정 검정, 및 플라크 검정이 잠재적 약물 표적의 유효성을 평가하는 데 사용될 수 있다.
추가로, 세포-세포 융합 검정은 HCMV 감염을 치료 또는 예방하는 데 있어서 잠재적 약물 표적의 유효성을 평가하기 위한 생체내 검정으로서 사용될 수 있다.
다양한 다른 생체내 모델이 이용가능하고, 특정 병원체 또는 특정 시험 작용제에 적절한 경우에 사용될 수 있다.
또한, 감염 모델에 사용된 동물의 종, 및 그 동물의 특정 유전자 구성이 특정 시험 작용제의 효과의 효과적인 평가에 기여할 수 있음을 주목하는 것이 관련된다. 예를 들어, 면역-부적격 동물은 일부 경우에 면역-적격 동물보다 바람직할 수 있다. 예를 들어, 적격 면역계의 작용은 면역-부적격 동물에서의 유사한 감염과 비교하여 시험 작용제의 효과를 어느 정도 차폐할 수 있다. 또한, 많은 기회 감염이 실제로 면역손상 환자에서 발생하므로, 유사한 면역학적 환경에서 감염을 모델링하는 것이 적절하다.
E. 제약 조성물
본 발명의 제약 조성물은 본 발명에 따라 확인된 임의의 조정제 또는 그의 제약상 허용되는 염, 및 제약상 허용되는 담체, 아주반트 또는 비히클을 포함한다. 용어 "제약상 허용되는 담체"는 조성물의 다른 성분과 상용성이고 그의 수용자에게 유해하지 않다는 의미에서 "허용되는" 담체(들)를 지칭한다.
이러한 제약 조성물의 제조 및 사용 방법이 또한 본 발명에 포함된다. 본 발명의 제약 조성물은 경구로, 비경구로, 흡입 스프레이에 의해, 국소로, 직장으로, 비강으로, 협측으로, 질로, 또는 이식된 저장소를 통해 투여될 수 있다. 본원에 사용된 용어 비경구는 피하, 피내, 정맥내, 근육내, 관절내, 활막내, 흉골내, 척수강내, 병변내 및 두개내 주사 또는 주입 기술을 포함한다.
본원에 기재된 조정제의 1일당 약 0.01 내지 약 100 mg/kg 체중, 바람직하게는 1일당 약 0.5 내지 약 75 mg/kg 체중의 투여량 수준이 본 발명의 폴리펩티드에 대해 병원성 기원 종에 의해 매개되는 질환 및 상태를 포함한 HCMV 감염에 의해 유발되는 질환 및 상태의 예방 및 치료에 유용하다. 단일 투여 형태를 제조하기 위해 담체 물질과 조합될 수 있는 활성 성분의 양은 치료되는 숙주 및 특정한 투여 방식에 따라 달라질 것이다. 전형적인 제제는 약 5% 내지 약 95% 활성 화합물 (w/w)을 함유할 것이다. 대안적으로, 이러한 제제는 약 20% 내지 약 80% 활성 화합물을 함유한다.
F. 키트
본 발명은 HCMV 감염을 치료 또는 예방하기 위한 키트를 제공한다. 예를 들어, 키트는 HCMV gB 폴리펩티드의 조정제로서 본원에서 확인된 화합물을 포함하는 조성물을 포함할 수 있다. 조성물은 제약상 허용되는 부형제를 포함하는 제약 조성물일 수 있다. 키트를 수반하는 다른 실시양태에서, 본 발명은 본 발명의 조성물, 및 임의로 그의 사용 지침서를 포함하는 키트를 고려한다. 키트 성분은 상기 방법의 수동 또는 부분 또는 완전 자동화 실시를 위해 포장될 수 있다. 이러한 키트는, 예를 들어 영상화, 진단, 요법 및 다른 적용을 포함한 다양한 용도를 가질 수 있다.
G. 폴리펩티드의 제조
본원에 기재된 폴리펩티드는 관련 기술분야에 공지된 상용 방법에 의해, 예컨대 적합한 벡터를 사용하는 재조합 숙주 시스템에서의 발현에 의해 제조될 수 있다. 적합한 재조합 숙주 세포는 예를 들어 곤충 세포, 포유동물 세포, 조류 세포, 박테리아 및 효모 세포를 포함한다. 적합한 곤충 세포의 예는, 예를 들어 Sf9 세포, Sf21 세포, Tn5 세포, 슈나이더(Schneider) S2 세포, 및 하이 파이브(HIGH FIVE) 세포 (모 트리코플루시아 니(Trichoplusia ni) BTI-TN-5B1-4 세포주로부터 유래된 클론 단리물)를 포함한다. 적합한 포유동물 세포의 예는 차이니즈 햄스터 난소 (CHO) 세포, 인간 배아 신장 세포 (전형적으로 전단된 아데노바이러스 유형 5 DNA에 의해 형질전환된 HEK293 또는 Expi 293 세포), NIH-3T3 세포, 293-T 세포, Vero 세포, 및 HeLa 세포를 포함한다. 적합한 조류 세포는, 예를 들어 닭 배아 줄기 세포 (예를 들어, EBx.RTM. 세포), 닭 배아 섬유모세포, 닭 배아 배세포, 메추라기 섬유모세포 (예를 들어 ELL-O), 및 오리 세포를 포함한다. 적합한 곤충 세포 발현 시스템, 예컨대 바큘로바이러스-벡터화 시스템은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 바큘로바이러스/곤충 세포 발현 시스템을 위한 물질 및 방법은 키트 형태로 상업적으로 입수가능하다. 조류 세포 발현 시스템 또한 관련 기술분야의 통상의 기술자에게 공지되어 있다. 유사하게, 박테리아 및 포유동물 세포 발현 시스템이 또한 관련 기술분야에 공지되어 있다.
곤충 또는 포유동물 세포에서 재조합 단백질의 발현을 위한 다수의 적합한 벡터는 관련 기술분야에 널리 공지되어 있고 통상적이다. 적합한 벡터는 하기 중 하나 이상을 포함하나 이에 제한되지는 않는 많은 성분을 함유할 수 있다: 복제 기점; 선택가능 마커 유전자; 1개 이상의 발현 제어 요소, 예컨대 전사 제어 요소 (예를 들어, 프로모터, 인핸서, 종결인자), 및/또는 1개 이상의 번역 신호; 및 선택된 숙주 세포 (예를 들어, 포유동물 기원의 또는 이종성 포유동물 또는 비-포유동물 종으로부터의 것) 내의 분비 경로에 대한 표적화를 위한 신호 서열 또는 리더 서열. 예를 들어, 곤충 세포에서의 발현을 위해, 적합한 바큘로바이러스 발현 벡터, 예컨대 PFASTBAC를 사용하여 재조합 바큘로바이러스 입자를 생산한다. 바큘로바이러스 입자를 증폭시키고, 이를 사용하여 곤충 세포를 감염시켜 재조합 단백질을 발현시킨다. 포유동물 세포에서의 발현을 위해, 목적하는 포유동물 숙주 세포 (예를 들어, 차이니즈 햄스터 난소 세포)에서 구축물의 발현을 유도할 벡터가 사용된다.
폴리펩티드는 임의의 적합한 방법을 사용하여 정제될 수 있다. 예를 들어, 면역친화성 크로마토그래피에 의해 폴리펩티드를 정제하는 방법은 관련 기술분야에 공지되어 있다. 침전, 및 소수성 상호작용, 이온 교환, 친화도, 킬레이트화 및 크기 배제와 같은 다양한 유형의 크로마토그래피를 포함한 목적하는 폴리펩티드를 정제하는 적합한 방법은 관련 기술분야에 공지되어 있다. 적합한 정제 계획은 이들 또는 다른 적합한 방법 중 2종 이상을 사용하여 생성될 수 있다. 원하는 경우에, 폴리펩티드는 정제를 용이하게 하는 "태그", 예컨대 에피토프 태그 또는 히스티딘 태그를 포함할 수 있다. 이러한 태그부착된 폴리펩티드는 예를 들어 킬레이팅 크로마토그래피 또는 친화도 크로마토그래피에 의해 조건화 배지로부터 정제될 수 있다.
1. 폴리펩티드를 코딩하는 핵산
또 다른 측면에서, 본 발명은 본원에 기재된 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다. 이들 핵산 분자는 DNA, cDNA 및 RNA 서열을 포함한다. 핵산 분자는 벡터, 예컨대 발현 벡터 내로 혼입될 수 있다.
일부 실시양태에서, 핵산은 자기-복제성 RNA 분자를 포함한다. 일부 실시양태에서, 핵산은 변형된 RNA 분자를 포함한다. 또 다른 측면에서, 본 발명은 본원에 기재된 실시양태 중 어느 하나에 따른 핵산을 포함하는 조성물에 관한 것이다.
2. 화합물-안정화된 폴리펩티드
본 발명자들은, 예를 들어 WO 2021/260510 (그 전문이 본원에 참조로 포함됨)에 기재된 바와 같은 HCMV gB에 대한 비스(아릴)티오우레아 화합물의 결합에 의해 확인될 수 있는 융합전 입체형태에서 안정화된 폴리펩티드를 발견하였다. 구조 1a,b (화학식 I)에 의해 예시된 바와 같은 비스(아릴)티오우레아 화합물은 CMV의 고도로 강력하고 특이적인 억제제이다. 한 측면에서, HCMV gB 폴리펩티드는 비스(아릴)티오우레아 화합물에 결합할 수 있다. 바람직한 실시양태에서, 화합물은 HCMV gB 폴리펩티드의 융합후 입체형태에 결합하지 않는다.
바람직한 실시양태에서, 화합물은 그의 비스(아릴)티오우레아 티오지올 유사체이다. 가장 바람직하게는, 일부 실시양태에서, 화합물은 하기 구조를 갖는 N-{4-[({(1S)-1-[3,5-비스(트리플루오로메틸)페닐]에틸}카르바모티오일)아미노]페닐}-1,3-티아졸-4-카르복스아미드이다.
또 다른 실시양태에서, 화합물은 하기 구조를 갖는다.
여러 실시양태에서, 폴리펩티드는 천연 HCMV gB 융합후 입체형태에서 존재하지 않는 HCMV gB 융합전 에피토프를 포함한다.
일부 실시양태에서, 적어도 약 90%의 폴리펩티드 (예컨대, 균질 집단 내의 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%의 폴리펩티드)가 비스(아릴)티오우레아 화합물 (예를 들어, 예컨대 비스(아릴)티오우레아 화합물의 티아졸 유사체, 보다 바람직하게는 N-{4-[({(1S)-1-[3,5-비스(트리플루오로메틸)페닐]에틸}카르바모티오일)아미노]페닐}-1,3-티아졸-4-카르복스아미드)에 의해 결합된다. 일부 실시양태에서, 비스(아릴)티오우레아 화합물에 결합할 수 있는 폴리펩티드는 융합후 입체형태를 갖지 않는다. 오히려, 폴리펩티드는 융합전 입체형태, 예컨대 HCMV gB 융합전 입체형태를 갖는다.
또 다른 실시양태에서, 폴리펩티드는 비스(아릴)티오우레아 화합물에 의해 특이적으로 결합되지 않은 HCMV gB 폴리펩티드로부터 적어도 80% 단리되거나, 적어도 90%, 95%, 98%, 99%, 또는 바람직하게는 99.9% 단리될 수 있다.
3. 폴리펩티드를 포함하는 조성물 및 그의 사용 방법
본 발명은 본원에 기재된 조정제를 사용하는 조성물 및 방법에 관한 것이다. 예를 들어, 본 발명의 조정제는 면역원성 조성물의 성분으로서 직접 전달될 수 있다. 대안적으로, 조정제가 아미노산을 포함하는 경우에, 본 발명의 아미노산 서열을 코딩하는 핵산은 생체내에서 펩티드, 폴리펩티드 또는 면역원성 단편을 생산하기 위해 투여될 수 있다. 폴리펩티드를 코딩하는 서열을 함유하는 특정의 바람직한 실시양태, 예컨대 단백질 제제, 재조합 핵산 (예를 들어, DNA, RNA, 자기-복제성 RNA, 또는 그의 임의의 변형) 및 바이러스 벡터 (예를 들어, 생, 단일-라운드, 비-복제성 어셈블리된 비리온, 또는 달리 바이러스-유사 입자, 또는 알파바이러스 VRP)가 본원에 추가로 기재되고, 조성물에 포함될 수 있다.
한 측면에서, 본 발명은 본원에 기재된 조정제를 포함하는 면역원성 조성물을 제공한다. 면역원성 조성물은 추가적인 CMV 단백질, 예컨대 gO, gH, gL, pUL128, pUL130, pUL131, pp65, 이들의 면역원성 단편 또는 그의 조합을 포함할 수 있다. 예를 들어, 조정제는 gH 또는 그의 오량체-형성 단편, gL 또는 그의 오량체-형성 단편, pUL128 또는 그의 오량체-형성 단편, pUL130 또는 그의 오량체-형성 단편, 및 pUL131 또는 그의 오량체-형성 단편을 포함하는 CMV 오량체 복합체와 조합될 수 있다. 본 발명의 조정제는 또한 gH 또는 그의 삼량체-형성 단편, gL 또는 그의 삼량체-형성 단편, 및 gO 또는 그의 삼량체-형성 단편을 포함하는 CMV 삼량체 복합체와 조합될 수 있다.
또 다른 측면에서, 본 발명은 포유동물에서 면역 반응을 도출할 수 있는 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다. 폴리뉴클레오티드는 적어도 1종의 관심 폴리펩티드, 예를 들어 항원을 코딩한다. 본원에 개시된 항원은 야생형 (즉, 감염원으로부터 유래됨)일 수 있거나, 또는 바람직하게는 변형된 것 (예를 들어, 조작된 것, 설계된 것 또는 인공인 것)일 수 있다. 본원에 기재된 핵산 분자, 구체적으로 폴리뉴클레오티드는, 일부 실시양태에서, 1종 이상의 관심 펩티드 또는 폴리펩티드를 코딩한다. 이러한 펩티드 또는 폴리펩티드는 항원 또는 항원 분자로서 작용할 수 있다. 용어 "핵산"은 뉴클레오티드의 중합체를 포함하는 임의의 화합물을 포함한다. 이들 중합체는 "폴리뉴클레오티드"로 지칭된다. 본 발명의 예시적인 핵산 또는 폴리뉴클레오티드는 mRNA를 포함한 리보핵산 (RNA), 및 데옥시리보핵산 (DNA)을 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 조성물은 본원에 기재된 폴리펩티드 또는 그의 단편을 코딩하는 DNA를 포함한다. 일부 실시양태에서, 조성물은 본원에 기재된 폴리펩티드 또는 그의 단편을 코딩하는 RNA를 포함한다. 일부 실시양태에서, 조성물은 본원에 기재된 폴리펩티드 또는 그의 단편을 코딩하는 mRNA 폴리뉴클레오티드를 포함한다. 이러한 조성물은 번역 시에 적절한 단백질 입체형태를 생성할 수 있다.
한 측면에서, 본 발명은 야생형 HCMV gB의 아미노산 서열에 비해 적어도 1개의 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 적어도 1종의 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다.
한 측면에서, 본 발명은 야생형 HCMV gB의 아미노산 서열에 비해 적어도 1개의 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 적어도 1종의 DNA 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다.
한 측면에서, 본 발명은 야생형 HCMV gB의 아미노산 서열에 비해 적어도 1개의 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 적어도 1종의 RNA 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다.
일부 실시양태에서, 본 발명은 적어도 1종의 hCMV gB 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프를 코딩하는 적어도 1종의 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다.
일부 실시양태에서, 조성물은 2종 이상의 항원성 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프를 코딩하는 적어도 1종의 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 조성물은 2종 이상의 항원성 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프를 코딩하는 2종 이상의 폴리뉴클레오티드를 포함한다. 1종 이상의 항원성 폴리펩티드는 단일 폴리뉴클레오티드 상에서 코딩될 수 있거나, 또는 다중 (예를 들어, 2종 이상의) 폴리뉴클레오티드 상에서 개별적으로 코딩될 수 있다.
또 다른 측면에서, 본 발명은 (a) 야생형 HCMV 당단백질 B (gB)의 아미노산 서열에 비해 적어도 1개의 도입된 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드; 및 (b) 추가의 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다.
또 다른 측면에서, 본 발명은 (a) 야생형 HCMV 당단백질 B (gB)의 아미노산 서열에 비해 적어도 1개의 도입된 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드; 및 (b) 추가의 폴리펩티드, 바람직하게는 HCMV 항원성 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다. 추가의 폴리펩티드는 HCMV gH, gL, gB, gO, gN 및 gM 및 그의 면역원성 단편 또는 에피토프로부터 선택될 수 있다. 일부 실시양태에서, 추가의 폴리펩티드는 HCMV pp65이다. 일부 실시양태에서, 추가의 폴리펩티드는 gH, gL, gO, gM, gN, UL128, UL130 및 UL131A, 및 그의 단편으로부터 선택될 수 있다. 일부 실시양태에서, 추가의 폴리펩티드는 HCMV gH 폴리펩티드이다. 일부 실시양태에서, 추가의 폴리펩티드는 HCMV gL 폴리펩티드이다. 일부 실시양태에서, 추가의 폴리펩티드는 HCMV gB 폴리펩티드이다. 일부 실시양태에서, 추가의 폴리펩티드는 HCMV gO 폴리펩티드이다. 일부 실시양태에서, 추가의 폴리펩티드는 HCMV gN 폴리펩티드이다. 일부 실시양태에서, 추가의 폴리펩티드는 HCMV gM 폴리펩티드이다. 일부 실시양태에서, 추가의 폴리펩티드는 변이체 gH 폴리펩티드, 변이체 gL 폴리펩티드 또는 변이체 gB 폴리펩티드이다. 일부 실시양태에서, 변이체 HCMV gH, gL 또는 gB 폴리펩티드는 하기 도메인 서열들 중 1종 이상이 결핍되어 있는 말단절단된 폴리펩티드이다: (1) 소수성 막 근위 도메인, (2) 막횡단 도메인 및 (3) 세포질 도메인. 일부 실시양태에서, 말단절단된 HCMV gH, gL 또는 gB 폴리펩티드는 소수성 막 근위 도메인, 막횡단 도메인 및 세포질 도메인이 결핍되어 있다. 일부 실시양태에서, 말단절단된 HCMV gH, gL 또는 gB 폴리펩티드는 엑토도메인 서열만을 포함한다. 일부 실시양태에서, 항원성 폴리펩티드는 UL83, UL123, UL128, UL130 및 UL131A 또는 그의 면역원성 단편 또는 에피토프에서 선택되는 HCMV 단백질이다. 일부 실시양태에서, 항원성 폴리펩티드는 HCMV UL83 폴리펩티드이다. 일부 실시양태에서, 항원성 폴리펩티드는 HCMV UL123 폴리펩티드이다. 일부 실시양태에서, 항원성 폴리펩티드는 HCMV UL128 폴리펩티드이다. 일부 실시양태에서, 항원성 폴리펩티드는 HCMV UL130 폴리펩티드이다. 일부 실시양태에서, 항원성 폴리펩티드는 HCMV UL131 폴리펩티드이다.
또 다른 측면에서, 본 발명은 (a) 야생형 HCMV 당단백질 B (gB)의 아미노산 서열에 비해 적어도 1개의 도입된 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드; 및 (b) 아미노산 서열 서열식별번호: 211-223 중 어느 하나를 갖는 추가의 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다. 또 다른 측면에서, 본 발명은 (a) 야생형 HCMV 당단백질 B (gB)의 아미노산 서열에 비해 적어도 1개의 도입된 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드; 및 (b) 서열식별번호: 141-210으로부터 선택된 서열 중 어느 하나를 갖는 폴리뉴클레오티드를 포함하는 조성물에 관한 것이다. 또 다른 측면에서, 본 발명은 (a) 야생형 HCMV 당단백질 B (gB)의 아미노산 서열에 비해 적어도 1개의 도입된 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드; 및 (b) 서열식별번호: 211-223으로부터 선택된 아미노산 서열 중 어느 하나를 갖는 추가의 폴리펩티드를 포함하는 조성물에 관한 것이다. 일부 실시양태에서, 추가의 폴리펩티드를 코딩하는 폴리뉴클레오티드는 서열식별번호: 224-254 중 임의의 것으로부터 선택된 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 추가의 폴리펩티드를 코딩하는 폴리뉴클레오티드는 서열식별번호: 141-147 중 임의의 것으로부터 선택된 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 추가의 폴리펩티드를 코딩하는 폴리뉴클레오티드는 서열식별번호: 220-223 중 임의의 것으로부터 선택된 적어도 하나의 서열을 갖는다.
일부 실시양태에서, 항원성 폴리펩티드는 2종 이상의 HCMV 단백질, 그의 단편 또는 에피토프를 포함한다. 일부 실시양태에서, 항원성 폴리펩티드는 2종 이상의 당단백질, 그의 단편 또는 에피토프를 포함한다. 일부 실시양태에서, 항원성 폴리펩티드는 적어도 1종의 HCMV 폴리펩티드, 그의 단편 또는 에피토프 및 적어도 1종의 다른 HCMV 단백질, 그의 단편 또는 에피토프를 포함한다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 단일 RNA 폴리뉴클레오티드에 의해 코딩된다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 2종 이상의 RNA 폴리뉴클레오티드에 의해 코딩되며, 예를 들어 각각의 HCMV 폴리펩티드는 별개의 RNA 폴리뉴클레오티드에 의해 코딩된다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 HCMV gH, gL, gB, gO, gN 및 gM 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 당단백질은 pp65 또는 그의 면역원성 단편 또는 에피토프; 및 HCMV gH, gL, gB, gO, gN 및 gM 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프의 임의의 조합을 포함한다. 일부 실시양태에서, 2종 이상의 당단백질은 HCMV gB, 및 gH, gL, gO, gN 및 gM 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프로부터 선택되는 1종 이상의 HCMV 폴리펩티드의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 당단백질은 HCMV gH, 및 gL, gO, gN 및 gM 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프로부터 선택되는 1종 이상의 HCMV 폴리펩티드의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 당단백질은 HCMV gL, 및 gB, gH, gO, gN 및 gM 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프로부터 선택되는 1종 이상의 HCMV 폴리펩티드의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 gB 및 gH이다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 gB 및 gL이다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 gH 및 gL이다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 gB, gL 및 gH이다. 일부 실시양태에서, 2종 이상의 HCMV 단백질은 HCMV UL83, UL123, UL128, UL130 및 UL131A 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 UL123 및 UL130이다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 UL123 및 131A이다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 UL130 및 131A이다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 UL 128, UL130 및 131A이다. 일부 실시양태에서, 2종 이상의 HCMV 단백질은 HCMV gB, gH, gL, gO, gM, gN, UL83, UL123, UL128, UL130 및 UL131A 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 당단백질은 HCMV gH, 및 gL, UL128, UL130 및 UL131A 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프로부터 선택되는 1종 이상의 HCMV 폴리펩티드의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 당단백질은 HCMV gL, 및 gH, UL128, UL130 및 UL131A 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프로부터 선택되는 1종 이상의 HCMV 폴리펩티드의 임의의 조합일 수 있다. 일부 실시양태에서, 2종 이상의 HCMV 폴리펩티드는 gL, gH, UL 128, UL130 및 131 A이다. 조성물이 2종 이상의 HCMV 단백질을 포함하는 이들 실시양태 중 어느 것에서, HCMV gH는 변이체 gH, 예컨대 본원에 개시된 변이체 HCMV gH 당단백질 중 어느 것, 예를 들어 본원에 개시된 변이체 HCMV gH 중 어느 것일 수 있다. 조성물이 2종 이상의 HCMV 단백질을 포함하는 이들 실시양태 중 어느 것에서, HCMV gB는 변이체 gB, 예컨대 본원에 개시된 변이체 HCMV gB 당단백질 중 어느 것, 예를 들어 본원에 개시된 변이체 HCMV gB 중 어느 것일 수 있다. 조성물이 2종 이상의 HCMV gL 단백질을 포함하는 이들 실시양태 중 어느 것에서, HCMV gL은 변이체 gL, 예컨대 본원에 개시된 변이체 HCMV gL 당단백질 중 어느 것, 예를 들어 본원에 개시된 변이체 HCMV gL 중 어느 것일 수 있다.
조성물이 2종 이상의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프를 코딩하는 2종 이상의 RNA 폴리뉴클레오티드 (단일 RNA 폴리뉴클레오티드에 의해 코딩되거나 또는 2종 이상의 RNA 폴리뉴클레오티드에 의해 코딩됨, 예를 들어 각각의 단백질은 별개의 RNA 폴리뉴클레오티드에 의해 코딩됨)를 포함하는 특정 실시양태에서, 2종 이상의 HCMV 단백질은 변이체 gB, 예를 들어 본원에 개시된 임의의 변이체 gB 폴리펩티드, 및 gH, gL, gO, gM, gN, UL128, UL130 및 UL131 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프로부터 선택된 HCMV 단백질이다. 일부 실시양태에서, 2종 이상의 HCMV 단백질은 변이체 gH, 예를 들어 본원에 개시된 임의의 변이체 gH 폴리펩티드, 및 gH, gL, gO, gM, gN, UL128, UL130 및 UL131A 폴리펩티드로부터 선택된 HCMV 단백질 또는 그의 면역원성 단편 또는 에피토프이다. 일부 실시양태에서, 2종 이상의 HCMV 단백질은 변이체 gH, 예를 들어 본원에 개시된 임의의 변이체 gH 폴리펩티드, 및 gH, gL, gO, gM, gN, UL128, UL130 및 UL131 폴리펩티드로부터 선택된 HCMV 단백질 또는 그의 면역원성 단편 또는 에피토프이다. 변이체 HCMV 단백질이 변이체 HCMV gB, 변이체 HCMV gL 및 변이체 HCMV gH인 일부 실시양태에서, 변이체 HCMV 폴리펩티드는 하기 말단절단된 폴리펩티드로부터 선택되는 말단절단된 폴리펩티드이다: 소수성 막 근위 도메인이 결핍됨; 막횡단 도메인이 결핍됨; 세포질 도메인이 결핍됨; 소수성 막 근위, 막횡단 및 세포질 도메인 중 2종 이상이 결핍됨; 및 엑토도메인만을 포함함. 일부 실시양태에서, 조성물은 적어도 1종의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프를 코딩하는 다량체 RNA 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 조성물은 적어도 1종의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프를 코딩하는 적어도 1종의 RNA 폴리뉴클레오티드를 포함하며, 여기서 RNA 폴리뉴클레오티드의 5'UTR은 패턴화된 UTR을 포함한다. 일부 실시양태에서, 패턴화된 UTR은 반복 또는 교대 패턴, 예컨대 ABABAB 또는 AABBAABBAABB 또는 ABCABCABC 또는 1회, 2회 또는 3회 초과로 반복되는 그의 변이체를 갖는다. 이들 패턴에서, 각각의 문자, A, B 또는 C는 뉴클레오티드 수준에서 상이한 UTR을 나타낸다. 일부 실시양태에서, RNA 폴리뉴클레오티드 (예를 들어, 제1 핵산)의 5' UTR은 또 다른 RNA 폴리뉴클레오티드 (제2 핵산)의 UTR과 상보성인 영역을 갖는다. 예를 들어, (예를 들어, 다량체 분자 내의) 연결시키고자 하는 2개의 폴리뉴클레오티드의 UTR 뉴클레오티드 서열은 2개의 UTR이 혼성화하여 다량체 분자를 형성하도록 상보성 영역을 포함하도록 변형될 수 있다. 일부 실시양태에서, HCMV 항원성 폴리펩티드를 코딩하는 RNA 폴리뉴클레오티드의 5' UTR은 다량체성 서열의 형성을 허용하도록 변형된다. 일부 실시양태에서, UL128, UL130, UL131로부터 선택되는 HCMV 단백질을 코딩하는 RNA 폴리뉴클레오티드의 5' UTR은 다량체성 서열의 형성을 허용하도록 변형된다. 일부 실시양태에서, HCMV 폴리펩티드를 코딩하는 RNA 폴리뉴클레오티드의 5' UTR은 다량체성 서열의 형성을 허용하도록 변형된다. 일부 실시양태에서, gH, gL, gB, gO, gM 및 gN으로부터 선택되는 HCMV 폴리펩티드를 코딩하는 RNA 폴리뉴클레오티드의 5' UTR은 다량체성 서열의 형성을 허용하도록 변형된다. 임의의 이들 실시양태에서, 다량체는 이량체, 삼량체, 오량체, 육량체, 칠량체, 팔량체, 구량체 또는 십량체일 수 있다. 따라서, 일부 실시양태에서, gH, gL, gB, gO, gM, gN, UL128, UL130 및 UL131에서 선택되는 HCMV 단백질을 코딩하는 RNA 폴리뉴클레오티드의 5' UTR은 이량체의 형성을 허용하도록 변형된다. 일부 실시양태에서, gH, gL, gB, gO, gM, gN, UL128, UL130 및 UL131A에서 선택되는 HCMV 단백질을 코딩하는 RNA 폴리뉴클레오티드의 5' UTR은 삼량체의 형성을 허용하도록 변형된다. 일부 실시양태에서, gH, gL, gB, gO, gM, gN, UL128, UL130 및 UL131에서 선택되는 HCMV 단백질을 코딩하는 RNA 폴리뉴클레오티드의 5' UTR은 오량체의 형성을 허용하도록 변형된다. 일부 실시양태에서, 조성물은 2종 이상 (예를 들어, 2종, 3종, 4종, 5종 또는 그 초과)의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편 또는 에피토프를 코딩하는 단일 오픈 리딩 프레임을 갖는 적어도 1종의 RNA 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 조성물은 2종, 3종, 4종, 5종 또는 그 초과의 HCMV 항원성 폴리펩티드를 코딩하는 1종 초과의 오픈 리딩 프레임, 예를 들어 2종, 3종, 4종, 5종 또는 그 초과의 오픈 리딩 프레임을 갖는 적어도 1종의 RNA 폴리뉴클레오티드를 포함한다. 이들 실시양태 중 어느 하나에서, 적어도 1종의 RNA 폴리뉴클레오티드는 gH, gB, gL, gO, gM, gN, UL83, UL123, UL128, UL130, UL131A, 및 그의 단편 또는 에피토프로부터 선택되는 2종 이상의 HCMV 항원성 폴리펩티드를 코딩할 수 있다. 일부 실시양태에서, 적어도 1종의 RNA 폴리뉴클레오티드는 UL83 및 UL123을 코딩한다. 일부 실시양태에서, 적어도 1종의 RNA 폴리뉴클레오티드는 gH 및 gL을 코딩한다. 일부 실시양태에서, 적어도 1종의 RNA 폴리뉴클레오티드는 UL128, UL130 및 UL131을 코딩한다. 일부 실시양태에서, 적어도 1종의 RNA 폴리뉴클레오티드는 gH, gL, UL128, UL130 및 UL131을 코딩한다. 적어도 1종의 RNA 폴리뉴클레오티드가 2종 이상 (예를 들어, 2종, 3종, 4종, 5종 또는 그 초과)의 HCMV 항원성 폴리펩티드를 코딩하는 단일 오픈 리딩 프레임을 갖는 일부 실시양태에서, RNA 폴리뉴클레오티드는 추가의 서열, 예를 들어 링커 서열 또는 HCMV RNA 전사체 또는 폴리펩티드의 프로세싱을 보조하는 서열, 예를 들어 절단 부위 서열을 추가로 포함한다. 일부 실시양태에서, 추가의 서열은 프로테아제 서열, 예컨대 푸린 서열일 수 있다. 일부 실시양태에서, 추가의 서열은 자기-절단 2A 펩티드, 예컨대 P2A, E2A, F2A 및 T2A 서열일 수 있다. 일부 실시양태에서, 링커 서열 및 절단 부위 서열은 HCMV 폴리펩티드를 코딩하는 서열 사이에 배치된다.
일부 실시양태에서, 적어도 1종의 RNA 폴리뉴클레오티드는 본원에 개시된 핵산 서열 중 어느 하나로부터 선택된 임의의 핵산 서열, 또는 본원에 개시된 핵산 서열에 대해 적어도 80% (예를 들어, 85%, 90%, 95%, 98%, 99%) 동일성을 갖는 그의 상동체를 포함한다. 일부 실시양태에서, 오픈 리딩 프레임은 코돈-최적화되어 코딩된다. 일부 실시양태는 적어도 1종의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편을 코딩하는 적어도 1종의 RNA 폴리뉴클레오티드 및 적어도 하나의 5' 말단 캡을 포함하는 조성물을 포함한다. 일부 실시양태에서, 5' 말단 캡은 7mG(5')ppp(5')NlmpNp이다.
일부 실시양태에서, 적어도 1종의 폴리뉴클레오티드는 서열식별번호: 141-210 중 어느 하나로부터 선택된 핵산 서열을 포함한다. 일부 실시양태에서, 적어도 1종의 폴리뉴클레오티드는 서열식별번호: 211-223의 아미노산 서열 중 어느 하나에 대해 적어도 90% 동일성을 갖는 폴리펩티드를 코딩한다. 일부 바람직한 실시양태에서, 조성물은 서열식별번호: 216의 아미노산 서열을 갖는 폴리펩티드를 포함하지 않는다. 일부 바람직한 실시양태에서, 조성물은 서열식별번호: 216의 아미노산 서열을 코딩하는 폴리뉴클레오티드를 포함하지 않는다. 일부 바람직한 실시양태에서, 조성물은 서열식별번호: 152의 서열을 갖는 폴리뉴클레오티드를 포함하지 않는다.
일부 실시양태에서, 조성물은 적어도 1종의 폴리뉴클레오티드를 포함하며, 여기서 적어도 1종의 폴리뉴클레오티드는 적어도 하나의 화학적 변형을 갖는다. 일부 실시양태에서, 적어도 1종의 폴리뉴클레오티드는 제2 화학적 변형을 추가로 포함한다. 바람직하게는, 폴리뉴클레오티드는 RAN이다. 일부 실시양태에서, 적어도 하나의 화학적 변형을 갖는 적어도 1종의 폴리뉴클레오티드는 5' 말단 캡을 갖는다. 일부 실시양태에서, 적어도 하나의 화학적 변형은 슈도우리딘, N1-메틸슈도우리딘, N1-에틸슈도우리딘, N1-에틸슈도우리딘, 2-티오우리딘, 4'-티오우리딘, 5-메틸시토신, 2-티오-1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 2-티오-5-아자-우리딘, 2-티오-디히드로슈도우리딘, 2-티오-디히드로우리딘, 2-티오-슈도우리딘, 4-메톡시-2-티오-슈도우리딘, 4-메톡시-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 4-티오-슈도우리딘, 5-아자-우리딘, 디히드로슈도우리딘, 5-메톡시우리딘 및 2'-O-메틸 우리딘으로부터 선택된다. 일부 실시양태에서, 조성물은 적어도 1종의 폴리뉴클레오티드를 포함하며, 여기서 오픈 리딩 프레임 내 우라실의 적어도 80% (예를 들어, 85%, 90%, 95%, 98%, 99%, 100%)는 화학적 변형을 갖고, 임의로 여기서 조성물은 지질 나노입자 내에 제제화된다. 일부 실시양태에서, 오픈 리딩 프레임 내 우라실의 100%는 화학적 변형을 갖는다. 일부 실시양태에서, 화학적 변형은 우라실의 5-위치에 있다. 일부 실시양태에서, 화학적 변형은 N1-메틸 슈도우리딘이다.
일부 실시양태에서, (예를 들어, mRNA 조성물 내의) 폴리뉴클레오티드에 의해 코딩되는 추가의 폴리펩티드 또는 면역원성 단편은 gB, gH, gL, gO, gM, gN, UL83, UL123, UL128, UL130, UL131A, pp65 및 IE1 항원으로부터 선택된다.
일부 실시양태에서, 제1 조성물 및 제2 조성물이 포유동물에게 투여된다. 일부 실시양태에서, 제1 조성물은 야생형 HCMV gB의 아미노산 서열에 비해 적어도 1개의 도입된 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하고; 제2 조성물은 HCMV pp65 또는 그의 항원 단편 또는 에피토프를 코딩하는 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 제1 조성물은 야생형 HCMV gB의 아미노산 서열에 비해 적어도 1개의 도입된 아미노산 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하고; 제2 조성물은 HCMV gH, gL, UL128, UL130 및 UL131로부터 선택된 추가의 폴리펩티드, 또는 그의 항원 단편 또는 에피토프를 코딩하는 적어도 1종의 폴리뉴클레오티드를 코딩하는 폴리뉴클레오티드를 포함한다.
또 다른 측면에서, 본 발명은 포유동물에게 면역 반응을 유도하는 유효량의 조성물을 투여하는 것을 포함하며, 여기서 조성물은 야생형 HCMV gB의 조정제를 코딩하는 폴리뉴클레오티드를 포함하는 것인, 포유동물에서 면역 반응을 유도하는 방법에 관한 것이다.
일부 실시양태에서, 면역 반응은 T 세포 반응 또는 B 세포 반응을 포함한다. 일부 실시양태에서, 면역 반응은 T 세포 반응 및 B 세포 반응을 포함한다. 일부 실시양태에서, 방법은 조성물의 단일 투여를 포함한다. 일부 실시양태에서, 방법은 대상체에게 부스터 용량의 조성물을 투여하는 것을 추가로 포함한다. 본원에 개시된 폴리뉴클레오티드를 포함하는 조성물은 포유동물에서 항원 특이적 면역 반응을 생성하는 유효량으로 제제화될 수 있다.
면역원성 조성물은 아주반트를 포함할 수 있다. 조성물의 유효성을 증진시키기 위한 예시적인 아주반트는 하기를 포함한다: (1) 알루미늄 염 (명반), 예컨대 수산화알루미늄, 인산알루미늄, 황산알루미늄 등; (2) 수중유 에멀젼 제제 (다른 특정 아주반트, 예컨대 뮤라밀 펩티드 (하기 참조) 또는 박테리아 세포벽 성분을 함유하거나 함유하지 않음), 예컨대 예를 들어 (a) 미세유동화기를 사용하여 서브마이크론 입자로 제제화된 5% 스쿠알렌, 0.5% 트윈(TWEEN) 80, 및 0.5% 스팬 85를 함유하는 MF59 (PCT 공개 번호 WO 90/14837), (b) 서브마이크론 에멀젼으로 미세유동화되거나 볼텍싱되어 보다 큰 입자 크기의 에멀젼을 생성하는, 10% 스쿠알란, 0.4% 트윈 80, 5% 플루로닉-차단된 중합체 L121, 및 thr-MDP를 함유하는 SAF, 및 (c) 2% 스쿠알렌, 0.2% 트윈 80, 및 모노포스포릴리피드 A (MPL), 트레할로스 디미콜레이트 (TDM) 및 세포벽 골격 (CWS)으로 이루어진 군으로부터의 1종 이상의 박테리아 세포벽 성분, 바람직하게는 MPL+CWS (데톡스(DETOX)™)를 함유하는 리비(RIBI)™ 아주반트 시스템 (RAS) (리비 이뮤노켐(Ribi Immunochem), 몬타나주 해밀턴); (3) 사포닌 아주반트, 예컨대 QS-21, 스티물론(STIMULON)™ (캠브리지 바이오사이언스(Cambridge Bioscience), 매사추세츠주 우스터) (이것이 사용되거나 또는 그로부터 생성된 입자, 예컨대 ISCOM (면역자극 복합체), ALFQ가 사용될 수 있음); (4) 완전 프로인트 아주반트 (CFA) 및 불완전 프로인트 아주반트 (IFA); (5) 시토카인, 예컨대 인터류킨 (IL-1, IL-2 등), 대식세포 콜로니 자극 인자 (M-CSF), 종양 괴사 인자 (TNF) 등; 및 (6) 조성물의 유효성을 증진시키기 위한 아주반트로서 작용하는 다른 물질. 바람직한 실시양태에서, 아주반트는 사포닌 아주반트, 즉 QS-21을 포함하는 것이다. 일부 실시양태에서, 조성물은 아주반트를 포함하지 않는다. 일부 실시양태에서, 조성물은 지질 나노입자를 추가로 포함한다. 일부 실시양태에서, 조성물은 나노입자로 제제화된다. 일부 실시양태에서, 조성물은 프로타민 또는 다른 양이온성 펩티드 또는 단백질, 예컨대 폴리-L-리신 (PLL)을 포함한 양이온성 또는 다가양이온성 화합물을 추가로 포함한다.
본원에 논의된 각각의 면역원성 조성물은 단독으로 또는 1종 이상의 다른 항원과 조합되어 사용될 수 있으며, 후자는 동일한 바이러스 병원체로부터 유래되거나 또는 또 다른 병원성 공급원 또는 공급원들로부터 유래된다. 이들 조성물은 (감염을 예방하기 위한) 예방적 또는 (감염 후 질환을 치료하기 위한) 치료적 목적으로 사용될 수 있다.
한 실시양태에서, 조성물은 "제약상 허용되는 담체"를 포함할 수 있으며, 이는 그 자체가 조성물을 받은 개체에 유해한 항체의 생산을 유도하지 않는 임의의 담체를 포함한다. 적합한 담체는 전형적으로 크고, 천천히 대사되는 거대분자, 예컨대 단백질, 폴리사카라이드, 폴리락트산, 폴리글리콜산, 중합체 아미노산, 아미노산 공중합체, 지질 응집체 (예컨대 오일 액적 또는 리포솜), 및 불활성 바이러스 입자이다. 이러한 담체는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 추가로, 이들 담체는 아주반트로서 기능할 수 있다. 또한, 항원은 박테리아 톡소이드, 예컨대 디프테리아, 파상풍, 콜레라, 에이치. 필로리(H. pylori) 등 병원체로부터의 톡소이드에 접합될 수 있다.
한 실시양태에서, 조성물은 희석제, 예컨대 물, 염수, 글리세롤, 에탄올 등을 포함한다. 추가로, 보조 물질, 예컨대 습윤제 또는 유화제, pH 완충 물질 등이 이러한 비히클에 존재할 수 있다.
본원에 기재된 조성물은 면역학적 유효량의 폴리펩티드 또는 폴리뉴클레오티드, 뿐만 아니라 필요에 따라 임의의 다른 상기 언급된 성분을 포함할 수 있다. "면역학적 유효량"은 단일 용량으로 또는 일련의 투여의 일부로서 개체에게 상기 양을 투여하는 것이 면역 반응을 유도하는 데 효과적임을 의미한다. 도출된 면역 반응은, 예를 들어 질병, 감염 또는 질환의 치료 및/또는 예방 및/또는 발생률의 감소에 충분할 수 있다. 이 양은 치료될 개체의 건강 및 신체 상태, 치료될 개체의 분류학상 군 (예를 들어, 비인간 영장류, 영장류 등), 항체를 합성하는 개체의 면역계의 능력, 목적하는 보호의 정도, 백신의 제제화, 의료 상황의 치료 의사의 평가, 및 다른 관련 인자에 따라 달라진다. 양은 상용 시험을 통해 결정될 수 있는 비교적 넓은 범위에 속할 것으로 예상된다.
조성물은 비경구로, 예를 들어 주사에 의해 피하로 또는 근육내로 투여될 수 있다. 일부 실시양태에서, 조성물은 포유동물에게 피내 또는 근육내 주사에 의해 투여된다. 다른 투여 방식에 적합한 추가의 제제는 경구 및 폐 제제, 비강 제제, 좌제 및 경피 적용을 포함한다. 경구 제제가 특정 바이러스 단백질에 바람직할 수 있다. 투여 치료는 단일 용량 스케줄 또는 다중 용량 스케줄일 수 있다. 면역원성 조성물은 다른 면역조절제와 함께 투여될 수 있다.
또 다른 측면에서, 본 발명은 시토메갈로바이러스에 대한 면역 반응의 도출을 필요로 하는 대상체에게 상기 기재된 바와 같은 단백질, DNA 분자, RNA 분자 (예를 들어, 자기-복제 RNA 분자) 또는 VRP를 포함하는 면역학적 유효량의 본원에 기재된 폴리펩티드 및/또는 면역원성 조성물을 투여하는 것을 포함하는, 시토메갈로바이러스에 대한 면역 반응을 도출하는 방법을 제공한다. 특정 실시양태에서, 면역 반응은 CMV에 대한 중화 항체의 생산을 포함한다.
면역 반응은 체액성 면역 반응, 세포-매개 면역 반응, 또는 둘 다를 포함할 수 있다. 일부 실시양태에서, 면역 반응은 각각의 전달된 CMV 단백질에 대해 유도된다. 세포-매개 면역 반응은 헬퍼 T-세포 (Th) 반응, CD8+ 세포독성 T-세포 (CTL) 반응, 또는 둘 다를 포함할 수 있다. 일부 실시양태에서, 면역 반응은 체액성 면역 반응을 포함하고, 항체는 중화 항체이다.
중화 항체는 세포의 바이러스 감염을 차단한다. CMV는 상피 세포 및 또한 섬유모세포를 감염시킨다. 일부 실시양태에서, 면역 반응은 두 세포 유형 모두의 감염을 감소시키거나 예방한다. 중화 항체 반응은 보체-의존성 또는 보체-비의존성일 수 있다. 일부 실시양태에서, 중화 항체 반응은 보체-비의존성이다. 일부 실시양태에서 중화 항체 반응은 교차-중화이며; 즉, 투여된 조성물에 대해 생성된 항체는 조성물에 사용된 균주 이외의 균주의 CMV 바이러스를 중화시킨다.
본원에 기재된 폴리펩티드 및/또는 면역원성 조성물은 또한 비-감염된 포유동물의 CMV 감염의 가능성을 감소시키거나, 또는 감염된 포유동물에서 증상을 감소시키는데, 예를 들어 발병의 수, CMV 배출, 및 바이러스를 다른 포유동물로 확산시킬 위험을 감소시키는 데 효과적인 면역 반응을 도출할 수 있다.
한 측면에서, 본 발명은 포유동물에서 CMV 바이러스 배출을 감소시키는 방법에 관한 것이다. 일부 실시양태에서, 본 발명은 포유동물에서 소변 중 CMV 바이러스 배출을 감소시키는 방법에 관한 것이다. 일부 실시양태에서, 본 발명은 포유동물에서 타액 중 CMV 바이러스 배출을 감소시키는 방법에 관한 것이다. 또 다른 측면에서, 본 발명은 포유동물에서 CMV 바이러스 역가를 감소시키는 방법에 관한 것이다. 한 측면에서, 본 발명은 포유동물에서 혈청 내의 CMV 핵산을 감소시키는 방법에 관한 것이다. 용어 "바이러스 배출"은 의학 및 바이러스학에서의 그의 일반적인 의미에 따라 본원에서 사용되고, 감염된 세포로부터의 바이러스의 생산 및 방출을 지칭한다. 일부 실시양태에서, 바이러스는 포유동물의 세포로부터 방출된다. 일부 실시양태에서, 바이러스는 감염된 포유동물로부터 환경으로 방출된다. 일부 실시양태에서, 바이러스는 포유동물 내의 세포로부터 방출된다.
한 측면에서, 본 발명은 포유동물에서 CMV 바이러스 배출을 감소시키는 방법에 관한 것이다. 방법은 본원에 기재된 변형된 CMV gB 폴리펩티드 및/또는 면역원성 조성물을 CMV에 감염되었거나 또는 감염될 위험이 있는 포유동물에게 투여하는 것을 포함한다. 한 실시양태에서, 포유동물에서의 CMV 바이러스 배출의 감소는 변형된 CMV gB를 투여받지 않은 포유동물에서의 바이러스 배출과 비교한 것이다. 또 다른 실시양태에서, 포유동물에서의 CMV 바이러스 배출의 감소는 CMV 오량체 단독 투여 후 또는 폴리펩티드 부재 하의 CMV 오량체 투여 후의 바이러스 배출과 비교한 것이다.
일부 실시양태에서, 포유동물은 인간이다. 일부 실시양태에서, 인간은 소아, 예컨대 유아이다. 일부 다른 실시양태에서, 인간은 청소년기 여성, 가임 연령의 여성, 임신 계획 중인 여성, 임신한 여성, 및 최근에 출산한 여성을 포함한 여성이다. 일부 실시양태에서, 인간은 이식 환자이다.
한 실시양태에서, 챌린지 시토메갈로바이러스 균주는 인간 CMV 균주이다. 한 실시양태에서, 챌린지 시토메갈로바이러스 균주는 폴리펩티드가 유래된 CMV 균주와 상동성이다. 또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 CMV 균주 VR1814와 상동성이다. 또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 CMV 균주 타운과 상동성이다.
한 실시양태에서, 챌린지 시토메갈로바이러스 균주는 변형된 CMV gB 폴리펩티드가 유래된 CMV 균주에 대해 이종성인 인간 CMV 균주이다. 또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 VR1814 CMV 균주에 대해 이종성인 인간 CMV 균주이다. 또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 VR1814 CMV 균주이다. 또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 CMV 균주 타운에 대해 이종성인 인간 CMV 균주이다. 또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 CMV 균주 타운이다.
또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 마카신 헤르페스바이러스 3 단리물 21252 CMV 균주에 상동성인 레서스 CMV 균주이다. 또 다른 실시양태에서, 챌린지 시토메갈로바이러스 균주는 마카신 헤르페스바이러스 3 단리물 21252 CMV 균주이다.
관련 기술분야에서 항체 효력의 유용한 척도는 "50% 중화 역가"이다. 항체 효력의 또 다른 유용한 척도는 하기 중 어느 하나이다: "60% 중화 역가"; "70% 중화 역가"; "80% 중화 역가"; 및 "90% 중화 역가". 예를 들어, 50% 중화 역가를 결정하기 위해, 면역화된 동물로부터의 혈청을 희석하여 희석된 혈청이 세포 내로의 감염성 바이러스의 50%의 진입을 차단하는 능력을 얼마나 유지할 수 있는지를 평가한다. 예를 들어, 역가 700은 혈청이 700배 희석된 후에 감염성 바이러스의 50%를 중화시키는 능력을 보유하였음을 의미한다. 따라서, 보다 높은 역가는 보다 강력한 중화 항체 반응을 나타낸다. 일부 실시양태에서, 이 역가는 약 200, 약 400, 약 600, 약 800, 약 1000, 약 1500, 약 2000, 약 2500, 약 3000, 약 3500, 약 4000, 약 4500, 약 5000, 약 5500, 약 6000, 약 6500, 또는 약 7000의 하한을 갖는 범위이다. 50%, 60%, 70%, 80%, 또는 90% 중화 역가 범위는 약 400, 약 600, 약 800, 약 1000, 약 1500, 약 2000, 약 2500, 약 3000, 약 3500, 약 4000, 약 4500, 약 5000, 약 5500, 약 6000, 약 6500, 약 7000, 약 8000, 약 9000, 약 10000, 약 11000, 약 12000, 약 13000, 약 14000, 약 15000, 약 16000, 약 17000, 약 18000, 약 19000, 약 20000, 약 21000, 약 22000, 약 23000, 약 24000, 약 25000, 약 26000, 약 27000, 약 28000, 약 29000, 또는 약 30000의 상한을 가질 수 있다. 예를 들어, 50% 중화 역가는 약 3000 내지 약 6500일 수 있다. "약"은 언급된 값의 플러스 또는 마이너스 10%를 의미한다. 중화 역가는 하기 구체적 예에 기재된 바와 같이 측정될 수 있다.
면역 반응은 단백질, DNA 분자, RNA 분자 (예를 들어, 자기-복제성 RNA 분자 또는 뉴클레오시드 변형된 RNA 분자), 또는 VRP를 개체, 전형적으로 인간을 포함한 포유동물에게 투여함으로써 자극될 수 있다. 일부 실시양태에서, 유도된 면역 반응은 보호성 면역 반응이고, 즉, 반응은 CMV 감염의 위험 또는 중증도 또는 임상 결과를 감소시킨다. 보호성 면역 반응의 자극은 특히 CMV 감염 및 질환의 위험이 있는 일부 집단에서 특히 바람직하다. 예를 들어, 위험이 있는 집단은 실질 기관 이식 (SOT) 환자, 골수 이식 환자, 및 조혈 줄기 세포 이식 (HSCT) 환자를 포함한다. VRP는 이식 공여자에게 이식전, 또는 이식 수용자에게 이식전 및/또는 이식후 투여될 수 있다. 모체로부터 아이로의 수직 전파는 영아를 감염시키는 통상적인 공급원이기 때문에, 임신 중이거나 임신할 수 있는 여성에게 VRP를 투여하는 것이 특히 유용하다.
임의의 적합한 투여 경로가 사용될 수 있다. 예를 들어, 조성물은 근육내로, 복강내로, 피하로 또는 경피로 투여될 수 있다. 일부 실시양태는 점막내 경로를 통해, 예컨대 구강내로, 비강내로, 질내로, 및 직장내로 투여될 것이다. 조성물은 임의의 적합한 스케줄에 따라 투여될 수 있다.
또한, 세포를 본원에 기재된 조성물과 접촉시키는 것을 포함하는, 세포 내로의 시토메갈로바이러스 진입을 억제하는 방법이 본원에 제공된다.
한 측면에서, 본 발명은 상기 기재된 조정제를 포함하는 조성물에 관한 것이다. 또 다른 측면에서, 본 발명은 이러한 조정제를 코딩하는 핵산 분자 또는 벡터를 포함하는 조성물에 관한 것이다. 추가 측면에서, 본 발명은 상기 기재된 조정제 및 이러한 조정제를 코딩하는 핵산 분자 또는 벡터를 포함하는 조성물에 관한 것이다.
일부 실시양태에서, 조성물은 대상체에서 CMV에 대한 면역 반응을 도출할 수 있는 면역원성 조성물이다. 일부 특정한 실시양태에서, 면역원성 조성물은 본 개시내용에 의해 제공된 조정제 및 제약상 허용되는 담체를 포함하는 제약 조성물이다. 또 다른 실시양태에서, 제약 조성물은 백신이다.
일부 실시양태에서, 조성물, 예컨대 면역원성 조성물 또는 백신은 상기 기재된 2종 이상의 상이한 조정제를 포함한다. 2종 이상의 상이한 조정제는 동일한 도입된 아미노산 돌연변이를 포함할 수 있으나, 상이한 HCMV 균주 또는 하위유형 유래의 gB로부터 유래할 수 있다. 또 다른 실시양태에서, 2종 이상의 상이한 조정제는 천연 HCMV gB와 비교하여 서로 상이한 아미노산 돌연변이를 포함할 수 있다.
바람직한 실시양태에서, 조정제는 수용액에서 가용성이다. 일부 실시양태에서, 조정제는 세제가 결여된 용액에서 가용성이다.
4. 항체 및 진단 용도
상기 기재된 조정제는 폴리클로날 및 모노클로날 둘 다의 항체를 생산하는 데 사용될 수 있다. 폴리클로날 항체를 원하는 경우, 선택된 포유동물 (예를 들어, 마우스, 토끼, 염소, 기니 피그, 말 등)을 면역원성 조정제로 면역화시킨다. 면역화된 동물로부터의 혈청을 수집하고, 공지된 절차에 따라 처리한다. CMV 에피토프에 대한 폴리클로날 항체를 함유하는 혈청이 다른 항원에 대한 항체를 함유하는 경우, 폴리클로날 항체는 면역친화성 크로마토그래피에 의해 정제될 수 있다. 폴리클로날 항혈청의 생산 및 가공 기술은 관련 기술분야에 공지되어 있다.
CMV 에피토프에 대해 지시된 모노클로날 항체는 또한 관련 기술분야의 통상의 기술자에 의해 용이하게 생산될 수 있다. 하이브리도마에 의해 모노클로날 항체를 제조하는 일반적인 방법은 공지되어 있다. 불멸 항체-생산 세포주는 세포 융합에 의해, 및 또한 다른 기술, 예컨대 종양원성 DNA를 사용한 B 림프구의 직접 형질전환, 또는 엡스타인-바르(Epstein-Barr) 바이러스를 사용한 형질감염에 의해 생성될 수 있다. CMV 에피토프에 대해 생산된 모노클로날 항체의 패널은 다양한 특성, 즉 이소형, 에피토프 친화도 등에 대해 스크리닝될 수 있다.
CMV 에피토프에 대해 지시된 모노클로날 및 폴리클로날 항체 둘 다는 진단에 특히 유용하고, 중화하는 것들은 수동적 면역요법에 유용하다. 모노클로날 항체는 특히 항-이디오타입 항체를 생성하는 데 사용될 수 있다.
CMV 항체를 함유하는 혈청과 면역학적으로 반응하는 조정제, 및 이들 조정제에 대해 생성된 항체 둘 다는, 예를 들어 혈액 또는 혈청 샘플을 포함한 생물학적 샘플에서 CMV 항체의 존재 또는 바이러스의 존재를 검출하기 위한 면역검정에 유용할 수 있다. 면역검정의 설계에 많은 변형이 적용되며, 다양한 것들이 관련 분야에 공지되어 있다. 예를 들어, 면역검정은 서열식별번호: 2-43 중 어느 하나에 제시된 서열을 갖는 폴리펩티드를 이용할 수 있다.
대안적으로, 면역검정은 본원에 기재된 폴리펩티드로부터 유래된 바이러스 항원의 조합을 사용할 수 있다. 이는, 예를 들어 본원에 기재된 적어도 1종의 폴리펩티드에 대해 지시된 모노클로날 항체, 본원에 기재된 폴리펩티드에 대해 지시된 모노클로날 항체의 조합, 상이한 바이러스 항원에 대해 지시된 모노클로날 항체, 본원에 기재된 폴리펩티드에 대해 지시된 폴리클로날 항체, 또는 상이한 바이러스 항원에 대해 지시된 폴리클로날 항체를 사용할 수 있다. 프로토콜은, 예를 들어 경쟁 또는 직접 반응에 기초할 수 있거나, 또는 샌드위치 유형 검정일 수 있다. 프로토콜은 또한, 예를 들어 고체 지지체를 사용할 수 있거나, 또는 면역침전에 의한 것일 수 있다. 대부분의 검정은 표지된 항체 또는 폴리펩티드의 사용을 수반하고; 표지는 예를 들어 형광, 화학발광, 방사성 또는 염료 분자일 수 있다. 프로브로부터의 신호를 증폭시키는 검정이 또한 공지되어 있으며; 그의 예는 비오틴 및 아비딘을 이용하는 검정, 및 효소-표지되고 매개된 면역검정, 예컨대 ELISA 검정이다.
면역진단에 적합하고 적절한 표지된 시약을 함유하는 키트는 CMV 에피토프를 함유하는 본 발명의 폴리펩티드 또는 에피토프에 대해 지시된 항체를 포함한 적절한 물질을 적합한 용기 내에, 검정의 수행에 필요한 나머지 시약 및 물질과 함께, 뿐만 아니라 검정 지침서의 적합한 세트와 함께 패키징함으로써 구축된다.
폴리뉴클레오티드 프로브는 또한 진단 키트에 패키징될 수 있다. 진단 키트는 표지될 수 있는 프로브 DNA를 포함하고; 대안적으로, 프로브 DNA는 표지되지 않을 수 있고, 표지를 위한 성분이 키트에 포함될 수 있다. 키트는 또한 특정한 혼성화 프로토콜에 필요한 다른 적합하게 패키징된 시약 및 물질, 예를 들어 표준물질, 뿐만 아니라 시험을 수행하기 위한 지침서를 함유할 수 있다.
본 개시내용의 일부 실시양태는 적어도 1종의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편을 코딩하는 오픈 리딩 프레임 및 적어도 하나의 5' 말단 캡을 갖는 적어도 1종의 리보핵산 (RNA) 폴리뉴클레오티드를 포함하는 HCMV 백신을 제공한다. 일부 실시양태에서, 5' 말단 캡은 7mG(5')ppp(5')NlmpNp이다.
본 개시내용의 일부 실시양태는 적어도 1종의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편을 코딩하는 오픈 리딩 프레임을 갖는 적어도 1종의 리보핵산 (RNA) 폴리뉴클레오티드를 포함하는 HCMV 백신을 제공하며, 여기서 적어도 1종의 리보핵산 (RNA) 폴리뉴클레오티드는 적어도 하나의 화학적 변형을 갖는다. 일부 실시양태에서, 적어도 1종의 리보핵산 (RNA) 폴리뉴클레오티드는 제2 화학적 변형을 추가로 포함한다. 일부 실시양태에서, 적어도 하나의 화학적 변형을 갖는 적어도 1종의 리보핵산 (RNA) 폴리뉴클레오티드는 5' 말단 캡을 갖는다. 일부 실시양태에서, 적어도 하나의 화학적 변형은 슈도우리딘, N1-메틸슈도우리딘, N1-에틸슈도우리딘, N1-에틸슈도우리딘, 2-티오우리딘, 4'-티오우리딘, 5-메틸시토신, 2-티오-1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 2-티오-5-아자-우리딘, 2-티오-디히드로슈도우리딘, 2-티오-디히드로우리딘, 2-티오-슈도우리딘, 4-메톡시-2-티오-슈도우리딘, 4-메톡시-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 4-티오-슈도우리딘, 5-아자-우리딘, 디히드로슈도우리딘, 5-메톡시우리딘 및 2'-O-메틸 우리딘으로부터 선택된다.
일부 실시양태에서, 화학적 변형은 슈도우리딘, N1-메틸슈도우리딘, N1-에틸슈도우리딘, 2-티오우리딘, 4'-티오우리딘, 5-메틸시토신, 2-티오-1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 2-티오-5-아자-우리딘, 2-티오-디히드로슈도우리딘, 2-티오-디히드로우리딘, 2-티오-슈도우리딘, 4-메톡시-2-티오-슈도우리딘, 4-메톡시-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 4-티오-슈도우리딘, 5-아자-우리딘, 디히드로슈도우리딘, 5-메톡시우리딘 및 2'-O-메틸 우리딘으로 이루어진 군으로부터 선택된다.
본 개시내용의 일부 실시양태는 적어도 1종의 HCMV 항원성 폴리펩티드 또는 그의 면역원성 단편을 코딩하는 오픈 리딩 프레임을 갖는 적어도 1종의 리보핵산 (RNA) 폴리뉴클레오티드를 포함하는 HCMV 백신을 제공하며, 여기서 오픈 리딩 프레임 내 우라실의 적어도 80% (예를 들어, 85%, 90%, 95%, 98%, 99%, 100%)는 화학적 변형을 갖고, 임의로 여기서 백신은 지질 나노입자 중에 제제화된다. 일부 실시양태에서, 오픈 리딩 프레임 내 우라실의 100%는 화학적 변형을 갖는다. 일부 실시양태에서, 화학적 변형은 우라실의 5-위치에 있다. 일부 실시양태에서, 화학적 변형은 N1-메틸 슈도우리딘이다.
본 개시내용의 일부 실시양태는 본원에서 이온화가능한 양이온성 지질 나노입자, 이온화가능한 지질 나노입자 및 지질 나노입자로도 지칭되는 (이들은 상호교환가능하게 사용됨) 양이온성 지질 나노입자 내에 제제화된 HCMV 백신을 제공한다. 일부 실시양태에서, 지질 나노입자는 양이온성 지질, PEG-변형된 지질, 스테롤 및 비-양이온성 지질을 포함한다. 일부 실시양태에서, 양이온성 지질은 이온화가능한 양이온성 지질이고, 비-양이온성 지질은 중성 지질이고, 스테롤은 콜레스테롤이다. 일부 실시양태에서, 양이온성 지질은 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란 (DLin-KC2-DMA), 디리놀레일-메틸-4-디메틸아미노부티레이트 (DLin-MC3-DMA), 및 디((Z)-논-2-엔-1-일) 9-((4-(디메틸아미노)부타노일)옥시)헵타데칸디오에이트 (L319)로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 지질 나노입자는 약 20-60% 양이온성 지질, 약 5-25% 비-양이온성 지질, 약 25-55% 스테롤 및 약 0.5-15% PEG-변형된 지질의 몰비를 갖는다. 일부 실시양태에서, 나노입자는 0.4 미만의 다분산도 값을 갖는다. 일부 실시양태에서, 나노입자는 중성 pH에서 순 중성 전하를 갖는다. 일부 실시양태에서, 나노입자는 50-200 nm의 평균 직경을 갖는다.
일부 실시양태에서, 오픈 리딩 프레임 내 우라실의 80%는 화학적 변형을 갖는다. 일부 실시양태에서, 오픈 리딩 프레임 내 우라실의 100%는 화학적 변형을 갖는다. 일부 실시양태에서, 화학적 변형은 우라실의 5-위치에 있다. 일부 실시양태에서, 화학적 변형은 N1-메틸슈도우리딘, N1-에틸슈도우리딘이다. 일부 실시양태에서, 백신은 지질 나노입자 내에 제제화된다. 일부 실시양태에서, 지질 나노입자는 양이온성 지질, PEG-변형된 지질, 스테롤 및 비-양이온성 지질을 포함한다. 일부 실시양태에서, 양이온성 지질은 이온화가능한 양이온성 지질이고, 비-양이온성 지질은 중성 지질이고, 스테롤은 콜레스테롤이다. 일부 실시양태에서, 양이온성 지질은 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란 (DLin-KC2-DMA), 디리놀레일-메틸-4-디메틸아미노부티레이트 (DLin-MC3-DMA), 및 디((Z)-논-2-엔-1-일) 9-((4-(디메틸아미노)부타노일)옥시)헵타데칸디오에이트 (L319)로 이루어진 군으로부터 선택된다.
본 개시내용의 일부 실시양태는 대상체에게 HCMV RNA 백신을 항원 특이적 면역 반응을 생성하는 유효량으로 투여하는 것을 포함하는, 대상체에서 항원 특이적 면역 반응을 유도하는 방법을 제공한다. 일부 실시양태에서, 항원 특이적 면역 반응은 T 세포 반응 또는 B 세포 반응을 포함한다. 일부 실시양태에서, 항원 특이적 면역 반응은 T 세포 반응 및 B 세포 반응을 포함한다. 일부 실시양태에서, 항원 특이적 면역 반응을 생성하는 방법은 백신의 단일 투여를 수반한다. 일부 실시양태에서, 방법은 대상체에게 부스터 용량의 백신을 투여하는 것을 추가로 포함한다. 일부 실시양태에서, 백신은 피내 또는 근육내 주사에 의해 대상체에게 투여된다.
또한, 대상체에게 HCMV RNA 백신을 항원 특이적 면역 반응을 생성하는 유효량으로 투여하는 것을 포함하는, 대상체에서 항원 특이적 면역 반응을 유도하는 방법에 사용하기 위한 HCMV RNA 백신이 본원에 제공된다.
대상체에게 HCMV RNA 백신을 항원 특이적 면역 반응을 생성하는 유효량으로 투여하는 것을 포함하는, 대상체에서 항원 특이적 면역 반응을 유도하는 방법에 사용하기 위한 의약의 제조에서의 HCMV RNA 백신의 용도가 본원에 추가로 제공된다.
대상체에게 본 개시내용의 백신을 투여하는 것을 포함하는, HCMV 감염을 예방 또는 치료하는 방법이 본원에서 추가로 제공된다. 본원에 개시된 HCMV 백신은 대상체에서 항원 특이적 면역 반응을 생성하는 유효량으로 제제화될 수 있다.
용어 "폴리펩티드 변이체"는 그의 아미노산 서열이 천연 또는 참조 서열과 상이한 분자를 지칭한다. 아미노산 서열 변이체는 천연 또는 참조 서열과 비교하여 아미노산 서열 내의 특정 위치에서 치환, 결실 및/또는 삽입을 보유할 수 있다. 통상적으로, 변이체는 천연 또는 참조 서열에 대해 적어도 50% 동일성을 보유한다. 일부 실시양태에서, 변이체는 천연 또는 참조 서열에 대해 적어도 80%, 또는 적어도 90% 동일성을 공유한다.
일부 실시양태에서, "변이체 모방체"가 제공된다. 본원에 사용된 용어 "변이체 모방체"는 활성화된 서열을 모방할 적어도 1개의 아미노산을 함유하는 것이다. 예를 들어, 글루타메이트는 포스포로-트레오닌 및/또는 포스포로-세린에 대한 모방체로서의 역할을 할 수 있다. 대안적으로, 변이체 모방체는 탈활성화를 유발할 수 있거나, 또는 모방체를 함유하는 불활성화된 생성물을 유발할 수 있으며, 예를 들어 페닐알라닌은 티로신에 대한 불활성화 치환으로서 작용할 수 있거나; 또는 알라닌은 세린에 대한 불활성화 치환으로서 작용할 수 있다. "오르토로그"는 종분화에 의해 공통 조상 유전자로부터 진화된 상이한 종에서의 유전자를 지칭한다. 통상적으로, 오르토로그는 진화 과정에서 동일한 기능을 보유한다. 오르토로그의 확인은 새로 서열분석된 게놈에서 유전자 기능의 신뢰가능한 예측에 중요하다. "유사체"는 모 또는 출발 폴리펩티드의 특성 중 하나 이상을 여전히 유지하는 1개 이상의 아미노산 변경, 예를 들어 아미노산 잔기의 치환, 부가 또는 결실에 따라 다른 폴리펩티드 변이체를 포함하는 것으로 의도된다.
본 개시내용은 변이체 및 유도체를 포함한, 폴리뉴클레오티드 또는 폴리펩티드 기반인 여러 유형의 조성물을 제공한다. 이들은, 예를 들어 치환, 삽입, 결실 및 공유 변이체 및 유도체를 포함한다. 용어 "유도체"는 용어 "변이체"와 동의어로 사용되지만, 일반적으로 참조 분자 또는 출발 분자에 비해 임의의 방식으로 변형 및/또는 변화된 분자를 지칭한다.
따라서, 참조 서열, 특히 본원에 개시된 폴리펩티드 서열과 관련하여 치환, 삽입 및/또는 부가, 결실 및 공유 변형을 함유하는 펩티드 또는 폴리펩티드를 코딩하는 폴리뉴클레오티드는 본 개시내용의 범주 내에 포함된다. 예를 들어, 서열 태그 또는 아미노산, 예컨대 1개 이상의 리신이 펩티드 서열에 (예를 들어, N-말단 또는 C-말단 단부에서) 부가될 수 있다. 서열 태그는 펩티드 검출, 정제 또는 국재화에 사용될 수 있다. 리신은 펩티드 용해도를 증가시키거나 비오티닐화를 허용하는 데 사용될 수 있다. 대안적으로, 펩티드 또는 단백질의 아미노산 서열의 카르복시 및 아미노 말단 영역에 위치한 아미노산 잔기는 임의로 결실되어 말단절단된 서열을 제공할 수 있다. 특정 아미노산 (예를 들어, C-말단 또는 N-말단 잔기)은 대안적으로 서열의 사용에 따라, 예를 들어 서열이 가용성인 보다 큰 서열의 일부로서, 또는 고체 지지체에 연결되어 발현됨에 따라, 결실될 수 있다. 폴리펩티드를 언급할 때 "치환 변이체"는 천연 또는 출발 서열 내의 적어도 1개의 아미노산 잔기가 제거되고 상이한 아미노산이 동일한 위치에서 그 자리에 삽입된 것이다. 치환은 분자 내의 단지 1개의 아미노산이 치환된 경우에 단일일 수 있거나, 또는 동일한 분자 내에서 2개 이상의 아미노산이 치환된 경우에 다중일 수 있다.
실시예
본 발명은 하기 예시적인 실시예에 의해 추가로 설명된다. 실시예는 어떠한 방식으로도 본 발명을 제한하지 않는다. 이들은 단지 본 발명을 명확하게 하는 역할을 한다.
실시예 1: 융합 억제제를 사용한 가교된 및 천연 HCMV gB (타운 균주)의 단리 및 정제
샘플 제조 동안, HCMV 융합 억제제 (문헌 [Bloom et al., Bioorganic & Medicinal Chemistry Letters 14 (2004) 3401-3406]에 기재된 화합물 28; 또한 도 5d 참조)를 바이러스 농축, 처리, 추출 및 정제 동안 각 단계에 첨가하여 gB의 융합후 형태로의 전환을 억제하였다.
비리온 표면 상의 단백질을 비스(술포숙신이미딜) 글루타레이트 (BS2G)와 가교시키고, 세제를 사용하여 비리온으로부터 gB를 추출한 후, SM5-1 His/Strep-태그부착된 Fab (Potzsch et al., PLoS pathogens 7(8):e1002172, 2011)를 첨가하여 전자 극저온 현미경검사에 의한 gB의 정제 및 확인을 보조하였다. Fab-gB 복합체를 친화성 칼럼에 의해 정제하였다.
이어서, 이들 추출 및 정제된 단백질을 전자 극저온 현미경검사에 의해 융합전 gB의 존재에 대해 분석하고, 융합전 형태의 구조를 해석하는 데 사용하였다.
실시예 2: 전자 현미경검사
그래핀 옥시드 필름-지지된 전자 현미경검사 그리드를 제조하였다. gB 샘플 용액을 비트로보트(Vitrobot) (써모피셔(ThermoFisher))를 사용하여 유리화시켰다. 동결 그리드를 300 kV에서 작동하는 FEI 티탄 크리오스(Titan Krios) 투과 전자 현미경으로 옮겼다. 표적 위치를 SerialEM 프로그램에서 설정하고, 고해상도 동영상 모드를 사용하는 K2 직접 검출기 카메라 (가탄(Gatan))를 사용하여 상기 프로그램으로 고배율 (18000X) 영상을 자동으로 수집하였다. 언비닝 픽셀 크기는 0.638Å이었고, 빔 강도는 ~8e/언비닝 픽셀/s였다. 각각의 동영상에 대한 샘플 상의 총 전자 선량은 ~40e/Å2이었다. 각각 28개의 프레임을 갖는 총 7,771개의 동영상을 3개의 세션에서 수집하였다.
영상 처리
드리프트 보정은 MotionCor2 프로그램 (Zheng S et al. Nature Methods 14, 331-332 (2017))을 사용하여 수행하였고, 최종 현미경사진은 2X 비닝하고, 모든 프레임으로부터 평균내었다. 조영제 전달 함수 파라미터는 Gctf로 계산하였다 (Kai Zhang, Journal of Structural Biology 193(1), 1-12 (2016)). 입자 선발을 위해, 융합후 입체형태의 HCMV gB의 공개된 구조 (PDB:5CXF)를 사용하여 pdb2mrc (EMAN)를 사용한 30Å 밀도 맵을 생성하였다 (Ludtke, S. et al. Journal of Structural Biology 128(1), 82-97 (1999)). 이 밀도 맵으로부터의 투사 영상을 project3d (EMAN)로 생성하고 (도 1), 가우토매치(Gautomatch) 프로그램을 사용하여 자동 입자 선별을 위한 주형으로서 사용하였다 (Urnavicius L, et al. Science 347(6229):1441-1446 (2015)). 릴리온(Relion) v2.1-베타 (Scheres, S.H. Journal of Structural Biology 180(3): 519-530 (2012))를 사용하여 생성된 ~190만개의 입자를 추출하고, 2D 분류, 3D 분류, 자동-정밀화 및 후-처리를 포함한 모든 후속 영상 처리 단계를 수행하였다. 2D 부류는 영상 특색에 기초하여 3개의 군으로 분류되었다: 제1 군은 결정학적으로 결정된 융합후 gB 구조와 유사한 특색을 보인 2D 부류로 이루어졌고 (>50%); 제2 군은 융합후 gB로부터의 구조적 특색과 유사하지 않은 잘 풀린 단백질 특색을 갖는 2D 부류를 함유하였고 (<10%); 제3 군은 명백하게 규정된 단백질을 함유하지 않은 2D 부류를 함유하였다 (~40%) (도 1). 제1 및 제2 군을 3D 분류, 자동 정밀화 및 렐리온(Relion)으로의 후처리 절차로 추가로 처리하였다. 이 처리 후에, 융합후 입체형태 구조를 나타내는 ~3.5Å 해상도 전자 밀도 맵을 제1 군으로부터 재구성하고; 융합전 입체형태 구조를 나타내는 ~3.6Å 해상도 전자 밀도 맵을 제2 군으로부터 재구성하였다. 이들 밀도 맵 및 공지된 HCMV gB 아미노산 서열 (타운 균주 P13201, 서열식별번호: 1)에 기초하여, 융합전 및 융합후 입체형태 구조에 대해 Coot 프로그램 (Emsley P. et al. Acta Crystallogr D Biol Crystallogr 66(Pt 4): 486-501 (2010))을 사용하여 원자 모델을 구축하였다. 융합후 gB 결정 구조 (PDB 수탁 코드 5CXF) 및 SM5-1 fab와 gB 도메인 II 사이의 복합체의 결정 구조 (PDB 수탁 코드 4OT1)를 두 구조에 대한 초기 모델로서 사용하였다. 융합후 구조 모델의 경우, 작은 조정으로 전자 밀도에 대한 우수한 핏을 충분히 얻었다. 융합전 입체형태 모델의 경우, 참조 PDB 모델로부터의 도메인 I, II, III 및 IV는 출발점으로서 전자 밀도 맵 내로 강성체로서 도킹될 수 있다. 이어서, 최적 피팅을 위해 개별 잔기의 조정을 수행하였다. 도메인 V, MPR 및 TM에 대한 모델을 새로 구축하였다. 모델을 피닉스.리얼_스페이스_리파인(Phenix.real_space_refine) 도구 (Afonine PV et al. Acta Crystallogr D Struct Biol 74(Pt 6): 531-544 (2018))로 반복적으로 정밀화한 후, 수회의 라운드 동안 국부 수동 조정하였다.
결과
cryoEM에 의한 샘플 스크리닝
gB의 융합전 입체형태는 불안정하며, 샘플 취급 동안을 포함하여 융합후 상태로 재배열되는 경향이 있다. 따라서, 연구된 샘플은 구조 결정을 복잡하게 하는 gB 이형태체의 혼합물을 함유하였다. 또한, 융합전 gB의 도메인의 배열 또는 독특한 구조적 특색에 대한 기존의 신뢰할 수 있는 정보는 없었다. 본 발명자들은 상이한 샘플 제조 조건을 스크리닝하기 위해 전자 현미경검사 및 영상 처리에 의한 직접 시각화를 사용하였다. 2D 및 3D 분류에 의한 영상 분류는 다중 구조가 불균질 샘플로부터 결정되도록 한다. 그러나, 이는 각각의 구조에 대한 충분한 입자가 조합되어 우수한 신호를 갖는 부류 평균을 생성할 수 있도록 하는 큰 데이터 세트를 필요로 한다. 이는 특히 gB 샘플의 경우였는데, 융합전 gB가 혼합물 중 소집단이기 때문이다. 따라서, 본 발명자들은 각각의 조건에 대해 ~1,000개의 동영상을 수집하고, 동일한 샘플로부터의 보다 많은 데이터로 영상 처리를 진행할지 또는 2D 분류 단계에서 또 다른 것으로 전환할지 여부를 결정하였다. 항체 Fab-결합된 융합후 입체형태 gB의 구조는 많은 데이터세트로부터 용이하게 수득되었다. 이들 Fab-결합된 융합후 입체형태 구조로부터의 투사 영상을 참조로서 사용하여 융합전 영상 재구성을 위한 영상을 선택하는 것을 피하였다. 본 발명자들은 추가의 영상 처리를 위해 임의의 융합후 gB 투사 영상과 유사하지 않은 단백질 특색을 갖는 임의의 우수한 부류 평균을 선택하였다. 본 발명자들은 이러한 전략으로 샘플 제조를 위한 수십 개의 조건을 스크리닝하였고, 마침내 입자 집단에서 부차적 종으로서 일부 대안적 2D 부류를 생산한 샘플을 발견하였다 (도 1b, 원형). 이어서, 총 7,771개의 동영상을 그 샘플로부터 수집하고, 융합전 gB 구조의 결정에 사용하였다.
항체 Fab-결합된 융합후 gB 구조의 투사 영상은 도 1a에 제시된다. 수집된 데이터세트로부터의 2D 부류 평균은 도 1b에 제시된다. 융합후 gB 참조 2D 투사도 중 어느 것과도 유사하지 않은 일부 부류는 동그라미로 표시된다.
융합전 입체형태 구조의 수득
대략 190만개의 미가공 입자 영상을 데이터 세트로부터 자동으로 선택하였다. 2D 분류 후, 영상을 융합후 부류 (입자 집단의 55%) 및 융합전 부류 (입자 집단의 10%)로 그룹화하였다. 2개의 군을 3D로 추가로 처리하고, C3 대칭을 적용하여 3.5Å 해상도에서 SM5-1 Fab-결합된 융합후 gB의 밀도 맵 및 3.6Å 해상도에서 SM5-1 Fab-결합된 융합전 gB의 밀도 맵을 수득하였다.
SM5-1 Fab 및 융합후 gB의 엑토도메인의 X선 결정학-기반 모델을 강성체 도킹으로 융합후 밀도 맵에 피팅하였다. Fab의 불변 도메인 (이는 강한 전자 밀도를 생성하기에는 너무 가요성일 가능성이 있음)을 제외하고는, 융합후 gB-Fab 복합체의 밀도 맵 및 모델은 서로 잘 일치하였다 (도 3a). 막 근위 영역, 막횡단 영역 및 세포질 도메인은 본 발명자들의 최종 융합후 gB 밀도 맵에서 해석되지 않았으며, 이는 이들 융합후 gB 영역이 본질적으로 또는 샘플 제제에서 세제 가용화를 통해 가요성임을 시사한다 (도 2, 하부 선). 전자 극저온 현미경검사-기반 모델에서 융합후 gB의 Fab 및 DII의 상호작용은 이전에 결정된 복합체의 결정 구조 (PDB 수탁 코드 4OT1)와 잘 일치한다.
공지된 Fab 결합 위치에 의해 안내되는 융합전 gB 모델을 구축하기 위해, 융합후 gB 결정 구조로부터의 도메인 I, II, III, 및 도메인 IV의 부분을 융합전 gB-Fab 복합체의 밀도 맵에 개별적으로 도킹하고, 전자 밀도의 최적 적합화를 위해 필요에 따라 개별 잔기를 수동으로 조정하였다. 융합전 gB 구조의 나머지를 새로 구축하였다. 융합전 구조로 모델링된 gB의 아미노산은 도 2의 상단 라인에 표시된다. 융합전 gB-Fab 복합체의 모델은 융합전 밀도 맵의 대다수의 부분에 적합하며, Fab 밀도의 존재는 신규 구조에서 gB의 정체를 확인시켜 준다 (도 3b).
본 실시예와 관련된 융합전 gB의 모델에 대한 좌표 및 구조 인자가 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1A에 제공된다.
융합전 입체형태의 gB의 구조 및 융합후 gB와의 비교
융합전 gB 및 SM5-1 Fab의 복합체에 대한 전자 밀도는 gB 엑토도메인, 막 근위 영역 (MPR - 바이러스 막에 평행하게 배향된 나선 영역), 및 단일 스팬 막횡단 나선 (TM)을 포함하는 융합전 gB 모델의 구축을 허용하였다 (도 3b 및 도 4b). MPR 및 TM 영역은 융합후 gB에 대한 구조적 데이터에서 해석되지 않았거나 또는 융합후 gB 모델에 포함되지 않았다.
융합전 및 융합후 gB의 전반적인 치수는 상이하다 (도 4a 대 도 4b). 융합후 gB 삼량체 엑토도메인은 막대 형상을 갖고, 대략 165Å의 높이 (막 원위 말단에서 각각의 프로토머의 프롤린 (570) 및 막 근위 말단에서 각각의 프로토머의 트립토판 (240)에 의해 형성된 평면 사이의 거리; 도 4a)를 갖는다. 이는 대략 65Å의 폭 (인접한 프로토머 상의 알라닌 315 사이의 거리)을 갖는다. 본원에 기재된 구조는 HCMV 균주 타운의 gB로부터 유래되었다. gB 아미노산 서열의 일부 천연 변이가 존재하지만, 타운 gB의 전체 융합후 구조는 균주 AD169 (PDB 수탁 코드 5CXF)로부터의 gB의 융합후 구조와 거의 동일하다. 따라서, 융합후 gB 구조의 기재를 두 균주에 적용하고, 서열 정렬로부터의 동등한 아미노산으로부터 측정한다.
융합전 gB 삼량체는 융합후 gB 삼량체보다 더 작달막한 형상을 갖는다 (도 4a 대 도 4b). 각각의 프로토머의 W240에 의해 형성된 평면과 융합전 구조 내에서 가장 막 원위에 모델링된 잔기인 Q483 사이의 거리는 대략 115Å이다. 융합전 모델은 95Å 폭 (상이한 프로토머로부터의 임의의 2개의 A315 사이의 거리에 의해 측정됨)이다.
도메인 I, II, III 및 IV의 개별 서브유닛 구조는 융합전 및 융합후 입체형태에서 유사하다. 그러나, 이들 도메인의 전체 배열은 2개의 입체형태에서 매우 상이하다 (도 4a-4b 및 도 6a-6c). 융합전 입체형태에서, DI의 팁에서의 융합 루프 및 도메인 III 내의 중심 나선 다발의 C-말단은 모두 TM 영역의 위치에 의해 확인되는 바와 같이 비리온 외피를 향해 동일한 방향을 향한다 (도 4a 및 도 6a). 대조적으로, 융합후 입체형태에서, 융합 루프 및 중심 나선 다발의 C-말단은 반대 방향을 가리킨다 (도 4b 및 도 6c).
융합전 구조에서, 융합 루프 내의 소수성 잔기 (잔기 Y155, I156, H157 및 W240, L241)는 MPR에 매우 근접하고, 아마도 세제에 의해 둘러싸인다 (도 4a 및 도 6a).
융합전으로부터 융합후로의 전이에서, 도메인 II는 도메인 III 중심 코일드-코일의 중간-방향의 위치에서 코일드-코일의 막 근위 단부 및 융합 루프에 대향하는 도메인 I의 단부 근처의 위치로 이동한다 (도 4a 및 도 4b).
DIII의 구조 (도 4a-4b 및 도 6a-6c)는 융합전 및 융합후 입체형태에서 매우 유사하다. 두 입체형태의 중심 나선은 L479에서 P525까지 걸쳐있으며, 이것은 융합전으로부터 융합후로의 전이 동안의 최소 재배열을 나타낸다. 그러나, 다른 도메인은 도메인 III의 중심 나선에 비해 그의 위치를 변화시켜, 상기 언급된 바와 같이, DIII 나선 다발의 (N-말단에서 C-말단으로의) 방향은 융합 루프로부터 융합후 입체형태에서 삼량체의 원위 말단을 향해 및 바이러스 막을 향해, 융합전 입체형태에서의 융합 루프와 동일한 방향으로 향한다.
융합전 구조에서, 도메인 IV (도 4a 및 도 6a)는 삼량체의 외부의 도메인 I와 삼량체의 중심의 도메인 III 및 V 사이의 계면에 매립된다. 대조적으로, 융합후 구조에서, 도메인 IV는 삼량체의 막-원위 팁에서 고도로 노출된 "크라운"을 형성한다.
도메인 V는 융합전 gB (도 4a 및 도 6a) 및 융합후 gB (도 4b 및 도 6c)에서 상이한 구조를 갖는다. 융합전 gB에서, 도메인의 N-말단 절반 (약 잔기 642-660)은 인접한 프로토머의 도메인 I와 도메인 IV 사이에 샌드위치되고, 용매로부터 격리된다. 도메인 V의 잔기 683-704 사이의 영역은 다른 프로토머에서 그의 대응물과 함께 삼량체 나선 다발을 형성한다. 이 나선 다발은 대부분 도메인 IV에 의해 형성된 "크라운"의 포켓 내부에 모여있다. 나선 다발을 도메인 V로부터 MPR 영역에 연결하는 추가의 짧은 나선 (대략 잔기 710-719)이 존재한다. 대조적으로, 융합후 입체형태 (도 4b 및 도 6c)에서, 도메인 V는 용매 노출되고, 도메인 III 나선 다발의 외부 및 인접한 프로토머로부터의 도메인 I 사이의 계면에 의해 형성된 홈을 따라 연장된다.
융합전 및 융합후 gB 구조의 비교는 다른 잘 연구된 융합 단백질로부터 익숙한 입체형태 변화의 진행을 시사한다 (Harrison, S.C. Virology 0:498-507 (2015)). 비교는 본 발명에 기재된 구조가 사실상 융합전 입체형태라는 확신을 제공한다. 융합전 상태에서 (도 6a), 도메인 I의 융합 루프는 MPR 및 잠재적으로 바이러스 막과의 상호작용에 의해 매립된다. 원위 gB 상동체인 수포성 구내염 바이러스 G 당단백질의 융합전 구조에서, 융합 루프는 또한 바이러스 막 (또한 MPR 영역의 예상된 위치, 이것은 그 구조에서 보이지 않음)을 향한다 (Roche et al. Science 315:843-8 (2007)).
다른 융합 단백질과의 유사성에 기초하여, 융합전 및 융합후 상태 사이의 제안된 연장된 중간체로의 전이의 일부로서 중심 나선의 연장과 함께 재배열이 진행될 가능성이 있다 (도 6b). 제안된 연장된 중간체 상태에서, TM 영역은 여전히 바이러스 막에 고정될 것이고, 이제 회전되고 전위된 도메인 I의 팁에서 바이러스 막으로부터 멀리 연장된 융합 루프는 세포 막과 상호작용할 것이다. 제안된 연장된 중간체로부터 융합후 입체형태로의 전이는 막횡단 영역 및 융합 루프가 다시 분자의 동일한 말단에서 서로 근접하도록 하는 폴드-백을 수반할 것이며, 이 때 둘 다 융합된 바이러스 및 세포 막과 상호작용한다 (도 6c).
본 발명자들은, 융합전 gB에서 중심 나선의 길이의 동적 변화가 있을 수 있고, 본 발명자들이 결정한 융합전 구조가 "호흡" 분자의 "스냅샷"을 나타내며, 이는 전자 극저온 현미경검사에 의해 연구된 샘플을 제조하는 데 사용된 융합 억제제 및 가교제에 의한 전자 밀도에서 본 발명자들이 보는 입체형태로 잠금된 것으로 추측한다.
관찰된 융합전 입체형태에 대한 안정화 인자
gB 아미노산을 전자 밀도 맵으로 모델링한 후, 아미노산 잔기에 의해 채워지지 않은 밀도의 영역은 MPR, 도메인 V, 및 융합 루프를 함유하는 도메인 I의 팁 사이에 남아있었다 (도 5a). 채워지지 않은 밀도의 크기 및 형상은 HCMV 융합 억제제인 N-{4-[({(1S)-1-[3,5-비스(트리플루오로메틸)페닐]에틸}카르바모티오일)아미노]페닐}-1,3-티아졸-4-카르복스아미드의 화학 구조 (도 5d)에 부합하며, 이는 전자 극저온 현미경검사에 의해 연구된 샘플의 제조 전반에 걸쳐 존재하였다 (도 5b). 화합물은 트리플루오로메틸 페닐 모이어티와 화합물의 나머지 부분 사이에 꼬임이 있는 포즈를 채택하였다. 티아졸은 인접한 프로토머로부터의 L712, A738 및 Y153, Y155의 소수성 잔기와 접촉을 형성한다. 페닐은 L715의 잔기, 인접한 프로토머의 도메인 V로부터의 D714, MPR로부터의 G734 및 I730, 및 TM 도메인으로부터의 F752에 의해 형성된 소수성 환경에서 둘러싸인다. 트리플루오로메틸 페닐은 또 다른 프로토머로부터의 MPR 및 TM 나선 사이의 힌지 근처의 소수성 환경에 존재한다. 이는 MPR 및 TM 도메인의 외향 이동을 방지하기 위한 후크로서 작용할 수 있다. 억제제 화합물에 의해 조정되는 상호작용 이외에도, 다른 융합 루프로부터의 W240, Y242는 각각 MPR 영역로부터의 소수성 패치 및 도메인 V에서의 L715와 반 데르 발스 상호작용을 형성하고 있다 (도 5c). 융합 억제제 주위의 이들 특이적 상호작용은 도메인 I, 도메인 V 및 MPR을 함께 보유하고, 융합 프로세스 동안 도메인 I, 도메인 V 및 MPR 사이의 이동을 제한할 것으로 예상될 것이다 (도 6a-6c).
융합전 입체형태의 안정성에 대한 가교의 효과를 또한 시험하였다. 샘플 제조 단계 동안, BS2G 가교 시약을 첨가하였거나 또는 첨가하지 않았다. 가교제의 부재 하에, 융합전 대 융합후 입체형태의 입자의 비는 1:100인 반면, BS2G 시약에 의해 가교된 샘플에서의 비는 1:4였다. 가교제는 전자 밀도에서 확인되지 않았다.
본원에 기재된 도면에 제시된 CMV gB의 융합전 구조 및 융합전 및 융합후 구조의 컬러 버전은 또한 문헌 [Liu et al. Science Advances 7(10): eabf3178 (2021)]에서 찾아볼 수 있으며, 이는 그 전문이 본원에 참조로 포함된다.
실시예 3: gB1666의 발현 및 정제
gB1666의 생산을 위해, PSB1666 구축물을 Expi293F 세포 내로 일시적으로 형질감염시켰다. 세포 펠릿을 형질감염 96시간 후에 수거하였다. PSB1666 단백질을 25 mM HEPES pH 7.5, 250 mM NaCl, 0.02% DDM, 0.002% CHS, 3 μg/ml WAY-174865 (억제제, 도 5d 참조) 내에서 일련의 가용화, 친화도 칼럼 및 크기 배제 크로마토그래피 공정을 통해 정제하였다. 단백질을 SDS-PAGE 상에서 및 EM에 의해 음성 염색으로 분석하여 단백질의 적어도 50%가 융합전 입체형태를 나타내는 것을 보장하였다. PSB1666 단백질은 Expi293F 세포의 형질감염에서 효율적으로 발현되고, 1L 발현은 ~0.1 mg의 정제된 PSB1666을 고품질로 생성할 것이다.
폴리펩티드 gB1666 (PSB1666) (서열식별번호: 57)은 도메인 I 및 IV에 돌연변이를 포함한다. 폴리펩티드는 서열식별번호: 1에 제시된 상응하는 야생형 gB (타운)에 비해 하기 돌연변이, D217C 및 Y589C를 포함한다.
실시예 4: DNA-발현된 gB1666은 Balb/c 마우스에서 면역원성이다
제안된 안정화된 전장 융합전 gB 구축물 중 하나인 gB1666 (서열식별번호: 57)은 EM에 의해 융합 억제제 (WAY-174865; 도 5d 참조)의 존재 하에 형질감염된 포유동물 세포로부터의 정제 후에 타운 균주의 야생형 gB에 비해 융합전 입체형태의 분자의 비율이 증가된 것으로 나타났다. 이 분자가 생체내에서 면역 반응을 도출할 수 있는지 여부를 평가하기 위해, gB1666 및 야생형 gB에 상응하는 DNA 서열을 사내 포유동물 발현 벡터 내로 클로닝하였다. 10마리의 Balb/c 마우스에 gB1666을 코딩하는 DNA 100 ug을 3주 간격으로 2회 전기천공하였다 (D0 및 D21). 추가의 10마리의 마우스를 야생형 gB를 코딩하는 DNA로 동일한 프로토콜에 의해 전기천공하고, 제3 군을 포스페이트-완충 염수로 이루어진 위약으로 전기천공하였다. 혈청 샘플을 제28일에 수집하였다. 표준 프로토콜에 따라 항-gB IgG 반응을 결정하기 위해, 타운 균주의 야생형 서열에 기초하지만 막횡단 도메인이 제거된 (시노 바이올로지칼스(Sino Biologicals)) 포유동물 세포로부터 생산된 재조합 gB 단백질에 대해 ELISA를 수행하였다. 야생형 gB DNA 면역화된 마우스로부터의 10마리의 동물 중 10마리 및 10마리의 gB1666 DNA 면역화된 마우스 중 9마리가 검출가능한 항-gB IgG 역가를 생성하였다 (도 11, 평균 ± SD, LLOQ = 25를 나타냄). 연구는 gB1666이 Balb/c 마우스에서 면역원성임을 입증한다.
실시예 5: 안정화된 융합전 gB1666 단백질의 면역원성 연구
마우스에서의 gB1666의 면역원성 연구.
마우스에서 항체 반응을 평가하기 위해, 하기 면역화 계획을 따를 것이다. 제8주에, 마우스를 방혈시키고, 면역화된 동물 혈청으로부터의 중화 역가를 결정하고, gB705 (융합후) 및/또는 gB 야생형 단백질로 면역화된 것과 비교할 것이다.
표 5. gB1666 단백질을 사용한 마우스 면역원성 연구 설계
실시예 6
실시예 2에서, 본 발명자들은 항체 단편과 복합체화된 융합전 인간 시토메갈로바이러스 (HCMV) 균주 타운 당단백질 B (gB)의 전자 극저온 현미경검사 (cryoEM) 구조를 개시하였다. 구조 결정에 사용된 gB는 소분자 융합 억제제, WAY-174865를 포유동물 세포 배양물 중 정격 HCMV의 발효에 첨가하고, gB의 생산 및 분석 전반에 걸쳐 억제제의 존재를 유지하고; 바이러스를 정제하고; 바이러스를 화학적 가교 링커, 비스(술포숙신이미딜) 글루타레이트 (BS2G; 7.7Å 스페이서 아암)로 처리하고; 세제로 바이러스로부터 gB를 추출하고; 비리온 상의 gB를 친화도 태그부착된 항체 단편과 결합시키고; gB를 친화도 및 크기결정 칼럼에 의해 정제함으로써 수득하였다. 본 발명자들은 또한 융합전 상태에서 gB를 안정화시키는 돌연변이를 조작하기 위한 융합전 gB cryoEM 구조의 용도를 개시하였다. 구체적으로, 본 발명자들은 2개의 잔기가 시스테인으로 돌연변이된 (D217C, Y589C) 재조합 gB 단백질 gB1666을 개시하였다. 생성된 C217과 C589 사이의 조작된 디술피드 결합의 형성은 융합전 상태에서 재조합 gB의 입체형태적 안정성을 증가시킨다. gB1666은 그것이 Expi293F 세포에서 발현되고 융합 억제제인 화합물 WAY-174865의 존재 하에 정제될 때 융합전 구조적 특색을 유지하였다. 억제제의 부재 하에, gB1666은 입체형태적 변화를 겪고 그의 융합전 구조적 상태를 상실하는 경향이 있다. 억제제의 부재 하에 융합전 입체형태적 안정성의 상실은 면역화를 위한 항원으로서의 재조합 당단백질의 사용에 바람직한 특징이 아니다. gB1666이 억제제와 함께 제제화되더라도, 사람 또는 동물에의 주사 시, 생체내 억제제의 희석이 gB1666으로부터의 그의 해리 및 gB1666의 융합전 입체형태의 상실로 이어질 위험이 있다. 따라서, HCMV gB는 WAY-174865의 부재 하에 융합전 상태로 유지되도록 융합전 입체형태에서 충분히 안정화되는 것이 바람직하다. 융합전 gB 면역원이 제조성을 개선시키고, 용해도를 개선시키고, 균질성을 개선시키고, gB 막횡단 영역에 의해 매개되는 응집 또는 침전을 방지하기 위해 세제 또는 다른 부형제와 함께 제제화할 필요성을 감소시키거나 제거하도록 가용성 엑토도메인을 포함하는 것이 또한 바람직하다.
본 발명자들은 지금에 이르러, 구조-기반 조작 접근법을 통해, 면역원으로서 융합전 gB의 사용을 위한 이들 개선된 특징을 부여하는 HCMV gB에서의 새로운 돌연변이에 관한 본 발명을 보고한다. 먼저, 본 발명자들은 나노디스크에 고정시킴으로써 가용화되고 WAY-174865의 존재에 의해 융합전 입체형태에서 안정화된 gB1666의 구조를 cryoEM에 의해 결정하였다 (도 12). 재조합, D217C 및 Y589C 돌연변이 gB의 대부분의 새로운 구조는 본 발명자들이 이전에 결정한 비리온-유래, 화학적으로 가교된 항체 단편 결합된 HCMV 타운 융합전 gB의 구조와 유사하지만, 특정 국부 영역에서 2개의 구조 사이에 미묘한 차이가 있다. 구조에서의 차이는 제제에서의 하기 여러 차이를 반영할 수 있다: 첫째로, 당단백질의 호흡 운동을 제한할 gB1666에서의 조작된 디술피드 결합의 존재; 둘째로, 이전 구조 결정을 위해 용액 중에서 gB를 추출하고 유지하는 데 사용된 세제보다 막횡단 도메인에 대해 보다 천연 국부 지질 환경을 제공하는 나노디스크에서의 gB1666의 고정; 셋째로, gB1666의 화학적 가교의 부재; 넷째로, 아미노산 측쇄의 보다 정확한 모델링을 가능하게 하는, 이전 구조의 3.6Å 해상도와 비교하여 새로운 구조의 3.3Å에서의 보다 높은 해상도.
새로운 구조적 정보에 기초하여, 본 발명자들은 전장 gB 구축물 pSB1666의 배경에 추가의 안정화 돌연변이를 설계하였다 (표 6 및 표 7). 본 발명자들은 pSB1666 배경에 이들 추가의 돌연변이를 부가하면 융합전 상태에서 gB를 추가로 안정화시킬 것으로 가정하였다 (도 13). 예를 들어, 잔기 M371 및 W506에서의 시스테인 돌연변이는 도메인 II와 III 사이에 디술피드 결합을 도입할 수 있고; (F541, E681) 및 (N524, M684)의 쌍에서의 시스테인 돌연변이는 도메인 IV와 V 사이에 디술피드 결합을 도입할 수 있고; 잔기 E686, D679의 소수성 잔기로의 돌연변이는 국부적 탈안정화 동일 전하 반발 패치를 제거하고 단백질 안정성을 증가시킬 수 있다. 새로운 부가된 돌연변이의 선택을 갖는 재조합 당단백질을 융합 억제제의 부재 하에 및 화학적 가교 없이 발현시키고 정제하였다. SDS-PAGE에 의한 발현된 당단백질의 전기영동 이동성은 글리코실화와 일치하는 예상된 겉보기 분자량 및 불균질성을 보여주었다 (도 14). 샘플을 4℃에서 보관하고, 제1일 및 제7일에 음성 염색된 전자 현미경검사 분석을 위해 분취물을 취하였다. 2D 부류 평균화된 영상에서, gB의 융합전 입체형태의 "상면도"와 유사한 삼각형 형상의 특색이 명백하였다. 융합전 및 융합후 부류에 속하는 집단 내의 입자의 비는 제1일에 5:1 및 제7일에 3:1이었다 (도 15).
새로운 구조적 정보에 기초하여, 본 발명자들은 도 16a-16d에 도시된 바와 같이 융합전-안정화 돌연변이를 갖는 여러 가용성, 세제-무함유 gB 엑토도메인 (표 8)을 설계하였다. HCMV gB의 정제된 엑토도메인인 잔기 1-707은 로제트-유사 응집체를 형성하였으며, 여기서 gB 단백질은 그의 노출된 융합 루프를 통해 회합하였다. 응집을 제거하고 조건화 배지에 대한 단백질 분비를 증가시키기 위해, 본 발명자들은 융합 루프 내의 4개의 노출된 소수성 잔기를 단순 헤르페스 바이러스-1 (HSV-1) gB로부터의 상응하는 보다 친수성인 아미노산, 예를 들어 YIH (155-157)→GHR, W240→A로 대체하였다. 본 발명자들은 또한 노출된 Cys246을 Ser (C246→S)로 돌연변이시켜 의사 디술피드 결합의 형성을 방지하였다. 항원의 융합전 삼량체 상태를 추가로 안정화시키기 위해, 본 발명자들은 프로토머간 디술피드 결합을 형성할 수 있는 시스테인 잔기를 도입하거나 또는 C-말단 삼량체화 모티프, 예를 들어 T4-박테리오파지 피브리틴으로부터의 GCN4 또는 폴드온을 부가하였다. 디술피드 돌연변이, 예를 들어 D217C-Y589C, M317C-W506C, N524C-M684C를 추가로 도입하여 단백질을 융합전 상태로 잠갔다. 재조합 당단백질을 발현시키고, 조건화 배지로 분비시키고, 융합 억제제의 부재 하에 화학적 세제 없이 정제하였다. 특히, GCN4 삼량체화 모티프에 융합된 재조합 변이체는 최적의 크기-배제 크로마토그래피 프로파일을 나타냈다 (도 17). 음성 염색된 전자 현미경검사는 억제제 및 세제의 부재 하에 단분산 단백질로서 재조합 단백질, gB2555 및 gB2556을 나타냈다. 예상된 gB 단백질 특색은 2D 부류 평균화된 영상에서 관찰된다 (도 18 및 도 19). 이들 결과는 이들 조작된 구축물이 필요한 경우에 억제제 및 세제의 부재 하에 융합전 형태의 gB에 대해 보다 많은 안정화 돌연변이를 부가하기 위한 프레임워크로서 사용하기에 적합하다는 것을 확인시켜 준다.
본 실시예와 관련된 융합전 gB의 모델에 대한 좌표 및 구조 인자가 그 전문이 본원에 참조로 포함되는 WO 2021/260510에 기재된 표 1B에 제공된다.
표 6. 디술피드 결합 안정화를 위한 예시적인 시스테인 쌍 돌연변이
표 7. 안정화를 위한 예시적인 전하 돌연변이
표 8. 구축물 돌연변이. 상이한 조건에서 정제된 재조합 단백질 제제 중 융합전 gB의 존재를 시험하기 위한 목적으로 설계로부터 구축물을 제조하였다.
표 9. 예시적인 가용성, 세제-무함유 gB 엑토도메인 단백질
* YIH (155-157)→GHR, W240→A 및 C246→S를 포함한 돌연변이를 gB에 혼입시켜 응집을 감소시키고 단백질 분비를 증가시켰다.
실시예 7: HCMV gB 폴리펩티드의 약물표적화가능한 영역측정
HCMV gB 폴리펩티드의 융합전 및 융합후 구조는 상기 제시된 실시예에 기재되어 있다. HCMV gB 폴리펩티드가 융합후 구조로 재배열되는 경우, 긴 베타-시트 풍부 구상 도메인은 삼량체로 합쳐져 그들 사이에 홈을 남기는 융합 루프에 의해 싸여 형성된다. 단백질의 막 앵커에 보다 가까운 길고 연장된 코일/알파-나선 구조는 이들 홈을 트래킹하여 막 앵커 및 융합 루프를 함께 가져와, 바이러스의 세포 진입을 일으키는 융합 반응을 완료한다.
도 20a 및 20b는 융합전 (도 20a) 및 융합후 (도 20b) 구조에서 HCMV (타운 균주) 도메인 V (잔기 I642-V697 (서열식별번호: 281))의 공간-충전 모델을 도시한다. 소수성 잔기는 표지된다. 융합전 입체형태에서, 이들 소수성 잔기는 무질서하지만, 이들은 융합후 구조의 다른 부분의 소수성 표면과 상보적이도록 양친매성 연장된 입체형태로 재배열된다. 예를 들어, 도 20b에 제시된 바와 같이, I642-F661 사이의 영역 (서열식별번호: 282)은 다른 2개의 프로모터로부터 Q485-L520에 의해 형성된 표면 (서열식별번호: 283)과 상호작용하고; L672-V697 사이의 영역 (서열식별번호: 284)은 다른 2개의 프로모터로부터 동일한 영역과 상호작용한다. 이러한 구조 배열은 바이러스와 숙주 세포 막 사이의 융합을 구동시키는 데 필요하다.
이러한 입체형태적 변화는 융합후 형태의 도메인 I와 II 사이의 홈 위로 HCMV gB 폴리펩티드 도메인 V에 약물표적화가능한 영역을 생성한다.
도 21a - 21c는 (도 21a) HCMV gB (타운 균주) 도메인 V (연회색) 및 그의 결합 포켓 (암회색)을 융합후 입체형태로 나타내고 (도 21b) 도메인 V가 없는 포켓의 공간-충전 모델을 나타낸다. 도 21c는 특정 잔기가 표지된, 도 21a에서와 동일한 구조의 리본 표현을 보여준다.
한 실시양태에서, 홈을 트래킹하는 긴 연장된 코일/a-나선의 부분에 상응하는 펩티드는 홈의 점유에 대해 그의 진정한 대응물과 경쟁하도록 바이러스에 첨가되어, 재배열의 완료를 방지하고, 이에 의해 막 융합, 바이러스 진입, 및 바이러스 감염성을 차단한다. 또 다른 실시양태에서, 홈 내로의 펩티드의 결합의 차단은 소분자의 라이브러리를 스크리닝하는 데 사용되어, 소분자 CMV 융합 억제제의 발견으로 이어질 수 있다.
본 발명은 M648-K700 (서열식별번호: 260), M648-V697 (서열식별번호: 261), S647-V697 (서열식별번호: 262), S647-V663 (서열식별번호: 263), I653-V697 (서열식별번호: 264), I653-Q692 (서열식별번호: 265), I653-L680 (서열식별번호: 266), I653-S675 (서열식별번호: 267), I653-Y667 (서열식별번호: 268), R662-V697 (서열식별번호: 269), R662-Q692 (서열식별번호: 270), R662-L680 (서열식별번호: 271), R662-S675 (서열식별번호: 272), L664-F678 (서열식별번호: 273), S668-V697 (서열식별번호: 274), S668-Q692 (서열식별번호: 275), S668-V677 (서열식별번호: 276), D679-V697 (서열식별번호: 277), L680-V697 (서열식별번호: 278), L680-Q692 (서열식별번호: 279), 및 R693-K700 (서열식별번호: 280)으로 이루어진 군으로부터 선택된 서열식별번호: 1 (타운 균주)의 잔기를 포함하는 펩티드를 제공한다.
펩티드 활성에 대한 검증 실험
상기 기재된 펩티드 (또한 표 10 참조)를 합성하고, 바이러스 세포 감염 억제 활성에서 시험하였다. 펩티드는 뎅기 바이러스에서 유사한 기능을 갖는 펩티드에 필적하는, 약 10 uM 이하의 농도에서 50% 감염 (IC50)을 감소시키는 효력을 가질 것으로 예상된다 (A. G. Schmidt, P. L. Yang, S. C. Harrison, Peptide inhibitors of dengue-virus entry target a late-stage fusion intermediate. PLoS Pathog 6, e1000851 (2010)). gB의 약물표적화가능한 영역에서의 선택된 펩티드의 결속은 결합 검정으로 검증될 수 있다. 이들은 약 10 uM 이하의 해리 상수 (Kd)를 나타내는 SPR에 의한 결합 친화도의 측정, 및 gB의 약물표적화가능한 영역에서 펩티드에 대한 밀도를 나타내는 cryoEM 구조를 포함한다. HCMV gB의 약물표적화가능한 영역은 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함한다. 약물표적화가능한 영역의 잔기는 융합후 입체형태이다.
이들 방법은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있고, 하기에 보다 상세하게 기재된다:
1. 바이러스 감염 억제 검정
미세중화 검정에 의해 MRC-5 섬유모세포 및 ARPE-19 상피 세포에서 HCMV 감염을 시험한다. 간략하게, 세포를 96 웰 플레이트에 37℃, 5% CO2에서 밤새 시딩한다. 연속 희석된 펩티드를 HCMV 타운 균주 또는 VR1814와 대략 500 pfu/웰로 합하고, 37℃에서 1시간 동안 인큐베이션되도록 한다. 이어서, 혼합물을 MRC-5 또는 ARPE-19 세포로 옮기고, 37℃, 5% CO2에서 24시간 동안 감염시킨다. 메탄올로 고정시킨 후, 마우스 모노클로날 항-HCMV 극초기 단백질 IE1 항체 (사내 개발됨)를 사용한 면역염색에 의해 HCMV-감염된 세포를 검출한다. 이어서, 2차 항체, 알렉사 플루오르 488 표지된 염소 항-마우스 IgG (H+L) (몰레큘라 프로브스(Molecular Probes)) 항체를 CTL-이뮤노스팟 분석기를 사용하여 감염된 세포를 계수하는 데 사용한다. 샘플의 감염성의 50%를 억제하는 역가 (IC50)를 4-파라미터 비선형 회귀를 사용하여 내삽에 의해 결정한다.
2. SPR에 의한 결합 친화도
HCMV gB 단백질 및 펩티드의 결합을 측정하기 위하여, 1xHBSP+ (0.01 M Hepes pH 7.4, 0.15 M NaCl, 0.05% v/v 계면활성제 P20) 구동 완충제를 사용하여 SPR CM5 센서 칩 표면을 제조한다. 모든 유동 세포를 0.4 M EDC + 0.1 M NHS로 활성화시키고, 10 mM 아세테이트 pH 4.5 내의 항-Avi pAb와 아민-커플링시킨다. 이어서, 표면을 0.2 M 보레이트 완충제 pH 8.5 중 0.1 M EDA로 차단한 다음, 75 mM 인산으로 3회 재생시킬 것이다.
구동 완충제로서 1 g/L BSA로 보충된 1xHBSP+를 사용하여 실온에서 다중사이클 동역학적 검정을 수행한다. 포획을 위하여, 정제된 HCMV gB 단백질을 0.2 ug/mL로 희석하고, 각 채널의 유동-셀 2에 적재한다. 이어서, 설계된 gB 펩티드를 초기 결합 스크린을 위해 100 uM의 농도로 주사할 것이다. 양성 결합 펩티드가 확인되면, 결합 동역학을 측정하기 위해 양성 펩티드를 0, 5, 10, 20, 50, 및 100 uM의 농도로 주입한다. 매 사이클 종료 시에, 표면을 75 mM 포스페이트로 3회 재생시킨다.
3. cryoEM에 의한 약물표적화가능한 부위에의 결합
도메인 V, MPR, TM 및 세포질 도메인이 결여되고 (대략 서열식별번호: 1의 잔기 642에서 종결됨) 그의 융합후 형태인 정제된 gB 단백질을 본 실험에 사용한다. 단백질을 설계된 펩티드와 함께 실온에서 4시간 동안 약 2배 몰 과량의 펩티드와 함께 인큐베이션한다. 이어서, 샘플을 냉동 그리드 제조 및 냉동 조건에서 영상화한다. 재구성된 구조는 대중적인 영상 처리 소프트웨어, 예컨대 크라이오스파크(CryoSparc) (A. Punjani, J. L. Rubinstein, D. J. Fleet, M. A. Brubaker, cryoSPARC: algorithms for rapid unsupervised cryo-EM structure determination. Nat Methods 14, 290-296 (2017)]) 또는 렐리온(Relion) (S. H. Scheres, RELION: implementation of a Bayesian approach to cryo-EM structure determination. J Struct Biol 180, 519-530 (2012))에 의해 수득된다. 특이적 약물표적화가능한 부위 결합은 융합후 구조에서와 같이 상응하는 위치에서의 펩티드 밀도의 존재에 의해 검증된다.
다른 바이러스와 달리, CMV는 평생 감염을 유발한다. 따라서, 이들 CMV 조정제 또는 억제제는 CMV 감염을 앓고 있는 대상체를 치료하거나 또는 이식 환자 또는 면역결핍 환자에서 감염을 예방하는 데 사용될 수 있다. 또 다른 실시양태에서, 조정제 또는 억제제는 선천성 CMV의 징후를 예방하거나 감소시키기 위해 CMV 감염을 갖는 신생아를 치료하는 데 사용될 수 있다. 신생아에서의 예방의 치료는 또한 임신한 여성에게 투여하는 것을 포함할 수 있다.
표 10
본 발명의 실시양태는 하기 넘버링된 조항에 제시된다:
C1. 약물표적화가능한 영역을 포함하는 당단백질 B (gB) 폴리펩티드를 갖는 인간 시토메갈로바이러스 (HCMV)를 화합물과 접촉시키는 것을 포함하는, HCMV 감염에 의해 유발되는 질환을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법으로서, 여기서 상기 화합물의 결합은 후보 치료제를 나타내는 것인 방법.
C2. 약물표적화가능한 영역을 포함하는 HCMV gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, HCMV 감염에 의해 유발되는 질환을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법으로서, 여기서 상기 gB 폴리펩티드의 기능 또는 활성의 조정은 후보 치료제를 나타내는 것인 방법.
C3. 조항 C2에 있어서, 상기 gB 폴리펩티드의 활성의 상기 조정이 융합후 입체형태에서 도메인 V 결합 홈에 대한 도메인 V의 결합을 배제하는 것을 수반하는 것인 방법.
C4. 약물표적화가능한 영역을 포함하는 gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, gB 폴리펩티드를 갖는 HCMV에 의한 감염에 의해 유발되는 질환을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법으로서, 여기서 상기 바이러스의 융합의 억제는 후보 치료제를 나타내는 것인 방법.
C5. 약물표적화가능한 영역을 포함하는 gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, gB 폴리펩티드를 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법으로서, 여기서 상기 바이러스의 바이러스 감염성의 억제는 후보 치료제를 나타내는 것인 방법.
C6. 약물표적화가능한 영역을 포함하는 gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, gB 폴리펩티드를 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법으로서, 여기서 대상체에서 상기 질환의 적어도 하나의 증상의 감소는 후보 치료제를 나타내는 것인 방법.
C7. 조항 C1-C6 중 어느 한 조항에 있어서, 상기 화합물이 하기 화합물 부류: 단백질, 펩티드, 폴리펩티드, 펩티드모방체, 항체, 핵산, 및 소분자로부터 선택되는 것인 방법.
C8. 조항 C7에 있어서, 결합이 시험관내 검정을 사용하여 결정되는 것인 방법.
C9. 조항 C7에 있어서, 결합이 생체내 검정을 사용하여 결정되는 것인 방법.
C10. 조항 C7에 있어서, 약물표적화가능한 영역이 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 또는 N676-Y690으로부터의 적어도 1개의 잔기를 포함하는 것인 방법.
C11. 조항 C10에 있어서, 약물표적화가능한 영역의 잔기가 융합후 입체형태인 방법.
C12. 조항 C1-C11 중 어느 한 조항에 있어서, 화합물이 M648-K700 (서열식별번호: 260), M648-V697 (서열식별번호: 261), S647-V697 (서열식별번호: 262), S647-V663 (서열식별번호: 263), I653-V697 (서열식별번호: 264), I653-Q692 (서열식별번호: 265), I653-L680 (서열식별번호: 266), I653-S675 (서열식별번호: 267), I653-Y667 (서열식별번호: 268), R662-V697 (서열식별번호: 269), R662-Q692 (서열식별번호: 270), R662-L680 (서열식별번호: 271), R662-S675 (서열식별번호: 272), L664-F678 (서열식별번호: 273), S668-V697 (서열식별번호: 274), S668-Q692 (서열식별번호: 275), S668-V677 (서열식별번호: 276), D679-V697 (서열식별번호: 277), L680-V697 (서열식별번호: 278), L680-Q692 (서열식별번호: 279) 및 R693-K700 (서열식별번호: 280)으로 이루어진 군으로부터 선택된 서열식별번호: 1 (타운 균주)의 잔기를 포함하는 펩티드인 방법.
C13. 조항 C1-C11 중 어느 한 조항에 있어서, 상기 화합물이 화합물의 라이브러리에 있는 것인 방법.
C14. 조항 C13에 있어서, 상기 라이브러리가 조합 합성 방법을 사용하여 생성되는 것인 방법.
C15. HCMV의 당단백질 B (gB)의 도메인 V 영역과 상호작용하는 HCMV 활성의 조정제인 후보 치료제.
C16. HCMV의 당단백질 B (gB)의 도메인 V의 이동을 배제하는 HCMV 활성의 조정제인 후보 치료제.
C17. 융합후 삼량체 내의 임의의 서브유닛에 의해 형성되는 삼량체 계면에서 도메인 V 잔기로부터의 적어도 1개의 잔기와 상호작용함으로써 입체형태 변화의 완료를 배제하는 HCMV 활성의 조정제인 후보 치료제.
C18. 서열식별번호: 1에 대해 적어도 80%의 상동성을 갖는 폴리펩티드 서열을 포함하는 HCMV 활성의 억제제인 후보 치료제.
C19. 조항 C15-C18 중 어느 한 조항에 있어서, 후보 억제제가 M648-K700 (서열식별번호: 260), M648-V697 (서열식별번호: 261), S647-V697 (서열식별번호: 262), S647-V663 (서열식별번호: 263), I653-V697 (서열식별번호: 264), I653-Q692 (서열식별번호: 265), I653-L680 (서열식별번호: 266), I653-S675 (서열식별번호: 267), I653-Y667 (서열식별번호: 268), R662-V697 (서열식별번호: 269), R662-Q692 (서열식별번호: 270), R662-L680 (서열식별번호: 271), R662-S675 (서열식별번호: 272), L664-F678 (서열식별번호: 273), S668-V697 (서열식별번호: 274), S668-Q692 (서열식별번호: 275), S668-V677 (서열식별번호: 276), D679-V697 (서열식별번호: 277), L680-V697 (서열식별번호: 278), L680-Q692 (서열식별번호: 279), 및 R693-K700 (서열식별번호: 280)으로 이루어진 군으로부터 선택된 서열식별번호: 1 (타운 균주)의 잔기를 포함하는 펩티드인 후보 치료제.
C20. 조항 C15-C19에 있어서, 핵산인 후보 치료제.
C21. 조항 C15-C20 중 어느 한 조항의 후보 치료제를 포함하는 제약 조성물.
C22. HCMV 감염과 연관된 질환 또는 장애를 갖는 대상체에게 조항 C21의 제약 조성물을 투여하는 것을 포함하는, 상기 대상체를 치료하는 방법.
C23. 조항 C21의 제약 조성물을 대상체에게 투여하는 것을 포함하는, 대상체에서 HCMV 감염과 연관된 질환 또는 장애를 예방하는 방법.
C24. 조항 C21의 제약 조성물 및 임의로 사용 지침서를 포함하는, HCMV 감염과 연관된 질환 또는 장애를 치료 또는 예방하기 위한 키트.
C25. 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함하는 HCMV gB의 약물표적화가능한 영역.
C26. 조항 C25에 있어서, 약물표적화가능한 영역의 잔기가 융합후 입체형태인 HCMV gB의 약물표적화가능한 영역.
SEQUENCE LISTING
<110> Pfizer Inc.
Chi, Xiaoyuan Sherry
Dormitzer, Philip Ralph
Liu, Weifeng
Liu, Yuhang
<120> NOVEL DRUGGABLE REGIONS IN THE HUMAN CYTOMEGALOVIRUS
GLYCOPROTEIN B POLYPEPTIDE AND METHODS OF USE THEREOF
<130> PC072715
<160> 289
<170> PatentIn version 3.5
<210> 1
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: Original HCMV gB (Towne) sequence
<400> 1
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 2
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-001 Q98C, G271C sequence
<400> 2
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Cys Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Cys Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 3
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-002 Q98C, I653C sequence
<400> 3
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Cys Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Cys Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 4
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-003 G99C, A267C
<400> 4
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Cys Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Cys Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 5
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-004 T100C, A267C
<400> 5
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Cys Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Cys Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 6
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-005 T100C, S269C
<400> 6
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Cys Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Cys Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 7
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-006 T100C, L651C
<400> 7
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Cys Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Cys Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 8
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-007 D217C, F584C
<400> 8
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Cys Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Cys Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 9
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-008 Y218C, A585C
<400> 9
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Cys Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Cys Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 10
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-009 S219C, D654C
<400> 10
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Cys Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Cys Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 11
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-010 N220C, D652C
<400> 11
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Cys Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Cys Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 12
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-011 T221C, D652C
<400> 12
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Cys His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Cys Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 13
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-012 W240C, G718C
<400> 13
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Cys
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Cys Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 14
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-013 Y242C, K710C
<400> 14
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Cys Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Cys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 15
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-014 Y242C, D714C
<400> 15
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Cys Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Cys Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 16
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-015 S269C, I653C
<400> 16
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Cys Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Cys Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 17
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-016 G271C, P614C
<400> 17
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Cys Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Cys Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 18
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-017 S367C, L499C
<400> 18
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Cys Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Cys Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 19
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-018 T372C, W506C
<400> 19
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Cys Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Cys Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 20
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-019 F541C, Q669C
<400> 20
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Cys Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Cys Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 21
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-020 L548C, A650C
<400> 21
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Cys Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Cys Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 22
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-021 A549C, I653C
<400> 22
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Cys Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Cys Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 23
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-022 S550C, D652C
<400> 23
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Cys Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Cys Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 24
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-023 G604C, F661C
<400> 24
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Cys Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Cys Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 25
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-024 N605C, E665C
<400> 25
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Cys His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Cys Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 26
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-025 R607C, S675C
<400> 26
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Cys Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Cys Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 27
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-026 T608C, D679C
<400> 27
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Cys
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Cys Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 28
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-027 E609C, F678C
<400> 28
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Cys Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Cys Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 29
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-028 R673C, S674C
<400> 29
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Cys Cys Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 30
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-029 N676C, V677C
<400> 30
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Cys Cys Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 31
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-030 L680C, E681C
<400> 31
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Cys Cys Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 32
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-031 I683C, M684C
<400> 32
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Cys Cys Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 33
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-032 F687C, N688C
<400> 33
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Cys Cys
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 34
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-033 Y690C, K691C
<400> 34
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Cys Cys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 35
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-034 K695C, K724C
<400> 35
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Cys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Cys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 36
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-035 T746C, F747C
<400> 36
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Cys Cys Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 37
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-036 K749C, N750C
<400> 37
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Cys Cys Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 38
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-037 K670L
<400> 38
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Leu Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 39
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-038 K670F
<400> 39
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Phe Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 40
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-039 R673L
<400> 40
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Leu Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 41
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-040 R673F
<400> 41
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Phe Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 42
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-041 K691L
<400> 42
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Leu Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 43
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence: gB-042 K691F
<400> 43
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Phe Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 44
<211> 630
<212> PRT
<213> Human cytomegalovirus
<400> 44
Tyr Gly Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val
1 5 10 15
Cys Ser Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile
20 25 30
Ile Cys Thr Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile
35 40 45
Met Val Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg
50 55 60
Val Tyr Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Gly His Arg
65 70 75 80
Thr Thr Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met
85 90 95
Trp Glu Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr
100 105 110
Ser Arg Val Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser
115 120 125
His Glu Asn Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr
130 135 140
His Ser Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly
145 150 155 160
Ser Thr Ala Thr His Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr
165 170 175
Ile Thr Thr Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser
180 185 190
Thr Gly Asp Val Val Tyr Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg
195 200 205
Asn Ala Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro
210 215 220
Asn Tyr Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu
225 230 235 240
Thr His Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser
245 250 255
Trp Asp Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp
260 265 270
Glu Ala Ser Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His
275 280 285
Phe Ser Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu
290 295 300
Val Asn Met Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile
305 310 315 320
Asn Lys Leu Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu
325 330 335
Lys Tyr Gly Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val
340 345 350
Phe Trp Gln Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu
355 360 365
Ala Asn Arg Ser Ser Leu Asn Ile Thr His Asp Asp Asp Asp Lys Ser
370 375 380
Thr Ser Asp Asn Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His
385 390 395 400
Asn Leu Val Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly
405 410 415
Tyr Ile Asn Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp
420 425 430
Gln Arg Arg Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro
435 440 445
Ser Ala Ile Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe
450 455 460
Met Gly Asp Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr
465 470 475 480
Ser Val Lys Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg
485 490 495
Cys Tyr Ser Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr
500 505 510
Val Gln Tyr Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn
515 520 525
His Arg Thr Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala
530 535 540
Gly Asn Ser Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile
545 550 555 560
Asp Leu Ser Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile
565 570 575
Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln
580 585 590
Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg
595 600 605
Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val
610 615 620
Val Asp Pro Leu Pro Pro
625 630
<210> 45
<211> 705
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence: gB705
<400> 45
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Val Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Ala His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Gly His Arg Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Arg His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Ala
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Ala Thr Lys Ala Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro
705
<210> 46
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 46
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Arg Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 47
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 47
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Cys
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Cys Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 48
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 48
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Cys Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Cys Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 49
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 49
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Cys Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Cys Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 50
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 50
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Cys Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Cys
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 51
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 51
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Cys Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Cys Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 52
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 52
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Cys Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Cys Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 53
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 53
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Cys Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Cys Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 54
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 54
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Cys Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Cys Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 55
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 55
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Cys Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Cys Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 56
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 56
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Cys Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Cys Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 57
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 57
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Cys Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Cys Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 58
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 58
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Cys Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Cys Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 59
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 59
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Cys Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Cys Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 60
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 60
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Cys Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Cys Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 61
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 61
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Cys Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Cys Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 62
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 62
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Cys Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Cys Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 63
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 63
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Cys
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Cys Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 64
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 64
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Cys
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Cys Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 65
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 65
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Cys Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Cys Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 66
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 66
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Cys Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Cys Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 67
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 67
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Cys Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Cys
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 68
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 68
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Cys Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Cys
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 69
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 69
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Cys Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Cys Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 70
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 70
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Cys
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Cys Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 71
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 71
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Cys Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Cys Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 72
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 72
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Cys Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Cys Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 73
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 73
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Cys Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Cys Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 74
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 74
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Cys Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Cys Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 75
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 75
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Cys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Cys Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 76
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 76
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Cys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Cys Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 77
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 77
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Cys Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Cys Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 78
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 78
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Cys Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Cys Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 79
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 79
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Cys Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Cys Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 80
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 80
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Cys Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Cys Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 81
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 81
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Cys Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Cys Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 82
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 82
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Cys Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Cys Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 83
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 83
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Cys Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Cys Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 84
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 84
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Cys Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Cys Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 85
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 85
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Cys Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Cys Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 86
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 86
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Cys Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Cys Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 87
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 87
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Cys Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Cys Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 88
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 88
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Cys Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Cys Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 89
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 89
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Cys Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Cys
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 90
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 90
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Cys Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Cys
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 91
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 91
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Cys
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Cys Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 92
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 92
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Cys Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Cys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 93
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 93
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Cys Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Cys Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 94
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 94
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Cys Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Cys Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 95
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 95
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Cys Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Cys Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 96
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 96
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Cys Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Cys Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 97
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 97
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Cys Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Cys Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 98
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 98
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Cys Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Cys Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 99
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 99
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Ser Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 100
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 100
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asn Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 101
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 101
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Ser Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 102
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 102
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Gln Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 103
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 103
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Ser Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 104
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 104
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Gln Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 105
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 105
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Pro Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 106
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 106
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Pro Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 107
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> >5CXF:A|PDBID|CHAIN|SEQUENCE
<400> 107
Tyr Gly Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val
1 5 10 15
Cys Ser Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile
20 25 30
Ile Cys Thr Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile
35 40 45
Met Val Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg
50 55 60
Val Tyr Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Gly His Arg
65 70 75 80
Thr Thr Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met
85 90 95
Trp Glu Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr
100 105 110
Ser Arg Val Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser
115 120 125
His Glu Asn Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr
130 135 140
His Ser Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly
145 150 155 160
Ser Thr Ala Thr His Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr
165 170 175
Ile Thr Thr Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser
180 185 190
Thr Gly Asp Val Val Tyr Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg
195 200 205
Asn Ala Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro
210 215 220
Asn Tyr Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu
225 230 235 240
Thr His Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser
245 250 255
Trp Asp Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp
260 265 270
Glu Ala Ser Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His
275 280 285
Phe Ser Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu
290 295 300
Val Asn Met Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile
305 310 315 320
Asn Lys Leu Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu
325 330 335
Lys Tyr Gly Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val
340 345 350
Phe Trp Gln Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu
355 360 365
Ala Asn Arg Ser Ser Leu Asn Ile Thr His Asp Asp Asp Asp Lys Ser
370 375 380
Thr Ser Asp Asn Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His
385 390 395 400
Asn Leu Val Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly
405 410 415
Tyr Ile Asn Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp
420 425 430
Gln Arg Arg Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro
435 440 445
Ser Ala Ile Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe
450 455 460
Met Gly Asp Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr
465 470 475 480
Ser Val Lys Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg
485 490 495
Cys Tyr Ser Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr
500 505 510
Val Gln Tyr Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn
515 520 525
His Arg Thr Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala
530 535 540
Gly Asn Ser Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile
545 550 555 560
Asp Leu Ser Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile
565 570 575
Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln
580 585 590
Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg
595 600 605
Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val
610 615 620
Val Asp Pro Leu Pro Pro
625 630
<210> 108
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> >5CXF:B|PDBID|CHAIN|SEQUENCE
<400> 108
Tyr Gly Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val
1 5 10 15
Cys Ser Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile
20 25 30
Ile Cys Thr Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile
35 40 45
Met Val Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg
50 55 60
Val Tyr Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Gly His Arg
65 70 75 80
Thr Thr Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met
85 90 95
Trp Glu Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr
100 105 110
Ser Arg Val Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser
115 120 125
His Glu Asn Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr
130 135 140
His Ser Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly
145 150 155 160
Ser Thr Ala Thr His Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr
165 170 175
Ile Thr Thr Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser
180 185 190
Thr Gly Asp Val Val Tyr Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg
195 200 205
Asn Ala Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro
210 215 220
Asn Tyr Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu
225 230 235 240
Thr His Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser
245 250 255
Trp Asp Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp
260 265 270
Glu Ala Ser Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His
275 280 285
Phe Ser Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu
290 295 300
Val Asn Met Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile
305 310 315 320
Asn Lys Leu Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu
325 330 335
Lys Tyr Gly Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val
340 345 350
Phe Trp Gln Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu
355 360 365
Ala Asn Arg Ser Ser Leu Asn Ile Thr His Asp Asp Asp Asp Lys Ser
370 375 380
Thr Ser Asp Asn Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His
385 390 395 400
Asn Leu Val Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly
405 410 415
Tyr Ile Asn Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp
420 425 430
Gln Arg Arg Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro
435 440 445
Ser Ala Ile Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe
450 455 460
Met Gly Asp Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr
465 470 475 480
Ser Val Lys Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg
485 490 495
Cys Tyr Ser Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr
500 505 510
Val Gln Tyr Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn
515 520 525
His Arg Thr Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala
530 535 540
Gly Asn Ser Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile
545 550 555 560
Asp Leu Ser Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile
565 570 575
Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln
580 585 590
Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg
595 600 605
Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val
610 615 620
Val Asp Pro Leu Pro Pro
625 630
<210> 109
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> >5CXF:C|PDBID|CHAIN|SEQUENCE
<400> 109
Tyr Gly Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val
1 5 10 15
Cys Ser Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile
20 25 30
Ile Cys Thr Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile
35 40 45
Met Val Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg
50 55 60
Val Tyr Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Gly His Arg
65 70 75 80
Thr Thr Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met
85 90 95
Trp Glu Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr
100 105 110
Ser Arg Val Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser
115 120 125
His Glu Asn Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr
130 135 140
His Ser Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly
145 150 155 160
Ser Thr Ala Thr His Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr
165 170 175
Ile Thr Thr Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser
180 185 190
Thr Gly Asp Val Val Tyr Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg
195 200 205
Asn Ala Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro
210 215 220
Asn Tyr Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu
225 230 235 240
Thr His Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser
245 250 255
Trp Asp Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp
260 265 270
Glu Ala Ser Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His
275 280 285
Phe Ser Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu
290 295 300
Val Asn Met Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile
305 310 315 320
Asn Lys Leu Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu
325 330 335
Lys Tyr Gly Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val
340 345 350
Phe Trp Gln Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu
355 360 365
Ala Asn Arg Ser Ser Leu Asn Ile Thr His Asp Asp Asp Asp Lys Ser
370 375 380
Thr Ser Asp Asn Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His
385 390 395 400
Asn Leu Val Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly
405 410 415
Tyr Ile Asn Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp
420 425 430
Gln Arg Arg Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro
435 440 445
Ser Ala Ile Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe
450 455 460
Met Gly Asp Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr
465 470 475 480
Ser Val Lys Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg
485 490 495
Cys Tyr Ser Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr
500 505 510
Val Gln Tyr Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn
515 520 525
His Arg Thr Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala
530 535 540
Gly Asn Ser Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile
545 550 555 560
Asp Leu Ser Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile
565 570 575
Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln
580 585 590
Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg
595 600 605
Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val
610 615 620
Val Asp Pro Leu Pro Pro
625 630
<210> 110
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 110
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Ala His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Arg His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Asn
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 111
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 111
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Val Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Ala His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Arg His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Asn
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 112
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 112
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Val Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Ala His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Arg His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Ser
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Arg Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 113
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 113
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Tyr
1 5 10 15
Val Cys Leu Gly Ala Val Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Ala His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Arg His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Asn
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 114
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 114
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Val Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Ala His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Arg His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Asn
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 115
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 115
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Arg Asn Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Arg Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Ser
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 116
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 116
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Thr His Asn Gly Ser His Ala Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Lys Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Ile
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Pro Val Leu Asp Cys Val Arg Asn Gln Ala Leu Asp Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser
435 440 445
Ser Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr
450 455 460
Thr Thr Leu Ser Pro Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala
485 490 495
Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Asn
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 117
<211> 904
<212> PRT
<213> Human cytomegalovirus
<400> 117
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Asn Gly Ser His Thr Ser His Thr Thr Ser Ala Gln Thr
35 40 45
Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser His
50 55 60
Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp Val
65 70 75 80
Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met Ala
85 90 95
Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr Pro
100 105 110
Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val Tyr
115 120 125
Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln Lys
130 135 140
Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr Leu
145 150 155 160
Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile His
165 170 175
His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val Ile
180 185 190
Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn Lys
195 200 205
Thr Met Gln Leu Met Leu Asp Asp Tyr Ser Asn Thr His Ser Thr Arg
210 215 220
Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp Leu
225 230 235 240
Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr Ala
245 250 255
Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp Val
260 265 270
Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Thr Ser Tyr
275 280 285
Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr Ile
290 295 300
Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg Leu
305 310 315 320
Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile Gln
325 330 335
Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser Glu
340 345 350
Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser Ala
355 360 365
Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met Ser
370 375 380
Asp Pro Val Leu Asp Cys Val Arg Asn Gln Ala Leu Asn Lys Leu Gln
385 390 395 400
Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly Asn
405 410 415
Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln Gly
420 425 430
Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala Asn Ser Ser
435 440 445
Gly Val Asn Ser Thr Arg Arg Thr Lys Arg Ser Thr Gly Asn Thr Thr
450 455 460
Thr Leu Ser Leu Glu Ser Glu Ser Val Arg Asn Val Leu Tyr Ala Gln
465 470 475 480
Leu Gln Phe Thr Tyr Asp Thr Leu Arg Ser Tyr Ile Asn Arg Ala Leu
485 490 495
Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu Glu
500 505 510
Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser Ala
515 520 525
Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu Gly
530 535 540
Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu Arg
545 550 555 560
Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro Val
565 570 575
Val Ile Phe Asn Phe Val Asn Ser Ser Tyr Val Gln Tyr Gly Gln Leu
580 585 590
Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu Cys
595 600 605
Gln Phe Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr Glu
610 615 620
Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile Ser
625 630 635 640
Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn Thr
645 650 655
Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser
660 665 670
Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys
675 680 685
Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro Pro
690 695 700
Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala Gly
705 710 715 720
Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala Ser
725 730 735
Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala Phe
740 745 750
Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu Ile
755 760 765
Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu Phe
770 775 780
Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Ser Ser Thr
785 790 795 800
Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val Tyr
805 810 815
Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser Thr
820 825 830
Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu Ala
835 840 845
Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr Asp
850 855 860
Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro Asn
865 870 875 880
Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu Lys
885 890 895
Asp Ser Asp Glu Glu Glu Asn Val
900
<210> 118
<211> 906
<212> PRT
<213> Human cytomegalovirus
<400> 118
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Tyr Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Ile Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile Tyr Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Tyr Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Ile Thr His Arg Thr Arg Arg Ser Thr Ser Asp Asn
450 455 460
Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu Val Tyr
465 470 475 480
Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg
485 490 495
Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr
500 505 510
Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu
515 520 525
Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val
530 535 540
Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val
545 550 555 560
Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg
565 570 575
Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly
580 585 590
Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu
595 600 605
Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala
610 615 620
Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser
625 630 635 640
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
645 650 655
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
660 665 670
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
675 680 685
Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu
690 695 700
Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala
705 710 715 720
Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val
725 730 735
Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly
740 745 750
Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr Tyr
755 760 765
Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn
770 775 780
Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly
785 790 795 800
Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser
805 810 815
Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala
820 825 830
Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu
835 840 845
Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly
850 855 860
Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys
865 870 875 880
Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His
885 890 895
Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 119
<211> 906
<212> PRT
<213> Human cytomegalovirus
<400> 119
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Tyr Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Ile Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile Tyr Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Ile Thr His Arg Thr Arg Arg Ser Thr Ser Asp Asn
450 455 460
Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu Val Tyr
465 470 475 480
Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg
485 490 495
Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr
500 505 510
Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu
515 520 525
Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val
530 535 540
Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val
545 550 555 560
Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg
565 570 575
Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly
580 585 590
Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu
595 600 605
Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala
610 615 620
Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser
625 630 635 640
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
645 650 655
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
660 665 670
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
675 680 685
Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu
690 695 700
Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala
705 710 715 720
Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val
725 730 735
Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly
740 745 750
Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr Tyr
755 760 765
Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn
770 775 780
Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly
785 790 795 800
Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser
805 810 815
Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala
820 825 830
Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu
835 840 845
Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly
850 855 860
Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys
865 870 875 880
Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His
885 890 895
Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 120
<211> 906
<212> PRT
<213> Human cytomegalovirus
<400> 120
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Tyr Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Ile Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile Tyr Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Ile Thr His Arg Thr Arg Arg Ser Thr Ser Asp Asn
450 455 460
Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu Val Tyr
465 470 475 480
Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg
485 490 495
Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr
500 505 510
Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu
515 520 525
Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val
530 535 540
Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val
545 550 555 560
Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg
565 570 575
Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly
580 585 590
Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu
595 600 605
Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala
610 615 620
Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser
625 630 635 640
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
645 650 655
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
660 665 670
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
675 680 685
Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu
690 695 700
Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala
705 710 715 720
Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val
725 730 735
Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly
740 745 750
Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr Tyr
755 760 765
Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn
770 775 780
Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly
785 790 795 800
Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser
805 810 815
Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala
820 825 830
Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu
835 840 845
Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly
850 855 860
Thr Asp Ser Leu Asp Gly Gln Ala Gly Thr Gln Asp Lys Gly Gln Lys
865 870 875 880
Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His
885 890 895
Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 121
<211> 906
<212> PRT
<213> Human cytomegalovirus
<400> 121
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Ser Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Ile Thr His Arg Thr Arg Arg Ser Thr Ser Asp Asn
450 455 460
Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu Val Tyr
465 470 475 480
Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg
485 490 495
Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr
500 505 510
Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu
515 520 525
Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val
530 535 540
Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val
545 550 555 560
Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg
565 570 575
Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly
580 585 590
Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu
595 600 605
Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala
610 615 620
Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser
625 630 635 640
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
645 650 655
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
660 665 670
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
675 680 685
Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu
690 695 700
Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala
705 710 715 720
Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val
725 730 735
Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly
740 745 750
Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr Tyr
755 760 765
Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn
770 775 780
Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly
785 790 795 800
Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser
805 810 815
Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala
820 825 830
Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu
835 840 845
Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly
850 855 860
Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys
865 870 875 880
Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His
885 890 895
Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 122
<211> 906
<212> PRT
<213> Human cytomegalovirus
<400> 122
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser His Ala Thr
20 25 30
Ser Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln
35 40 45
Thr Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser
50 55 60
His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Ile Thr His Arg Thr Arg Arg Ser Thr Ser Asp Asn
450 455 460
Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu Val Tyr
465 470 475 480
Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg
485 490 495
Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr
500 505 510
Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu
515 520 525
Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val
530 535 540
Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val
545 550 555 560
Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg
565 570 575
Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly
580 585 590
Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu
595 600 605
Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala
610 615 620
Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser
625 630 635 640
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
645 650 655
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
660 665 670
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
675 680 685
Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu
690 695 700
Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala
705 710 715 720
Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val
725 730 735
Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly
740 745 750
Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr Tyr
755 760 765
Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn
770 775 780
Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly
785 790 795 800
Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser
805 810 815
Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala
820 825 830
Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu
835 840 845
Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly
850 855 860
Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys
865 870 875 880
Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His
885 890 895
Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 123
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 123
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr His Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Ser Gln Arg Val Thr Ser Ser Glu Ala Val
50 55 60
Ser His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly
65 70 75 80
Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser
85 90 95
Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys
100 105 110
Thr Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val
115 120 125
Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr
130 135 140
Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile Tyr Thr Thr
145 150 155 160
Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu
165 170 175
Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser Arg
180 185 190
Val Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu
195 200 205
Asn Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr His Ser
210 215 220
Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr
225 230 235 240
Trp Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr Ile Thr
245 250 255
Thr Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly
260 265 270
Asp Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala
275 280 285
Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr
290 295 300
Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu Thr His
305 310 315 320
Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp
325 330 335
Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala
340 345 350
Ser Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser
355 360 365
Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn
370 375 380
Met Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys
385 390 395 400
Leu Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr
405 410 415
Gly Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val Phe Trp
420 425 430
Gln Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn
435 440 445
Arg Ser Ser Leu Asn Ile Thr His Arg Thr Arg Arg Ser Thr Ser Asp
450 455 460
Asn Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 124
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 124
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr His Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Ser Gln Arg Val Thr Ser Ser Glu Ala Val
50 55 60
Ser His Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly
65 70 75 80
Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser
85 90 95
Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys
100 105 110
Thr Pro Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val
115 120 125
Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr
130 135 140
Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile Tyr Thr Thr
145 150 155 160
Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu
165 170 175
Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser Arg
180 185 190
Val Ile Gly Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu
195 200 205
Asn Lys Thr Met Gln Leu Ile Pro Asp Asp Tyr Ser Asn Thr His Ser
210 215 220
Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr
225 230 235 240
Trp Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Leu Thr Ile Thr
245 250 255
Thr Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly
260 265 270
Asp Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala
275 280 285
Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr
290 295 300
Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Pro Glu Thr His
305 310 315 320
Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp
325 330 335
Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala
340 345 350
Ser Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser
355 360 365
Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn
370 375 380
Met Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys
385 390 395 400
Leu Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr
405 410 415
Gly Asn Val Ser Val Phe Glu Thr Ser Gly Gly Leu Val Val Phe Trp
420 425 430
Gln Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn
435 440 445
Arg Ser Ser Leu Asn Ile Thr His Arg Thr Arg Arg Ser Thr Ser Asp
450 455 460
Asn Asn Thr Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Lys Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 125
<211> 906
<212> PRT
<213> Human cytomegalovirus
<400> 125
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Thr Ser His Ala Thr Ser
20 25 30
Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln Thr
35 40 45
Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser His
50 55 60
Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp Val
65 70 75 80
Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met Ala
85 90 95
Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr Ser
100 105 110
Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val Tyr
115 120 125
Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln Lys
130 135 140
Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr Leu
145 150 155 160
Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile His
165 170 175
His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val Ile
180 185 190
Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn Lys
195 200 205
Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr Arg
210 215 220
Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp Leu
225 230 235 240
Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr Ala
245 250 255
Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp Val
260 265 270
Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser Tyr
275 280 285
Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr Ile
290 295 300
Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg Ser
305 310 315 320
Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile Gln
325 330 335
Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser Glu
340 345 350
Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser Ala
355 360 365
Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met Ser
370 375 380
Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu Gln
385 390 395 400
Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly Asn
405 410 415
Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln Gly
420 425 430
Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg Ser
435 440 445
Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asn Gly Asn
450 455 460
Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val Tyr
465 470 475 480
Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg
485 490 495
Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Ser
500 505 510
Leu Glu Val Phe Arg Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu
515 520 525
Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val
530 535 540
Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val
545 550 555 560
Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg
565 570 575
Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly
580 585 590
Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu
595 600 605
Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala
610 615 620
Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser
625 630 635 640
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
645 650 655
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
660 665 670
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
675 680 685
Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu
690 695 700
Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala
705 710 715 720
Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val
725 730 735
Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly
740 745 750
Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr
755 760 765
Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn
770 775 780
Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly
785 790 795 800
Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser
805 810 815
Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala
820 825 830
Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu
835 840 845
Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly
850 855 860
Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys
865 870 875 880
Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His
885 890 895
Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 126
<211> 906
<212> PRT
<213> Human cytomegalovirus
<400> 126
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Thr Ser His Ala Thr Ser
20 25 30
Ser Thr His Asn Gly Ser His Thr Ser Arg Thr Thr Ser Ala Gln Thr
35 40 45
Arg Ser Val Ser Ser Gln His Val Thr Ser Ser Glu Ala Val Ser His
50 55 60
Arg Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp Val
65 70 75 80
Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met Ala
85 90 95
Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr Ser
100 105 110
Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val Tyr
115 120 125
Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln Lys
130 135 140
Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr Leu
145 150 155 160
Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile His
165 170 175
His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val Ile
180 185 190
Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn Lys
195 200 205
Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr Arg
210 215 220
Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp Leu
225 230 235 240
Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr Ala
245 250 255
Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp Val
260 265 270
Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser Tyr
275 280 285
Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr Ile
290 295 300
Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg Ser
305 310 315 320
Val Ala Phe Leu Glu Arg Ala Glu Ser Val Ile Ser Trp Asp Ile Gln
325 330 335
Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser Glu
340 345 350
Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser Ala
355 360 365
Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met Ser
370 375 380
Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu Gln
385 390 395 400
Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly Asn
405 410 415
Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln Gly
420 425 430
Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg Ser
435 440 445
Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asn Gly Ser
450 455 460
Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val Tyr
465 470 475 480
Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg
485 490 495
Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Ser
500 505 510
Leu Glu Val Phe Arg Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu
515 520 525
Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val
530 535 540
Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val
545 550 555 560
Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg
565 570 575
Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly
580 585 590
Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu
595 600 605
Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala
610 615 620
Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser
625 630 635 640
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
645 650 655
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
660 665 670
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
675 680 685
Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu
690 695 700
Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala
705 710 715 720
Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val
725 730 735
Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly
740 745 750
Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr
755 760 765
Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn
770 775 780
Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly
785 790 795 800
Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser
805 810 815
Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala
820 825 830
Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu
835 840 845
Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly
850 855 860
Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys
865 870 875 880
Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His
885 890 895
Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 127
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 127
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 128
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 128
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Arg Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser Arg Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asn
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 129
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 129
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Arg Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 130
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 130
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Leu
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 131
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 131
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Val Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 132
<211> 908
<212> PRT
<213> Human cytomegalovirus
<400> 132
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Ser Arg Gly Thr
20 25 30
Ser Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His
35 40 45
Ser Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val
50 55 60
Ser His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly
65 70 75 80
Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser
85 90 95
Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys
100 105 110
Thr Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val
115 120 125
Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr
130 135 140
Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr
145 150 155 160
Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu
165 170 175
Ile His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg
180 185 190
Val Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu
195 200 205
Asn Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser
210 215 220
Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr
225 230 235 240
Trp Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr
245 250 255
Thr Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly
260 265 270
Asp Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala
275 280 285
Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr
290 295 300
Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His
305 310 315 320
Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp
325 330 335
Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala
340 345 350
Ser Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser
355 360 365
Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn
370 375 380
Met Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys
385 390 395 400
Leu Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr
405 410 415
Gly Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp
420 425 430
Gln Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn
435 440 445
Arg Ser Ser Leu Asn Leu Thr His Ser Arg Thr Lys Arg Ser Ala Asp
450 455 460
Gly Asn Asn Ala Thr His Leu Ser Ser Met Glu Ser Val His Asn Leu
465 470 475 480
Val Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile
485 490 495
Asn Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg
500 505 510
Arg Ser Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala
515 520 525
Ile Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly
530 535 540
Asp Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val
545 550 555 560
Lys Val Leu Arg Asp Met Asn Val Lys Asp Ser Pro Gly Arg Cys Tyr
565 570 575
Ser Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln
580 585 590
Tyr Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg
595 600 605
Thr Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn
610 615 620
Ser Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu
625 630 635 640
Ser Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro
645 650 655
Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu
660 665 670
Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe
675 680 685
Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp
690 695 700
Pro Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu
705 710 715 720
Gly Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly
725 730 735
Ala Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro
740 745 750
Phe Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile
755 760 765
Thr Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu
770 775 780
Gln Asn Leu Phe Pro Tyr Leu Val Ser Ala Asn Gly Thr Thr Val Thr
785 790 795 800
Ser Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu
805 810 815
Glu Ser Val Tyr Asn Ser Gly Arg Lys Gly Ser Gly Pro Pro Ser Ser
820 825 830
Asp Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln
835 840 845
Met Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln
850 855 860
Asn Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly
865 870 875 880
Gln Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr
885 890 895
Arg His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 133
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 133
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Pro
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Arg Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 134
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 134
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Ala Asn Ser Ala Pro Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Val Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Ser Arg Ala Lys Arg Ser Ala Asp Gly
450 455 460
Asn Asn Thr Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Ser Leu Glu Val Phe Arg Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 135
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 135
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Thr Ser Arg Ala Thr Ser
20 25 30
Thr His Asn Gly Ser His Ile Ser Arg Thr Thr Ser Ala Gln Thr Arg
35 40 45
Ser Ile Ser Ser Gln Arg Val Thr Ser Ser Glu Ala Val Ser His Arg
50 55 60
Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp Val Val
65 70 75 80
Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met Ala Gln
85 90 95
Gly Thr Asp Leu Ile Arg Phe Asp Arg Asn Ile Val Cys Thr Pro Met
100 105 110
Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val Tyr Lys
115 120 125
Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln Lys Val
130 135 140
Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr Leu Leu
145 150 155 160
Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile His His
165 170 175
Ile Asn Arg His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val Ile Ala
180 185 190
Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn Lys Thr
195 200 205
Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr Arg Tyr
210 215 220
Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp Leu Tyr
225 230 235 240
Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr Ala Arg
245 250 255
Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp Val Val
260 265 270
Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser Tyr Phe
275 280 285
Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr Ile Val
290 295 300
Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg Leu Val
305 310 315 320
Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile Gln Asp
325 330 335
Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser Glu Arg
340 345 350
Thr Ile Arg Ser Glu Ala Glu Glu Ser Tyr His Phe Ser Ser Ala Lys
355 360 365
Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met Ser Asp
370 375 380
Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Leu Asn Lys Leu Gln Gln
385 390 395 400
Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly Asn Val
405 410 415
Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln Gly Ile
420 425 430
Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg Ser Ser
435 440 445
Leu Asn Leu Thr His Ser Arg Thr Arg Arg Ser Thr Asp Gly Thr Asn
450 455 460
Val Thr His Leu Ser Asn Met Asp Ser Val His Asn Leu Val Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg Ala
485 490 495
Leu Thr Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Ser
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 136
<211> 905
<212> PRT
<213> Human cytomegalovirus
<400> 136
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Thr Ser Arg Ala Thr Ser
20 25 30
Thr His Asn Gly Asn His Thr Ser His Thr Thr Ser Ala Gln Thr Arg
35 40 45
Ser Ile Ser Ser Gln Arg Val Thr Ser Ser Glu Ala Val Ser His Arg
50 55 60
Ala Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp Val Val
65 70 75 80
Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met Ala Gln
85 90 95
Gly Thr Asp Leu Ile Arg Phe Asp Arg Asn Ile Val Cys Thr Pro Met
100 105 110
Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val Tyr Lys
115 120 125
Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln Lys Val
130 135 140
Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr Leu Leu
145 150 155 160
Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile His His
165 170 175
Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val Ile Ala
180 185 190
Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn Lys Thr
195 200 205
Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr Arg Tyr
210 215 220
Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp Leu Tyr
225 230 235 240
Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr Ala Arg
245 250 255
Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp Val Val
260 265 270
Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser Tyr Phe
275 280 285
Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr Ile Val
290 295 300
Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg Leu Val
305 310 315 320
Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile Gln Asp
325 330 335
Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser Glu Arg
340 345 350
Thr Ile Arg Ser Glu Ala Glu Glu Ser Tyr His Phe Ser Ser Ala Lys
355 360 365
Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met Ser Asp
370 375 380
Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Leu Asn Lys Leu Gln Gln
385 390 395 400
Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly Asn Val
405 410 415
Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln Gly Ile
420 425 430
Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg Ser Ser
435 440 445
Leu Asn Leu Thr His Ser Arg Thr Arg Arg Ser Thr Asp Gly Thr Asn
450 455 460
Val Thr His Leu Ser Asn Met Asp Ser Val His Asn Leu Val Tyr Ala
465 470 475 480
Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg Ala
485 490 495
Leu Thr Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu
500 505 510
Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile Leu Ser
515 520 525
Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp Val Leu
530 535 540
Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys Val Leu
545 550 555 560
Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser Arg Pro
565 570 575
Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr Gly Gln
580 585 590
Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr Glu Glu
595 600 605
Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser Ala Tyr
610 615 620
Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser Ser Ile
625 630 635 640
Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn
645 650 655
Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser
660 665 670
Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
675 680 685
Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro Leu Pro
690 695 700
Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly Ala Ala
705 710 715 720
Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala Val Ala
725 730 735
Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe Gly Ala
740 745 750
Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile Tyr Leu
755 760 765
Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln Asn Leu
770 775 780
Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser Gly Asn
785 790 795 800
Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu Ser Val
805 810 815
Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp Ala Ser
820 825 830
Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met Leu Leu
835 840 845
Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn Gly Thr
850 855 860
Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln Lys Pro
865 870 875 880
Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg His Leu
885 890 895
Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 137
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 137
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 138
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 138
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ser Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Arg Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Ile Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 139
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 139
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Thr Gly Ser Arg
20 25 30
Gly Thr Ser Thr His Asn His His Ser Ser His Thr Thr Ser Ala Ala
35 40 45
Arg Ser Gln Ser Gly Ser Val Ser His His Val Thr Ser Ser Gln Thr
50 55 60
Val Ser His Asp Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr
65 70 75 80
Gly Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys
85 90 95
Ser Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val
100 105 110
Cys Thr Pro Val Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met
115 120 125
Val Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val
130 135 140
Tyr Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile Tyr Ser
145 150 155 160
Thr Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp
165 170 175
Glu Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser
180 185 190
Arg Val Ile Ala Gly Thr Leu Phe Val Ala Tyr His Arg Asp Ser Tyr
195 200 205
Glu Asn Lys Thr Met Gln Leu Met Ser Asp Asp Tyr Ser Asn Thr His
210 215 220
Ser Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser
225 230 235 240
Thr Trp Leu Tyr His Glu Thr Cys Asn Leu Asn Cys Met Val Thr Met
245 250 255
Thr Ala Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr
260 265 270
Gly Asp Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn
275 280 285
Thr Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn
290 295 300
Tyr Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Gln Glu Thr
305 310 315 320
His Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp
325 330 335
Asp Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu
340 345 350
Ala Ser Glu Arg Thr Ile Arg Ser Glu Ala Lys Asp Ser Tyr His Phe
355 360 365
Ser Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val
370 375 380
Asn Met Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn
385 390 395 400
Lys Leu Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys
405 410 415
Tyr Gly Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe
420 425 430
Trp Gln Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala
435 440 445
Asn Ser Ser Gly Val Asn Ala Thr Arg Arg Ser Lys Arg Ser Thr Asn
450 455 460
Asn Thr Thr Thr Leu Ser Leu Glu Asn Asp Ser Val Arg Ser Val Leu
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Asn Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Thr Ile Lys Asp Ser Thr Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Thr Phe Ala Asn Ser Ser His Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 140
<211> 907
<212> PRT
<213> Human cytomegalovirus
<400> 140
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Thr Gly Ser Arg
20 25 30
Gly Thr Ser Thr His Asn His His Ser Ser His Thr Thr Ser Ala Ala
35 40 45
Arg Ser Gln Ser Gly Ser Val Ser His His Val Thr Ser Ser Gln Thr
50 55 60
Val Ser His Asp Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr
65 70 75 80
Gly Asp Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys
85 90 95
Ser Met Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val
100 105 110
Cys Thr Pro Val Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met
115 120 125
Val Val Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val
130 135 140
Tyr Gln Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile Tyr Ser
145 150 155 160
Thr Tyr Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp
165 170 175
Glu Ile His His Ile Asn Lys Phe Ala Gln Cys Tyr Ser Ser Tyr Ser
180 185 190
Arg Val Ile Ala Gly Thr Leu Phe Val Ala Tyr His Arg Asp Ser Tyr
195 200 205
Glu Asn Lys Thr Met Gln Leu Met Ser Asp Asp Tyr Ser Asn Thr His
210 215 220
Ser Thr Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser
225 230 235 240
Thr Trp Leu Tyr His Glu Thr Cys Asn Leu Asn Cys Met Val Thr Met
245 250 255
Thr Ala Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr
260 265 270
Gly Asp Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn
275 280 285
Thr Ser Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn
290 295 300
Tyr Thr Ile Val Ser Asp Phe Gly Arg Pro Asn Ala Ala Gln Glu Thr
305 310 315 320
His Arg Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp
325 330 335
Asp Ile Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu
340 345 350
Ala Ser Glu Arg Thr Ile Arg Ser Glu Ala Lys Asp Ser Tyr His Phe
355 360 365
Ser Ser Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val
370 375 380
Asn Met Ser Asp Pro Val Leu Asp Cys Val Arg Asp Gln Ala Leu Asn
385 390 395 400
Lys Leu Gln Gln Ile Phe Asn Ala Ser Tyr Asn Gln Thr Tyr Glu Lys
405 410 415
Tyr Gly Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe
420 425 430
Trp Gln Gly Ile Lys Gln Lys Ser Leu Leu Glu Leu Glu Arg Leu Ala
435 440 445
Asn Ser Ser Gly Val Asn Ala Thr Arg Arg Ser Lys Arg Ser Thr Asn
450 455 460
Asn Thr Thr Thr Leu Ser Leu Glu Asn Asp Ser Val Arg Ser Val Leu
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Asn Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Thr Ile Lys Asp Ser Thr Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Thr Phe Ala Asn Ser Ser His Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Gln Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asn Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 141
<211> 2437
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 141
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggcc aggcctcccc tcctacctca 120
tcatcctcgc cgtctgtctc ttcagccacc tactttcgtc acgatatggc gcagaagccg 180
tatccgaacc gctggacaaa gcgtttcacc tactgctcaa cacctacggg agacccatcc 240
gcttcctgcg tgaaaatacc acccagtgta cctacaacag cagcctccgt aacagcacgg 300
tcgtcaggga aaacgccatc agtttcaact tcttccaaag ctataatcaa tactatgtat 360
tccatatgcc tcgatgtctc tttgcgggtc ctctggcgga gcagtttctg aaccaggtag 420
atctgaccga aaccctggaa agataccaac agagacttaa cacttacgcg ctggtatcca 480
aagacctggc cagctaccga tctttctcgc agcagctaaa ggcacaagac agcctaggtg 540
aacagcccac cactgtgcca ccgcccattg acctgtcaat acctcacgtt tggatgccac 600
cgcaaaccac tccacacggc tggacagaat cacataccac ctcaggacta caccgaccac 660
actttaacca gacctgtatc ctctttgatg gacacgatct actattcagc accgtcacac 720
cttgtttgca ccaaggcttt tacctcatcg acgaactacg ttacgttaaa ataacactga 780
ccgaggactt cttcgtagtt acggtgtcca tagacgacga cacacccatg ctgcttatct 840
tcggccatct tccacgcgta cttttcaaag cgccctatca acgcgacaac tttatactac 900
gacaaactga gaaacacgag ctcctggtgc tagttaagaa agatcaactg aaccgtcact 960
cttatctcaa agacccggac tttcttgacg ccgcacttga cttcaactac ctagacctca 1020
gcgcactact acgtaacagc tttcaccgtt acgccgtgga tgtactcaag agcggtcgat 1080
gtcagatgct ggaccgccgc acggtagaaa tggccttcgc ctacgcatta gcactgttcg 1140
cagcagcccg acaagaagag gccggcgccc aagtctccgt cccacgggcc ctagaccgcc 1200
aggccgcact cttacaaata caagaattta tgatcacctg cctctcacaa acaccaccac 1260
gcaccacgtt gctgctgtat cccacggccg tggacctggc caaacgagcc ctttggacac 1320
cgaatcagat caccgacatc accagcctcg tacgcctggt ctacatactc tctaaacaga 1380
atcagcaaca tctcatcccc caatgggcac tacgacagat cgccgacttt gccctaaaac 1440
tacacaaaac gcacctggcc tcttttcttt cagccttcgc acgccaagaa ctctacctca 1500
tgggcagcct cgtccactcc atgctggtac atacgacgga gagacgcgaa atcttcatcg 1560
tagaaacggg cctctgttca ttggccgagc tatcacactt tacgcagttg ttagctcatc 1620
cacaccacga atacctcagc gacctgtaca caccctgttc cagtagcggg cgacgcgatc 1680
actcgctcga acgcctcacg cgtctcttcc ccgatgccac cgtccccgct accgttcccg 1740
ccgccctctc catcctatct accatgcaac caagcacgct ggaaaccttc cccgacctgt 1800
tttgcttgcc gctcggcgaa tccttctccg cgctgaccgt ctccgaacac gtcagttata 1860
tcgtaacaaa ccagtacctg atcaaaggta tctcctaccc tgtctccacc accgtcgtag 1920
gccagagcct catcatcacc cagacggaca gtcaaactaa atgcgaactg acgcgcaaca 1980
tgcataccac acacagcatc acagtggcgc tcaacatttc gctagaaaac tgcgcctttt 2040
gccaaagcgc cctgctagaa tacgacgaca cgcaaggcgt catcaacatc atgtacatgc 2100
acgactcgga cgacgtcctt ttcgccctgg atccctacaa cgaagtggtg gtctcatctc 2160
cgcgaactca ctacctcatg cttttgaaga acggtacggt actagaagta actgacgtcg 2220
tcgtggacgc caccgacagt cgtctcctca tgatgtccgt ctacgcgcta tcggccatca 2280
tcggcatcta tctgctctac cgcatgctca agacatgctg ataataggct ggagcctcgg 2340
tggccatgct tcttgcccct tgggcctccc cccagcccct cctccccttc ctgcacccgt 2400
acccccgtgg tctttgaata aagtctgagt gggcggc 2437
<210> 142
<211> 1045
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 142
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgtgccg ccgcccggat tgcggcttct 120
ctttctcacc tggaccggtg atactgctgt ggtgttgcct tctgctgccc attgtttcct 180
cagccgccgt cagcgtcgct cctaccgccg ccgagaaagt ccccgcggag tgccccgaac 240
taacgcgccg atgcttgttg ggtgaggtgt ttgagggtga caagtatgaa agttggctgc 300
gcccgttggt gaatgttacc gggcgcgatg gcccgctatc gcaacttatc cgttaccgtc 360
ccgttacgcc ggaggccgcc aactccgtgc tgttggacga ggctttcctg gacactctgg 420
ccctgctgta caacaatccg gatcaattgc gggccctgct gacgctgttg agctcggaca 480
cagcgccgcg ctggatgacg gtgatgcgcg gctacagcga gtgcggcgat ggctcgccgg 540
ccgtgtacac gtgcgtggac gacctgtgcc gcggctacga cctcacgcga ctgtcatacg 600
ggcgcagcat cttcacggaa cacgtgttag gcttcgagct ggtgccaccg tctctcttta 660
acgtggtggt ggccatacgc aacgaagcca cgcgtaccaa ccgcgccgtg cgtctgcccg 720
tgagcaccgc tgccgcgccc gagggcatca cgctctttta cggcctgtac aacgcagtga 780
aggaattctg cctgcgtcac cagctggacc cgccgctgct acgccaccta gataaatact 840
acgccggact gccgcccgag ctgaagcaga cgcgcgtcaa cctgccggct cactcgcgct 900
atggccctca agcagtggat gctcgctgat aataggctgg agcctcggtg gccatgcttc 960
ttgccccttg ggcctccccc cagcccctcc tccccttcct gcacccgtac ccccgtggtc 1020
tttgaataaa gtctgagtgg gcggc 1045
<210> 143
<211> 724
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 143
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgagtcc caaagatctg acgccgttct 120
tgacggcgtt gtggctgcta ttgggtcaca gccgcgtgcc gcgggtgcgc gcagaagaat 180
gttgcgaatt cataaacgtc aaccacccgc cggaacgctg ttacgatttc aaaatgtgca 240
atcgcttcac cgtcgcgctg cggtgtccgg acggcgaagt ctgctacagt cccgagaaaa 300
cggctgagat tcgcgggatc gtcaccacca tgacccattc attgacacgc caggtcgtac 360
acaacaaact gacgagctgc aactacaatc cgttatacct cgaagctgac gggcgaatac 420
gctgcggcaa agtaaacgac aaggcgcagt acctgctggg cgccgctggc agcgttccct 480
atcgatggat caatctggaa tacgacaaga taacccggat cgtgggcctg gatcagtacc 540
tggagagcgt taagaaacac aaacggctgg atgtgtgccg cgctaaaatg ggctatatgc 600
tgcagtgata ataggctgga gcctcggtgg ccatgcttct tgccccttgg gcctcccccc 660
agcccctcct ccccttcctg cacccgtacc cccgtggtct ttgaataaag tctgagtggg 720
cggc 724
<210> 144
<211> 846
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 144
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgctgcg gcttctgctt cgtcaccact 120
ttcactgcct gcttctgtgc gcggtttggg caacgccctg tctggcgtct ccgtggtcga 180
cgctaacagc aaaccagaat ccgtccccgc catggtctaa actgacgtat tccaaaccgc 240
atgacgcggc gacgttttac tgtccttttc tctatccctc gcccccacga tcccccttgc 300
aattctcggg gttccagcgg gtatcaacgg gtcccgagtg tcgcaacgag accctgtatc 360
tgctgtacaa ccgggaaggc cagaccttgg tggagagaag ctccacctgg gtgaaaaagg 420
tgatctggta cctgagcggt cggaaccaaa ccatcctcca acggatgccc cgaacggctt 480
cgaaaccgag cgacggaaac gtgcagatca gcgtggaaga cgccaagatt tttggagcgc 540
acatggtgcc caagcgctgc tacgcttcgt cgtcaacgat ggcacacgtt atcagatgtg 600
tgtgatgaag ctggagagct gggctcacgt cttccgggac tacagcgtgt cttttcaggt 660
gcgattgacg ttcaccgagg ccaataacca gacttacacc ttctgcaccc atcccaatct 720
catcgtttga taataggctg gagcctcggt ggccatgctt cttgcccctt gggcctcccc 780
ccagcccctc ctccccttcc tgcacccgta cccccgtggt ctttgaataa agtctgagtg 840
ggcggc 846
<210> 145
<211> 598
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 145
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggct gtgtcgggtg tggctgtctg 120
tttgtctgtg cgccgtggtg ctgggtcagt gccagcggga aaccgcggaa aagaacgatt 180
attaccgagt accgcattac tgggacgcgt gctctcgcgc gctgcccgac caaacccgtt 240
acaagtatgt ggaacagctc gtggacctca cgttgaacta ccactacgat gcgagccacg 300
gcttggacaa ctttgacgtg ctcaagagaa tcaacgtgac cgaggtgtcg ttgctcatca 360
gcgactttag acgtcagaac cgtcgcggcg gcaccaacaa aaggaccacg ttcaacgccg 420
ccggttcgct ggcgccacac gcccggagcc tcgagttcag cgtgcggctc tttgccaact 480
gataataggc tggagcctcg gtggccatgc ttcttgcccc ttgggcctcc ccccagcccc 540
tcctcccctt cctgcacccg tacccccgtg gtctttgaat aaagtctgag tgggcggc 598
<210> 146
<211> 2933
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 146
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggaatc caggatctgg tgcctggtag 120
tctgcgttaa cttgtgtatc gtctgtctgg gtgctgcggt ttcctcatct tctactcgtg 180
gaacttctgc tactcacagt caccattcct ctcatacgac gtctgctgct cactctcgat 240
ccggttcagt ctctcaacgc gtaacttctt cccaaacggt cagccatggt gttaacgaga 300
ccatctacaa cactaccctc aagtacggag atgtggtggg ggtcaatacc accaagtacc 360
cctatcgcgt gtgttctatg gcccagggta cggatcttat tcgctttgaa cgtaatatcg 420
tctgcacctc gatgaagccc atcaatgaag acctggacga gggcatcatg gtggtctaca 480
aacgcaacat cgtcgcgcac acctttaagg tacgagtcta ccagaaggtt ttgacgtttc 540
gtcgtagcta cgcttacatc cacaccactt atctgctggg cagcaacacg gaatacgtgg 600
cgcctcctat gtgggagatt catcatatca acagccacag tcagtgctac agttcctaca 660
gccgcgttat agcaggcacg gttttcgtgg cttatcatag ggacagctat gaaaacaaaa 720
ccatgcaatt aatgcccgac gattattcca acacccacag tacccgttac gtgacggtca 780
aggatcaatg gcacagccgc ggcagcacct ggctctatcg tgagacctgt aatctgaatt 840
gtatggtgac catcactact gcgcgctcca aatatcctta tcattttttc gccacttcca 900
cgggtgacgt ggttgacatt tctcctttct acaacggaac caatcgcaat gccagctact 960
ttggagaaaa cgccgacaag tttttcattt ttccgaacta cactatcgtc tccgactttg 1020
gaagaccgaa ttctgcgtta gagacccaca ggttggtggc ttttcttgaa cgtgcggact 1080
cggtgatctc ctgggatata caggacgaaa agaatgtcac ttgtcaactc actttctggg 1140
aagcctcgga acgcaccatt cgttccgaag ccgaggactc gtatcacttt tcttctgcca 1200
aaatgaccgc cactttctta tctaagaagc aagaggtgaa catgtccgac tctgcgctgg 1260
actgcgtacg tgatgaggct ataaataagt tacagcagat tttcaatact tcatacaatc 1320
aaacatatga aaaatatgga aacgtgtccg tctttgaaac cactggtggt ttggtagtgt 1380
tctggcaagg tatcaagcaa aaatctctgg tggaactcga acgtttggcc aaccgctcca 1440
gtctgaatct tactcataat agaaccaaaa gaagtacaga tggcaacaat gcaactcatt 1500
tatccaacat ggaatcggtg cacaatctgg tctacgccca gctgcagttc acctatgaca 1560
cgttgcgcgg ttacatcaac cgggcgctgg cgcaaatcgc agaagcctgg tgtgtggatc 1620
aacggcgcac cctagaggtc ttcaaggaac tcagcaagat caacccgtca gccattctct 1680
cggccattta caacaaaccg attgccgcgc gtttcatggg tgatgtcttg ggcctggcca 1740
gctgcgtgac catcaaccaa accagcgtca aggtgctgcg tgatatgaac gtgaaggagt 1800
cgccaggacg ctgctactca cgacccgtgg tcatctttaa tttcgccaac agctcgtacg 1860
tgcagtacgg tcaactgggc gaggacaacg aaatcctgtt gggcaaccac cgcactgagg 1920
aatgtcagct tcccagcctc aagatcttca tcgccgggaa ctcggcctac gagtacgtgg 1980
actacctctt caaacgcatg attgacctca gcagtatctc caccgtcgac agcatgatcg 2040
ccctggatat cgacccgctg gaaaataccg acttcagggt actggaactt tactcgcaga 2100
aagagctgcg ttccagcaac gtttttgacc tcgaagagat catgcgcgaa ttcaactcgt 2160
acaagcagcg ggtaaagtac gtggaggaca aggtagtcga cccgctaccg ccctacctca 2220
agggtctgga cgacctcatg agcggcctgg gcgccgcggg aaaggccgtt ggcgtagcca 2280
ttggggccgt gggtggcgcg gtggcctccg tggtcgaagg cgttgccacc ttcctcaaaa 2340
accccttcgg agcgttcacc atcatcctcg tggccatagc tgtagtcatt atcacttatt 2400
tgatctatac tcgacagcgg cgtttgtgca cgcagccgct gcagaacctc tttccctatc 2460
tggtgtccgc cgacgggacc accgtgacgt cgggcagcac caaagacacg tcgttacagg 2520
ctccgccttc ctacgaggaa agtgtttata attctggtcg caaaggaccg ggaccaccgt 2580
cgtctgatgc atccacggcg gctccgcctt acaccaacga gcaggcttac cagatgcttc 2640
tggccctggc ccgtctggac gcagagcagc gagcgcagca gaacggtaca gattctttgg 2700
acggacggac tggcacgcag gacaagggac agaagcccaa cctactagac cgactgcgac 2760
atcgcaaaaa cggctaccga cacttgaaag actctgacga agaagagaac gtcttgataa 2820
taggctggag cctcggtggc catgcttctt gccccttggg cctcccccca gcccctcctc 2880
cccttcctgc acccgtaccc ccgtggtctt tgaataaagt ctgagtgggc ggc 2933
<210> 147
<211> 1882
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 147
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggagtc gcgcggtcgc cgttgtcccg 120
aaatgatatc cgtactgggt cccatttcgg ggcacgtgct gaaagccgtg tttagtcgcg 180
gcgatacgcc ggtgctgccg cacgagacga gactcctgca gacgggtatc cacgtacgcg 240
tgagccagcc ctcgctgatc ctggtgtcgc agtacacgcc cgactcgacg ccatgccacc 300
gcggcgacaa tcagctgcag gtgcagcaca cgtactttac gggcagcgag gtggagaacg 360
tgtcggtcaa cgtgcacaac cccacgggcc gaagcatctg ccccagccaa gagcccatgt 420
cgatctatgt gtacgcgctg ccgctcaaga tgctgaacat ccccagcatc aacgtgcacc 480
actacccgtc ggcggccgag cgcaaacacc gacacctgcc cgtagccgac gctgttattc 540
acgcgtcggg caagcagatg tggcaggcgc gtctcacggt ctcgggactg gcctggacgc 600
gtcagcagaa ccagtggaaa gagcccgacg tctactacac gtcagcgttc gtgtttccca 660
ccaaggacgt ggcactgcgg cacgtggtgt gcgcgcacga gctggtttgc tccatggaga 720
acacgcgcgc aaccaagatg caggtgatag gtgaccagta cgtcaaggtg tacctggagt 780
ccttctgcga ggacgtgccc tccggcaagc tctttatgca cgtcacgctg ggctctgacg 840
tggaagagga cctaacgatg acccgcaacc cgcaaccctt catgcgcccc cacgagcgca 900
acggctttac ggtgttgtgt cccaaaaata tgataatcaa accgggcaag atctcgcaca 960
tcatgctgga tgtggctttt acctcacacg agcattttgg gctgctgtgt cccaagagca 1020
tcccgggcct gagcatctca ggtaacctgt tgatgaacgg gcagcaaatc ttcctggagg 1080
tacaagcgat acgcgagacc gtggaactgc gtcagtacga tcccgtggct gcgctcttct 1140
ttttcgatat cgacttgttg ctgcagcgcg ggcctcagta cagcgagcac cccaccttca 1200
ccagccagta tcgcatccag ggcaagcttg agtaccgaca cacctgggac cggcacgacg 1260
agggtgccgc ccagggcgac gacgacgtct ggaccagcgg atcggactcc gacgaagaac 1320
tcgtaaccac cgagcgtaag acgccccgcg tcaccggcgg cggagccatg gcgagcgcct 1380
ccacttccgc gggctcagca tcctcggcga cggcgtgcac ggcgggcgtt atgacacgcg 1440
gccgccttaa ggccgagtcc accgtcgcgc ccgaagagga caccgacgag gattccgaca 1500
acgaaatcca caatccggcc gtgttcacct ggccgccctg gcaggccggc atcctggccc 1560
gcaacctggt gcccatggtg gctacggttc agggtcagaa tctgaagtac caggagttct 1620
tctgggacgc caacgacatc taccgcatct tcgccgaatt ggaaggcgta tggcagcccg 1680
ctgcgcaacc caaacgtcgc cgccaccggc aagacgcctt gcccgggcca tgcatcgcct 1740
cgacgcccaa aaagcaccga ggttgataat aggctggagc ctcggtggcc atgcttcttg 1800
ccccttgggc ctccccccag cccctcctcc ccttcctgca cccgtacccc cgtggtcttt 1860
gaataaagtc tgagtgggcg gc 1882
<210> 148
<211> 3364
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 148
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggagtc gcgcggtcgc cgttgtcccg 120
aaatgatatc cgtactgggt cccatttcgg ggcacgtgct gaaagccgtg tttagtcgcg 180
gcgatacgcc ggtgctgccg cacgagacgc gactcctgca gacgggtatc cacgtacgcg 240
tgagccagcc ctcgctgatc ctggtgtcgc agtacacgcc cgactcgacg ccatgccacc 300
gcggcgacaa tcagctgcag gtgcagcaca cgtactttac gggcagcgag gtggagaacg 360
tgtcggtcaa cgtgcacaac cccacgggcc gaagcatctg ccccagccaa gagcccatgt 420
cgatctatgt gtacgcgctg ccgctcaaga tgctgaacat ccccagcatc aacgtgcacc 480
actacccgtc ggcggccgag cgcaaacacc gacacctgcc cgtagccgac gctgttattc 540
acgcgtcggg caagcagatg tggcaggcgc gtctcacggt ctcgggactg gcctggacgc 600
gtcagcagaa ccagtggaaa gagcccgacg tctactacac gtcagcgttc gtgtttccca 660
ccaaggacgt ggcactgcgg cacgtggtgt gcgcgcacga gctggtttgc tccatggaga 720
acacgcgcgc aaccaagatg caggtgatag gtgaccagta cgtcaaggtg tacctggagt 780
ccttctgcga ggacgtgccc tccggcaagc tctttatgca cgtcacgctg ggctctgacg 840
tggaagagga cctaacgatg acccgcaacc cgcaaccctt catgcgcccc cacgagcgca 900
acggctttac ggtgttgtgt cccaaaaata tgataatcaa accgggcaag atctcgcaca 960
tcatgctgga tgtggctttt acctcacacg agcattttgg gctgctgtgt cccaagagca 1020
tcccgggcct gagcatctca ggtaacctgt tgatgaacgg gcagcaaatc ttcctggagg 1080
tacaagcgat acgcgagacc gtggaactgc gtcagtacga tcccgtggct gcgctcttct 1140
ttttcgatat cgacttgttg ctgcagcgcg ggcctcagta cagcgagcac cccaccttca 1200
ccagccagta tcgcatccag ggcaagcttg agtaccgaca cacctgggac cggcacgacg 1260
agggtgccgc ccagggcgac gacgacgtct ggaccagcgg atcggactcc gacgaagaac 1320
tcgtaaccac cgagcgtaag acgccccgcg tcaccggcgg cggcgccatg gcgagcgcct 1380
ccacttccgc gggccgcaaa cgcaaatcag catcctcggc gacggcgtgc acggcgggcg 1440
ttatgacacg cggccgcctt aaggccgagt ccaccgtcgc gcccgaagag gacaccgacg 1500
aggattccga caacgaaatc cacaatccgg ccgtgttcac ctggccgccc tggcaggccg 1560
gcatcctggc ccgcaacctg gtgcccatgg tggctacggt tcagggtcag aatctgaagt 1620
accaggagtt cttctgggac gccaacgaca tctaccgcat cttcgccgaa ttggaaggcg 1680
tatggcagcc cgctgcgcaa cccaaacgtc gccgccaccg gcaagacgcc ttgcccgggc 1740
catgcatcgc ctcgacgccc aaaaagcacc gaggtgagtc ctctgccaag agaaagatgg 1800
accctgataa tcctgacgag ggcccttcct ccaaggtgcc acggcccgag acacccgtga 1860
ccaaggccac gacgttcctg cagactatgt taaggaagga ggttaacagt cagctgagcc 1920
tgggagaccc gctgttccca gaattggccg aagaatccct caaaaccttt gaacaagtga 1980
ccgaggattg caacgagaac cccgaaaaag atgtcctgac agaactcgtc aaacagatta 2040
aggttcgagt ggacatggtg cggcatagaa tcaaggagca catgctgaaa aaatataccc 2100
agacggaaga aaaattcact ggcgccttta atatgatggg aggatgtttg cagaatgcct 2160
tagatatctt agataaggtt catgagcctt tcgaggacat gaagtgtatt gggctaacta 2220
tgcagagcat gtatgagaac tacattgtac ctgaggataa gcgggagatg tggatggctt 2280
gtattaagga gctgcatgat gtgagcaagg gcgccgctaa caagttgggg ggtgcactgc 2340
aggctaaggc ccgtgctaaa aaggatgaac ttaggagaaa gatgatgtat atgtgctaca 2400
ggaatataga gttctttacc aagaactcag ccttccctaa gaccaccaat ggctgcagtc 2460
aggccatggc ggcattgcag aacttgcctc agtgctctcc tgatgagatt atgtcttatg 2520
cccagaaaat ctttaagatt ttggatgagg agagagacaa ggtgctcacg cacattgatc 2580
acatatttat ggatatcctc actacatgtg tggaaacaat gtgtaatgag tacaaggtca 2640
ctagtgacgc ttgtatgatg accatgtacg ggggcatctc tctcttaagt gagttctgtc 2700
gggtgctgtg ctgctatgtc ttagaggaga ctagtgtgat gctggccaag cggcctctga 2760
taaccaagcc tgaggttatc agtgtaatga agcgccgcat tgaggagatc tgcatgaagg 2820
tctttgccca gtacattctg ggggccgatc ctttgagagt ctgctctcct agtgtggatg 2880
acctacgggc catcgccgag gagtcagatg aggaagaggc tattgtagcc tacactttgg 2940
ccaccgctgg tgccagctcc tctgattctc tggtgtcacc tccagagtcc cctgtacccg 3000
cgactatccc tctgtcctca gtaattgtgg ctgagaacag tgatcaggaa gaaagtgaac 3060
agagtgatga ggaacaggag gagggtgctc aggaggagcg ggaggacact gtgtctgtca 3120
agtctgagcc agtgtctgag atagaggaag ttgcctcaga ggaagaggag gatggtgctg 3180
aggaacccac cgcctctgga ggcaagagca cccaccctat ggtgactaga agcaaggctg 3240
accagtgata ataggctgga gcctcggtgg ccatgcttct tgccccttgg gcctcccccc 3300
agcccctcct ccccttcctg cacccgtacc cccgtggtct ttgaataaag tctgagtggg 3360
cggc 3364
<210> 149
<211> 3352
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 149
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggagtc gcgcggtcgc cgttgtcccg 120
aaatgatatc cgtactgggt cccatttcgg gtcatgtgct gaaagcggtg tttagtcgcg 180
gcgatacgcc agtactgccg cacgagacgc gactcctgca gacaggtatc cacgtacgcg 240
tgagccagcc ctcgctcatc ctggtgtcgc agtacacgcc cgactcgacg ccatgccacc 300
gcggcgacaa tcagctgcag gtgcagcaca cgtactttac gggcagcgag gtggagaacg 360
tgtcggtcaa cgtccacaac cccacgggtc gaagcatctg cccctctcaa gagcccatgt 420
cgatctatgt gtacgcgctg ccgctcaaga tgctgaacat cccgagcatc aacgtgcacc 480
actacccgag cgcggccgag cgcaaacacc gacacctgcc cgtagccgac gctgttattc 540
acgcgtcggg caagcagatg tggcaagcgc gcctcacggt ctcgggacta gcctggacgc 600
gtcagcagaa ccagtggaaa gagcccgacg tctactacac gtcagcgttc gtgtttccca 660
ccaaggacgt ggcactgcgc cacgtggtgt gtgcgcacga gctggtttgc tccatggaga 720
atacgcgcgc aaccaagatg caggtgatag gtgatcaata cgtcaaggtg tacctggagt 780
ccttctgcga ggatgtgccc tccggtaagc tctttatgca cgtcacgctg ggctctgacg 840
tggaagagga cctaacgatg acccgcaatc cgcaaccctt catgcgcccc cacgagcgca 900
acggctttac ggtgttgtgt cctaaaaata tgataatcaa accaggcaag atctcgcaca 960
tcatgctgga tgtggctttt acctcacacg agcattttgg gctgctgtgt cccaagagca 1020
tcccgggcct gagcatctca ggtaacctgt tgatgaacgg gcagcaaatc tttctcgagg 1080
tgcaagctat acgcgagacc gtcgaactgc gtcagtacga tcccgtggct gcgctgttct 1140
ttttcgatat cgacttgttg ctgcagcgcg ggcctcagta cagcgagcac cccaccttca 1200
ccagccagta tcgcatccag ggcaagcttg agtaccgaca cacctgggac cggcacgacg 1260
agggagccgc ccagggcgac gacgacgtct ggacctctgg atcggactcc gacgaagaac 1320
tcgtaacgac cgagcgtaag accccccgcg tcaccggcgg cggcgccatg gcgtccgcct 1380
caacttccgc gggctcagca tcctcggcta cggcgtgcac ggcgggcgtt atgacacgtg 1440
gcagacttaa ggccgagtcc accgtcgcgc ccgaagagga caccgacgag gattccgaca 1500
acgaaatcca caatccggcc gtgttcacct ggccgccctg gcaggccggc atcctggccc 1560
gcaacctggt gcccatggtg gctacggttc agggtcagaa tctgaagtac caggagttct 1620
tctgggacgc caacgacatc taccgcatct tcgccgaatt ggaaggcgta tggcagcccg 1680
ctgcgcaacc caaacgtcgc cgccaccggc aagacgcctt gcccgggcca tgcatcgcct 1740
cgacgcccaa aaagcaccga ggtgagtcct ctgccaagag aaagatggac cctgataatc 1800
ctgacgaggg cccttcctcc aaggtgccac ggcccgagac acccgtgacc aaggccacga 1860
cgttcctgca gactatgtta aggaaggagg ttaacagtca gctgagcctg ggagacccgc 1920
tgttcccaga attggccgaa gaatccctca aaacctttga acaagtgacc gaggattgca 1980
acgagaaccc cgaaaaagat gtcctgacag aactcgtcaa acagattaag gttcgagtgg 2040
acatggtgcg gcatagaatc aaggagcaca tgctgaaaaa atatacccag acggaagaaa 2100
aattcactgg cgcctttaat atgatgggag gatgtttgca gaatgcctta gatatcttag 2160
ataaggttca tgagcctttc gaggacatga agtgtattgg gctaactatg cagagcatgt 2220
atgagaacta cattgtacct gaggataagc gggagatgtg gatggcttgt attaaggagc 2280
tgcatgatgt gagcaagggc gccgctaaca agttgggggg tgcactgcag gctaaggccc 2340
gtgctaaaaa ggatgaactt aggagaaaga tgatgtatat gtgctacagg aatatagagt 2400
tctttaccaa gaactcagcc ttccctaaga ccaccaatgg ctgctcgcag gccatggcgg 2460
cattgcagaa cttgcctcag tgctctcctg atgagattat gtcttatgcc cagaaaatct 2520
ttaagatttt ggatgaggag cgagacaagg tgcttacgca cattgatcac atatttatgg 2580
atatcctcac tacatgtgtt gaaacgatgt gcaatgagta caaggtcact agtgacgctt 2640
gtatgatgac catgtacggg ggcatatctc tcttaagtga attctgtcgg gtgctgtgct 2700
gctacgtctt agaggagact agtgtgatgc tggccaagcg gcctctgata accaagcctg 2760
aggtcatcag tgtaatgaag cgccgcattg aggagatctg catgaaggtc tttgcccagt 2820
acattctggg ggccgatcct ttgagagtct gctctccaag tgtggatgac ctacgggcca 2880
tcgccgagga gtcagacgag gaagaggcta ttgtagccta cactttggcc accgctggtg 2940
ccagctcctc tgactctctg gtgtcacctc cagaatcccc tgtgcccgcg acaatccctc 3000
tgtcctcagt aattgtggct gagaacagtg atcaggaaga aagtgaacag agtgatgagg 3060
aacaggagga gggtgctcag gaggagcggg aggatactgt gtctgtcaag tctgagccag 3120
tgtctgaaat tgaggaagtt gcctcagagg aagaggagga tggtgctgag gaacccaccg 3180
cctctggagg caagtccacc caccctatgg taactagatc aaaggctgac cagtgataat 3240
aggctggagc ctcggtggcc atgcttcttg ccccttgggc ctccccccag cccctcctcc 3300
ccttcctgca cccgtacccc cgtggtcttt gaataaagtc tgagtgggcg gc 3352
<210> 150
<211> 1473
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 150
atggagtcct ctgccaagag aaagatggac cctgataatc ctgacgaggg cccttcctcc 60
aaggtgccac ggcccgagac acccgtgacc aaggccacga cgttcctgca gactatgtta 120
aggaaggagg ttaacagtca gctgagcctg ggagacccgc tgttcccaga attggccgaa 180
gaatccctca agacctttga acaagtgacc gaggattgca acgagaaccc cgagaaagat 240
gtcctgacag aactcgtcaa acagattaag gttcgagtgg acatggtgcg gcatagaatc 300
aaggagcaca tgctgaagaa atatacccag acggaagaga aattcactgg cgcctttaat 360
atgatgggag gatgtttgca gaatgcctta gatatcttag ataaggttca tgagcctttc 420
gaggacatga agtgtattgg gctaactatg cagagcatgt atgagaacta cattgtacct 480
gaggataagc gggagatgtg gatggcttgt attaaggagc tgcatgatgt gagcaagggc 540
gccgctaaca agttgggcgg tgcactgcag gctaaggccc gtgctaagaa ggatgaactt 600
aggagaaaga tgatgtatat gtgctacagg aatatagagt tctttaccaa gaactcagcc 660
ttccctaaga ccaccaatgg ctgcagtcag gccatggcgg cattgcagaa cttgcctcag 720
tgctctcctg atgagattat gtcttatgcc cagaagatct ttaagatttt ggatgaggag 780
agagacaagg tgctcacgca cattgatcac atatttatgg atatcctcac tacatgtgtg 840
gaaacaatgt gtaatgagta caaggtcact agtgacgctt gtatgatgac catgtacggc 900
ggcatctctc tcttaagtga gttctgtcgg gtgctgtgct gctatgtctt agaggagact 960
agtgtgatgc tggccaagcg gcctctgata accaagcctg aggttatcag tgtaatgaag 1020
cgccgcattg aggagatctg catgaaggtc tttgcccagt acattctggg agccgatcct 1080
ttgagagtct gctctcctag tgtggatgac ctacgggcca tcgccgagga gtcagatgag 1140
gaagaggcta ttgtagccta cactttggcc accgctggtg ccagctcctc tgattctctg 1200
gtgtcacctc cagagtcccc tgtacccgcg actatccctc tgtcctcagt aattgtggct 1260
gagaacagtg atcaggaaga aagtgaacag agtgatgagg aacaggagga gggtgctcag 1320
gaggagcggg aggacactgt gtctgtcaag tctgagccag tgtctgagat agaggaagtt 1380
gcctcagagg aagaggagga tggtgctgag gaacccaccg cctctggagg caagagcacc 1440
caccctatgg tgactagaag caaggctgac cag 1473
<210> 151
<211> 1740
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 151
atggagtcct ctgccaagag aaagatggac cctgataatc ctgacgaggg cccttcctcc 60
aaggtgccac ggcccgagac acccgtgacc aaggccacga cgttcctgca gactatgtta 120
aggaaggagg ttaacagtca gctgagcctg ggagacccgc tgttcccaga attggccgaa 180
gaatccctca agacctttga acaagtgacc gaggattgca acgagaaccc cgagaaagat 240
gtcctgacag aactcggtga catcctcgcc caggctgtca atcatgccgg tatcgattcc 300
agtagcaccg gccccacgct gacaacccac tcttgcagcg ttagcagcgc ccctcttaac 360
aagccgacgc ccaccagcgt cgcggttact aacactcctc tccccggggc atccgctact 420
cccgagctca gcccgcgtaa gaaaccgcgc aagaccacgc gtcctttcaa ggtgattatt 480
aaaccgcccg tgcctcccgc gcctatcatg ctgcccctca tcaaacagga agacatcaag 540
cccgagcccg actttaccat ccagtaccgc aacaagatta tcgataccgc cggctgtatc 600
gtgatctctg atagcgagga agaacagggt gaagaagtcg agacccgcgg tgctaccgcg 660
tcttcccctt ccaccggcag cggcacgccg cgagtgacct ctcccacgca cccgctctcc 720
cagatgaacc accctcctct tcccgatcct ttgggccggc ccgatgaaga tagttcctct 780
tcgtcttcct cctcctgcag ttcggcttcg gacagcgaga gtgagtccga ggagatgaaa 840
tgcagcagtg gcggaggagc atccgtgacc tcgagccacc atgggcgcgg cggttttggt 900
ggcgcggcct cctcctctct gctgagctgc ggacatcaga gcagcggcgg ggcgagcacc 960
ggacctcgca agaagaagag caaacgcatc tccgagttgg acaacgagaa ggtgcgcaat 1020
atcatgaaag ataagaacac gcccttctgc acacccaacg tgcagactcg gcggggtcgc 1080
gtcaagattg acgaggtgag ccgcatgttc cgtcacacca atcgttctct tgagtacaag 1140
aatctgccat tcatgatccc tagtatgcac caagtgttag aagaggccat caaagtttgc 1200
aagaccatgc aggtgaacaa caagggcatt cagatcatct acacccgcaa tcatgaagtg 1260
aagaatgagg tggatcaggt acggtgtcgc ctgggtagca tgtgcaacct ggccctctcc 1320
actcccttcc tcatggagca cactatgcct gtgacacacc ctcctgatgt ggcgcagcgc 1380
acggccgatg cttgtaacga cggtgtcaag gccgtgtgga acctcaaaga actgcacacc 1440
caccaattgt gcccgcgctc ttctgattac cgcaacatga ttatccacgc tgccacgccc 1500
gtggacctgt tgggcgctct caacctgtgc ctgcccctga tgcagaagtt tcccaaacag 1560
gtcatggtgc gcatcttctc caccaaccag ggtgggttca tgctgcctat ctacgagacg 1620
gccgcgaagg cctacgccgt ggggcagttt gagaagccca ccgagacccc tcccgaagac 1680
ctggacaccc tgagcctggc catcgaggca gccatccagg acctgaggaa caaatctcag 1740
<210> 152
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 152
atggaatcca ggatctggtg cctggtagtc tgcgttaact tgtgtatcgt ctgtctgggt 60
gctgcggttt cctcatcttc tactcgtgga acttctgcta ctcacagtca ccattcctct 120
catacgacgt ctgctgctca ctctcgatcc ggttcagtct ctcaacgcgt aacttcttcc 180
caaacggtca gccatggtgt taacgagacc atctacaaca ctaccctcaa gtacggagat 240
gtggtggggg tcaataccac caagtacccc tatcgcgtgt gttctatggc ccagggtacg 300
gatcttattc gctttgaacg taatatcgtc tgcacctcga tgaagcccat caatgaagac 360
ctggacgagg gcatcatggt ggtctacaaa cgcaacatcg tcgcgcacac ctttaaggta 420
cgagtctacc agaaggtttt gacgtttcgt cgtagctacg cttacatcca caccacttat 480
ctgctgggca gcaacacgga atacgtggcg cctcctatgt gggagattca tcatatcaac 540
agccacagtc agtgctacag ttcctacagc cgcgttatag caggcacggt tttcgtggct 600
tatcataggg acagctatga aaacaaaacc atgcaattaa tgcccgacga ttattccaac 660
acccacagta cccgttacgt gacggtcaag gatcaatggc acagccgcgg cagcacctgg 720
ctctatcgtg agacctgtaa tctgaattgt atggtgacca tcactactgc gcgctccaaa 780
tatccttatc attttttcgc cacttccacg ggtgacgtgg ttgacatttc tcctttctac 840
aacggaacca atcgcaatgc cagctacttt ggagaaaacg ccgacaagtt tttcattttt 900
ccgaactaca ctatcgtctc cgactttgga agaccgaatt ctgcgttaga gacccacagg 960
ttggtggctt ttcttgaacg tgcggactcg gtgatctcct gggatataca ggacgaaaag 1020
aatgtcactt gtcaactcac tttctgggaa gcctcggaac gcaccattcg ttccgaagcc 1080
gaggactcgt atcacttttc ttctgccaaa atgaccgcca ctttcttatc taagaagcaa 1140
gaggtgaaca tgtccgactc tgcgctggac tgcgtacgtg atgaggctat aaataagtta 1200
cagcagattt tcaatacttc atacaatcaa acatatgaaa aatatggaaa cgtgtccgtc 1260
tttgaaacca ctggtggttt ggtagtgttc tggcaaggta tcaagcaaaa atctctggtg 1320
gaactcgaac gtttggccaa ccgctccagt ctgaatctta ctcataatag aaccaaaaga 1380
agtacagatg gcaacaatgc aactcattta tccaacatgg aatcggtgca caatctggtc 1440
tacgcccagc tgcagttcac ctatgacacg ttgcgcggtt acatcaaccg ggcgctggcg 1500
caaatcgcag aagcctggtg tgtggatcaa cggcgcaccc tagaggtctt caaggaactc 1560
agcaagatca acccgtcagc cattctctcg gccatttaca acaaaccgat tgccgcgcgt 1620
ttcatgggtg atgtcttggg cctggccagc tgcgtgacca tcaaccaaac cagcgtcaag 1680
gtgctgcgtg atatgaacgt gaaggagtcg ccaggacgct gctactcacg acccgtggtc 1740
atctttaatt tcgccaacag ctcgtacgtg cagtacggtc aactgggcga ggacaacgaa 1800
atcctgttgg gcaaccaccg cactgaggaa tgtcagcttc ccagcctcaa gatcttcatc 1860
gccgggaact cggcctacga gtacgtggac tacctcttca aacgcatgat tgacctcagc 1920
agtatctcca ccgtcgacag catgatcgcc ctggatatcg acccgctgga aaataccgac 1980
ttcagggtac tggaacttta ctcgcagaaa gagctgcgtt ccagcaacgt ttttgacctc 2040
gaagagatca tgcgcgaatt caactcgtac aagcagcggg taaagtacgt ggaggacaag 2100
gtagtcgacc cgctaccgcc ctacctcaag ggtctggacg acctcatgag cggcctgggc 2160
gccgcgggaa aggccgttgg cgtagccatt ggggccgtgg gtggcgcggt ggcctccgtg 2220
gtcgaaggcg ttgccacctt cctcaaaaac cccttcggag cgttcaccat catcctcgtg 2280
gccatagctg tagtcattat cacttatttg atctatactc gacagcggcg tttgtgcacg 2340
cagccgctgc agaacctctt tccctatctg gtgtccgccg acgggaccac cgtgacgtcg 2400
ggcagcacca aagacacgtc gttacaggct ccgccttcct acgaggaaag tgtttataat 2460
tctggtcgca aaggaccggg accaccgtcg tctgatgcat ccacggcggc tccgccttac 2520
accaacgagc aggcttacca gatgcttctg gccctggccc gtctggacgc agagcagcga 2580
gcgcagcaga acggtacaga ttctttggac ggacggactg gcacgcagga caagggacag 2640
aagcccaacc tactagaccg actgcgacat cgcaaaaacg gctaccgaca cttgaaagac 2700
tctgacgaag aagagaacgt c 2721
<210> 153
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 153
atgcggccag gcctcccctc ctacctcatc atcctcgccg tctgtctctt cagccaccta 60
ctttcgtcac gatatggcgc agaagccgta tccgaaccgc tggacaaagc gtttcaccta 120
ctgctcaaca cctacgggag acccatccgc ttcctgcgtg aaaataccac ccagtgtacc 180
tacaacagca gcctccgtaa cagcacggtc gtcagggaaa acgccatcag tttcaacttc 240
ttccaaagct ataatcaata ctatgtattc catatgcctc gatgtctctt tgcgggtcct 300
ctggcggagc agtttctgaa ccaggtagat ctgaccgaaa ccctggaaag ataccaacag 360
agacttaaca cttacgcgct ggtatccaaa gacctggcca gctaccgatc tttctcgcag 420
cagctaaagg cacaagacag cctaggtgaa cagcccacca ctgtgccacc gcccattgac 480
ctgtcaatac ctcacgtttg gatgccaccg caaaccactc cacacggctg gacagaatca 540
cataccacct caggactaca ccgaccacac tttaaccaga cctgtatcct ctttgatgga 600
cacgatctac tattcagcac cgtcacacct tgtttgcacc aaggctttta cctcatcgac 660
gaactacgtt acgttaaaat aacactgacc gaggacttct tcgtagttac ggtgtccata 720
gacgacgaca cacccatgct gcttatcttc ggccatcttc cacgcgtact tttcaaagcg 780
ccctatcaac gcgacaactt tatactacga caaactgaga aacacgagct cctggtgcta 840
gttaagaaag atcaactgaa ccgtcactct tatctcaaag acccggactt tcttgacgcc 900
gcacttgact tcaactacct agacctcagc gcactactac gtaacagctt tcaccgttac 960
gccgtggatg tactcaagag cggtcgatgt cagatgctgg accgccgcac ggtagaaatg 1020
gccttcgcct acgcattagc actgttcgca gcagcccgac aagaagaggc cggcgcccaa 1080
gtctccgtcc cacgggccct agaccgccag gccgcactct tacaaataca agaatttatg 1140
atcacctgcc tctcacaaac accaccacgc accacgttgc tgctgtatcc cacggccgtg 1200
gacctggcca aacgagccct ttggacaccg aatcagatca ccgacatcac cagcctcgta 1260
cgcctggtct acatactctc taaacagaat cagcaacatc tcatccccca atgggcacta 1320
cgacagatcg ccgactttgc cctaaaacta cacaaaacgc acctggcctc ttttctttca 1380
gccttcgcac gccaagaact ctacctcatg ggcagcctcg tccactccat gctggtacat 1440
acgacggaga gacgcgaaat cttcatcgta gaaacgggcc tctgttcatt ggccgagcta 1500
tcacacttta cgcagttgtt agctcatcca caccacgaat acctcagcga cctgtacaca 1560
ccctgttcca gtagcgggcg acgcgatcac tcgctcgaac gcctcacgcg tctcttcccc 1620
gatgccaccg tccccgctac cgttcccgcc gccctctcca tcctatctac catgcaacca 1680
agcacgctgg aaaccttccc cgacctgttt tgcttgccgc tcggcgaatc cttctccgcg 1740
ctgaccgtct ccgaacacgt cagttatatc gtaacaaacc agtacctgat caaaggtatc 1800
tcctaccctg tctccaccac cgtcgtaggc cagagcctca tcatcaccca gacggacagt 1860
caaactaaat gcgaactgac gcgcaacatg cataccacac acagcatcac agtggcgctc 1920
aacatttcgc tagaaaactg cgccttttgc caaagcgccc tgctagaata cgacgacacg 1980
caaggcgtca tcaacatcat gtacatgcac gactcggacg acgtcctttt cgccctggat 2040
ccctacaacg aagtggtggt ctcatctccg cgaactcact acctcatgct tttgaagaac 2100
ggtacggtac tagaagtaac tgacgtcgtc gtggacgcca ccgacagtcg tctcctcatg 2160
atgtccgtct acgcgctatc ggccatcatc ggcatctatc tgctctaccg catgctcaag 2220
acatgc 2226
<210> 154
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 154
atgcggccag gcctcccctc ctacctcatc atcctcgccg tctgtctctt cagccaccta 60
ctttcgtcac gatatggcgc agaagccgta tccgaaccgc tggacaaagc gtttcaccta 120
ctgctcaaca cctacgggag acccatccgc ttcctgcgtg aaaataccac ccagtgtacc 180
tacaacagca gcctccgtaa cagcacggtc gtcagggaaa acgccatcag tttcaacttc 240
ttccaaagct ataatcaata ctatgtattc catatgcctc gatgtctctt tgcgggtcct 300
ctggcggagc agtttctgaa ccaggtagat ctgaccgaaa ccctggaaag ataccaacag 360
agacttaaca cttacgcgct ggtatccaaa gacctggcca gctaccgatc tttctcgcag 420
cagctaaagg cacaagacag cctaggtgaa cagcccacca ctgtgccacc gcccattgac 480
ctgtcaatac ctcacgtttg gatgccaccg caaaccactc cacacggctg gacagaatca 540
cataccacct caggactaca ccgaccacac tttaaccaga cctgtatcct ctttgatgga 600
cacgatctac tattcagcac cgtcacacct tgtttgcacc aaggctttta cctcatcgac 660
gaactacgtt acgttaaaat aacactgacc gaggacttct tcgtagttac ggtgtccata 720
gacgacgaca cacccatgct gcttatcttc ggccatcttc cacgcgtact tttcaaagcg 780
ccctatcaac gcgacaactt tatactacga caaactgaga aacacgagct cctggtgcta 840
gttaagaaag atcaactgaa ccgtcactct tatctcaaag acccggactt tcttgacgcc 900
gcacttgact tcaactacct agacctcagc gcactactac gtaacagctt tcaccgttac 960
gccgtggatg tactcaagag cggtcgatgt cagatgctgg accgccgcac ggtagaaatg 1020
gccttcgcct acgcattagc actgttcgca gcagcccgac aagaagaggc cggcgcccaa 1080
gtctccgtcc cacgggccct agaccgccag gccgcactct tacaaataca agaatttatg 1140
atcacctgcc tctcacaaac accaccacgc accacgttgc tgctgtatcc cacggccgtg 1200
gacctggcca aacgagccct ttggacaccg aatcagatca ccgacatcac cagcctcgta 1260
cgcctggtct acatactctc taaacagaat cagcaacatc tcatccccca atgggcacta 1320
cgacagatcg ccgactttgc cctaaaacta cacaaaacgc acctggcctc ttttctttca 1380
gccttcgcac gccaagaact ctacctcatg ggcagcctcg tccactccat gctggtacat 1440
acgacggaga gacgcgaaat cttcatcgta gaaacgggcc tctgttcatt ggccgagcta 1500
tcacacttta cgcagttgtt agctcatcca caccacgaat acctcagcga cctgtacaca 1560
ccctgttcca gtagcgggcg acgcgatcac tcgctcgaac gcctcacgcg tctcttcccc 1620
gatgccaccg tccccgctac cgttcccgcc gccctctcca tcctatctac catgcaacca 1680
agcacgctgg aaaccttccc cgacctgttt tgcttgccgc tcggcgaatc cttctccgcg 1740
ctgaccgtct ccgaacacgt cagttatatc gtaacaaacc agtacctgat caaaggtatc 1800
tcctaccctg tctccaccac cgtcgtaggc cagagcctca tcatcaccca gacggacagt 1860
caaactaaat gcgaactgac gcgcaacatg cataccacac acagcatcac agtggcgctc 1920
aacatttcgc tagaaaactg cgccttttgc caaagcgccc tgctagaata cgacgacacg 1980
caaggcgtca tcaacatcat gtacatgcac gactcggacg acgtcctttt cgccctggat 2040
ccctacaacg aagtggtggt ctcatctccg cgaactcact acctcatgct tttgaagaac 2100
ggtacggtac tagaagtaac tgacgtcgtc gtggacgcca ccgacagtcg tctcctcatg 2160
atgtccgtct acgcgctatc ggccatcatc ggcatctatc tgctctaccg catgctcaag 2220
acatgc 2226
<210> 155
<211> 513
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 155
atgagtccca aagatctgac gccgttcttg acggcgttgt ggctgctatt gggtcacagc 60
cgcgtgccgc gggtgcgcgc agaagaatgt tgcgaattca taaacgtcaa ccacccgccg 120
gaacgctgtt acgatttcaa aatgtgcaat cgcttcaccg tcgcgctgcg gtgtccggac 180
ggcgaagtct gctacagtcc cgagaaaacg gctgagattc gcgggatcgt caccaccatg 240
acccattcat tgacacgcca ggtcgtacac aacaaactga cgagctgcaa ctacaatccg 300
ttatacctcg aagctgacgg gcgaatacgc tgcggcaaag taaacgacaa ggcgcagtac 360
ctgctgggcg ccgctggcag cgttccctat cgatggatca atctggaata cgacaagata 420
acccggatcg tgggcctgga tcagtacctg gagagcgtta agaaacacaa acggctggat 480
gtgtgccgcg ctaaaatggg ctatatgctg cag 513
<210> 156
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 156
atgtgccgcc gcccggattg cggcttctct ttctcacctg gaccggtgat actgctgtgg 60
tgttgccttc tgctgcccat tgtttcctca gccgccgtca gcgtcgctcc taccgccgcc 120
gagaaagtcc ccgcggagtg ccccgaacta acgcgccgat gcttgttggg tgaggtgttt 180
gagggtgaca agtatgaaag ttggctgcgc ccgttggtga atgttaccgg gcgcgatggc 240
ccgctatcgc aacttatccg ttaccgtccc gttacgccgg aggccgccaa ctccgtgctg 300
ttggacgagg ctttcctgga cactctggcc ctgctgtaca acaatccgga tcaattgcgg 360
gccctgctga cgctgttgag ctcggacaca gcgccgcgct ggatgacggt gatgcgcggc 420
tacagcgagt gcggcgatgg ctcgccggcc gtgtacacgt gcgtggacga cctgtgccgc 480
ggctacgacc tcacgcgact gtcatacggg cgcagcatct tcacggaaca cgtgttaggc 540
ttcgagctgg tgccaccgtc tctctttaac gtggtggtgg ccatacgcaa cgaagccacg 600
cgtaccaacc gcgccgtgcg tctgcccgtg agcaccgctg ccgcgcccga gggcatcacg 660
ctcttttacg gcctgtacaa cgcagtgaag gaattctgcc tgcgtcacca gctggacccg 720
ccgctgctac gccacctaga taaatactac gccggactgc cgcccgagct gaagcagacg 780
cgcgtcaacc tgccggctca ctcgcgctat ggccctcaag cagtggatgc tcgc 834
<210> 157
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 157
atgctgcggc ttctgcttcg tcaccacttt cactgcctgc ttctgtgcgc ggtttgggca 60
acgccctgtc tggcgtctcc gtggtcgacg ctaacagcaa accagaatcc gtccccgcca 120
tggtctaaac tgacgtattc caaaccgcat gacgcggcga cgttttactg tccttttctc 180
tatccctcgc ccccacgatc ccccttgcaa ttctcggggt tccagcgggt atcaacgggt 240
cccgagtgtc gcaacgagac cctgtatctg ctgtacaacc gggaaggcca gaccttggtg 300
gagagaagct ccacctgggt gaaaaaggtg atctggtacc tgagcggtcg gaaccaaacc 360
atcctccaac ggatgccccg aacggcttcg aaaccgagcg acggaaacgt gcagatcagc 420
gtggaagacg ccaagatttt tggagcgcac atggtgccca agcagaccaa gctgctacgc 480
ttcgtcgtca acgatggcac acgttatcag atgtgtgtga tgaagctgga gagctgggct 540
cacgtcttcc gggactacag cgtgtctttt caggtgcgat tgacgttcac cgaggccaat 600
aaccagactt acaccttctg cacccatccc aatctcatcg tt 642
<210> 158
<211> 1671
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 158
atggagtcgc gcggtcgccg ttgtcccgaa atgatatccg tactgggtcc catttcgggg 60
cacgtgctga aagccgtgtt tagtcgcggc gatacgccgg tgctgccgca cgagacgaga 120
ctcctgcaga cgggtatcca cgtacgcgtg agccagccct cgctgatcct ggtgtcgcag 180
tacacgcccg actcgacgcc atgccaccgc ggcgacaatc agctgcaggt gcagcacacg 240
tactttacgg gcagcgaggt ggagaacgtg tcggtcaacg tgcacaaccc cacgggccga 300
agcatctgcc ccagccaaga gcccatgtcg atctatgtgt acgcgctgcc gctcaagatg 360
ctgaacatcc ccagcatcaa cgtgcaccac tacccgtcgg cggccgagcg caaacaccga 420
cacctgcccg tagccgacgc tgttattcac gcgtcgggca agcagatgtg gcaggcgcgt 480
ctcacggtct cgggactggc ctggacgcgt cagcagaacc agtggaaaga gcccgacgtc 540
tactacacgt cagcgttcgt gtttcccacc aaggacgtgg cactgcggca cgtggtgtgc 600
gcgcacgagc tggtttgctc catggagaac acgcgcgcaa ccaagatgca ggtgataggt 660
gaccagtacg tcaaggtgta cctggagtcc ttctgcgagg acgtgccctc cggcaagctc 720
tttatgcacg tcacgctggg ctctgacgtg gaagaggacc taacgatgac ccgcaacccg 780
caacccttca tgcgccccca cgagcgcaac ggctttacgg tgttgtgtcc caaaaatatg 840
ataatcaaac cgggcaagat ctcgcacatc atgctggatg tggcttttac ctcacacgag 900
cattttgggc tgctgtgtcc caagagcatc ccgggcctga gcatctcagg taacctgttg 960
atgaacgggc agcaaatctt cctggaggta caagcgatac gcgagaccgt ggaactgcgt 1020
cagtacgatc ccgtggctgc gctcttcttt ttcgatatcg acttgttgct gcagcgcggg 1080
cctcagtaca gcgagcaccc caccttcacc agccagtatc gcatccaggg caagcttgag 1140
taccgacaca cctgggaccg gcacgacgag ggtgccgccc agggcgacga cgacgtctgg 1200
accagcggat cggactccga cgaagaactc gtaaccaccg agcgtaagac gccccgcgtc 1260
accggcggcg gagccatggc gagcgcctcc acttccgcgg gctcagcatc ctcggcgacg 1320
gcgtgcacgg cgggcgttat gacacgcggc cgccttaagg ccgagtccac cgtcgcgccc 1380
gaagaggaca ccgacgagga ttccgacaac gaaatccaca atccggccgt gttcacctgg 1440
ccgccctggc aggccggcat cctggcccgc aacctggtgc ccatggtggc tacggttcag 1500
ggtcagaatc tgaagtacca ggagttcttc tgggacgcca acgacatcta ccgcatcttc 1560
gccgaattgg aaggcgtatg gcagcccgct gcgcaaccca aacgtcgccg ccaccggcaa 1620
gacgccttgc ccgggccatg catcgcctcg acgcccaaaa agcaccgagg t 1671
<210> 159
<211> 1683
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 159
atggagtcgc gcggtcgccg ttgtcccgaa atgatatccg tactgggtcc catttcgggg 60
cacgtgctga aagccgtgtt tagtcgcggc gatacgccgg tgctgccgca cgagacgcga 120
ctcctgcaga cgggtatcca cgtacgcgtg agccagccct cgctgatcct ggtgtcgcag 180
tacacgcccg actcgacgcc atgccaccgc ggcgacaatc agctgcaggt gcagcacacg 240
tactttacgg gcagcgaggt ggagaacgtg tcggtcaacg tgcacaaccc cacgggccga 300
agcatctgcc ccagccaaga gcccatgtcg atctatgtgt acgcgctgcc gctcaagatg 360
ctgaacatcc ccagcatcaa cgtgcaccac tacccgtcgg cggccgagcg caaacaccga 420
cacctgcccg tagccgacgc tgttattcac gcgtcgggca agcagatgtg gcaggcgcgt 480
ctcacggtct cgggactggc ctggacgcgt cagcagaacc agtggaaaga gcccgacgtc 540
tactacacgt cagcgttcgt gtttcccacc aaggacgtgg cactgcggca cgtggtgtgc 600
gcgcacgagc tggtttgctc catggagaac acgcgcgcaa ccaagatgca ggtgataggt 660
gaccagtacg tcaaggtgta cctggagtcc ttctgcgagg acgtgccctc cggcaagctc 720
tttatgcacg tcacgctggg ctctgacgtg gaagaggacc taacgatgac ccgcaacccg 780
caacccttca tgcgccccca cgagcgcaac ggctttacgg tgttgtgtcc caagaatatg 840
ataatcaaac cgggcaagat ctcgcacatc atgctggatg tggcttttac ctcacacgag 900
cattttgggc tgctgtgtcc caagagcatc ccgggcctga gcatctcagg taacctgttg 960
atgaacgggc agcaaatctt cctggaggta caagcgatac gcgagaccgt ggaactgcgt 1020
cagtacgatc ccgtggctgc gctcttcttt ttcgatatcg acttgttgct gcagcgcggg 1080
cctcagtaca gcgagcaccc caccttcacc agccagtatc gcatccaggg caagcttgag 1140
taccgacaca cctgggaccg gcacgacgag ggtgccgccc agggcgacga cgacgtctgg 1200
accagcggat cggactccga cgaagaactc gtaaccaccg agcgtaagac gccccgcgtc 1260
accggcggcg gcgccatggc gagcgcctcc acttccgcgg gccgcaaacg caaatcagca 1320
tcctcggcga cggcgtgcac ggcgggcgtt atgacacgcg gccgccttaa ggccgagtcc 1380
accgtcgcgc ccgaagagga caccgacgag gattccgaca acgaaatcca caatccggcc 1440
gtgttcacct ggccgccctg gcaggccggc atcctggccc gcaacctggt gcccatggtg 1500
gctacggttc agggtcagaa tctgaagtac caggagttct tctgggacgc caacgacatc 1560
taccgcatct tcgccgaatt ggaaggcgta tggcagcccg ctgcgcaacc caaacgtcgc 1620
cgccaccggc aagacgcctt gcccgggcca tgcatcgcct cgacgcccaa gaagcaccga 1680
ggt 1683
<210> 160
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 160
atggaaagcc ggatctggtg tcttgtggtg tgcgtgaatc tttgcatcgt gtgcttgggt 60
gccgccgtgt catctagcag cacaagaggc acctccgcca ctcactcaca ccacagcagc 120
cacacgacca gcgccgctca ctccagaagc ggctctgtaa gccagagagt gaccagttct 180
caaaccgtca gccacggcgt caatgagacg atatataata caaccctgaa gtatggagac 240
gtggtgggtg tcaataccac caagtaccct tatcgcgtgt gcagcatggc ccagggcact 300
gacctgatca gattcgagag aaatatcgtc tgcacctcca tgaagcctat caacgaggac 360
cttgacgagg gcatcatggt tgtctacaag agaaacattg tggctcacac cttcaaggtg 420
agagtgtatc agaaagtact gacctttagg agatcctacg cttacatcca caccacgtac 480
ctgctcggct ccaacaccga gtatgtggct ccacccatgt gggagattca tcacatcaat 540
tcccacagcc aatgttacag ttcctatagc agagtcattg ctggtaccgt gttcgtcgct 600
taccacagag acagctatga gaacaagacc atgcagttga tgcccgatga ctactccaat 660
acacactcta caaggtatgt gacagtcaaa gatcagtggc acagccgggg cagcacctgg 720
ctgtaccgag agacatgtaa tctgaattgt atggtgacta tcactacagc caggagcaaa 780
tatccatacc acttcttcgc cactagcacc ggggacgtcg tggacatttc cccattctac 840
aatggcacaa acagaaacgc cagctacttc ggcgagaatg ccgacaagtt ctttatattc 900
cccaactata ccatcgtgag cgacttcggc cgccccaaca gcgccctgga aacccaccgg 960
ctcgtggcct ttctcgagcg ggccgatagc gtcatatcct gggacatcca ggacgagaag 1020
aatgtgacat gccagctgac cttctgggag gcctccgagc gtaccatccg gtccgaggca 1080
gaggacagct accatttcag cagcgccaag atgaccgcaa ccttcctcag taagaaacag 1140
gaggttaaca tgtctgattc tgccctggac tgcgtgcgcg atgaggcaat caacaagctg 1200
cagcagatct tcaacacatc ttacaaccaa acttacgaga agtacggcaa cgtcagcgtg 1260
ttcgagacaa caggaggcct ggtagtgttc tggcaaggta tcaagcagaa gagtctggtg 1320
gagctcgagc gactggctaa ccgcagctcc ctcaacctga cccataatag gacaaagaga 1380
agcaccgacg gcaacaacgc tactcatttg agcaacatgg aatccgtgca caacctggtg 1440
tatgcccagc tgcagttcac ttacgacacc ctgagaggct acatcaatag agccttagct 1500
cagatcgcag aggcttggtg tgtggaccag cgaagaactc tggaggtgtt caaggagtta 1560
agtaagatca atccatccgc catcctgtct gctatctaca acaagcccat tgccgccagg 1620
ttcatgggag atgtgctcgg cctggctagt tgtgtcacca tcaaccagac ctccgtgaag 1680
gtgctgcggg acatgaatgt gaaggagagc cccggtcggt gttactccag accagtggtg 1740
attttcaact tcgccaacag ctcctatgtg cagtacggac agctcggaga ggataacgag 1800
atcttgctcg gcaatcacag aactgaggag tgtcagctgc catcactgaa gatatttatt 1860
gccgggaatt ccgcctacga atacgttgac taccttttca agagaatgat cgacctgagc 1920
agcatcagca ccgtcgacag catgattgct ctcgatatcg accctctgga gaacaccgac 1980
tttagagtcc ttgagctgta ttcacagaag gagctgagga gctccaatgt gttcgacctg 2040
gaggaaatca tgagagagtt caactcttac aagcagcggg tgaagtacgt ggaggataag 2100
gtagtggacc cactcccacc atacctgaaa ggactcgacg atctcatgag cggactgggc 2160
gcagccggga aggctgttgg cgtcgccatc ggagcggtcg gaggagcagt ggctagcgtg 2220
gtggagggcg tggccacctt cctgaagaac cctttcggcg cctttaccat catcctggtg 2280
gccatcgccg tggtcatcat tacatatctg atttatacaa gacagagaag gctctgcacc 2340
cagcccttgc agaacctgtt cccctacctg gtcagtgccg acggtacaac cgtgaccagc 2400
ggtagcacca aggacacctc cctgcaggca ccgccgagct acgaggagtc cgtgtataac 2460
agtggaagaa agggccccgg accgcccagc agcgacgcat ccaccgccgc tcctccctac 2520
acaaatgagc aggcctatca gatgttgctg gctctggcac gcctggacgc cgagcagcga 2580
gctcagcaga acggcaccga ttccctggat ggacgcacag gcacacagga caaggggcag 2640
aagcccaacc tcctcgacag actgagacac cggaagaacg gatacaggca tctgaaggac 2700
tccgatgagg aggagaacgt t 2721
<210> 161
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 161
atggaatcca ggatctggtg cctcgtggtc tgtgtgaact tgtgcatcgt gtgcttgggt 60
gccgccgtga gcagtagcag caccagaggc accagcgcaa cacactcaca ccacagctcc 120
cataccactt ccgccgccca ctccagatcg ggctccgtga gccagagggt caccagcagc 180
cagacggtgt cccacggagt gaatgaaacc atctacaaca ctactctgaa gtacggagac 240
gtcgtcggcg tgaataccac taagtacccc tacagggtct gctctatggc ccaaggcaca 300
gacctgatca gatttgaaag aaatatcgtc tgtacctcca tgaagcccat caatgaggac 360
ttagacgagg gcattatggt ggtgtataaa cgcaacattg tggcccacac tttcaaggtc 420
agagtgtatc agaaagtgct caccttcagg cgtagctatg cctatatcca caccacttat 480
ctcctcggca gcaacaccga gtatgttgcc ccgcctatgt gggagattca ccatataaat 540
agccatagcc agtgctacag ctcctattcg agagtaatcg ccggaaccgt tttcgtcgcc 600
taccacagag actcgtacga gaacaagaca atgcagctga tgccagatga ctattcgaac 660
acccacagca cgagatatgt caccgtgaaa gatcagtggc acagcagggg tagtacatgg 720
ttgtataggg aaacctgcaa tctcaattgc atggtgacca tcaccaccgc cagaagcaaa 780
tacccctatc atttcttcgc tacctcgaca ggagacgtgg tggacatatc tcccttttat 840
aatggcacaa atagaaatgc tagctacttt ggagagaacg ccgacaaatt cttcatcttc 900
cctaactata ccatcgtgag cgactttggg cgacctaaca gcgccctcga gactcacagg 960
ctggtggctt tcttagagag ggctgatagt gttatctctt gggacattca ggatgagaag 1020
aacgtgacat gccagctgac attttgggag gctagcgagc gaaccatcag gtccgaggcc 1080
gaggacagct accatttctc tagtgccaag atgaccgcca ccttcttgtc aaagaagcaa 1140
gaggtgaaca tgtccgactc tgcgctggac tgtgtccgcg acgaggcaat taataaactg 1200
cagcagatct ttaataccag ctacaaccag acatacgaga agtatggcaa cgtgagcgtc 1260
ttcgaaacca caggcggcct tgtcgtcttt tggcaaggca tcaagcagaa gagtctggtg 1320
gagctggaaa gactcgccaa ccggtcatcc ctgaatctga cccacaatag gacaaagcgc 1380
agcaccgatg ggaacaacgc cacccacctg tcgaacatgg agtcagtgca caacctggtg 1440
tacgcccagc tgcagttcac ttatgatacc ctcagaggct acattaaccg cgcactggct 1500
cagatcgccg aagcatggtg cgtggaccag cggcgaaccc tggaagtgtt taaagagctc 1560
tccaagatta atcctagcgc catcctgagt gctatctaca ataagcctat cgccgcaaga 1620
tttatgggcg acgtgctggg actggcttcc tgcgtgacaa ttaaccagac ctccgtcaag 1680
gtgctgaggg acatgaacgt gaaggagagc cccggcagat gctatagccg gccagtggtg 1740
atcttcaatt tcgccaacag ctcatacgtg cagtacggcc agctcgggga ggataatgaa 1800
atcctgctgg gaaatcacag aaccgaggag tgtcagctgc ccagtctgaa gattttcatc 1860
gcaggcaaca gtgcctatga atacgtggac tatctgttca aacgcatgat cgatctgagc 1920
tctatctcca ccgtggactc catgattgcc ttggatatcg acccactgga gaacaccgat 1980
ttcagagtgc tggagctgta cagccagaag gagctcaggt ccagcaatgt gttcgacctg 2040
gaggaaatca tgagagagtt caactcctac aaacagagag tcaagtacgt ggaggacaag 2100
gtggtggatc ccctgcctcc ctacctgaag gggctggacg acctgatgag tggcctggga 2160
gccgccggca aagctgtggg agtggccatc ggtgccgtcg gaggggctgt ggccagcgtc 2220
gtcgagggag ttgccacatt cctgaagaac cccttcgggg ccttcaccat tatcctagtc 2280
gccattgccg tggtcatcat tacctatctg atctacacgc ggcagagacg gctgtgcacc 2340
cagcctttgc agaacctgtt cccctattta gtgtccgctg acgggaccac tgtgacaagc 2400
ggaagcacca aggacacatc cctgcaggcc ccacccagct acgaggagtc tgtttacaat 2460
tctggccgga agggccccgg ccctccctct tctgacgcct ccaccgcagc ccctccttac 2520
acaaacgagc aggcttacca gatgctgttg gctttggccc gtctggacgc cgaacagagg 2580
gcccagcaga atggcaccga ctccttggac ggccggacag ggacccagga taagggtcag 2640
aagcctaacc tactggatcg gctccgccat cgcaagaatg gctacagaca tctcaaggac 2700
agcgacgaag aagagaatgt g 2721
<210> 162
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 162
atggaatcaa gaatctggtg tctcgtggtg tgcgtgaacc tgtgtatcgt ctgtcttggc 60
gccgccgtct cttcctcaag cacccggggt accagtgcca cccactcaca tcactcctcc 120
cacactacca gcgccgccca cagcagatcc ggctccgtgt cccagcgggt gaccagcagc 180
cagaccgtgt cacacggcgt taatgaaacc atttacaaca ccacactgaa gtacggggac 240
gtggtgggcg tgaacaccac caagtatccc tacagggtgt gcagcatggc ccagggcacc 300
gacctgattc ggttcgagag aaacatcgtg tgcacatcca tgaagcctat caatgaggac 360
ctcgacgagg gcatcatggt ggtttacaag aggaacattg tcgcacacac atttaaggtg 420
cgagtgtacc agaaggtgtt aaccttcaga aggtcctacg catacatcca caccacctac 480
ctcctgggct ctaacacaga atacgtcgcc cctcccatgt gggagattca ccacatcaac 540
agtcacagcc agtgctacag ctcgtatagc agagttatcg ctggcaccgt gttcgtggct 600
tatcaccgcg acagctacga gaacaagacg atgcaactta tgcccgacga ttactcaaac 660
acgcactcca ctagatacgt gactgtgaag gaccagtggc acagtagagg cagcacctgg 720
ctgtaccggg aaacatgcaa tctcaattgt atggtcacca ttaccaccgc caggtccaag 780
tacccttacc acttcttcgc cacctccact ggcgacgtgg tcgacatcag ccccttctac 840
aatggcacca acaggaacgc ctcttacttt ggggagaacg ccgataaatt ctttattttc 900
cccaactaca ctattgtctc cgactttggc agacccaact cagcattgga aacccacagg 960
ctcgtggcct tcctggagcg ggccgatagt gtgatcagct gggacatcca ggatgagaag 1020
aacgtgacat gccagctgac cttctgggag gccagcgaac gaaccatccg gtccgaggcc 1080
gaggactctt atcacttctc tagcgcaaag atgaccgcca ccttcctgtc taagaaacag 1140
gaggtgaaca tgagcgacag cgccctggac tgcgtcagag acgaggcaat caacaagctg 1200
cagcaaatct tcaacaccag ctacaaccaa acctacgaga aatacggcaa cgtcagcgtc 1260
ttcgagacta ccggagggct cgttgttttc tggcagggca ttaagcagaa gtctctggtc 1320
gagctggaaa ggctggccaa tagaagctcc ctaaacctca ctcacaacag aactaagaga 1380
agcaccgatg gcaataacgc cactcatctg agtaacatgg agtctgttca caacctggtg 1440
tatgcccagc tgcagtttac ttatgacaca ctgaggggct acatcaatcg agccctggcc 1500
cagatcgccg aggcttggtg cgtcgaccag agaagaacac tggaagtgtt caaggagctg 1560
agtaagatta atcccagcgc cattctgtcc gccatctaca ataagccaat cgccgcaaga 1620
ttcatgggtg acgtgctggg cctggcctcc tgcgtgacaa tcaaccagac aagcgtgaaa 1680
gtcctcagag acatgaacgt caaggagtct cctggcaggt gttactcccg gcccgtggtg 1740
atatttaatt tcgccaacag cagttacgtg cagtacggac agctgggcga ggataacgag 1800
atactgctcg gaaaccatag aacagaggag tgccaactgc cctccctgaa gattttcatc 1860
gccgggaaca gcgcctatga gtatgttgac tatctgttca agcggatgat cgacctgagt 1920
tctatcagca ccgttgactc catgattgct ctcgatatcg atcctctgga gaacaccgat 1980
ttcagagtgc tggaactcta ctctcagaaa gagctaagaa gctcgaacgt gttcgacctg 2040
gaagaaatca tgagagagtt caactcctac aaacagaggg ttaagtacgt agaggataag 2100
gtcgtggacc ctctgcctcc ataccttaag ggattagatg atctgatgag cggcctgggc 2160
gctgccggaa aggccgtggg agtggccatc ggcgcagtgg gtggtgccgt ggctagcgtc 2220
gtggaaggcg ttgccacatt cttgaagaac ccattcgggg ccttcacaat catcctggtg 2280
gctatcgccg ttgtgattat cacatatctg atctacactc gccagcggag gctctgcacc 2340
cagcctctgc agaacctttt cccctaccta gtgtccgctg atgggactac agtcactagc 2400
ggcagcacta aggacacatc cctgcaggct cctccatctt acgaggagag cgtgtataac 2460
tccgggcgca agggacctgg ccctcccagc agcgacgcca gcacggcggc tcctccctac 2520
accaacgagc aggcatacca gatgttgctt gcactggccc gtctggacgc tgagcagagg 2580
gcccagcaga atgggactga ttccctggac ggcagaaccg gcacacagga taaaggacag 2640
aaaccgaatc tgctcgacag gctgaggcac cggaagaatg gatacaggca tctgaaggac 2700
agtgacgagg aggagaacgt g 2721
<210> 163
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 163
atggagtcaa gaatctggtg cttggtggtg tgtgtgaact tgtgtatcgt gtgccttgga 60
gccgccgtga gcagcagctc caccagaggc accagcgcca cccacagcca tcactcttcc 120
cacaccacaa gcgccgccca ctcgcggagc gggagtgttt cccaacgggt gacaagcagc 180
cagactgtga gccacggcgt taacgagaca atctacaaca caacactgaa gtacggcgac 240
gtggtgggtg taaatactac caagtatcct tacagggtgt gctctatggc ccagggtacc 300
gacctgatca ggtttgagag aaacattgtt tgcacaagca tgaagcccat caatgaggac 360
ttggatgagg gcatcatggt ggtttacaag agaaatatcg tggcccacac cttcaaagtg 420
agggtgtatc agaaggtgct gacctttaga aggagctacg cttatatcca cacaacctac 480
cttctgggca gcaacaccga gtacgtcgca ccacccatgt gggaaattca ccacatcaac 540
tctcactccc agtgctattc cagctacagc agagtgatag ccggcacagt cttcgtggcc 600
taccacaggg atagttacga gaataagacg atgcaactga tgcctgacga ttactccaac 660
acacacagca cccggtacgt caccgtgaag gaccagtggc actccagagg tagtacttgg 720
ctgtaccggg agacttgtaa cctgaactgc atggtgacaa ttaccactgc tcgaagcaag 780
tacccttacc acttctttgc cacctctacc ggcgatgtcg tagacatatc tcctttctat 840
aacgggacca acagaaacgc ttcgtacttc ggcgagaacg ctgacaagtt cttcatcttc 900
ccgaactaca ctatagttag cgactttggt aggccgaaca gcgccctgga gacacaccga 960
cttgtggcct tcctcgagag agctgacagc gtgatctcct gggacatcca ggacgagaag 1020
aacgtcacct gccagctgac attctgggag gcctctgaga ggaccatcag atccgaggcc 1080
gaggattcat accactttag cagcgctaag atgaccgcta ccttcctgag taagaagcag 1140
gaagtgaaca tgtccgactc agccctcgac tgcgtgaggg acgaggccat caacaagctg 1200
cagcagatct tcaacacctc ctacaaccag acatatgaga agtatggtaa cgtgagcgtg 1260
ttcgagacaa ccggcggact ggtcgtgttt tggcagggca taaagcagaa gtctctggtc 1320
gagctggaga ggctggcgaa caggagcagc ctcaacctga cccataacag aaccaaacgc 1380
agcaccgacg gcaacaatgc tacccacctg tcaaacatgg agagcgtcca caacctggtg 1440
tatgcccagc tgcaatttac atacgacacg ctgcgcggct acatcaatag agccctggcc 1500
cagatcgccg aggcttggtg cgttgaccag cggcgtactc tggaagtctt caaggagctg 1560
agcaagatca atcccagcgc tatcctgagc gcgatctaca ataaacctat tgctgccaga 1620
ttcatgggag acgtgttggg gctggccagc tgcgtgacaa tcaatcagac cagcgtgaaa 1680
gtgctgagag acatgaatgt gaaggagtct cctggtaggt gctactcaag gcccgtcgta 1740
attttcaatt tcgccaacag ttcctacgtg cagtacggac agctgggcga agacaatgag 1800
atcctcctgg gcaaccatcg gacggaggag tgtcaactcc catcactgaa gatctttatc 1860
gcaggcaatt ccgcctatga gtatgtggac tatctgttca agaggatgat cgacctgtcc 1920
agcatcagca cagtggattc aatgattgcc cttgacatcg accctcttga gaataccgac 1980
tttagagtgc tggagcttta tagccagaaa gagctcagga gctccaatgt gttcgacctg 2040
gaagagatca tgcgggagtt taacagctac aagcagaggg ttaaatatgt ggaggacaag 2100
gttgtggatc cactgccgcc ctacctgaaa gggctggacg acctcatgtc cggcctagga 2160
gccgcaggga aagccgtggg cgtggccatc ggcgcagttg gaggcgccgt cgcctctgtg 2220
gttgaaggcg ttgcgacctt tctgaagaac ccattcggcg ccttcaccat tatcctggtg 2280
gccattgccg tggtcatcat cacctatctg atctacacca ggcaacgacg cctgtgcacc 2340
cagcccctgc agaacctgtt cccttacctg gtcagcgccg atgggaccac agtgacctct 2400
ggttctacta aagacaccag ccttcaggcc cctccatcct acgaggagtc tgtgtacaat 2460
agcggcagaa agggccccgg cccgcccagc agcgatgcca gcaccgccgc tcctccatac 2520
acgaacgagc aggcctatca gatgctgctg gcccttgccc gcctggacgc cgagcagcgt 2580
gctcagcaga atggcaccga ttctctggac ggccgaactg gaacgcaaga caagggacag 2640
aagccaaacc tgctggacag actgagacac aggaagaatg gctacaggca tctgaaggat 2700
tcagacgagg aggagaacgt g 2721
<210> 164
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 164
atggagagcc ggatctggtg ccttgtggtg tgcgtgaacc tttgcatcgt gtgcctcggc 60
gccgccgtga gctcatcgag cacccggggc accagcgcca cccacagcca ccacagcagc 120
cacaccacca gcgcggccca cagtcggagc ggcagcgtga gccagcgggt gacctcctcc 180
cagaccgtct cccacggcgt gaacgaaacc atctacaaca ccaccctgaa gtacggcgac 240
gtggttgggg taaataccac taagtacccc taccgggtgt gcagcatggc ccagggcacc 300
gacctgatcc ggttcgagcg gaacatcgtc tgtaccagca tgaagcccat caacgaggac 360
ctggacgagg gcatcatggt tgtctacaag cggaatatcg tagcccacac cttcaaggtg 420
cgggtgtacc agaaggtgct gaccttccgg cggagctacg cctacattca cacgacttac 480
ctgctgggca gcaacaccga gtacgtggcg ccgcccatgt gggagatcca ccacatcaac 540
tctcactctc agtgctacag cagctacagc cgggtgatcg ccggcaccgt gttcgtggcc 600
taccaccggg acagctacga gaacaagacc atgcagctga tgcccgacga ctattctaac 660
acacactcca ctaggtacgt gaccgtgaag gaccagtggc actccagagg cagcacctgg 720
ctgtaccggg agacgtgcaa cctgaactgc atggtgacca tcaccaccgc ccggtcaaag 780
tacccttacc acttcttcgc caccagcact ggggatgtgg ttgacatcag ccccttctac 840
aacggcacca accggaacgc cagctacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtgag cgacttcggc cggcccaaca gcgccctgga aacacaccgg 960
ctggtggcct tcctggagcg ggccgacagc gtgatcagct gggacatcca ggacgagaag 1020
aacgtgacct gccaactcac attttgggag gccagcgagc ggaccatccg gagcgaggcc 1080
gaggactcct atcacttcag cagcgccaag atgaccgcca ccttcctgag caagaagcag 1140
gaggtgaaca tgagcgattc ggcattggac tgcgtgcggg acgaggccat caacaagctg 1200
cagcagatct tcaacaccag ctacaaccag acctatgaga aatacggcaa cgtgagcgtg 1260
ttcgaaacca ccggcggact ggttgttttc tggcagggta tcaagcagaa gagtttggtg 1320
gagctcgagc gcctggcaaa caggagcagc ctgaacctga cccacaaccg gaccaagcgg 1380
agcaccgacg gcaacaatgc aacgcaccta tccaacatgg agtccgtgca caacctggtg 1440
tacgcccagc tgcagttcac ctacgacacc ctgcggggct acatcaaccg ggccctggcc 1500
cagatcgccg aggcatggtg cgtggaccag cggcggaccc tggaggtgtt caaggagctt 1560
tccaagatca acccctctgc catcctgtct gctatctaca ataagccaat cgcggcacgc 1620
ttcatgggag acgtactggg cctggccagc tgcgtgacta ttaatcagac tagcgtcaaa 1680
gtgctacggg acatgaacgt aaaggagagc cccggccggt gctattctcg gcccgtggtc 1740
attttcaact tcgccaacag ttcctacgtg cagtacggac agttaggcga ggacaacgag 1800
attctgctgg gtaaccaccg gaccgaggag tgccaacttc ccagtctaaa gatatttatc 1860
gccgggaatt ccgcttatga gtatgtcgac tacctgttca agcggatgat cgacctgtcc 1920
agtatcagca ccgtggacag catgattgca ctggatatcg accctctcga gaacaccgac 1980
ttccgggtgc tggagctgta cagccagaaa gagctgagat caagtaatgt ctttgacctg 2040
gaggagatca tgcgggagtt caatagctac aagcagaggg tgaaatatgt cgaagacaag 2100
gtagtagacc cgctgcctcc ctacctgaag gggcttgacg acctcatgtc agggttaggg 2160
gcagctggca aggccgttgg cgtcgccatc ggcgcggtgg gcggtgccgt tgcctccgtg 2220
gtcgaaggcg tcgctacctt cctcaagaac cccttcggcg ccttcaccat catcctggtg 2280
gctattgcag ttgtcatcat tacctacctc atctacaccc ggcagcggag gctgtgcacc 2340
cagcccctgc agaacctgtt tccatacctg gtgagcgcag acggaactac cgtgacgagc 2400
ggatccacta aggacaccag cctgcaggcg cctccttcat acgaagagag tgtgtacaac 2460
agcggccgga agggccccgg acctccgagt agcgacgcaa gtaccgccgc cccaccctat 2520
accaacgagc aagcttacca gatgctgctg gcacttgctc ggctggacgc cgaacaacgc 2580
gcccagcaga acggaactga ttctctggac ggccggaccg gcacccagga caagggccag 2640
aagcccaacc tgttggaccg gctgcggcac cggaagaacg gctatcgtca cctgaaagac 2700
agcgacgagg aggagaacgt g 2721
<210> 165
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 165
atggagagcc ggatctggtg cctagtggtg tgcgtgaacc tctgcatcgt gtgcctaggc 60
gccgccgtga gcagttctag tacccggggc accagcgcca cccacagcca ccacagcagc 120
cacactacgt cagcagcgca tagtcggagc ggcagcgtga gccagcgggt gacgtcttcc 180
cagacagtgt cccacggcgt gaacgaaacc atctacaaca ccaccctgaa gtacggcgac 240
gtggtgggtg tcaatacaac taagtacccc taccgggtgt gcagcatggc ccagggcacc 300
gacctgatcc ggttcgagcg gaatattgtg tgtaccagca tgaagcccat caacgaggac 360
ctggacgagg gcatcatggt ggtatacaag agaaacattg tcgcccacac cttcaaggtg 420
cgggtgtatc agaaggtgct gaccttccgg cggagctacg cctacattca tacgacttac 480
ctgctgggca gcaacaccga gtacgtggcc ccgcccatgt gggagatcca ccacatcaac 540
agccactccc agtgctacag cagctacagc cgggtgatcg ccggcaccgt gttcgtggcc 600
taccaccggg acagctacga gaacaagacc atgcagctga tgcccgacga ctatagcaat 660
actcacagca cacggtacgt gaccgtgaag gaccagtggc acagccgcgg cagcacctgg 720
ctgtaccggg aaacgtgcaa cctgaactgc atggtgacca tcaccaccgc ccggtcgaag 780
tatccctatc acttcttcgc caccagcacg ggcgatgtgg ttgacatcag ccccttctac 840
aacggcacca accggaacgc cagctacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtgag cgacttcggc cggcccaaca gcgccctgga aacccaccgg 960
ctggtggcct tcctggagcg ggccgacagc gtgatcagct gggacatcca ggacgagaag 1020
aacgtgacct gccagcttac attctgggag gccagcgagc ggaccatccg gagcgaggcc 1080
gaggacagtt accacttctc gagcgccaag atgaccgcca ccttcctgag caagaagcag 1140
gaggtgaaca tgagcgacag tgctctggac tgcgtgcggg acgaggccat caacaagctg 1200
cagcagatct tcaacaccag ctacaaccag acctatgaga aatacgggaa cgtgagcgtg 1260
ttcgagacaa ccggcggctt agtagtgttc tggcagggga tcaagcagaa gagtttggtg 1320
gagctcgagc ggctggcgaa cagaagcagc ctgaacctga cccacaaccg gaccaagcgg 1380
agcaccgacg gcaacaacgc aacgcactta tcaaacatgg aaagtgtgca caacctggtg 1440
tacgcccagc tgcagttcac ctacgacacc ctgcggggct acatcaaccg ggccctggcc 1500
cagatcgccg aggcgtggtg cgtggaccag cggcggaccc tggaggtgtt caaggagttg 1560
tcgaagatca acccttctgc catcctgtca gcaatttaca ataaacctat tgccgcaagg 1620
ttcatgggag atgtcctggg cctggccagc tgcgtgacca taaaccagac aagcgtcaaa 1680
gtcctccggg acatgaatgt gaaagagagc cccggccggt gttacagtcg acccgtggtg 1740
atctttaact tcgccaattc ttcttatgtg cagtacggac agctcggcga ggacaacgag 1800
atcctgctcg gtaaccaccg gaccgaggag tgtcagcttc cctcactgaa gattttcatt 1860
gcggggaaca gtgcatacga gtatgttgac tacctgttca agcggatgat cgatctgtct 1920
agtatcagca ccgtggacag catgatcgct ctggatatcg acccattgga gaacaccgac 1980
ttccgggtgc tggagctgta cagccagaag gagcttcgca gcagtaatgt gtttgacctg 2040
gaggagatca tgcgggagtt caattcttac aagcagcgcg tgaaatacgt tgaggacaag 2100
gtggtcgatc cgctgcctcc ctacctgaag ggcctggatg atctcatgag cgggttaggg 2160
gctgccggca aggccgtcgg cgttgccatc ggcgcagtgg gcggagccgt cgccagcgtg 2220
gtggagggtg ttgcaacgtt cctgaagaac cccttcggcg ccttcaccat catcttggtt 2280
gcaatcgcgg ttgttatcat tacctacctt atctacaccc ggcaacggcg gctgtgcacc 2340
cagcccctgc agaacctgtt tccatacttg gtgagcgcgg atgggaccac cgtgacttca 2400
ggttccacca aggacaccag cctgcaggcg cctccctcat acgaggagtc cgtatacaac 2460
agcggccgga aggggccagg tcctcctagc tcggacgcaa gtactgccgc accgccttat 2520
accaacgagc aggcatatca gatgctgctt gccctggctc ggctggacgc cgaacagcgc 2580
gcccagcaga acggaacaga ttccctggac ggccggaccg gcacccagga taagggccag 2640
aagcccaact tgctggaccg gctgcggcac cggaagaacg gctataggca tctgaaggac 2700
agcgacgagg aggagaacgt g 2721
<210> 166
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 166
atggagagcc ggatctggtg cctagtggtg tgcgtgaacc tatgcatcgt gtgcttaggc 60
gccgccgtga gctcatcgtc cacccggggc accagcgcca cccacagcca ccacagcagc 120
cacacgacaa gcgccgccca ctcccggagc ggcagcgtga gccagcgggt gacttcttcc 180
cagacagtga gccacggcgt gaacgagact atctacaaca ccaccctgaa gtacggcgac 240
gtggtgggcg tcaacactac caagtacccc taccgggtgt gcagcatggc ccagggcacc 300
gacctgatcc ggttcgagcg gaacattgtg tgcaccagca tgaagcccat caacgaggac 360
ctggacgagg gcatcatggt tgtgtacaag cgtaatatcg tcgcccacac cttcaaggtg 420
cgggtgtacc agaaggtgct gaccttccgg cggagctacg cctacatcca tactacgtac 480
ctgctgggca gcaacaccga gtacgtggct cctcccatgt gggagatcca ccacatcaac 540
tcccatagcc agtgctacag cagctacagc cgggtgatcg ccggcaccgt gttcgtggcc 600
taccaccggg acagctacga gaacaagacc atgcagctga tgcccgacga ctattcgaac 660
acccactcaa ccagatacgt gaccgtgaag gaccagtggc attcacgggg cagcacctgg 720
ctgtaccggg aaacatgcaa cctgaactgc atggtgacca tcaccaccgc ccggagtaaa 780
tacccttatc acttcttcgc caccagcacg ggcgacgtcg tagacatcag ccccttctac 840
aacggcacca accggaacgc cagctacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtgag cgacttcggc cggcccaaca gcgccctgga gacacaccgg 960
ctggtggcct tcctggagcg ggccgacagc gtgatcagct gggacatcca ggacgagaag 1020
aacgtgacct gccagctgac gttttgggag gccagcgagc ggaccatccg gagcgaggcc 1080
gaagattcct atcactttag cagcgccaag atgaccgcca ccttcctgag caagaagcag 1140
gaggtgaaca tgtctgattc cgcgctggac tgcgtgcggg acgaggccat caacaagctg 1200
cagcagatct tcaacaccag ctacaaccag acctatgaga agtatgggaa cgtgagcgtg 1260
ttcgagacaa ccggcgggct ggtcgtcttc tggcaaggca ttaagcagaa gtccctcgtg 1320
gagctggaac ggctggccaa ccgtagcagc ctgaacctga cccacaaccg gaccaagcgg 1380
agcaccgacg gcaacaatgc tactcatcta tcaaacatgg aaagcgtgca caacctggtg 1440
tacgcccagc tgcagttcac ctacgacacc ctgcggggct acatcaaccg ggccctggcc 1500
cagatcgccg aggcctggtg cgtggaccag cggcggaccc tggaggtgtt caaggagcta 1560
agtaagatca acccctccgc aatcctgagc gccatctata acaagcctat cgccgcccgg 1620
ttcatgggcg atgtgctggg cctggccagc tgcgtcacca tcaatcaaac tagcgtgaag 1680
gtcctacggg acatgaacgt gaaagagagc cccggccggt gctactcccg gcccgtggtc 1740
atcttcaatt tcgccaactc ttcctatgtg cagtacgggc agctgggcga ggacaacgag 1800
attctgctgg gtaaccaccg gaccgaggag tgccagcttc cctccctcaa gattttcata 1860
gcaggcaatt ctgcctatga atacgttgac tacctgttca agcggatgat cgatctctct 1920
agtatcagca ccgtggacag catgattgcg ttggacatcg acccgttaga gaacaccgac 1980
ttccgggtgc tggagctgta cagccagaaa gaactgcgtt caagcaacgt tttcgacctg 2040
gaggagatca tgcgggagtt caactcttac aagcagcggg tcaagtacgt cgaggataag 2100
gtcgtggacc cgctgccgcc ctacctgaag ggactggacg atctgatgtc cggattggga 2160
gctgcaggaa aggccgtggg agtagccatc ggcgctgttg gaggggcagt ggccagcgtg 2220
gtcgaaggcg tcgcgacgtt cctgaagaac cccttcggcg ccttcacaat aatcttggtt 2280
gccattgctg tcgtcattat tacatatctt atctacaccc ggcagagaag actgtgcacc 2340
cagcccctgc agaacctgtt cccttatttg gtgagcgccg acgggacaac cgtcacctcc 2400
ggctcaacga aggacaccag cctgcaggct ccgccttcat atgaagagtc agtatataac 2460
agcggccgga aggggccagg tcctccatct agcgacgcat caactgccgc acctccgtac 2520
accaacgagc aggcatacca gatgctgttg gccctcgcac ggctggacgc cgagcaacgc 2580
gcccagcaga acgggacgga ctctttggat ggccggaccg gcacccaaga caagggccag 2640
aagcccaatt tgctggaccg gctgcggcac cggaagaacg gctatagaca tctgaaggac 2700
agcgacgagg aggagaacgt g 2721
<210> 167
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 167
atggagagcc ggatctggtg cctagtggtg tgcgtgaacc tatgcatcgt gtgccttggc 60
gccgccgtga gctcgtccag tacccggggc acctccgcca cccactccca ccactcctcc 120
cacactacaa gcgccgccca ctcgcgctcc ggctccgtct cccagcgcgt caccagttcc 180
cagaccgtga gtcacggcgt caacgaaacc atctacaaca ccaccctcaa gtacggcgac 240
gtcgtgggcg tgaatacaac caagtacccc taccgcgtct gctccatggc ccagggcacc 300
gacctcatcc gcttcgagcg caacatcgtc tgcacctcca tgaagcccat caacgaggac 360
ctcgacgagg gcatcatggt cgtgtataag cgaaatattg tggcccacac cttcaaggtc 420
cgcgtctacc agaaggtcct caccttccgc cgctcctacg cctacattca cacaacctac 480
ctcctcggct ccaacaccga gtacgtcgcc cctcccatgt gggagatcca ccacatcaac 540
agtcacagcc agtgctactc ctcctactcc cgcgtcatcg ccggcaccgt cttcgtcgcc 600
taccaccgcg actcctacga gaacaagacc atgcagctca tgcccgacga ctatagcaat 660
acacatagta cccgctacgt caccgtcaag gaccagtggc acagcagggg ctccacctgg 720
ctctaccgcg agacttgcaa cctcaactgc atggtcacca tcaccaccgc ccgctcaaag 780
tacccgtatc acttcttcgc cacctccacg ggagacgtgg tggacatctc ccctttctac 840
aacggcacca accgcaacgc tagctatttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtctc cgacttcggc cgccccaact ccgccctcga aacccacagg 960
cttgtggcct tcctcgagcg cgccgactcc gtcatctcct gggacatcca ggacgagaag 1020
aacgtcacct gccagctcac attctgggag gcctccgagc gcaccatccg ctccgaggcc 1080
gaggattcgt accactttag ctcagcaaag atgaccgcca ccttcctctc caagaagcag 1140
gaggtcaaca tgagcgactc tgctttggac tgcgtccgcg acgaggccat caacaagctc 1200
cagcagatct tcaacacctc ctacaaccag acttatgaga agtatggcaa cgtctcggtg 1260
ttcgagacta cgggcggtct ggtggtcttc tggcagggga ttaagcagaa gtccctcgtc 1320
gagttggaga gactcgccaa ccgctcctcc ctcaacctca cccacaaccg caccaagcgc 1380
tccaccgacg gcaacaacgc cacgcacctc tcaaacatgg agtccgtcca caacctcgtc 1440
tacgcccagc tccagttcac ctacgacacc ctccgcggct acatcaaccg cgccctcgcc 1500
cagatcgccg aggcctggtg cgtcgaccag cgccgcaccc tcgaggtctt caaggagctc 1560
agtaagatca acccaagtgc gatcctgtcg gccatttaca ataaaccgat tgcagcccgc 1620
ttcatgggtg acgtactcgg cctcgcctcc tgcgtgacga ttaatcagac cagcgtcaag 1680
gtgcttcgcg acatgaatgt gaaggagagc ccaggccgct gttacagtcg gcccgtcgtc 1740
attttcaatt tcgccaatag cagctatgtc cagtacggcc agctcggcga ggacaacgag 1800
atactccttg gcaaccaccg caccgaggag tgccagctgc cgtctctgaa gatattcata 1860
gccggcaaca gcgcttatga atacgtggac tacctcttca agcgcatgat cgacctctcc 1920
tccatctcca ccgtcgactc catgatcgca cttgatatcg acccactgga gaacaccgac 1980
ttccgcgttc tggaactcta ctcccagaag gagctacggt cctccaatgt tttcgacctc 2040
gaggagatca tgcgcgagtt caattcatac aagcaacggg tgaagtatgt ggaggacaag 2100
gtcgtcgatc ctctgcctcc ctacctcaag ggtcttgatg atctcatgtc cggcctcggc 2160
gctgccggga aggcagtggg agtcgccatc ggcgccgttg gaggggccgt cgcctctgtg 2220
gtggagggcg tggctacctt cctgaagaac cccttcggcg ccttcaccat tattctggtg 2280
gccatcgcag tggttatcat cacgtacctt atctacaccc ggcagagaag gctctgcacc 2340
cagcccctcc agaacctctt tccttatctc gtcagcgcag acggtacaac agttactagt 2400
ggaagtacca aggacacctc cctccaggcc ccgccaagct acgaggaaag tgtttacaac 2460
tccggccgca agggccccgg cccaccttct tccgacgctt ccaccgctgc tccaccatac 2520
accaacgagc aggcctacca gatgctcctg gcactggctc ggctggatgc cgagcagagg 2580
gcccagcaga acggtaccga ttccctcgac ggccgcaccg gcacccagga taagggccag 2640
aagcccaatt tactagacag actgcgccac cggaagaacg gctaccgcca tctgaaggac 2700
tccgacgagg aggagaacgt c 2721
<210> 168
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 168
atggagagcc ggatctggtg cctagtggtg tgcgtgaacc tctgcatcgt gtgcttgggc 60
gccgccgtga gtagttccag tacccggggc acctccgcca cccactccca ccactcctcc 120
cacactacga gtgccgccca ctcacgctcc ggctccgtct cccagcgcgt cactagttct 180
cagacagtgt ctcacggcgt caacgagaca atctacaaca ccaccctcaa gtacggcgac 240
gtcgtgggtg tgaatactac taagtacccc taccgcgtct gctccatggc ccagggcacc 300
gacctcatcc gcttcgagcg caacatcgtc tgcacctcca tgaagcccat caacgaggac 360
ctcgacgagg gcatcatggt cgtctacaag agaaatatag tggcccacac cttcaaggtc 420
cgcgtctacc agaaggtcct caccttccgc cgctcctacg cctacattca cactacctac 480
ctcctcggct ccaacaccga gtacgtcgcc ccacccatgt gggagatcca ccacatcaac 540
tctcacagtc agtgctactc ctcctactcc cgcgtcatcg ccggcaccgt cttcgtcgcc 600
taccaccgcg actcctacga gaacaagacc atgcagctca tgcccgacga ctactcaaac 660
actcacagca cccgctacgt caccgtcaag gaccagtggc acagccgcgg ctccacctgg 720
ctctaccgcg agacttgcaa cctcaactgc atggtcacca tcaccaccgc ccgctcgaag 780
tatccgtacc acttcttcgc cacctccacg ggcgatgtgg tcgacatcag tccattctac 840
aacggcacca accgcaacgc ttcatacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtctc cgacttcggc cgccccaact ccgccctcga gacacaccgc 960
ctggtcgcct tcctcgagcg cgccgactcc gtcatctcct gggacatcca ggacgagaag 1020
aacgtcacct gccagttgac cttctgggag gcctccgagc gcaccatccg ctccgaggcc 1080
gaggacagtt accatttcag tagtgccaag atgaccgcca ccttcctctc caagaagcag 1140
gaggtcaaca tgtcggactc tgctcttgac tgcgtccgcg acgaggccat caacaagctc 1200
cagcagatct tcaacacctc ctacaaccag acttatgaga agtatggtaa cgtctctgtg 1260
tttgagacta caggcggtct tgtcgtcttc tggcagggta tcaagcagaa gtccctcgtc 1320
gagctggaac gcctcgccaa ccgctcctcc ctcaacctca cccacaaccg caccaagcgc 1380
tccaccgacg gcaacaacgc aacacatctt agcaacatgg agtccgtcca caacctcgtc 1440
tacgcccagc tccagttcac ctacgacacc ctccgcggct acatcaaccg cgccctcgcc 1500
cagatcgccg aggcctggtg cgtcgaccag cgccgcaccc tcgaggtctt caaggagctg 1560
agtaagatca acccaagtgc aatcctaagc gctatttaca acaaacctat cgcagccagg 1620
ttcatgggag acgtcctcgg cctcgcctcc tgcgtcacca ttaatcagac gtctgttaag 1680
gttctccgcg acatgaacgt gaaagagtct ccgggccgct gctacagcag gcccgtcgtc 1740
atcttcaatt tcgccaattc ttcatatgtc cagtacggcc agctcggcga ggacaacgag 1800
attctcttag ggaaccaccg caccgaggag tgtcagctac ccagcctgaa gatctttatt 1860
gccggcaata gcgcttatga gtatgttgac tacctcttca agcgcatgat cgacctctcc 1920
tccatctcca ccgtcgactc catgatcgct ctggatatcg accctctgga gaacaccgac 1980
ttccgcgtgc ttgagctcta ctcccagaaa gagcttaggt caagcaacgt tttcgacctc 2040
gaggagatca tgcgcgagtt caactcatat aagcaacgcg ttaaatatgt agaggataag 2100
gtggttgatc cacttcctcc ctacctcaag ggtctggatg acctcatgtc cggcctcggg 2160
gcagcaggca aggccgtcgg cgttgccatc ggcgccgtgg gaggtgctgt ggccagtgtt 2220
gtcgagggcg tagccacctt cttaaagaac cccttcggcg cctttacaat aatcctggtg 2280
gccatcgctg tggttatcat tacctatctt atctacacca ggcagcggag gctctgcacc 2340
cagcccctcc agaacctctt cccttacctc gtgagcgcgg acgggacgac cgtcacatct 2400
ggcagtacaa aggacacctc cctccaggcc ccgcctagtt atgaagagag cgtttacaac 2460
tccggccgca agggccccgg tcctccctcc tccgacgcca gcaccgcagc gcctccatac 2520
accaacgagc aggcctacca gatgctcttg gccctggccc gactggatgc cgagcagcgc 2580
gcccagcaga acggaaccga ctccctcgac ggccgcaccg gcacccagga caaaggccag 2640
aagcccaatc tgctcgaccg cctgcgacac cgcaagaacg gctatcggca ccttaaagac 2700
tccgacgagg aggagaacgt c 2721
<210> 169
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 169
atgcggccag gacttcctag ctacctaatc atccttgccg tgtgtctttt ctcacacctc 60
ctctctagta ggtacggcgc agaggccgtg tccgagccac tcgacaaggc cttccacctt 120
ttgttaaaca cctacggtcg gccaatcaga ttcctccgcg agaacaccac ccagtgcacg 180
tacaattcgt ctctccgcaa cagcacagtc gtgagggaga acgctatatc attcaacttc 240
ttccagtctt acaaccagta ttacgtgttc cacatgccaa gatgcctgtt cgctggccca 300
ctggccgagc agttccttaa ccaggtggat ctgacagaga ctctggagag ataccaacag 360
aggctgaaca cctacgcact ggtgagcaag gatctggcct cctacaggag cttcagccaa 420
cagctgaagg cccaggacag tctgggcgag caaccaacca ccgtacctcc acctattgac 480
ttatcaatac ctcacgtgtg gatgcctcct cagaccactc ctcacggctg gaccgaatcc 540
cacaccacct ccggcctgca caggcctcat ttcaaccaga cctgtattct cttcgacgga 600
cacgacctgc ttttcagcac cgtcacgcca tgcttgcacc agggcttcta cctgatcgac 660
gagctcaggt atgtgaagat cactctgacc gaggacttct tcgtggttac tgtgagcatc 720
gatgacgata ccccaatgtt actgatcttc ggccacctgc ctagggtgct gttcaaggca 780
ccataccaga gagacaattt catcctgaga caaaccgaga agcacgagct gctggtgctg 840
gtcaagaagg accagctgaa taggcactca tacctgaagg acccagattt cctggacgct 900
gcccttgatt tcaattacct ggacctgtcc gccctgctga gaaacagctt ccacagatac 960
gccgtggatg tgctgaagtc aggcagatgt cagatgttgg accgccgaac cgttgagatg 1020
gccttcgcct acgcgctggc cctgttcgcc gccgctcggc aggaggaagc tggcgcacag 1080
gtgagcgtgc cgagggctct ggaccgacag gctgctctgc tacagattca ggaattcatg 1140
atcacctgcc tgtcacagac tccgcctcgg actaccctgc tgctgtatcc tacagcagtg 1200
gacctggcaa agagagctct ttggacccct aaccagatca ccgatatcac cagcctcgtc 1260
cggctggtct acattctgtc taagcagaat cagcagcacc tgatccctca gtgggctctc 1320
agacagatcg ccgatttcgc cctgaagctg cacaagaccc acctggcttc tttcctgagc 1380
gctttcgcca gacaggaact gtacctgatg ggatcgcttg tgcacagcat gctggtgcac 1440
acaactgaga ggagagagat tttcattgtg gagactggcc tgtgcagcct ggccgagctg 1500
tcccatttca cccagctcct cgctcatccg caccacgagt acctctccga cctctatacc 1560
ccttgctcct cttccggccg gcgcgatcac agcctggaaa gactcactag actgttccca 1620
gacgctaccg tgccggctac tgtcccggca gcactgagca tcctgagcac tatgcagcct 1680
tctacgctgg aaaccttccc ggacctgttc tgcctgccac tcggagaaag cttctctgcc 1740
ctgacggtga gtgagcacgt gtcgtacatc gtgacaaacc agtacctgat caagggtatc 1800
agctacccag tgtccacaac tgtggtgggc cagagcctga tcatcaccca gaccgatagc 1860
caaacaaagt gcgaactgac aagaaacatg cataccactc attccatcac tgtggcctta 1920
aacatctccc tggagaactg cgccttctgt cagtccgccc tgctggagta cgatgatacc 1980
cagggcgtta ttaatatcat gtacatgcat gatagcgacg atgtgctttt cgccctggac 2040
ccatacaacg aggtggtggt gtccagccct agaacccact acctcatgct gctgaagaac 2100
ggcacagtgc tggaggtgac cgacgtggtg gtggacgcta cggacagcag gctgctgatg 2160
atgagcgtgt acgccctgag cgccattatc ggaatatacc tgctgtacag gatgttgaag 2220
acctgt 2226
<210> 170
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 170
atgcggccgg gactccctag ctacctcatc atcctcgccg tgtgcctttt ctctcacctt 60
ttgagctcca gatacggcgc cgaagcggtg tccgagcctc tcgacaaggc cttccacctc 120
cttctcaaca catacggcag accgatccgg ttcttgaggg agaacactac ccaatgcaca 180
tataacagta gcctgcggaa tagcactgtg gtgcgggaga acgccatcag cttcaatttc 240
ttccagagct acaatcagta ttacgtgttc cacatgccta gatgtctgtt cgcgggccct 300
ctggcagagc agttcctgaa ccaggttgat ctcacagaga cactggagag ataccagcaa 360
agactgaaca cctacgctct cgtctccaag gacctggcca gctataggag cttcagccag 420
cagctgaagg cccaggattc cctgggagag cagccaacca ccgtcccgcc gccaatcgac 480
ctctctatcc cacacgtgtg gatgcctcca caaaccacac cacacggatg gactgagtcc 540
cataccacca gcggactgca caggcctcac ttcaatcaga cctgcatttt gttcgacggc 600
cacgacctcc tgttcagcac tgtgaccccg tgtctgcatc agggcttcta cctgattgac 660
gagctgaggt acgtcaagat tacgctcacc gaagacttct tcgtggtcac agtgagtatc 720
gatgacgaca cccctatgct gctcatcttc ggccatctgc ctagggtgct gttcaaggcc 780
ccttaccaga gagataattt catcttgcgg cagactgaga agcacgaact gctggtactc 840
gtgaagaagg accagctgaa ccgccactct tacttaaagg atccagactt cctggatgca 900
gcacttgact tcaactatct cgacctctct gccctgctga ggaacagctt ccaccggtat 960
gccgtggacg tgctgaagag tggacggtgt cagatgctgg accgcagaac agtggaaatg 1020
gcgttcgcgt atgctctggc cctattcgcg gccgcaagac aggaggaggc cggcgctcag 1080
gtgtccgtcc ctagagctct ggacaggcag gccgccctgc tgcaaattca ggagttcatg 1140
ataacttgcc tgagccaaac ccctccgaga acaacactgc tgctgtatcc aacagccgta 1200
gatctggcca agcgggccct ttggactcct aaccagatca ccgatattac ctccctggtg 1260
agactggtgt acattctgtc caagcagaac cagcagcacc tgatcccgca gtgggccctg 1320
agacagatcg ctgatttcgc cttgaagctg cacaagactc atctggcctc cttcctgagt 1380
gctttcgccc gccaggaact gtatctgatg ggctctcttg tccattccat gctggttcat 1440
accacggaga gaagggagat cttcatcgtg gaaaccggcc tttgctccct cgctgagctg 1500
agccatttca ctcagctgct cgcccacccg caccacgagt acctgtcaga cctttatact 1560
ccgtgctcct ccagcggcag gagggaccac agcctggaac ggctcacaag actgttcccg 1620
gatgctaccg tgcctgctac tgtgccagcc gccctgagca tcctttccac catgcagcct 1680
tccacactgg agactttccc tgacctgttc tgcctgccac ttggcgaaag tttcagcgcc 1740
ctgaccgtgt ccgaacatgt gagctacatc gtgactaacc agtacctgat caagggcatc 1800
agctacccgg ttagcaccac tgtcgtcgga cagtcactga tcatcactca gaccgactcc 1860
cagaccaagt gcgaactgac cagaaatatg cacacaaccc atagcatcac cgtggccctg 1920
aacattagcc tggagaactg tgccttctgc cagagcgccc tcctcgagta cgacgatacc 1980
cagggtgtga taaacattat gtatatgcac gacagtgacg acgttctgtt cgcactggac 2040
ccttacaacg aagtggtcgt ttcctctcct cggacccatt acctgatgct gctgaagaac 2100
ggcaccgtgc tagaggttac tgatgtggta gtggacgcca cagacagcag actgctgatg 2160
atgagcgtgt acgccctgag cgccattatt ggcatctacc tgctgtacag gatgctgaag 2220
acatgt 2226
<210> 171
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 171
atgcggccgg gactcccttc ctacctcatc atccttgccg tgtgtctttt ctcacacctc 60
ctcagcagcc gctacggcgc cgaggccgtg tcagagccac ttgacaaggc cttccatctt 120
ttgttgaaca cctacggcag acctattcgg ttcctgagag agaacacaac ccagtgcacc 180
tataacagct ctctgcgcaa ctccacagtg gttagagaga atgccatcag cttcaacttc 240
ttccagagtt acaaccagta ttacgtgttc catatgccta ggtgcctgtt cgctggcccg 300
ttagccgaac agttcctcaa ccaggtggat ctgaccgaaa cactggaaag gtaccagcag 360
cggctgaata catacgcctt ggtgtcaaag gatcttgctt cctacagaag cttcagccag 420
cagctgaagg cccaggacag ccttggagag cagccaacca ccgtgcctcc tcctattgac 480
ctgagcatcc ctcatgtgtg gatgcctcct cagaccaccc ctcacggctg gactgagagc 540
cataccacgt ccggcctgca caggcctcac ttcaatcaga cctgcatcct gttcgacggc 600
cacgatctgc ttttcagcac cgtcacccct tgcctgcacc agggattcta cctgatcgac 660
gagctccggt atgtgaagat tacactgacc gaggacttct tcgtggtgac cgtgtccatc 720
gacgatgaca ccccaatgct gctgatcttc ggccacctgc cgagagtcct gttcaaggcc 780
ccataccaga gagacaactt catcctgcgg cagaccgaga agcacgaact gctagtgctg 840
gtgaagaagg atcagctgaa ccggcactcc tacctgaagg accctgactt ccttgacgcc 900
gcactcgact tcaactacct ggacctcagt gctctactga ggaactcttt ccaccggtac 960
gccgtggacg tgctgaagtc tggaagatgc cagatgctgg ataggaggac agtggagatg 1020
gcgttcgcgt acgccctggc cctgttcgcc gccgccagac aggaggaggc cggcgcacag 1080
gtcagcgtcc caagggccct ggaccgccag gctgccctgc tgcagattca ggaattcatg 1140
atcacctgtc tcagccagac ccctccgaga acaaccctgc tgttgtaccc gaccgcagtg 1200
gatctggcta agagggccct gtggacccca aaccagatta ccgacatcac ctctctggtg 1260
agactggtgt acatcctgtc caagcagaac caacagcacc tcattccaca atgggccctg 1320
aggcaaatcg ccgatttcgc tctcaagttg cataagaccc atctggcctc attcctcagc 1380
gccttcgcaa gacaggagtt gtatctcatg ggctccctcg tgcatagcat gctggtgcac 1440
acaaccgagc gcagagaaat tttcatcgtt gaaaccggac tgtgcagcct cgccgagttg 1500
tctcatttca cccagctgct ggctcatcct caccatgagt atctttccga cctgtacacc 1560
ccgtgcagca gcagcggccg cagggatcac agcctcgaga gactgacaag actgttccca 1620
gacgccaccg tgcctgccac agtgccagcc gcgctgtcca tcctgagcac aatgcagcct 1680
agcacactgg agactttccc agatctgttc tgtcttccac tgggcgagag cttcagcgcc 1740
ctgaccgtga gcgagcacgt gagctacata gtgaccaacc aatatttgat taagggcatc 1800
tcctaccctg tgagcaccac agtggtgggc cagtctctga tcatcacaca aaccgacagt 1860
cagacgaagt gcgagctgac tagaaacatg cacacgaccc acagcataac cgtggcactc 1920
aacatctccc tggagaattg cgccttctgc cagagcgccc tcctggagta cgacgacact 1980
caaggagtga tcaacatcat gtacatgcac gatagcgatg acgtgctgtt cgccctggac 2040
ccatacaatg aagtggtggt gtccagccca cggacccact acctgatgct cctcaagaac 2100
ggcacagtgc tggaggttac agacgtggtg gtcgacgcta ccgatagcag acttcttatg 2160
atgtccgtgt acgccctgag cgccatcatc ggaatctatc tgctttacag gatgctgaag 2220
acttgc 2226
<210> 172
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 172
atgcggccag gcctcccttc gtaccttatc atcttggccg tgtgtctttt ctctcaccta 60
ctctcctcaa ggtacggcgc cgaggccgtg agtgagccgc tagacaaggc cttccaccta 120
ttacttaaca cctacggccg gcctatccga ttcctccggg agaataccac acagtgtaca 180
tacaactcta gcctgcgcaa cagcactgtg gtcagggaga acgccatcag cttcaatttc 240
ttccagagtt ataaccagta ctacgtgttc cacatgccaa gatgcctgtt cgccggacct 300
cttgccgagc agttcctgaa ccaggtggat ctgaccgaga cactggagag ataccagcaa 360
aggctcaata cctacgcttt agtgagcaag gaccttgctt cttacagatc tttctcacaa 420
cagcttaagg cgcaggacag cctcggcgag cagcctacca ccgtgcctcc tcctattgac 480
ttgagcatcc cacacgtatg gatgcctcca cagacgacac cacacggctg gaccgaatcc 540
catacaacca gcggactcca ccggcctcat ttcaatcaga cctgcatcct tttcgacggc 600
catgacctgc tattctctac cgtcaccccg tgcctgcacc agggcttcta ccttatcgac 660
gaactgagat acgtcaagat cacgctgacc gaagacttct tcgtcgttac agtcagcatc 720
gacgacgata cccctatgct gctgatattc ggccaccttc ctagagtcct gttcaaggca 780
ccgtaccaga gggacaactt catcctgaga cagacagaga agcacgagct cctggtgctg 840
gtgaagaagg atcagctgaa tagacacagt tacctgaagg atccagactt cctggacgcc 900
gcactggact tcaactatct ggatctgagc gccctgcttc gcaatagctt ccatagatac 960
gctgtggacg tgctgaagtc tggccggtgt cagatgctgg atcgtaggac cgtggagatg 1020
gccttcgcct acgcactcgc tctgttcgcc gccgctagac aggaggaggc cggagcccaa 1080
gtgagtgtgc ctcgggcact ggacagacag gcagccttac tgcagatcca ggagttcatg 1140
attacctgcc tgtctcagac tccaccacgg accacccttc tgctgtatcc taccgcggtt 1200
gatctggcta agagggccct gtggacccct aaccagatca ctgacatcac cagcctcgtg 1260
aggctggtgt acattcttag caagcagaac cagcagcacc taatacctca gtgggccctg 1320
cggcagatcg ccgacttcgc cctgaagctg cacaagaccc acctggcaag cttcctgtcc 1380
gccttcgccc gccaggagct gtacctcatg ggaagtctgg tacactccat gctggtgcac 1440
accaccgaga gaagagagat cttcatcgta gaaaccggac tctgctcact ggccgaattg 1500
tcacacttca cccagctgct ggcccatcct catcacgagt atctgtccga cctgtacacc 1560
ccttgcagct ctagcggcag gcgggaccat tccttggaga ggctgaccag gctgttcccg 1620
gatgccaccg ttccagcaac agtgcctgca gccctgagca ttctgtcaac aatgcagcct 1680
agcaccctcg aaactttccc ggatctgttc tgcctgcctc ttggtgagag cttcagcgcc 1740
ctgaccgtgt ccgagcatgt gtcttatatc gtaaccaatc agtacctgat caagggcatc 1800
agctaccctg tgtccacaac tgtcgtgggc caaagcctca tcataaccca gaccgattcc 1860
cagacaaagt gtgaactgac ccgcaacatg cacaccactc acagcattac tgtggccctg 1920
aacatctccc tggagaactg tgccttctgt cagagcgcgc ttctggagta tgatgacacc 1980
cagggtgtga ttaatatcat gtacatgcac gacagcgacg atgtgctgtt cgcgctggat 2040
ccttacaatg aggtggtcgt gagctcccct agaacccact atctcatgct gttaaagaac 2100
ggcaccgtcc tggaggtgac agacgtggtg gttgatgcca ccgacagcag gctgctgatg 2160
atgagcgttt atgccctgag cgccatcatc ggcatttacc tcctgtacag gatgttaaag 2220
acttgt 2226
<210> 173
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 173
atgcggccag gactccctag ctacctcatt atcctcgccg tgtgcctttt ctctcacctc 60
ttaagctccc ggtacggcgc cgaagccgtg agcgagccgc ttgacaaggc tttccacctc 120
ctccttaaca cctacggcag acctattaga ttcctgagag agaacaccac ccagtgtaca 180
tataattcta gcctgcggaa ctccaccgta gtgagggaga atgccattag cttcaacttc 240
ttccagagct acaaccagta ctatgtgttc catatgccga gatgtctgtt cgctggacct 300
ctcgcagaac agttcttgaa ccaggtggat ctgactgaaa ctctcgagcg gtaccagcaa 360
agactgaata cctatgcctt ggtaagcaag gatctggcta gctacaggag cttctcccag 420
cagctcaagg cccaggactc ccttggcgaa cagcctacca ccgtccctcc tccaattgac 480
ctgagcattc cgcacgtgtg gatgcctcct cagaccaccc cacacggctg gacagagtct 540
cataccacca gcggactgca tagaccgcat ttcaaccaga cttgcatcct gttcgatgga 600
catgatctcc tgttctctac agtgactcca tgcctgcacc agggcttcta cctgatcgat 660
gagctcagat acgtcaagat caccttgacc gaagatttct tcgtggtcac agtgagcatt 720
gacgacgaca ccccaatgct tctgatattc ggtcacctgc ctagggtcct cttcaaggct 780
ccataccaga gagacaattt catccttaga cagaccgaga agcacgagct gctcgtgctg 840
gtgaagaagg atcaactgaa cagacatagc tacctaaagg atccggattt cctggacgcc 900
gctctggact tcaactacct cgacctcagc gccctgctga ggaacagctt ccaccggtat 960
gcagtcgatg ttctcaagtc cggcagatgc cagatgctgg accgtagaac tgtggagatg 1020
gccttcgcct atgctctggc cctgttcgcc gccgcacgcc aggaagaggc tggagcccag 1080
gtgagcgtcc cacgggctct ggacagacag gctgctctgc tgcagatcca agagttcatg 1140
attacctgtc tgagccagac ccctcctaga accaccctcc tcctctatcc gaccgctgtg 1200
gacctggcca agagagcctt gtggacccct aatcagatta ctgacatcac aagcctggtc 1260
agactggtgt atatcctgag caagcagaat cagcagcacc tcattccaca gtgggcgctg 1320
cggcagatcg ctgatttcgc cctgaagctg cacaagaccc acctggccag cttcttgagc 1380
gcattcgcac ggcaggaact ctacctgatg ggctctctgg tgcacagcat gctcgtccac 1440
accacagaac ggcgagagat attcatcgtt gagacaggcc tgtgctctct ggccgagttg 1500
tcccacttca cccaactgct ggctcaccct catcacgagt acctcagcga cctgtacacc 1560
ccttgctcct ccagcggtag acgggatcac agcctggaaa gactgaccag actgttccca 1620
gacgccacgg tccctgcaac cgtgcctgcc gctctttcaa tcttgtccac catgcagcct 1680
agtacactgg aaacattccc tgacctcttc tgcctgcctc tcggagagtc cttctcagcc 1740
ctgaccgtga gcgaacacgt gtcctacatc gtgaccaacc agtacctgat caagggcatc 1800
tcctaccctg tgtcgaccac cgtcgtgggc cagagcctga tcattacaca gacggactct 1860
cagaccaagt gcgagttgac acggaacatg cacaccacac acagcatcac tgtggccctg 1920
aatattagcc tcgagaactg cgccttctgc cagagtgccc tgctagagta tgatgataca 1980
cagggcgtga ttaatatcat gtatatgcac gactctgatg acgtcctgtt cgccctggac 2040
ccatacaacg aggtggttgt gagctcccct cggacccact atctgatgct gctcaagaac 2100
ggcactgttc tcgaggtgac agatgtggtg gtcgatgcca cagattctcg gctgctgatg 2160
atgagcgtgt acgctcttag cgccatcatc ggaatctacc tcctgtacag gatgctgaag 2220
acttgt 2226
<210> 174
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 174
atgcggccgg gcctcccgtc ttacctcatc atcttggccg tgtgcctctt ctcccacctc 60
ttgagctccc ggtacggcgc agaggccgtg tcagagcctc tcgacaaggc cttccatttg 120
ctccttaaca catacggcag gccaatcagg ttcctgcgag agaataccac acaatgcacc 180
tacaactcca gcttgaggaa tagcaccgtg gtgcgggaga acgccatctc cttcaatttc 240
ttccagtcct acaatcagta ttatgtgttc catatgccta ggtgtctctt cgcaggccca 300
cttgccgaac aattcctgaa ccaagtggac ctgacagaga cactggagag ataccagcaa 360
cggctgaata cctacgcctt ggtgagcaag gatctcgcca gctacagatc tttctcacaa 420
caactgaagg cccaggattc tctcggtgag cagccaacga ctgtgcctcc tccaattgac 480
ctgtctatcc cacatgtgtg gatgccacct cagactaccc ctcacggatg gacagagtct 540
cataccacta gcggcctgca caggcctcac ttcaatcaga cctgtatcct cttcgacggt 600
cacgatctgt tgttcagcac cgtgacccca tgcctgcatc agggcttcta cctgattgac 660
gagctgagat atgtgaagat aacactgacc gaggatttct tcgtggtcac cgtgagcata 720
gacgacgaca caccgatgct cctgatcttc ggccatctgc cacgagttct gttcaaggca 780
ccttatcaga gagacaactt catcttgagg caaacagaga agcacgagct tctcgtgctg 840
gttaagaagg accagctcaa caggcatagc tacctgaagg acccagattt cctggacgcc 900
gctctggatt tcaattatct ggacctttct gctctgctga gaaacagctt ccatagatac 960
gccgtggacg tccttaagtc tggccgctgc cagatgctgg atagacggac tgtcgagatg 1020
gcattcgcct acgctctggc tctgttcgcc gccgccaggc aggaggaggc tggagcccaa 1080
gtgtcagtgc ctagggctct ggatagacaa gccgccttgc tccagatcca ggagttcatg 1140
attacctgtc tgagccagac cccaccaaga accacgttac tgctgtaccc taccgctgtg 1200
gacctggcta agcgagccct ctggacgcct aatcaaatca ccgacatcac cagcttagtc 1260
agactggtgt acattctgtc taagcagaac cagcagcact tgattccaca gtgggccctg 1320
agacagattg ccgacttcgc cctgaagctc cataagaccc atctggcgtc cttcctgagc 1380
gccttcgcca gacaggagct ctacctgatg ggcagcctgg ttcattccat gctggtccat 1440
acaacggaga gaagagagat cttcatcgtg gagacaggac tgtgctcttt ggccgaactt 1500
tcccacttca ctcagctgct ggcgcaccct catcacgagt acttatcgga cctgtacacc 1560
ccttgcagca gcagcggaag gagggaccat tctctcgaaa ggctgacaag actgttccct 1620
gacgccaccg tcccagccac agtgcctgcc gcactgagca tcctcagcac aatgcagcca 1680
agcactctgg agactttccc ggacttgttc tgcctgccgc tgggcgagtc cttcagcgcc 1740
cttacagtgt cagagcatgt gtcctacatc gtgaccaatc agtacctgat caagggaatc 1800
agctaccctg tgtctacaac cgtggttggc cagtccctca tcatcaccca gacagatagc 1860
caaactaagt gcgaactgac tagaaacatg cacacaaccc actccatcac agtggccctg 1920
aacatcagcc tcgagaattg cgccttctgc cagagcgcac tgttggagta cgacgatact 1980
cagggcgtga ttaacatcat gtacatgcat gatagcgacg atgtgctgtt cgccctggac 2040
ccttataacg aggtggtggt gagtagtcct aggacccatt accttatgct gctgaagaac 2100
ggaactgttc tggaggttac cgacgtcgtc gttgacgcta ccgactcacg cctgctcatg 2160
atgtctgtgt atgccctgtc tgccatcatc ggcatctacc tgctgtatag gatgctgaag 2220
acttgc 2226
<210> 175
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 175
atgcggcccg gccttcccag ctacctcatc atcctcgccg tgtgcttgtt cagccacctt 60
ctaagcagcc ggtacggcgc cgaggccgtg agcgagcccc tcgacaaggc cttccacttg 120
ttattgaaca cctacggccg gcccatccgg ttcctgcggg agaacaccac ccagtgcacc 180
tacaacagca gcctgcggaa cagcaccgtg gttcgggaga atgccatcag cttcaacttc 240
ttccagagct acaaccagta ctacgtgttc cacatgcccc ggtgtctttt cgccggaccg 300
ctggccgagc agttcctgaa ccaggtggac ctgaccgaaa ctctggagcg gtaccagcag 360
cggctgaata cctatgccct ggtgagcaag gacctggcct cataccggag cttcagccag 420
cagctgaagg cccaggacag cctgggcgag cagcccacca ccgtgcctcc acccatcgac 480
ctgagcatcc cgcacgtgtg gatgcctcca cagaccacac ctcacggctg gaccgagagc 540
cacaccacca gcggcctgca ccggccccac ttcaaccaga cctgcatcct gttcgacggc 600
cacgacctgc tgttcagcac agttacccct tgccttcatc agggcttcta tcttatagac 660
gagctgcggt acgtgaagat cacactcacc gaggacttct tcgtggtgac cgtgagcatc 720
gacgacgaca ctcctatgct cctcatcttc ggccatcttc cccgggttct gttcaaggct 780
ccataccagc gggacaactt catcctgcgg cagaccgaga agcacgagtt gctggtgctg 840
gtgaagaagg accagctgaa ccggcattcg taccttaagg accccgactt cctggacgcc 900
gccctggact tcaactacct agatctcagc gccctgttga ggaatagctt ccaccggtac 960
gccgtggacg tgttaaagag cggccggtgc cagatgctgg atcggcggac cgtggagatg 1020
gccttcgcct acgcgctggc cttgttcgct gccgcccggc aggaggaggc cggcgcccag 1080
gtgagcgtac cgcgggcact cgatcggcag gccgctctgc tgcagatcca ggagttcatg 1140
atcacctgcc tgagccagac ccctccgcgg accaccttac tgctttaccc cactgcagtt 1200
gacctggcta agcgcgcact ctggacccct aaccagatca ccgacatcac cagcctggtg 1260
cggctggtgt acatcctgag caagcagaac cagcaacacc tgataccaca gtgggctctg 1320
agacagatcg ccgacttcgc cctgaagctg cacaagaccc atctggccag cttcctgtcc 1380
gctttcgcac gacaggagct gtacctgatg ggatcactcg tgcacagcat gctcgtgcat 1440
accaccgagc ggcgggagat cttcatcgtg gaaacaggcc tgtgttcact agccgaactg 1500
agccacttca cccaactttt ggcccatcca caccacgagt atttgtcgga cctgtacacc 1560
ccttgttcct cttccggaag gcgggaccac tccctggaac ggctgacccg gctgttcccc 1620
gacgcaaccg taccggccac ggttccagct gccttaagca tcttaagtac catgcagccc 1680
agcacactgg aaaccttccc agatctgttc tgcctgccgc tgggtgagtc tttcagcgct 1740
ctcaccgtgt ccgagcacgt gagctacatc gtgacaaatc aatatctgat taagggcatc 1800
agctacccag tgtcaactac ggtggttggc cagagcttga ttataaccca gaccgactcg 1860
cagactaagt gcgagcttac gagaaacatg cacacaaccc acagcatcac cgtggccctg 1920
aacataagtc tggagaactg cgccttctgc cagtctgcct tgctcgagta tgatgacacc 1980
cagggcgtga tcaacatcat gtacatgcat gacagcgacg atgttctctt cgcgttggat 2040
ccatacaacg aggtggtggt gtccagtccg agaactcact atctgatgct cctaaagaac 2100
ggcaccgtgc tggaggtgac cgacgtcgtg gtcgatgcca cggactccag actgcttatg 2160
atgagcgtgt acgccctaag cgccatcatc ggcatctatc tcctgtatcg gatgcttaag 2220
acctgc 2226
<210> 176
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 176
atgcggcccg gccttcccag ctacctcatc atcctcgccg tgtgcttgtt cagccacttg 60
cttagcagcc ggtacggcgc cgaggccgtg agcgagccct tggacaaggc cttccactta 120
ctcctcaaca cctacggccg gcccatccgg ttcctgcggg agaacaccac ccagtgcacc 180
tacaacagca gcctgcggaa cagcaccgtg gtgcgtgaga acgccatcag cttcaacttc 240
ttccagagct acaaccagta ctacgtgttc cacatgccca ggtgcctttt cgccggacca 300
ctggccgagc agttcctgaa ccaggtggac ctgaccgaaa cactggagcg gtaccagcag 360
aggctgaaca catacgccct ggtgagcaag gacctggcct cctaccggag cttcagccag 420
cagctgaagg cccaggacag cctgggcgag cagcccacca ccgtgccgcc acccatcgac 480
ctgagcatcc cacacgtgtg gatgccacca cagaccaccc ctcacggctg gaccgagagc 540
cacaccacca gcggcctgca ccggccccac ttcaaccaga cctgcatcct gttcgacggc 600
cacgacctgc tgttctcgac cgtcacccct tgcttgcacc agggcttcta tctgatagac 660
gagctgcggt acgtgaagat caccttgacc gaggacttct tcgtggtgac cgtgagcatc 720
gacgacgaca cacctatgct gctcatcttc ggccatttac cccgggttct gttcaaggca 780
ccataccagc gggacaactt catcctgcgg cagaccgaga agcatgagct tctggtgctg 840
gtgaagaagg accagctgaa ccggcactca tatctgaagg accccgactt cctggacgcc 900
gccctggact tcaactacct ggatttaagc gccctgctcc gtaactcttt ccaccggtac 960
gccgtggacg tgttaaagtc aggccggtgc cagatgttgg accggcggac cgtggagatg 1020
gccttcgctt acgcattagc cctcttcgca gccgcccggc aggaggaggc cggcgcgcag 1080
gtgagcgtgc ctagagcgtt ggatagacag gcggccttgc tgcagatcca ggagttcatg 1140
atcacctgcc tgagccagac tcctccacgg accacattgc tgctctaccc caccgccgtt 1200
gacctggcaa agcgggcgct ctggactccg aaccagatca ccgacatcac cagcctggtg 1260
cggctggtgt acatcctgag caagcagaat cagcagcacc tgataccaca gtgggcacta 1320
cgccagatcg ccgacttcgc cctgaagctg cacaagaccc acctggccag cttcctgtct 1380
gctttcgcaa ggcaggaact gtacctgatg ggctctctag tgcacagcat gctcgtccat 1440
accacagagc ggcgggagat cttcatcgtg gagactggcc tgtgctctct tgcggaactg 1500
agccacttca cccagctcct agcccaccca caccacgagt acctttctga cctgtacacc 1560
ccgtgctcat caagtggacg gcgggaccac tcgctggaaa gactcacccg gctgttcccc 1620
gacgctactg tgccggcaac tgtgcctgcg gctctctcta tattatctac catgcagccc 1680
agcacactcg aaaccttccc tgatctgttc tgcctgcctc taggagagag cttctctgcc 1740
cttacagtgt ccgagcacgt gagctacatc gtgacaaacc aatacctcat taagggcatc 1800
agctaccctg ttagtactac cgtcgtaggc cagagcctaa ttatcaccca gaccgactcc 1860
cagacaaagt gcgaattaac gcgcaacatg cacacaaccc acagcatcac cgtggccctg 1920
aacattagcc tcgagaactg cgccttctgc cagagtgcct tgcttgagta tgatgatacc 1980
cagggcgtga tcaacatcat gtacatgcac gacagcgacg atgtgctgtt cgcactcgac 2040
ccctacaacg aggtggtcgt aagcagtcca aggacccatt atttgatgct gcttaagaac 2100
ggcaccgtgc tggaggtgac cgacgtggtg gtagacgcta cagactcccg gctgcttatg 2160
atgagcgtgt acgcgctcag tgcgatcatc ggcatctacc tgctttatcg gatgctaaag 2220
acctgc 2226
<210> 177
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 177
atgcggcccg gcttgcccag ctacttgatc atcttggccg tgtgcttgtt cagccactta 60
cttagcagcc ggtacggcgc cgaggccgtg tccgagcccc tcgacaaggc cttccacctc 120
ctcctcaaca cctacggccg ccccatccgc ttcctccgcg agaacaccac ccagtgcacc 180
tacaactcct ccctccgcaa ctccaccgtc gtgcgggaga atgccatctc cttcaacttc 240
ttccagtcct acaaccagta ctacgtcttc cacatgcccc gctgcctctt cgccggacct 300
ctcgccgagc agttcctcaa ccaggtcgac ctcaccgaga cgctcgagcg ctaccagcag 360
aggttgaata cctatgccct cgtctccaag gacctcgcct cctaccgctc cttctcccag 420
cagctcaagg cccaggactc cctcggcgag cagcccacca ccgtgcctcc accaatcgac 480
ctctccatcc cgcacgtctg gatgcctccc cagaccactc cgcacggctg gaccgagtcc 540
cacaccacct ccggactgca tcgccctcac ttcaaccaga cctgcatcct cttcgacggc 600
cacgacctcc tcttcagtac cgtgacgcca tgcctgcacc agggcttcta cctcatcgac 660
gagctccgct acgtcaagat cacccttacc gaggacttct tcgtcgtcac cgtctcgatt 720
gacgacgaca caccaatgct cctcatcttc ggccacctcc cgcgcgtgct gttcaaggcg 780
ccctaccagc gcgacaactt catcctgagg cagaccgaga agcacgagct gctcgtcctc 840
gtcaagaagg accagctcaa ccgccactcc tacctcaagg accccgactt cctcgacgcc 900
gccctcgact tcaactacct cgatctgagt gctctgctga ggaattcatt ccaccgctac 960
gccgtcgacg tcctcaagtc cggccgctgc cagatgctcg accgccgcac cgtcgagatg 1020
gccttcgctt acgcgctggc actcttcgct gccgcccgcc aggaggaggc cggcgcccag 1080
gtcagtgtgc caagagcact ggatagacag gccgcacttt tgcagatcca ggagttcatg 1140
atcacctgcc tctcccagac tccgcctcgc accacgttgt tgttgtaccc cacagcagtc 1200
gatctggcta agagagcctt atggacacct aaccagatca ccgacatcac ctccctcgtt 1260
cggctggtct acatcctctc caagcagaat cagcagcacc tgatccctca gtgggcactc 1320
cgtcaaatcg ccgacttcgc cctcaagctc cacaagaccc acctggcgtc tttcctcagt 1380
gcattcgcta ggcaggagct gtacctgatg ggcagtctcg tccactccat gctggtgcac 1440
accacggagc gccgcgagat cttcatcgtc gagactggcc tctgtagttt agccgagctc 1500
agtcacttca cccaactgct cgcccaccct caccacgagt accttagtga cctctatacc 1560
ccttgctcta gttccggtcg ccgcgaccac agcctggaac gtctgacccg cctcttcccc 1620
gacgctacag taccagcaac cgtgccagcg gccctgtcta tcctgtctac catgcagccc 1680
tccaccttgg agacgttccc agatctgttc tgcctccctc taggcgaatc gttctctgca 1740
ctcacggtca gcgaacacgt ctcctacatc gtcacaaacc agtatctgat aaagggcatc 1800
tcctacccag tgtcgaccac tgttgtcggc cagtccctca tcatcacaca gactgattct 1860
cagactaagt gcgagttgac acggaacatg catactacac attctatcac cgttgcttta 1920
aacataagcc tggagaactg cgccttctgc cagtccgctc tgctcgagta cgacgatacg 1980
cagggcgtca tcaacatcat gtacatgcac gactccgatg acgttctgtt cgcactggac 2040
ccctacaacg aggtcgtcgt ctcctctcct aggactcact acttaatgct gttgaagaac 2100
ggcaccgtcc tcgaggtcac cgacgtggtc gtcgatgcta cagacagccg actgctcatg 2160
atgtccgtgt acgctctctc cgccatcatc ggcatctacc tgctctaccg catgctcaag 2220
acctgc 2226
<210> 178
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 178
atgcggcccg gcctacccag ctaccttatc atcttagccg tgtgcttgtt cagccacttg 60
ctcagcagcc ggtacggcgc cgaggccgtg tccgagcccc tcgacaaggc cttccacctc 120
ctcctcaaca cctacggccg ccccatccgc ttcctccgcg agaacaccac ccagtgcacc 180
tacaactcct ccctccgcaa ctccaccgtc gtcagagaga atgccatctc cttcaacttc 240
ttccagtcct acaaccagta ctacgtcttc cacatgcccc gctgcctctt cgccggccca 300
ctcgccgagc agttcctcaa ccaggtcgac ctcaccgaaa ctctcgagcg ctaccagcag 360
cggctgaata cgtatgccct cgtctccaag gacctcgcct cctaccgctc cttctcccag 420
cagctcaagg cccaggactc cctcggcgag cagcccacca ccgtccctcc tccaatcgac 480
ctctccatcc cacacgtctg gatgcctccc cagaccactc ctcacggctg gaccgagtcc 540
cacaccacct ccggcctcca caggccacac ttcaaccaga cctgcatcct cttcgacggc 600
cacgacctcc tcttcagcac agtgacgcca tgtctgcatc agggcttcta cctcatcgac 660
gagctccgct acgtcaagat cactctgacg gaggacttct tcgtcgtcac cgtctctata 720
gatgacgaca ccccaatgct cctcatcttc ggccacttgc ctcgcgtgct gttcaaggct 780
ccctaccagc gcgacaactt catcctccgc cagaccgaga agcatgaatt actcgtcctc 840
gtcaagaagg accagctcaa ccgccactcc tacctcaagg accccgactt cctcgacgcc 900
gccctcgact tcaactacct ggatcttagc gccctgctgc gtaacagctt ccaccgctac 960
gccgtcgacg tcctcaagtc cggccgctgc cagatgctcg accgccgcac cgtcgagatg 1020
gccttcgcct atgctctggc cctgttcgct gccgcccgcc aggaggaggc cggcgcccag 1080
gtttccgttc ctcgggcttt agacagacag gctgccctgc ttcagatcca ggagttcatg 1140
atcacctgcc tctcccagac gccaccacgc accacactgt tgctgtaccc gacagcagtg 1200
gacctggcaa agagggcact ctggactcca aaccagatca ccgacatcac ctccctcgtc 1260
cgcctcgtct acatcctctc caagcagaac cagcaacacc tgatacctca gtgggctctg 1320
cggcagatcg ccgacttcgc cctcaagctc cacaagaccc atttggcctc cttcctgagt 1380
gccttcgcta gacaggagct gtacctgatg ggctccctgg tgcactccat gctggttcac 1440
accacagagc gccgcgagat cttcatcgtc gagacaggcc tctgttcatt ggcagaactc 1500
tcgcatttca cccagctgct ggcccacccg caccacgagt atctgagtga cctctacaca 1560
ccatgcagtt cgtcaggaag gcgcgaccac agcctggagc gactgacccg cctcttcccc 1620
gacgcaacag tccctgctac tgtccctgcc gcgctgagta ttttatcaac gatgcagccc 1680
tccacgctcg aaaccttccc tgacttgttc tgcctccctc ttggagagag tttcagtgcc 1740
ctgaccgtgt cagagcacgt ctcctacatc gtcacgaacc agtatcttat caagggcatc 1800
tcctacccag tatcgactac agtggttggc cagtccctca tcatcaccca gactgacagt 1860
caaactaagt gcgagcttac tagaaacatg cacacaaccc actccatcac cgttgcatta 1920
aacatcagcc tcgagaactg cgccttctgc cagagcgctc tgctggagta cgacgacaca 1980
cagggcgtca tcaacatcat gtacatgcac gactccgacg acgtcctgtt cgcgcttgat 2040
ccctacaacg aggtcgtcgt gtccagtcca cgaactcatt acctcatgct gcttaagaac 2100
ggcaccgtcc tcgaggtcac cgacgtggtc gtcgatgcta ccgactcccg cctcctcatg 2160
atgtccgttt acgcactctc tgcgatcatc ggcatctact tactatatcg catgctcaag 2220
acctgc 2226
<210> 179
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 179
atgtgcagaa gaccagactg cggattcagc ttctccccag gcccagtgat cttactttgg 60
tgctgcctcc tccttccgat tgtgagcagt gccgccgtga gcgtggctcc taccgcggcc 120
gagaaggtgc cggccgagtg cccagagctc acccgaaggt gccttctggg cgaggttttc 180
gagggagaca agtacgagtc ttggctccgg cctctggtca acgtgacggg cagagacggc 240
cctttgagcc agctcatcag atacagacca gtaacacctg aggccgccaa ttccgtcctg 300
ctggatgagg ccttcctgga caccctcgcc ctcctttaca ataacccaga ccagctgaga 360
gccctgttga cccttctcag cagcgacacc gctccacggt ggatgaccgt catgagaggc 420
tatagcgagt gcggagatgg cagccctgcc gtctatacct gcgttgacga cctgtgcagg 480
ggctacgatt tgacaaggct cagctacggc agatctatat tcacagagca tgtgctgggc 540
ttcgagctgg tgccgccatc cctgttcaac gtggtggtcg ctataaggaa cgaggccacc 600
agaacaaatc gcgccgtgag actgccggtg tccacggcag ccgcacctga gggcattaca 660
ctgttctatg gcctctacaa cgccgtgaag gagttctgtt tgcggcacca gctggaccca 720
ccactgctca gacacctgga taagtactac gctggcctgc ctccggagct gaagcaaaca 780
cgtgtgaatc tgccagccca ctctcggtac ggaccgcagg ccgtggacgc ccgg 834
<210> 180
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 180
atgtgcagga ggccagactg cggcttctca ttcagcccag gcccagtcat cctcctttgg 60
tgttgcctcc ttctccctat agttagcagt gccgccgtga gcgtggcccc tacagccgcg 120
gagaaggtgc cagcggagtg cccggagtta accagacgtt gcctcttggg cgaggtgttc 180
gagggcgata agtatgagtc ctggctgcgg cctctggtga acgtgaccgg cagagacgga 240
cctctgtccc agctgatcag atacagacca gtgacccctg aagccgcaaa cagcgtgctg 300
ctggacgagg ccttcctgga caccctggcc ctgttataca acaaccctga ccagcttcgc 360
gcgctgctta cactgctgag cagcgatacc gccccaagat ggatgactgt gatgagggga 420
tatagcgagt gtggcgacgg cagccctgcc gtctacacct gtgtggacga cctctgcaga 480
ggctatgacc tgaccagact gtcatacggc cgaagcatct tcaccgagca cgtcttagga 540
ttcgagctgg tgcctccaag cctcttcaat gtggtggtgg ccattcggaa cgaggctacc 600
agaaccaacc gggcggtgcg tcttccagtt tctacagccg ccgccccgga aggaattacc 660
ctgttctacg gcctgtacaa cgctgtcaag gagttctgcc tgagacacca gctggatcca 720
ccgctgctgc gccacttgga caagtactat gcgggcctcc ctcctgagct caagcagacg 780
agggtgaacc tccctgctca ctcacgttat ggaccacagg ccgtggacgc taga 834
<210> 181
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 181
atgtgcagaa ggccagactg cggcttcagc ttctctccag gaccagtgat cctcctctgg 60
tgctgccttc tcctccctat tgtgtcctcc gccgccgtgt ccgtggcccc aaccgccgcc 120
gagaaggtgc cagcggagtg cccagagctc accaggcgct gtctgctggg cgaggtgttc 180
gagggcgata agtacgagag ttggctgagg ccgttggtga acgtgacggg cagggacggc 240
ccgctaagtc agttaataag gtaccggcca gtgaccccgg aggccgccaa cagcgtgctg 300
ctggatgagg ccttcttgga caccctggcc ctgttgtaca acaacccaga ccagctgaga 360
gccctgctga ctctgttgag cagcgacacc gccccaagat ggatgaccgt gatgagaggc 420
tatagcgagt gcggcgatgg cagccctgcc gtgtacacgt gcgtggacga tttgtgtaga 480
ggctacgacc tcaccagact gagctacggc agaagcatct tcactgagca tgtgctggga 540
ttcgagctgg tgcctcctag cctgttcaat gttgtggtgg ctatacgcaa cgaggccaca 600
agaacaaaca gggccgtaag actcccagtg agcaccgctg cagcccctga gggaatcacg 660
ctgttctacg gcctctacaa cgctgtgaag gagttctgtc tgaggcacca actggaccca 720
cctctgctta gacacctgga taagtactac gccggcctcc cacctgaact gaagcagacc 780
agggtgaatc ttcctgcaca ctcaaggtat ggcccacagg ccgtggatgc cagg 834
<210> 182
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 182
atgtgcaggc ggccagactg cggcttcagc ttctcaccgg gcccagtcat cttgttgtgg 60
tgctgcctcc tcctccctat cgtaagctcg gcagccgtca gtgtggcccc aaccgccgcc 120
gagaaggttc cagccgagtg tccagaactc acaaggcggt gcctgctggg cgaggtcttc 180
gagggcgaca agtatgaaag ctggctcagg ccacttgtca atgtgacagg cagagacggc 240
ccactgagcc agcttatccg gtatagacct gtcactcctg aggccgctaa cagcgtgctt 300
ctggacgagg ctttcctgga cactctggct ctgctttaca acaacccaga ccagctgaga 360
gccctgctga ccctgctgag cagcgataca gccccaaggt ggatgacagt tatgagggga 420
tacagcgagt gtggcgacgg aagcccagcc gtgtatacct gcgtggatga cctgtgcaga 480
ggctacgacc tgacccgcct ctcctacgga agatccatct tcaccgagca cgtgctagga 540
ttcgagctcg tccctcctag cctgttcaat gtggtggtgg ccatcagaaa cgaggccact 600
cggaccaata gagcagtgag actgccagtg agcaccgcgg ccgcaccaga gggtatcaca 660
ctgttctacg gcctgtacaa cgccgtgaag gagttctgtc tgcgtcacca gctggaccca 720
cctctgctta gacatctgga taagtactat gccggcctgc ctcctgaact caagcagacc 780
cgtgtgaatc tgcctgccca ctccagatac ggccctcagg ccgtggacgc aagg 834
<210> 183
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 183
atgtgtagac gaccagactg cggcttctct ttctctccag gcccggtgat cttactctgg 60
tgttgtttgc tccttcctat cgttagtagc gccgccgtga gcgtggctcc gacagccgcc 120
gagaaggtgc cagccgagtg cccagagctc accagaagat gtctgctggg cgaggtcttc 180
gaaggcgaca agtacgagtc ttggctgagg cctctcgtga atgttaccgg cagggacggc 240
ccactgagcc agctgattag gtaccggcca gtgaccccgg aagccgccaa cagcgtgctg 300
ctggatgaag ccttcctgga caccctggcc ctgctgtaca acaatcctga ccagctccgg 360
gccctgctga ccctcctcag cagcgacact gcccctcggt ggatgacagt catgagaggc 420
tactccgaat gtggagacgg cagccctgcc gtctacacct gtgtggacga cctctgtagg 480
ggctacgacc tgacaagact gtcctatggc agaagcattt tcaccgagca tgtgcttggc 540
ttcgagctgg tgcctccatc cctgttcaac gtggttgtgg ccattagaaa cgaggccacc 600
agaaccaaca gggccgtgcg gctgccagtg agtacagccg ctgctccaga gggcattacc 660
ctgttctacg gcctttacaa tgccgtgaag gagttctgtc tgcgccatca gctggaccct 720
cctctgctga gacacctgga taagtattac gcgggcctgc ctccagaact gaagcagacc 780
cgcgtcaacc tgccagctca tagccgttac ggcccgcaag cagtggacgc ccga 834
<210> 184
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 184
atgtgccgaa gaccggactg cggcttcagc ttcagcccag gcccggttat cctcctctgg 60
tgctgcctcc ttctcccaat cgtgagcagc gccgccgtga gcgtggcgcc taccgccgcg 120
gagaaggtcc cagccgagtg cccagaattg acgaggagat gcttgctggg cgaagtgttc 180
gagggcgata agtatgagag ctggctgcgg cctctggtca acgtgaccgg ccgcgacggc 240
ccactgtccc agctgatcag gtacagacca gtgaccccag aggctgctaa cagcgtgctg 300
ctggatgagg ctttcctcga cacgctggct ctcctgtaca acaatccgga tcagctcaga 360
gccctgctca cactgctgtc cagcgacacc gctccaaggt ggatgacagt gatgcggggc 420
tactcagagt gcggcgacgg tagccctgcg gtgtatacat gtgtggacga cctgtgcaga 480
ggctacgact taaccaggct gtcctacggt agatccatct tcactgagca cgtgctgggc 540
ttcgagctgg tgccacctag cctgttcaat gtcgtggtag ccatccggaa cgaggctacc 600
agaacaaatc gggccgtgag gctcccagtg agcaccgccg ccgctcctga gggcatcact 660
ctgttctacg gactttacaa cgccgtcaag gagttctgcc tgcggcacca gctcgatcca 720
cctctgctga gacacctgga caagtactac gccggccttc cgcctgagct gaagcagacc 780
agagtcaacc tgcctgccca tagcagatac ggcccacagg ctgtggatgc caga 834
<210> 185
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 185
atgtgccggc ggcccgactg cggcttcagc ttcagccccg gccccgtgat cctattgtgg 60
tgctgcctac ttttgcccat cgtgagcagc gccgccgtga gcgtggctcc taccgccgcc 120
gagaaggtgc ccgccgagtg ccccgagcta acccggcggt gccttcttgg cgaggtgttc 180
gagggcgaca agtacgagag ctggctgcgg cccctggtga acgtgaccgg ccgggacggc 240
cctctgagcc agctgatccg gtaccggccc gtgacaccag aggccgccaa cagcgtgctg 300
ctggacgagg ccttcctgga caccctggcc ctgctgtaca acaaccccga ccagctgaga 360
gctctgctga cgctgctgtc aagcgacacc gcgccacggt ggatgaccgt gatgcggggc 420
tacagcgagt gcggcgacgg cagccccgcc gtgtacacct gcgtggacga cctgtgcagg 480
ggctatgacc tgacccgtct gagctacggc cggagcatct tcaccgagca cgtgctgggc 540
ttcgagctgg tgcctcccag cctgttcaac gtggtggtgg ccatccggaa cgaggccacc 600
cggaccaacc gggccgtgcg gctgcccgtg agcaccgcag cagccccaga aggcatcacc 660
ctgttctacg gcctgtacaa tgccgtgaag gagttctgcc tgcggcacca gctggaccca 720
cctcttctca ggcacctgga taagtactac gccggcctgc ctcctgaact gaagcagacc 780
cgggtgaacc tgcccgccca cagccggtat ggcccacagg ccgtggacgc ccgg 834
<210> 186
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 186
atgtgccggc ggcccgactg cggcttcagc ttcagccccg gccccgtgat cctcctctgg 60
tgctgcctct tgttgcccat cgtgagcagc gccgccgtga gcgtggctcc taccgccgcc 120
gagaaggtgc ccgccgagtg ccccgagctc acccggcggt gccttctggg cgaggtgttc 180
gagggcgaca agtacgagag ctggctgcgg cccctggtga acgtgaccgg ccgggacggc 240
cctctgagcc agctgatccg gtaccggccc gtgactccag aggccgccaa cagcgtgctg 300
ctggacgagg ccttcctgga caccctggcc ctgctgtaca acaaccccga ccagctgagg 360
gcccttctga ccctgctcag cagcgacacc gccccacggt ggatgaccgt gatgcggggc 420
tacagcgagt gcggcgacgg cagccccgcc gtgtacacct gcgtggacga cctgtgcagg 480
ggctacgacc tgaccaggct gagctacggc cggagcatct tcaccgagca cgtgctgggc 540
ttcgagctgg tgccgcccag cctgttcaac gtggtggtgg ccatccggaa cgaggccacc 600
cggaccaacc gggccgtgcg gctgcccgtg tcgacagccg ccgcccctga gggcatcacc 660
ctgttctacg gcctatataa cgccgtgaag gagttctgcc tgcggcacca gctggacccg 720
cccctgcttc gccacctgga caagtattac gccggcctgc ctccggagct gaagcagacc 780
cgggtgaacc tgcccgccca cagccggtac ggccctcagg ccgtggacgc ccgg 834
<210> 187
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 187
atgtgccggc ggcccgactg cggcttcagc ttcagccccg gccccgtgat cctcctttgg 60
tgctgcttgc tcttgcccat cgtgagcagc gccgccgtct ccgtcgctcc taccgccgcc 120
gagaaggtcc ccgccgagtg ccccgagctc acccgccgct gcctcctcgg cgaggtcttc 180
gagggcgaca agtacgagtc ctggctcaga cctctcgtca acgtcaccgg ccgcgacggc 240
ccactctccc agctcatccg ctaccgcccc gtcacaccgg aggccgccaa ctccgtcctc 300
ctcgacgagg ccttcctcga caccctcgcc ctcctctaca acaaccccga ccagctccga 360
gccctgctga ccctgctgtc ctccgacacc gctcctcgct ggatgaccgt catgcgcggc 420
tactccgagt gcggcgacgg ctccccagct gtgtacacct gcgtcgacga cctctgcaga 480
ggctacgacc tgacgcgcct ctcctacggc cgctccatct tcaccgagca cgtcctcggc 540
ttcgagctcg tgcctccctc cctcttcaac gtcgtcgtcg ccatccgcaa cgaggccacc 600
cgcaccaacc gcgccgtccg cctccccgtc agcacagccg ctgcaccaga gggcatcacc 660
ctcttctacg gactgtacaa cgccgtcaag gagttctgcc tccgccacca gctcgaccca 720
cctctgctga ggcatctgga caagtattac gccggcctcc caccagagct gaagcagacc 780
cgcgtcaacc tccccgccca ctcccgctac ggaccacagg ccgtcgacgc ccgc 834
<210> 188
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 188
atgtgccggc ggcccgactg cggcttcagc ttcagccccg gccccgtgat cctcctctgg 60
tgctgccttt tgctccccat cgtgagcagc gccgccgtct ccgtcgctcc taccgccgcc 120
gagaaggtcc ccgccgagtg ccccgagctc acccgccgct gcctcctcgg cgaggtcttc 180
gagggcgaca agtacgagtc ctggctcaga cctctcgtca acgtcaccgg ccgcgacggc 240
ccactctccc agctcatccg ctaccgcccc gtcaccccag aggccgccaa ctccgtcctc 300
ctcgacgagg ccttcctcga caccctcgcc ctcctctaca acaaccccga ccagctcagg 360
gcccttctaa ccctgctgtc ctccgacacc gcccctcgct ggatgaccgt catgcgcggc 420
tactccgagt gcggcgacgg ctccccggcc gtgtacacct gcgtcgacga cctctgcaga 480
ggatacgacc tcacccggct ctcctacggc cgctccatct tcaccgagca cgtcctcggc 540
ttcgagctcg tcccaccctc cctcttcaac gtcgtcgtcg ccatccgcaa cgaggccacc 600
cgcaccaacc gcgccgtccg cctccccgtc agcacagccg cagccccaga gggcatcacc 660
ctcttctacg gcctgtataa cgccgtcaag gagttctgcc tccgccacca gctcgacccg 720
cctctgctga ggcacctgga caagtattac gccggcctcc ctcctgagct gaagcagacc 780
cgcgtcaacc tccccgccca ctcccgctat ggaccacagg ccgtcgacgc ccgc 834
<210> 189
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 189
atggagagca gaatttggtg cttggtggtg tgtgttaacc tctgcattgt ttgcctcggc 60
gcagcagtgt ctagcagctc tactcgggga acatccgcaa cccacagcca ccatagctca 120
cacaccacca gcgccgccca ctccagatcc ggtagcgtga gccagcgggt gactagcagc 180
cagactgtgt cccatggcgt caacgagaca atctacaaca ccaccctgaa gtacggcgac 240
gtcgtgggcg tgaacacaac gaagtaccct tacagggtgt gtagcatggc tcagggcacc 300
gacttgatcc ggttcgagag aaatattgta tgcaccagca tgaagccaat taacgaggat 360
ctggacgaag gcatcatggt agtgtataag agaaacatag ttgcacacac tttcaaggtg 420
agggtctacc agaaggtgct gaccttccgc cgaagctatg cttacatcca tactacctac 480
ctgctcggtt ctaacaccga gtatgtggca cctccaatgt gggagatcca ccacatcaat 540
tctcatagcc agtgttacag ctcttacagc cgggtgatag ccggcaccgt cttcgtggcc 600
taccatagag attcatacga gaacaagacc atgcagctga tgccagacga ctacagcaac 660
acccattcca ccaggtatgt gacagtcaag gaccaatggc actcacgcgg ctccacctgg 720
ctgtacaggg agacttgcaa cctcaattgc atggtgacca tcaccaccgc ccgcagcaag 780
tacccgtacc acttcttcgc caccagcacc ggagatgtcg tggacatcag ccctttctat 840
aacggcacta acagaaacgc cagttacttc ggagagaatg ccgacaagtt cttcatcttc 900
ccgaactaca ctattgtgag cgatttcggt cgccctaact ccgccctgga gacacaccgc 960
ctggttgcct tcctggagag agccgattcc gtgatcagct gggacatcca ggacgagaag 1020
aatgtgacct gtcagctcac tttctgggag gcctccgaga ggactatccg gagcgaggcc 1080
gaggactcat accatttcag cagcgccaag atgaccgcca ccttcctgtc aaagaagcag 1140
gaggtgaaca tgtcagatag cgctctggac tgtgtgcgcg acgaggctat taacaagctg 1200
cagcagatct tcaatacctc ctacaatcag acctacgaga agtatggtaa cgtgtcagta 1260
ttcgagacaa ctggcggcct cgtggtgttc tggcagggaa tcaagcagaa gtccctggtg 1320
gagcttgaaa gactcgccaa ccggagcagc ctgaacctga cccacaacag gacaaagaga 1380
tctacagatg gtaacaacgc cacccatctg agcaacatgg agtccgtgca caacctggtg 1440
tacgcccagc tccagttcac atacgacacc ctgagaggct acattaatag agccctcgcc 1500
caaatcgcag aggcctggtg cgtggaccag aggcgaaccc tggaggtgtt caaggaattg 1560
agcaagatca atccaagcgc catcttgagc gcaatctata acaagccgat tgcggccaga 1620
ttcatgggcg acgtgttggg cctggcctcc tgcgtcacta tcaaccagac ctctgtcaag 1680
gtgctcagag atatgaacgt taaggagtcc ccaggcagat gctatagcag acctgtcgtg 1740
attttcaatt tcgccaactc aagctacgtg cagtacggcc agctcggcga agataacgag 1800
atcctgctgg gcaaccacag aaccgaagag tgccagctgc cttccctgaa gattttcatc 1860
gctggcaact ccgcttacga gtacgtggat tacctgttca agagaatgat cgacctcagc 1920
agcatcagca ccgtggacag catgatcgcc ttagacattg accctctgga gaacacagat 1980
ttcagggtgc tggaactata ctctcagaag gagctccggt ctagcaacgt gttcgatctg 2040
gaggagatca tgcgggagtt caattcctac aagcagcacc accaccatca tcac 2094
<210> 190
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 190
atggagtcaa gaatctggtg tcttgtggtg tgcgtgaact tgtgtatcgt gtgtttgggc 60
gcagccgtgt cctcaagcag cactagaggc actagcgcca cccactccca tcatagctca 120
cacaccacaa gcgccgccca ctctaggtca ggcagcgtgt ctcagcgcgt gacctctagc 180
cagactgtga gtcacggagt caatgaaacc atctacaaca caacactgaa gtacggagac 240
gtcgtgggcg tgaatacaac caagtaccca tacagggtgt gcagcatggc tcagggcact 300
gacctcatca gattcgagcg gaacattgtg tgcacctcaa tgaagcctat caacgaggat 360
ttggatgaag gcatcatggt cgtgtacaag agaaacatcg tcgctcatac cttcaaggtg 420
agagtgtatc agaaggtgct gaccttcaga cgtagctacg cttacattca caccacctac 480
ctgctgggca gcaacaccga gtatgtggct cctcctatgt gggagataca tcacatcaac 540
agccattctc agtgctatag ttcttatagc agggtcatcg ccggcaccgt cttcgtggcc 600
taccatagag atagctacga gaacaagacc atgcagttga tgccggacga ttacagcaat 660
acccatagca ctaggtacgt gactgtgaag gaccagtggc actcccgggg tagcacctgg 720
ctttacaggg aaacctgcaa tctgaactgc atggtgacta ttaccaccgc caggagcaag 780
tatccttacc acttcttcgc tacatctact ggagacgtgg tcgatatctc tcctttctac 840
aatggcacaa acagaaatgc ttcatatttc ggcgagaatg ccgacaagtt cttcatcttc 900
ccaaactaca ccattgtgtc cgacttcgga agacctaatt ccgccctgga aacccataga 960
ctggtcgcat tcctggaaag ggccgactcc gtcatttcat gggacatcca ggatgagaag 1020
aacgtcacct gtcagctcac attctgggaa gcgagcgaaa gaacaattcg cagcgaagcc 1080
gaggacagct atcatttcag cagtgctaag atgaccgcca ctttcctgtc taagaagcag 1140
gaggtgaaca tgtccgacag cgccttggat tgcgtgagag acgaagctat taacaagctg 1200
cagcagatct tcaacacctc ctacaaccag acttacgaga agtatggcaa tgtgagtgtg 1260
ttcgagacaa ccggcggcct ggtagtattc tggcagggca tcaagcagaa gtcactggtg 1320
gagcttgaga ggctggccaa tagatccagc ctgaacctga cccacaaccg gacaaagaga 1380
tctaccgacg gaaacaacgc cactcatctt tccaatatgg agagcgtgca caacctggtg 1440
tacgcgcagc tccagttcac ctacgacaca ctgaggggct acataaacag ggccctggca 1500
cagatcgccg aagcctggtg cgtggaccag agaaggaccc tggaggtttt caaggagctg 1560
agcaagatta atccgtccgc tatcctgagc gcaatataca ataagccaat cgccgccaga 1620
ttcatgggcg acgtgttggg actggccagt tgcgtcacaa taaaccagac ctctgtaaag 1680
gtcctgaggg acatgaatgt caaggagagc ccgggcaggt gctacagccg tcctgtggtg 1740
attttcaact tcgctaattc atcttacgtc cagtacggcc agctgggcga agacaatgag 1800
atcttactgg gcaaccatag gactgaggag tgccagctgc cgagtctgaa gattttcata 1860
gccggcaata gcgcatatga atatgtagac tacctgttca agaggatgat tgacctctct 1920
agcatctcga ccgtggacag catgatcgcc ctcgacatcg accctctgga gaacacagac 1980
ttccgggtcc tcgaactgta cagccagaag gagcttagga gctccaacgt gttcgatctt 2040
gaggagatca tgagggagtt caatagctat aagcaacatc accaccatca tcac 2094
<210> 191
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 191
atggagagca gaatttggtg tctcgtggtg tgtgttaatc tctgcatcgt gtgccttggc 60
gccgccgtgt ccagcagctc caccaggggc accagcgcaa cacacagcca ccactctagc 120
cacacaacca gcgccgccca ctctcgttca ggctccgttt cacagagggt gacctcctct 180
caaaccgtgt ctcatggagt gaatgaaacc atttataaca caacactgaa gtatggcgac 240
gtggtgggcg tcaacaccac caagtatcct taccgggttt gttcaatggc ccagggcacc 300
gatctcatca gattcgagcg aaatatcgtg tgtacatcca tgaagcctat caacgaagac 360
ctggacgagg gaattatggt cgtgtacaag agaaatattg tggcccacac tttcaaggtg 420
agagtgtacc agaaggtgtt gacattcagg cggtcctacg cctacatcca caccacttat 480
ctgttgggat ccaacacaga gtacgtcgca ccgcctatgt gggaaataca tcacatcaat 540
tcccattctc agtgctattc tagctactcc agagtgatcg ccggcaccgt gttcgtggcc 600
taccaccgcg atagctacga gaataagacc atgcagctga tgcctgacga ttacagcaac 660
actcattcca cacgctacgt gaccgtgaag gatcagtggc acagccgcgg cagcacctgg 720
ctgtaccggg aaacctgcaa cctgaactgc atggtgacaa taacaaccgc acgtagcaag 780
tacccatacc acttcttcgc cacctccacc ggtgacgtgg tcgacatcag ccctttctac 840
aatggcacca acagaaatgc ctcctacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cctaattata caattgtgag cgacttcggc aggcctaaca gcgccctgga gactcatcgc 960
ttggtggctt tcctggaacg cgctgacagc gtcatctctt gggatatcca agatgagaag 1020
aacgtgacct gccagctgac cttctgggag gccagcgaga ggacaatcag aagcgaagcc 1080
gaggactctt accatttcag ttcagctaag atgaccgcca ccttcctgag caagaagcag 1140
gaagtgaata tgtccgattc cgctcttgac tgcgtcaggg acgaagccat caacaagctc 1200
cagcagattt tcaatacttc ttataatcag acctatgaga agtacggcaa tgtcagcgtc 1260
ttcgagacga ccggcggcct ggttgtgttc tggcaaggaa tcaagcagaa gtcactggtg 1320
gagcttgagc ggctggccaa cagatccagc ttgaacctga cccataatcg caccaagcgg 1380
agtaccgatg gcaacaacgc cacacacctc agcaatatgg aaagcgtgca caaccttgtg 1440
tacgctcagc tgcagttcac ctacgatacc cttagaggct acatcaacag agccctggcc 1500
cagatcgcag aggcatggtg cgtggaccag cggcggaccc tggaggtgtt caaggagctc 1560
tccaagatca acccatccgc cattctctcc gccatctaca acaagcctat tgccgctcgg 1620
ttcatgggcg atgtgctggg actggccagc tgcgtgacca tcaaccaaac ctcagtgaag 1680
gtgctcagag acatgaacgt caaggagtct ccaggcagat gttacagcag acctgtggtg 1740
atcttcaact tcgccaattc ttcctacgtg cagtacggcc aactgggtga agacaacgag 1800
attctgttag gcaaccacag gactgaggag tgtcagctgc cgagcctgaa gatcttcatc 1860
gctggaaaca gcgcatacga gtacgtggac tacctcttca agaggatgat cgacttgtca 1920
tctatctcca cggttgattc catgatcgcc ttggacatcg atcctctgga gaataccgac 1980
ttcagagtgc tggagctcta cagccagaag gagcttaggt ctagcaatgt gttcgacctg 2040
gaggagatca tgagggagtt caatagctat aagcagcatc accaccacca tcac 2094
<210> 192
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 192
atggagagca gaatctggtg cctcgtggtg tgcgtgaacc tctgtatcgt ctgcttagga 60
gccgccgtga gcagtagctc taccagaggc acatccgcca cccacagcca ccactcttca 120
cacaccacca gcgccgccca ctccagatca ggcagcgtat cccagagagt gaccagcagc 180
cagaccgtgt cacatggagt gaatgaaaca atttacaaca ccaccctcaa gtacggcgac 240
gtagtgggag tgaacactac taagtaccca taccgcgtgt gtagcatggc ccagggcacc 300
gatctgatcc gattcgagag aaacatcgtt tgcaccagca tgaagcctat caacgaggac 360
ctggatgagg gcatcatggt ggtgtacaag aggaacatcg tggcccacac gttcaaggtt 420
agggtgtacc agaaggtgct gactttccga agaagctatg cctacattca cactacatac 480
ctgctcggca gtaacaccga gtacgtggcg ccaccgatgt gggaaataca ccatattaat 540
tctcatagtc agtgctattc cagctacagc agggtgatcg ccggaaccgt tttcgtggct 600
tatcatagag attcctacga gaacaagacc atgcagctga tgccagacga ctatagcaac 660
acgcatagca cccgctacgt gaccgtgaag gaccagtggc attcaagagg atccacctgg 720
ctctacagag agacatgcaa tctgaactgc atggtgacca tcaccaccgc ccggtccaag 780
tacccttatc acttcttcgc cacaagcacc ggcgatgtgg tggacatttc cccattctac 840
aacggaacca accggaacgc ctcttacttc ggcgagaacg ccgacaagtt cttcatcttc 900
ccaaattata ccatcgtgag cgacttcgga agacctaaca gcgccctgga gacacacaga 960
ctggtggcct tcctcgagcg cgccgactcc gtgatctcct gggacatcca ggacgagaag 1020
aacgtgactt gtcagctgac attctgggag gccagcgaac ggaccatcag aagcgaggct 1080
gaagactcct accacttcag ctccgccaag atgaccgcca ctttcctgtc aaagaagcag 1140
gaggtgaaca tgagcgacag cgccttggat tgcgtgagag atgaggccat caacaagctt 1200
caacagatct tcaacacatc ctacaaccag acgtacgaga agtacggaaa cgtgagcgtg 1260
ttcgaaacca ccggcggctt agtggtgttc tggcagggaa tcaagcagaa gtctctggtg 1320
gagctggaga gactggctaa cagatcctct ctaaacctga cacacaacag aaccaagcgg 1380
agcacagacg gcaataatgc cacacacctg agcaacatgg aaagcgtcca caacctcgtc 1440
tatgcccaac tgcagttcac ctacgacacc ctccgaggct acatcaacag agccctggcc 1500
cagatcgccg aggcttggtg tgtggatcag agacggaccc tggaggtgtt caaggagttg 1560
agcaagatca acccgtccgc catcttgagc gctatataca acaagccaat tgctgcgcgg 1620
ttcatgggcg acgtgctggg cctcgcctca tgtgtgacca ttaatcaaac aagcgtcaag 1680
gtcctgaggg atatgaacgt taaggagagc ccaggcaggt gctatagcag acctgtggtg 1740
attttcaact tcgccaacag cagctacgtg cagtacggcc agctgggcga ggacaacgag 1800
atcctgctgg gcaaccaccg cactgaggag tgccagctgc caagtctgaa gatattcatc 1860
gcgggaaatt cagcttacga gtatgtagac tacctgttca agagaatgat agatcttagc 1920
agcatctcca ctgtggacag tatgatagct cttgatattg acccactgga gaataccgac 1980
ttcagagtgt tggagctgta cagtcagaag gagctcagga gctccaatgt gttcgacctg 2040
gaggagatca tgagggaatt caatagctac aagcagcacc accaccatca tcac 2094
<210> 193
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 193
atggaatccc gaatctggtg cctcgttgtg tgcgtgaatt tgtgcatcgt gtgtttgggc 60
gccgccgtct cttcttcctc cacacgtggt accagcgcaa cacactccca ccactcaagc 120
cacaccacgt ccgcggcaca cagcagaagc ggcagtgtga gccaaagggt gaccagcagc 180
cagaccgtga gtcacggcgt gaacgagaca atctacaata ccacactcaa gtacggcgat 240
gtggtgggcg tcaacaccac caagtatcct tacagagtct gttccatggc ccagggcact 300
gacctgatcc ggttcgaaag aaacatagtg tgcacctcca tgaagcctat caatgaggac 360
ctcgatgaag gcattatggt ggtgtacaag aggaatattg tggcccatac cttcaaggtg 420
agagtgtacc agaaggtgct gaccttcaga cggagctacg cctacatcca tacaacctac 480
ctgctgggaa gcaacaccga gtacgtggct cctccaatgt gggagatcca ccacatcaat 540
agccacagcc agtgctactc cagctacagc agagtgattg ctggcaccgt cttcgtggct 600
taccacagag acagctatga gaacaagaca atgcagctca tgccagacga ctactctaac 660
acacattcaa cccggtatgt gaccgtgaag gaccagtggc actcaagagg cagcacatgg 720
ctctaccgag agacatgtaa cctgaactgc atggttacaa tcaccactgc aaggtctaag 780
tacccatatc acttcttcgc cacctctacc ggagacgtgg tggacatcag cccattctac 840
aatggcacca atcggaacgc aagctacttc ggagagaacg ccgacaagtt cttcatcttc 900
ccgaactaca ccatcgtgtc cgatttcggc aggccaaaca gcgccctgga gacacaccgg 960
ctggtggcct tcctggagcg cgctgactcc gttatctctt gggacatcca ggatgagaag 1020
aatgtgacct gccaactgac attctgggag gcatccgagc ggactatcag aagcgaggcc 1080
gaggacagct accacttcag cagcgctaag atgactgcta ccttcctgtc caagaagcag 1140
gaggtgaaca tgtctgattc cgctctggac tgcgtgaggg acgaggctat caacaagctc 1200
cagcagatat tcaatacttc ctacaaccag acctacgaga agtacggtaa cgtcagcgtt 1260
ttcgaaacca ccggcggcct ggtcgtgttc tggcagggaa tcaagcagaa gtcccttgtc 1320
gagctcgaga gactggccaa ccggtctagc ctcaatctga cacacaatag gaccaagaga 1380
tctactgacg gcaataacgc cacacacctc tccaacatgg agagtgttca taacctggtt 1440
tacgcccagc tgcagttcac ttacgatacc ctccgcggct acatcaacag ggccctggcg 1500
cagatcgccg aggcctggtg cgtggatcaa agaaggaccc tggaggtctt caaggaactc 1560
agcaagatca acccatctgc tatcctgagc gccatctaca acaagccaat cgccgcccgg 1620
ttcatgggcg acgtcctggg cttggctagc tgcgtgacca tcaatcagac cagcgtcaag 1680
gtgcttcgcg acatgaacgt caaggagtca cctggccgct gttactcaag gccagtcgtg 1740
atcttcaatt tcgccaatag ctcctacgtg cagtacggac agttgggcga ggacaatgaa 1800
atactcctgg gcaaccaccg caccgaggag tgtcagctgc caagcctgaa gatcttcatc 1860
gcgggaaact ccgcttacga gtatgtggac tacctgttca agagaatgat tgatctgagc 1920
agcatctcca ccgtggacag catgattgct ctggatattg atcctctgga gaacaccgat 1980
ttccgcgtgc tggagctgta cagccagaag gaattaagga gcagtaatgt gttcgacctg 2040
gaggagatca tgagggagtt caacagttac aagcagcacc accatcacca ccac 2094
<210> 194
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 194
atggagtcca gaatctggtg cttggtggtg tgcgtgaatc tttgcattgt gtgcctcggc 60
gccgccgtga gcagcagcag tactagaggt acctccgcta cccacagcca ccactcttcc 120
catacaacca gcgccgccca ctcacgtagc ggctctgtga gccagagggt gacaagctca 180
cagaccgtga gccacggcgt gaacgagact atctacaaca ctaccctgaa gtacggcgat 240
gtggtgggag tgaataccac aaagtacccg tacagggtgt gttccatggc ccagggcacc 300
gacctgattc gcttcgaaag aaacatcgtc tgcaccagca tgaagcctat caacgaggat 360
ttggatgagg gtattatggt ggtctacaag agaaatattg tggcccacac cttcaaggtc 420
agagtgtacc agaaggtcct gacgttcagg agatcttacg cttacatcca caccacctac 480
cttctgggct ccaacaccga gtatgtggcc ccgcctatgt gggagatcca ccacattaat 540
tcccactctc aatgctacag ctcctattcc agagtgatcg ccggcacagt cttcgtggcc 600
taccaccggg acagctatga gaacaagact atgcagctca tgccagacga ctatagcaat 660
actcatagca ctagatatgt gactgtgaag gaccagtggc atagcagagg cagcacttgg 720
ctgtaccggg aaacatgcaa tcttaattgc atggtcacca taaccaccgc gagatccaag 780
tacccttacc acttcttcgc cacctccact ggtgacgtcg tggacatctc ccctttctat 840
aacggaacaa atagaaacgc cagctacttc ggtgagaacg ccgacaagtt cttcatcttc 900
cctaactaca ccatagtgag cgatttcggc agaccgaact ccgctctgga gacacaccgg 960
ctggtggcct tcctggaacg ggccgatagt gttatctctt gggatattca agacgagaag 1020
aacgtcacct gtcagctgac tttctgggaa gccagcgaga ggaccatcag aagtgaagct 1080
gaggatagct accatttctc tagtgccaag atgactgcca ccttcctgtc caagaagcag 1140
gaggtcaaca tgtccgacag cgccctcgac tgtgtgagag acgaggctat taacaagctg 1200
cagcagattt tcaacactag ctacaatcag acatacgaga agtatggaaa cgtgagcgtg 1260
ttcgaaacta ccggtggcct ggtggtattc tggcagggca tcaagcagaa gtccctggtg 1320
gaattggaga gactggctaa caggtcgtcc ctgaacctga ctcacaatag aacgaagagg 1380
agcacagacg gcaataatgc cacccatctg tccaatatgg agagtgtgca caatttggtg 1440
tatgcccagc tgcagttcac ctacgacacc ctcaggggct acatcaacag agccctcgcc 1500
cagatcgctg aagcctggtg cgtggatcag aggaggaccc tggaggtctt caaggaactg 1560
agcaagataa acccatccgc catcctcagt gccatttata acaagcctat tgccgccagg 1620
ttcatgggcg acgtgctggg cctggcttcc tgtgtcacga ttaatcagac ctccgtgaag 1680
gtgctgaggg acatgaacgt gaaggaaagc cctggacggt gttacagccg accagtagtg 1740
atcttcaact tcgccaactc ctcatacgtg cagtatggcc agctgggcga ggacaatgaa 1800
attctgctgg gcaaccacag gaccgaagag tgccagctgc ctagcctgaa gatattcatc 1860
gccggtaata gcgcctacga gtacgtcgac tatcttttca agagaatgat cgatctgtct 1920
agcatttcta ccgtggattc catgatcgct cttgacattg acccactgga gaacacagac 1980
ttcagggtgc tcgagctgta ttcccagaag gaactcaggt ctagcaacgt tttcgacctc 2040
gaggaaatta tgagagagtt caactcgtac aagcaacacc atcaccacca tcac 2094
<210> 195
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 195
atggagagcc ggatctggtg cctcgtggtg tgcgtgaact tatgcatcgt gtgcctcggc 60
gccgccgtga gctctagctc tacccggggc accagcgcca cccacagcca ccacagcagc 120
cacaccacct cggccgctca cagccggagc ggcagcgtga gccagcgggt gacctccagc 180
cagaccgtgt cccacggcgt gaacgagacg atctacaaca ccaccctgaa gtacggcgac 240
gtggtgggag tgaacacgac caagtacccc taccgggtgt gcagcatggc ccagggcacc 300
gacctgatcc ggttcgagcg gaacattgtg tgcaccagca tgaagcccat caacgaggac 360
ctggacgagg gcatcatggt agtgtacaag agaaacatcg tggcccacac cttcaaggtg 420
cgggtgtacc agaaggtgct gaccttccgg cggagctacg cctacattca cacaacatac 480
ctgctgggca gcaacaccga gtacgtggct cctcccatgt gggagatcca ccacatcaac 540
tctcatagcc agtgctacag cagctacagc cgggtgatcg ccggcaccgt gttcgtggcc 600
taccaccggg acagctacga gaacaagacc atgcagctga tgcccgacga ctatagcaac 660
acacactcca ctcggtacgt gaccgtgaag gaccagtggc acagcagagg cagcacctgg 720
ctgtaccggg agacttgcaa cctgaactgc atggtgacca tcaccaccgc ccggtctaag 780
tacccttacc acttcttcgc caccagcacc ggcgatgtgg tggacatcag ccccttctac 840
aacggcacca accggaacgc cagctacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtgag cgacttcggc cggcccaaca gcgccctgga aactcaccgg 960
ctggtggcct tcctggagcg ggccgacagc gtgatcagct gggacatcca ggacgagaag 1020
aacgtgacct gccagctgac attctgggag gccagcgagc ggaccatccg gagcgaggcc 1080
gaggatagct atcacttcag cagcgccaag atgaccgcca ccttcctgag caagaagcag 1140
gaggtgaaca tgagcgattc tgcactggac tgcgtgcggg acgaggccat caacaagctg 1200
cagcagatct tcaacaccag ctacaaccag acctacgaga agtacggaaa cgtgagcgtg 1260
ttcgagacta ccggcggcct tgtcgtgttc tggcagggaa tcaagcagaa gtccctggtc 1320
gagctcgagc gactggccaa cagaagcagc ctgaacctga cccacaaccg gaccaagcgg 1380
agcaccgacg gcaacaacgc cacacacctg tctaacatgg agtctgtgca caacctggtg 1440
tacgcccagc tgcagttcac ctacgacacc ctgcggggct acatcaaccg ggccctggcc 1500
cagatcgccg aggcatggtg cgtggaccag cggcggaccc tggaggtgtt caaggagctc 1560
tctaagatca acccgtctgc catcctgagc gccatttaca acaagcctat cgccgcaaga 1620
ttcatgggcg acgtcctggg cctggccagc tgcgtgacga tcaatcagac cagcgtgaag 1680
gtcctgcggg acatgaacgt caaggagagc cccggcaggt gctatagccg gcccgtggtg 1740
attttcaact tcgccaatag ctcttacgtg cagtacggtc agttaggcga ggacaacgag 1800
atcttactgg gcaaccaccg gaccgaggag tgccaactcc cgagcctcaa gattttcatt 1860
gccggcaata gcgcatacga atatgtggac tacctgttca agcggatgat cgacctgagc 1920
agcatcagca ccgtggacag catgattgct ctggacatcg accctctgga gaacaccgac 1980
ttccgggtgc tggagctgta cagccagaag gagctgcgga gctctaatgt gttcgacctg 2040
gaggagatca tgcgggagtt caactcatat aagcagcacc accaccatca tcac 2094
<210> 196
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 196
atggagagcc ggatctggtg cctcgtggtg tgcgtgaacc tttgcatcgt gtgcttgggc 60
gccgccgtga gcagcagctc cacccggggc acctccgcca cccactccca ccactcctcc 120
cacaccacct cagccgccca ctctcgctcc ggctccgtct cccagcgcgt cacctccagc 180
cagaccgtta gccacggcgt caacgaaacc atctacaaca ccaccctcaa gtacggcgac 240
gtcgtcggcg taaacacaac caagtacccc taccgcgtct gctccatggc ccagggcacc 300
gacctcatcc gcttcgagcg caacatcgtc tgcacctcca tgaagcccat caacgaggac 360
ctcgacgagg gcatcatggt cgtctacaag cgcaatattg tggcccacac cttcaaggtc 420
cgcgtctacc agaaggtcct caccttccgc cgctcctacg cctacatcca cacaacctac 480
ctcctcggct ccaacaccga gtacgtcgcc cctcccatgt gggagatcca ccacatcaac 540
agccacagcc agtgctactc ctcctactcc cgcgtcatcg ccggcaccgt cttcgtcgcc 600
taccaccgcg actcctacga gaacaagacc atgcagctca tgcccgacga ctacagcaat 660
acccacagca cccgctacgt caccgtcaag gaccagtggc acagcagagg ctccacctgg 720
ctctaccgcg agacatgcaa cctcaactgc atggtcacca tcaccaccgc ccgctccaag 780
tatccttacc acttcttcgc cacctccacc ggcgatgtcg tggacatctc accattctac 840
aacggcacca accgcaacgc cagttacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtctc cgacttcggc cgccccaact ccgccctcga gacacacaga 960
ctggtggcct tcctcgagcg cgccgactcc gtcatctcct gggacatcca ggacgagaag 1020
aacgtcacct gccagctcac attctgggag gcctccgagc gcaccatccg ctccgaggcc 1080
gaggactcat accatttctc cagcgccaag atgaccgcca ccttcctctc caagaagcag 1140
gaggtcaaca tgagcgacag cgctctcgac tgcgtccgcg acgaggccat caacaagctc 1200
cagcagatct tcaacacctc ctacaaccag acgtacgaga agtatggaaa cgtcagtgtc 1260
ttcgaaacca cgggcggcct ggttgtattc tggcagggaa taaagcagaa gtccctcgtc 1320
gagcttgagc gcctcgccaa ccgctcctcc ctcaacctca cccacaaccg caccaagcgc 1380
tccaccgacg gcaacaacgc tacccacctg tccaacatgg agtccgtcca caacctcgtc 1440
tacgcccagc tccagttcac ctacgacacc ctccgcggct acatcaaccg cgccctcgcc 1500
cagatcgccg aggcctggtg cgtcgaccag cgccgcaccc tcgaggtctt caaggagctg 1560
agtaagatca accctagcgc gatcctcagc gctatctata acaagccaat cgctgctagg 1620
ttcatgggag acgtgctcgg cctcgcctcc tgcgtgacca tcaatcagac atccgtgaag 1680
gtgctgcgcg acatgaatgt caaggagagc ccaggccgct gttattcccg gcccgtcgtc 1740
attttcaatt tcgccaatag ctcttacgtc cagtacggcc agctcggcga ggacaacgag 1800
atcctgctgg gcaaccaccg caccgaggag tgccagctgc ctagcctcaa gattttcatt 1860
gccggcaatt ccgcttacga atacgtggac tacctcttca agcgcatgat cgacctctcc 1920
tccatctcca ccgtcgactc catgatcgcc ctggatatcg accctctcga gaacaccgac 1980
ttccgcgtgt tggagctcta ctcccagaag gagctcagat ccagcaacgt attcgacctc 2040
gaggagatca tgcgcgagtt caactcctat aagcagcacc accaccatca tcac 2094
<210> 197
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 197
atggagagcc ggatctggtg cttggtggtg tgcgtgaact tgtgcatcgt gtgcttgggc 60
gccgccgtga gcagctctag cacccggggc accagcgcca cccacagcca ccacagcagc 120
cacacgacct ccgccgccca ctcacggagc ggcagcgtga gccagcgggt gaccagctca 180
cagaccgtgt cccacggcgt gaacgagacg atctacaaca ccaccctgaa gtacggcgac 240
gtggtgggcg tcaacactac caagtacccc taccgggtgt gcagcatggc ccagggcacc 300
gacctgatcc ggttcgagcg gaatattgtg tgtaccagca tgaagcccat caacgaggac 360
ctggacgagg gcatcatggt ggtctacaag agaaacattg tggcccacac cttcaaggtg 420
cgggtgtacc agaaggtgct gaccttccgg cggagctacg cctacatcca tacaacctac 480
ctgctgggca gcaacaccga gtacgtggcg cctcccatgt gggagatcca ccacatcaac 540
tctcactcgc agtgctacag cagctacagc cgggtgatcg ccggcaccgt gttcgtggcc 600
taccaccggg acagctacga gaacaagacc atgcagctga tgcccgacga ctattctaac 660
acccactcca ccagatacgt gaccgtgaag gaccagtggc acagcagggg cagcacctgg 720
ctgtaccggg agacttgcaa cctgaactgc atggtgacca tcaccaccgc ccggagtaag 780
tatccatatc acttcttcgc caccagcacg ggcgacgttg tggacatcag ccccttctac 840
aacggcacca accggaacgc cagctacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtgag cgacttcggc cggcccaaca gcgccctgga aacccaccgg 960
ctggtggcct tcctggagcg ggccgacagc gtgatcagct gggacatcca ggacgagaag 1020
aacgtgacct gccagctgac tttctgggag gccagcgagc ggaccatccg gagcgaggcc 1080
gaagactcct accacttcag cagcgccaag atgaccgcca ccttcctgag caagaagcag 1140
gaggtgaaca tgagcgattc agctctggac tgcgtgcggg acgaggccat caacaagctg 1200
cagcagatct tcaacaccag ctacaaccag acttacgaga agtatggaaa cgtgagcgtg 1260
ttcgagacaa ccggcggcct cgtggtgttc tggcagggta tcaagcagaa gtctctcgtg 1320
gagctggaga gactggccaa cagaagcagc ctgaacctga cccacaaccg gaccaagcgg 1380
agcaccgacg gcaacaacgc tacccatctg tctaacatgg agtcagtgca caacctggtg 1440
tacgcccagc tgcagttcac ctacgacacc ctgcggggct acatcaaccg ggccctggcc 1500
cagatcgccg aggcctggtg cgtggaccag cggcggaccc tggaggtgtt caaggagctg 1560
tccaagatca acccttccgc catcctgagc gccatttata ataagccgat cgccgcccgg 1620
ttcatgggcg atgttctggg cctggccagc tgcgtcacca ttaatcagac cagcgttaag 1680
gtcctgcggg acatgaatgt caaggagagc cccggcaggt gctactcccg ccccgtggtg 1740
atattcaact tcgccaactc tagctacgtg cagtacggcc aactaggcga ggacaacgag 1800
atcttgctcg gtaaccaccg gaccgaggag tgccagttac cttccctgaa gattttcatc 1860
gcgggcaact ccgcctacga gtatgtggac tacctgttca agcggatgat cgatctttct 1920
agcatcagca ccgtggacag catgatagcc ctggacatcg acccactgga gaacaccgac 1980
ttccgggtgc tggagctgta cagccagaag gagcttcgga gcagcaatgt gttcgacctg 2040
gaggagatca tgcgggagtt caattcttac aagcagcacc accaccatca tcac 2094
<210> 198
<211> 2094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 198
atggagagcc ggatctggtg cctcgtggtg tgcgtgaacc tctgcatcgt gtgcctcggc 60
gccgccgtgt cttcatcctc cacccggggc acctccgcca cccactccca ccactcctcc 120
cacaccacta gtgccgccca ctcacgctcc ggctccgtct cccagcgcgt cacctcatcc 180
cagacagtga gccacggcgt caacgaaacc atctacaaca ccaccctcaa gtacggcgac 240
gtcgtgggcg tgaacactac aaagtacccc taccgcgtct gctccatggc ccagggcacc 300
gacctgatcc gcttcgagcg caacatcgtc tgcacctcca tgaagcccat caacgaggac 360
ctcgacgagg gcatcatggt cgtctacaag aggaacattg tggcccacac cttcaaggtc 420
cgcgtctacc agaaggtcct caccttccgc cgctcctacg cctacatcca cactacgtac 480
ctcctcggct ccaacaccga gtacgtcgcc cctcccatgt gggagatcca ccacatcaac 540
tcgcacagcc agtgctactc ctcctactcc cgcgtcatcg ccggcaccgt cttcgtcgcc 600
taccaccgcg actcctacga gaacaagacc atgcagctca tgcccgacga ctatagcaac 660
acacatagca cccgctacgt caccgtcaag gaccagtggc atagcagagg ctccacctgg 720
ctctaccgcg agacgtgcaa cctcaactgc atggtcacca tcaccaccgc ccgcagcaag 780
tatccatatc acttcttcgc cacctccaca ggagacgtgg tcgacatctc gcctttctac 840
aacggcacca accgcaacgc tagctacttc ggcgagaacg ccgacaagtt cttcatcttc 900
cccaactaca ccatcgtctc cgacttcggc cgccccaact ccgccctcga gactcaccgc 960
ttggtggcct tcctcgagcg cgccgactcc gtcatctcct gggacatcca ggacgagaag 1020
aacgtcacct gccagctgac cttctgggag gcctccgagc gcaccatccg ctccgaggcc 1080
gaggacagct accacttcag cagcgccaag atgaccgcca ccttcctctc caagaagcag 1140
gaggtcaaca tgagcgacag cgcccttgac tgcgtccgcg acgaggccat caacaagctc 1200
cagcagatct tcaacacctc ctacaaccag acttatgaga agtacggaaa cgtctccgtt 1260
ttcgagacaa caggaggcct ggttgtcttc tggcagggca ttaagcagaa gtccctcgtc 1320
gagctggaga gactcgccaa ccgctcctcc ctcaacctca cccacaaccg caccaagcgc 1380
tccaccgacg gcaacaatgc tacacacctg agcaacatgg agtccgtcca caacctcgtc 1440
tacgcccagc tccagttcac ctacgacacc ctccgcggct acatcaaccg cgccctcgcc 1500
cagatcgccg aggcgtggtg cgtcgaccag cgccgcaccc tcgaggtctt caaggagctg 1560
tccaagatca accctagcgc catcctgtcc gcaatctata acaagcctat cgcggctagg 1620
ttcatgggcg atgtgctcgg cctcgcctcc tgcgtgacta ttaatcagac cagcgtcaag 1680
gtgctgcgcg acatgaacgt gaaggagagc cctggccgct gctattccag gcccgtcgtc 1740
atcttcaatt tcgccaattc cagctatgtc cagtacggcc agctcggcga ggacaacgag 1800
atcctgcttg gcaaccaccg caccgaggag tgtcagctcc ctagcctgaa gattttcatt 1860
gccggcaata gcgcttatga gtatgtggac tacctcttca agcgcatgat cgacctctcc 1920
tccatctcca ccgtcgactc catgatcgcc ctggacatcg acccactgga gaacaccgac 1980
ttccgcgtgc tcgaactcta ctcccagaag gaactgagat caagcaacgt gttcgacctc 2040
gaggagatca tgcgcgagtt caactcttat aagcagcacc accaccatca tcac 2094
<210> 199
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 199
atgctcagac ttctcctcag acaccacttc cactgcctct tgctttgtgc cgtctgggcc 60
acaccttgcc tcgccagccc ttggagcacc ttgacagcca accagaaccc ttcccctcct 120
tggtcaaagt tgacctacag caagcctcac gacgctgcta ccttctactg tccattcctg 180
taccctagcc ctccaagatc tccgctgcag ttcagcggct tccagagggt gtctaccgga 240
cctgagtgca ggaatgagac gctgtacctg ctgtacaaca gagagggcca gaccctggtg 300
gaaagaagct ccacctgggt caagaaggta atctggtacc tgagcggcag aaaccagaca 360
atactccaga gaatgccacg gaccgctagc aagcctagcg atggaaacgt gcagattagc 420
gtggaggacg caaagatttt cggcgcccac atggtgccaa agcagacaaa gctgctgcgg 480
ttcgtggtca acgacggcac ccggtaccag atgtgcgtga tgaagctgga gagctgggct 540
cacgtgttca gagattactc tgtgagcttc caagtgcggc tcaccttcac cgaagccaac 600
aatcagacct acactttctg tactcaccct aacctgatcg tg 642
<210> 200
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 200
atgcttagac tcctcctcag acaccacttc cattgtctcc ttttgtgcgc cgtgtgggcc 60
accccttgcc ttgcatcacc ttggtctacc ctcaccgcca accagaaccc tagccctcct 120
tggagtaagt taacatactc taagccgcac gacgccgcca ccttctactg tcctttcctc 180
tacccaagcc cacctcgtag cccacttcag ttctctggat tccagagagt ttcaacaggc 240
cctgagtgtc ggaacgagac tctgtacctg ttgtataaca gagagggaca gaccctggtg 300
gagcggtcct ccacctgggt gaagaaggtg atctggtatc tgagcggcag aaaccagacc 360
atcctgcagc ggatgccaag gaccgctagc aagccaagcg acggcaatgt gcagattagc 420
gtggaggatg ctaagatttt cggcgcacac atggttccta agcagaccaa gctgttacgg 480
ttcgtggtga acgatggaac tcggtaccaa atgtgcgtga tgaagctgga gtcatgggca 540
catgtgttcc gtgactactc tgtttctttc caggtgcgcc tgaccttcac cgaggccaat 600
aaccagacat acaccttctg tacgcaccca aatctgatcg ta 642
<210> 201
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 201
atgctcagac ttttgctcag acaccacttc cactgtttgt tgttatgtgc cgtgtgggct 60
accccttgcc tcgcatctcc gtggtccaca ctcacagcca accagaatcc ttctcctcct 120
tggagcaagc tcacatatag caagcctcac gacgcggcaa ccttctactg cccattcctg 180
tatccttctc ctccgcggag ccctctgcag ttctccggat tccagagagt gtccaccggt 240
cctgagtgca gaaatgaaac actgtatctt ctctacaaca gagagggcca gacccttgtg 300
gagagaagca gcacctgggt gaagaaggtc atttggtatc tgtctggcag aaaccagacc 360
atactgcagc ggatgccaag aacagcctcc aagccatccg acggtaacgt gcagatctcc 420
gtggaggacg ccaagatttt cggcgcccac atggtgccaa agcagaccaa gctgctgaga 480
ttcgtggtga acgatggcac caggtaccag atgtgcgtta tgaagcttga gtcctgggct 540
cacgtgttca gagactactc tgtgagcttc caggtgagac tgacattcac agaggccaac 600
aaccagactt acaccttctg cacgcatcct aatctgatcg tg 642
<210> 202
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 202
atgctcagac ttcttctcag acaccacttc cactgtttgc ttctctgcgc agtgtgggca 60
accccttgcc ttgcttcccc ttggtcgact ctcaccgcca accagaatcc aagccctcct 120
tggagcaagc tcacttacag caagccgcac gacgccgcca ccttctactg tcctttcctg 180
taccctagcc ctccaagatc tcctctgcaa ttctctggat tccagagagt gagcaccggc 240
ccagagtgcc ggaacgagac tctgtatctg ctgtacaata gggagggaca aaccctggtg 300
gagaggagca gcacatgggt gaagaaggtg atctggtacc tgagcggcag aaaccagacc 360
atcctgcaga gaatgccacg gaccgccagc aagccaagcg atggcaacgt ccagattagc 420
gtggaagacg ccaagatctt cggagcccac atggtgccta agcagaccaa gcttctgcga 480
ttcgtggtga acgacggtac ccgctaccaa atgtgcgtga tgaagctgga gtcatgggcc 540
cacgtcttcc gcgactacag cgtatccttc caggtgaggc ttaccttcac cgaggccaac 600
aaccaaacct acacattctg cacccatcca aatttgattg tg 642
<210> 203
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 203
atgctcagac tattgttgag acatcacttc cattgcctcc ttttgtgcgc cgtgtgggct 60
accccttgcc tcgcctcacc ttggagcacc ttgaccgcca accagaaccc gagccctccg 120
tggtcaaagc tcacctacag caagcctcac gacgccgcaa ccttctattg tccattcctg 180
tacccttctc cgccgaggtc ccctcttcag ttcagcggat tccagagagt gtctaccgga 240
ccagaatgca gaaacgaaac actgtatctg ctgtacaacc gggagggcca gaccctggtc 300
gagcggagct ctacctgggt caagaaggtt atatggtatc tgagcggcag gaaccagacc 360
atcctgcagc gcatgcctag aaccgctagc aagccaagcg acggcaacgt tcagatctcc 420
gtggaggacg ctaagatctt cggcgcccat atggtgccaa agcagactaa gctgctgaga 480
ttcgtggtaa acgacggcac aagatatcag atgtgcgtga tgaagctgga gagctgggct 540
catgtgttca gggactactc cgtgagtttc caggtgaggc tgacattcac cgaggctaat 600
aatcagacct acaccttctg cactcaccca aatctgatcg tg 642
<210> 204
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 204
atgctcagat tattgctcag acaccacttc cactgcctcc tcttgtgcgc cgtgtgggcg 60
acaccgtgtc tcgcaagccc ttggtccaca ctaacggcca accagaaccc tagccctcct 120
tggagcaagc tcacttatag caagccacac gatgcggcca ctttctactg tcctttcctg 180
tatccatccc ctcctagatc tcctctgcag ttcagcggat tccagagagt atctactggc 240
cctgagtgca gaaatgaaac cctctatctc ctgtacaatc gggagggcca gactttggtg 300
gagcgcagct ccacctgggt gaagaaggtg atctggtacc tgagcggcag aaaccagacc 360
atcctacaga ggatgccaag gaccgccagc aagccatctg acggcaacgt gcagatctct 420
gtggaggacg ccaagatctt cggagcccat atggtgccta agcagacaaa gctgttgagg 480
ttcgtcgtga atgacggcac aagataccag atgtgtgtga tgaagctgga gagctgggct 540
cacgtgttcc gagactacag cgtctcgttc caggtgagac tgacattcac cgaggcaaac 600
aaccagacct acaccttctg tacgcaccct aacctgatcg tt 642
<210> 205
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 205
atgcttcggc tcctccttcg gcaccacttc cactgcctcc tcctctgcgc cgtgtgggcc 60
acaccttgcc tcgccagccc ctggagcacc ctcaccgcca accagaaccc cagccctccg 120
tggtctaagt taacctacag caagccccac gacgccgcca ccttctactg ccccttcctg 180
tacccttcac cgccgcggag cccgctgcag ttcagcggct tccagcgggt gagcaccggc 240
cccgagtgcc ggaacgagac gctgtacctg ctgtacaacc gggagggcca gaccctggtg 300
gagcggagca gcacctgggt gaagaaggtg atctggtacc tgagcggccg gaaccagacc 360
atcctgcagc ggatgccccg gaccgcctca aagccaagcg acggcaacgt gcagatcagc 420
gtggaggacg ccaagatctt cggcgcccac atggtgccca agcagaccaa gttgctgcgc 480
ttcgtggtga acgacggcac ccggtaccag atgtgcgtga tgaagctgga gagctgggcc 540
cacgtgttcc gggactacag cgtgagcttc caggtgcggc tgacattcac cgaggccaac 600
aatcagacct acaccttctg cacccacccc aacctgatcg tg 642
<210> 206
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 206
atgttacggc tccttctccg ccaccacttc cactgcctct tactctgcgc cgtgtgggcc 60
actccatgcc ttgccagccc ctggagcacc ttgaccgcca accagaaccc cagcccacct 120
tggagtaagc tcacctacag caagccccac gacgccgcca ccttctactg ccccttcctg 180
tatccgagcc caccgcggag cccgctgcag ttcagcggct tccagcgggt gagcaccggc 240
cccgagtgcc ggaacgaaac cctgtacctg ctgtacaacc gggagggcca gaccctggtg 300
gagcggagca gcacctgggt gaagaaggtg atctggtacc tgagcggccg gaaccagacc 360
atcctgcagc ggatgccccg gaccgctagt aagcctagcg acggcaacgt gcagatcagc 420
gtggaggacg ccaagatctt cggcgcccac atggtgccca agcagaccaa gctgcttagg 480
ttcgtggtga acgacggcac ccggtaccag atgtgcgtga tgaagctgga gagctgggcc 540
cacgtgttcc gggactacag cgtgagcttc caggtgcggc tgaccttcac cgaggccaac 600
aaccagacat acaccttctg cacccacccc aacctgatcg tg 642
<210> 207
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 207
atgctacggc tcctactccg ccaccacttc cactgcttac ttttgtgcgc cgtgtgggcc 60
acaccatgct tggccagccc ctggagcacc ctcaccgcca accagaaccc ctcacctccc 120
tggtccaagc tcacctactc caagccccac gacgccgcca ccttctactg ccccttcctc 180
tatccatctc ctccacgcag cccactccag ttctccggct tccagcgcgt ctccaccggc 240
cccgagtgcc gcaacgagac gctctacctc ctctacaacc gcgagggcca gaccctcgtc 300
gagaggtcat ccacctgggt caagaaggtc atctggtacc tctccggccg caaccagacc 360
atcctccagc gcatgccccg caccgcgtct aagccgtccg acggcaacgt ccagatctcc 420
gtcgaggacg ccaagatctt cggcgcccac atggtcccca agcagaccaa gctcctccgc 480
ttcgtcgtca acgacggcac ccgctaccag atgtgcgtca tgaagctcga gtcctgggcc 540
cacgtcttcc gcgactactc cgtctccttc caggtccgcc tcaccttcac cgaggccaat 600
aaccagactt acaccttctg cacccacccc aacctcatcg tc 642
<210> 208
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 208
atgctacggc tcctactccg ccaccacttc cactgcttac ttttgtgcgc cgtgtgggcc 60
acaccatgct tggccagccc ctggagcacc ctcaccgcca accagaaccc ctcacctccc 120
tggtccaagc tcacctactc caagccccac gacgccgcca ccttctactg ccccttcctc 180
tatccatctc ctccacgcag cccactccag ttctccggct tccagcgcgt ctccaccggc 240
cccgagtgcc gcaacgagac gctctacctc ctctacaacc gcgagggcca gaccctcgtc 300
gagaggtcat ccacctgggt caagaaggtc atctggtacc tctccggccg caaccagacc 360
atcctccagc gcatgccccg caccgcgtct aagccgtccg acggcaacgt ccagatctcc 420
gtcgaggacg ccaagatctt cggcgcccac atggtcccca agcagaccaa gctcctccgc 480
ttcgtcgtca acgacggcac ccgctaccag atgtgcgtca tgaagctcga gtcctgggcc 540
cacgtcttcc gcgactactc cgtctccttc caggtccgcc tcaccttcac cgaggccaat 600
aaccagactt acaccttctg cacccacccc aacctcatcg tc 642
<210> 209
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 209
atgcttcggc tcctcctaag gcaccacttc cactgccttt tgctttgcgc cgtgtgggcc 60
accccttgct tggccagccc ctggagcacc ctcaccgcca accagaaccc ctcccctccc 120
tggtccaagc tcacctactc caagccccac gacgccgcca ccttctactg ccccttcctc 180
tacccgtccc ctccacgcag cccactccag ttctccggct tccagcgcgt ctccaccggc 240
cccgagtgcc gcaacgaaac actctacctc ctctacaacc gcgagggcca gaccctcgtc 300
gagcgctcct ccacctgggt caagaaggtc atctggtacc tctccggccg caaccagacc 360
atcctccagc gcatgccccg caccgcaagc aagccatccg acggcaacgt ccagatctcc 420
gtcgaggacg ccaagatctt cggcgcccac atggtcccca agcagaccaa gctcctccgc 480
ttcgtcgtca acgacggcac ccgctaccag atgtgcgtca tgaagctcga gtcctgggcc 540
cacgtcttcc gcgactactc cgtctccttc caggtccgcc tcaccttcac cgaggccaat 600
aatcagacat acaccttctg cacccacccc aacctcatcg tc 642
<210> 210
<211> 387
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 210
atgcggctgt gtcgggtgtg gctgtctgtt tgtctgtgcg ccgtggtgct gggtcagtgc 60
cagcgggaaa ccgcggaaaa gaacgattat taccgagtac cgcattactg ggacgcgtgc 120
tctcgcgcgc tgcccgacca aacccgttac aagtatgtgg aacagctcgt ggacctcacg 180
ttgaactacc actacgatgc gagccacggc ttggacaact ttgacgtgct caagagaatc 240
aacgtgaccg aggtgtcgtt gctcatcagc gactttagac gtcagaaccg tcgcggcggc 300
accaacaaaa ggaccacgtt caacgccgcc ggttcgctgg cgccacacgc ccggagcctc 360
gagttcagcg tgcggctctt tgccaac 387
<210> 211
<211> 742
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 211
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu
1 5 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu
20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro
35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser Ser
50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe
65 70 75 80
Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys Leu
85 90 95
Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu Thr
100 105 110
Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu Val
115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys Ala
130 135 140
Gln Asp Ser Leu Gly Glu Gln Pro Thr Thr Val Pro Pro Pro Ile Asp
145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His Gly
165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn
180 185 190
Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val
195 200 205
Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr
210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile
225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val
245 250 255
Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln Thr
260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gln Leu Asn Arg
275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe
290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr
305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg Arg
325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala
340 345 350
Arg Gln Glu Glu Ala Gly Ala Gln Val Ser Val Pro Arg Ala Leu Asp
355 360 365
Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys Leu
370 375 380
Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val
385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gln Ile Thr Asp Ile
405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln Gln
420 425 430
His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala Leu
435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg
450 455 460
Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His
465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser
485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His His
500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg
515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val
530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln Pro
545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu
565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr
580 585 590
Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val
595 600 605
Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys Cys
610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Val Ala Leu
625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu Glu
645 650 655
Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp Ser
660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser
675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu
690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu Met
705 710 715 720
Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu Tyr
725 730 735
Arg Met Leu Lys Thr Cys
740
<210> 212
<211> 278
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 212
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val
1 5 10 15
Ile Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Ala Ala
20 25 30
Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu Cys Pro
35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Glu Gly Asp Lys
50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Gly Arg Asp Gly
65 70 75 80
Pro Leu Ser Gln Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala
85 90 95
Asn Ser Val Leu Leu Asp Glu Ala Phe Leu Asp Thr Leu Ala Leu Leu
100 105 110
Tyr Asn Asn Pro Asp Gln Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser
115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys
130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg
145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu
165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val
180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu
195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly
210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gln Leu Asp Pro
225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu
245 250 255
Leu Lys Gln Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro
260 265 270
Gln Ala Val Asp Ala Arg
275
<210> 213
<211> 171
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 213
Met Ser Pro Lys Asp Leu Thr Pro Phe Leu Thr Ala Leu Trp Leu Leu
1 5 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu
20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met
35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys
50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met
65 70 75 80
Thr His Ser Leu Thr Arg Gln Val Val His Asn Lys Leu Thr Ser Cys
85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly
100 105 110
Lys Val Asn Asp Lys Ala Gln Tyr Leu Leu Gly Ala Ala Gly Ser Val
115 120 125
Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys Ile Thr Arg Ile Val
130 135 140
Gly Leu Asp Gln Tyr Leu Glu Ser Val Lys Lys His Lys Arg Leu Asp
145 150 155 160
Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gln
165 170
<210> 214
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 214
Met Leu Arg Leu Leu Leu Arg His His Phe His Cys Leu Leu Leu Cys
1 5 10 15
Ala Val Trp Ala Thr Pro Cys Leu Ala Ser Pro Trp Ser Thr Leu Thr
20 25 30
Ala Asn Gln Asn Pro Ser Pro Pro Trp Ser Lys Leu Thr Tyr Ser Lys
35 40 45
Pro His Asp Ala Ala Thr Phe Tyr Cys Pro Phe Leu Tyr Pro Ser Pro
50 55 60
Pro Arg Ser Pro Leu Gln Phe Ser Gly Phe Gln Arg Val Ser Thr Gly
65 70 75 80
Pro Glu Cys Arg Asn Glu Thr Leu Tyr Leu Leu Tyr Asn Arg Glu Gly
85 90 95
Gln Thr Leu Val Glu Arg Ser Ser Thr Trp Val Lys Lys Val Ile Trp
100 105 110
Tyr Leu Ser Gly Arg Asn Gln Thr Ile Leu Gln Arg Met Pro Arg Thr
115 120 125
Ala Ser Lys Pro Ser Asp Gly Asn Val Gln Ile Ser Val Glu Asp Ala
130 135 140
Lys Ile Phe Gly Ala His Met Val Pro Lys Gln Thr Lys Leu Leu Arg
145 150 155 160
Phe Val Val Asn Asp Gly Thr Arg Tyr Gln Met Cys Val Met Lys Leu
165 170 175
Glu Ser Trp Ala His Val Phe Arg Asp Tyr Ser Val Ser Phe Gln Val
180 185 190
Arg Leu Thr Phe Thr Glu Ala Asn Asn Gln Thr Tyr Thr Phe Cys Thr
195 200 205
His Pro Asn Leu Ile Val
210
<210> 215
<211> 129
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 215
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val
1 5 10 15
Leu Gly Gln Cys Gln Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg
20 25 30
Val Pro His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gln Thr
35 40 45
Arg Tyr Lys Tyr Val Glu Gln Leu Val Asp Leu Thr Leu Asn Tyr His
50 55 60
Tyr Asp Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile
65 70 75 80
Asn Val Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gln Asn
85 90 95
Arg Arg Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser
100 105 110
Leu Ala Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala
115 120 125
Asn
<210> 216
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 216
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro
690 695 700
Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly
705 710 715 720
Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala
725 730 735
Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe
740 745 750
Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Thr
755 760 765
Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Thr Gln Pro Leu Gln
770 775 780
Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser
785 790 795 800
Gly Ser Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu
805 810 815
Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp
820 825 830
Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met
835 840 845
Leu Leu Ala Leu Ala Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn
850 855 860
Gly Thr Asp Ser Leu Asp Gly Arg Thr Gly Thr Gln Asp Lys Gly Gln
865 870 875 880
Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg
885 890 895
His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val
900 905
<210> 217
<211> 557
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 217
Met Glu Ser Arg Gly Arg Arg Cys Pro Glu Met Ile Ser Val Leu Gly
1 5 10 15
Pro Ile Ser Gly His Val Leu Lys Ala Val Phe Ser Arg Gly Asp Thr
20 25 30
Pro Val Leu Pro His Glu Thr Arg Leu Leu Gln Thr Gly Ile His Val
35 40 45
Arg Val Ser Gln Pro Ser Leu Ile Leu Val Ser Gln Tyr Thr Pro Asp
50 55 60
Ser Thr Pro Cys His Arg Gly Asp Asn Gln Leu Gln Val Gln His Thr
65 70 75 80
Tyr Phe Thr Gly Ser Glu Val Glu Asn Val Ser Val Asn Val His Asn
85 90 95
Pro Thr Gly Arg Ser Ile Cys Pro Ser Gln Glu Pro Met Ser Ile Tyr
100 105 110
Val Tyr Ala Leu Pro Leu Lys Met Leu Asn Ile Pro Ser Ile Asn Val
115 120 125
His His Tyr Pro Ser Ala Ala Glu Arg Lys His Arg His Leu Pro Val
130 135 140
Ala Asp Ala Val Ile His Ala Ser Gly Lys Gln Met Trp Gln Ala Arg
145 150 155 160
Leu Thr Val Ser Gly Leu Ala Trp Thr Arg Gln Gln Asn Gln Trp Lys
165 170 175
Glu Pro Asp Val Tyr Tyr Thr Ser Ala Phe Val Phe Pro Thr Lys Asp
180 185 190
Val Ala Leu Arg His Val Val Cys Ala His Glu Leu Val Cys Ser Met
195 200 205
Glu Asn Thr Arg Ala Thr Lys Met Gln Val Ile Gly Asp Gln Tyr Val
210 215 220
Lys Val Tyr Leu Glu Ser Phe Cys Glu Asp Val Pro Ser Gly Lys Leu
225 230 235 240
Phe Met His Val Thr Leu Gly Ser Asp Val Glu Glu Asp Leu Thr Met
245 250 255
Thr Arg Asn Pro Gln Pro Phe Met Arg Pro His Glu Arg Asn Gly Phe
260 265 270
Thr Val Leu Cys Pro Lys Asn Met Ile Ile Lys Pro Gly Lys Ile Ser
275 280 285
His Ile Met Leu Asp Val Ala Phe Thr Ser His Glu His Phe Gly Leu
290 295 300
Leu Cys Pro Lys Ser Ile Pro Gly Leu Ser Ile Ser Gly Asn Leu Leu
305 310 315 320
Met Asn Gly Gln Gln Ile Phe Leu Glu Val Gln Ala Ile Arg Glu Thr
325 330 335
Val Glu Leu Arg Gln Tyr Asp Pro Val Ala Ala Leu Phe Phe Phe Asp
340 345 350
Ile Asp Leu Leu Leu Gln Arg Gly Pro Gln Tyr Ser Glu His Pro Thr
355 360 365
Phe Thr Ser Gln Tyr Arg Ile Gln Gly Lys Leu Glu Tyr Arg His Thr
370 375 380
Trp Asp Arg His Asp Glu Gly Ala Ala Gln Gly Asp Asp Asp Val Trp
385 390 395 400
Thr Ser Gly Ser Asp Ser Asp Glu Glu Leu Val Thr Thr Glu Arg Lys
405 410 415
Thr Pro Arg Val Thr Gly Gly Gly Ala Met Ala Ser Ala Ser Thr Ser
420 425 430
Ala Gly Ser Ala Ser Ser Ala Thr Ala Cys Thr Ala Gly Val Met Thr
435 440 445
Arg Gly Arg Leu Lys Ala Glu Ser Thr Val Ala Pro Glu Glu Asp Thr
450 455 460
Asp Glu Asp Ser Asp Asn Glu Ile His Asn Pro Ala Val Phe Thr Trp
465 470 475 480
Pro Pro Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val
485 490 495
Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Glu Phe Phe Trp Asp
500 505 510
Ala Asn Asp Ile Tyr Arg Ile Phe Ala Glu Leu Glu Gly Val Trp Gln
515 520 525
Pro Ala Ala Gln Pro Lys Arg Arg Arg His Arg Gln Asp Ala Leu Pro
530 535 540
Gly Pro Cys Ile Ala Ser Thr Pro Lys Lys His Arg Gly
545 550 555
<210> 218
<211> 900
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 218
Met Glu Ser Arg Gly Arg Arg Cys Pro Glu Met Ile Ser Val Leu Gly
1 5 10 15
Pro Ile Ser Gly His Val Leu Lys Ala Val Phe Ser Arg Gly Asp Thr
20 25 30
Pro Val Leu Pro His Glu Thr Arg Leu Leu Gln Thr Gly Ile His Val
35 40 45
Arg Val Ser Gln Pro Ser Leu Ile Leu Val Ser Gln Tyr Thr Pro Asp
50 55 60
Ser Thr Pro Cys His Arg Gly Asp Asn Gln Leu Gln Val Gln His Thr
65 70 75 80
Tyr Phe Thr Gly Ser Glu Val Glu Asn Val Ser Val Asn Val His Asn
85 90 95
Pro Thr Gly Arg Ser Ile Cys Pro Ser Gln Glu Pro Met Ser Ile Tyr
100 105 110
Val Tyr Ala Leu Pro Leu Lys Met Leu Asn Ile Pro Ser Ile Asn Val
115 120 125
His His Tyr Pro Ser Ala Ala Glu Arg Lys His Arg His Leu Pro Val
130 135 140
Ala Asp Ala Val Ile His Ala Ser Gly Lys Gln Met Trp Gln Ala Arg
145 150 155 160
Leu Thr Val Ser Gly Leu Ala Trp Thr Arg Gln Gln Asn Gln Trp Lys
165 170 175
Glu Pro Asp Val Tyr Tyr Thr Ser Ala Phe Val Phe Pro Thr Lys Asp
180 185 190
Val Ala Leu Arg His Val Val Cys Ala His Glu Leu Val Cys Ser Met
195 200 205
Glu Asn Thr Arg Ala Thr Lys Met Gln Val Ile Gly Asp Gln Tyr Val
210 215 220
Lys Val Tyr Leu Glu Ser Phe Cys Glu Asp Val Pro Ser Gly Lys Leu
225 230 235 240
Phe Met His Val Thr Leu Gly Ser Asp Val Glu Glu Asp Leu Thr Met
245 250 255
Thr Arg Asn Pro Gln Pro Phe Met Arg Pro His Glu Arg Asn Gly Phe
260 265 270
Thr Val Leu Cys Pro Lys Asn Met Ile Ile Lys Pro Gly Lys Ile Ser
275 280 285
His Ile Met Leu Asp Val Ala Phe Thr Ser His Glu His Phe Gly Leu
290 295 300
Leu Cys Pro Lys Ser Ile Pro Gly Leu Ser Ile Ser Gly Asn Leu Leu
305 310 315 320
Met Asn Gly Gln Gln Ile Phe Leu Glu Val Gln Ala Ile Arg Glu Thr
325 330 335
Val Glu Leu Arg Gln Tyr Asp Pro Val Ala Ala Leu Phe Phe Phe Asp
340 345 350
Ile Asp Leu Leu Leu Gln Arg Gly Pro Gln Tyr Ser Glu His Pro Thr
355 360 365
Phe Thr Ser Gln Tyr Arg Ile Gln Gly Lys Leu Glu Tyr Arg His Thr
370 375 380
Trp Asp Arg His Asp Glu Gly Ala Ala Gln Gly Asp Asp Asp Val Trp
385 390 395 400
Thr Ser Gly Ser Asp Ser Asp Glu Glu Leu Val Thr Thr Glu Arg Lys
405 410 415
Thr Pro Arg Val Thr Gly Gly Gly Ala Met Ala Ser Ala Ser Thr Ser
420 425 430
Ala Gly Arg Lys Arg Lys Ser Ala Ser Ser Ala Thr Ala Cys Thr Ala
435 440 445
Gly Val Met Thr Arg Gly Arg Leu Lys Ala Glu Ser Thr Val Ala Pro
450 455 460
Glu Glu Asp Thr Asp Glu Asp Ser Asp Asn Glu Ile His Asn Pro Ala
465 470 475 480
Val Phe Thr Trp Pro Pro Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu
485 490 495
Val Pro Met Val Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Glu
500 505 510
Phe Phe Trp Asp Ala Asn Asp Ile Tyr Arg Ile Phe Ala Glu Leu Glu
515 520 525
Gly Val Trp Gln Pro Ala Ala Gln Pro Lys Arg Arg Arg His Arg Gln
530 535 540
Asp Ala Leu Pro Gly Pro Cys Ile Ala Ser Thr Pro Lys Lys His Arg
545 550 555 560
Gly Glu Ser Ser Ala Lys Arg Lys Met Asp Pro Asp Asn Pro Asp Glu
565 570 575
Gly Pro Ser Ser Lys Val Pro Arg Pro Glu Thr Pro Val Thr Lys Ala
580 585 590
Thr Thr Phe Leu Gln Thr Met Leu Arg Lys Glu Val Asn Ser Gln Leu
595 600 605
Ser Leu Gly Asp Pro Leu Phe Pro Glu Leu Ala Glu Glu Ser Leu Lys
610 615 620
Thr Phe Glu Gln Val Thr Glu Asp Cys Asn Glu Asn Pro Glu Lys Asp
625 630 635 640
Val Leu Thr Glu Leu Val Lys Gln Ile Lys Val Arg Val Asp Met Val
645 650 655
Arg His Arg Ile Lys Glu His Met Leu Lys Lys Tyr Thr Gln Thr Glu
660 665 670
Glu Lys Phe Thr Gly Ala Phe Asn Met Met Gly Gly Cys Leu Gln Asn
675 680 685
Ala Leu Asp Ile Leu Asp Lys Val His Glu Pro Phe Glu Asp Met Lys
690 695 700
Cys Ile Gly Leu Thr Met Gln Ser Met Tyr Glu Asn Tyr Ile Val Pro
705 710 715 720
Glu Asp Lys Arg Glu Met Trp Met Ala Cys Ile Lys Glu Leu His Asp
725 730 735
Val Ser Lys Gly Ala Ala Asn Lys Leu Gly Gly Ala Leu Gln Ala Lys
740 745 750
Ala Arg Ala Lys Lys Asp Glu Leu Arg Arg Lys Met Met Tyr Met Cys
755 760 765
Tyr Arg Asn Ile Glu Phe Phe Thr Lys Asn Ser Ala Phe Pro Lys Thr
770 775 780
Thr Asn Gly Cys Ser Gln Ala Met Ala Ala Leu Gln Asn Leu Pro Gln
785 790 795 800
Cys Ser Pro Asp Glu Ile Met Ser Tyr Ala Gln Lys Ile Phe Lys Ile
805 810 815
Leu Asp Glu Glu Arg Asp Lys Val Leu Thr His Ile Asp His Ile Phe
820 825 830
Met Asp Ile Leu Thr Thr Cys Val Glu Thr Met Cys Asn Glu Tyr Lys
835 840 845
Val Thr Ser Asp Ala Cys Met Met Thr Met Tyr Gly Gly Ile Ser Leu
850 855 860
Leu Ser Glu Phe Cys Arg Val Leu Cys Cys Tyr Val Leu Glu Glu Thr
865 870 875 880
Ser Val Met Leu Ala Lys Arg Pro Leu Ile Thr Lys Pro Glu Val Ile
885 890 895
Ser Val Met Lys
900
<210> 219
<211> 1047
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 219
Met Glu Ser Arg Gly Arg Arg Cys Pro Glu Met Ile Ser Val Leu Gly
1 5 10 15
Pro Ile Ser Gly His Val Leu Lys Ala Val Phe Ser Arg Gly Asp Thr
20 25 30
Pro Val Leu Pro His Glu Thr Arg Leu Leu Gln Thr Gly Ile His Val
35 40 45
Arg Val Ser Gln Pro Ser Leu Ile Leu Val Ser Gln Tyr Thr Pro Asp
50 55 60
Ser Thr Pro Cys His Arg Gly Asp Asn Gln Leu Gln Val Gln His Thr
65 70 75 80
Tyr Phe Thr Gly Ser Glu Val Glu Asn Val Ser Val Asn Val His Asn
85 90 95
Pro Thr Gly Arg Ser Ile Cys Pro Ser Gln Glu Pro Met Ser Ile Tyr
100 105 110
Val Tyr Ala Leu Pro Leu Lys Met Leu Asn Ile Pro Ser Ile Asn Val
115 120 125
His His Tyr Pro Ser Ala Ala Glu Arg Lys His Arg His Leu Pro Val
130 135 140
Ala Asp Ala Val Ile His Ala Ser Gly Lys Gln Met Trp Gln Ala Arg
145 150 155 160
Leu Thr Val Ser Gly Leu Ala Trp Thr Arg Gln Gln Asn Gln Trp Lys
165 170 175
Glu Pro Asp Val Tyr Tyr Thr Ser Ala Phe Val Phe Pro Thr Lys Asp
180 185 190
Val Ala Leu Arg His Val Val Cys Ala His Glu Leu Val Cys Ser Met
195 200 205
Glu Asn Thr Arg Ala Thr Lys Met Gln Val Ile Gly Asp Gln Tyr Val
210 215 220
Lys Val Tyr Leu Glu Ser Phe Cys Glu Asp Val Pro Ser Gly Lys Leu
225 230 235 240
Phe Met His Val Thr Leu Gly Ser Asp Val Glu Glu Asp Leu Thr Met
245 250 255
Thr Arg Asn Pro Gln Pro Phe Met Arg Pro His Glu Arg Asn Gly Phe
260 265 270
Thr Val Leu Cys Pro Lys Asn Met Ile Ile Lys Pro Gly Lys Ile Ser
275 280 285
His Ile Met Leu Asp Val Ala Phe Thr Ser His Glu His Phe Gly Leu
290 295 300
Leu Cys Pro Lys Ser Ile Pro Gly Leu Ser Ile Ser Gly Asn Leu Leu
305 310 315 320
Met Asn Gly Gln Gln Ile Phe Leu Glu Val Gln Ala Ile Arg Glu Thr
325 330 335
Val Glu Leu Arg Gln Tyr Asp Pro Val Ala Ala Leu Phe Phe Phe Asp
340 345 350
Ile Asp Leu Leu Leu Gln Arg Gly Pro Gln Tyr Ser Glu His Pro Thr
355 360 365
Phe Thr Ser Gln Tyr Arg Ile Gln Gly Lys Leu Glu Tyr Arg His Thr
370 375 380
Trp Asp Arg His Asp Glu Gly Ala Ala Gln Gly Asp Asp Asp Val Trp
385 390 395 400
Thr Ser Gly Ser Asp Ser Asp Glu Glu Leu Val Thr Thr Glu Arg Lys
405 410 415
Thr Pro Arg Val Thr Gly Gly Gly Ala Met Ala Ser Ala Ser Thr Ser
420 425 430
Ala Gly Ser Ala Ser Ser Ala Thr Ala Cys Thr Ala Gly Val Met Thr
435 440 445
Arg Gly Arg Leu Lys Ala Glu Ser Thr Val Ala Pro Glu Glu Asp Thr
450 455 460
Asp Glu Asp Ser Asp Asn Glu Ile His Asn Pro Ala Val Phe Thr Trp
465 470 475 480
Pro Pro Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val
485 490 495
Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Glu Phe Phe Trp Asp
500 505 510
Ala Asn Asp Ile Tyr Arg Ile Phe Ala Glu Leu Glu Gly Val Trp Gln
515 520 525
Pro Ala Ala Gln Pro Lys Arg Arg Arg His Arg Gln Asp Ala Leu Pro
530 535 540
Gly Pro Cys Ile Ala Ser Thr Pro Lys Lys His Arg Gly Glu Ser Ser
545 550 555 560
Ala Lys Arg Lys Met Asp Pro Asp Asn Pro Asp Glu Gly Pro Ser Ser
565 570 575
Lys Val Pro Arg Pro Glu Thr Pro Val Thr Lys Ala Thr Thr Phe Leu
580 585 590
Gln Thr Met Leu Arg Lys Glu Val Asn Ser Gln Leu Ser Leu Gly Asp
595 600 605
Pro Leu Phe Pro Glu Leu Ala Glu Glu Ser Leu Lys Thr Phe Glu Gln
610 615 620
Val Thr Glu Asp Cys Asn Glu Asn Pro Glu Lys Asp Val Leu Thr Glu
625 630 635 640
Leu Val Lys Gln Ile Lys Val Arg Val Asp Met Val Arg His Arg Ile
645 650 655
Lys Glu His Met Leu Lys Lys Tyr Thr Gln Thr Glu Glu Lys Phe Thr
660 665 670
Gly Ala Phe Asn Met Met Gly Gly Cys Leu Gln Asn Ala Leu Asp Ile
675 680 685
Leu Asp Lys Val His Glu Pro Phe Glu Asp Met Lys Cys Ile Gly Leu
690 695 700
Thr Met Gln Ser Met Tyr Glu Asn Tyr Ile Val Pro Glu Asp Lys Arg
705 710 715 720
Glu Met Trp Met Ala Cys Ile Lys Glu Leu His Asp Val Ser Lys Gly
725 730 735
Ala Ala Asn Lys Leu Gly Gly Ala Leu Gln Ala Lys Ala Arg Ala Lys
740 745 750
Lys Asp Glu Leu Arg Arg Lys Met Met Tyr Met Cys Tyr Arg Asn Ile
755 760 765
Glu Phe Phe Thr Lys Asn Ser Ala Phe Pro Lys Thr Thr Asn Gly Cys
770 775 780
Ser Gln Ala Met Ala Ala Leu Gln Asn Leu Pro Gln Cys Ser Pro Asp
785 790 795 800
Glu Ile Met Ser Tyr Ala Gln Lys Ile Phe Lys Ile Leu Asp Glu Glu
805 810 815
Arg Asp Lys Val Leu Thr His Ile Asp His Ile Phe Met Asp Ile Leu
820 825 830
Thr Thr Cys Val Glu Thr Met Cys Asn Glu Tyr Lys Val Thr Ser Asp
835 840 845
Ala Cys Met Met Thr Met Tyr Gly Gly Ile Ser Leu Leu Ser Glu Phe
850 855 860
Cys Arg Val Leu Cys Cys Tyr Val Leu Glu Glu Thr Ser Val Met Leu
865 870 875 880
Ala Lys Arg Pro Leu Ile Thr Lys Pro Glu Val Ile Ser Val Met Lys
885 890 895
Arg Arg Ile Glu Glu Ile Cys Met Lys Val Phe Ala Gln Tyr Ile Leu
900 905 910
Gly Ala Asp Pro Leu Arg Val Cys Ser Pro Ser Val Asp Asp Leu Arg
915 920 925
Ala Ile Ala Glu Glu Ser Asp Glu Glu Glu Ala Ile Val Ala Tyr Thr
930 935 940
Leu Ala Thr Ala Gly Ala Ser Ser Ser Asp Ser Leu Val Ser Pro Pro
945 950 955 960
Glu Ser Pro Val Pro Ala Thr Ile Pro Leu Ser Ser Val Ile Val Ala
965 970 975
Glu Asn Ser Asp Gln Glu Glu Ser Glu Gln Ser Asp Glu Glu Gln Glu
980 985 990
Glu Gly Ala Gln Glu Glu Arg Glu Asp Thr Val Ser Val Lys Ser Glu
995 1000 1005
Pro Val Ser Glu Ile Glu Glu Val Ala Ser Glu Glu Glu Glu Asp
1010 1015 1020
Gly Ala Glu Glu Pro Thr Ala Ser Gly Gly Lys Ser Thr His Pro
1025 1030 1035
Met Val Thr Arg Ser Lys Ala Asp Gln
1040 1045
<210> 220
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 220
Met Glu Ser Ser Ala Lys Arg Lys Met Asp Pro Asp Asn Pro Asp Glu
1 5 10 15
Gly Pro Ser Ser Lys Val Pro Arg Pro Glu Thr Pro Val Thr Lys Ala
20 25 30
Thr Thr Phe Leu Gln Thr Met Leu Arg Lys Glu Val Asn Ser Gln Leu
35 40 45
Ser Leu Gly Asp Pro Leu Phe Pro Glu Leu Ala Glu Glu Ser Leu Lys
50 55 60
Thr Phe Glu Gln Val Thr Glu Asp Cys Asn Glu Asn Pro Glu Lys Asp
65 70 75 80
Val Leu Thr Glu Leu Val Lys Gln Ile Lys Val Arg Val Asp Met Val
85 90 95
Arg His Arg Ile Lys Glu His Met Leu Lys Lys Tyr Thr Gln Thr Glu
100 105 110
Glu Lys Phe Thr Gly Ala Phe Asn Met Met Gly Gly Cys Leu Gln Asn
115 120 125
Ala Leu Asp Ile Leu Asp Lys Val His Glu Pro Phe Glu Asp Met Lys
130 135 140
Cys Ile Gly Leu Thr Met Gln Ser Met Tyr Glu Asn Tyr Ile Val Pro
145 150 155 160
Glu Asp Lys Arg Glu Met Trp Met Ala Cys Ile Lys Glu Leu His Asp
165 170 175
Val Ser Lys Gly Ala Ala Asn Lys Leu Gly Gly Ala Leu Gln Ala Lys
180 185 190
Ala Arg Ala Lys Lys Asp Glu Leu Arg Arg Lys Met Met Tyr Met Cys
195 200 205
Tyr Arg Asn Ile Glu Phe Phe Thr Lys Asn Ser Ala Phe Pro Lys Thr
210 215 220
Thr Asn Gly Cys Ser Gln Ala Met Ala Ala Leu Gln Asn Leu Pro Gln
225 230 235 240
Cys Ser Pro Asp Glu Ile Met Ser Tyr Ala Gln Lys Ile Phe Lys Ile
245 250 255
Leu Asp Glu Glu Arg Asp Lys Val Leu Thr His Ile Asp His Ile Phe
260 265 270
Met Asp Ile Leu Thr Thr Cys Val Glu Thr Met Cys Asn Glu Tyr Lys
275 280 285
Val Thr Ser Asp Ala Cys Met Met Thr Met Tyr Gly Gly Ile Ser Leu
290 295 300
Leu Ser Glu Phe Cys Arg Val Leu Cys Cys Tyr Val Leu Glu Glu Thr
305 310 315 320
Ser Val Met Leu Ala Lys Arg Pro Leu Ile Thr Lys Pro Glu Val Ile
325 330 335
Ser Val Met Lys Arg Arg Ile Glu Glu Ile Cys Met Lys Val Phe Ala
340 345 350
Gln Tyr Ile Leu Gly Ala Asp Pro Leu Arg Val Cys Ser Pro Ser Val
355 360 365
Asp Asp Leu Arg Ala Ile Ala Glu Glu Ser Asp Glu Glu Glu Ala Ile
370 375 380
Val Ala Tyr Thr Leu Ala Thr Ala Gly Ala Ser Ser Ser Asp Ser Leu
385 390 395 400
Val Ser Pro Pro Glu Ser Pro Val Pro Ala Thr Ile Pro Leu Ser Ser
405 410 415
Val Ile Val Ala Glu Asn Ser Asp Gln Glu Glu Ser Glu Gln Ser Asp
420 425 430
Glu Glu Gln Glu Glu Gly Ala Gln Glu Glu Arg Glu Asp Thr Val Ser
435 440 445
Val Lys Ser Glu Pro Val Ser Glu Ile Glu Glu Val Ala Ser Glu Glu
450 455 460
Glu Glu Asp Gly Ala Glu Glu Pro Thr Ala Ser Gly Gly Lys Ser Thr
465 470 475 480
His Pro Met Val Thr Arg Ser Lys Ala Asp Gln
485 490
<210> 221
<211> 580
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 221
Met Glu Ser Ser Ala Lys Arg Lys Met Asp Pro Asp Asn Pro Asp Glu
1 5 10 15
Gly Pro Ser Ser Lys Val Pro Arg Pro Glu Thr Pro Val Thr Lys Ala
20 25 30
Thr Thr Phe Leu Gln Thr Met Leu Arg Lys Glu Val Asn Ser Gln Leu
35 40 45
Ser Leu Gly Asp Pro Leu Phe Pro Glu Leu Ala Glu Glu Ser Leu Lys
50 55 60
Thr Phe Glu Gln Val Thr Glu Asp Cys Asn Glu Asn Pro Glu Lys Asp
65 70 75 80
Val Leu Thr Glu Leu Gly Asp Ile Leu Ala Gln Ala Val Asn His Ala
85 90 95
Gly Ile Asp Ser Ser Ser Thr Gly Pro Thr Leu Thr Thr His Ser Cys
100 105 110
Ser Val Ser Ser Ala Pro Leu Asn Lys Pro Thr Pro Thr Ser Val Ala
115 120 125
Val Thr Asn Thr Pro Leu Pro Gly Ala Ser Ala Thr Pro Glu Leu Ser
130 135 140
Pro Arg Lys Lys Pro Arg Lys Thr Thr Arg Pro Phe Lys Val Ile Ile
145 150 155 160
Lys Pro Pro Val Pro Pro Ala Pro Ile Met Leu Pro Leu Ile Lys Gln
165 170 175
Glu Asp Ile Lys Pro Glu Pro Asp Phe Thr Ile Gln Tyr Arg Asn Lys
180 185 190
Ile Ile Asp Thr Ala Gly Cys Ile Val Ile Ser Asp Ser Glu Glu Glu
195 200 205
Gln Gly Glu Glu Val Glu Thr Arg Gly Ala Thr Ala Ser Ser Pro Ser
210 215 220
Thr Gly Ser Gly Thr Pro Arg Val Thr Ser Pro Thr His Pro Leu Ser
225 230 235 240
Gln Met Asn His Pro Pro Leu Pro Asp Pro Leu Gly Arg Pro Asp Glu
245 250 255
Asp Ser Ser Ser Ser Ser Ser Ser Ser Cys Ser Ser Ala Ser Asp Ser
260 265 270
Glu Ser Glu Ser Glu Glu Met Lys Cys Ser Ser Gly Gly Gly Ala Ser
275 280 285
Val Thr Ser Ser His His Gly Arg Gly Gly Phe Gly Gly Ala Ala Ser
290 295 300
Ser Ser Leu Leu Ser Cys Gly His Gln Ser Ser Gly Gly Ala Ser Thr
305 310 315 320
Gly Pro Arg Lys Lys Lys Ser Lys Arg Ile Ser Glu Leu Asp Asn Glu
325 330 335
Lys Val Arg Asn Ile Met Lys Asp Lys Asn Thr Pro Phe Cys Thr Pro
340 345 350
Asn Val Gln Thr Arg Arg Gly Arg Val Lys Ile Asp Glu Val Ser Arg
355 360 365
Met Phe Arg His Thr Asn Arg Ser Leu Glu Tyr Lys Asn Leu Pro Phe
370 375 380
Met Ile Pro Ser Met His Gln Val Leu Glu Glu Ala Ile Lys Val Cys
385 390 395 400
Lys Thr Met Gln Val Asn Asn Lys Gly Ile Gln Ile Ile Tyr Thr Arg
405 410 415
Asn His Glu Val Lys Asn Glu Val Asp Gln Val Arg Cys Arg Leu Gly
420 425 430
Ser Met Cys Asn Leu Ala Leu Ser Thr Pro Phe Leu Met Glu His Thr
435 440 445
Met Pro Val Thr His Pro Pro Asp Val Ala Gln Arg Thr Ala Asp Ala
450 455 460
Cys Asn Asp Gly Val Lys Ala Val Trp Asn Leu Lys Glu Leu His Thr
465 470 475 480
His Gln Leu Cys Pro Arg Ser Ser Asp Tyr Arg Asn Met Ile Ile His
485 490 495
Ala Ala Thr Pro Val Asp Leu Leu Gly Ala Leu Asn Leu Cys Leu Pro
500 505 510
Leu Met Gln Lys Phe Pro Lys Gln Val Met Val Arg Ile Phe Ser Thr
515 520 525
Asn Gln Gly Gly Phe Met Leu Pro Ile Tyr Glu Thr Ala Ala Lys Ala
530 535 540
Tyr Ala Val Gly Gln Phe Glu Lys Pro Thr Glu Thr Pro Pro Glu Asp
545 550 555 560
Leu Asp Thr Leu Ser Leu Ala Ile Glu Ala Ala Ile Gln Asp Leu Arg
565 570 575
Asn Lys Ser Gln
580
<210> 222
<211> 561
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 222
Met Glu Ser Arg Gly Arg Arg Cys Pro Glu Met Ile Ser Val Leu Gly
1 5 10 15
Pro Ile Ser Gly His Val Leu Lys Ala Val Phe Ser Arg Gly Asp Thr
20 25 30
Pro Val Leu Pro His Glu Thr Arg Leu Leu Gln Thr Gly Ile His Val
35 40 45
Arg Val Ser Gln Pro Ser Leu Ile Leu Val Ser Gln Tyr Thr Pro Asp
50 55 60
Ser Thr Pro Cys His Arg Gly Asp Asn Gln Leu Gln Val Gln His Thr
65 70 75 80
Tyr Phe Thr Gly Ser Glu Val Glu Asn Val Ser Val Asn Val His Asn
85 90 95
Pro Thr Gly Arg Ser Ile Cys Pro Ser Gln Glu Pro Met Ser Ile Tyr
100 105 110
Val Tyr Ala Leu Pro Leu Lys Met Leu Asn Ile Pro Ser Ile Asn Val
115 120 125
His His Tyr Pro Ser Ala Ala Glu Arg Lys His Arg His Leu Pro Val
130 135 140
Ala Asp Ala Val Ile His Ala Ser Gly Lys Gln Met Trp Gln Ala Arg
145 150 155 160
Leu Thr Val Ser Gly Leu Ala Trp Thr Arg Gln Gln Asn Gln Trp Lys
165 170 175
Glu Pro Asp Val Tyr Tyr Thr Ser Ala Phe Val Phe Pro Thr Lys Asp
180 185 190
Val Ala Leu Arg His Val Val Cys Ala His Glu Leu Val Cys Ser Met
195 200 205
Glu Asn Thr Arg Ala Thr Lys Met Gln Val Ile Gly Asp Gln Tyr Val
210 215 220
Lys Val Tyr Leu Glu Ser Phe Cys Glu Asp Val Pro Ser Gly Lys Leu
225 230 235 240
Phe Met His Val Thr Leu Gly Ser Asp Val Glu Glu Asp Leu Thr Met
245 250 255
Thr Arg Asn Pro Gln Pro Phe Met Arg Pro His Glu Arg Asn Gly Phe
260 265 270
Thr Val Leu Cys Pro Lys Asn Met Ile Ile Lys Pro Gly Lys Ile Ser
275 280 285
His Ile Met Leu Asp Val Ala Phe Thr Ser His Glu His Phe Gly Leu
290 295 300
Leu Cys Pro Lys Ser Ile Pro Gly Leu Ser Ile Ser Gly Asn Leu Leu
305 310 315 320
Met Asn Gly Gln Gln Ile Phe Leu Glu Val Gln Ala Ile Arg Glu Thr
325 330 335
Val Glu Leu Arg Gln Tyr Asp Pro Val Ala Ala Leu Phe Phe Phe Asp
340 345 350
Ile Asp Leu Leu Leu Gln Arg Gly Pro Gln Tyr Ser Glu His Pro Thr
355 360 365
Phe Thr Ser Gln Tyr Arg Ile Gln Gly Lys Leu Glu Tyr Arg His Thr
370 375 380
Trp Asp Arg His Asp Glu Gly Ala Ala Gln Gly Asp Asp Asp Val Trp
385 390 395 400
Thr Ser Gly Ser Asp Ser Asp Glu Glu Leu Val Thr Thr Glu Arg Lys
405 410 415
Thr Pro Arg Val Thr Gly Gly Gly Ala Met Ala Ser Ala Ser Thr Ser
420 425 430
Ala Gly Arg Lys Arg Lys Ser Ala Ser Ser Ala Thr Ala Cys Thr Ala
435 440 445
Gly Val Met Thr Arg Gly Arg Leu Lys Ala Glu Ser Thr Val Ala Pro
450 455 460
Glu Glu Asp Thr Asp Glu Asp Ser Asp Asn Glu Ile His Asn Pro Ala
465 470 475 480
Val Phe Thr Trp Pro Pro Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu
485 490 495
Val Pro Met Val Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Glu
500 505 510
Phe Phe Trp Asp Ala Asn Asp Ile Tyr Arg Ile Phe Ala Glu Leu Glu
515 520 525
Gly Val Trp Gln Pro Ala Ala Gln Pro Lys Arg Arg Arg His Arg Gln
530 535 540
Asp Ala Leu Pro Gly Pro Cys Ile Ala Ser Thr Pro Lys Lys His Arg
545 550 555 560
Gly
<210> 223
<211> 698
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 223
Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile
1 5 10 15
Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser
20 25 30
Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser
35 40 45
Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser
50 55 60
His Gly Val Asn Glu Thr Ile Tyr Asn Thr Thr Leu Lys Tyr Gly Asp
65 70 75 80
Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met
85 90 95
Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr
100 105 110
Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val
115 120 125
Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln
130 135 140
Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr
145 150 155 160
Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile
165 170 175
His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val
180 185 190
Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn
195 200 205
Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr
210 215 220
Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp
225 230 235 240
Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr
245 250 255
Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp
260 265 270
Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser
275 280 285
Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr
290 295 300
Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg
305 310 315 320
Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile
325 330 335
Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser
340 345 350
Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser
355 360 365
Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met
370 375 380
Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu
385 390 395 400
Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly
405 410 415
Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln
420 425 430
Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg
435 440 445
Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly
450 455 460
Asn Asn Ala Thr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val
465 470 475 480
Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn
485 490 495
Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg
500 505 510
Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile
515 520 525
Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp
530 535 540
Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys
545 550 555 560
Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser
565 570 575
Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr
580 585 590
Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr
595 600 605
Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser
610 615 620
Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser
625 630 635 640
Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu
645 650 655
Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu
660 665 670
Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn
675 680 685
Ser Tyr Lys Gln His His His His His His
690 695
<210> 224
<211> 742
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 224
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu
1 5 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu
20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro
35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser Ser
50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe
65 70 75 80
Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys Leu
85 90 95
Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu Thr
100 105 110
Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu Val
115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys Ala
130 135 140
Gln Asp Ser Leu Gly Glu Gln Pro Thr Thr Val Pro Pro Pro Ile Asp
145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His Gly
165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn
180 185 190
Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val
195 200 205
Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr
210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile
225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val
245 250 255
Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln Thr
260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gln Leu Asn Arg
275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe
290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr
305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg Arg
325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala
340 345 350
Arg Gln Glu Glu Ala Gly Ala Gln Val Ser Val Pro Arg Ala Leu Asp
355 360 365
Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys Leu
370 375 380
Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val
385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gln Ile Thr Asp Ile
405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln Gln
420 425 430
His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala Leu
435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg
450 455 460
Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His
465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser
485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His His
500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg
515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val
530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln Pro
545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu
565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr
580 585 590
Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val
595 600 605
Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys Cys
610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Val Ala Leu
625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu Glu
645 650 655
Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp Ser
660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser
675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu
690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu Met
705 710 715 720
Met Ser Val Tyr Ala Leu Ser Ala Ile Ile Gly Ile Tyr Leu Leu Tyr
725 730 735
Arg Met Leu Lys Thr Cys
740
<210> 225
<211> 2464
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 225
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggcc aggcctcccc tcctacctca 120
tcatcctcgc cgtctgtctc ttcagccacc tactttcgtc acgatatggc gcagaagccg 180
tatccgaacc gctggacaaa gcgtttcacc tactgctcaa cacctacggg agacccatcc 240
gcttcctgcg tgaaaatacc acccagtgta cctacaacag cagcctccgt aacagcacgg 300
tcgtcaggga aaacgccatc agtttcaact ttttccaaag ctataatcaa tactatgtat 360
tccatatgcc tcgatgtctt tttgcgggtc ctctggcgga gcagtttctg aaccaggtag 420
atctgaccga aaccctggaa agataccaac agagacttaa cacttacgcg ctggtatcca 480
aagacctggc cagctaccga tctttttcgc agcagctaaa ggcacaagac agcctaggtg 540
aacagcccac cactgtgcca ccgcccattg acctgtcaat acctcacgtt tggatgccac 600
cgcaaaccac tccacacggc tggacagaat cacataccac ctcaggacta caccgaccac 660
actttaacca gacctgtatc ctctttgatg gacacgatct actattcagc accgtcacac 720
cttgtttgca ccaaggcttt tacctcatcg acgaactacg ttacgttaaa ataacactga 780
ccgaggactt cttcgtagtt acggtgtcca tagacgacga cacacccatg ctgcttatct 840
tcggccatct tccacgcgta cttttcaaag cgccctatca acgcgacaac tttatactac 900
gacaaactga aaaacacgag ctcctggtgc tagttaagaa agatcaactg aaccgtcact 960
cttatctcaa agacccggac tttcttgacg ccgcacttga cttcaactac ctagacctca 1020
gcgcactact acgtaacagc tttcaccgtt acgccgtgga tgtactcaag agcggtcgat 1080
gtcagatgct ggaccgccgc acggtagaaa tggccttcgc ctacgcatta gcactgttcg 1140
cagcagcccg acaagaagag gccggcgccc aagtctccgt cccacgggcc ctagaccgcc 1200
aggccgcact cttacaaata caagaattta tgatcacctg cctctcacaa acaccaccac 1260
gcaccacgtt gctgctgtat cccacggccg tggacctggc caaacgagcc ctttggacac 1320
cgaatcagat caccgacatc accagcctcg tacgcctggt ctacatactc tctaaacaga 1380
atcagcaaca tctcatcccc caatgggcac tacgacagat cgccgacttt gccctaaaac 1440
tacacaaaac gcacctggcc tcttttcttt cagccttcgc acgccaagaa ctctacctca 1500
tgggcagcct cgtccactcc atgctggtac atacgacgga gagacgcgaa atcttcatcg 1560
tagaaacggg cctctgttca ttggccgagc tatcacactt tacgcagttg ttagctcatc 1620
cacaccacga atacctcagc gacctgtaca caccctgttc cagtagcggg cgacgcgatc 1680
actcgctcga acgcctcacg cgtctcttcc ccgatgccac cgtccccgct accgttcccg 1740
ccgccctctc catcctatct accatgcaac caagcacgct ggaaaccttc cccgacctgt 1800
tttgcttgcc gctcggcgaa tccttctccg cgctgaccgt ctccgaacac gtcagttata 1860
tcgtaacaaa ccagtacctg atcaaaggta tctcctaccc tgtctccacc accgtcgtag 1920
gccagagcct catcatcacc cagacggaca gtcaaactaa atgcgaactg acgcgcaaca 1980
tgcataccac acacagcatc acagtggcgc tcaacatttc gctagaaaac tgcgcctttt 2040
gccaaagcgc cctgctagaa tacgacgaca cgcaaggcgt catcaacatc atgtacatgc 2100
acgactcgga cgacgtcctt ttcgccctgg atccctacaa cgaagtggtg gtctcatctc 2160
cgcgaactca ctacctcatg cttttgaaaa acggtacggt actagaagta actgacgtcg 2220
tcgtggacgc caccgacagt cgtctcctca tgatgtccgt ctacgcgcta tcggccatca 2280
tcggcatcta tctgctctac cgcatgctca agacatgcga ttacaaggac gatgacgata 2340
agtgatgata ataggctgga gcctcggtgg ccatgcttct tgccccttgg gcctcccccc 2400
agcccctcct ccccttcctg cacccgtacc cccgtggtct ttgaataaag tctgagtggg 2460
cggc 2464
<210> 226
<211> 1045
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 226
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgtgccg ccgcccggat tgcggcttct 120
ctttctcacc tggaccggtg atactgctgt ggtgttgcct tctgctgccc attgtttcct 180
cagccgccgt cagcgtcgct cctaccgccg ccgagaaagt ccccgcggag tgccccgaac 240
taacgcgccg atgcttgttg ggtgaggtgt ttgagggtga caagtatgaa agttggctgc 300
gcccgttggt gaatgttacc gggcgcgatg gcccgctatc gcaacttatc cgttaccgtc 360
ccgttacgcc ggaggccgcc aactccgtgc tgttggacga ggctttcctg gacactctgg 420
ccctgctgta caacaatccg gatcaattgc gggccctgct gacgctgttg agctcggaca 480
cagcgccgcg ctggatgacg gtgatgcgcg gctacagcga gtgcggcgat ggctcgccgg 540
ccgtgtacac gtgcgtggac gacctgtgcc gcggctacga cctcacgcga ctgtcatacg 600
ggcgcagcat cttcacggaa cacgtgttag gcttcgagct ggtgccaccg tctctcttta 660
acgtggtggt ggccatacgc aacgaagcca cgcgtaccaa ccgcgccgtg cgtctgcccg 720
tgagcaccgc tgccgcgccc gagggcatca cgctctttta cggcctgtac aacgcagtga 780
aggaattctg cctgcgtcac cagctggacc cgccgctgct acgccaccta gataaatact 840
acgccggact gccgcccgag ctgaagcaga cgcgcgtcaa cctgccggct cactcgcgct 900
atggccctca agcagtggat gctcgctgat aataggctgg agcctcggtg gccatgcttc 960
ttgccccttg ggcctccccc cagcccctcc tccccttcct gcacccgtac ccccgtggtc 1020
tttgaataaa gtctgagtgg gcggc 1045
<210> 227
<211> 1072
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 227
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgtgccg ccgcccggat tgcggcttct 120
ctttctcacc tggaccggtg atactgctgt ggtgttgcct tctgctgccc attgtttcct 180
cagccgccgt cagcgtcgct cctaccgccg ccgagaaagt ccccgcggag tgccccgaac 240
taacgcgccg atgcttgttg ggtgaggtgt ttgagggtga caagtatgaa agttggctgc 300
gcccgttggt gaatgttacc gggcgcgatg gcccgctatc gcaacttatc cgttaccgtc 360
ccgttacgcc ggaggccgcc aactccgtgc tgttggacga ggctttcctg gacactctgg 420
ccctgctgta caacaatccg gatcaattgc gggccctgct gacgctgttg agctcggaca 480
cagcgccgcg ctggatgacg gtgatgcgcg gctacagcga gtgcggcgat ggctcgccgg 540
ccgtgtacac gtgcgtggac gacctgtgcc gcggctacga cctcacgcga ctgtcatacg 600
ggcgcagcat cttcacggaa cacgtgttag gcttcgagct ggtgccaccg tctctcttta 660
acgtggtggt ggccatacgc aacgaagcca cgcgtaccaa ccgcgccgtg cgtctgcccg 720
tgagcaccgc tgccgcgccc gagggcatca cgctctttta cggcctgtac aacgcagtga 780
aggaattctg cctgcgtcac cagctggacc cgccgctgct acgccaccta gataaatact 840
acgccggact gccgcccgag ctgaagcaga cgcgcgtcaa cctgccggct cactcgcgct 900
atggccctca agcagtggat gctcgcgatt acaaggacga tgacgataag tgatgataat 960
aggctggagc ctcggtggcc atgcttcttg ccccttgggc ctccccccag cccctcctcc 1020
ccttcctgca cccgtacccc cgtggtcttt gaataaagtc tgagtgggcg gc 1072
<210> 228
<211> 2932
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 228
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggaatc caggatctgg tgcctggtag 120
tctgcgttaa cttgtgtatc gtctgtctgg gtgctgcggt ttcctcatct tctactcgtg 180
gaacttctgc tactcacagt caccattcct ctcatacgac gtctgctgct cactctcgat 240
ccggttcagt ctctcaacgc gtaacttctt cccaaacggt cagccatggt gttaacgaga 300
ccatctacaa cactaccctc aagtacggag atgtggtggg ggtcaatacc accaagtacc 360
cctatcgcgt gtgttctatg gcccagggta cggatcttat tcgctttgaa cgtaatatcg 420
tctgcacctc gatgaagccc atcaatgaag acctggacga gggcatcatg gtggtctaca 480
aacgcaacat cgtcgcgcac acctttaagg tacgagtcta ccagaaggtt ttgacgtttc 540
gtcgtagcta cgcttacatc cacaccactt atctgctggg cagcaacacg gaatacgtgg 600
cgcctcctat gtgggagatt catcatatca acagccacag tcagtgctac agttcctaca 660
gccgcgttat agcaggcacg gttttcgtgg cttatcatag ggacagctat gaaaacaaaa 720
ccatgcaatt aatgcccgac gattattcca acacccacag tacccgttac gtgacggtca 780
aggatcaatg gcacagccgc ggcagcacct ggctctatcg tgagacctgt aatctgaatt 840
gtatggtgac catcactact gcgcgctcca aatatcctta tcattttttc gccacttcca 900
cgggtgacgt ggttgacatt tctcctttct acaacggaac caatcgcaat gccagctact 960
ttggagaaaa cgccgacaag tttttcattt ttccgaacta cactatcgtc tccgactttg 1020
gaagaccgaa ttctgcgtta gagacccaca ggttggtggc ttttcttgaa cgtgcggact 1080
cggtgatctc ctgggatata caggacgaaa agaatgtcac ttgtcaactc actttctggg 1140
aagcctcgga acgcaccatt cgttccgaag ccgaggactc gtatcacttt tcttctgcca 1200
aaatgaccgc cactttctta tctaagaagc aagaggtgaa catgtccgac tctgcgctgg 1260
actgcgtacg tgatgaggct ataaataagt tacagcagat tttcaatact tcatacaatc 1320
aaacatatga aaaatatgga aacgtgtccg tctttgaaac cactggtggt ttggtagtgt 1380
tctggcaagg tatcaagcaa aaatctctgg tggaactcga acgtttggcc aaccgctcca 1440
gtctgaatct tactcataat agaaccaaaa gaagtacaga tggcaacaat gcaactcatt 1500
tatccaacat ggaatcggtg cacaatctgg tctacgccca gctgcagttc acctatgaca 1560
cgttgcgcgg ttacatcaac cgggcgctgg cgcaaatcgc agaagcctgg tgtgtggatc 1620
aacggcgcac cctagaggtc ttcaaggaac tcagcaagat caacccgtca gccattctct 1680
cggccattta caacaaaccg attgccgcgc gtttcatggg tgatgtcttg ggcctggcca 1740
gctgcgtgac catcaaccaa accagcgtca aggtgctgcg tgatatgaac gtgaaggagt 1800
cgccaggacg ctgctactca cgacccgtgg tcatctttaa tttcgccaac agctcgtacg 1860
tgcagtacgg tcaactgggc gaggacaacg aaatcctgtt gggcaaccac cgcactgagg 1920
aatgtcagct tcccagcctc aagatcttca tcgccgggaa ctcggcctac gagtacgtgg 1980
actacctctt caaacgcatg attgacctca gcagtatctc caccgtcgac agcatgatcg 2040
ccctggatat cgacccgctg gaaaataccg acttcagggt actggaactt tactcgcaga 2100
aagagctgcg ttccagcaac gtttttgacc tcgaagagat catgcgcgaa ttcaactcgt 2160
acaagcagcg ggtaaagtac gtggaggaca aggtagtcga cccgctaccg ccctacctca 2220
agggtctgga cgacctcatg agcggcctgg gcgccgcggg aaaggccgtt ggcgtagcca 2280
ttggggccgt gggtggcgcg gtggcctccg tggtcgaagg cgttgccacc ttcctcaaaa 2340
accccttcgg agcgttcacc atcatcctcg tggccatagc tgtagtcatt atcacttatt 2400
tgatctatac tcgacagcgg cgtttgtgca cgcagccgct gcagaacctc tttccctatc 2460
tggtgtccgc cgacgggacc accgtgacgt cgggcagcac caaagacacg tcgttacagg 2520
ctccgccttc ctacgaggaa agtgtttata attctggtcg caaaggaccg ggaccaccgt 2580
cgtctgatgc atccacggcg gctccgcctt acaccaacga gcaggcttac cagatgcttc 2640
tggccctggc ccgtctggac gcagagcagc gagcgcagca gaacggtaca gattctttgg 2700
acggacggac tggcacgcag gacaagggac agaagcccaa cctactagac cgactgcgac 2760
atcgcaaaaa cggctaccga cacttgaaag actctgacga agaagagaac gtctgataat 2820
aggctggagc ctcggtggcc atgcttcttg ccccttgggc ctccccccag cccctcctcc 2880
ccttcctgca cccgtacccc cgtggtcttt gaataaagtc tgagtgggcg gc 2932
<210> 229
<211> 2956
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 229
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggaatc caggatctgg tgcctggtag 120
tctgcgttaa cttgtgtatc gtctgtctgg gtgctgcggt ttcctcatct tctactcgtg 180
gaacttctgc tactcacagt caccattcct ctcatacgac gtctgctgct cactctcgat 240
ccggttcagt ctctcaacgc gtaacttctt cccaaacggt cagccatggt gttaacgaga 300
ccatctacaa cactaccctc aagtacggag atgtggtggg ggtcaatacc accaagtacc 360
cctatcgcgt gtgttctatg gcccagggta cggatcttat tcgctttgaa cgtaatatcg 420
tctgcacctc gatgaagccc atcaatgaag acctggacga gggcatcatg gtggtctaca 480
aacgcaacat cgtcgcgcac acctttaagg tacgagtcta ccagaaggtt ttgacgtttc 540
gtcgtagcta cgcttacatc cacaccactt atctgctggg cagcaacacg gaatacgtgg 600
cgcctcctat gtgggagatt catcatatca acagccacag tcagtgctac agttcctaca 660
gccgcgttat agcaggcacg gttttcgtgg cttatcatag ggacagctat gaaaacaaaa 720
ccatgcaatt aatgcccgac gattattcca acacccacag tacccgttac gtgacggtca 780
aggatcaatg gcacagccgc ggcagcacct ggctctatcg tgagacctgt aatctgaatt 840
gtatggtgac catcactact gcgcgctcca aatatcctta tcattttttc gccacttcca 900
cgggtgacgt ggttgacatt tctcctttct acaacggaac caatcgcaat gccagctact 960
ttggagaaaa cgccgacaag tttttcattt ttccgaacta cactatcgtc tccgactttg 1020
gaagaccgaa ttctgcgtta gagacccaca ggttggtggc ttttcttgaa cgtgcggact 1080
cggtgatctc ctgggatata caggacgaaa agaatgtcac ttgtcaactc actttctggg 1140
aagcctcgga acgcaccatt cgttccgaag ccgaggactc gtatcacttt tcttctgcca 1200
aaatgaccgc cactttctta tctaagaagc aagaggtgaa catgtccgac tctgcgctgg 1260
actgcgtacg tgatgaggct ataaataagt tacagcagat tttcaatact tcatacaatc 1320
aaacatatga aaaatatgga aacgtgtccg tctttgaaac cactggtggt ttggtagtgt 1380
tctggcaagg tatcaagcaa aaatctctgg tggaactcga acgtttggcc aaccgctcca 1440
gtctgaatct tactcataat agaaccaaaa gaagtacaga tggcaacaat gcaactcatt 1500
tatccaacat ggaatcggtg cacaatctgg tctacgccca gctgcagttc acctatgaca 1560
cgttgcgcgg ttacatcaac cgggcgctgg cgcaaatcgc agaagcctgg tgtgtggatc 1620
aacggcgcac cctagaggtc ttcaaggaac tcagcaagat caacccgtca gccattctct 1680
cggccattta caacaaaccg attgccgcgc gtttcatggg tgatgtcttg ggcctggcca 1740
gctgcgtgac catcaaccaa accagcgtca aggtgctgcg tgatatgaac gtgaaggagt 1800
cgccaggacg ctgctactca cgacccgtgg tcatctttaa tttcgccaac agctcgtacg 1860
tgcagtacgg tcaactgggc gaggacaacg aaatcctgtt gggcaaccac cgcactgagg 1920
aatgtcagct tcccagcctc aagatcttca tcgccgggaa ctcggcctac gagtacgtgg 1980
actacctctt caaacgcatg attgacctca gcagtatctc caccgtcgac agcatgatcg 2040
ccctggatat cgacccgctg gaaaataccg acttcagggt actggaactt tactcgcaga 2100
aagagctgcg ttccagcaac gtttttgacc tcgaagagat catgcgcgaa ttcaactcgt 2160
acaagcagcg ggtaaagtac gtggaggaca aggtagtcga cccgctaccg ccctacctca 2220
agggtctgga cgacctcatg agcggcctgg gcgccgcggg aaaggccgtt ggcgtagcca 2280
ttggggccgt gggtggcgcg gtggcctccg tggtcgaagg cgttgccacc ttcctcaaaa 2340
accccttcgg agcgttcacc atcatcctcg tggccatagc tgtagtcatt atcacttatt 2400
tgatctatac tcgacagcgg cgtttgtgca cgcagccgct gcagaacctc tttccctatc 2460
tggtgtccgc cgacgggacc accgtgacgt cgggcagcac caaagacacg tcgttacagg 2520
ctccgccttc ctacgaggaa agtgtttata attctggtcg caaaggaccg ggaccaccgt 2580
cgtctgatgc atccacggcg gctccgcctt acaccaacga gcaggcttac cagatgcttc 2640
tggccctggc ccgtctggac gcagagcagc gagcgcagca gaacggtaca gattctttgg 2700
acggacggac tggcacgcag gacaagggac agaagcccaa cctactagac cgactgcgac 2760
atcgcaaaaa cggctaccga cacttgaaag actctgacga agaagagaac gtcgattaca 2820
aggacgatga cgataagtga taataggctg gagcctcggt ggccatgctt cttgcccctt 2880
gggcctcccc ccagcccctc ctccccttcc tgcacccgta cccccgtggt ctttgaataa 2940
agtctgagtg ggcggc 2956
<210> 230
<211> 2356
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 230
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggcc aggcctcccc tcctacctca 120
tcatcctcgc cgtctgtctc ttcagccacc tactttcgtc acgatatggc gcagaagccg 180
tatccgaacc gctggacaaa gcgtttcacc tactgctcaa cacctacggg agacccatcc 240
gcttcctgcg tgaaaatacc acccagtgta cctacaacag cagcctccgt aacagcacgg 300
tcgtcaggga aaacgccatc agtttcaact ttttccaaag ctataatcaa tactatgtat 360
tccatatgcc tcgatgtctt tttgcgggtc ctctggcgga gcagtttctg aaccaggtag 420
atctgaccga aaccctggaa agataccaac agagacttaa cacttacgcg ctggtatcca 480
aagacctggc cagctaccga tctttttcgc agcagctaaa ggcacaagac agcctaggtg 540
aacagcccac cactgtgcca ccgcccattg acctgtcaat acctcacgtt tggatgccac 600
cgcaaaccac tccacacggc tggacagaat cacataccac ctcaggacta caccgaccac 660
actttaacca gacctgtatc ctctttgatg gacacgatct actattcagc accgtcacac 720
cttgtttgca ccaaggcttt tacctcatcg acgaactacg ttacgttaaa ataacactga 780
ccgaggactt cttcgtagtt acggtgtcca tagacgacga cacacccatg ctgcttatct 840
tcggccatct tccacgcgta cttttcaaag cgccctatca acgcgacaac tttatactac 900
gacaaactga aaaacacgag ctcctggtgc tagttaagaa agatcaactg aaccgtcact 960
cttatctcaa agacccggac tttcttgacg ccgcacttga cttcaactac ctagacctca 1020
gcgcactact acgtaacagc tttcaccgtt acgccgtgga tgtactcaag agcggtcgat 1080
gtcagatgct ggaccgccgc acggtagaaa tggccttcgc ctacgcatta gcactgttcg 1140
cagcagcccg acaagaagag gccggcgccc aagtctccgt cccacgggcc ctagaccgcc 1200
aggccgcact cttacaaata caagaattta tgatcacctg cctctcacaa acaccaccac 1260
gcaccacgtt gctgctgtat cccacggccg tggacctggc caaacgagcc ctttggacac 1320
cgaatcagat caccgacatc accagcctcg tacgcctggt ctacatactc tctaaacaga 1380
atcagcaaca tctcatcccc caatgggcac tacgacagat cgccgacttt gccctaaaac 1440
tacacaaaac gcacctggcc tcttttcttt cagccttcgc acgccaagaa ctctacctca 1500
tgggcagcct cgtccactcc atgctggtac atacgacgga gagacgcgaa atcttcatcg 1560
tagaaacggg cctctgttca ttggccgagc tatcacactt tacgcagttg ttagctcatc 1620
cacaccacga atacctcagc gacctgtaca caccctgttc cagtagcggg cgacgcgatc 1680
actcgctcga acgcctcacg cgtctcttcc ccgatgccac cgtccccgct accgttcccg 1740
ccgccctctc catcctatct accatgcaac caagcacgct ggaaaccttc cccgacctgt 1800
tttgcttgcc gctcggcgaa tccttctccg cgctgaccgt ctccgaacac gtcagttata 1860
tcgtaacaaa ccagtacctg atcaaaggta tctcctaccc tgtctccacc accgtcgtag 1920
gccagagcct catcatcacc cagacggaca gtcaaactaa atgcgaactg acgcgcaaca 1980
tgcataccac acacagcatc acagtggcgc tcaacatttc gctagaaaac tgcgcctttt 2040
gccaaagcgc cctgctagaa tacgacgaca cgcaaggcgt catcaacatc atgtacatgc 2100
acgactcgga cgacgtcctt ttcgccctgg atccctacaa cgaagtggtg gtctcatctc 2160
cgcgaactca ctacctcatg cttttgaaaa acggtacggt actagaagta actgacgtcg 2220
tcgtggacgc caccgactga taataggctg gagcctcggt ggccatgctt cttgcccctt 2280
gggcctcccc ccagcccctc ctccccttcc tgcacccgta cccccgtggt ctttgaataa 2340
agtctgagtg ggcggc 2356
<210> 231
<211> 2383
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 231
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggcc aggcctcccc tcctacctca 120
tcatcctcgc cgtctgtctc ttcagccacc tactttcgtc acgatatggc gcagaagccg 180
tatccgaacc gctggacaaa gcgtttcacc tactgctcaa cacctacggg agacccatcc 240
gcttcctgcg tgaaaatacc acccagtgta cctacaacag cagcctccgt aacagcacgg 300
tcgtcaggga aaacgccatc agtttcaact ttttccaaag ctataatcaa tactatgtat 360
tccatatgcc tcgatgtctt tttgcgggtc ctctggcgga gcagtttctg aaccaggtag 420
atctgaccga aaccctggaa agataccaac agagacttaa cacttacgcg ctggtatcca 480
aagacctggc cagctaccga tctttttcgc agcagctaaa ggcacaagac agcctaggtg 540
aacagcccac cactgtgcca ccgcccattg acctgtcaat acctcacgtt tggatgccac 600
cgcaaaccac tccacacggc tggacagaat cacataccac ctcaggacta caccgaccac 660
actttaacca gacctgtatc ctctttgatg gacacgatct actattcagc accgtcacac 720
cttgtttgca ccaaggcttt tacctcatcg acgaactacg ttacgttaaa ataacactga 780
ccgaggactt cttcgtagtt acggtgtcca tagacgacga cacacccatg ctgcttatct 840
tcggccatct tccacgcgta cttttcaaag cgccctatca acgcgacaac tttatactac 900
gacaaactga aaaacacgag ctcctggtgc tagttaagaa agatcaactg aaccgtcact 960
cttatctcaa agacccggac tttcttgacg ccgcacttga cttcaactac ctagacctca 1020
gcgcactact acgtaacagc tttcaccgtt acgccgtgga tgtactcaag agcggtcgat 1080
gtcagatgct ggaccgccgc acggtagaaa tggccttcgc ctacgcatta gcactgttcg 1140
cagcagcccg acaagaagag gccggcgccc aagtctccgt cccacgggcc ctagaccgcc 1200
aggccgcact cttacaaata caagaattta tgatcacctg cctctcacaa acaccaccac 1260
gcaccacgtt gctgctgtat cccacggccg tggacctggc caaacgagcc ctttggacac 1320
cgaatcagat caccgacatc accagcctcg tacgcctggt ctacatactc tctaaacaga 1380
atcagcaaca tctcatcccc caatgggcac tacgacagat cgccgacttt gccctaaaac 1440
tacacaaaac gcacctggcc tcttttcttt cagccttcgc acgccaagaa ctctacctca 1500
tgggcagcct cgtccactcc atgctggtac atacgacgga gagacgcgaa atcttcatcg 1560
tagaaacggg cctctgttca ttggccgagc tatcacactt tacgcagttg ttagctcatc 1620
cacaccacga atacctcagc gacctgtaca caccctgttc cagtagcggg cgacgcgatc 1680
actcgctcga acgcctcacg cgtctcttcc ccgatgccac cgtccccgct accgttcccg 1740
ccgccctctc catcctatct accatgcaac caagcacgct ggaaaccttc cccgacctgt 1800
tttgcttgcc gctcggcgaa tccttctccg cgctgaccgt ctccgaacac gtcagttata 1860
tcgtaacaaa ccagtacctg atcaaaggta tctcctaccc tgtctccacc accgtcgtag 1920
gccagagcct catcatcacc cagacggaca gtcaaactaa atgcgaactg acgcgcaaca 1980
tgcataccac acacagcatc acagtggcgc tcaacatttc gctagaaaac tgcgcctttt 2040
gccaaagcgc cctgctagaa tacgacgaca cgcaaggcgt catcaacatc atgtacatgc 2100
acgactcgga cgacgtcctt ttcgccctgg atccctacaa cgaagtggtg gtctcatctc 2160
cgcgaactca ctacctcatg cttttgaaaa acggtacggt actagaagta actgacgtcg 2220
tcgtggacgc caccgacgat tacaaggacg atgacgataa gtgatgataa taggctggag 2280
cctcggtggc catgcttctt gccccttggg cctcccccca gcccctcctc cccttcctgc 2340
acccgtaccc ccgtggtctt tgaataaagt ctgagtgggc ggc 2383
<210> 232
<211> 2377
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 232
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggcc aggcctcccc tcctacctca 120
tcatcctcgc cgtctgtctc ttcagccacc tactttcgtc acgatatggc gcagaagccg 180
tatccgaacc gctggacaaa gcgtttcacc tactgctcaa cacctacggg agacccatcc 240
gcttcctgcg tgaaaatacc acccagtgta cctacaacag cagcctccgt aacagcacgg 300
tcgtcaggga aaacgccatc agtttcaact ttttccaaag ctataatcaa tactatgtat 360
tccatatgcc tcgatgtctt tttgcgggtc ctctggcgga gcagtttctg aaccaggtag 420
atctgaccga aaccctggaa agataccaac agagacttaa cacttacgcg ctggtatcca 480
aagacctggc cagctaccga tctttttcgc agcagctaaa ggcacaagac agcctaggtg 540
aacagcccac cactgtgcca ccgcccattg acctgtcaat acctcacgtt tggatgccac 600
cgcaaaccac tccacacggc tggacagaat cacataccac ctcaggacta caccgaccac 660
actttaacca gacctgtatc ctctttgatg gacacgatct actattcagc accgtcacac 720
cttgtttgca ccaaggcttt tacctcatcg acgaactacg ttacgttaaa ataacactga 780
ccgaggactt cttcgtagtt acggtgtcca tagacgacga cacacccatg ctgcttatct 840
tcggccatct tccacgcgta cttttcaaag cgccctatca acgcgacaac tttatactac 900
gacaaactga aaaacacgag ctcctggtgc tagttaagaa agatcaactg aaccgtcact 960
cttatctcaa agacccggac tttcttgacg ccgcacttga cttcaactac ctagacctca 1020
gcgcactact acgtaacagc tttcaccgtt acgccgtgga tgtactcaag agcggtcgat 1080
gtcagatgct ggaccgccgc acggtagaaa tggccttcgc ctacgcatta gcactgttcg 1140
cagcagcccg acaagaagag gccggcgccc aagtctccgt cccacgggcc ctagaccgcc 1200
aggccgcact cttacaaata caagaattta tgatcacctg cctctcacaa acaccaccac 1260
gcaccacgtt gctgctgtat cccacggccg tggacctggc caaacgagcc ctttggacac 1320
cgaatcagat caccgacatc accagcctcg tacgcctggt ctacatactc tctaaacaga 1380
atcagcaaca tctcatcccc caatgggcac tacgacagat cgccgacttt gccctaaaac 1440
tacacaaaac gcacctggcc tcttttcttt cagccttcgc acgccaagaa ctctacctca 1500
tgggcagcct cgtccactcc atgctggtac atacgacgga gagacgcgaa atcttcatcg 1560
tagaaacggg cctctgttca ttggccgagc tatcacactt tacgcagttg ttagctcatc 1620
cacaccacga atacctcagc gacctgtaca caccctgttc cagtagcggg cgacgcgatc 1680
actcgctcga acgcctcacg cgtctcttcc ccgatgccac cgtccccgct accgttcccg 1740
ccgccctctc catcctatct accatgcaac caagcacgct ggaaaccttc cccgacctgt 1800
tttgcttgcc gctcggcgaa tccttctccg cgctgaccgt ctccgaacac gtcagttata 1860
tcgtaacaaa ccagtacctg atcaaaggta tctcctaccc tgtctccacc accgtcgtag 1920
gccagagcct catcatcacc cagacggaca gtcaaactaa atgcgaactg acgcgcaaca 1980
tgcataccac acacagcatc acagtggcgc tcaacatttc gctagaaaac tgcgcctttt 2040
gccaaagcgc cctgctagaa tacgacgaca cgcaaggcgt catcaacatc atgtacatgc 2100
acgactcgga cgacgtcctt ttcgccctgg atccctacaa cgaagtggtg gtctcatctc 2160
cgcgaactca ctacctcatg cttttgaaaa acggtacggt actagaagta actgacgtcg 2220
tcgtggacgc caccgaccac catcaccacc atcactgatg ataataggct ggagcctcgg 2280
tggccatgct tcttgcccct tgggcctccc cccagcccct cctccccttc ctgcacccgt 2340
acccccgtgg tctttgaata aagtctgagt gggcggc 2377
<210> 233
<211> 2287
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 233
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggaatc caggatctgg tgcctggtag 120
tctgcgttaa cttgtgtatc gtctgtctgg gtgctgcggt ttcctcatct tctactcgtg 180
gaacttctgc tactcacagt caccattcct ctcatacgac gtctgctgct cactctcgat 240
ccggttcagt ctctcaacgc gtaacttctt cccaaacggt cagccatggt gttaacgaga 300
ccatctacaa cactaccctc aagtacggag atgtggtggg ggtcaatacc accaagtacc 360
cctatcgcgt gtgttctatg gcccagggta cggatcttat tcgctttgaa cgtaatatcg 420
tctgcacctc gatgaagccc atcaatgaag acctggacga gggcatcatg gtggtctaca 480
aacgcaacat cgtcgcgcac acctttaagg tacgagtcta ccagaaggtt ttgacgtttc 540
gtcgtagcta cgcttacatc cacaccactt atctgctggg cagcaacacg gaatacgtgg 600
cgcctcctat gtgggagatt catcatatca acagccacag tcagtgctac agttcctaca 660
gccgcgttat agcaggcacg gttttcgtgg cttatcatag ggacagctat gaaaacaaaa 720
ccatgcaatt aatgcccgac gattattcca acacccacag tacccgttac gtgacggtca 780
aggatcaatg gcacagccgc ggcagcacct ggctctatcg tgagacctgt aatctgaatt 840
gtatggtgac catcactact gcgcgctcca aatatcctta tcattttttc gccacttcca 900
cgggtgacgt ggttgacatt tctcctttct acaacggaac caatcgcaat gccagctact 960
ttggagaaaa cgccgacaag tttttcattt ttccgaacta cactatcgtc tccgactttg 1020
gaagaccgaa ttctgcgtta gagacccaca ggttggtggc ttttcttgaa cgtgcggact 1080
cggtgatctc ctgggatata caggacgaaa agaatgtcac ttgtcaactc actttctggg 1140
aagcctcgga acgcaccatt cgttccgaag ccgaggactc gtatcacttt tcttctgcca 1200
aaatgaccgc cactttctta tctaagaagc aagaggtgaa catgtccgac tctgcgctgg 1260
actgcgtacg tgatgaggct ataaataagt tacagcagat tttcaatact tcatacaatc 1320
aaacatatga aaaatatgga aacgtgtccg tctttgaaac cactggtggt ttggtagtgt 1380
tctggcaagg tatcaagcaa aaatctctgg tggaactcga acgtttggcc aaccgctcca 1440
gtctgaatct tactcataat agaaccaaaa gaagtacaga tggcaacaat gcaactcatt 1500
tatccaacat ggaatcggtg cacaatctgg tctacgccca gctgcagttc acctatgaca 1560
cgttgcgcgg ttacatcaac cgggcgctgg cgcaaatcgc agaagcctgg tgtgtggatc 1620
aacggcgcac cctagaggtc ttcaaggaac tcagcaagat caacccgtca gccattctct 1680
cggccattta caacaaaccg attgccgcgc gtttcatggg tgatgtcttg ggcctggcca 1740
gctgcgtgac catcaaccaa accagcgtca aggtgctgcg tgatatgaac gtgaaggagt 1800
cgccaggacg ctgctactca cgacccgtgg tcatctttaa tttcgccaac agctcgtacg 1860
tgcagtacgg tcaactgggc gaggacaacg aaatcctgtt gggcaaccac cgcactgagg 1920
aatgtcagct tcccagcctc aagatcttca tcgccgggaa ctcggcctac gagtacgtgg 1980
actacctctt caaacgcatg attgacctca gcagtatctc caccgtcgac agcatgatcg 2040
ccctggatat cgacccgctg gaaaataccg acttcagggt actggaactt tactcgcaga 2100
aagagctgcg ttccagcaac gtttttgacc tcgaagagat catgcgcgaa ttcaactcgt 2160
acaagcagtg ataataggct ggagcctcgg tggccatgct tcttgcccct tgggcctccc 2220
cccagcccct cctccccttc ctgcacccgt acccccgtgg tctttgaata aagtctgagt 2280
gggcggc 2287
<210> 234
<211> 2311
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 234
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggaatc caggatctgg tgcctggtag 120
tctgcgttaa cttgtgtatc gtctgtctgg gtgctgcggt ttcctcatct tctactcgtg 180
gaacttctgc tactcacagt caccattcct ctcatacgac gtctgctgct cactctcgat 240
ccggttcagt ctctcaacgc gtaacttctt cccaaacggt cagccatggt gttaacgaga 300
ccatctacaa cactaccctc aagtacggag atgtggtggg ggtcaatacc accaagtacc 360
cctatcgcgt gtgttctatg gcccagggta cggatcttat tcgctttgaa cgtaatatcg 420
tctgcacctc gatgaagccc atcaatgaag acctggacga gggcatcatg gtggtctaca 480
aacgcaacat cgtcgcgcac acctttaagg tacgagtcta ccagaaggtt ttgacgtttc 540
gtcgtagcta cgcttacatc cacaccactt atctgctggg cagcaacacg gaatacgtgg 600
cgcctcctat gtgggagatt catcatatca acagccacag tcagtgctac agttcctaca 660
gccgcgttat agcaggcacg gttttcgtgg cttatcatag ggacagctat gaaaacaaaa 720
ccatgcaatt aatgcccgac gattattcca acacccacag tacccgttac gtgacggtca 780
aggatcaatg gcacagccgc ggcagcacct ggctctatcg tgagacctgt aatctgaatt 840
gtatggtgac catcactact gcgcgctcca aatatcctta tcattttttc gccacttcca 900
cgggtgacgt ggttgacatt tctcctttct acaacggaac caatcgcaat gccagctact 960
ttggagaaaa cgccgacaag tttttcattt ttccgaacta cactatcgtc tccgactttg 1020
gaagaccgaa ttctgcgtta gagacccaca ggttggtggc ttttcttgaa cgtgcggact 1080
cggtgatctc ctgggatata caggacgaaa agaatgtcac ttgtcaactc actttctggg 1140
aagcctcgga acgcaccatt cgttccgaag ccgaggactc gtatcacttt tcttctgcca 1200
aaatgaccgc cactttctta tctaagaagc aagaggtgaa catgtccgac tctgcgctgg 1260
actgcgtacg tgatgaggct ataaataagt tacagcagat tttcaatact tcatacaatc 1320
aaacatatga aaaatatgga aacgtgtccg tctttgaaac cactggtggt ttggtagtgt 1380
tctggcaagg tatcaagcaa aaatctctgg tggaactcga acgtttggcc aaccgctcca 1440
gtctgaatct tactcataat agaaccaaaa gaagtacaga tggcaacaat gcaactcatt 1500
tatccaacat ggaatcggtg cacaatctgg tctacgccca gctgcagttc acctatgaca 1560
cgttgcgcgg ttacatcaac cgggcgctgg cgcaaatcgc agaagcctgg tgtgtggatc 1620
aacggcgcac cctagaggtc ttcaaggaac tcagcaagat caacccgtca gccattctct 1680
cggccattta caacaaaccg attgccgcgc gtttcatggg tgatgtcttg ggcctggcca 1740
gctgcgtgac catcaaccaa accagcgtca aggtgctgcg tgatatgaac gtgaaggagt 1800
cgccaggacg ctgctactca cgacccgtgg tcatctttaa tttcgccaac agctcgtacg 1860
tgcagtacgg tcaactgggc gaggacaacg aaatcctgtt gggcaaccac cgcactgagg 1920
aatgtcagct tcccagcctc aagatcttca tcgccgggaa ctcggcctac gagtacgtgg 1980
actacctctt caaacgcatg attgacctca gcagtatctc caccgtcgac agcatgatcg 2040
ccctggatat cgacccgctg gaaaataccg acttcagggt actggaactt tactcgcaga 2100
aagagctgcg ttccagcaac gtttttgacc tcgaagagat catgcgcgaa ttcaactcgt 2160
acaagcagga ttacaaggac gatgacgata agtgataata ggctggagcc tcggtggcca 2220
tgcttcttgc cccttgggcc tccccccagc ccctcctccc cttcctgcac ccgtaccccc 2280
gtggtctttg aataaagtct gagtgggcgg c 2311
<210> 235
<211> 2305
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 235
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggaatc caggatctgg tgcctggtag 120
tctgcgttaa cttgtgtatc gtctgtctgg gtgctgcggt ttcctcatct tctactcgtg 180
gaacttctgc tactcacagt caccattcct ctcatacgac gtctgctgct cactctcgat 240
ccggttcagt ctctcaacgc gtaacttctt cccaaacggt cagccatggt gttaacgaga 300
ccatctacaa cactaccctc aagtacggag atgtggtggg ggtcaatacc accaagtacc 360
cctatcgcgt gtgttctatg gcccagggta cggatcttat tcgctttgaa cgtaatatcg 420
tctgcacctc gatgaagccc atcaatgaag acctggacga gggcatcatg gtggtctaca 480
aacgcaacat cgtcgcgcac acctttaagg tacgagtcta ccagaaggtt ttgacgtttc 540
gtcgtagcta cgcttacatc cacaccactt atctgctggg cagcaacacg gaatacgtgg 600
cgcctcctat gtgggagatt catcatatca acagccacag tcagtgctac agttcctaca 660
gccgcgttat agcaggcacg gttttcgtgg cttatcatag ggacagctat gaaaacaaaa 720
ccatgcaatt aatgcccgac gattattcca acacccacag tacccgttac gtgacggtca 780
aggatcaatg gcacagccgc ggcagcacct ggctctatcg tgagacctgt aatctgaatt 840
gtatggtgac catcactact gcgcgctcca aatatcctta tcattttttc gccacttcca 900
cgggtgacgt ggttgacatt tctcctttct acaacggaac caatcgcaat gccagctact 960
ttggagaaaa cgccgacaag tttttcattt ttccgaacta cactatcgtc tccgactttg 1020
gaagaccgaa ttctgcgtta gagacccaca ggttggtggc ttttcttgaa cgtgcggact 1080
cggtgatctc ctgggatata caggacgaaa agaatgtcac ttgtcaactc actttctggg 1140
aagcctcgga acgcaccatt cgttccgaag ccgaggactc gtatcacttt tcttctgcca 1200
aaatgaccgc cactttctta tctaagaagc aagaggtgaa catgtccgac tctgcgctgg 1260
actgcgtacg tgatgaggct ataaataagt tacagcagat tttcaatact tcatacaatc 1320
aaacatatga aaaatatgga aacgtgtccg tctttgaaac cactggtggt ttggtagtgt 1380
tctggcaagg tatcaagcaa aaatctctgg tggaactcga acgtttggcc aaccgctcca 1440
gtctgaatct tactcataat agaaccaaaa gaagtacaga tggcaacaat gcaactcatt 1500
tatccaacat ggaatcggtg cacaatctgg tctacgccca gctgcagttc acctatgaca 1560
cgttgcgcgg ttacatcaac cgggcgctgg cgcaaatcgc agaagcctgg tgtgtggatc 1620
aacggcgcac cctagaggtc ttcaaggaac tcagcaagat caacccgtca gccattctct 1680
cggccattta caacaaaccg attgccgcgc gtttcatggg tgatgtcttg ggcctggcca 1740
gctgcgtgac catcaaccaa accagcgtca aggtgctgcg tgatatgaac gtgaaggagt 1800
cgccaggacg ctgctactca cgacccgtgg tcatctttaa tttcgccaac agctcgtacg 1860
tgcagtacgg tcaactgggc gaggacaacg aaatcctgtt gggcaaccac cgcactgagg 1920
aatgtcagct tcccagcctc aagatcttca tcgccgggaa ctcggcctac gagtacgtgg 1980
actacctctt caaacgcatg attgacctca gcagtatctc caccgtcgac agcatgatcg 2040
ccctggatat cgacccgctg gaaaataccg acttcagggt actggaactt tactcgcaga 2100
aagagctgcg ttccagcaac gtttttgacc tcgaagagat catgcgcgaa ttcaactcgt 2160
acaagcagca ccatcaccac catcactgat aataggctgg agcctcggtg gccatgcttc 2220
ttgccccttg ggcctccccc cagcccctcc tccccttcct gcacccgtac ccccgtggtc 2280
tttgaataaa gtctgagtgg gcggc 2305
<210> 236
<211> 724
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 236
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgagtcc caaagatctg acgccgttct 120
tgacggcgtt gtggctgcta ttgggtcaca gccgcgtgcc gcgggtgcgc gcagaagaat 180
gttgcgaatt cataaacgtc aaccacccgc cggaacgctg ttacgatttc aaaatgtgca 240
atcgcttcac cgtcgcgctg cggtgtccgg acggcgaagt ctgctacagt cccgagaaaa 300
cggctgagat tcgcgggatc gtcaccacca tgacccattc attgacacgc caggtcgtac 360
acaacaaact gacgagctgc aactacaatc cgttatacct cgaagctgac gggcgaatac 420
gctgcggcaa agtaaacgac aaggcgcagt acctgctggg cgccgctggc agcgttccct 480
atcgatggat caatctggaa tacgacaaga taacccggat cgtgggcctg gatcagtacc 540
tggagagcgt taagaaacac aaacggctgg atgtgtgccg cgctaaaatg ggctatatgc 600
tgcagtgata ataggctgga gcctcggtgg ccatgcttct tgccccttgg gcctcccccc 660
agcccctcct ccccttcctg cacccgtacc cccgtggtct ttgaataaag tctgagtggg 720
cggc 724
<210> 237
<211> 748
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 237
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgagtcc caaagatctg acgccgttct 120
tgacggcgtt gtggctgcta ttgggtcaca gccgcgtgcc gcgggtgcgc gcagaagaat 180
gttgcgaatt cataaacgtc aaccacccgc cggaacgctg ttacgatttc aaaatgtgca 240
atcgcttcac cgtcgcgctg cggtgtccgg acggcgaagt ctgctacagt cccgagaaaa 300
cggctgagat tcgcgggatc gtcaccacca tgacccattc attgacacgc caggtcgtac 360
acaacaaact gacgagctgc aactacaatc cgttatacct cgaagctgac gggcgaatac 420
gctgcggcaa agtaaacgac aaggcgcagt acctgctggg cgccgctggc agcgttccct 480
atcgatggat caatctggaa tacgacaaga taacccggat cgtgggcctg gatcagtacc 540
tggagagcgt taagaaacac aaacggctgg atgtgtgccg cgctaaaatg ggctatatgc 600
tgcaggatta caaggacgat gacgataagt gataataggc tggagcctcg gtggccatgc 660
ttcttgcccc ttgggcctcc ccccagcccc tcctcccctt cctgcacccg tacccccgtg 720
gtctttgaat aaagtctgag tgggcggc 748
<210> 238
<211> 853
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 238
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgctgcg gcttctgctt cgtcaccact 120
ttcactgcct gcttctgtgc gcggtttggg caacgccctg tctggcgtct ccgtggtcga 180
cgctaacagc aaaccagaat ccgtccccgc catggtctaa actgacgtat tccaaaccgc 240
atgacgcggc gacgttttac tgtccttttc tctatccctc gcccccacga tcccccttgc 300
aattctcggg gttccagcgg gtatcaacgg gtcccgagtg tcgcaacgag accctgtatc 360
tgctgtacaa ccgggaaggc cagaccttgg tggagagaag ctccacctgg gtgaaaaagg 420
tgatctggta cctgagcggt cggaaccaaa ccatcctcca acggatgccc cgaacggctt 480
cgaaaccgag cgacggaaac gtgcagatca gcgtggaaga cgccaagatt tttggagcgc 540
acatggtgcc caagcagacc aagctgctac gcttcgtcgt caacgatggc acacgttatc 600
agatgtgtgt gatgaagctg gagagctggg ctcacgtctt ccgggactac agcgtgtctt 660
ttcaggtgcg attgacgttc accgaggcca ataaccagac ttacaccttc tgcacccatc 720
ccaatctcat cgtttgataa taggctggag cctcggtggc catgcttctt gccccttggg 780
cctcccccca gcccctcctc cccttcctgc acccgtaccc ccgtggtctt tgaataaagt 840
ctgagtgggc ggc 853
<210> 239
<211> 880
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 239
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgctgcg gcttctgctt cgtcaccact 120
ttcactgcct gcttctgtgc gcggtttggg caacgccctg tctggcgtct ccgtggtcga 180
cgctaacagc aaaccagaat ccgtccccgc catggtctaa actgacgtat tccaaaccgc 240
atgacgcggc gacgttttac tgtccttttc tctatccctc gcccccacga tcccccttgc 300
aattctcggg gttccagcgg gtatcaacgg gtcccgagtg tcgcaacgag accctgtatc 360
tgctgtacaa ccgggaaggc cagaccttgg tggagagaag ctccacctgg gtgaaaaagg 420
tgatctggta cctgagcggt cggaaccaaa ccatcctcca acggatgccc cgaacggctt 480
cgaaaccgag cgacggaaac gtgcagatca gcgtggaaga cgccaagatt tttggagcgc 540
acatggtgcc caagcagacc aagctgctac gcttcgtcgt caacgatggc acacgttatc 600
agatgtgtgt gatgaagctg gagagctggg ctcacgtctt ccgggactac agcgtgtctt 660
ttcaggtgcg attgacgttc accgaggcca ataaccagac ttacaccttc tgcacccatc 720
ccaatctcat cgttgattac aaggacgatg acgataagtg atgataatag gctggagcct 780
cggtggccat gcttcttgcc ccttgggcct ccccccagcc cctcctcccc ttcctgcacc 840
cgtacccccg tggtctttga ataaagtctg agtgggcggc 880
<210> 240
<211> 598
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 240
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggct gtgtcgggtg tggctgtctg 120
tttgtctgtg cgccgtggtg ctgggtcagt gccagcggga aaccgcggaa aaaaacgatt 180
attaccgagt accgcattac tgggacgcgt gctctcgcgc gctgcccgac caaacccgtt 240
acaagtatgt ggaacagctc gtggacctca cgttgaacta ccactacgat gcgagccacg 300
gcttggacaa ctttgacgtg ctcaagagaa tcaacgtgac cgaggtgtcg ttgctcatca 360
gcgactttag acgtcagaac cgtcgcggcg gcaccaacaa aaggaccacg ttcaacgccg 420
ccggttcgct ggcgccacac gcccggagcc tcgagttcag cgtgcggctc tttgccaact 480
gataataggc tggagcctcg gtggccatgc ttcttgcccc ttgggcctcc ccccagcccc 540
tcctcccctt cctgcacccg tacccccgtg gtctttgaat aaagtctgag tgggcggc 598
<210> 241
<211> 625
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 241
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggct gtgtcgggtg tggctgtctg 120
tttgtctgtg cgccgtggtg ctgggtcagt gccagcggga aaccgcggaa aaaaacgatt 180
attaccgagt accgcattac tgggacgcgt gctctcgcgc gctgcccgac caaacccgtt 240
acaagtatgt ggaacagctc gtggacctca cgttgaacta ccactacgat gcgagccacg 300
gcttggacaa ctttgacgtg ctcaagagaa tcaacgtgac cgaggtgtcg ttgctcatca 360
gcgactttag acgtcagaac cgtcgcggcg gcaccaacaa aaggaccacg ttcaacgccg 420
ccggttcgct ggcgccacac gcccggagcc tcgagttcag cgtgcggctc tttgccaacg 480
attacaagga cgatgacgat aagtgatgat aataggctgg agcctcggtg gccatgcttc 540
ttgccccttg ggcctccccc cagcccctcc tccccttcct gcacccgtac ccccgtggtc 600
tttgaataaa gtctgagtgg gcggc 625
<210> 242
<211> 2434
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 242
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggac agacgagaga 60
gaagcacgcc aattctgcct gcttaagcca tgcggccagg cctcccctcc tacctcatca 120
tcctcgccgt ctgtctcttc agccacctac tttcgtcacg atatggcgca gaagccgtat 180
ccgaaccgct ggacaaagcg tttcacctac tgctcaacac ctacgggaga cccatccgct 240
tcctgcgtga aaataccacc cagtgtacct acaacagcag cctccgtaac agcacggtcg 300
tcagggaaaa cgccatcagt ttcaactttt tccaaagcta taatcaatac tatgtattcc 360
atatgcctcg atgtcttttt gcgggtcctc tggcggagca gtttctgaac caggtagatc 420
tgaccgaaac cctggaaaga taccaacaga gacttaacac ttacgcgctg gtatccaaag 480
acctggccag ctaccgatct ttttcgcagc agctaaaggc acaagacagc ctaggtgaac 540
agcccaccac tgtgccaccg cccattgacc tgtcaatacc tcacgtttgg atgccaccgc 600
aaaccactcc acacggctgg acagaatcac ataccacctc aggactacac cgaccacact 660
ttaaccagac ctgtatcctc tttgatggac acgatctact attcagcacc gtcacacctt 720
gtttgcacca aggcttttac ctcatcgacg aactacgtta cgttaaaata acactgaccg 780
aggacttctt cgtagttacg gtgtccatag acgacgacac acccatgctg cttatcttcg 840
gccatcttcc acgcgtactt ttcaaagcgc cctatcaacg cgacaacttt atactacgac 900
aaactgaaaa acacgagctc ctggtgctag ttaagaaaga tcaactgaac cgtcactctt 960
atctcaaaga cccggacttt cttgacgccg cacttgactt caactaccta gacctcagcg 1020
cactactacg taacagcttt caccgttacg ccgtggatgt actcaagagc ggtcgatgtc 1080
agatgctgga ccgccgcacg gtagaaatgg ccttcgccta cgcattagca ctgttcgcag 1140
cagcccgaca agaagaggcc ggcgcccaag tctccgtccc acgggcccta gaccgccagg 1200
ccgcactctt acaaatacaa gaatttatga tcacctgcct ctcacaaaca ccaccacgca 1260
ccacgttgct gctgtatccc acggccgtgg acctggccaa acgagccctt tggacaccga 1320
atcagatcac cgacatcacc agcctcgtac gcctggtcta catactctct aaacagaatc 1380
agcaacatct catcccccaa tgggcactac gacagatcgc cgactttgcc ctaaaactac 1440
acaaaacgca cctggcctct tttctttcag ccttcgcacg ccaagaactc tacctcatgg 1500
gcagcctcgt ccactccatg ctggtacata cgacggagag acgcgaaatc ttcatcgtag 1560
aaacgggcct ctgttcattg gccgagctat cacactttac gcagttgtta gctcatccac 1620
accacgaata cctcagcgac ctgtacacac cctgttccag tagcgggcga cgcgatcact 1680
cgctcgaacg cctcacgcgt ctcttccccg atgccaccgt ccccgctacc gttcccgccg 1740
ccctctccat cctatctacc atgcaaccaa gcacgctgga aaccttcccc gacctgtttt 1800
gcttgccgct cggcgaatcc ttctccgcgc tgaccgtctc cgaacacgtc agttatatcg 1860
taacaaacca gtacctgatc aaaggtatct cctaccctgt ctccaccacc gtcgtaggcc 1920
agagcctcat catcacccag acggacagtc aaactaaatg cgaactgacg cgcaacatgc 1980
ataccacaca cagcatcaca gtggcgctca acatttcgct agaaaactgc gccttttgcc 2040
aaagcgccct gctagaatac gacgacacgc aaggcgtcat caacatcatg tacatgcacg 2100
actcggacga cgtccttttc gccctggatc cctacaacga agtggtggtc tcatctccgc 2160
gaactcacta cctcatgctt ttgaaaaacg gtacggtact agaagtaact gacgtcgtcg 2220
tggacgccac cgacagtcgt ctcctcatga tgtccgtcta cgcgctatcg gccatcatcg 2280
gcatctatct gctctaccgc atgctcaaga catgctgata ataggctgga gcctcggtgg 2340
ccatgcttct tgccccttgg gcctcccccc agcccctcct ccccttcctg cacccgtacc 2400
cccgtggtct ttgaataaag tctgagtggg cggc 2434
<210> 243
<211> 1044
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 243
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggct taagcaggca 60
gaattggccc ttagcctgta ccagccgaac catgtgccgc cgcccggatt gcggcttctc 120
tttctcacct ggaccggtga tactgctgtg gtgttgcctt ctgctgccca ttgtttcctc 180
agccgccgtc agcgtcgctc ctaccgccgc cgagaaagtc cccgcggagt gccccgaact 240
aacgcgccga tgcttgttgg gtgaggtgtt tgagggtgac aagtatgaaa gttggctgcg 300
cccgttggtg aatgttaccg ggcgcgatgg cccgctatcg caacttatcc gttaccgtcc 360
cgttacgccg gaggccgcca actccgtgct gttggacgag gctttcctgg acactctggc 420
cctgctgtac aacaatccgg atcaattgcg ggccctgctg acgctgttga gctcggacac 480
agcgccgcgc tggatgacgg tgatgcgcgg ctacagcgag tgcggcgatg gctcgccggc 540
cgtgtacacg tgcgtggacg acctgtgccg cggctacgac ctcacgcgac tgtcatacgg 600
gcgcagcatc ttcacggaac acgtgttagg cttcgagctg gtgccaccgt ctctctttaa 660
cgtggtggtg gccatacgca acgaagccac gcgtaccaac cgcgccgtgc gtctgcccgt 720
gagcaccgct gccgcgcccg agggcatcac gctcttttac ggcctgtaca acgcagtgaa 780
ggaattctgc ctgcgtcacc agctggaccc gccgctgcta cgccacctag ataaatacta 840
cgccggactg ccgcccgagc tgaagcagac gcgcgtcaac ctgccggctc actcgcgcta 900
tggccctcaa gcagtggatg ctcgctgata ataggctgga gcctcggtgg ccatgcttct 960
tgccccttgg gcctcccccc agcccctcct ccccttcctg cacccgtacc cccgtggtct 1020
ttgaataaag tctgagtggg cggc 1044
<210> 244
<211> 1045
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 244
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggtg gctcttatat 60
ttcttcttac tcttcttttc tctcttattt ccatgtgccg ccgcccggat tgcggcttct 120
ctttctcacc tggaccggtg atactgctgt ggtgttgcct tctgctgccc attgtttcct 180
cagccgccgt cagcgtcgct cctaccgccg ccgagaaagt ccccgcggag tgccccgaac 240
taacgcgccg atgcttgttg ggtgaggtgt ttgagggtga caagtatgaa agttggctgc 300
gcccgttggt gaatgttacc gggcgcgatg gcccgctatc gcaacttatc cgttaccgtc 360
ccgttacgcc ggaggccgcc aactccgtgc tgttggacga ggctttcctg gacactctgg 420
ccctgctgta caacaatccg gatcaattgc gggccctgct gacgctgttg agctcggaca 480
cagcgccgcg ctggatgacg gtgatgcgcg gctacagcga gtgcggcgat ggctcgccgg 540
ccgtgtacac gtgcgtggac gacctgtgcc gcggctacga cctcacgcga ctgtcatacg 600
ggcgcagcat cttcacggaa cacgtgttag gcttcgagct ggtgccaccg tctctcttta 660
acgtggtggt ggccatacgc aacgaagcca cgcgtaccaa ccgcgccgtg cgtctgcccg 720
tgagcaccgc tgccgcgccc gagggcatca cgctctttta cggcctgtac aacgcagtga 780
aggaattctg cctgcgtcac cagctggacc cgccgctgct acgccaccta gataaatact 840
acgccggact gccgcccgag ctgaagcaga cgcgcgtcaa cctgccggct cactcgcgct 900
atggccctca agcagtggat gctcgctgat aataggctgg agcctcggtg gccatgcttc 960
ttgccccttg ggcctccccc cagcccctcc tccccttcct gcacccgtac ccccgtggtc 1020
tttgaataaa gtctgagtgg gcggc 1045
<210> 245
<211> 722
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 245
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggtt cggctggtac 60
aggctaacca gaagacagat aagagcctcc atgagtccca aagatctgac gccgttcttg 120
acggcgttgt ggctgctatt gggtcacagc cgcgtgccgc gggtgcgcgc agaagaatgt 180
tgcgaattca taaacgtcaa ccacccgccg gaacgctgtt acgatttcaa aatgtgcaat 240
cgcttcaccg tcgcgctgcg gtgtccggac ggcgaagtct gctacagtcc cgagaaaacg 300
gctgagattc gcgggatcgt caccaccatg acccattcat tgacacgcca ggtcgtacac 360
aacaaactga cgagctgcaa ctacaatccg ttatacctcg aagctgacgg gcgaatacgc 420
tgcggcaaag taaacgacaa ggcgcagtac ctgctgggcg ccgctggcag cgttccctat 480
cgatggatca atctggaata cgacaagata acccggatcg tgggcctgga tcagtacctg 540
gagagcgtta agaaacacaa acggctggat gtgtgccgcg ctaaaatggg ctatatgctg 600
cagtgataat aggctggagc ctcggtggcc atgcttcttg ccccttgggc ctccccccag 660
cccctcctcc ccttcctgca cccgtacccc cgtggtcttt gaataaagtc tgagtgggcg 720
gc 722
<210> 246
<211> 853
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 246
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggtg gctcttatat 60
ttcttcttag tccgaattcg aagtacggct acatgctgcg gcttctgctt cgtcaccact 120
ttcactgcct gcttctgtgc gcggtttggg caacgccctg tctggcgtct ccgtggtcga 180
cgctaacagc aaaccagaat ccgtccccgc catggtctaa actgacgtat tccaaaccgc 240
atgacgcggc gacgttttac tgtccttttc tctatccctc gcccccacga tcccccttgc 300
aattctcggg gttccagcgg gtatcaacgg gtcccgagtg tcgcaacgag accctgtatc 360
tgctgtacaa ccgggaaggc cagaccttgg tggagagaag ctccacctgg gtgaaaaagg 420
tgatctggta cctgagcggt cggaaccaaa ccatcctcca acggatgccc cgaacggctt 480
cgaaaccgag cgacggaaac gtgcagatca gcgtggaaga cgccaagatt tttggagcgc 540
acatggtgcc caagcagacc aagctgctac gcttcgtcgt caacgatggc acacgttatc 600
agatgtgtgt gatgaagctg gagagctggg ctcacgtctt ccgggactac agcgtgtctt 660
ttcaggtgcg attgacgttc accgaggcca ataaccagac ttacaccttc tgcacccatc 720
ccaatctcat cgtttgataa taggctggag cctcggtggc catgcttctt gccccttggg 780
cctcccccca gcccctcctc cccttcctgc acccgtaccc ccgtggtctt tgaataaagt 840
ctgagtgggc ggc 853
<210> 247
<211> 853
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 247
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggtg gctcttatat 60
ttcttcttag tccgaattcg aagtacggct acatgctgcg gcttctgctt cgtcaccact 120
ttcactgcct gcttctgtgc gcggtttggg caacgccctg tctggcgtct ccgtggtcga 180
cgctaacagc aaaccagaat ccgtccccgc catggtctaa actgacgtat tccaaaccgc 240
atgacgcggc gacgttttac tgtccttttc tctatccctc gcccccacga tcccccttgc 300
aattctcggg gttccagcgg gtatcaacgg gtcccgagtg tcgcaacgag accctgtatc 360
tgctgtacaa ccgggaaggc cagaccttgg tggagagaag ctccacctgg gtgaaaaagg 420
tgatctggta cctgagcggt cggaaccaaa ccatcctcca acggatgccc cgaacggctt 480
cgaaaccgag cgacggaaac gtgcagatca gcgtggaaga cgccaagatt tttggagcgc 540
acatggtgcc caagcagacc aagctgctac gcttcgtcgt caacgatggc acacgttatc 600
agatgtgtgt gatgaagctg gagagctggg ctcacgtctt ccgggactac agcgtgtctt 660
ttcaggtgcg attgacgttc accgaggcca ataaccagac ttacaccttc tgcacccatc 720
ccaatctcat cgtttgataa taggctggag cctcggtggc catgcttctt gccccttggg 780
cctcccccca gcccctcctc cccttcctgc acccgtaccc ccgtggtctt tgaataaagt 840
ctgagtgggc ggc 853
<210> 248
<211> 597
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 248
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggta gccgtacttc 60
gaattcggac aagcttctct ctcgtctgtc catgcggctg tgtcgggtgt ggctgtctgt 120
ttgtctgtgc gccgtggtgc tgggtcagtg ccagcgggaa accgcggaaa aaaacgatta 180
ttaccgagta ccgcattact gggacgcgtg ctctcgcgcg ctgcccgacc aaacccgtta 240
caagtatgtg gaacagctcg tggacctcac gttgaactac cactacgatg cgagccacgg 300
cttggacaac tttgacgtgc tcaagagaat caacgtgacc gaggtgtcgt tgctcatcag 360
cgactttaga cgtcagaacc gtcgcggcgg caccaacaaa aggaccacgt tcaacgccgc 420
cggttcgctg gcgccacacg cccggagcct cgagttcagc gtgcggctct ttgccaactg 480
ataataggct ggagcctcgg tggccatgct tcttgcccct tgggcctccc cccagcccct 540
cctccccttc ctgcacccgt acccccgtgg tctttgaata aagtctgagt gggcggc 597
<210> 249
<211> 597
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 249
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggta gccgtacttc 60
gaattcggac tttcttttct ctcttatttc catgcggctg tgtcgggtgt ggctgtctgt 120
ttgtctgtgc gccgtggtgc tgggtcagtg ccagcgggaa accgcggaaa aaaacgatta 180
ttaccgagta ccgcattact gggacgcgtg ctctcgcgcg ctgcccgacc aaacccgtta 240
caagtatgtg gaacagctcg tggacctcac gttgaactac cactacgatg cgagccacgg 300
cttggacaac tttgacgtgc tcaagagaat caacgtgacc gaggtgtcgt tgctcatcag 360
cgactttaga cgtcagaacc gtcgcggcgg caccaacaaa aggaccacgt tcaacgccgc 420
cggttcgctg gcgccacacg cccggagcct cgagttcagc gtgcggctct ttgccaactg 480
ataataggct ggagcctcgg tggccatgct tcttgcccct tgggcctccc cccagcccct 540
cctccccttc ctgcacccgt acccccgtgg tctttgaata aagtctgagt gggcggc 597
<210> 250
<211> 3364
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 250
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggagtc gcgcggtcgc cgttgtcccg 120
aaatgatatc cgtactgggt cccatttcgg ggcacgtgct gaaagccgtg tttagtcgcg 180
gcgatacgcc ggtgctgccg cacgagacgc gactcctgca gacgggtatc cacgtacgcg 240
tgagccagcc ctcgctgatc ctggtgtcgc agtacacgcc cgactcgacg ccatgccacc 300
gcggcgacaa tcagctgcag gtgcagcaca cgtactttac gggcagcgag gtggagaacg 360
tgtcggtcaa cgtgcacaac cccacgggcc gaagcatctg ccccagccaa gagcccatgt 420
cgatctatgt gtacgcgctg ccgctcaaga tgctgaacat ccccagcatc aacgtgcacc 480
actacccgtc ggcggccgag cgcaaacacc gacacctgcc cgtagccgac gctgttattc 540
acgcgtcggg caagcagatg tggcaggcgc gtctcacggt ctcgggactg gcctggacgc 600
gtcagcagaa ccagtggaaa gagcccgacg tctactacac gtcagcgttc gtgtttccca 660
ccaaggacgt ggcactgcgg cacgtggtgt gcgcgcacga gctggtttgc tccatggaga 720
acacgcgcgc aaccaagatg caggtgatag gtgaccagta cgtcaaggtg tacctggagt 780
ccttctgcga ggacgtgccc tccggcaagc tctttatgca cgtcacgctg ggctctgacg 840
tggaagagga cctaacgatg acccgcaacc cgcaaccctt catgcgcccc cacgagcgca 900
acggctttac ggtgttgtgt cccaaaaata tgataatcaa accgggcaag atctcgcaca 960
tcatgctgga tgtggctttt acctcacacg agcattttgg gctgctgtgt cccaagagca 1020
tcccgggcct gagcatctca ggtaacctgt tgatgaacgg gcagcaaatc ttcctggagg 1080
tacaagcgat acgcgagacc gtggaactgc gtcagtacga tcccgtggct gcgctcttct 1140
ttttcgatat cgacttgttg ctgcagcgcg ggcctcagta cagcgagcac cccaccttca 1200
ccagccagta tcgcatccag ggcaagcttg agtaccgaca cacctgggac cggcacgacg 1260
agggtgccgc ccagggcgac gacgacgtct ggaccagcgg atcggactcc gacgaagaac 1320
tcgtaaccac cgagcgtaag acgccccgcg tcaccggcgg cggcgccatg gcgagcgcct 1380
ccacttccgc gggccgcaaa cgcaaatcag catcctcggc gacggcgtgc acggcgggcg 1440
ttatgacacg cggccgcctt aaggccgagt ccaccgtcgc gcccgaagag gacaccgacg 1500
aggattccga caacgaaatc cacaatccgg ccgtgttcac ctggccgccc tggcaggccg 1560
gcatcctggc ccgcaacctg gtgcccatgg tggctacggt tcagggtcag aatctgaagt 1620
accaggagtt cttctgggac gccaacgaca tctaccgcat cttcgccgaa ttggaaggcg 1680
tatggcagcc cgctgcgcaa cccaaacgtc gccgccaccg gcaagacgcc ttgcccgggc 1740
catgcatcgc ctcgacgccc aaaaagcacc gaggtgagtc ctctgccaag agaaagatgg 1800
accctgataa tcctgacgag ggcccttcct ccaaggtgcc acggcccgag acacccgtga 1860
ccaaggccac gacgttcctg cagactatgt taaggaagga ggttaacagt cagctgagcc 1920
tgggagaccc gctgttccca gaattggccg aagaatccct caaaaccttt gaacaagtga 1980
ccgaggattg caacgagaac cccgaaaaag atgtcctgac agaactcgtc aaacagatta 2040
aggttcgagt ggacatggtg cggcatagaa tcaaggagca catgctgaaa aaatataccc 2100
agacggaaga aaaattcact ggcgccttta atatgatggg aggatgtttg cagaatgcct 2160
tagatatctt agataaggtt catgagcctt tcgaggacat gaagtgtatt gggctaacta 2220
tgcagagcat gtatgagaac tacattgtac ctgaggataa gcgggagatg tggatggctt 2280
gtattaagga gctgcatgat gtgagcaagg gcgccgctaa caagttgggg ggtgcactgc 2340
aggctaaggc ccgtgctaaa aaggatgaac ttaggagaaa gatgatgtat atgtgctaca 2400
ggaatataga gttctttacc aagaactcag ccttccctaa gaccaccaat ggctgcagtc 2460
aggccatggc ggcattgcag aacttgcctc agtgctctcc tgatgagatt atgtcttatg 2520
cccagaaaat ctttaagatt ttggatgagg agagagacaa ggtgctcacg cacattgatc 2580
acatatttat ggatatcctc actacatgtg tggaaacaat gtgtaatgag tacaaggtca 2640
ctagtgacgc ttgtatgatg accatgtacg ggggcatctc tctcttaagt gagttctgtc 2700
gggtgctgtg ctgctatgtc ttagaggaga ctagtgtgat gctggccaag cggcctctga 2760
taaccaagcc tgaggttatc agtgtaatga agcgccgcat tgaggagatc tgcatgaagg 2820
tctttgccca gtacattctg ggggccgatc ctttgagagt ctgctctcct agtgtggatg 2880
acctacgggc catcgccgag gagtcagatg aggaagaggc tattgtagcc tacactttgg 2940
ccaccgctgg tgccagctcc tctgattctc tggtgtcacc tccagagtcc cctgtacccg 3000
cgactatccc tctgtcctca gtaattgtgg ctgagaacag tgatcaggaa gaaagtgaac 3060
agagtgatga ggaacaggag gagggtgctc aggaggagcg ggaggacact gtgtctgtca 3120
agtctgagcc agtgtctgag atagaggaag ttgcctcaga ggaagaggag gatggtgctg 3180
aggaacccac cgcctctgga ggcaagagca cccaccctat ggtgactaga agcaaggctg 3240
accagtgata ataggctgga gcctcggtgg ccatgcttct tgccccttgg gcctcccccc 3300
agcccctcct ccccttcctg cacccgtacc cccgtggtct ttgaataaag tctgagtggg 3360
cggc 3364
<210> 251
<211> 3388
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 251
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatggagtc gcgcggtcgc cgttgtcccg 120
aaatgatatc cgtactgggt cccatttcgg ggcacgtgct gaaagccgtg tttagtcgcg 180
gcgatacgcc ggtgctgccg cacgagacgc gactcctgca gacgggtatc cacgtacgcg 240
tgagccagcc ctcgctgatc ctggtgtcgc agtacacgcc cgactcgacg ccatgccacc 300
gcggcgacaa tcagctgcag gtgcagcaca cgtactttac gggcagcgag gtggagaacg 360
tgtcggtcaa cgtgcacaac cccacgggcc gaagcatctg ccccagccaa gagcccatgt 420
cgatctatgt gtacgcgctg ccgctcaaga tgctgaacat ccccagcatc aacgtgcacc 480
actacccgtc ggcggccgag cgcaaacacc gacacctgcc cgtagccgac gctgttattc 540
acgcgtcggg caagcagatg tggcaggcgc gtctcacggt ctcgggactg gcctggacgc 600
gtcagcagaa ccagtggaaa gagcccgacg tctactacac gtcagcgttc gtgtttccca 660
ccaaggacgt ggcactgcgg cacgtggtgt gcgcgcacga gctggtttgc tccatggaga 720
acacgcgcgc aaccaagatg caggtgatag gtgaccagta cgtcaaggtg tacctggagt 780
ccttctgcga ggacgtgccc tccggcaagc tctttatgca cgtcacgctg ggctctgacg 840
tggaagagga cctaacgatg acccgcaacc cgcaaccctt catgcgcccc cacgagcgca 900
acggctttac ggtgttgtgt cccaaaaata tgataatcaa accgggcaag atctcgcaca 960
tcatgctgga tgtggctttt acctcacacg agcattttgg gctgctgtgt cccaagagca 1020
tcccgggcct gagcatctca ggtaacctgt tgatgaacgg gcagcaaatc ttcctggagg 1080
tacaagcgat acgcgagacc gtggaactgc gtcagtacga tcccgtggct gcgctcttct 1140
ttttcgatat cgacttgttg ctgcagcgcg ggcctcagta cagcgagcac cccaccttca 1200
ccagccagta tcgcatccag ggcaagcttg agtaccgaca cacctgggac cggcacgacg 1260
agggtgccgc ccagggcgac gacgacgtct ggaccagcgg atcggactcc gacgaagaac 1320
tcgtaaccac cgagcgtaag acgccccgcg tcaccggcgg cggcgccatg gcgagcgcct 1380
ccacttccgc gggccgcaaa cgcaaatcag catcctcggc gacggcgtgc acggcgggcg 1440
ttatgacacg cggccgcctt aaggccgagt ccaccgtcgc gcccgaagag gacaccgacg 1500
aggattccga caacgaaatc cacaatccgg ccgtgttcac ctggccgccc tggcaggccg 1560
gcatcctggc ccgcaacctg gtgcccatgg tggctacggt tcagggtcag aatctgaagt 1620
accaggagtt cttctgggac gccaacgaca tctaccgcat cttcgccgaa ttggaaggcg 1680
tatggcagcc cgctgcgcaa cccaaacgtc gccgccaccg gcaagacgcc ttgcccgggc 1740
catgcatcgc ctcgacgccc aaaaagcacc gaggtgagtc ctctgccaag agaaagatgg 1800
accctgataa tcctgacgag ggcccttcct ccaaggtgcc acggcccgag acacccgtga 1860
ccaaggccac gacgttcctg cagactatgt taaggaagga ggttaacagt cagctgagcc 1920
tgggagaccc gctgttccca gaattggccg aagaatccct caaaaccttt gaacaagtga 1980
ccgaggattg caacgagaac cccgaaaaag atgtcctgac agaactcgtc aaacagatta 2040
aggttcgagt ggacatggtg cggcatagaa tcaaggagca catgctgaaa aaatataccc 2100
agacggaaga aaaattcact ggcgccttta atatgatggg aggatgtttg cagaatgcct 2160
tagatatctt agataaggtt catgagcctt tcgaggacat gaagtgtatt gggctaacta 2220
tgcagagcat gtatgagaac tacattgtac ctgaggataa gcgggagatg tggatggctt 2280
gtattaagga gctgcatgat gtgagcaagg gcgccgctaa caagttgggg ggtgcactgc 2340
aggctaaggc ccgtgctaaa aaggatgaac ttaggagaaa gatgatgtat atgtgctaca 2400
ggaatataga gttctttacc aagaactcag ccttccctaa gaccaccaat ggctgcagtc 2460
aggccatggc ggcattgcag aacttgcctc agtgctctcc tgatgagatt atgtcttatg 2520
cccagaaaat ctttaagatt ttggatgagg agagagacaa ggtgctcacg cacattgatc 2580
acatatttat ggatatcctc actacatgtg tggaaacaat gtgtaatgag tacaaggtca 2640
ctagtgacgc ttgtatgatg accatgtacg ggggcatctc tctcttaagt gagttctgtc 2700
gggtgctgtg ctgctatgtc ttagaggaga ctagtgtgat gctggccaag cggcctctga 2760
taaccaagcc tgaggttatc agtgtaatga agcgccgcat tgaggagatc tgcatgaagg 2820
tctttgccca gtacattctg ggggccgatc ctttgagagt ctgctctcct agtgtggatg 2880
acctacgggc catcgccgag gagtcagatg aggaagaggc tattgtagcc tacactttgg 2940
ccaccgctgg tgccagctcc tctgattctc tggtgtcacc tccagagtcc cctgtacccg 3000
cgactatccc tctgtcctca gtaattgtgg ctgagaacag tgatcaggaa gaaagtgaac 3060
agagtgatga ggaacaggag gagggtgctc aggaggagcg ggaggacact gtgtctgtca 3120
agtctgagcc agtgtctgag atagaggaag ttgcctcaga ggaagaggag gatggtgctg 3180
aggaacccac cgcctctgga ggcaagagca cccaccctat ggtgactaga agcaaggctg 3240
accaggatta caaggacgat gacgataagt gataataggc tggagcctcg gtggccatgc 3300
ttcttgcccc ttgggcctcc ccccagcccc tcctcccctt cctgcacccg tacccccgtg 3360
gtctttgaat aaagtctgag tgggcggc 3388
<210> 252
<211> 3352
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 252
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggcc aggcctcccc tcctacctca 120
tcatcctcgc cgtctgtctc ttcagccacc tactttcgtc acgatatggc gcagaagccg 180
tatccgaacc gctggacaaa gcgtttcacc tactgctcaa cacctacggg agacccatcc 240
gcttcctgcg tgaaaatacc acccagtgta cctacaacag cagcctccgt aacagcacgg 300
tcgtcaggga aaacgccatc agtttcaact ttttccaaag ctataatcaa tactatgtat 360
tccatatgcc tcgatgtctt tttgcgggtc ctctggcgga gcagtttctg aaccaggtag 420
atctgaccga aaccctggaa agataccaac agagacttaa cacttacgcg ctggtatcca 480
aagacctggc cagctaccga tctttttcgc agcagctaaa ggcacaagac agcctaggtg 540
aacagcccac cactgtgcca ccgcccattg acctgtcaat acctcacgtt tggatgccac 600
cgcaaaccac tccacacggc tggacagaat cacataccac ctcaggacta caccgaccac 660
actttaacca gacctgtatc ctctttgatg gacacgatct actattcagc accgtcacac 720
cttgtttgca ccaaggcttt tacctcatcg acgaactacg ttacgttaaa ataacactga 780
ccgaggactt cttcgtagtt acggtgtcca tagacgacga cacacccatg ctgcttatct 840
tcggccatct tccacgcgta cttttcaaag cgccctatca acgcgacaac tttatactac 900
gacaaactga aaaacacgag ctcctggtgc tagttaagaa agatcaactg aaccgtcact 960
cttatctcaa agacccggac tttcttgacg ccgcacttga cttcaactac ctagacctca 1020
gcgcactact acgtaacagc tttcaccgtt acgccgtgga tgtactcaag agcggtcgat 1080
gtcagatgct ggaccgccgc acggtagaaa tggccttcgc ctacgcatta gcactgttcg 1140
cagcagcccg acaagaagag gccggcgccc aagtctccgt cccacgggcc ctagaccgcc 1200
aggccgcact cttacaaata caagaattta tgatcacctg cctctcacaa acaccaccac 1260
gcaccacgtt gctgctgtat cccacggccg tggacctggc caaacgagcc ctttggacac 1320
cgaatcagat caccgacatc accagcctcg tacgcctggt ctacatactc tctaaacaga 1380
atcagcaaca tctcatcccc caatgggcac tacgacagat cgccgacttt gccctaaaac 1440
tacacaaaac gcacctggcc tcttttcttt cagccttcgc acgccaagaa ctctacctca 1500
tgggcagcct cgtccactcc atgctggtac atacgacgga gagacgcgaa atcttcatcg 1560
tagaaacggg cctctgttca ttggccgagc tatcacactt tacgcagttg ttagctcatc 1620
cacaccacga atacctcagc gacctgtaca caccctgttc cagtagcggg cgacgcgatc 1680
actcgctcga acgcctcacg cgtctcttcc ccgatgccac cgtccccgct accgttcccg 1740
ccgccctctc catcctatct accatgcaac caagcacgct ggaaaccttc cccgacctgt 1800
tttgcttgcc gctcggcgaa tccttctccg cgctgaccgt ctccgaacac gtcagttata 1860
tcgtaacaaa ccagtacctg atcaaaggta tctcctaccc tgtctccacc accgtcgtag 1920
gccagagcct catcatcacc cagacggaca gtcaaactaa atgcgaactg acgcgcaaca 1980
tgcataccac acacagcatc acagtggcgc tcaacatttc gctagaaaac tgcgcctttt 2040
gccaaagcgc cctgctagaa tacgacgaca cgcaaggcgt catcaacatc atgtacatgc 2100
acgactcgga cgacgtcctt ttcgccctgg atccctacaa cgaagtggtg gtctcatctc 2160
cgcgaactca ctacctcatg cttttgaaaa acggtacggt actagaagta actgacgtcg 2220
tcgtggacgc caccgacagt cgtctcctca tgatgtccgt ctacgcgcta tcggccatca 2280
tcggcatcta tctgctctac cgcatgctca agacatgccg cgccaagagg agcggaagcg 2340
gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac cctggaccta 2400
tgtgccgccg cccggattgc ggcttctctt tctcacctgg accggtgata ctgctgtggt 2460
gttgccttct gctgcccatt gtttcctcag ccgccgtcag cgtcgctcct accgccgccg 2520
agaaagtccc cgcggagtgc cccgaactaa cgcgccgatg cttgttgggt gaggtgtttg 2580
agggtgacaa gtatgaaagt tggctgcgcc cgttggtgaa tgttaccggg cgcgatggcc 2640
cgctatcgca acttatccgt taccgtcccg ttacgccgga ggccgccaac tccgtgctgt 2700
tggacgaggc tttcctggac actctggccc tgctgtacaa caatccggat caattgcggg 2760
ccctgctgac gctgttgagc tcggacacag cgccgcgctg gatgacggtg atgcgcggct 2820
acagcgagtg cggcgatggc tcgccggccg tgtacacgtg cgtggacgac ctgtgccgcg 2880
gctacgacct cacgcgactg tcatacgggc gcagcatctt cacggaacac gtgttaggct 2940
tcgagctggt gccaccgtct ctctttaacg tggtggtggc catacgcaac gaagccacgc 3000
gtaccaaccg cgccgtgcgt ctgcccgtga gcaccgctgc cgcgcccgag ggcatcacgc 3060
tcttttacgg cctgtacaac gcagtgaagg aattctgcct gcgtcaccag ctggacccgc 3120
cgctgctacg ccacctagat aaatactacg ccggactgcc gcccgagctg aagcagacgc 3180
gcgtcaacct gccggctcac tcgcgctatg gccctcaagc agtggatgct cgctgataat 3240
aggctggagc ctcggtggcc atgcttcttg ccccttgggc ctccccccag cccctcctcc 3300
ccttcctgca cccgtacccc cgtggtcttt gaataaagtc tgagtgggcg gc 3352
<210> 253
<211> 1924
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 253
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgagtcc caaagatctg acgccgttct 120
tgacggcgtt gtggctgcta ttgggtcaca gccgcgtgcc gcgggtgcgc gcagaagaat 180
gttgcgaatt cataaacgtc aaccacccgc cggaacgctg ttacgatttc aaaatgtgca 240
atcgcttcac cgtcgcgctg cggtgtccgg acggcgaagt ctgctacagt cccgagaaaa 300
cggctgagat tcgcgggatc gtcaccacca tgacccattc attgacacgc caggtcgtac 360
acaacaaact gacgagctgc aactacaatc cgttatacct cgaagctgac gggcgaatac 420
gctgcggcaa agtaaacgac aaggcgcagt acctgctggg cgccgctggc agcgttccct 480
atcgatggat caatctggaa tacgacaaga taacccggat cgtgggcctg gatcagtacc 540
tggagagcgt taagaaacac aaacggctgg atgtgtgccg cgctaaaatg ggctatatgc 600
tgcagcgcgc caagaggagc ggaagcggag ctactaactt cagcctgctg aagcaggctg 660
gagacgtgga ggagaaccct ggacctatgc tgcggcttct gcttcgtcac cactttcact 720
gcctgcttct gtgcgcggtt tgggcaacgc cctgtctggc gtctccgtgg tcgacgctaa 780
cagcaaacca gaatccgtcc ccgccatggt ctaaactgac gtattccaaa ccgcatgacg 840
cggcgacgtt ttactgtcct tttctctatc cctcgccccc acgatccccc ttgcaattct 900
cggggttcca gcgggtatca acgggtcccg agtgtcgcaa cgagaccctg tatctgctgt 960
acaaccggga aggccagacc ttggtggaga gaagctccac ctgggtgaaa aaggtgatct 1020
ggtacctgag cggtcggaac caaaccatcc tccaacggat gccccgaacg gcttcgaaac 1080
cgagcgacgg aaacgtgcag atcagcgtgg aagacgccaa gatttttgga gcgcacatgg 1140
tgcccaagca gaccaagctg ctacgcttcg tcgtcaacga tggcacacgt tatcagatgt 1200
gtgtgatgaa gctggagagc tgggctcacg tcttccggga ctacagcgtg tcttttcagg 1260
tgcgattgac gttcaccgag gccaataacc agacttacac cttctgcacc catcccaatc 1320
tcatcgttcg cgccaagagg agcggaagcg gagtgaaaca gactttgaat tttgaccttc 1380
tcaagttggc gggagacgtg gagtccaacc ctggacctat gcggctgtgt cgggtgtggc 1440
tgtctgtttg tctgtgcgcc gtggtgctgg gtcagtgcca gcgggaaacc gcggaaaaaa 1500
acgattatta ccgagtaccg cattactggg acgcgtgctc tcgcgcgctg cccgaccaaa 1560
cccgttacaa gtatgtggaa cagctcgtgg acctcacgtt gaactaccac tacgatgcga 1620
gccacggctt ggacaacttt gacgtgctca agagaatcaa cgtgaccgag gtgtcgttgc 1680
tcatcagcga ctttagacgt cagaaccgtc gcggcggcac caacaaaagg accacgttca 1740
acgccgccgg ttcgctggcg ccacacgccc ggagcctcga gttcagcgtg cggctctttg 1800
ccaactgata ataggctgga gcctcggtgg ccatgcttct tgccccttgg gcctcccccc 1860
agcccctcct ccccttcctg cacccgtacc cccgtggtct ttgaataaag tctgagtggg 1920
cggc 1924
<210> 254
<211> 5146
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence
<400> 254
tcaagctttt ggaccctcgt acagaagcta atacgactca ctatagggaa ataagagaga 60
aaagaagagt aagaagaaat ataagagcca ccatgcggcc aggcctcccc tcctacctca 120
tcatcctcgc cgtctgtctc ttcagccacc tactttcgtc acgatatggc gcagaagccg 180
tatccgaacc gctggacaaa gcgtttcacc tactgctcaa cacctacggg agacccatcc 240
gcttcctgcg tgaaaatacc acccagtgta cctacaacag cagcctccgt aacagcacgg 300
tcgtcaggga aaacgccatc agtttcaact ttttccaaag ctataatcaa tactatgtat 360
tccatatgcc tcgatgtctt tttgcgggtc ctctggcgga gcagtttctg aaccaggtag 420
atctgaccga aaccctggaa agataccaac agagacttaa cacttacgcg ctggtatcca 480
aagacctggc cagctaccga tctttttcgc agcagctaaa ggcacaagac agcctaggtg 540
aacagcccac cactgtgcca ccgcccattg acctgtcaat acctcacgtt tggatgccac 600
cgcaaaccac tccacacggc tggacagaat cacataccac ctcaggacta caccgaccac 660
actttaacca gacctgtatc ctctttgatg gacacgatct actattcagc accgtcacac 720
cttgtttgca ccaaggcttt tacctcatcg acgaactacg ttacgttaaa ataacactga 780
ccgaggactt cttcgtagtt acggtgtcca tagacgacga cacacccatg ctgcttatct 840
tcggccatct tccacgcgta cttttcaaag cgccctatca acgcgacaac tttatactac 900
gacaaactga aaaacacgag ctcctggtgc tagttaagaa agatcaactg aaccgtcact 960
cttatctcaa agacccggac tttcttgacg ccgcacttga cttcaactac ctagacctca 1020
gcgcactact acgtaacagc tttcaccgtt acgccgtgga tgtactcaag agcggtcgat 1080
gtcagatgct ggaccgccgc acggtagaaa tggccttcgc ctacgcatta gcactgttcg 1140
cagcagcccg acaagaagag gccggcgccc aagtctccgt cccacgggcc ctagaccgcc 1200
aggccgcact cttacaaata caagaattta tgatcacctg cctctcacaa acaccaccac 1260
gcaccacgtt gctgctgtat cccacggccg tggacctggc caaacgagcc ctttggacac 1320
cgaatcagat caccgacatc accagcctcg tacgcctggt ctacatactc tctaaacaga 1380
atcagcaaca tctcatcccc caatgggcac tacgacagat cgccgacttt gccctaaaac 1440
tacacaaaac gcacctggcc tcttttcttt cagccttcgc acgccaagaa ctctacctca 1500
tgggcagcct cgtccactcc atgctggtac atacgacgga gagacgcgaa atcttcatcg 1560
tagaaacggg cctctgttca ttggccgagc tatcacactt tacgcagttg ttagctcatc 1620
cacaccacga atacctcagc gacctgtaca caccctgttc cagtagcggg cgacgcgatc 1680
actcgctcga acgcctcacg cgtctcttcc ccgatgccac cgtccccgct accgttcccg 1740
ccgccctctc catcctatct accatgcaac caagcacgct ggaaaccttc cccgacctgt 1800
tttgcttgcc gctcggcgaa tccttctccg cgctgaccgt ctccgaacac gtcagttata 1860
tcgtaacaaa ccagtacctg atcaaaggta tctcctaccc tgtctccacc accgtcgtag 1920
gccagagcct catcatcacc cagacggaca gtcaaactaa atgcgaactg acgcgcaaca 1980
tgcataccac acacagcatc acagtggcgc tcaacatttc gctagaaaac tgcgcctttt 2040
gccaaagcgc cctgctagaa tacgacgaca cgcaaggcgt catcaacatc atgtacatgc 2100
acgactcgga cgacgtcctt ttcgccctgg atccctacaa cgaagtggtg gtctcatctc 2160
cgcgaactca ctacctcatg cttttgaaaa acggtacggt actagaagta actgacgtcg 2220
tcgtggacgc caccgacagt cgtctcctca tgatgtccgt ctacgcgcta tcggccatca 2280
tcggcatcta tctgctctac cgcatgctca agacatgccg cgccaagagg agcggaagcg 2340
gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac cctggaccta 2400
tgtgccgccg cccggattgc ggcttctctt tctcacctgg accggtgata ctgctgtggt 2460
gttgccttct gctgcccatt gtttcctcag ccgccgtcag cgtcgctcct accgccgccg 2520
agaaagtccc cgcggagtgc cccgaactaa cgcgccgatg cttgttgggt gaggtgtttg 2580
agggtgacaa gtatgaaagt tggctgcgcc cgttggtgaa tgttaccggg cgcgatggcc 2640
cgctatcgca acttatccgt taccgtcccg ttacgccgga ggccgccaac tccgtgctgt 2700
tggacgaggc tttcctggac actctggccc tgctgtacaa caatccggat caattgcggg 2760
ccctgctgac gctgttgagc tcggacacag cgccgcgctg gatgacggtg atgcgcggct 2820
acagcgagtg cggcgatggc tcgccggccg tgtacacgtg cgtggacgac ctgtgccgcg 2880
gctacgacct cacgcgactg tcatacgggc gcagcatctt cacggaacac gtgttaggct 2940
tcgagctggt gccaccgtct ctctttaacg tggtggtggc catacgcaac gaagccacgc 3000
gtaccaaccg cgccgtgcgt ctgcccgtga gcaccgctgc cgcgcccgag ggcatcacgc 3060
tcttttacgg cctgtacaac gcagtgaagg aattctgcct gcgtcaccag ctggacccgc 3120
cgctgctacg ccacctagat aaatactacg ccggactgcc gcccgagctg aagcagacgc 3180
gcgtcaacct gccggctcac tcgcgctatg gccctcaagc agtggatgct cgccgcgcca 3240
agaggagcgg aagcggagtg aaacagactt tgaattttga ccttctcaag ttggcgggag 3300
acgtggagtc caaccctgga cctatgagtc ccaaagatct gacgccgttc ttgacggcgt 3360
tgtggctgct attgggtcac agccgcgtgc cgcgggtgcg cgcagaagaa tgttgcgaat 3420
tcataaacgt caaccacccg ccggaacgct gttacgattt caaaatgtgc aatcgcttca 3480
ccgtcgcgct gcggtgtccg gacggcgaag tctgctacag tcccgagaaa acggctgaga 3540
ttcgcgggat cgtcaccacc atgacccatt cattgacacg ccaggtcgta cacaacaaac 3600
tgacgagctg caactacaat ccgttatacc tcgaagctga cgggcgaata cgctgcggca 3660
aagtaaacga caaggcgcag tacctgctgg gcgccgctgg cagcgttccc tatcgatgga 3720
tcaatctgga atacgacaag ataacccgga tcgtgggcct ggatcagtac ctggagagcg 3780
ttaagaaaca caaacggctg gatgtgtgcc gcgctaaaat gggctatatg ctgcagcgcg 3840
ccaagaggag cggaagcgga cagtgtacta attatgctct cttgaaattg gctggagatg 3900
ttgagagcaa ccctggacct atgctgcggc ttctgcttcg tcaccacttt cactgcctgc 3960
ttctgtgcgc ggtttgggca acgccctgtc tggcgtctcc gtggtcgacg ctaacagcaa 4020
accagaatcc gtccccgcca tggtctaaac tgacgtattc caaaccgcat gacgcggcga 4080
cgttttactg tccttttctc tatccctcgc ccccacgatc ccccttgcaa ttctcggggt 4140
tccagcgggt atcaacgggt cccgagtgtc gcaacgagac cctgtatctg ctgtacaacc 4200
gggaaggcca gaccttggtg gagagaagct ccacctgggt gaaaaaggtg atctggtacc 4260
tgagcggtcg gaaccaaacc atcctccaac ggatgccccg aacggcttcg aaaccgagcg 4320
acggaaacgt gcagatcagc gtggaagacg ccaagatttt tggagcgcac atggtgccca 4380
agcagaccaa gctgctacgc ttcgtcgtca acgatggcac acgttatcag atgtgtgtga 4440
tgaagctgga gagctgggct cacgtcttcc gggactacag cgtgtctttt caggtgcgat 4500
tgacgttcac cgaggccaat aaccagactt acaccttctg cacccatccc aatctcatcg 4560
ttcgcgccaa gaggagcgga agcggagagg gcagaggaag tctgctaaca tgcggtgacg 4620
tcgaggagaa tcctggacct atgcggctgt gtcgggtgtg gctgtctgtt tgtctgtgcg 4680
ccgtggtgct gggtcagtgc cagcgggaaa ccgcggaaaa aaacgattat taccgagtac 4740
cgcattactg ggacgcgtgc tctcgcgcgc tgcccgacca aacccgttac aagtatgtgg 4800
aacagctcgt ggacctcacg ttgaactacc actacgatgc gagccacggc ttggacaact 4860
ttgacgtgct caagagaatc aacgtgaccg aggtgtcgtt gctcatcagc gactttagac 4920
gtcagaaccg tcgcggcggc accaacaaaa ggaccacgtt caacgccgcc ggttcgctgg 4980
cgccacacgc ccggagcctc gagttcagcg tgcggctctt tgccaactga taataggctg 5040
gagcctcggt ggccatgctt cttgcccctt gggcctcccc ccagcccctc ctccccttcc 5100
tgcacccgta cccccgtggt ctttgaataa agtctgagtg ggcggc 5146
<210> 255
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 255
Arg Ile Lys Gln Ile Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Gln
1 5 10 15
Tyr His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile Gly
20 25 30
<210> 256
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 256
Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu Asn Glu Ile
1 5 10 15
Ala Arg Ile Lys Lys Leu Ile Gly
20
<210> 257
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 257
Lys Ile Tyr His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile
1 5 10 15
Gly
<210> 258
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 258
Leu Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
1 5 10 15
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
20 25 30
<210> 259
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 259
Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu Asn Glu Ile
1 5 10 15
Ala Arg Ile Lys Lys Leu Ile Gly
20
<210> 260
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 260
Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg Val
1 5 10 15
Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser Asn Val Phe Asp
20 25 30
Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys
35 40 45
Tyr Val Glu Asp Lys
50
<210> 261
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 261
Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg Val
1 5 10 15
Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser Asn Val Phe Asp
20 25 30
Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys
35 40 45
Tyr Val
50
<210> 262
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 262
Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg
1 5 10 15
Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser Asn Val Phe
20 25 30
Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln Arg Val
35 40 45
Lys Tyr Val
50
<210> 263
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 263
Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg
1 5 10 15
Val
<210> 264
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 264
Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser
1 5 10 15
Gln Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met
20 25 30
Arg Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val
35 40 45
<210> 265
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 265
Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser
1 5 10 15
Gln Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met
20 25 30
Arg Glu Phe Asn Ser Tyr Lys Gln
35 40
<210> 266
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 266
Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser
1 5 10 15
Gln Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu
20 25
<210> 267
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 267
Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser
1 5 10 15
Gln Lys Glu Leu Arg Ser Ser
20
<210> 268
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 268
Ile Asp Pro Leu Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr
1 5 10 15
<210> 269
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 269
Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser Asn Val
1 5 10 15
Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln Arg
20 25 30
Val Lys Tyr Val
35
<210> 270
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 270
Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser Asn Val
1 5 10 15
Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln
20 25 30
<210> 271
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 271
Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser Asn Val
1 5 10 15
Phe Asp Leu
<210> 272
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 272
Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser
1 5 10
<210> 273
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 273
Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg Ser Ser Asn Val Phe
1 5 10 15
<210> 274
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 274
Ser Gln Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile
1 5 10 15
Met Arg Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val
20 25 30
<210> 275
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 275
Ser Gln Lys Glu Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile
1 5 10 15
Met Arg Glu Phe Asn Ser Tyr Lys Gln
20 25
<210> 276
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 276
Ser Gln Lys Glu Leu Arg Ser Ser Asn Val
1 5 10
<210> 277
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 277
Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln Arg Val
1 5 10 15
Lys Tyr Val
<210> 278
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 278
Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln Arg Val Lys
1 5 10 15
Tyr Val
<210> 279
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 279
Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr Lys Gln
1 5 10
<210> 280
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 280
Arg Val Lys Tyr Val Glu Asp Lys
1 5
<210> 281
<211> 56
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 281
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
1 5 10 15
Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu Arg
20 25 30
Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser
35 40 45
Tyr Lys Gln Arg Val Lys Tyr Val
50 55
<210> 282
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 282
Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu Glu
1 5 10 15
Asn Thr Asp Phe
20
<210> 283
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 283
Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn Arg Ala Leu Ala
1 5 10 15
Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg Thr Leu Glu Val
20 25 30
Phe Lys Glu Leu
35
<210> 284
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 284
Leu Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe
1 5 10 15
Asn Ser Tyr Lys Gln Arg Val Lys Tyr Val
20 25
<210> 285
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 285
Lys Arg Asn Ile Val Ala
1 5
<210> 286
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 286
Asp Asp Tyr Ser Asn Thr His Ser Thr Arg Tyr Val Thr Val Lys Asp
1 5 10 15
Gln Trp
<210> 287
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 287
Ala Thr Ser Thr Gly Asp Val
1 5
<210> 288
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 288
Val Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile
1 5 10 15
Asn Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg
20 25 30
Arg Thr Leu Glu Val Phe Lys
35
<210> 289
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic amino acid sequence
<400> 289
Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn Ser Tyr
1 5 10 15
Claims (26)
- 약물표적화가능한(druggable) 영역을 포함하는 당단백질 B (gB) 폴리펩티드를 갖는 인간 시토메갈로바이러스 (HCMV)를 화합물과 접촉시키는 것을 포함하는, HCMV 감염에 의해 유발되는 질환을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법으로서, 여기서 상기 화합물의 결합은 후보 치료제를 나타내는 것인 방법.
- 약물표적화가능한 영역을 포함하는 HCMV gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, HCMV 감염에 의해 유발되는 질환을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법으로서, 여기서 상기 gB 폴리펩티드의 기능 또는 활성의 조정은 후보 치료제를 나타내는 것인 방법.
- 제2항에 있어서, 상기 gB 폴리펩티드의 활성의 상기 조정이 융합후 입체형태에서 도메인 V 결합 홈에 대한 도메인 V의 결합을 배제하는 것을 수반하는 것인 방법.
- 약물표적화가능한 영역을 포함하는 gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, gB 폴리펩티드를 갖는 HCMV에 의한 감염에 의해 유발되는 질환을 치료 또는 예방하기 위한 후보 치료제를 확인하는 방법으로서, 여기서 상기 바이러스의 융합의 억제는 후보 치료제를 나타내는 것인 방법.
- 약물표적화가능한 영역을 포함하는 gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, gB 폴리펩티드를 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법으로서, 여기서 상기 바이러스의 바이러스 감염성의 억제는 후보 치료제를 나타내는 것인 방법.
- 약물표적화가능한 영역을 포함하는 gB 폴리펩티드를 화합물과 접촉시키는 것을 포함하는, gB 폴리펩티드를 갖는 HCMV에 의한 감염에 의해 유발되는 질환에 대한 후보 치료제를 확인하는 방법으로서, 여기서 대상체에서 상기 질환의 적어도 하나의 증상의 감소는 후보 치료제를 나타내는 것인 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 화합물이 하기 화합물 부류: 단백질, 펩티드, 폴리펩티드, 펩티드모방체, 항체, 핵산 및 소분자로부터 선택되는 것인 방법.
- 제7항에 있어서, 결합이 시험관내 검정을 사용하여 결정되는 것인 방법.
- 제7항에 있어서, 결합이 생체내 검정을 사용하여 결정되는 것인 방법.
- 제7항에 있어서, 약물표적화가능한 영역이 서열식별번호(SEQ ID NO): 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 또는 N676-Y690으로부터의 적어도 1개의 잔기를 포함하는 것인 방법.
- 제10항에 있어서, 약물표적화가능한 영역의 잔기가 융합후 입체형태인 방법.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 화합물이 M648-K700 (서열식별번호: 260), M648-V697 (서열식별번호: 261), S647-V697 (서열식별번호: 262), S647-V663 (서열식별번호: 263), I653-V697 (서열식별번호: 264), I653-Q692 (서열식별번호: 265), I653-L680 (서열식별번호: 266), I653-S675 (서열식별번호: 267), I653-Y667 (서열식별번호: 268), R662-V697 (서열식별번호: 269), R662-Q692 (서열식별번호: 270), R662-L680 (서열식별번호: 271), R662-S675 (서열식별번호: 272), L664-F678 (서열식별번호: 273), S668-V697 (서열식별번호: 274), S668-Q692 (서열식별번호: 275), S668-V677 (서열식별번호: 276), D679-V697 (서열식별번호: 277), L680-V697 (서열식별번호: 278), L680-Q692 (서열식별번호: 279) 및 R693-K700 (서열식별번호: 280)으로 이루어진 군으로부터 선택된 서열식별번호: 1 (타운(Towne) 균주)의 잔기를 포함하는 펩티드인 방법.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 화합물이 화합물의 라이브러리에 있는 것인 방법.
- 제13항에 있어서, 상기 라이브러리가 조합 합성 방법을 사용하여 생성되는 것인 방법.
- HCMV의 당단백질 B (gB)의 도메인 V 영역과 상호작용하는 HCMV 활성의 조정제인 후보 치료제.
- HCMV의 당단백질 B (gB)의 도메인 V의 이동을 배제하는 HCMV 활성의 조정제인 후보 치료제.
- 융합후 삼량체 내의 임의의 서브유닛에 의해 형성되는 삼량체 계면에서 도메인 V 잔기로부터의 적어도 1개의 잔기와 상호작용함으로써 입체형태 변화의 완료를 배제하는 HCMV 활성의 조정제인 후보 치료제.
- 서열식별번호: 1에 대해 적어도 80%의 상동성을 갖는 폴리펩티드 서열을 포함하는 HCMV 활성의 억제제인 후보 치료제.
- 제15항 내지 제18항 중 어느 한 항에 있어서, 후보 억제제가 M648-K700 (서열식별번호: 260), M648-V697 (서열식별번호: 261), S647-V697 (서열식별번호: 262), S647-V663 (서열식별번호: 263), I653-V697 (서열식별번호: 264), I653-Q692 (서열식별번호: 265), I653-L680 (서열식별번호: 266), I653-S675 (서열식별번호: 267), I653-Y667 (서열식별번호: 268), R662-V697 (서열식별번호: 269), R662-Q692 (서열식별번호: 270), R662-L680 (서열식별번호: 271), R662-S675 (서열식별번호: 272), L664-F678 (서열식별번호: 273), S668-V697 (서열식별번호: 274), S668-Q692 (서열식별번호: 275), S668-V677 (서열식별번호: 276), D679-V697 (서열식별번호: 277), L680-V697 (서열식별번호: 278), L680-Q692 (서열식별번호: 279) 및 R693-K700 (서열식별번호: 280)으로 이루어진 군으로부터 선택된 서열식별번호: 1 (타운 균주)의 잔기를 포함하는 펩티드인 후보 치료제.
- 제15항 내지 제19항 중 어느 한 항에 있어서, 핵산인 후보 치료제.
- 제15항 내지 제20항 중 어느 한 항의 후보 치료제를 포함하는 제약 조성물.
- HCMV 감염과 연관된 질환 또는 장애를 갖는 대상체에게 제21항의 제약 조성물을 투여하는 것을 포함하는, 상기 대상체를 치료하는 방법.
- 제21항의 제약 조성물을 대상체에게 투여하는 것을 포함하는, 대상체에서 HCMV 감염과 연관된 질환 또는 장애를 예방하는 방법.
- 제21항의 제약 조성물 및 임의로 사용 지침서를 포함하는, HCMV 감염과 연관된 질환 또는 장애를 치료 또는 예방하기 위한 키트.
- 서열식별번호: 1의 잔기 K130-A135, D216-W233, R258-K260, A267-V273, R327-D329, W349-E350, V480-K518 및 N676-Y690을 포함하는 HCMV gB의 약물표적화가능한 영역.
- 제25항에 있어서, 약물표적화가능한 영역의 잔기가 융합후 입체형태인 HCMV gB의 약물표적화가능한 영역.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163153164P | 2021-02-24 | 2021-02-24 | |
US63/153,164 | 2021-02-24 | ||
US202263306669P | 2022-02-04 | 2022-02-04 | |
US63/306,669 | 2022-02-04 | ||
PCT/IB2022/051504 WO2022180500A2 (en) | 2021-02-24 | 2022-02-21 | Novel druggable regions in the human cytomegalovirus glycoprotein b polypeptide and methods of use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230148416A true KR20230148416A (ko) | 2023-10-24 |
Family
ID=80625345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237032170A KR20230148416A (ko) | 2021-02-24 | 2022-02-21 | 인간 시토메갈로바이러스 당단백질 b 폴리펩티드 내의 신규 약물표적화가능한 영역및 그의 사용 방법 |
Country Status (9)
Country | Link |
---|---|
EP (1) | EP4298444A2 (ko) |
JP (1) | JP2024508799A (ko) |
KR (1) | KR20230148416A (ko) |
AU (1) | AU2022225742A1 (ko) |
CA (1) | CA3211449A1 (ko) |
CO (1) | CO2023010902A2 (ko) |
IL (1) | IL305419A (ko) |
PE (1) | PE20240083A1 (ko) |
WO (1) | WO2022180500A2 (ko) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1990014837A1 (en) | 1989-05-25 | 1990-12-13 | Chiron Corporation | Adjuvant formulation comprising a submicron oil droplet emulsion |
AU2010313339B2 (en) * | 2009-10-30 | 2016-05-26 | The Administrators Of The Tulane Educational Fund | Peptide compositions and methods for inhibiting herpesvirus infection |
SG11201408328VA (en) * | 2012-07-06 | 2015-02-27 | Novartis Ag | Complexes of cytomegalovirus proteins |
US11629172B2 (en) * | 2018-12-21 | 2023-04-18 | Pfizer Inc. | Human cytomegalovirus gB polypeptide |
EP4004018A1 (en) * | 2019-07-24 | 2022-06-01 | GlaxoSmithKline Biologicals SA | Modified human cytomegalovirus proteins |
TWI810589B (zh) | 2020-06-21 | 2023-08-01 | 美商輝瑞股份有限公司 | 人巨細胞病毒糖蛋白B(gB)多肽 |
-
2022
- 2022-02-21 EP EP22707515.7A patent/EP4298444A2/en active Pending
- 2022-02-21 AU AU2022225742A patent/AU2022225742A1/en active Pending
- 2022-02-21 WO PCT/IB2022/051504 patent/WO2022180500A2/en active Application Filing
- 2022-02-21 PE PE2023002409A patent/PE20240083A1/es unknown
- 2022-02-21 KR KR1020237032170A patent/KR20230148416A/ko unknown
- 2022-02-21 JP JP2023550629A patent/JP2024508799A/ja active Pending
- 2022-02-21 CA CA3211449A patent/CA3211449A1/en active Pending
- 2022-02-21 IL IL305419A patent/IL305419A/en unknown
-
2023
- 2023-08-22 CO CONC2023/0010902A patent/CO2023010902A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
CO2023010902A2 (es) | 2023-09-08 |
AU2022225742A1 (en) | 2023-09-07 |
JP2024508799A (ja) | 2024-02-28 |
IL305419A (en) | 2023-10-01 |
CA3211449A1 (en) | 2022-09-01 |
PE20240083A1 (es) | 2024-01-16 |
WO2022180500A2 (en) | 2022-09-01 |
WO2022180500A3 (en) | 2023-01-19 |
EP4298444A2 (en) | 2024-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105188745B (zh) | 稳定化的可溶性融合前rsv f多肽 | |
KR20230025020A (ko) | 인간 시토메갈로바이러스 gB 폴리펩티드 | |
Solomons et al. | Structural basis for ESCRT-III CHMP3 recruitment of AMSH | |
Rappas et al. | Structural basis of the nucleotide driven conformational changes in the AAA+ domain of transcription activator PspF | |
JP6594306B2 (ja) | キメラ表面タンパク質を有するロタウイルス粒子 | |
US11629172B2 (en) | Human cytomegalovirus gB polypeptide | |
JPH08322580A (ja) | 乳頭腫ウイルス型特異的抗体 | |
JPH03503478A (ja) | 組換えcmv中和タンパク | |
JP2011515074A (ja) | インフルエンザ・ウイルスpaの発現精製及びpaのn末端及びpaのc末端とpb1のn末端ポリペプチド複合体の結晶構造 | |
JP2022022308A (ja) | 哺乳類で発現した新規なヒト免疫不全ウイルスエンベロープタンパク質抗原 | |
WO2006007555A2 (en) | Rotavirus antigens | |
US20180044649A1 (en) | Influenza a 2009 pandemic h1n1 polypeptide fragments comprising endonuclease activity and their use | |
US20050221285A1 (en) | Method for identifying or screening anti-viral agents | |
KR20230148416A (ko) | 인간 시토메갈로바이러스 당단백질 b 폴리펩티드 내의 신규 약물표적화가능한 영역및 그의 사용 방법 | |
US20010043931A1 (en) | Human respiratory syncytial virus | |
CN117677847A (zh) | 人巨细胞病毒糖蛋白b多肽中的新的可成药区域及其使用方法 | |
JP2002020399A (ja) | ノルウォークウイルス(nv)を認識するモノクローナル抗体 | |
CN113493494B (zh) | Eb病毒balf3蛋白的抗原表位 | |
TW202413391A (zh) | 人巨細胞病毒糖蛋白B(gB)多肽 | |
RU2667429C2 (ru) | Композиции и способы для одновременного обнаружения hcv антигена/антитела | |
US20040248800A1 (en) | Crystals and structures of epidermal growth factor receptor kinase domain | |
US20180221468A1 (en) | Haemophilus influenzae immunogen | |
AU2005327236A1 (en) | Immunogenic domains of sars coronavirus |