KR20180132604A - 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 변이체 - Google Patents
개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 변이체 Download PDFInfo
- Publication number
- KR20180132604A KR20180132604A KR1020187020089A KR20187020089A KR20180132604A KR 20180132604 A KR20180132604 A KR 20180132604A KR 1020187020089 A KR1020187020089 A KR 1020187020089A KR 20187020089 A KR20187020089 A KR 20187020089A KR 20180132604 A KR20180132604 A KR 20180132604A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- cyp153a
- amino acid
- fusion polypeptide
- hybrid fusion
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 499
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 498
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 498
- 230000004927 fusion Effects 0.000 title claims abstract description 409
- 102000005297 Cytochrome P-450 CYP4A Human genes 0.000 title abstract description 29
- 108010081498 Cytochrome P-450 CYP4A Proteins 0.000 title abstract description 29
- 230000001976 improved effect Effects 0.000 title abstract description 16
- 244000005700 microbiome Species 0.000 claims abstract description 34
- 238000004519 manufacturing process Methods 0.000 claims abstract description 24
- 239000000194 fatty acid Substances 0.000 claims description 535
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 533
- 229930195729 fatty acid Natural products 0.000 claims description 533
- 150000004665 fatty acids Chemical class 0.000 claims description 489
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 395
- 230000035772 mutation Effects 0.000 claims description 275
- 239000000203 mixture Substances 0.000 claims description 123
- 230000014509 gene expression Effects 0.000 claims description 75
- 229910052799 carbon Inorganic materials 0.000 claims description 49
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 47
- 238000006243 chemical reaction Methods 0.000 claims description 47
- 238000004113 cell culture Methods 0.000 claims description 45
- 150000007523 nucleic acids Chemical group 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 36
- 108020001507 fusion proteins Proteins 0.000 claims description 31
- 102000037865 fusion proteins Human genes 0.000 claims description 31
- 102200074510 rs2015352 Human genes 0.000 claims description 25
- 102000005488 Thioesterase Human genes 0.000 claims description 21
- 108020002982 thioesterase Proteins 0.000 claims description 21
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 claims description 17
- 230000037361 pathway Effects 0.000 claims description 15
- 102220517055 Transcriptional regulator PINT87aa_I11L_mutation Human genes 0.000 claims description 13
- 238000012258 culturing Methods 0.000 claims description 8
- 102220367838 c.28G>T Human genes 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 102100037611 Lysophospholipase Human genes 0.000 claims 2
- 229940053200 antiepileptics fatty acid derivative Drugs 0.000 abstract description 78
- 235000001014 amino acid Nutrition 0.000 description 331
- 210000004027 cell Anatomy 0.000 description 209
- 238000006467 substitution reaction Methods 0.000 description 101
- 108090000623 proteins and genes Proteins 0.000 description 65
- 102000040430 polynucleotide Human genes 0.000 description 62
- 108091033319 polynucleotide Proteins 0.000 description 62
- 239000002157 polynucleotide Substances 0.000 description 62
- 102000004316 Oxidoreductases Human genes 0.000 description 55
- 108090000854 Oxidoreductases Proteins 0.000 description 55
- 230000000694 effects Effects 0.000 description 51
- 102000004190 Enzymes Human genes 0.000 description 49
- 108090000790 Enzymes Proteins 0.000 description 49
- 229940088598 enzyme Drugs 0.000 description 49
- 102000004169 proteins and genes Human genes 0.000 description 45
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 44
- 235000018102 proteins Nutrition 0.000 description 42
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 38
- 239000004474 valine Substances 0.000 description 38
- 229920006395 saturated elastomer Polymers 0.000 description 36
- 239000004475 Arginine Substances 0.000 description 35
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 35
- 230000003197 catalytic effect Effects 0.000 description 31
- 230000001965 increasing effect Effects 0.000 description 31
- 235000004279 alanine Nutrition 0.000 description 30
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 27
- 125000003729 nucleotide group Chemical group 0.000 description 24
- 239000004471 Glycine Substances 0.000 description 23
- 101150053185 P450 gene Proteins 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 22
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 21
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 21
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 21
- 235000009582 asparagine Nutrition 0.000 description 21
- 229960001230 asparagine Drugs 0.000 description 21
- 239000002773 nucleotide Substances 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 18
- 102220557155 Alstrom syndrome protein 1_N61L_mutation Human genes 0.000 description 17
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 17
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 17
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 16
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 15
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 14
- 239000004473 Threonine Substances 0.000 description 14
- 229940009098 aspartate Drugs 0.000 description 14
- 230000002255 enzymatic effect Effects 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 13
- 229930195712 glutamate Natural products 0.000 description 13
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 12
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 12
- 239000004472 Lysine Substances 0.000 description 12
- 230000001588 bifunctional effect Effects 0.000 description 12
- 229930182817 methionine Natural products 0.000 description 12
- 241000894007 species Species 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 239000002028 Biomass Substances 0.000 description 11
- 108020004414 DNA Proteins 0.000 description 11
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 11
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 11
- -1 primary alcohols Chemical class 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 102220245308 rs1555601006 Human genes 0.000 description 11
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 10
- 229940024606 amino acid Drugs 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 230000001580 bacterial effect Effects 0.000 description 10
- 229960000310 isoleucine Drugs 0.000 description 10
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 10
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 9
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 9
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 9
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 9
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 9
- 239000008103 glucose Substances 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 9
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 8
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 8
- 239000011521 glass Substances 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 102100037885 Calcium-independent phospholipase A2-gamma Human genes 0.000 description 7
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 7
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 7
- 230000009088 enzymatic function Effects 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 7
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 6
- 150000001335 aliphatic alkanes Chemical class 0.000 description 6
- 235000003704 aspartic acid Nutrition 0.000 description 6
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 6
- 238000000855 fermentation Methods 0.000 description 6
- 230000004151 fermentation Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 150000002430 hydrocarbons Chemical class 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 6
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 6
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 6
- 239000002699 waste material Substances 0.000 description 6
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 5
- 241000206589 Marinobacter Species 0.000 description 5
- 241000187492 Mycobacterium marinum Species 0.000 description 5
- 150000002194 fatty esters Chemical class 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 5
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- ZDHCZVWCTKTBRY-UHFFFAOYSA-N 12-hydroxylauric acid Chemical compound OCCCCCCCCCCCC(O)=O ZDHCZVWCTKTBRY-UHFFFAOYSA-N 0.000 description 4
- 102220510014 52 kDa repressor of the inhibitor of the protein kinase_L27R_mutation Human genes 0.000 description 4
- 108010025188 Alcohol oxidase Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 102000018832 Cytochromes Human genes 0.000 description 4
- 108010052832 Cytochromes Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 241000186359 Mycobacterium Species 0.000 description 4
- 241000512220 Polaromonas Species 0.000 description 4
- 125000002252 acyl group Chemical group 0.000 description 4
- 125000000217 alkyl group Chemical group 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 235000014633 carbohydrates Nutrition 0.000 description 4
- 229910002092 carbon dioxide Inorganic materials 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 150000002148 esters Chemical class 0.000 description 4
- 235000011187 glycerol Nutrition 0.000 description 4
- 229930195733 hydrocarbon Natural products 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 102200059965 rs61753185 Human genes 0.000 description 4
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 4
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 108010074122 Ferredoxins Proteins 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 241000108056 Monas Species 0.000 description 3
- 229910052781 Neptunium Inorganic materials 0.000 description 3
- 241001520808 Panicum virgatum Species 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 241000187562 Rhodococcus sp. Species 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000036983 biotransformation Effects 0.000 description 3
- 229910021538 borax Inorganic materials 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000001569 carbon dioxide Substances 0.000 description 3
- 108020001778 catalytic domains Proteins 0.000 description 3
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 3
- 239000005516 coenzyme A Substances 0.000 description 3
- 229940093530 coenzyme a Drugs 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 3
- 150000002191 fatty alcohols Chemical class 0.000 description 3
- 125000000524 functional group Chemical group 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 239000010813 municipal solid waste Substances 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- LFNLGNPSGWYGGD-UHFFFAOYSA-N neptunium atom Chemical compound [Np] LFNLGNPSGWYGGD-UHFFFAOYSA-N 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 239000003348 petrochemical agent Substances 0.000 description 3
- 108040006686 pyruvate synthase activity proteins Proteins 0.000 description 3
- 239000004328 sodium tetraborate Substances 0.000 description 3
- 235000010339 sodium tetraborate Nutrition 0.000 description 3
- 239000010902 straw Substances 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- BZUNJUAMQZRJIP-UHFFFAOYSA-N 15-hydroxypentadecanoic acid Chemical compound OCCCCCCCCCCCCCCC(O)=O BZUNJUAMQZRJIP-UHFFFAOYSA-N 0.000 description 2
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 2
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 2
- 241000611270 Alcanivorax borkumensis Species 0.000 description 2
- 108091023020 Aldehyde Oxidase Proteins 0.000 description 2
- 102000048262 Aldehyde oxidases Human genes 0.000 description 2
- 108010018763 Biotin carboxylase Proteins 0.000 description 2
- 241000995051 Brenda Species 0.000 description 2
- 241001453380 Burkholderia Species 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 241001464430 Cyanobacterium Species 0.000 description 2
- JDMUPRLRUUMCTL-VIFPVBQESA-N D-pantetheine 4'-phosphate Chemical group OP(=O)(O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS JDMUPRLRUUMCTL-VIFPVBQESA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 102000000476 Fatty Acid Transport Proteins Human genes 0.000 description 2
- 108010055870 Fatty Acid Transport Proteins Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 206010021703 Indifference Diseases 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 description 2
- 241000206597 Marinobacter hydrocarbonoclasticus Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000187488 Mycobacterium sp. Species 0.000 description 2
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 description 2
- 101710198130 NADPH-cytochrome P450 reductase Proteins 0.000 description 2
- 108091005461 Nucleic proteins Chemical group 0.000 description 2
- 102000004020 Oxygenases Human genes 0.000 description 2
- 108090000417 Oxygenases Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000232299 Ralstonia Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 241000736131 Sphingomonas Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 2
- 150000001336 alkenes Chemical group 0.000 description 2
- OCKPCBLVNKHBMX-UHFFFAOYSA-N butylbenzene Chemical compound CCCCC1=CC=CC=C1 OCKPCBLVNKHBMX-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000004129 fatty acid metabolism Effects 0.000 description 2
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 2
- 229940013640 flavin mononucleotide Drugs 0.000 description 2
- FVTCRASFADXXNN-UHFFFAOYSA-N flavin mononucleotide Natural products OP(=O)(O)OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-UHFFFAOYSA-N 0.000 description 2
- 239000011768 flavin mononucleotide Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- 150000003278 haem Chemical group 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 150000007931 macrolactones Chemical class 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 150000004702 methyl esters Chemical class 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 235000019231 riboflavin-5'-phosphate Nutrition 0.000 description 2
- 239000007320 rich medium Substances 0.000 description 2
- 238000009738 saturating Methods 0.000 description 2
- 239000010865 sewage Substances 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- GGQQNYXPYWCUHG-RMTFUQJTSA-N (3e,6e)-deca-3,6-diene Chemical group CCC\C=C\C\C=C\CC GGQQNYXPYWCUHG-RMTFUQJTSA-N 0.000 description 1
- XKLJLHAPJBUBNL-UHFFFAOYSA-N 12-methyltetradecanoic acid Chemical compound CCC(C)CCCCCCCCCCC(O)=O XKLJLHAPJBUBNL-UHFFFAOYSA-N 0.000 description 1
- ZVRQKBZSJNBTCW-UHFFFAOYSA-N 15-hydroxypentadec-2-enoic acid Chemical compound OCCCCCCCCCCCCC=CC(O)=O ZVRQKBZSJNBTCW-UHFFFAOYSA-N 0.000 description 1
- YSNNTXAJZMWJCI-UHFFFAOYSA-N 16-hydroxyhexadec-2-enoic acid Chemical compound OCCCCCCCCCCCCCC=CC(O)=O YSNNTXAJZMWJCI-UHFFFAOYSA-N 0.000 description 1
- JQNQKNGCSLCPDE-UHFFFAOYSA-N 18-hydroxyoctadec-2-enoic acid Chemical compound OCCCCCCCCCCCCCCCC=CC(O)=O JQNQKNGCSLCPDE-UHFFFAOYSA-N 0.000 description 1
- 101710186512 3-ketoacyl-CoA thiolase Proteins 0.000 description 1
- 102220590902 60S ribosomal protein L4_P56Q_mutation Human genes 0.000 description 1
- 241000588624 Acinetobacter calcoaceticus Species 0.000 description 1
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 1
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102000005369 Aldehyde Dehydrogenase Human genes 0.000 description 1
- 108020002663 Aldehyde Dehydrogenase Proteins 0.000 description 1
- 102100026608 Aldehyde dehydrogenase family 3 member A2 Human genes 0.000 description 1
- 241001489705 Aquarius Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 1
- 241000579120 Coliiformes Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 241000701988 Escherichia virus T5 Species 0.000 description 1
- 101710172176 Fasciclin-1 Proteins 0.000 description 1
- 101710172177 Fasciclin-2 Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 101000836620 Homo sapiens Nucleic acid dioxygenase ALKBH1 Proteins 0.000 description 1
- 102100034337 Long-chain-fatty-acid-CoA ligase 6 Human genes 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 241000212301 Marinobacterium Species 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- 102000002568 Multienzyme Complexes Human genes 0.000 description 1
- 108010093369 Multienzyme Complexes Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 102100027051 Nucleic acid dioxygenase ALKBH1 Human genes 0.000 description 1
- 241000930992 Paraburkholderia fungorum Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241001472610 Polaromonas sp. Species 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241001135759 Sphingomonas sp. Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 108010069175 acyl-CoA transferase Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000007824 aliphatic compounds Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- VCIQTMGWJDEYRX-UHFFFAOYSA-N dodec-1-ene-1,12-diol Chemical compound OCCCCCCCCCCC=CO VCIQTMGWJDEYRX-UHFFFAOYSA-N 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004133 fatty acid degradation Effects 0.000 description 1
- 230000004136 fatty acid synthesis Effects 0.000 description 1
- 150000002192 fatty aldehydes Chemical class 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000002921 fermentation waste Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000003546 flue gas Substances 0.000 description 1
- 239000010794 food waste Substances 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- IVSXFFJGASXYCL-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=NC=N[C]21 IVSXFFJGASXYCL-UHFFFAOYSA-N 0.000 description 1
- 125000005252 haloacyl group Chemical group 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- BXWNKGSJHAJOGX-UHFFFAOYSA-N hexadecan-1-ol Chemical compound CCCCCCCCCCCCCCCCO BXWNKGSJHAJOGX-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- ZOCYQVNGROEVLU-UHFFFAOYSA-N isopentadecanoic acid Chemical compound CC(C)CCCCCCCCCCCC(O)=O ZOCYQVNGROEVLU-UHFFFAOYSA-N 0.000 description 1
- 150000002576 ketones Chemical group 0.000 description 1
- 239000010871 livestock manure Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 description 1
- 235000021354 omega 7 monounsaturated fatty acids Nutrition 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 150000003138 primary alcohols Chemical class 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000002910 solid waste Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 101150087812 tesA gene Proteins 0.000 description 1
- 101150026728 tesB gene Proteins 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- XLKZJJVNBQCVIX-UHFFFAOYSA-N tetradecane-1,14-diol Chemical compound OCCCCCCCCCCCCCCO XLKZJJVNBQCVIX-UHFFFAOYSA-N 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 150000003573 thiols Chemical group 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000000341 volatile oil Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
- C12N9/0038—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12N9/0042—NADPH-cytochrome P450 reductase (1.6.2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y106/00—Oxidoreductases acting on NADH or NADPH (1.6)
- C12Y106/02—Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12Y106/02004—NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01005—Lysophospholipase (3.1.1.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
- C12Y301/02014—Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 재조합 숙주 세포에서 발현되는 경우 개선된 오메가-하이드록실화 지방산 유도체 생산을 유발하는 오메가-하이드록실라제-관련 융합 폴리펩티드에 관한 것이다. 본 발명은 추가로, 오메가-하이드록실화 지방산 유도체의 생산을 위해 오메가-하이드록실라제-관련 융합 폴리펩티드를 발현하기 위한 미생물에 관한 것이다.
Description
관련 출원에 대한 상호참조
본원은 2015년 12월 15일에 출원된 국제 출원 번호 PCT/EP2015/079832의 일부 계속(continuation-in-part)으로, 이것의 전체 개시내용이 본원에 참고로 편입되었다.
서열 목록
본원은 ASCII 포맷으로 전자 형식으로 제출되어, 그 전체가 참조로 본원에 편입된 서열 목록을 포함한다. 2016년 12월 12일 작성된 상기의 ASCII 복사본은 파일명을 LS00054PCT3_SL. txt라고 하고, 크기는 936,451 바이트이다.
분야
본 발명은 재조합 숙주 세포에서 발현되는 경우 개선된 오메가-하이드록실화 지방산 유도체 생산을 유발하는 오메가-하이드록실라제-관련 융합 폴리펩티드 및 이의 변이체에 관한 것이다. 본 발명은 추가로 오메가-하이드록실화 지방산 유도체의 생산을 위해 오메가-하이드록실라제-관련 융합 폴리펩티드 및 이의 변이체를 발현하기 위한 미생물에 관한 것이기도 하다.
사이토크롬 P450 모노옥시게나제(P450)는 효소의 다양한 그룹이다. 이들은 패밀리 및 서브패밀리로 분류된다. 이들이 40 퍼센트 이상의 아미노산 동일성을 공유하는 경우 동일한 패밀리에 속한다. 이들이 55 퍼센트 이상의 아미노산 동일성을 공유하는 경우 동일한 서브패밀리에 속한다. P450은 기질로서 지방산을 사용하며 하이드록실화 반응을 촉매한다. 박테리아는 알칸 분해 및 지방산 개질에 관련된 몇 가지 P450 시스템을 가지며 1000개 이상의 미생물 P450이 지금까지 공지되어 있다. 한 가지 특정 P450 서브패밀리가 cyp153A로서 공지되어 있으며, 여기서, 최초는 2001년에 아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus)로부터 클로닝되었다. 그 이후로, 유사한 효소들이 스핀고모나스 종(Sphingomonas sp.) HXN200, 마이코박테리움 종(Mycobacterium sp .) HXN1500, 및 알카니보락스 보쿠멘시스(Alcanivorax borkumensis)와 같은 기타의 알칸-사용 종에서 식별되었다(문헌 참조; Van Bogaert et al. (2011) FEBS Journal 278:206-221). 박테리아성 CYP153A 서브패밀리로부터의 몇가지 P450은 높은 말단 위치선택성을 갖는 알칸 오메가-하이드록실라제(ω-하이드록실라제, ω-옥시게나제라고도 함)이다. CYP153A는 또한 산업적으로 관련된 오메가-하이드록실화(ω-하이드록실화) 지방족 화합물, 예를 들면, 1급 알콜, ω-하이드록실화 지방산 및 이관능성 지방산 유도체, 예를 들면, α,ω-디카복실산 및 α,ω-디올의 합성과 연관되었다 (Honda Malca et al. (2012) Chem. Commun. 48:5115-5117).
본 발명은 숙주 세포에서 오메가-하이드록실화- 및 이관능성 지방산 유도체를 생산할 수 있는 오메가-하이드록실라제-관련 융합 폴리펩티드 및 이의 변이체를 제공한다. 보다 구체적으로, 본 발명은 오메가-하이드록실화- (ω-하이드록실화) 및 이관능성 지방산 유도체를 생산하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 및 ω-하이드록실화 지방산, α,ω-하이드록실화 지방 에스테르, α,ω-이산, α,ω-디에스테르, α,ω-디올 및 매크로락톤과 같은 이들로부터 유도된 화학물질을 포함한 이의 조성물을 제공한다. 또한, 이러한 조작된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 포함하는 특이 CYP153A-환원효소 하이브리드 융합 핵산 및 단백질 서열 뿐만 아니라 재조합 숙주 세포 및 세포 배양물이 제공된다. 본 발명은 또한 ω-하이드록실화 및/또는 이관능성 지방산 유도체 또는 이의 조성물을 제조하기 위해 재조합 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체-발현 숙주 세포를 사용하는 방법을 제공한다.
본 발명의 하나의 측면은 지방산에서 ω-하이드록실화 (ω-OH) 지방산 또는 지방산 유도체으로의 전환을 촉매하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공하며, 여기서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 서열에 대해 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 및 이의 변이체를 발현시키는 방법이 추가로 포함된다. 일 양태에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 서열 번호: 38에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 가지며, 그리고 재조합 숙주 세포 내 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은 ω-OH 지방산 또는 지방산 유도체 또는 조성물의 보다 높은 역가를 유발한다 (서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현 또는 야생형 CYP153A의 발현에 의하여 생성된 역가와 비교하여). 일 양태에서, 재조합 숙주 세포는, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하거나, 또는 상응하는 야생형 CYP153A를 발현하는 숙주 세포에 의하여 생산된 ω-OH 지방산 또는 이의 ω-OH 지방산 유도체 또는 조성물의 역가보다 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19% 또는 20% 큰 역가를 갖는, ω-OH 지방산 또는 이의 ω-OH 지방산 유도체 또는 조성물을 생산한다 (CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하기에 효과적인 조건 하에서 탄소 공급원을 함유하는 배지 중 배양될 경우). 또 다른 측면에서, ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물은 세포외에서 생산된다.
일 양태에서, 본 개시내용은 서열 번호: 38의 아미노산 서열에 적어도 80% 또는 적어도 90% 서열 동일성을 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공하며, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아미노산 위치 12에서의 돌연변이 및 하기의 아미노산 위치 각각에서의 돌연변이를 포함하며: (a) 서열 번호: 38의 27, 119, 140, 157, 159, 233, 및 244; (b) 서열 번호: 38의 28, 61, 119, 231, 309, 413, 및 480; (c) 서열 번호: 38의 119, 231, 및 480; (d) 서열 번호: 38의 28, 77, 119, 141, 231, 및 407; (e) 서열 번호: 38의 28, 61, 141, 231, 및 407; (f) 서열 번호: 38의 28, 119, 231, 및 244; (g) 서열 번호: 38의 28, 407, 및 480; (h) 서열 번호: 38의 141, 231, 413, 및 481; (i) 서열 번호: 38의 28, 111, 231, 및 407; (j) 서열 번호: 38의 28, 61, 140, 및 149; (k) 서열 번호: 38의 28, 77, 119, 159, 231, 254, 407, 및 480; (l) 서열 번호: 38의 28, 254, 309, 407, 및 451; (m) 서열 번호: 38의 28, 254, 309, 407, 및 480; 또는 (n) 서열 번호: 38의 28, 309, 407, 451, 및 480; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 38의 아미노산 위치 12, 27, 119, 140, 157, 159, 233, 및 244 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 38의 아미노산 위치 12, 28, 61, 119, 231, 309, 413, 및 480 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 38의 아미노산 위치 12, 119, 231, 및 480 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 38의 아미노산 위치 12, 28, 77, 119; 141, 231 및 407 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 38의 아미노산 위치 12, 28, 61, 141, 231, 및 407 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 38의 아미노산 위치 12, 28, 119, 231, 및 244 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 38의 아미노산 위치 12, 28, 407, 및 480 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (h) 서열 번호: 38의 아미노산 위치 12, 141, 231, 413, 및 481 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (i) 서열 번호: 38의 아미노산 위치 12, 28, 111, 231, 및 407 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (j) 서열 번호: 38의 아미노산 위치 12, 28, 61, 140, 및 149 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (k) 아미노산 위치 12, 28, 77, 119, 159, 231, 254, 407, 및 480 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (l) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 451 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (m) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 480 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (n) 서열 번호: 38의 아미노산 위치 12, 28, 309, 407, 451, 및 480 하에서의 돌연변이는 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 38의 아미노산 위치 12, 27, 119, 140, 157, 159, 233, 및 244 하에서의 돌연변이는 Q12W, R27L, K119R, S140N, S157R, V159M, S233L, 및 A244R, 각각이다. 일 구현예에서, (b) 서열 번호: 38의 아미노산 위치 12, 28, 61, 119, 231, 309, 413, 및 480 하에서의 돌연변이는 Q12R, Q28M, N61L, K119R, A231V, N309S, Y413R, 및 I480G, 각각이다. 일 구현예에서, (c) 서열 번호: 38의 아미노산 위치 12, 119, 231, 및 480 하에서의 돌연변이는 Q12R, K119R, A231V, 및 I480G, 각각이다. 일 구현예에서, (d) 서열 번호: 38의 아미노산 위치 12, 28, 77, 119; 141, 231 및 407 하에서의 돌연변이는 Q12T, Q28M, R77Q, K119R, V141T, A231W, 및 N407G, 각각이다. 일 구현예에서, (e) 서열 번호: 38의 아미노산 위치 12, 28, 61, 141, 231, 및 407 하에서의 돌연변이는 Q12R, Q28M, N61L, V141T, A231Y, 및 N407G, 각각이다. 일 구현예에서, (f) 서열 번호: 38의 아미노산 위치 12, 28, 119, 231, 및 244 하에서의 돌연변이는 Q12W, Q28M, K119R, A231Y, 및 A244R, 각각이다. 일 구현예에서, (g) 서열 번호: 38의 아미노산 위치 12, 28, 407, 및 480 하에서의 돌연변이는 Q12W, Q28T, N407G, 및 I480G, 각각이다. 일 구현예에서, (h) 서열 번호: 38의 아미노산 위치 12, 141, 231, 413, 및 481 하에서의 돌연변이는 Q12R, V141T, A231Y, Y413R, 및 G481I, 각각이다. 일 구현예에서, (i) 서열 번호: 38의 아미노산 위치 12, 28, 111, 231, 및 407 하에서의 돌연변이는 Q12T, Q28M, F111A, A231V, 및 N407G, 각각이다. 일 구현예에서, (j) 서열 번호: 38의 아미노산 위치 12, 28, 61, 140, 및 149 하에서의 돌연변이는 Q12T, Q28M, N61L, S140N, 및 P149R, 각각이다. 일 구현예에서, 아미노산 위치 12, 28, 77, 119, 159, 231, 254, 407 및 480에서 (k) 하의 상기 돌연변이는 각각 Q12W, Q28T, R77Q, K119R, V159M, A231Y, R254G, N407G, 및 I480G이다. 일 구현예에서, (l) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 451 하에서의 돌연변이는 Q12W, Q28T, R254G, N309S, N407G, 및 V451M, 각각이다. 일 구현예에서, (m) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 480 하에서의 돌연변이는 Q12W, Q28T, R254G, N309S, N407G, 및 I480G, 각각이다. 일 구현예에서, (n) 서열 번호: 38의 아미노산 위치 12, 28, 309, 407, 451, 및 480 하에서의 돌연변이는 Q12W, Q28T, N309S, N407G, V451M, 및 I480G, 각각이다. 일 바람직한 구현예에서, 상기 (a)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 추가로 하기에서의 돌연변이를 포함한다: 서열 번호: 38의 아미노산 위치 141, 231 및 407 각각, 또는 서열 번호: 38의 아미노산 위치 231, 407, 451, 757, 770 및 784 각각, 또는 서열 번호: 38의 아미노산 위치 231, 407, 591, 643, 757 및 784 각각. 다양한 구현예에서, 서열 번호: 38의 아미노산 위치 141, 231 및 407 각각에서의 추가 돌연변이는 아미노산 치환이다. 또한, 다양한 구현예에서, 서열 번호: 38의 아미노산 위치 231, 407, 451, 757, 770 및 784 각각에서의 추가 돌연변이는 아미노산 치환이다. 또한, 다양한 구현예에서, 서열 번호: 38의 아미노산 위치 231, 407, 591, 643, 757 및 784 각각에서의 추가 돌연변이는 아미노산 치환이다. 바람직하게는, 서열 번호: 38의 아미노산 위치 141, 231 및 407 각각에서의 추가 돌연변이는 V141T, A231Y, 및 N407G, 각각이다. 또한, 바람직하게는, 서열 번호: 38의 아미노산 위치 231, 407, 451, 757, 770 및 784 각각에서의 돌연변이는 A231Y, N407G, V451M, E757A, T770G, 및 M784I, 각각이다. 또한, 바람직하게는, 서열 번호: 38의 아미노산 위치 231, 407, 591, 643, 757 및 784 각각에서의 돌연변이는 A231Y, N407G, E591Q, R643H, E757A, 및 M784I, 각각이다. 더욱 바람직하게는, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 포함한다: 서열 번호: 146, 서열 번호: 150, 또는 서열 번호: 160. 본 개시내용의 기타 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122 및 서열 번호: 124.
또 다른 양태에서, 본 개시내용은 서열 번호: 38의 아미노산 서열에 적어도 80% 또는 적어도 90% 서열 동일성을 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공하며, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 하기 아미노산 위치 중 각각에서의 RhF 도메인 (또는 RhF 환원효소 도메인, 또는 Red450RhF 도메인, 또는 Red450RhF 환원효소 도메인, 또는 P450RhF 도메인, 또는 P450RhF 환원효소 도메인) 내 돌연변이를 포함한다: (a) 서열 번호: 38의 527, 544, 719, 757, 771, 및 784; (b) 서열 번호: 38의 527, 544, 및 557; (c) 서열 번호: 38의 770 및 784; (d) 서열 번호: 38의 527, 591, 648, 719, 757, 771, 및 784; (e) 서열 번호: 38의 527, 591, 648, 757, 및 771; (f) 서열 번호: 38의 527, 544, 770, 및 784; (g) 서열 번호: 38의 527, 557, 770, 및 784; (h) 서열 번호: 38의 557, 757, 및 770; (i) 서열 번호: 38의 557, 757, 및 771; 또는 (j) 서열 번호: 38의 757 및 770; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 38의 아미노산 위치 527, 544, 719, 757, 771, 및 784 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 38의 아미노산 위치 527, 544, 및 557 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 38의 아미노산 위치 770 및 784 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 38의 아미노산 위치 527, 591, 648, 719, 757, 771 및 784 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 38의 아미노산 위치 527, 591, 648, 757, 및 771 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 38의 아미노산 위치 527, 544, 770, 및 784 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 38의 아미노산 위치 527, 557, 770, 및 784 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (h) 서열 번호: 38의 아미노산 위치 557, 757, 및 770 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (i) 서열 번호: 38의 아미노산 위치 557, 757 및 771 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (j) 서열 번호: 38의 아미노산 위치 757, 및 770 하에서의 돌연변이는 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 38의 아미노산 위치 527, 544, 719, 757, 771, 및 784 하에서의 돌연변이는 D527E, D544N, R719W, E757A, V771F, 및 M784I, 각각이다. 일 구현예에서, (b) 서열 번호: 38의 아미노산 위치 527, 544, 및 557 하에서의 돌연변이는 D527E, D544N, 및 E557R, 각각이다. 일 구현예에서, (c) 서열 번호: 38의 아미노산 위치 770 및 784 하에서의 돌연변이는 T770G 및 M784I, 각각이다. 일 구현예에서, (d) 서열 번호: 38의 아미노산 위치 527, 591, 648, 719; 757, 771 및 784 하에서의 돌연변이는 D527E, E591Q, V648L, R719W, E757A, V771F, 및 M784I, 각각이다. 일 구현예에서, (e) 서열 번호: 38의 아미노산 위치 527, 591, 648, 757, 및 771 하에서의 돌연변이는 D527E, E591Q, V648L, E757A, 및 V771F, 각각이다. 일 구현예에서, (f) 서열 번호: 38의 아미노산 위치 527, 544, 770, 및 784 하에서의 돌연변이는 D527E, D544N, T770G, 및 M784I, 각각이다. 일 구현예에서, (g) 서열 번호: 38의 아미노산 위치 527, 557, 770, 및 784 하에서의 돌연변이는 D527E, E557R, T770G, 및 M784I, 각각이다. 일 구현예에서, (h) 서열 번호: 38의 아미노산 위치 557, 757, 및 770 하에서의 돌연변이는 E557W, E757A, 및 T770G, 각각이다. 일 구현예에서, (i) 서열 번호: 38의 아미노산 위치 557, 757, 및 771 하에서의 돌연변이는 E557R, E757A, 및 V771F, 각각이다. 일 구현예에서, (j) 서열 번호: 38의 아미노산 위치 757 및 770 하에서의 돌연변이는 E757A 및 T770G, 각각이다. 본 개시내용의 일부 바람직한 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142 및 서열 번호: 144.
추가의 또 다른 양태에서, 본 개시내용은 서열 번호: 38의 아미노산 서열에 적어도 80% 또는 적어도 90% 서열 동일성을 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공하며, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 위치 각각에서의 돌연변이를 포함하며: (a) 서열 번호: 38의 141, 231, 233, 및 254; (b) 서열 번호: 38의 141, 231, 233, 및 244; (c) 서열 번호: 38의 141, 231, 244, 451, 557, 749, 및 770; (d) 서열 번호: 38의 27, 28, 61, 141, 149, 및 231; (e) 서열 번호: 38의 141, 157, 231, 233, 244, 757, 및 784; (f) 서열 번호: 38의 28, 61, 140, 141, 231, 233, 및 271; 또는 (g) 서열 번호: 38의 231, 233, 254, 및 557; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 38의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 38의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 38의 아미노산 위치 141, 157, 231, 233; 244, 757 및 784 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 38의 아미노산 위치 28, 61, 140, 141, 231, 233 및 271 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 38의 아미노산 위치 231, 233, 254, 및 557 하에서의 돌연변이는 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는 V141T, A231Y, L233S, 및 R254G, 각각이다. 일 구현예에서, (b) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는 V141T, A231Y, L233S, 및 R244A, 각각이다. 일 구현예에서, (c) 서열 번호: 38의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는 V141T, A231Y, R244A, V451M, E557W, E749L, 및 T770G, 각각이다. 일 구현예에서, (d) 서열 번호: 38의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는L27R, Q28M, N61L, V141T, P149G, 및 A231Y, 각각이다. 일 구현예에서, (e) 서열 번호: 38의 아미노산 위치 141, 157, 231, 233; 244, 757 및 784 하에서의 돌연변이는 V141T, R157S, A231Y, L233S, R244A, E757A, 및 M784I, 각각이다. 일 구현예에서, (f) 서열 번호: 38의 아미노산 위치 28, 61, 140, 141; 231, 233 및 271 하에서의 돌연변이는 Q28M, N61L, N140S, V141T, A231Y, L233S, 및 E271D, 각각이다. 일 구현예에서, (g) 서열 번호: 38의 아미노산 위치 231, 233, 254, 및 557 하에서의 돌연변이는 A231Y, L233S, R254G, 및 E557W, 각각이다. 본 개시내용의 일부 바람직한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 148, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 162 및 서열 번호: 164.
추가의 또 다른 양태에서, 본 개시내용은 서열 번호: 98의 아미노산 서열에 적어도 80% 또는 적어도 90% 서열 동일성을 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공하며, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 위치 각각에서의 돌연변이를 포함하며: (a) 서열 번호: 98의 141, 231, 및 407; (b) 서열 번호: 98의 141, 231, 233, 및 254; (c) 서열 번호: 98의 231, 407, 451, 757, 770, 및 784; (d) 서열 번호: 98의 141, 231, 233, 및 244; (e) 서열 번호: 98의 141, 231, 244, 451, 557, 749, 및 770; (f) 서열 번호: 98의 27, 28, 61, 141, 149, 및 231; (g) 서열 번호: 98의 27, 119, 140, 141, 159, 231, 757, 및 784; (h) 서열 번호: 98의 231, 407, 591, 643, 757, 및 784; (i) 서열 번호: 98의 28, 61, 140, 141, 231, 233, 및 271; 또는 (j) 서열 번호: 98의 231, 233 및 254; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 98의 아미노산 위치 141, 231, 및 407 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 98의 아미노산 위치 231, 407, 451, 757, 770, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 98의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 98의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 98의 아미노산 위치 27, 119, 140, 141, 159, 231, 757, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (h) 서열 번호: 98의 아미노산 위치 231, 407, 591, 643, 757, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (i) 서열 번호: 98의 아미노산 위치 28, 61, 140, 141; 231, 233 및 271 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (j) 서열 번호: 38의 아미노산 위치 231, 233, 및 254 하에서의 돌연변이는, 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 98의 아미노산 위치 141, 231, 및 407 하에서의 돌연변이는, V141T, A231Y, 및 N407G, 각각이다. 일 구현예에서, (b) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는, V141T, A231Y, L233S, 및 R254G, 각각이다. 일 구현예에서, (c) 서열 번호: 98의 아미노산 위치 231, 407, 451, 757, 770, 및 784 하에서의 돌연변이는, A231Y, N407G, V451M, E757A, T770G, 및 M784I, 각각이다. 일 구현예에서, (d) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는, V141T, A231Y, L233S, 및 R244A, 각각이다. 일 구현예에서, (e) 서열 번호: 98의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는, V141T, A231Y, R244A, V451M, E557W, E749L, 및 T770G, 각각이다. 일 구현예에서, (f) 서열 번호: 98의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는, L27R, Q28M, N61L, V141T, P149G, 및 A231Y, 각각이다. 일 구현예에서, (g) 서열 번호: 98의 아미노산 위치 141, 157, 231, 233; 244, 757 및 784 하에서의 돌연변이는, V141T, R157S, A231Y, L233S, R244A, E757A, 및 M784I, 각각이다. 일 구현예에서, (h) 서열 번호: 98의 아미노산 위치 231, 407, 591, 643, 757, 및 784 하에서의 돌연변이는, A231Y, N407G, E591Q, R643H, E757A, 및 M784I, 각각이다. 일 구현예에서, (i) 서열 번호: 98의 아미노산 위치 28, 61, 140, 141; 231, 233 및 271 하에서의 돌연변이는, Q28M, N61L, N140S, V141T, A231Y, L233S, 및 E271D, 각각이다. 일 구현예에서, (j) 서열 번호: 98의 아미노산 위치 231, 233, 254, 및 557 하에서의 돌연변이는, A231Y, L233S, R254G, 및 E557W, 각각이다. 본 개시내용의 일부 바람직한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164.
본 개시내용의 다양한 구현예에서, 재조합 숙주 세포에서 본 개시내용에 의해 제공되는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은 예를 들면 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 오메가-하이드록실화된 지방산의 역가와 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 유발한다: 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중). 또한, 본 개시내용의 다양한 구현예에서, 본 개시내용에 의해 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하이브리드 CYP153A-RedRhF 융합 단백질 변이체이다.
일 측면에서, 본 개시내용은 본 개시내용에 의해 제공되는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현시키는 재조합 숙주 세포를 제공한다. 다양한 구현예에서, 재조합 숙주 세포는 추가로 EC 3.1.2.-, EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제 폴리펩티드를 발현시킬 것이다. 또한, 다양한 구현예에서, 하기를 포함하는 상응하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 숙주 세포에 의해 생산된 오메가-하이드록실화 지방산 조성물의 역가보다 적어도 10% 더 큰, 적어도 15% 더 큰, 적어도 20% 더 큰, 적어도 25% 더 큰, 또는 적어도 30% 더 큰 역가로 오메가-하이드록실화 지방산 조성물을 생산한다: 서열 번호: 38, 또는 서열 번호: 6 (탄소 공급원을 함유하는 배지에서 배양되는 경우).
또 다른 측면에서, 본 개시내용은 본 개시내용의 재조합 숙주 세포를 포함하는 세포 배양물을 제공한다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는 오메가-하이드록실화된 지방산의 제조 방법을 제공한다: (i) 탄소 공급원의 존재 하에 본 개시내용의 재조합 숙주 세포 또는 본 개시내용의 세포 배양물을 배양하는 단계; 및 (ii) 오메가-하이드록실화된 지방산을 수거하는 단계.
또 다른 측면에서, 본 개시내용은 하기를 포함하는 폴리펩티드를 암호화하는 적어도 2종의 핵산 서열을 발현시키기 위해 조작된 경로를 포함하는 재조합 미생물을 제공한다: (i) EC 3.1.2. -, EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제; 및 (ii) 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체.
본 개시내용의 다양한 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 자족성(self-sufficient) CYP153A-RedRhF 하이브리드 융합 단백질 변이체이다.
본 개시내용의 또 다른 측면은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 6과 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 및 위치 796, 141, 231, 27, 82, 178, 309, 407, 415, 516 및/또는 666을 포함하는 아미노산 위치에 적어도 하나의 돌연변이 (여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매함). CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 알라닌(A)이 발린(V)으로 치환(즉, 대체)된 위치 A796V; 발린이 이소류신(I)으로 치환된 위치 V141I; 발린(V)이 글루타민(Q)으로 치환된 위치 V141Q; 발린(V)이 글리신(G)으로 치환된 위치 V141G; 발린(V)이 메티오닌(M)으로 치환된 위치 V141M; 발린(V)이 류신(L)으로 치환된 위치 V141L; 발린(V)이 트레오닌(T)으로 치환된 위치 V141T; 알라닌(A)이 트레오닌(T)으로 치환된 위치 A231T; 아르기닌(R)이 리신(L)으로 치환된 위치 R27L; 아르기닌(R)이 아스파르트산(D)으로 치환된 위치 R82D; 아르기닌(R)이 아스파라긴(N)으로 치환된 위치 R178N; 아스파라긴(N)이 아르기닌(R)으로 치환된 위치 N309R; 아스파라긴(N)이 알라닌(A)으로 치환된 위치 N407A; 발린(V)이 아르기닌(R)으로 치환된 위치 V415R; 트레오닌(T)이 발린(V)으로 치환된 위치 T516V; 프롤린(P)이 알라닌(A)으로 치환된 위치 P666A; 및 프롤린(P)이 아스파르트산(D)으로 치환된 위치 P666D를 포함한 상기 위치들 중의 선택적인 하나 이상에 돌연변이를 갖는다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 예시는 하기를 포함한다: 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44 및 서열 번호: 46 [서열 표 A (단락 [0146])에서 나타난 바와 같음]. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하이브리드 CYP153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 상응하는 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물의 역가와 비교하여 더 높은 역가의 ω-OH 지방산 또는 ω-OH 지방산 유도체 또는 이의 조성물을 야기한다 (주형; 예를 들어, 서열 번호: 6, 서열 번호: 38, 서열 번호: 98) (상응하는 숙주 세포 중). 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 A796V를 포함한 아미노산 위치 796에 돌연변이를 갖는다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 A231T를 포함한 아미노산 위치 231에 돌연변이를 갖는다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 돌연변이 V141I 또는 V141T를 포함한 아미노산 위치 141에 돌연변이를 갖는다. 본원에서, 재조합 숙주 세포에서 돌연변이 A796V, V141I 또는 V141T 및/또는 A231T를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 ω-OH C12 또는 C16 지방산의 역가와 비교하여, 각각 더 높은 역가의 ω-OH C12 또는 C16 지방산을 야기한다 (주형; 예를 들어, 서열 번호: 6, 서열 번호: 38, 서열 번호: 98).
본 개시내용은 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 재조합 숙주 세포를 갖는 세포 배양물을 추가로 고려한다. ω-OH 지방산 또는 이의 지방산 유도체 또는 조성물은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19 및 C20 ω-OH 지방산 또는 지방산 유도체를 포함한다. ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 포화 또는 불포화 ω-OH 지방산 또는 지방산 유도체를 포함할 수 있다. 또 다른 구현예에서, ω-OH 지방산 또는 이의 지방산 유도체 또는 조성물은 C8:1, C9:1, C10:1,C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및 C20:1 불포화 ω-OH 지방산 또는 지방산 유도체를 포함한다. 또 다른 구현예에서, ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 ω-OH C12 및/또는 C16 및/또는 C16:1 지방산 또는 지방산 유도체를 포함할 수 있다.
본 발명의 또 다른 측면은 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 숙주 세포를 탄소 공급원과 배양하는 단계; 및 ω-OH 지방산 또는 ω-OH 지방산 유도체를 수거하는 단계를 포함하는, ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물을 제조하는 방법을 제공한다. 상기 방법은 ω-OH 지방산 또는 이의 ω-OH 지방산 유도체 또는 조성물의 역가의 증가/개선을 제공한다. 일 측면에서, 상기 ω-OH 지방산 또는 지방산 유도체는 CYP153A-환원효소 하이브리드 융합 폴리펩티드-발현 숙주 세포, 특히 예를 들면, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현시키는 숙주 세포에 의해 생산된 ω-OH 지방산 또는 지방산 유도체보다 역가가 적어도 약 20% 내지 30% 더 크다: 서열 번호: 6, 서열 번호: 38, 또는 서열 번호: 98. 또 다른 측면에서, ω-OH 지방산 또는 지방산 유도체 또는 이의 조성물은 탄소 공급원, 특히 재생가능한 공급원료로부터 약 15g/L 내지 약 25g/L의 역가로 제조된다. 다양한 구현예에서, 탄소 기반 재생가능한 공급원료는 옥수수, 사탕수수, 수수, 비트, 지팽이풀(switch grass), 목초, 짚, 목재, 펄프, 하수, 쓰레기, 셀룰로오스성 도시 쓰레기, 플루-가스, 합성가스, 바이오매스 가수분해물, 및 이산화탄소로 구성된 군으로부터 선택된다.
본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 32 (V141I 및 A231T에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다. 본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 34 (R27L, R82D, V141M, R178N 및 N407A에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다. 본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 36 (P666A에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다. 본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38 (A796V에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다. 본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 40 (A796V, P666D 및 T516V에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다. 본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 42 (V141I, A231T 및 A796V에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다. 본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 44 (R27L, R82D, V141M, R178N, N407A 및 A796V에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다. 본 개시내용의 또 다른 측면은 하기와 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 46 (V141T, A231T 및 A796V에서의 돌연변이를 가짐), 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산으로부터 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물로의 전환을 촉진한다.
본 개시내용은 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 재조합 숙주 세포를 추가로 고려한다. 하나의 구현예에서, 재조합 숙주 세포는 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 및 EC 3.1.2. - 또는 EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제 폴리펩티드를 발현하며, 여기서, 재조합 숙주 세포는, 상응하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는, 예를 들어, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는, 숙주 세포에 의해 생산된 ω-OH 지방산 또는 이의 조성물의 역가보다 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 또는 적어도 30% 더 높은 역가를 갖는 ω-OH 지방산 또는 이의 조성물을 생산한다: 서열 번호: 6, 또는 서열 번호: 38 (본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하기에 효과적인 조건 하에서 탄소 공급원을 함유하는 배지 중 배양될 경우). 하나의 구현예에서, ω-OH 지방산 또는 이의 조성물은 약 15 g/L 내지 약 25 g/L의 역가로 생산될 수 있다. 또 다른 구현예에서, ω-OH 지방산 또는 이의 조성물은 세포외에서 생산된다.
일 측면에서, 본 개시내용은 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현시키기 위해 조작된 재조합 미생물을 제공한다. 다양한 구현예에서, 상기 재조합 미생물은 ω-하이드록시 지방산 또는 ω-OH 지방산 유도체, 구체적으로는 ω-하이드록시 지방산 메틸 에스테르를 생산하거나 또는 생산할 수 있다. 다양한 구현예에서, 상기 재조합 미생물은 EC 1.1.1.1/2의 알코올 탈수소효소, 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다제를 포함하는 폴리펩티드를 암호화하는 핵산 서열을 추가로 발현시키기 위해 조작되되, 바람직하게는 상기 재조합 미생물은 ω-옥소 지방산 및 ω-옥소 지방산 메틸 에스테르로 구성된 군에서 선택된 ω-하이드록시 지방산 유도체를 생산한다. 이와 같은 재조합 미생물은 EC 1.2.1.3/4/5의 알데하이드 탈수소효소 또는 EC 1.2.3.1의 알데하이드 옥시다제를 포함하는 폴리펩티드를 암호화하는 핵산 서열을 추가로 발현시키도록 조작될 수 있되, 상기 재조합 미생물은 α,ω-이산 또는 ω-카복시 지방산 메틸 에스테르인 ω-하이드록시 지방산 유도체를 생산한다. 이와 같은 재조합 미생물은 EC 6.2.1.3의 아실-CoA 리가제 또는 EC 2.8.3.6의 아실-CoA 전달효소를 포함하는 폴리펩티드를 암호화하는 핵산 서열을 추가로 발현시키기 위해 조작될 수 있되, 상기 재조합 미생물은 α,ω-디에스테르인 ω-하이드록시 지방산 유도체를 생산한다. 다양한 구현예에서, 상기-언급된 재조합 미생물 (EC 1.1.1.1/2의 알코올 탈수소효소 및 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다제를 포함하는 폴리펩티드를 암호화하는 핵산 서열을 추가로 발현하도록 가공됨)은, ω-아미노 지방산 및 ω-아미노 지방산 메틸 에스테르로 이루어진 군으로부터 선택된 ω-하이드록시 지방산 유도체를 생산하도록 EC 2.6.1의 아미노 전달효소 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 탈수소효소를 포함하는 폴리펩티드를 암호화하는 핵산 서열을 추가로 발현하도록 가공될 수 있다. 다양한 구현예에서, 상기 재조합 미생물은 EC 1.1.-. -의 알코올 탈수소효소 및 1.2.99. 의 카복실산 환원효소를 포함하는 폴리펩티드를 암호화하는 핵산 서열을 추가로 발현시키도록 조작될 수 있되, 상기 생산된 ω-하이드록시 지방산 유도체는 α,ω-디올이다. 또 다른 양태에서, 본 개시내용은, EC 3.1.2.- 또는 EC 3.1.1.5 또는 3.1.2.14의 티오에스테라제를 포함하는 폴리펩티드를 암호화하는 적어도 2개의 핵산 서열; 및 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하도록 가공된 경로를 갖는 재조합 미생물을 포괄한다. 상기 재조합 미생물은, 재생가능한 공급원료에서 유래된 탄소 공급원의 존재 하에 발효 액체배지에서 성장된 경우, ω-OH 지방산 또는 ω-OH 지방산 유도체를 생체내에서 생산하기 위해 사용될 수 있다. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 자족성(self-sufficient) CYP153A-RedRhF 하이브리드 융합 단백질 변이체이다.
일 측면에서, 본 개시내용은 하기를 포함하는 ω-하이드록시 지방산 유도체 제조 방법을 제공한다: (a) 탄소 공급원을 함유하는 재생 가능한 공급원료를 포함하는 배양 배지에서 본 개시내용의 재조합 미생물을 배양하는 단계 , 및 (b) 상기 재조합 미생물 또는 상기 배양 배지에서 ω-하이드록시 지방산 유도체를 단리하는 단계. 바람직하게는, 재생가능한 공급원료는 탄소계이며, 바람직하게는, 탄소 기반 재생가능한 공급원료는 옥수수, 사탕수수, 수수, 비트, 지팽이풀(switch grass), 목초, 짚, 목재, 펄프, 하수, 쓰레기, 셀룰로오스성 도시 쓰레기, 플루-가스, 합성가스, 바이오매스 가수분해물, 및 이산화탄소로 구성된 군으로부터 선택된다.
본 개시내용의 또 다른 측면은 본 개시내용의 재조합 숙주 세포를 포함하는 세포 배양물을 제공한다. 본 개시내용의 세포 배양물은 ω-OH 지방산 또는 이것의 조성물을 생산할 수 있다. 일 구현예에서, 세포 배양물은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물 중 하나 이상을 포함하는 ω-OH 지방산을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C16:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C16 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C12:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C12 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C14:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C14 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C18:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C18 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C10:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C10 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C8:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C8 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C20:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C20 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 추가의 포화 또는 불포화 ω-OH 지방산 또는 이의 조성물은 재조합 숙주 세포에 의해 생산된다.
본 개시내용의 추가의 또 다른 양태는 ω-OH 지방산을 생산하는 방법을 제공하며, 이는 탄소 공급원으로 본 개시내용의 숙주 세포를 배양하는 단계; 및 ω-OH 지방산 또는 이의 조성물을 수거하는 단계를 포함한다. 상기 방법은 상기 생산된 ω-OH 지방산의 역가의 증가/개선을 허용한다. 본 방법은, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물인 ω-OH 지방산을 수거하는 것을 고려한다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C16:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C16 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C12:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C12 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C14:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C14 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C18:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C18 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C10:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C10 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C8:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C8 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C20:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C20 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 추가의 포화 또는 불포화 ω-OH 지방산 또는 이의 조성물은 본원에 기재된 방법으로 생산된다.
본 개시내용의 또 다른 측면은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38과 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 및 위치 9, 10, 11, 12, 13, 14, 27, 28, 56, 61, 111, 119, 140, 149, 154, 157, 162, 164, 204, 231, 233, 244, 254, 271, 273, 302, 309, 327, 407, 413, 477, 480, 481, 527, 544, 546, 557, 567, 591, 648, 649, 703, 706, 707, 708, 709, 710, 719, 720, 736, 741, 745, 747, 749, 757, 770, 771, 784를 포함한 아미노산 위치에 적어도 하나의 돌연변이 (여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산 또는 이의 조성물로의 전환을 촉매함). CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아스파르테이트(D)가 아스파라긴(N)으로 치환(즉, 대체)된 위치 D9N; 아스파르테이트(D)가 리신(K)으로 치환된 위치 D9K; 아스파르트산(D)이 티로신(Y)으로 치환된 위치 D10Y; 이소류신(I)이 류신(L)으로 치환된 위치 I11L; 글루타민(Q)이 트립토판(W)으로 치환된 위치 Q12W; 글루타민(Q)이 아르기닌(R)으로 치환된 위치 Q12R; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q12T; 세린(S)이 리신(K)으로 치환된 위치 S13K; 아르기닌(R)이 페닐알라닌(F)으로 치환된 위치 R14F; 아르기닌(R)이 류신(L)으로 치환된 위치 R27L; 글루타민(Q)이 메티오닌(M)으로 치환된 위치 Q28M; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q28T; 프롤린(P)이 글루타민(Q)으로 치환된 위치 P56Q; 아스파라긴(N)이 류신(L)으로 치환된 위치 N61L; 페닐알라닌(F)이 알라닌(A)으로 치환된 위치 F111A; 리신(K)이 아르기닌(R)으로 치환된 위치 K119R; 세린(S)이 아스파라긴(N)으로 치환된 위치 S140N; 프롤린(P)이 글리신(G)으로 치환된 위치 P149G; 프롤린(P)이 아르기닌(R)으로 치환된 위치 P149R; 발린(V)이 글리신(G)으로 치환된 위치 V154G; 세린(S)이 아르기닌(R)으로 치환된 위치 S157R; 발린(V)이 시스테인(C)으로 치환된 위치 V162C; 알라닌(A)이 아스파라긴(N)으로 치환된 위치 A164N; 글리신(G)이 발린(V)으로 치환된 위치 G204V; 알라닌(A)이 트립토판(W)으로 치환된 위치 A231W; 알라닌(A)이 티로신(Y)으로 치환된 위치 A231Y; 알라닌(A)이 발린(V)으로 치환된 위치 A231V; 세린(S)이 류신(L)으로 치환된 위치 S233L; 세린(S)이 발린(V)으로 치환된 위치 S233V; 알라닌(A)이 아르기닌(R)으로 치환된 위치 A244R; 아르기닌(R)이 글리신(G)으로 치환된 위치 R254G; 글루타메이트(E)가 아스파르테이트(D)로 치환된 위치 E271D; 프롤린(P)이 메티오닌(M)으로 치환된 위치 P273M; 트레오닌(T)이 메티오닌(M)으로 치환된 위치 T302M; 아스파라긴(N)이 세린(S)으로 치환된 위치 N309S; 프롤린(P)이 아스파르테이트(D)로 치환된 위치 P327D; 아스파라긴(N)이 글리신(G)으로 치환된 위치 N407G; 티로신(Y)이 아르기닌(R)으로 치환된 위치 Y413R; 발린 (V)이 메티오닌 (M)으로 치환된 위치 V451M; 프롤린(P)이 글리신(G)으로 치환된 위치 P477G; 이소류신(I)이 글리신(G)으로 치환된 위치 I480G; 글리신(G)이 이소류신(I)으로 치환된 위치 G481I; 아스파르테이트(D)가 글루타메이트(E)로 치환된 위치 D527E; 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D544N; 프롤린(P)이 글리신(G)으로 치환된 위치 P546G; 글루타메이트(E)가 아르기닌(R)으로 치환된 위치 E557R; 글루타메이트(E)가 트립토판(W)으로 치환된 위치 E557W; 글루타메이트(E)가 세린(S)으로 치환된 위치 E567S; 글루타메이트(E)가 글루타민(Q)으로 치환된 위치 E591Q; 발린(V)이 류신(L)으로 치환된 위치 V648L; 세린(S)이 이소류신(I)으로 치환된 위치 S649I; 류신(L)이 글리신(G)으로 치환된 위치 L703G; 류신(L)이 글루타메이트(E)로 치환된 위치 L706E; 류신(L)이 세린(S)으로 치환된 위치 L706S; 류신(L)이 히스티딘(H)으로 치환된 위치 L706H; 아스파르테이트(D)가 글루타메이트(E)로 치환된 위치 D707E; 프롤린(P)이 세린(S)으로 치환된 위치 P708S; 아스파르테이트(D)가 류신(L)으로 치환된 위치 D709L; 발린(V)이 시스테인(C)으로 치환된 위치 V710C; 발린(V)이 아르기닌(R)으로 치환된 위치 V710R; 발린(V)이 글루타민(Q)으로 치환된 위치 V710Q; 아르기닌(R)이 트립토판(W)으로 치환된 위치 R719W; 아스파르테이트(D)가 발린(V)으로 치환된 위치 D720V; 알라닌(A)이 발린(V)으로 치환된 위치 A736V; 아스파라긴(N)이 글리신(G)으로 치환된 위치 N741G; 프롤린(P)이 리신(K)으로 치환된 위치 P745K; 프롤린(P)이 아르기닌(R)으로 치환된 위치 P745R; 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D747N; 글루타메이트(E)가 류신(L)으로 치환된 위치 E749L; 글루타메이트(E)가 메티오닌(M)으로 치환된 위치 E749M; 글루타메이트(E)가 알라닌(A)으로 치환된 위치 E757A; 트레오닌(T)이 글리신(G)으로 치환된 위치 T770G; 발린(V)이 페닐알라닌(F)으로 치환된 위치 V771F; 및 메티오닌(M)이 이소류신(I)으로 치환된 위치 M784I를 포함한 상기 위치들 중의 하나 이상에 돌연변이를 갖는다. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하이브리드 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 예를 들어, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산의 역가와 비교하여 더 높은 역가의 ω-OH 지방산을 야기한다: 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중). 또 다른 구현예에서, ω-OH 지방산은 ω-OH 지방산 조성물이다.
본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 예시는 하기이다: 서열 번호: 47-164 (서열 표 B 및 C (단락 [00147] 및 [00148] 하기)에 나타난 바와 같음).
본 개시내용의 또 다른 측면은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38과 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 및 747, 12, 327, 14, 61, 28, 13, 771, 119, 10, 11, 28, 231, 745, 9, 770, 413, 784, 749, 233, 757, 및 703으로 이루어진 그룹으로부터 선택된 아미노산 위치에 적어도 하나의 돌연변이 (여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매함). CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D747N; 글루타민(Q)이 트립토판(W)으로 치환된 위치 Q12W; 글루타민(Q)이 아르기닌(R)으로 치환된 위치 Q12R; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q12T; 프롤린(P)이 아스파르테이트(D)로 치환된 위치 P327D; 아르기닌(R)이 페닐알라닌(F)으로 치환된 위치 R14F; 아스파라긴(N)이 류신(L)으로 치환된 위치 N61L; 글루타민(Q)이 메티오닌(M)으로 치환된 위치 Q28M; 세린(S)이 리신(K)으로 치환된 위치 S13K; 발린(V)이 페닐알라닌(F)으로 치환된 위치 V771F; 리신(K)이 아르기닌(R)으로 치환된 위치 K119R; 아스파르트산(D)이 티로신(Y)으로 치환된 위치 D10Y; 이소류신(I)이 류신(L)으로 치환된 위치 I11L; 글루타민(Q)이 트레오닌(T)으로 치환된 위치 Q28T; 프롤린(P)이 아르기닌(R)으로 치환된 위치 P745R; 아스파르테이트(D)가 아스파라긴(N)으로 치환된 위치 D9N; 아스파르테이트(D)가 리신(K)으로 치환된 위치 D9K; 트레오닌(T)이 글리신(G)으로 치환된 위치 T770G; 티로신(Y)이 아르기닌(R)으로 치환된 위치 Y413R; 메티오닌(M)이 이소류신(I)으로 치환된 위치 M784I; 글루타메이트(E)가 류신(L)으로 치환된 위치 E749L; 세린(S)이 류신(L)으로 치환된 위치 S233L; 글루타메이트(E)가 알라닌(A)으로 치환된 위치 E757A; 류신 (L)이 글라이신 (G)으로 치환된 위치 L703G; 및 알라닌 (A)이 티로신 (Y)으로 치환된 위치 A231Y를 포함한 상기 위치들 중의 하나 이상에 돌연변이를 갖는다. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하이브리드 CYP153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 예를 들어, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산의 역가와 비교하여 더 높은 역가의 ω-OH 지방산을 야기한다: 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중). 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체(및 상응하는 폴리뉴클레오티드 서열)는 하기를 포함한다: 서열 번호: 47- 164 (서열 표 B 및 C에 나타난 바와 같음). 또 다른 구현예에서, 상기 ω-OH 지방산은 ω-OH 지방산 조성물이다.
본 개시내용의 또 다른 측면은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 98과 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 및 12, 27, 119, 140, 157, 159, 233 및 244로 이루어진 그룹으로부터 선택된 아미노산 위치에 적어도 하나의 돌연변이 (여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매함). 일 구현예에서, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 다음과 같은 위치, 예컨대 글루타민(Q)이 트립토판(W)으로 치환된 위치 Q12W; 아르기닌(R)이 류신 (L)으로 치환된 위치 R27L; 라이신(K)이 아르기닌(R)으로 치환된 위치 K119R; 세린(S)이 아스파라긴(N)으로 치환된 위치 S140N; 세린(S)이 아르기닌(R)으로 치환된 위치 S157R; 발린(V)이 메티오닌(M)으로 치환된 위치 V159M; 세린(S)이 류신(L)으로 치환된 위치 S233L; 및 알라닌(A)이 아르기닌(R)으로 치환된 위치 A244R 중 임의의 하나 이상에서 돌연변이를 갖는다.
본 개시내용의 또 다른 측면은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 100과 적어도 약 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 및 12, 28, 61, 119, 231, 309, 413 및 480로 이루어진 그룹으로부터 선택된 아미노산 위치에 적어도 하나의 돌연변이 (여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매함). 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 다음과 같은 위치, 예컨대 글루타민(Q)이 아르기닌(R)으로 치환된 위치 Q12R; 글루타민(Q)이 메티오닌(M)으로 치환된 위치 Q28M; 아스파라긴(N)이 류신(L)으로 치환된 위치 N61L; 라이신(K)이 아르기닌(R)으로 치환된 위치 K119R; 알라닌(A)이 발린(V)으로 치환된 위치 A231V; 아스파라긴(N)이 세린(S)으로 치환된 위치 N309S; 티로신(Y)이 아르기닌(R)으로 치환된 위치 Y413R; 및 이소류신(I)이 글리신(G)으로 치환된 위치 I480G 중 임의의 하나 이상에서 돌연변이를 갖는다.
본 개시내용의 또 다른 측면은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38의 아미노산 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 또는 89% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아미노산 위치 12에서의 돌연변이 및 하기의 아미노산 위치 각각에서의 돌연변이를 포함한다: (a) 서열 번호: 38의 27, 119, 140, 157, 159, 233, 및 244; (b) 서열 번호: 38의 28, 61, 119, 231, 309, 413, 및 480; (c) 서열 번호: 38의 119, 231, 및 480; (d) 서열 번호: 38의 28, 77, 119, 141, 231, 및 407; (e) 서열 번호: 38의 28, 61, 141, 231, 및 407; (f) 서열 번호: 38의 28, 119, 231, 및 244; (g) 서열 번호: 38의 28, 407, 및 480; (h) 서열 번호: 38의 141, 231, 413, 및 481; (i) 서열 번호: 38의 28, 111, 231, 및 407; (j) 서열 번호: 38의 28, 61, 140, 및 149; (k) 서열 번호: 38의 28, 77, 119, 159, 231, 254, 407, 및 480; (l) 서열 번호: 38의 28, 254, 309, 407, 및 451; (m) 서열 번호: 38의 28, 254, 309, 407, 및 480; 또는 (n) 서열 번호: 38의 28, 309, 407, 451, 및 480; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 본 개시내용의 또 다른 측면은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38의 아미노산 서열과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아미노산 위치 12에서의 돌연변이 및 하기의 아미노산 위치 각각에서의 돌연변이를 포함한다: (a) 서열 번호: 38의 27, 119, 140, 157, 159, 233, 및 244; (b) 서열 번호: 38의 28, 61, 119, 231, 309, 413, 및 480; (c) 서열 번호: 38의 119, 231, 및 480; (d) 서열 번호: 38의 28, 77, 119, 141, 231, 및 407; (e) 서열 번호: 38의 28, 61, 141, 231, 및 407; (f) 서열 번호: 38의 28, 119, 231, 및 244; (g) 서열 번호: 38의 28, 407, 및 480; (h) 서열 번호: 38의 141, 231, 413, 및 481; (i) 서열 번호: 38의 28, 111, 231, 및 407; (j) 서열 번호: 38의 28, 61, 140, 및 149; (k) 서열 번호: 38의 28, 77, 119, 159, 231, 254, 407, 및 480; (l) 서열 번호: 38의 28, 254, 309, 407, 및 451; (m) 서열 번호: 38의 28, 254, 309, 407, 및 480; 또는 (n) 서열 번호: 38의 28, 309, 407, 451, 및 480; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 38의 아미노산 위치 12, 27, 119, 140, 157, 159, 233, 및 244 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 38의 아미노산 위치 12, 28, 61, 119, 231, 309, 413, 및 480 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 38의 아미노산 위치 12, 119, 231, 및 480 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 38의 아미노산 위치 12, 28, 77, 119; 141, 231 및 407 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 38의 아미노산 위치 12, 28, 61, 141, 231, 및 407 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 38의 아미노산 위치 12, 28, 119, 231, 및 244 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 38의 아미노산 위치 12, 28, 407, 및 480 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (h) 서열 번호: 38의 아미노산 위치 12, 141, 231, 413, 및 481 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (i) 서열 번호: 38의 아미노산 위치 12, 28, 111, 231, 및 407 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (j) 서열 번호: 38의 아미노산 위치 12, 28, 61, 140, 및 149 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (k) 아미노산 위치 12, 28, 77, 119, 159, 231, 254, 407, 및 480 하에서의 돌연변이는 아미노산 치환이다. 다양한 구현예에서, (l) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 451 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (m) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 480 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (n) 서열 번호: 38의 아미노산 위치 12, 28, 309, 407, 451, 및 480 하에서의 돌연변이는, 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 38의 아미노산 위치 12, 27, 119, 140, 157, 159, 233, 및 244 하에서의 돌연변이는 Q12W, R27L, K119R, S140N, S157R, V159M, S233L, 및 A244R, 각각이다. 일 구현예에서, (b) 서열 번호: 38의 아미노산 위치 12, 28, 61, 119, 231, 309, 413, 및 480 하에서의 돌연변이는 Q12R, Q28M, N61L, K119R, A231V, N309S, Y413R, 및 I480G, 각각이다. 일 구현예에서, (c) 서열 번호: 38의 아미노산 위치 12, 119, 231, 및 480 하에서의 돌연변이는, Q12R, K119R, A231V, 및 I480G, 각각이다. 일 구현예에서, (d) 서열 번호: 38의 아미노산 위치 12, 28, 77, 119; 141, 231 및 407 하에서의 돌연변이는 Q12T, Q28M, R77Q, K119R, V141T, A231W, 및 N407G, 각각이다. 일 구현예에서, (e) 서열 번호: 38의 아미노산 위치 12, 28, 61, 141, 231, 및 407 하에서의 돌연변이는, Q12R, Q28M, N61L, V141T, A231Y, 및 N407G, 각각이다. 일 구현예에서, (f) 서열 번호: 38의 아미노산 위치 12, 28, 119, 231, 및 244 하에서의 돌연변이는 Q12W, Q28M, K119R, A231Y, 및 A244R, 각각이다. 일 구현예에서, (g) 서열 번호: 38의 아미노산 위치 12, 28, 407, 및 480 하에서의 돌연변이는, Q12W, Q28T, N407G, 및 I480G, 각각이다. 일 구현예에서, (h) 서열 번호: 38의 아미노산 위치 12, 141, 231, 413, 및 481 하에서의 돌연변이는 Q12R, V141T, A231Y, Y413R, 및 G481I, 각각이다. 일 구현예에서, (i) 서열 번호: 38의 아미노산 위치 12, 28, 111, 231, 및 407 하에서의 돌연변이는 Q12T, Q28M, F111A, A231V, 및 N407G, 각각이다. 일 구현예에서, (j) 서열 번호: 38의 아미노산 위치 12, 28, 61, 140, 및 149 하에서의 돌연변이는 Q12T, Q28M, N61L, S140N, 및 P149R, 각각이다. 일 구현예에서, 아미노산 위치 12, 28, 77, 119, 159, 231, 254, 407 및 480에서 (k) 하의 상기 돌연변이는 각각 Q12W, Q28T, R77Q, K119R, V159M, A231Y, R254G, N407G, 및 I480G이다. 일 구현예에서, (l) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 451 하에서의 돌연변이는, Q12W, Q28T, R254G, N309S, N407G, 및 V451M, 각각이다. 일 구현예에서, (m) 서열 번호: 38의 아미노산 위치 12, 28, 254, 309, 407, 및 480 하에서의 돌연변이는, Q12W, Q28T, R254G, N309S, N407G, 및 I480G, 각각이다. 일 구현예에서, (n) 서열 번호: 38의 아미노산 위치 12, 28, 309, 407, 451, 및 480 하에서의 돌연변이는, Q12W, Q28T, N309S, N407G, V451M, 및 I480G, 각각이다. 일 바람직한 구현예에서, 상기 (a)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 추가로 하기를 포함한다: 하기에서의 돌연변이: 서열 번호: 38의 아미노산 위치 141, 231 및 407 각각, 또는 서열 번호: 38의 아미노산 위치 231, 407, 451, 757, 770 및 784 각각, 또는 서열 번호: 38의 아미노산 위치 231, 407, 591, 643, 757 및 784 각각. 다양한 구현예에서, 서열 번호: 38의 아미노산 위치 141, 231 및 407 각각에서의 추가 돌연변이는, 아미노산 치환이다. 또한, 다양한 구현예에서, 서열 번호: 38의 아미노산 위치 231, 407, 451, 757, 770 및 784 각각에서의 추가 돌연변이는, 아미노산 치환이다. 또한, 다양한 구현예에서, 서열 번호: 38의 아미노산 위치 231, 407, 591, 643, 757 및 784 각각에서의 추가 돌연변이는, 아미노산 치환이다. 바람직하게는, 서열 번호: 38의 아미노산 위치 141, 231 및 407 각각에서의 추가 돌연변이는, V141T, A231Y, 및 N407G, 각각이다. 또한, 바람직하게는, 서열 번호: 38의 아미노산 위치 231, 407, 451, 757, 770 및 784 각각에서의 돌연변이는, A231Y, N407G, V451M, E757A, T770G, 및 M784I, 각각이다. 또한, 바람직하게는, 서열 번호: 38의 아미노산 위치 231, 407, 591, 643, 757 및 784 각각에서의 돌연변이는, A231Y, N407G, E591Q, R643H, E757A, 및 M784I, 각각이다. 더욱 바람직하게는, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 포함한다: 서열 번호: 146, 서열 번호: 150, 또는 서열 번호: 160. 본 개시내용의 기타 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122 및 서열 번호: 124.
또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38의 아미노산 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 또는 89% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 하기 아미노산 위치 중 각각에서의 RhF 도메인 (또는 RhF 환원효소 도메인, 또는 Red450RhF 도메인, 또는 Red450RhF 환원효소 도메인, 또는 P450RhF 도메인, 또는 P450RhF 환원효소 도메인) 내 돌연변이를 포함한다: (a) 서열 번호: 38의 527, 544, 719, 757, 771, 및 784; (b) 서열 번호: 38의 527, 544, 및 557; (c) 서열 번호: 38의 770 및 784; (d) 서열 번호: 38의 527, 591, 648, 719, 757, 771, 및 784; (e) 서열 번호: 38의 527, 591, 648, 757, 및 771; (f) 서열 번호: 38의 527, 544, 770, 및 784; (g) 서열 번호: 38의 527, 557, 770, 및 784; (h) 서열 번호: 38의 557, 757, 및 770; (i) 서열 번호: 38의 557, 757, 및 771; 또는 (j) 서열 번호: 38의 757 및 770; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38의 아미노산 서열과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 하기 아미노산 위치 중 각각에서의 RhF 도메인 (또는 RhF 환원효소 도메인, 또는 Red450RhF 도메인, 또는 Red450RhF 환원효소 도메인, 또는 P450RhF 도메인, 또는 P450RhF 환원효소 도메인) 내 돌연변이를 포함한다: (a) 서열 번호: 38의 527, 544, 719, 757, 771, 및 784; (b) 서열 번호: 38의 527, 544, 및 557; (c) 서열 번호: 38의 770 및 784; (d) 서열 번호: 38의 527, 591, 648, 719, 757, 771, 및 784; (e) 서열 번호: 38의 527, 591, 648, 757, 및 771; (f) 서열 번호: 38의 527, 544, 770, 및 784; (g) 서열 번호: 38의 527, 557, 770, 및 784; (h) 서열 번호: 38의 557, 757, 및 770; (i) 서열 번호: 38의 557, 757, 및 771; 또는 (j) 서열 번호: 38의 757 및 770; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 38의 아미노산 위치 527, 544, 719, 757, 771, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 38의 아미노산 위치 527, 544, 및 557 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 38의 아미노산 위치 770 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 38의 아미노산 위치 527, 591, 648, 719; 757, 771 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 38의 아미노산 위치 527, 591, 648, 757, 및 771 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 38의 아미노산 위치 527, 544, 770, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 38의 아미노산 위치 527, 557, 770, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (h) 서열 번호: 38의 아미노산 위치 557, 757, 및 770 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (i) 서열 번호: 38의 아미노산 위치 557, 757 및 771 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (j) 서열 번호: 38의 아미노산 위치 757, 및 770 하에서의 돌연변이는, 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 38의 아미노산 위치 527, 544, 719, 757, 771, 및 784 하에서의 돌연변이는, D527E, D544N, R719W, E757A, V771F, 및 M784I, 각각이다. 일 구현예에서, (b) 서열 번호: 38의 아미노산 위치 527, 544, 및 557 하에서의 돌연변이는 D527E, D544N, 및 E557R, 각각이다. 일 구현예에서, (c) 서열 번호: 38의 아미노산 위치 770 및 784 하에서의 돌연변이는T770G 및 M784I, 각각이다. 일 구현예에서, (d) 서열 번호: 38의 아미노산 위치 527, 591, 648, 719; 757, 771 및 784 하에서의 돌연변이는, D527E, E591Q, V648L, R719W, E757A, V771F, 및 M784I, 각각이다. 일 구현예에서, (e) 서열 번호: 38의 아미노산 위치 527, 591, 648, 757, 및 771 하에서의 돌연변이는 D527E, E591Q, V648L, E757A, 및 V771F, 각각이다. 일 구현예에서, (f) 서열 번호: 38의 아미노산 위치 527, 544, 770, 및 784 하에서의 돌연변이는, D527E, D544N, T770G, 및 M784I, 각각이다. 일 구현예에서, (g) 서열 번호: 38의 아미노산 위치 527, 557, 770, 및 784 하에서의 돌연변이는, D527E, E557R, T770G, 및 M784I, 각각이다. 일 구현예에서, (h) 서열 번호: 38의 아미노산 위치 557, 757, 및 770 하에서의 돌연변이는 E557W, E757A, 및 T770G, 각각이다. 일 구현예에서, (i) 서열 번호: 38의 아미노산 위치 557, 757 및 771 하에서의 돌연변이는 E557R, E757A, 및 V771F, 각각이다. 일 구현예에서, (j) 서열 번호: 38의 아미노산 위치 757 및 770 하에서의 돌연변이는 E757A 및 T770G, 각각이다. 본 개시내용의 일부 바람직한 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142 및 서열 번호: 144.
추가의 또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38의 아미노산 서열과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 위치 각각에서의 돌연변이를 포함한다: (a) 서열 번호: 38의 141, 231, 233, 및 254; (b) 서열 번호: 38의 141, 231, 233, 및 244; (c) 서열 번호: 38의 141, 231, 244, 451, 557, 749, 및 770; (d) 서열 번호: 38의 27, 28, 61, 141, 149, 및 231; (e) 서열 번호: 38의 141, 157, 231, 233, 244, 757, 및 784; (f) 서열 번호: 38의 28, 61, 140, 141, 231, 233, 및 271; 또는 (g) 서열 번호: 38의 231, 233, 254, 및 557; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 추가의 또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38의 아미노산 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 또는 89% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 위치 각각에서의 돌연변이를 포함한다: (a) 서열 번호: 38의 141, 231, 233, 및 254; (b) 서열 번호: 38의 141, 231, 233, 및 244; (c) 서열 번호: 38의 141, 231, 244, 451, 557, 749, 및 770; (d) 서열 번호: 38의 27, 28, 61, 141, 149, 및 231; (e) 서열 번호: 38의 141, 157, 231, 233, 244, 757, 및 784; (f) 서열 번호: 38의 28, 61, 140, 141, 231, 233, 및 271; 또는 (g) 서열 번호: 38의 231, 233, 254, 및 557; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 38의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 38의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 38의 아미노산 위치 141, 157, 231, 233; 244, 757 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 38의 아미노산 위치 28, 61, 140, 141; 231, 233 및 271 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 38의 아미노산 위치 231, 233, 254, 및 557 하에서의 돌연변이는, 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는, V141T, A231Y, L233S, 및 R254G, 각각이다. 일 구현예에서, (b) 서열 번호: 38의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는, V141T, A231Y, L233S, 및 R244A, 각각이다. 일 구현예에서, (c) 서열 번호: 38의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는, V141T, A231Y, R244A, V451M, E557W, E749L, 및 T770G, 각각이다. 일 구현예에서, (d) 서열 번호: 38의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는, L27R, Q28M, N61L, V141T, P149G, 및 A231Y, 각각이다. 일 구현예에서, (e) 서열 번호: 38의 아미노산 위치 141, 157, 231, 233; 244, 757 및 784 하에서의 돌연변이는, V141T, R157S, A231Y, L233S, R244A, E757A, 및 M784I, 각각이다. 일 구현예에서, (f) 서열 번호: 38의 아미노산 위치 28, 61, 140, 141; 231, 233 및 271 하에서의 돌연변이는, Q28M, N61L, N140S, V141T, A231Y, L233S, 및 E271D, 각각이다. 일 구현예에서, (g) 서열 번호: 38의 아미노산 위치 231, 233, 254, 및 557 하에서의 돌연변이는, A231Y, L233S, R254G, 및 E557W, 각각이다. 본 개시내용의 일부 바람직한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 148, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 162 및 서열 번호: 164.
추가의 또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 98의 아미노산 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 또는 89% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 아미노산 위치 각각에서의 돌연변이를 포함한다: (a) 서열 번호: 98의 141, 231, 및 407; (b) 서열 번호: 98의 141, 231, 233, 및 254; (c) 서열 번호: 98의 231, 407, 451, 757, 770, 및 784; (d) 서열 번호: 98의 141, 231, 233, 및 244; (e) 서열 번호: 98의 141, 231, 244, 451, 557, 749, 및 770; (f) 서열 번호: 98의 27, 28, 61, 141, 149, 및 231; (g) 서열 번호: 98의 27, 119, 140, 141, 159, 231, 757, 및 784; (h) 서열 번호: 98의 231, 407, 591, 643, 757, 및 784; (i) 서열 번호: 98의 28, 61, 140, 141, 231, 233, 및 271; 또는 (j) 서열 번호: 98의 231, 233 및 254; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 추가의 또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 98의 아미노산 서열과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 아미노산 위치 각각에서의 돌연변이를 포함한다: (a) 서열 번호: 98의 141, 231, 및 407; (b) 서열 번호: 98의 141, 231, 233, 및 254; (c) 서열 번호: 98의 231, 407, 451, 757, 770, 및 784; (d) 서열 번호: 98의 141, 231, 233, 및 244; (e) 서열 번호: 98의 141, 231, 244, 451, 557, 749, 및 770; (f) 서열 번호: 98의 27, 28, 61, 141, 149, 및 231; (g) 서열 번호: 98의 27, 119, 140, 141, 159, 231, 757, 및 784; (h) 서열 번호: 98의 231, 407, 591, 643, 757, 및 784; (i) 서열 번호: 98의 28, 61, 140, 141, 231, 233, 및 271; 또는 (j) 서열 번호: 98의 231, 233 및 254; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 다양한 구현예에서, (a) 서열 번호: 98의 아미노산 위치 141, 231, 및 407 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (b) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (c) 서열 번호: 98의 아미노산 위치 231, 407, 451, 757, 770, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (d) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (e) 서열 번호: 98의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (f) 서열 번호: 98의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (g) 서열 번호: 98의 아미노산 위치 27, 119, 140, 141, 159, 231, 757, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (h) 서열 번호: 98의 아미노산 위치 231, 407, 591, 643, 757, 및 784 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (i) 서열 번호: 98의 아미노산 위치 28, 61, 140, 141; 231, 233 및 271 하에서의 돌연변이는, 아미노산 치환이다. 다양한 구현예에서, (j) 서열 번호: 38의 아미노산 위치 231, 233, 및 254 하에서의 돌연변이는, 아미노산 치환이다. 일 구현예에서, (a) 서열 번호: 98의 아미노산 위치 141, 231, 및 407 하에서의 돌연변이는, V141T, A231Y, 및 N407G, 각각이다. 일 구현예에서, (b) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 254 하에서의 돌연변이는, V141T, A231Y, L233S, 및 R254G, 각각이다. 일 구현예에서, (c) 서열 번호: 98의 아미노산 위치 231, 407, 451, 757, 770, 및 784 하에서의 돌연변이는, A231Y, N407G, V451M, E757A, T770G, 및 M784I, 각각이다. 일 구현예에서, (d) 서열 번호: 98의 아미노산 위치 141, 231, 233, 및 244 하에서의 돌연변이는, V141T, A231Y, L233S, 및 R244A, 각각이다. 일 구현예에서, (e) 서열 번호: 98의 아미노산 위치 141, 231, 244, 451; 557, 749 및 770 하에서의 돌연변이는, V141T, A231Y, R244A, V451M, E557W, E749L, 및 T770G, 각각이다. 일 구현예에서, (f) 서열 번호: 98의 아미노산 위치 27, 28, 61, 141, 149, 및 231 하에서의 돌연변이는, L27R, Q28M, N61L, V141T, P149G, 및 A231Y, 각각이다. 일 구현예에서, (g) 서열 번호: 98의 아미노산 위치 141, 157, 231, 233; 244, 757 및 784 하에서의 돌연변이는, V141T, R157S, A231Y, L233S, R244A, E757A, 및 M784I, 각각이다. 일 구현예에서, (h) 서열 번호: 98의 아미노산 위치 231, 407, 591, 643, 757, 및 784 하에서의 돌연변이는, A231Y, N407G, E591Q, R643H, E757A, 및 M784I, 각각이다. 일 구현예에서, (i) 서열 번호: 98의 아미노산 위치 28, 61, 140, 141; 231, 233 및 271 하에서의 돌연변이는, Q28M, N61L, N140S, V141T, A231Y, L233S, 및 E271D, 각각이다. 일 구현예에서, (j) 서열 번호: 98의 아미노산 위치 231, 233, 254, 및 557 하에서의 돌연변이는, A231Y, L233S, R254G, 및 E557W, 각각이다. 본 개시내용의 일부 바람직한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164.
또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38, 또는 서열 번호: 98의 아미노산 서열과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, (CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 위치 10, 11, 12, 27, 28, 111, 119, 140, 141, 149, 157, 159, 197, 231, 233, 244, 254, 407 및 477에서의 하나 이상의 돌연변이(들)를 포함함). CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다. 추가의 또 다른 양태에서, 본 개시내용은 하기를 포함하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 38, 또는 서열 번호: 98의 아미노산 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 또는 89% 서열 동일성, (CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 포함하는 하나 이상의 돌연변이를 포함함: (a) Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A231Y, S233L, A244R (서열 번호: 166); (b) Q12W, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, R254G, N407G (서열 번호: 168); (c) Q12W, R27L, F111A, K119R, V141T, S157R, V159M, A231Y, S233L, A244R, R254G (서열 번호: 170); (d) Q12W, Q28M, K119R, S140N, P149G, S157R, V159M, A231Y, S233L, N407G (서열 번호: 172); (e) Q12W, R27L, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, N407G (서열 번호: 174); (f) D10Y, I11L, Q12W, Q28M, K119R, V141T, V159M, A231Y, S233L, A244R, N407G (서열 번호: 176); (g) I11L, Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G, P477G (서열 번호: 178); (h) I11L, Q12W, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G (서열 번호: 180); 및 (i) I11L, Q12W, R27L, Q28M, K119R, V141T, P149G, S157R, V159M, A231Y, S233L, N407G (서열 번호: 182). 다양한 구현예에서, (a)-(i) 하에서의 돌연변이는 아미노산 치환이다. 본 개시내용의 일부 바람직한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기 중 임의의 것의 아미노산 서열을 포함한다: 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180 및 서열 번호: 182.
본 개시내용은 서열 번호: 38의 아미노산 서열에 적어도 90% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 고려하며, 여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아미노산 위치 12에서의 돌연변이 및 하기 아미노산 위치 각각에서의 돌연변이를 포함한다: (a) 서열 번호: 38의 12, 27, 28, 119, 141, 157, 159, 231, 233, 및 244; (b) 서열 번호: 38의 12, 28, 119, 140, 157, 159, 233, 244, 254, 및 407; (c) 서열 번호: 38의 12, 27, 111, 119, 141, 157, 159, 231, 233, 244, 및 254; (d) 서열 번호: 38의 12, 28, 119, 140, 149, 157, 159, 231, 233, 및 407; (e) 서열 번호: 38의 12, 27, 28, 119, 140, 157, 159, 233, 244, 및 407; (f) 서열 번호: 38의 10, 11, 12, 28, 119, 141, 159, 231, 233, 244, 및 407; (g) 서열 번호: 38의 11, 12, 27, 28, 119, 141, 157, 159, 197, 231, 233, 244, 407, 및 477; (f) 서열 번호: 38의 11, 12, 28, 119, 141, 157, 159, 197, 231, 233, 244, 및 407; 또는 (i) 서열 번호: 38의 11, 12, 27, 28, 119, 141, 149, 157, 159, 231, 233, 및 407; 여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매한다.
일 특정 측면에서, 본 개시내용은 하기의 특징을 갖는 청구항 1에 따른 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: (a) 서열 번호: 38의 아미노산 위치 12, 27, 28, 119, 141, 157, 159, 231, 233, 및 244에서의 돌연변이는, Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A231Y, S233L, 및 A244R, 각각이며; (b) 서열 번호: 38의 아미노산 위치 12, 28, 119, 140, 157, 159, 233, 244, 254, 및 407에서의 돌연변이는, Q12W, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, R254G, 및 N407G, 각각이며; (c) 서열 번호: 38의 아미노산 위치 12, 27, 111, 119, 141, 157, 159, 231, 233, 244, 및 254에서의 돌연변이는, Q12W, R27L, F111A, K119R, V141T, S157R, V159M, A231Y, S233L, 및 R254G, 각각이며; (d) 서열 번호: 38의 아미노산 위치 12, 28, 119, 140, 149, 157, 159, 231, 233, 및 407에서의 돌연변이는, Q12W, Q28M, K119R, S140N, P149G, S157R, V159M, A231Y, S233L, 및 N407G, 각각이며; (e) 서열 번호: 38의 아미노산 위치 12, 27, 28, 119, 140, 157, 159, 233, 244, 및 407에서의 돌연변이는, Q12W, R27L, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, 및 N407G, 각각이며; (f) 서열 번호: 38의 아미노산 위치 10, 11, 12, 28, 119, 141, 159, 231, 233, 244, 및 407에서의 돌연변이는, D10Y, I11L, Q12W, Q28M, K119R, V141T, V159M, A231Y, S233L, 및 N407G, 각각이며; (g) 서열 번호: 38의 아미노산 위치 11, 12, 27, 28, 119, 141, 157, 159, 197, 231, 233, 244, 407, 및 477에서의 돌연변이는, I11L, Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G, 및 P477G, 각각이며; (h) 서열 번호: 38의 아미노산 위치 11, 12, 28, 119, 141, 157, 159, 197, 231, 233, 244, 및 407에서의 돌연변이는, I11L, Q12W, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, 및 N407G, 각각이며; 그리고 (i) 서열 번호: 38의 아미노산 위치 11, 12, 27, 28, 119, 141, 149, 157, 159, 231, 233, 및 407에서의 돌연변이는, I11L, Q12W, R27L, Q28M, K119R, V141T, P149G, S157R, V159M, A231Y, S233L, 및 N407G, 각각이다.
또 다른 측면에서, 본 개시내용은 하기의 특징을 갖는 청구항 2에 따른 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: (a) (a)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 166; (b) (b)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 168; (c) (c)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 170; (d) (d)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 172; (e) (e)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 174; (f) (f)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 176; (g) (g)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 178; (h) (h)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 180; 그리고 (i) (i)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기의 아미노산 서열을 가지며: 서열 번호: 182.
일 구현예에서, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 비제한적으로, 하기를 포함한다: 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180 및 서열 번호: 182. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 오메가-하이드록실화된 지방산의 역가와 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 유발한다: 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중). 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하이브리드 CYP153A-RedRhF 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포는 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현시킨다. 또 다른 구현예에서, 상기 재조합 숙주 세포는 EC 3.1.2.-, EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제 폴리펩티드를 추가로 발현시킨다. 추가의 또 다른 구현예에서, 하기를 갖는 상응하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 숙주 세포에 의해 생산된 오메가-하이드록실화 지방산 조성물의 역가보다 적어도 10% 더 큰, 적어도 15% 더 큰, 적어도 20% 더 큰, 적어도 25% 더 큰, 또는 적어도 30% 더 큰 역가로 오메가-하이드록실화 지방산 조성물을 생산한다: 서열 번호: 38, 또는 서열 번호: 6 (탄소 공급원을 함유하는 배지에서 배양되는 경우). 또 다른 구현예에서, 본 개시내용은 앞서 고려된 재조합 숙주 세포를 포함하는 세포 배양물을 제공한다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는 오메가-하이드록실화된 지방산의 제조 방법을 제공한다: (i) 탄소 공급원의 존재 하에 재조합 숙주 세포 또는 상기 세포 배양물을 배양하는 단계; 및 (ii) 오메가-하이드록실화된 지방산을 수거하는 단계.
본 개시내용은 하기를 포함하는 폴리펩티드를 암호화하는 적어도 2종의 핵산 서열을 발현시키도록 조작된 경로를 포함하는 재조합 미생물을 추가로 고려한다: (i) EC 3.1.2.-, EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제; 및 (ii) CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체.
본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 CYP153A ω-하이드록실라제 도메인 및 P450RhF 환원효소 도메인을 포함한다. 상기 두 도메인의 순서는 비제한적으로 도 5에 나타낸 순서이다. 상기 CYP153A ω-하이드록실라제 도메인은 N-말단에 존재할 수도 있고 또는 상기 하이브리드 융합 폴리펩티드 변이체의 C-말단에 존재할 수도 있다. 또한, 상기 P450RhF 환원효소 도메인은 상기 N-말단에 존재하거나, 또는 하이브리드 융합 폴리펩티드 변이체의 C-말단에 존재할 수 있다. 상기 두 도메인은 도 5에서 나타낸 바와 같이, 직접적으로 또는 링커에 의해 연결될 수 있다. 다양한 구현예에서, 링커는 펩티드 또는 폴리펩티드 링커이다. 상기 링커의 아미노산 서열의 길이는 실험적으로 또는 구조적 정보의 안내로 또는 상기 두 가지 접근법의 조합을 사용함으로써 선택될 수 있다. 당해 분야의 숙련가는 과도하게 길거나 또는 짧지 않음을 기본적인 고려로 하여 링커로 작용할 수 있는 길이 또는 조성이 다양한 그와 같은 서열이 많이 있음을 인식할 것이다.
본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 상기에서 언급된 바와 같이 CYP153A ω-하이드록실라제 도메인 및 P450RhF 환원효소 도메인을 포함한다. 서열 번호: 6의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 아미노산 서열은, 일 돌연변이, 즉 위치 307 (G307A)에서의 돌연변이를 포함하며, 여기서 알라닌 (A)은 글라이신 (G)으로 치환 (즉, 대체)된다. 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 아미노산 서열은, 서열 번호: 6의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 아미노산 서열에 상응하며, (단, 일 추가의 돌연변이, 즉 위치 796 (A796V)에서의 돌연변이를 갖는 것을 제외함), 여기서 알라닌 (A)은 발린 (V)으로 치환 (즉, 대체)된다.
(주형) CYP153A-환원효소 하이브리드 융합 폴리펩티드로서, 오메가-하이드록시 지방산 유도체를 생산하기 위해 CYP153A P450 옥시게나제가 환원효소 도메인과 융합되는 하이브리드 융합 단백질이 고려될 수 있을 것이다. 자족성 사이토크롬 P450 옥시게나제는 환원효소 파트너가 상기 사이토크롬 P450 촉매적 단백질에 융합된 효소이다. 자족성 박테리아 사이토크롬 P450 옥시게나제의 한 부류는 로도코쿠스 종( Rhodococcus sp ) NCIMB 9784에서 유래된 P450RhF에 의해 대표되며 (Roberts et al. (2003) J. Biol. Chem. 278:48914; Hunter et al. (2005) FEBS Lett. 579:2215), 그리고 “I형 P450-융합된 PFOR”로 지칭된다 (DeMot and Parret (2002) Trends Microbiol. 10:502). 따라서, (주형) CYP153A-환원효소 하이브리드 융합 폴리펩티드로서, CYPl53A P450 촉매적 단백질(예를 들면, 마리노박터 아쿠아에올리에서 유래됨) 및, 로도코쿠스 종 NCIMB9784에서 유래된 P450RhF의 c-말단 FMN- 및 Fe/S-함유 환원효소 도메인을 포함하는 융합 단백질이 고려될 수 있을 것이다.
본 개시내용의 다양한 구현예에서, 하이브리드 융합 폴리펩티드 변이체는 자기-충분하고, 지방산(유도체)의 ω-OH 지방산 또는 ω-OH 지방산 유도체로의 반응에 촉매작용을 일으키는 ω-하이드록실라제 효소 활성을 보유한다.
일 측면에서, 본 개시내용은 재생가능한 공급원료에서 유래된 탄소 공급원의 존재 하에 발효 액체배지에서 성장될 경우, 생체내에서 ω-OH 지방산 또는 ω-OH 지방산 유도체를 생산하기 위한 재조합 미생물 또는 재조합 숙주 세포를 아우르되, 상기 미생물은 EC 3.1.2. - 또는 EC 3.1.1.5 또는 3.1.2.14의 티오에스테라제를 포함하는 폴리펩티드; 및 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 암호화하는 적어도 2종의 핵산 서열을 발현시키기 위해 조작된 경로를 갖되, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56 서열 번호: 58, 서열 번호: 60 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164 중 어느 하나와 적어도 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 자족성(self-sufficient) CYP153A-RedRhF 하이브리드 융합 단백질 변이체이다.
본 발명의 또 다른 측면은 상기 논의된 바와 같은 재조합 숙주 세포(상기)를 포함한 세포 배양물을 제공하며, 여기서, 세포 배양물은 ω-OH 지방산 또는 이의 조성물을 생산한다. 일 구현예에서, 세포 배양물은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물 중 하나 이상을 포함하는 ω-OH 지방산을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C16:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C16 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C12:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C12 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C14:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C14 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C18:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C18 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C10:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C10 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C8:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C8 지방산 또는 이의 조성물을 생산한다. 하나의 구현예에서, 세포 배양물은 불포화 ω-OH C20:1 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 세포 배양물은 포화 ω-OH C20 지방산 또는 이의 조성물을 생산한다. 또 다른 구현예에서, 추가의 포화 또는 불포화 ω-OH 지방산 또는 이의 조성물은 재조합 숙주 세포에 의해 생산된다.
본 발명의 여전히 또 다른 측면은 숙주 세포(상기)를 탄소 공급원과 배양하는 단계; 및 ω-OH 지방산 또는 이의 조성물을 수거하는 단계를 포함하는, 역가 증가를 갖는 ω-OH 지방산을 제조하는 방법을 제공한다. 특히, 본 방법은, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 이의 지방산 유도체 또는 조성물을 생산하는 것을 포괄한다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C16:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C16 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C12:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C12 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C14:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C14 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C18:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C18 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C10:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C10 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C8:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C8 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C20:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C20 지방산 또는 이의 조성물이다. 하나의 구현예에서, 수거된 ω-OH 지방산은 불포화 ω-OH C22:1 지방산 또는 이의 조성물이다. 또 다른 구현예에서, 수거된 ω-OH 지방산은 포화 ω-OH C22 지방산 또는 이의 조성물이다.
본 발명은 몇몇 바람직한 구현예들을 예시하기 위한 작용을 하는 첨부된 도면을과 함께 판독할 때 가장 잘 이해된다. 그러나, 본 발명이 도면에 개시된 특정 구현예들로 제한되지 않는 것으로 이해된다.
도 1은 재조합 미생물에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 및 티오에스테라제 폴리펩티드를 발현시킨 결과로서, 예를 들면, ω-하이드록실화 C12 지방산 (ω-OH C12 FFA) 및/또는 ω-하이드록실화 C16:1 지방산 (ω-OH C16:1 FFA)과 같은 ω-하이드록실화 지방산 유도체의 제조를 위한 예시적인 생합성 경로의 개략적인 개요이다. FAB는 미생물에서의 지방산 생합성을 나타내고; fatB1은 캘리포니아만 월계수(Umbellularia californica)(캘리포니아만)으로부터의 중쇄 아실-ACP 티오에스테라제를 나타내고; fatA3은 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 장쇄 아실-ACP 티오에스테라제를 나타낸다.
도 2는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현의 결과로서의 ω-하이드록실화 지방산의 제조의 예를 제공한다. 변이체를 통한 ω-하이드록실화(ω-OH) 지방산의 제조를 예시하기 위해 부위 포화 돌연변이유발이 사용되었다. 도시된 그래프는 CYP153A(G307A, A796V)-Red450RhF의 아미노산 위치 141 및 309의 부위 포화 돌연변이유발로부터의 최고 히트수(hits)를 보여준다. 도면은 총 지방산 화학종(총 FAS)(진회색 막대 참조); ω-하이드록시 헥사데센산(ω-OH C16:1)(담회색 막대 참조); 및 ω-하이드록시 지방산 퍼센트(% ω-OH FFA)(화살표 참조)를 나타낸다.
도 3은 하이브리드 사이토크롬 P450 Cyp153A(G307A)-RedRhF 융합 단백질 (서열 번호: 6)의 폴리펩티드 서열을 도시하며, 이는 서열 표 A에서 도시된 변이체에 대한 주형 서열로서 사용되었다.
도 4는 하이브리드 사이토크롬 P450 Cyp153A(G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 38)의 폴리펩티드 서열을 도시하며, 이는 서열 표 B에서 도시된 변이체에 대한 주형 서열로서 사용되었다.
도 5는 서열 번호: 38의 사이토크롬 P450 Cyp153A(G307A)-RedRhF(A796V) 하이브리드 융합 폴리펩티드 변이체의 구조를 도시하며, 이는, 2개의 개별 도메인, 즉, 링커 폴리펩티드에 의하여 연결된 촉매 및 환원효소 도메인을 갖는다. 상기 촉매 도메인은 아미노산 위치 1 내지 486의 범위에 속하는 것으로 보이고, 아미노산 위치 1 내지 470의 범위에 속하는 P450 Cyp153A(G307A) 및 아미노산 위치 471 내지 486의 범위에 속하는 링커 폴리펩티드를 포함한다. Red450RhF(A796V)으로 표현되는 환원효소 도메인은 아미노산 위치 487 내지 799의 범위에 속한다. 서열 번호: 38은 추가 변이체를 생성하기 위한 주형 서열로서 사용된다.
도 6은 서열 번호: 98의 3-차원 단백질 구조를 도시한다. 구들(balls)은 돌연변이화된 잔기들 상의 탄소, 질소 및 산소 원자를 묘사한다. 또한 상기 중심 근처에 중간의 철 원자를 둘러싸고 클러스터링된 헴(heme) 그룹이 보여진다. 상기 잠재적인 리간드 결합 부위가 회색(grayed-out) 표면으로 설명된다. 이 사진에서 보여지듯이, 모든 돌연변이화된 잔기들은 잠재적인 리간드 결합 부위 (즉, 활성 부위) 밖에 있다.
일반적인 개요
석유화학제품에 대한 우리의 의존도를 없애는 한 가지 방법은 미니어처(miniature) 생산 숙주로서 작용하는 환경 친화적인 미생물을 통해 ω-OH 지방산 유도체와 같은 지방산 유도체를 생산하는 것이다. 이러한 세포 숙주(즉, 재조합 숙주 세포 또는 미생물)는 재생가능한 공급원료(예컨대, 발효성 탄수화물, 바이오매스, 셀룰로스, 글리세롤, CO, CO2, 등)와 같은 재생가능한 공급원으로부터 ω-OH 지방산 유도체 및 이관능성 지방산 유도체를 생산하도록 조작된다. 이러한 ω-OH 지방산 유도체가 특수 화학물질, 중합체 및 향을 포함한 산업 제품을 위한 원료이다.
본 발명은 재조합 숙주 세포에서 발현되는 경우 ω-OH 지방산 유도체 조성물의 높은 역가, 수율 및/또는 생산성을 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 및 이의 변이체를 포함하는 ω-하이드록실라제-관련 융합 폴리펩티드에 관한 것이다. 본원에서, 증진된 ω-OH 지방산 유도체 생합성은, 숙주 세포를 변형함으로써 달성되며, 이로써 이들은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체를 발현하도록 하고, 이는 지방산의, ω-OH 지방산 예컨대, 예를 들어, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 지방산 유도체로의 반응을 촉진한다. 본 발명은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 및 이의 변이체를 발현하는 재조합 숙주 세포 또는 생산 균주를 포함한다. 하나의 측면에서, 본 발명은 P450 서브패밀리 cyp153A에 관한 것이다.
정의
본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수형 "a", "an" 및"the"는, 문맥이 명백히 달리 나타내지 않는 한, 복수 지시대상을 포함한다. 따라서, 예를 들면, "하나의 숙주 세포(a host cell)"에 대한 언급은 둘 이상의 이러한 숙주 세포를 포함하고, "하나의 지방 에스테르(a fatty ester)"에 대한 언급은 하나 이상의 지방 에스테르, 또는 에스테르의 혼합물을 포함하며, 하나의 핵산 서열(a nucleic acid 서열)"에 대한 언급은 하나 이상의 핵산 서열을 포함하고, "하나의 효소(an enzyme)"에 대한 언급은 하나 이상의 효소를 포함하는 등이다.
용어 "효소 분류(EC) 번호"는 특정 효소 활성을 나타내는 번호를 말한다. EC 번호는 효소 명명법의 시스템 하에서 이들이 촉매하는 반응에 따라 효소를 분류한다. EC 번호는 효소-촉매된 반응을 특정화한다. 예를 들면, 상이한 유기체들로부터의 상이한 효소들이 동일한 반응을 촉매하는 경우, 이들은 동일한 EC 번호를 갖는다. 또한, 상이한 단백질 폴드가 동일한 반응을 촉매할 수 있고, 따라서, 동일한 EC 번호(예컨대, 비상동성 동기능 효소, 또는 NISE)가 할당될 것이다. EC 번호는 생화학 및 분자생물학 국제 연합(IUBMB)의 명명 위원회에 의해 확립되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. 예를 들면, ω-하이드록실라제 또는 ω-옥시게나제 효소 활성을 포함한 사이토크롬 P450 모노옥시게나제(P450) 효소 활성은 EC 1.14.15.3으로 분류된다. P450 효소 패밀리에 속하는 효소의 기능은 하나의 종으로부터 다음 종으로 대부분의 원핵생물에서 보존된다. 따라서, 상이한 미생물 종이 EC 1.14.15.3으로 분류된 동일한 효소 활성을 수행할 수 있다. EC 1.14.15.3에 의해 특성화된 효소 활성의 예는 본원에 논의된 바와 같은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체(상기)의 효소 활성이다.
용어 "오메가-하이드록실화 지방산" 또는 "ω-하이드록실화 지방산" 또는 "ω-하이드록시 지방산" 또는 "ω-하이드록실 지방산" 또는 "ω-OH 지방산" 또는 "ωOH 지방산"은 본원에서 상호교환 가능하게 사용되며, 지방산 대사로부터 기원하는 지방산을 나타내고 오메가(ω) 위치에 적어도 하나의 OH 그룹을 갖는다. ω-하이드록실화 지방산의 예시는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산이다. 일 구현예에서, 이와 같은 ω-하이드록실화된 지방산은 ω-OH C8:0 지방산, ω-OH C10:0 지방산, ω-OH C12:0 지방산, ω-OH C14:0 지방산, ω-OH C16:0 지방산, ω-OH C18:0 지방산, ω-OH C20:0 지방산, ω-OH C8:1 지방산, ω-OH C10:1 지방산, ω-OH C12:1 지방산, ω-OH C14:1 지방산, ω-OH C16:1 지방산, ω-OH C18:1 지방산, ω-OH C20:1 지방산 및 기타 동종의 것이다. 미생물에서, ω-하이드록실화 지방산은 ω-하이드록실화 지방산 유도체, 예를 들면, ω-하이드록실화 지방 에스테르 뿐만 아니라 α,ω-이산, α,ω-디에스테르, 및 α,ω-디올을 포함한 이관능성 지방산 유도체를 제조하는데 사용될 수 있다. 그러한 점에서, 용어 "오메가-하이드록실화 지방산 유도체" 및 "ω-하이드록실화 지방산 유도체" 및 "ω-하이드록시 지방산 유도체" 및 "ω-하이드록실 지방산 유도체" 및 "α,ω-이관능성 지방산 유도체" 및 "ω-OH 지방산 유도체"는 지방산 대사로부터 기원하고 오메가 위치에 적어도 하나의 OH 그룹을 갖거나 오메가 위치에 적어도 하나의 OH 그룹을 갖는 중간체로부터 유도된 화학적 개체(chemical entity)를 나타낸다. 본원에서, "오메가(ω) 위치"는 이의 1차 관능기에 대해 반대쪽 단부에 있는 지방산 유도체의 말단 탄소 원자를 나타낸다. 이러한 ω-하이드록실화 지방산 유도체는 α,ω-이산; α,ω- 디에스테르; α,ω-디올 및 이의 유도된 화합물(예컨대, 매크로락톤)을 포함하지만, 이에 제한되지 않는다.
본원에 언급된 바와 같은 "ω-하이드록실화 지방산 조성물" 또는 "ω-OH 지방산 조성물"은 재조합 숙주 세포에 의해 생산되며 전형적으로 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 유형의 ω-하이드록실화 지방산들의 혼합물을 포함한다. 유사하게, "ω-하이드록실화 지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생산되며 전형적으로 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 유형의 ω- 하이드록실화 지방산 유도체들(예컨대, 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 ω-하이드록실화 지방산; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 ω-하이드록실화 지방 에스테르; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-이산; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-디에스테르; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-디올; 등)의 혼합물을 포함한다. 몇몇 경우에, ω-OH 지방산 유도체 조성물은 주로 한 가지 유형의 ω-OH 지방산 유도체, 예를 들면, 1,12-도데센디올, 또는 1,14-테트라데칸디올, 또는 16-하이드록시 헥사데칸산 메틸 에스테르, 또는 16-하이드록시 헥사데센산, 또는 15-하이드록시 펜타데칸산, EH는 15-하이드록시 펜타데센산, 또는 18-하이드록시 옥타데센산, 또는 이러한 지방산 유도체 중의 어느 것의 메틸 에스테르, 또는 기타를 포함한다. 여전히 또 다른 경우에, ω-OH 지방산 유도체 조성물은 특별하게 설계된 조성물을 제공하기 위해 하나 이상의 유형의 ω-OH 지방산 유도체들의 혼합물을 포함한다(예컨대, 동일한 조성물에서 약 20% 12-하이드록시 도데칸산 및 약 80% 1,14-14-하이드록시 테트라데칸산이 이러한 예를 제공한다).
용어 "수탁 번호" 또는 "NCBI 수탁 번호" 또는 "GenBank 수탁 번호"는 특정 핵산 서열을 표시하는 번호를 나타낸다. 당해 설명에 논의된 서열 수탁 번호는 U. S. A. 국립 보건원에 의해 운영되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (UniProtKB 수탁 번호라고도 하는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.
본원에서 사용되는 용어 "뉴클레오티드"는 헤테로환계 염기, 당 및 하나 이상의 포스페이트 그룹으로 이루어진 폴리뉴클레오티드의 단량체 단위를 나타낸다. 자연적으로 발생하는 염기[구아닌(G), 아데닌(A), 시토신(C), 티민(T) 및 우라실(U)]은 전형적으로 퓨린 또는 피리미딘의 유도체이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토스(5-탄당)의 (DNA를 형성하는) 데옥시리보스 또는 (RNA를 형성하는) 리보스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체도 포함되는 것으로 이해하여야 한다. 핵산은 전형적으로 핵산 또는 폴리뉴클레오티드를 형성하는 포스페이트 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 당업계에 알려져 있다.
용어 "폴리뉴클레오티드"는 리보뉴클레오티드(RNA) 또는 데옥시리보뉴클레오티드(DNA)의 중합체를 나타내고, 이는 외가닥 또는 이중가닥일 수 있으며, 비-자연적 또는 변형된 뉴클레오티드를 함유할 수 있다. 용어 "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"은 어떠한 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 나타내는데 상호교환 가능하게 사용된다. 이들 용어는 분자의 일차 구조를 나타내며, 따라서 이중가닥 및 외가닥의 DNA, 및 이중가닥 및 외가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된 폴리뉴클레오티드와 같지만 이로 제한되지 않는 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하지만 이로 제한되지 않는 선택적인 형태로 존재할 수 있다.
본원에서 사용되는 용어 "폴리펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 나타내는데 상호교환 가능하게 사용된다. 용어 "재조합 폴리펩티드"는 재조합 기술에 의해 생성된 폴리펩티드를 나타내고, 여기서, 일반적으로 발현된 단백질을 암호화하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는데 사용되는 적합한 발현 벡터 내로 삽입된다. 유사하게, 용어 "재조합 폴리뉴클레오티드" 또는 "재조합 핵산" 또는 "재조합 DNA"는 당업계의 숙련가들에게 공지된 재조합 기술로 생산된다.
용어 "동족체" 및 "상동성"은 상응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50퍼센트(%) 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드를 나타낸다. 바람직하게는 상동성 폴리뉴클레오티드 또는 폴리펩티드는 상응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 약 99% 상동성인 폴리뉴클레오티드 서열 또는 아미노산 서열을 갖는다. 본원에서 사용되는 용어 서열 "상동성" 및 서열 "동일성"은 상호교환 가능하게 사용된다. 당업계의 통상의 숙련가는 둘 이상의 서열들 간의 상동성을 결정하는 방법을 잘 알고 있다. 간략하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 서열들은 최적의 비교 목적으로 정렬된다[예를 들어, 최적의 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 다에 갭(gap)이 도입될 수 있으며, 비교 목적을 위해 비-상동성 서열은 무시될 수 있다]. 하나의 바람직한 구현예에서, 비교 목적을 위해 정렬된 제1 서열의 길이는 제2 서열의 길이의 적어도 약 30%, 바람직하게는 적어도 약 40%, 보다 바람직하게는 적어도 약 50%, 보다 더 바람직하게는 적어도 약 60%, 훨씬 더 바람직하게는 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 또는 약 100%이다. 그후, 제1 및 제2 서열의 상응하는 아미노산 위치 또는 뉴클레오티드 위치에 있는 아미노산 잔기 또는 뉴클레오티드를 비교한다. 제1 서열에서 위치가 제2 서열에서 상응하는 위치로서 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점거된 경우, 분자는 그 위치에서 동일하다. 두 서열들 간의 상동성 퍼센트는, 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치의 개수의 함수이다. 서열의 비교 및 2개 서열 사이에서 동일성 퍼센트의 결정은 수학적 알고리즘, 예컨대 BLAST를 이용하여 달성될 수 있다 (Altschul et al. (1990) J. Mol. Biol. 215(3):403-410). 두 아미노산 서열들 간의 상동성 퍼센트 또한 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다 (Needleman and Wunsch (1970) J. Mol. Biol. 48:444-453). 두 뉴클레오티드 서열들 간의 상동성 퍼센트 또한 NWSgapdna. CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 당업계의 숙련가는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항들의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들이 생물공학 분야에 알려져 있다(참조; 예컨대, Rosenberg (2005) BMC Bioinformatics 6:278; Altschul et al. (2005) FEBS J. 272(20):5101-5109).
용어 "저 엄격, 중간 엄격, 고 엄격, 또는 초고 엄격 조건 하에서 하이브리드화한다"는 하이브리드화 및 세척을 위한 조건을 설명한다. 하이브리드화 반응을 수행하기 위한 가이드는 하기의 최신 프로토콜에서 찾을 수 있다: Current Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989), 6.3.1 - 6.3.6. 수성 및 비수성 방법이 상기 참조문헌에 기재되어 있으며, 어느 하나의 방법이 사용될 수 있다. 본원에 언급된 특정 하이브리드화 조건은 아래와 같다: (1) 저 엄격 하이브리드화 조건 -- 약 45℃에서 6X 염화나트륨/시트르산나트륨(SSC)에 이어 적어도 50℃에서 0.2X SSC, 0.1% SDS로 2회 세척(세척의 온도는 저 엄격 조건의 경우 55℃로 상승될 수 있다); (2) 중간 엄격 하이브리드화 조건 -- 약 45℃에서 6X SSC에 이어 60℃에서 0.2X SSC, 0.1% SDS로 1회 이상 세척; (3) 고 엄격 하이브리드화 조건 -- 약 45℃에서 6X SSC에 이어 65℃에서 0.2.X SSC, 0.1% SDS로 1회 이상 세척; 및 (4) 초고 엄격 하이브리드화 조건 -- 65℃에서 0.5M 인산나트륨, 7% SDS에 이어 65℃에서 0.2X SSC, 1% SDS로 1회 이상 세척. 초고 엄격 조건(4)가 달리 명시되지 않는 한 바람직한 조건이다.
“내인성” 폴리펩티드는 친계 세포(또는 숙주 세포)의 게놈에 의해 암호화되거나, 또는 상기 친계 숙주 세포에서 비롯된 또는 발달된 또는 유래된 폴리펩티드를 지칭한다. “외인성” 폴리펩티드는 친계 세포의 게놈에 의해 암호화되지 않거나 또는 친계 숙주 세포의 외부에서 비롯된 폴리펩티드를 지칭힌다. 변이체 또는 돌연변이체 폴리펩티드가 외인성 폴리펩티드의 예이다. 따라서, 비자연적으로 발생하는 핵산 분자는 일단 세포에 도입되면 세포에 외인성인 것으로 간주된다. 자연적으로 발생하는 핵산 분자 또한 특정 세포에 외인성일 수 있다. 예를 들면, 세포 X로부터 단리된 전체 암호화 서열은 일단 그 암호화 서열이 세포 Y에 도입되면 X 및 Y가 동일한 세포 유형이더라도 세포 Y에 대해 외인성 핵산이다.
용어 "과발현된"은 유전자가 그 유전자에 대한 야생형 또는 천연 또는 내인성 전사 속도에 비해 상승된 속도로 전사되게 함을 의미한다. 몇몇 예에서, 과발현은 또한 그 유전자에 대한 야생형 또는 천연 또는 내인성 번역 속도에 비해 유전자의 상승된 번역 속도를 포함한다. 과발현에 대한 시험방법은 당업계에 널리 공지되어 있으며, 예를 들면, 전사된 RNA 수준은 rtPCR을 사용하여 평가될 수 있고 단백질 수준은 SDS page 겔 분석을 사용하여 평가될 수 있다.
용어 "이종(heterologous)"은 상이한 유기체, 상이한 세포 유형, 또는 상이한 종으로부터 유도됨을 의미한다. 본원에서 사용되는 바와 같이 이것은 소정의 유기체에서 자연적으로 존재하지 않는, 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드- 또는 단백질 서열을 나타낸다. 예를 들면, 시아노박테리아에 고유한 폴리뉴클레오티드 서열이 재조합 방법에 의해 대장균(E. coli)의 숙주 세포에 도입될 수 있으며, 그후 시아노박테리아로부터의 폴리뉴클레오티드는 대장균 세포(예컨대, 재조합 세포)에 대해 이종이다. 용어 "이종"은 또한 비-천연 상태(non-native state)로 재조합 숙주 세포에 존재하는 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드-, 또는 단백질 서열에 관해 사용될 수 있다. 예를 들면, "이종" 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열은 상응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 비해, 예를 들면, 발현의 수준에 있어서 또는 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질의 서열에 있어서의 변형으로 변형될 수 있다.
본원에서 사용되는 바와 같이, 용어 폴리펩티드의 "단편"은 2개의 아미노산 잔기에서부터 1개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전장 폴리펩티드 또는 단백질의 더 짧은 부분을 나타낸다. 본 발명의 특정 구현예에서, 단편은 폴리펩티드 또는 단백질의 도메인(예컨대, 기질 결합 도메인 또는 촉매 도메인)의 전체 아미노산 서열을 나타낸다.
용어 "돌연변이유발"은 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 나타낸다. 단백질 암호화 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 돌연변이유발은 또한 변형된 단백질 활성을 야기하는 비-암호화 핵산 서열의 변화를 나타낸다.
본원에서 사용되는 "돌연변이"는 유전자의 핵산 위치에서의 영구적인 변화 또는 폴리펩티드 또는 단백질의 아미노산 위치에서의 영구적인 변화를 나타낸다. 돌연변이는 치환, 부가, 삽입, 및 결손을 포함한다. 예를 들면, 아미노산 위치에서의 돌연변이는 한 가지 유형의 아미노산의 다른 유형의 아미노산으로의 치환일 수 있다(예컨대, 세린(S)이 알라닌(A)으로 치환될 수 있고; 리신(L)이 트레오닌(T)으로 치환될 수 있고; 등). 이와 같이, 폴리펩티드 또는 단백질은 하나의 아미노산이 다른 아미노산으로 치환된 하나 이상의 돌연변이를 가질 수 있다. 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38의 아미노산 서열 내 특정 아미노산 위치에서의 돌연변이를 갖는다. 예를 들어, 서열 번호: 38의 아미노산 위치 12, 27, 119, 140, 157, 159, 233, 및 244 각각에서의 돌연변이를 갖는, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 본 개시내용에 의하여 제공된다. 이러한 특정 아미노산 위치 중 각각에서의 돌연변이를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산의 오메가-하이드록실화 지방산으로의 전환을 촉진한다. 바람직하게는, 이러한 특정 아미노산 위치 중 각각에서의 돌연변이를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 예를 들면, 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교할 경우, 보다 높은 역가에서의 ω-OH 지방산 유도체를 생산할 수 있다. 따라서, 청구된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 특정 아미노산 위치에서의 돌연변이는 바람직하게는 예를 들면, 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여 ω-OH 지방산 유도체를 더 높은 역가로 생산하는 청구된 효과를 허용하지 않을 수 있는 돌연변이는 포함하지 않는다. 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 당해 분야에서 공지된 방법을 사용하여, 그것의 기능, 예컨대, 야생형 CYP153A 폴리펩티드, 또는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 선택적인 다른 참조 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여 개선된 기능, 예컨대, 비제한적으로, 증가된 촉매적 활성, 증가된 안정성, 또는 감소된 억제(예를 들면, 감소된, 피드백 억제)와 관련하여 선별될 수 있다. 본 개시내용의 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이는, 예를 들면, 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가, 및/또는 지방산에서 ω-하이드록시 지방산으로의 전환 증가를 허용하는 성질을 갖는다. 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이는, 예를 들면, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가, 및/또는 지방산에서 ω-하이드록시 지방산으로의 전환 증가를 허용하는 성질을 갖는다. 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이는, 예를 들면, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가, 및/또는 지방산에서 ω-하이드록시 지방산으로의 전환 증가를 허용하는 성질을 갖는다. 본 개시내용의 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이들 중 하나 이상은 하나 이상의 아미노산 치환 및/또는 결실을 의미한다. 바람직하게는, 청구항에서 정의된 특정 위치에서의 돌연변이들 중 하나 이상은 하나 이상의 아미노산 치환을 의미한다. 더 바람직하게는, 소정의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 대해 청구항에서 정의된 특정 위치에서의 모든 돌연변이들이 아미노산 치환이다. 특정 위치에서 아미노산 잔기가 결실되고 상이한 아미노산 잔기가 상기 위치에 삽입된 경우, 이것은 특정 위치에서의 아미노산 잔기의 치환으로 간주될 수 있다. 본 개시내용의 다양한 구현예에서, 아미노산 위치에서의 돌연변이는 (상기 위치에서의) 아미노산 치환을 의미하되, 상기 치환은 잠재적인(silent) 치환이 아니다.
본원에서 사용되는 용어 "유전자"는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 암호화하는 핵산 서열 뿐만 아니라 RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된 핵산 서열(예를 들면, 이러한 서열은 프로모터 또는 인핸서 서열을 포함하지만 이로 제한되지 않음) 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 암호화하는 작동가능하게-연결된 핵산 서열(예를 들면, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열을 포함하지만 이로 제한되지 않음)을 나타낸다.
발현 조절 서열은 당업계에 공지되어 있으며, 예를 들면, 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 인핸서, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 전사에 관여된 세포 단백질과 특이적으로 상호작용한다 (Maniatis et al. (1987) Science 236:1237-1245). 예시적 발현 조절 서열은 예를 들어, 하기에 기술된다: Goeddel, Gene Expression Technology:Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif. (1990). 본 발명의 방법에서, 발현 조절 서열은 폴리뉴클레오티드 서열과 작동가능하게 연결된다. “작동가능하게 연결된"이란 적절한 분자(예컨대, 전사 활성인자 단백질)가 발현 조절 서열(들)에 결합될 때 폴리뉴클레오티드 서열 및 발현 조절 서열이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류에 위치된다. 작동가능하게 연결된 인핸서는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류에 위치될 수 있다.
본원에서 사용되는 용어 "벡터"는 이것이 연결된 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 니타낸다. 유용한 벡터의 한 가지 유형은 에피솜(즉, 염색체외 복제를 할 수 있는 핵산)이다. 유용한 벡터는 이들이 연결되는 헥산의 자율 복제 및/또는 발현이 가능한 것이다. 당해 벡터가 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터를 본원에서 '발현 벡터"라고 한다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종 "플라스미드"의 형태로 되어 있으며, 이것은 일반적으로 이들의 벡터 형태에서 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프를 나타낸다. 기타의 유용한 발현 벡터가 직선 형태로 제공되어 있다. 등가의 기능을 제공하고, 이후에 당업계에 알려지게 된 이러한 다른 형태들의 발현 벡터도 포함된다. 일부 구현예에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 추가로 포함한다. 일부 구현예에서, 프로모터는 발달적으로-조절된 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적 프로모터, 또는 세포-특이적 프로모터이다. 재조합 벡터는 전형적으로 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택된 적어도 하나의 서열을 포함한다. 특정 구현예에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA에 안정적으로 삽입되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 영역의 제어하에 있다. 본원에서 사용되는 바와 같은 발현 벡터는 숙주 세포에서 폴리뉴클레오티드 서열의 발현에 적합한 형태로 본원에 기재된 바와 같은 특정 폴리뉴클레오티드 서열을 포함한다. 상기 발현 벡터의 디자인은 전환될 숙주 세포의 선택, 요망된 폴리펩티드의 발현 수준 등과 같은 인자에 따라 달라질 수 있음이 당해 분야의 숙련가에 의해 인정될 것이다. 본원에 기재된 발현 벡터는 숙주 세포에 유입되어 본 명세서에서 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 암호화된, 융합 폴리펩티드를 비롯한 폴리펩티드를 생산한다. 원핵생물, 예를 들면, 대장균에서 폴리펩티드를 암호화하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행된다. 융합 벡터는 그 안에 암호화된 폴리펩티드에, 통상적으로 재조합 폴리펩티드의 아미노- 또는 카복시-말단에 다수의 아미노산을 부가한다. 이러한 융합 벡터는 전형적으로 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키고; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것을 포함한 상기 세 가지 목적들 중의 하나 이상을 제공한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 특정 구현예에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도되는 프로모터에 작동가능하게 연결된다.
특정 구현예에서, 숙주 세포는 효모 세포이고, 발현 벡터는 효모 발현 벡터이다. 효모 S. 세레비시에(S. cerevisiae)에서의 발현을 위한 벡터의 예는 하기를 포함한다: pYepSec1(Baldari et al. (1987) EMBO J. 6:229-234); pMFa (Kurjan et al. (1982) Cell 30:933-943); pJRY88 (Schultz et al. (1987) Gene 54:113-123); pYES2 (Invitrogen Corp., San Diego, CA), 및 picZ (Invitrogen Corp., San Diego, CA). 또 다른 구현예에서, 숙주 세포는 곤충 세포이고, 발현 벡터는 바큘로바이러스 발현 벡터이다. 배양된 곤충 세포(예컨대, Sf9 세포)에서 단백질의 발현을 위해 이용 가능한 바큘로바이러스 벡터는, 예를 들면, pAc 계열(Smith et al. (1983) Mol. Cell Biol. 3:2156-2165) 및 pVL 계열(Lucklow et al. (1989) Virology 170:31-39)를 포함한다. 또 다른 구현예에서, 본원에 기재된 폴리뉴클레오티드 서열은 포유류 발현 벡터를 사용하여 포유류 세포에서 발현될 수 있다. 원핵 및 진핵 세포 모두를 위한 다른 적합한 발현 시스템은 당해 분야에서 잘 알려져 있으며; 예를 들어, 하기를 참고한다: Sambrook et al. , “Molecular Cloning:A Laboratory Manual,” second edition, Cold Spring Harbor Laboratory, (1989).
본원에서 사용되는 용어 "CoA" 또는 "아실-CoA"는 조효소 A(CoA)의 4'-포스포판테티오닐 모이어티의 설프하이드릴 그룹과 알킬 쇄의 카보닐 탄소 사이에서 형성되는 아실 티오에스테르를 나타내며, 이는 화학식 R-C(O)S-CoA를 갖고, 여기서 R은 적어도 4개의 탄소원자를 갖는 선택적인 알킬 기이다.
용어 "ACP"는 아실 운반 단백질을 의미한다. ACP는 지방산 생합성 동안 아실 중합체의 고도로 보존된 운반체이며, 여기서, 성장하는 쇄는 4'-포스포판테테인 모이어티의 말단 티올에서 티올 에스테르로서 합성 동안 결합된다. 단백질은 두 가지 형태, 즉, 아포(apo)-ACP(지방산 생합성에서 불활성) 및 ACP 또는 홀로(holo)-ACP(지방산 생합성에서 활성)로 존재한다. 용어 "ACP" 및 "홀로-ACP"는 본원에서 상호교환 가능하게 사용되며, 단백질의 활성 형태를 나타낸다. 포스포판테테이닐트랜스퍼라제라고 불리는 효소가 불활성 아포-ACP에서 활성 홀로-ACP로의 전환에 관여한다. 보다 구체적으로, ACP는 불활성 아포-ACP 형태로 발현되고, 4'-포스포판테테인 모이어티는 홀로-ACP를 생산하기 위해 홀로-아실 운반 단백질 신타제(ACPS), 포스포판테테이닐트랜스퍼라제의 활성에 의해 ACP 상에서 보존된 세린 잔기에 후-번역되도록 부착되어야 한다.
본원에서 사용되는 용어 "아실-ACP"는 아실 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 설프하이드릴 그룹과 알킬 쇄의 카보닐 탄소 사이에서 형성되는 아실 티오에스테르를 나타낸다. 일부 구현예에서 ACP는 완전 포화된 아실-ACP의 합성에 있어서 중간체이다. 또 다른 구현예에서 ACP는 불포화 아실-ACP의 합성에 있어서 중간체이다. 일부 구현예에서, 탄소 쇄는 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 26개의 탄소를 가질 것이다.
본원에서 사용되는 용어 "지방산 유도체"는 "지방산 또는 이의 유도체"라고 할 수 있는 "지방산" 또는 "지방산 유도체"를 의미한다. 용어 "지방산"은 화학식 RCOOH를 갖는 카복실산을 의미한다. R은 지방족 그룹, 바람직하게는 알킬 그룹을 나타낸다. R은 약 4 내지 약 22개 탄소원자를 포함할 수 있다. 지방산은 포화, 불포화, 또는 다중불포화될 수 있다. "지방산 유도체"는 생산 숙주 유기체(예컨대, 재조합 숙주 세포 또는 미생물)의 지방산 생합성 경로로부터 부분적으로 제조되는 생성물이다. "지방산 유도체"는 ACP, 아실-ACP 또는 아실-ACP 유도체로부터 부분적으로 제조되는 생성물을 포함한다. 예시적인 지방산 유도체는, 예를 들면, 아실-CoA, 지방산, 지방 알데히드, 단쇄 및 장쇄 알콜, 지방 알콜, 탄화수소, 에스테르(예컨대, 왁스,지방산 에스테르, 또는 지방 에스테르), 말단 올레핀, 내부 올레핀, 케톤 뿐만 아니라 ω-OH 지방산 및 α,ω-이산을 포함한 이의 ω-OH 지방산 유도체, 및 기타의 이관능성 화합물을 포함한다.
본원에서 사용되는 용어 "지방산 생합성 경로"는 지방산 및 이의 유도체를 생산하는 생합성 경로를 의미한다. 지방산 생합성 경로는 목적하는 특징을 갖는 지방산 유도체를 생산하는 추가의 효소를 포함할 수 있다.
지방산의 R 그룹은 직쇄 또는 측쇄일 수 있다. 측쇄는 하나 이상의 분지점을 가질 수 있고 환계 분지를 포함할 수 있다. 일부 구현예에서, 분지형 지방산은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25, 또는 C26 분지형 지방산이다. 기타 구현예에서, 분지형 지방산은 C6, C8, C10, C12, C13, C14, C15, C16, C17, C18, 또는 C20 분지형 지방산이다. 특정 구현예에서, 측쇄 지방산의 하이드록실(OH) 그룹은 오메가(ω) 위치에 있다. 특정 구현예에서, 측쇄 지방산은 이소-지방산 또는 안테이소-지방산이다. 예시적인 구현예에서, 상기 분지형 지방산은 이소-C7:0-, 이소-C8:0-, 이소-C9:0-, 이소-C10:0-, 이소-C11:0-, 이소-C12:0-, 이소-C13:0-, 이소-C14:0-, 이소-C15:0-, 이소-C16:0-, 이소-C17:0-, 이소-C18:0-, 이소-C19:0-, 이소-C20:0, 안테이소-C7:0-, 안테이소-C9:0-, 안테이소-C11:0-, 안테이소-C13:0-, 안테이소-C15:0-, 안테이소-C17:0- 및 안테이소-C19:0 분지형 지방산에서 선택된다.
지방산의 R 그룹은 포화 또는 불포화일 수 있다. 불포화된다면, R 그룹은 하나 또는 하나 이상의 불포화점을 가질 수 있다. 일부 구현예에서, 불포화 지방산은 단일불포화 지방산이다. 특정 구현예에서, 불포화 지방산은 C8:1-, C9:1-, C10:1-, C11:1-, C12:1-, C13:1-, C14:1-, C15:1-, C16:1-, C17:1-, C18:1-, C19:1-, C20:1-, C21:1-, C22:1-, C23:1-, C24:1-, C25:1-, 또는 C26:1 불포화 지방산이다. 특정 구현예에서, 불포화 지방산은 C8:1, C10:1, C12:1, C14:1, C16:1, C18:1, 또는 C20:1 이다. 또 다른 구현예에서, 불포화 지방산은 오메가-7 위치에서 불포화된다. 특정 구현예에서, 불포화 지방산은 시스 이중결합을 갖는다.
본원에서 사용되는 바와 같이, "재조합 숙주 세포" 또는 "조작된 숙주 세포"는 ω-하이드록실화 지방산 및 이관능성 지방산 유도체를 포함한 ω-하이드록실화 지방산 유도체를 생산하도록 변형된 숙주 세포, 예컨대, 미생물이다. 일부 구현예에서, 재조합 숙주 세포는 하나 이상의 폴리뉴클레오티드를 포함하며, 각각의 폴리뉴클레오티드는 ω-하이드록실라제 생합성 효소 활성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체를 암호화하고, 여기서, 재조합 숙주 세포는 폴리뉴클레오티드를 발현하는데 효과적인 조건하에서 탄소 공급원의 존재하에 배양되는 경우 ω-하이드록실화 지방산 및/또는 ω-하이드록실화 지방산 유도체 또는 이의 조성물을 생산한다.
본원에서 사용되는 용어 "클론"은 전형적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포의 그룹, 예를 들면, 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니의 박테리아를 나타낸다.
본원에서 사용되는 용어 "배양물"은 전형적으로 생존가능한 세포를 포함하는 액체 배지를 나타낸다. 하나의 구현예에서, 배양물은 제어된 조건 하에서 사전설정된 배양 배지에서 번식하는 세포를 포함하는 배양물, 예를 들면, 선택된 탄소원 및/또는 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포의 배양물을 포함한다.
용어 "배양하는" 또는 "배양"은 액체 또는 고체 배지에서 적절한 조건 하에 세포(예컨대, 미생물 세포)의 개체군을 성장시키는 것을 나타낸다. 특정 구현예에서, 배양은 기질에서 최종산물로의 발효성 생물전환을 나타낸다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 개별 성분들은 상업적 공급원으로부터, 예컨대, DIFCO 배지 및 BBL 배지 하에 이용 가능하다. 하나의 비제한적인 예에서, 수성 영양 배지는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함하는, YP 배지와 같은 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이다. 또한, 숙주 세포는, 예를 들면, 미국 특허 제5,000,000호; 제5,028,539호; 제5,424,202호; 제5,482,846호; 제5,602,030호 및 제WO2010127318호에 기재된 방법에 따라 탄소를 효율적으로 동화시키고 탄소 공급원으로서 셀룰로스 물질을 사용하도록 조작될 수 있다. 또한, 숙주 세포는 수크로스가 탄소 공급원으로서 사용될 수 있도록 인버타제(invertase)를 발현시키도록 조작될 수 있다.
본원에서 사용되는 용어 "이종 뉴클레오티드 서열을 발현하기에 효과적인 조건하에서"는 숙주 세포가 목적하는 지방산 유도체(예컨대, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)를 생산하도록 하는 선택적인 조건을 의미한다. 적합한 조건은, 예를 들면, 발효 조건을 포함한다.
본원에서 사용되는 바와 같이, 재조합 숙주 세포에서, 단백질, 예를 들면 효소의 "변형된" 또는 "변경된 수준의" 활성은 부모 또는 천연 숙주 세포에 비해 결정된 활성에서 하나 이상의 특징에 있어서의 차이를 나타낸다. 전형적으로 활성에 있어서의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 상응하는 야생형 숙주 세포 사이에 결정된다(예컨대, 야생형 숙주 세포에 비해 재조합 숙주 세포의 배양물의 비교). 변형된 활성은, 예를 들면, 재조합 숙주 세포에 의해 발현된 단백질의 변형된 양(예컨대, 단백질을 암호화하는 DNA 서열의 증가되거나 감소된 수의 카피, 단백질을 암호화하는 증가되거나 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가되거나 감소된 양의 단백질 번역의 결과로서); 단백질의 구조에 있어서의 변화(예컨대, 기질 특이성의 변화, 관찰된 동적 파라미터의 변화를 야기하는 단백질의 암호화 서열에 대한 변화와 같은 1차 구조에의 변화); 및 단백질 안정성에 있어서의 변화(예컨대, 단백질의 증가되거나 감소된 분해)의 결과일 수 있다. 일부 구현예에서, 폴리펩티드는 본원에 기재된 폴리펩티드 중의 어느 것의 돌연변이체 또는 변이체이다. 특정 예에서, 본원에 기재된 바와 같은 폴리펩티드에 대한 암호화 서열은 특정 숙주 세포에서 발현을 위해 최적화된 코돈이다. 예를 들면, 대장균에서의 발현을 위해, 하나 이상의 코돈이 최적화될 수 있다(Grosjean et al. (1982) Gene 18:199-209).
본원에서 사용되는 용어 "조절 서열"은 전형적으로 궁극적으로 단백질의 발현을 조절하는 단백질을 암호화하는 DNA 서열에 작동가능하게-연결된, DNA의 염기 서열을 나타낸다. 조절 서열의 예는 RNA 프로모터 서열, 전사 인자 결합 서열, 전사 종결 서열, (인핸서 요소와 같은) 전사의 조절인자, RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예를 들면, 리보솜 결합 부위(예컨대, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequence) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함하지만, 이에 제한되지 않는다.
본원에서 사용되는 어구 "뉴클레오티드 서열의 발현이 야생형 뉴클레오티드 서열에 비해 변형된다"는 내인성 뉴클레오티드 서열의 발현 및/또는 활성 또는 이종 또는 비-천연 폴리펩티드-암호화 뉴클레오티드 서열의 발현 및/또는 활성의 수준에 있어서의 증가 또는 감소를 의미한다.
본원에서 사용되는 어구 "CYP153A-환원효소 하이브리드 융합 폴리펩티드 서열 변이체의 활성이 CYP153A-환원효소 하이브리드 융합 폴리펩티드 서열(즉, 폴리펩티드 주형)의 활성에 비해 변형된다"는 발현된 폴리펩티드 서열 주형과 비교하여 발현된 폴리펩티드 서열 변이체의 활성 수준에 있어서의 증가 또는 감소를 의미한다. 폴리펩티드 주형은 핵산 주형(즉, DNA 주형 서열)에 의해 암호화된다. 폴리펩티드 서열 주형의 예는 cyp153A가 환원효소 도메인과 융합되어 있는 하이브리드 cyp153A-RedRhF 융합 단백질 서열이다. 폴리펩티드 서열 주형의 또 다른 예는 서열 번호: 6이다. 폴리펩티드 서열 주형의 또 다른 예는 서열 번호: 38이다. 선택적인 폴리펩티드 서열은 변이체를 포함한 주형으로서 작용할 수 있다.
본원에서 사용되는 바와 같이, 폴리뉴클레오티드에 대해 용어 "발현하다"는 이것이 기능을 하도록 하는 것이다. 폴리펩티드(또는 단백질)을 암호화하는 폴리뉴클레오티드는, 발현되는 경우, 그 폴리펩티드(또는 단백질)를 생산하도록 전사 및 번역될 것이다. 본원에서 사용되는 용어 "과발현하다"는 동일한 조건하에서 상응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현함(또는 발현되도록 함)을 의미한다. 또 다른 구현예에서, 용어 "과발현"은 동일한 조건하에서 주형 폴리뉴클레오티드 또는 주형 폴리펩티드 서열을 발현하는 상응하는 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현함(또는 발현되도록 함)을 의미한다. 주형 폴리펩티드 서열의 예는 CYP153A-RedRhF-하이브리드 융합 폴리펩티드이다.
용어 "변경된 수준의 발현" 및 "변형된 수준의 발현"은 상호교환 가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드, 또는 지방산 유도체가 동일한 조건하에서 상응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다.
본원에서 사용되는 용어 "역가"는 숙주 세포 배양물의 단위 용적당 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 양을 나타낸다. 본원에 기재된 조성물 및 방법의 임의의 측면에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L (2g/L), 3g/L, 5g/L, 10g/L, 20g/L, 30g/L, 40g/L, 50g/L, 60g/L, 70g/L, 80g/L, 90g/L, 100g/L 또는 상기한 값들 중의 선택적인 두 개에 의해 경계된 범위의 역가로 생산된다. 또 다른 구현예에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 100g/L 초과, 200g/L 초과, 300g/L 초과, 또는 그 이상, 예를 들면, 500 g/L, 700 g/L, 1000 g/L, 1200 g/L, 1500 g/L, 또는 2000 g/L의 역가로 생산된다. 하나의 구현예에서, 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 역가는 5g/L 내지 200g/L, 10g/L 내지 150g/L, 20g/L 내지 120g/L, 25g/L 내지 110g/L 및 30g/L 내지 100g/L이다.
본원에서 사용되는 용어 "숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 수율"은 투입된 탄소 공급원이 숙주 세포에서 생성물(즉, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)로 전환되는 효율을 나타낸다. 본 발명의 방법에 따라 ω-OH 지방산 및/또는 ω-OH 지방산 유도체를 생산하도록 조작된 숙주 세포는 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 11%, 적어도 12%, 적어도 13%, 적어도 14%, 적어도 15%, 적어도 16%, 적어도 17%, 적어도 18%, 적어도 19%, 적어도 20 %, 적어도 21%, 적어도 22%, 적어도 23%, 적어도 24%, 적어도 25%, 적어도 26%, 적어도 27%, 적어도 28%, 적어도 29%, 또는 적어도 30% 또는 상기한 값들 중의 어느 두 가지에 의해 경계된 범위의 수율을 갖는다. 또 다른 구현예에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 30%, 40%, 50%, 60%, 70%, 80%, 90% 초과 또는 그 이상의 수율로 생산된다. 대안적으로, 또는 추가로, 수율은 약 30% 이하, 약 27% 이하, 약 25% 이하, 또는 약 22% 이하이다. 따라서, 수율은 상기한 종점 중의 어느 두 가지에 의해 경계될 수 있다. 예를 들면, 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 수율은 5% 내지 15%, 10% 내지 25%, 10% 내지 22%, 15% 내지 27%, 18% 내지 22%, 20% 내지 28%, 20% 내지 30%, 25% 내지 40%, 또는 그 이상일 수 있다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 예는 10% 내지 30%이다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 또 다른 예는 10% 내지 40%이다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 또 다른 예는 10% 내지 50%이다.
본원에서 사용되는 용어 "생산성"은 단위 시간당 숙주 세포 배양물의 단위 용적당 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 양을 나타낸다. 본원에 기재된 조성물 및 방법의 선택적인 측면에서, 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 생산성은 적어도 100 mg/L/시간, 적어도 200 mg/L/시간0, 적어도 300 mg/L/시간, 적어도 400 mg/L/시간, 적어도 500 mg/L/시간, 적어도 600 mg/L/시간, 적어도 700 mg/L/시간, 적어도 800 mg/L/시간, 적어도 900 mg/L/시간, 적어도 1000 mg/L/시간, 적어도 1100 mg/L/시간, 적어도 1200 mg/L/시간, 적어도 1300 mg/L/시간, 적어도 1400 mg/L/시간, 적어도 1500 mg/L/시간, 적어도 1600 mg/L/시간, 적어도 1700 mg/L/시간, 적어도 1800 mg/L/시간, 적어도 1900 mg/L/시간, 적어도 2000 mg/L/시간, 적어도 2100 mg/L/시간, 적어도 2200 mg/L/시간, 적어도 2300 mg/L/시간, 적어도 2400 mg/L/시간, 또는 적어도 2500 mg/L/시간이다. 또한, 생산성은 2500 mg/L/시간 이하, 2000 mg/L/OD600 이하, 1500 mg/L/OD600 이하, 120 mg/L/시간 이하, 1000 mg/L/시간 이하, 800 mg/L/시간 이하, 또는 600 mg/L/시간 이하일 수 있다. 따라서, 생산성은 상기 종점 중의 어느 두 가지에 의해 경계될 수 있다. 예를 들면, 생산성은 3 내지 30 mg/L/시간, 6 내지 20 mg/L/시간, 또는 15 내지 30 mg/L/시간일 수 있다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 생산성은 500 mg/L/시간 내지 2500 mg/L/시간, 또는 700 mg/L/시간 내지 2000 mg/L/시간로부터 선택된다.
용어 "총 지방 화학종(FAS): 및 "총 지방산 생성물"은 국제 특허 출원 공보 제WO 2008/119082호에 기재된 바와 같이 GC-FID에 의해 평가되는 바와 같이 샘플에 존재하는 ω-OH 지방산 및 지방산의 총 양과 관련하여 본원에서 상호교환 가능하게 사용될 수 있다.
본원에서 사용되는 용어 "글루코스 이용률"은 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양물에 사용되는 글루코스의 양을 의미한다.
용어 "재생가능한 공급원료로부터의 탄소 공급원"은, 단독으로 사용되거나 공급원과 관련하여 사용되는 경우, 유지화학물질(oleochemicals)(즉, 지방산, 지방산 에스테르, TAG, 하이드록시 지방산 등과 같은 식물 및 동물로부터의 정유) 및 석유화학물질(즉, 알칸, 알켄 등과 같은 석유로부터 유도된 화학물질)을 제외하고 탄소가 유래되는 (재생가능한 공급원료 및/또는 바이오매스 및/또는 노폐물을 포함하는) 선택적인 생물학적 물질을 포함한다. 따라서, 본원에서 사용되는 바와 같은 용어 "재생가능한 공급원료로부터의 탄소 공급원"은 유지화학물질 및 석유화학물질로부터 유래된 탄소를 제외한다. 일부 구현예에서, 탄소 공급원은 당류 또는 탄수화물(예컨대, 단당류, 이당류 또는 다당류)을 포함한다. 일부 구현예에서, 탄소 공급원은 글루코스 및/또는 수크로스이다. 또 다른 구현예에서, 탄소 공급원은 옥수수, 사탕수수 또는 목질계 바이오매스로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물; 또는 바이오매스 또는 천연 가스와 같은 유기 재료의 재형성물; 또는 광합성적으로 고정된(fixed photosynthetically) 이산화탄소와 같은 재생가능한 공급원료로부터 유도된다. 또 다른 구현예에서, 바이오매스는 탄소 공급원으로 가공되고, 이것은 생물전환에 적합하다. 여전히 또 다른 구현예에서, 바이오매스는 탄소 공급원으로의 추가적인 가공을 필요로 하지 않지만, 탄소 공급원으로서 바로 사용될 수 있다. 이러한 바이오매스의 예시적인 공급원은 스위치그래스와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 탄소 공급원은 동물성 물질[예컨대, 우분(cow manure)]과 같은 대사 노폐물을 포함한다. 추가의 예시적인 탄소의 공급원은 조류(algae) 및 다른 해양 식물을 포함한다. (바이오매스를 포함하는) 또 다른 탄소 공급원은 발효 폐기물, 발효 바이오매스, 글리세롤/글리세린, 목초, 짚, 목재, 오수, 쓰레기, 마니플 고체 폐기물, 셀룰로스 도시 폐기물 및 음식 쓰레기를 포함하지만 이로 제한되지 않는 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다.
ω-OH 지방산 및 이의 유도체와 같은 생성물에 대해 본원에서 사용되는 용어 "단리된"은 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분리된 생성물을 나타낸다. 본원에 기재된 방법에 의해 생산된 지방산 및 이의 유도체(예컨대, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)는 발효 브로쓰에서 뿐만 아니라 세포질에서도 비교적 비혼화성일 수 있다. 따라서, 지방산 및 이의 유도체는 세포내 또는 세포외에서 유기 상으로 수집될 수 있다.
본원에서 사용되는 용어 "정제하다", "정제된" 또는 "정제"는, 예를 들면, 단리 또는 분리에 의해 그 환경으로부터의 분자의 제거 또는 단리를 의미한다. "실질적으로 정제된" 분자는 이들이 연결된 다른 성분들로부터 적어도 약 60% 유리(예컨대, 적어도 약 70% 유리, 적어도 약 75% 유리, 적어도 약 85% 유리, 적어도 약 90% 유리, 적어도 약 95% 유리, 적어도 약 97% 유리, 적어도 약 99% 유리)된다. 본원에서 사용되는 바와 같이, 이들 용어는 또한 샘플로부터의 오염물의 제거를 나타낸다. 예를 들면, 오염물의 제거는 샘플에서 ω-OH 지방산 및/또는 ω-OH 지방산 유도체와 같은 지방산 유도체의 백분율의 증가를 유발할 수 있다. 예를 들면, 지방산 유도체가 재조합 숙주 세포에서 생산된 경우, 지방산 유도체는 숙주 세포 단백질 또는 다른 숙주 세포 물질의 제거에 의해 정제될 수 있다. 정제 후, 샘플 중의 지방산 유도체의 백분율은 증가된다. 용어 "정제하다", "정제된" 또는 "정제"는 절대 순도를 필요로 하지 않는 상대적인 용어이다. 따라서, 예를 들면, 지방산 유도체가 재조합 숙주 세포에서 생산된 경우, 정제된 지방산 유도체는 다른 세포 성분(예컨대, 핵산, 폴리펩티드, 지질, 탄수화물, 또는 기타의 탄화수소)으로부터 실질적으로 분리된 지방산 유도체이다.
세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 발현의 결과로서, 오메가-하이드록실화된 지방산 및 지방산 유도체 생산
촉매 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 12에 도시된다.
표 12: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된 개선된 변이체의 요약 (서열 번호: 38)
촉매 도메인의 조합 라이브러리에서 확인된 유익한 돌연변이(실시예 8, 상기 참조)는 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질 (높은 발현 수준에서 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질의 촉매 도메인의 조합 라이브러리)을 더욱 개선하기 위한 차기 조합 라이브러리를 위한 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 12에 도시된다.
표 13: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된, 더 높은 발현 수준의 개선된 변이체의 요약
환원효소 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체가 표 14에 도시된다.
표 14: cyp153A(G307A)-Red450RhF(A796V)의 환원효소 도메인의 조합 라이브러리에서 유래된 개선된 변이체
촉매적 및 환원효소 도메인(상기 실시예 8~10 참조)의 조합 라이브러리에서 확인된 유익한 돌연변이는 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R,G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98))의 촉매적 및 환원효소 도메인의 조합 라이브러리)을 더욱 개선하기 위한 조합 라이브러리용 염기였다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체가 표 15에 도시된다.
표 15: cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 및 환원효소 도메인의 조합 라이브러리 유래의 개선된 변이체.
표 12~15를 고려하여, 다양한 구현예에서 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 예를 들면, 서열 번호: 38, 또는 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교해보면, 지방산(유도체)의 ω-하이드록실화된 지방산 또는 ω-OH 지방산 유도체로의 전환에 촉매작용을 일으킬 경우, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가를 허용한다. 따라서, 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 예를 들면, 서열 번호: 38, 또는 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 지방산(유도체)의 ω-하이드록시 지방산 또는 ω-OH 지방산 유도체로의 전환의 증가를 허용한다.
본 발명은 숙주 세포에서 ω-OH 지방산 및 ω-OH 지방산 유도체의 생산을 제공한다. ω-OH 지방산 생산은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현의 결과로서 증진될 수 있다. 예를 들면, 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 또는 예를 들면, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 더 높은 역가로 ω-OH 지방산 유도체를 생산한다. 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 예컨대, 서열 번호: 42 및/또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 보다 높은 역가에서의 ω-OH 지방산 유도체를 생산한다. 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 예컨대, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 보다 높은 역가에서의 ω-OH 지방산 유도체를 생산한다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 ω-OH 지방산 유도체의 생산을 위해 생합성 경로에 관련되고; 이것은 단독으로 또는 다른 효소와 함께 사용될 수 있다. 예를 들면, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 조직된 생합성 경로에서 사용될 수 있으며, 여기서, 티오에스테라제(즉, 자연적으로 또는 이종으로/외인성으로 발현된) 효소가 아실-ACP 또는 아실-CoA를 지방산으로 전환시킨다. 그후, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산을 ω-OH 지방산으로 전환시킬 수 있다(도 1 참조). 경로에서 추가의 효소는 ω-OH 지방산을 다른 이관능성 지방산 유도체, 예를 들면, α,ω-이산으로 전환시킬 수 있다.
더욱 특이적으로, 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 폴리펩티드 서열이며,6, 그리고 이는 ω-OH 지방산 및 지방산 유도체의 생산을 위한 개선된 효소 활성으로 변이체를 생성하도록 돌연변이를 도입하는 주형 서열로서 작용한다. 서열 번호: 6의 CYP153A-환원효소 하이브리드 융합 폴리펩티드는, 글리신이 알라닌으로 치환된 위치 307의 촉매 도메인에서 돌연변이를 갖는 P450 Cyp153A(G307A)-RedRhF 융합 단백질이다(도 3 참조). 이러한 단백질은 자족성이며, 지방산에서 ω-OH 지방산으로의 반응을 촉매하는 ω-하이드록실라제 효소 활성을 갖는다.
본 개시내용의 다양한 구현예에서, 본 개시내용에 의해 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 자기-충분하고, 지방산(유도체)의 ω-OH 지방산 (유도체)로의 반응에 촉매작용을 일으키는 ω-하이드록실라제 효소 활성을 보유한다. 본 개시내용의 다양한 구현예에서, 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산 (유도체)의 ω-OH 지방산 (유도체)로의 반응을 촉진시키는 ω-하이드록실라제 효소 활성을 가지며, 이는 예컨대, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 ω-하이드록실라제 효소 활성과 비교하여 더 높다. 본 개시내용의 다양한 구현예에서, 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산 (유도체)의 ω-OH 지방산 (유도체)로의 반응을 촉진시키는 ω-하이드록실라제 효소 활성을 가지며, 이는 예컨대, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 ω-하이드록실라제 효소 활성과 비교하여 더 높다. 본 개시내용의 다양한 구현예에서, 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산 (유도체)의 ω-OH 지방산 (유도체)로의 반응을 촉진시키는 ω-하이드록실라제 효소 활성을 가지며, 이는 예컨대, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 ω-하이드록실라제 효소 활성과 비교하여 더 높다.
일 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아미노산 위치 796, 141, 231, 27, 82, 178, 309, 407, 415, 516 및/또는 666 또는 이의 조합에 돌연변이을 포함하지만 이에 제한되지 않는, 이의 환원효소 도메인 중의 적어도 하나의 추가 돌연변이를 갖는 변형된 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 나타낸다. 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 상응하는 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체 또는 이의 조성물의 개선된 역가, 수율 및/또는 생산성을 유발한다.
CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 예시는 하기이다: 서열 번호: 38, 이는 알라닌이 발린으로 교체되는 위치 796의 환원효소 도메인에서 하나의 추가의 돌연변이를 갖는다(도 4 참조). 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 폴리펩티드 서열을 가지며, 이것은 또한 추가의 돌연변이 또는 추가의 변이체를 생성하는 주형 서열로서 작용한다. 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, P450 Cyp153A(G307A)-RedRhF(A796V) 융합 단백질(도 5 참조)이고, 촉매 도메인(G307A)에서 하나의 돌연변이를 가지며, 환원효소 도메인(A796V)에서 하나의 돌연변이를 갖고, 자기-충분하며 지방산의 ω-OH 지방산으로의 반응에 촉매작용을 일으키는 ω-하이드록실라제 효소 활성을 보유한다. 일 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 그것의 촉매 및/또는 환원효소 도메인 중 그것의 아미노산 서열에서 적어도 1종의 추가의 돌연변이, 예컨대 비제한적으로 아미노산 위치 9, 10, 11, 12, 13, 14, 27, 28, 61, 77, 119, 140, 141, 149, 157, 159, 231, 233, 244, 254, 271, 309, 327, 407, 413, 451, 480, 527, 544, 557, 567, 591, 648, 649, 703, 706, 719, 745, 747, 749, 757, 770, 771 및 784 또는 이들의 조합(예를 들면, 그와 같은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 핵산 및 단백질 서열을 가리키는 서열 번호: 47-164 참조)에서 돌연변이를 갖는 변형된 CYP153A-환원효소 하이브리드 융합 폴리펩티드이다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 서열 번호: 38 (즉, 주형 변이체) (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 서열 번호: 6 (즉, 주형 변이체)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 예를 들어, 서열 번호: 42 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 예를 들어, 서열 번호: 46 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 예를 들어, 서열 번호: 98 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다.
세포가 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체로 형질전환되는 경우 이것은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포(예컨대, 재조합 세포)이다. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현시키는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체, 특히 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현시키는 상응하는 세포의 그것에 적어도 2배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 대장균 (Escherichia coli)과 같은 숙주에서, ω-OH 지방산은 자연적으로 또는 이종으로 발현된 효소에 의해 이관능성 지방산 유도체로 전환될 수 있다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 1배, 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 또는 적어도 약 10배 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 템플릿화 변이체, 특히, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 것보다 적어도 약 1배, 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 또는 적어도 약 10배 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 하나의 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는, 주형 또는 참조 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는, 상응하는 세포의 그것보다 적어도 약 1퍼센트, 적어도 약 2퍼센트, 적어도 약 3퍼센트, 적어도 약 4퍼센트, 적어도 약 5퍼센트, 적어도 약 6퍼센트, 적어도 약 7퍼센트, 적어도 약 8퍼센트, 적어도 약 9퍼센트, 또는 적어도 약 10퍼센트 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체를 발현하는 상응하는 세포의 그것보다 적어도 약 1퍼센트, 적어도 약 2퍼센트, 적어도 약 3퍼센트, 적어도 약 4퍼센트, 적어도 약 5퍼센트, 적어도 약 6퍼센트, 적어도 약 7퍼센트, 적어도 약 8퍼센트, 적어도 약 9퍼센트, 또는 적어도 약 10퍼센트 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체를 발현하는 상응하는 세포의 그것보다 적어도 약 1퍼센트, 적어도 약 2퍼센트, 적어도 약 3퍼센트, 적어도 약 4퍼센트, 적어도 약 5퍼센트, 적어도 약 6퍼센트, 적어도 약 7퍼센트, 적어도 약 8퍼센트, 적어도 약 9퍼센트, 또는 적어도 약 10퍼센트 더 높다.
또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현으로 인해 재조합 세포에서 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트 내지 적어도 약 80퍼센트 더 높다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현으로 인해 재조합 세포에서 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트 내지 적어도 약 80퍼센트 더 높다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현으로 인해 재조합 세포에서 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트 내지 적어도 약 80퍼센트 더 높다.
일부 구현예에서, 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다. 기타 구현예에서, 본 개시내용의 세포 또는 재조합 미생물에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체, 특히, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다. 기타 구현예에서, 본 개시내용의 세포 또는 재조합 미생물에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다. 기타 구현예에서, 본 개시내용의 세포 또는 재조합 미생물에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다.
따라서, 본 개시내용은 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하여 ω-OH 지방산 또는 이의 유도체를 생산하도록 조작된 재조합 숙주 세포를 제공한다. 그와 같은 변이체의 예들이 순차적으로 표 A, B 및 C(하기)에 묘사되었다. 일 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드-발현 숙주 세포, 즉 예를 들면, 서열 번호: 6, 서열 번호: 38, 서열 번호: 42, 또는 서열 번호: 46을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 일 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드-발현 숙주 세포, 즉 예를 들면, 서열 번호: 98에 기반한, CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉, 서열 번호: 38을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉, 서열 번호: 6을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉 예를 들면, 서열 번호: 42을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉 예를 들면, 서열 번호: 46을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉 예를 들면, 서열 번호: 98을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 각종 상이한 숙주 세포들이 본원에 기재된 바와 같은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하도록 변형될 수 있으며, 이것이 ω-OH 지방산 및 ω-OH 지방산 유도체 또는 이의 조성물의 증진된 생산에 적합한 재조합 숙주 세포를 야기한다. 생산된 ω-OH 지방산의 예시는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산이다. 일 구현예에서, 이와 같은 ω-OH 지방산은 ω-OH C8:0 지방산, ω-OH C10:0 지방산, ω-OH C12:0 지방산, ω-OH C14:0 지방산, ω-OH C16:0 지방산, ω-OH C18:0 지방산, ω-OH C20:0 지방산, ω-OH C8:1 지방산, ω-OH C10:1 지방산, ω-OH C12:1 지방산, ω-OH C14:1 지방산, ω-OH C16:1 지방산, ω-OH C18:1 지방산, ω-OH C20:1 지방산 및 기타 동종의 것이다. 본원에 기재된 바와 같은 재조합 숙주 세포에서 사용하기에 적합한 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 포함하는 각종 세포들이 유전 물질의 공급원을 제공할 수 있는 것으로 이해된다.
경로 조작 및 효소 활성
지방산 합성은 박테리아 생합성 기구의 가장 잘 보존된 시스템들 중 하나이다. 지방산 신타제 (FAS) 다중-효소 복합체는 모든 박테리아 및 진핵생물에 존재한다. FAS 관련 유전자들의 대부분은 세포 성장 및 생존에 필수적이다. 진핵생물 및 박테리아 FAS는 본질적으로 동일한 타입의 생화학적 형질전환을 구현한다. 진핵생물에서, FAS는 FAS I라고 하며, 이의 촉매 도메인들의 대부분은 하나의 폴리펩티드 사슬(비-해리성)에 의해 암호화된다. 박테리아와 같은 원핵생물에서, FAS는 FAS II라고 하며, 이의 개개의 효소들 및 운반 단백질들은 별개의(해리성) 단백질에 대해 암호화하는 별도의 유전자에 의해 암호화된다. 이와 같이, FASII는 상당한 변동 및 뚜렷한 특이성을 갖는 복합 시스템이다.
FAS 경로에서의 효소와 함께 아실기 운반 단백질(ACP)이 원래의(native) 유기체에서 생산된 지방산의 길이, 포화도 및 분지화를 조절한다. 이 경로에서의 단계들이 아세틸-CoA 카복실라제(ACC) 유전자 패밀리 및 지방산 생합성(FAB)의 효소에 의해 촉매된다. 예를 들면, FAS 경로에 포함될 수 있는 효소는 AccABCD, FabD, FabH, FabG, FabA, FabZ, FabI, FabK, FabL, FabM, FabB, 및 FabF를 포함한다. 목적하는 생성물에 따라, 이러한 유전자들 중 하나 이상이 감쇠되거나 과발현될 수 있다. 이와 같이, 원핵생물은 글루코스 또는 다른 탄소 공급원과 같은 재생가능한 공급원료로부터의 지방산 유도체의 생성을 증가시키도록 조작되었다. 여기서 주요 목표는 박테리아 균주를 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 및 지방 알콜(FALC)을 포함한, 지방산 유도체 생산을 위한 미생물 공장(microbial factory)으로 전환시키기 위해 지방산 유도체들의 생산을 조절하는 주요 조절 효소의 활성을 증가시키는 것이다(예컨대, 본원에 참고로 포함된 미국 특허 제8,283,143호 참조).
본 발명은 ω-OH 지방산 및 ω-OH 지방산 유도체와 같은 바람직한 화합물의 생산을 위한 효소 경로를 변형시키기 위해 효소 기능의 폴리펩티드를 암호화하는 CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드를 식별한다. 본원에서 효소 수탁 번호(EC 번호)에 의해 식별되는 이러한 폴리펩티드들은 ω-OH 지방산 및 기타의 이관능성 분자, 예를 들면, α,ω-이산과 같은 ω-OH 지방산 유도체의 생산을 유도하는 지방산 경로들을 조작하는데 유용하다(도 1 참조).
하나의 구현예에서, ω-OH 지방산 유도체를 생산하기 위해 글루코스와 같은 재생가능한 공급원료로부터 유도된 탄소 공급원을 사용하는 경로가 도 1에 도시되어 있다. 탄수화물(예컨대, 글루코스)은 원래의 유기체에 의해 아실-ACP와 같은 아실-티오에스테르로 전환된다(도 1의 단계 1 참조). 지방산 분해 효소 활성을 갖는 폴리펩티드에 대해 암호화하는 폴리뉴클레오티드는 목적하는 생성물에 따라 선택적으로 감쇠될 수 있다(하기 실시예 참조). 이러한 폴리펩티드의 비제한적인 예는 아실-CoA 합성효소(FadD) 및 아실-CoA 데하이드로게나제(FadE)이다. 표 1은 당업계에 공지된 방법에 따라 선택적으로 감쇠될 수 있는 다양한 지방산 분해 효소를 포함한, 대사 경로 내의 효소 활성(하기)의 광범위한 목록을 제공한다(예컨대, 상기 미국 특허 제8,283,143호 참조).
예를 들면, FadR(하기 표 1 참조)은 지방산 분해 및 지방산 생합성 경로에 관련된 주요 조절 인자이다(Cronan et al. , Mol . Microbiol . , 29(4):937-943 (1998)). 대장균 효소 FadD(하기 표 1 참조) 및 지방산 수송 단백질 FadL은 지방산 흡수 시스템의 성분이다. FadL은 지방산의 박테리아 세포로의 수송을 매개하고, FadD는 아실-CoA 에스테르의 형성을 매개한다. 다른 탄소 공급원이 이용가능하지 않을 때, 외인성 지방산이 박테리아에 의해 흡수되고 아실-CoA 에스테르로 전환되며, 이것은 전사 인자 FadR에 결합할 수 있고, 지방산 수송(FadL), 활성화(FadD) 및 β-산화(FadA, FadB 및 FadE)를 담당하는 단백질을 암호화하는 fad 유전자의 발현을 저하시킬 수 있다. 대안적인 탄소 공급원들이 이용가능할 때, 박테리아가 아실-ACP로서 지방산을 합성하며, 이것이 인지질 합성에 사용되지만 β-산화에 대한 기질은 아니다. 따라서, 아실-CoA 및 아실-ACP는 둘 다 상이한 최종산물을 야기할 수 있는 지방산의 독립적인 공급원들이다(Caviglia et al. , J. Biol. Chem. , 279(12):1163-1169 (2004)).
표 1:효소 활성
도 1은 아실-ACP와 같은 아실 티오에스테르가 전구물질 중간체로서 C12 또는 C16:1 지방산(FFA)으로 전환될 수 있는 예시적인 경로를 보여준다. 도 1의 단계 1에서, 티오에스테라제가 아실-ACP를 FFA로 전환시키는데 사용된다. 특정 구현예에서, 티오에스테라제를 암호화하는 유전자는 tesA, 'tesA, tesB, fatB1, fatB2, fatB3, fatA1, 또는 fatA이다(또한 이 단계를 촉매하는데 사용될 수 있는 티오에스테라제의 효소 활성을 갖는 폴리펩티드를 보여주는 상기 표 1 참조). 단계 2에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체가 지방산으로부터 ω-OH 지방산(ω-OH FFA)을 생성하는데 사용된다. 다른 이관능성 분자, 예를 들면 α,ω-이산 또는 다른 ω-OH 지방산 유도체가 경로에 존재하는 효소 관능기에 따라 경로의 다운스트림에서 생산될 수 있다.
CYP153A-환원효소 하이브리드 융합 폴리펩티드
ω-하이드록실라제(또는 ω-옥시게나제)는 특정 비-햄(non-heme) 이철 옥시게나제(예컨대, 슈도모나스 퓨티다(Pseudomonas putida) GPo1로부터의 alkB) 및 특정 햄-타입 P450 옥시게나제(예컨대, 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 cyp153A와 같은 ω-하이드록실라제)를 포함한다. P450은 편재하여 분포된 효소이며, 높은 복잡성을 갖고 광범위한 활성을 나타낸다. 이들은 광범위하게 다양한 기질을 전환시키고 다양한 화학적 반응을 촉매하는 유전자들의 상과(superfamily)에 의해 암호화되는 단백질이다. Cyp153A는 ω-위치에 대해 높은 선택성을 갖는 탄화수소 쇄를 하이드록실화하는 가용성 박테리아 사이토크롬 P450의 아과(sub-family)이다(van Beilen et al. (2006) Appl. Environ. Microbiol. 72:59-65). cyp153A 패밀리의 구성원들, 예를 들면 마이코박테리움 종(Mycobacterium sp.) HXN-1500으로부터의 cyp153A6(Funhoff et al. (2006) J. Bacteriol . 188:5220-5227), 마이코박테리움 마리눔(Mycobacterium marinum)으로부터의 cyp153A16 및 폴라로모나스 종(Polaromonas sp .) JS666으로부터의 cyp153A(Scheps et al. (2011) Org . Biomol . Chem . 9:6727-6733) 뿐만 아니라 마리노박터 아쿠애올리(Marinobacter aquaeoli)로부터의 cyp153A(Honda-Malca et al. (2012) Chem. Commun. 48:5115-5117)는 알칸, 지방산 또는 지방 알콜의 ω-위치를 선택적으로 하이드록실화하는 것으로 시험관내에서 나타났다. 아래 표 2A 및 2B는 ω-OH 지방산 및 ω-OH 지방산 유도체를 생산하는데 사용될 수 있는 ω-하이드록실라제 효소 활성을 갖는 효소 및 산화환원 파트너의 예를 보여준다.
표 2A:ω-하이드록실라제 효소 활성(P450)(EC 1.14.15.3)의 예
표 2B:ω-하이드록실라제 효소 활성(P450)(EC 1.14.15.3)에 대한 산화환원 파트너의 예
모든 사이토크롬 P450과 마찬가지로, Cyp153A ω-하이드록실라제는 이들의 촉매 활성을 위해 전자를 필요로 하며, 이것은 페레독신 및 페레독신 환원효소와 같은 특이 산화환원 단백질을 통해 제공된다. 이들은 cyp153A와 상호작용하는 별개의 단백질이다. 자족성 하이브리드(키메라성) cyp153A 옥시게나제(즉, 활성을 위해 별개의 페레독신 및 페레독신 환원효소 단백질을 필요로 하지 않는 옥시게나제)는 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis) SK2로부터의 cyp153A (Kubota et al. (2005) Biosci. Biotechnol. Biochem. 69:2421-2430; Fujita et al. (2009) Biosci. Biotechnol. Biochem. 73:1825-1830)를 플라빈 모노뉴클레오티드(FMN) 및 NADPH-결합 부위 및 [2FeS] 페레독신 중심을 포함하는 P450RhF로부터의 환원효소 도메인과 융합함으로써 이전에 생성되었다(Hunter et al. (2005) FEBS Lett. 579:2215-2220)는 알칸, 지방산 또는 지방 알콜의 ω-위치를 선택적으로 하이드록실화하는 것으로 시험관내에서 나타났다. P450RhF는 I형 P450-융합된 PFOR에 속한다(DeMot and Parret (2003) Trends Microbiol. 10:502). 이러한 하이브리드 cyp153A-RedRhF 융합 단백질은 시험관내 생물형질전환에서 ω-위치에서 옥탄을 하이드록실화하고 또한 사이클로헥산 또는 부틸벤젠과 같은 다른 화합물을 하이드록실화하는 것으로 나타났다. 또 다른 자족성 하이브리드(키메라성) cyp153A 옥시게나제는 마리노박터 아쿠애올리(Marinobacter aquaeoli)로부터의 cyp153A를 P450RhF 및 P450-BM3으로부터의 환원효소 도메인과 융합시킴으로써 생성되었다(Scheps et al. (2013) Microb. Biotechnol. 6:694-707)는 알칸, 지방산 또는 지방 알콜의 ω-위치를 선택적으로 하이드록실화하는 것으로 시험관내에서 나타났다. 천연 P450-환원효소 융합 단백질의 예가 아래 표 2C 및 2D에 도시된다.
표 2C:자족성 ω-1, ω-2, ω-3-하이드록실라제 (EC 1. 14. 14. 1) 융합 단백질의 예
표 2D:자족성 I형 P450-융합된 PFOR 융합 단백질의 예
탄화수소 쇄의 ω-위치에 대한 이들의 높은 선택성을 고려하면, cyp153A 계열 옥시게나제는 재생가능한 탄소 공급원으로부터 α,ω-이관능성 지방산 유도체를 생산하기 위한 적합한 후보물질의 우수한 예인 것으로 보인다. 이것은 상업적으로 실현가능한 공정들의 개발이 이러한 귀중한 화합물들을 생성할 수 있게 할 것이다. 그럼에도, 다른 사이토크롬 P450과 마찬가지로, cyp153A 계열 단백질은 정제된 효소 또는 원 세포 용해물을 갖는 시험관내 실험에 또는 지방산 유도체 또는 탄화수소이 외인성으로 추가되는 휴지 세포 생물형질전환에 지금까지 대부분 적용되었다(Kubota et al. , Fujita et al. , Honda-Malca et al. , Scheps et al. , 상기). 그러나, 하이브리드 융합-사용 시험관내 과정 또는 휴지 세포 생물형질전환은 ω-하이드록시 지방산 유도체의 대규모의 비용-효율적인 생산에 도움이 되지 않는다. 당업계에서 널리 수용되는 지식은, 다수의 사이토크롬 P450 뿐만 아니라 alkB-타입 ω-하이드록실라제가 재조합 미생물에서 기능적으로 발현하기가 쉽지 않은데, 그 이유는 효소가 종종 불활성이고 이들의 화학작용이 규명하기가 어렵기 때문이다. 사실상, 지금까지 시도된 지방산-유도체 이외의 재생가능한 탄소 공급원을 사용하는 유일한 생체내 작업에서는 alkB ω-하이드록실라제를 사용하였으며 높은 세포 밀도 발효에서 단지 낮은 역가의 ω-하이드록시 지방산 유도체를 달성하였다(WO2013/024114A2).
본 발명은 재생가능한 탄소 공급원으로부터 생체내에서 ω-하이드록시 지방산 유도체를 효율적으로 생산할 수 있는 CYP153A-환원효소 하이브리드 융합 단백질 변이체를 제공한다. 보다 구체적으로, 알라닌(A)이 위치 307에서 글리신(G)을 치환하는 CYP153A (G307A) P450 촉매 도메인의 하이브리드 융합 단백질을 암호화하는 마리노박터 아쿠애올리(Marinobacter aquaeoli)로부터의 유전자를 링커 폴리펩티드를 통하여 로도코쿠스 종(Rhodococcus sp .) NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 환원효소 도메인을 암호화하는 유전자와 융합시켰다. 수득된 폴리펩티드는 하기이다: CYP153A-RedRhF 하이브리드 융합 폴리펩티드 (서열 번호: 6, 참고: 도 3) (하기를 가짐: 상응하는 핵산 서열 (서열 번호: 5). 이러한 CYP153A-환원효소 하이브리드 융합 단백질이 대장균에서 발현되는 경우, 글루코스 지방산 유도체와 같은 단순 탄소 공급원을 갖는 세포가 ω-하이드록시 지방산 유도체로 효율적으로 전환되었다(실시예 1 참조). 유사한 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 생성하는데 사용될 수 있는 적합한 ω-하이드록실라제(EC 1.14.15.3) 및 이들의 산화환원 파트너에 대한 또 다른 예가 표 2A 및 2B에 열거되어 있다(상기 참조).
CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체
본 개시내용은 숙주 세포에서 발현된 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 특히 숙주 세포에서 발현된 예를 들면, 서열 번호: 6, 서열 번호: 38, 서열 번호: 42, 서열 번호: 46 및 서열 번호: 98 중 어느 하나의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 그리고 좀 더 구체적으로 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 더 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체를 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 식별한다: 서열 번호: 38 (숙주 세포 중 발현됨). 다양한 구현예에서, 본 개시내용은 숙주 세포에서 발현된 예를 들면, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 더 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체 조성물을 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 42, 서열 번호: 46, 또는 서열 번호: 98 (숙주 세포 중 발현됨). 본 발명의 비제한적인 실시예(하기 실시예 1-7 참조)에서 하이브리드 CYP153A(G307A)-RedRhF 융합 폴리펩티드(상기 참조)가 증가된 양의 ω-OH 지방산 및 ω-OH 지방산 유도체를 생산하도록 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 효율적으로 조작하는 주형으로서 사용되었다. 예를 들면, 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 글루코스와 같은 단순 탄소 공급원으로부터 생체내에서 도데칸산과 같은 화합물을 12-하이드록시 도데칸산으로 효율적으로 전환시킬 수 있다. 예를 들면, 재생가능한 공급원료로부터 유도되는 것과 같은 어떠한 단순 탄소 공급원도 적합하다. 조작된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체(즉, 조작된 CYP153A-RedRhF 하이브리드 융합 폴리펩티드 변이체를 통해 예시됨)가 재생가능한 공급원료로부터 글루코스와 같은 탄소 공급원을 사용함으로써 대장균과 같은 숙주 세포에서 티오에스테라제와 공동-발현되는 경우 생체내에서 지방산을 ω-OH 지방산을 포함한 특정의 바람직한 화합물로 전환시킬 수 있는 것으로 나타났다(하기 실시예들 참조). 본 발명을 따름으로써, 다른 하이브리드 융합 폴리펩티드 변이체는 CYP153A 촉매 도메인을 암호화하는 유전자와 같은 돌연변이화된 유전자를 c-말단 환원효소 도메인을 암호화하는 돌연변이화된 유전자에 결합시킴으로써 조작될 수 있다(상기 표 2A 내지 2D 또한 도 5 참조). 예를 들면, 유전자 둘 다(P5450 촉매 도메인 및 환원효소 도메인)를 돌연변이시키거나 하나의 유전자(P450 촉매 도메인 또는 환원효소 도메인)를 돌연변이시키는 변형이 본원에 포함된다. 이러한 지침에 따라, 유사한 융합 단백질 변이체들이 다른 타입의 ω-하이드록실라제로부터 생성될 수 있다.
따라서, 본 개시내용은 숙주 세포에서 발현된 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 특히 숙주 세포에서 발현된 예를 들면, 서열 번호: 6, 서열 번호: 38, 서열 번호: 42, 서열 번호: 46 및 서열 번호: 98 중 어느 하나의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 그리고 좀 더 구체적으로 숙주 세포에서 발현된 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체를 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다: 서열 번호: 38 (숙주 세포 중 발현됨). 다양한 구현예에서, 본 개시내용은 숙주 세포에서 발현된 예를 들면, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체 조성물을 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다: 서열 번호: 42, 서열 번호: 46, 또는 서열 번호: 98 (숙주 세포 중 발현됨). CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 CYP153A 도메인 또는 환원효소 도메인 또는 둘 다에 하나 이상의 돌연변이를 갖는다. 일 구현예에서, 본 개시내용은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 6 (참고: 도 3)과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 및 27, 82, 141, 178, 231, 309, 407, 415, 516, 666 및/또는 796으로 이루어진 그룹으로부터 선택된 아미노산 위치에 하나 이상의 돌연변이 (여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매함). 보다 구체적으로, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아르기닌(R)이 리신(L)으로 치환된 R27L; 아르기닌(R)이 아스파르트산(D)으로 치환된 위치 R82D; 발린이 이소류신(I)으로 치환된 위치 V141I; 발린(V)이 글루타민(Q)으로 치환된 위치 V141Q; 발린(V)이 글리신(G)으로 치환된 위치 V141G; 발린(V)이 메티오닌(M)으로 치환된 위치 V141M; 발린(V)이 류신(L)으로 치환된 위치 V141L; 발린(V)이 트레오닌(T)으로 치환된 위치 V141T; 아르기닌(R)이 아스파라긴(N)으로 치환된 위치 R178N; 알라닌(A)이 트레오닌(T)으로 치환된 위치 A231T; 아스파라긴(N)이 아르기닌(R)으로 치환된 위치 N309R; 아스파라긴(N)이 알라닌(A)으로 치환된 위치 N407A; 발린(V)이 아르기닌(R)으로 치환된 위치 V415R; 트레오닌(T)이 발린(V)으로 치환된 위치 T516V; 프롤린(P)이 알라닌(A)으로 치환된 위치 P666A; 프롤린(P)이 아스파르트산(D)으로 치환된 위치 P666D; 및 알라닌(A)이 발린(V)으로 치환된 위치 A796V를 포함한 하나 이상의 상기 돌연변이를 갖는다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 예시는 하기를 포함한다: 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44 및 서열 번호: 46. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하이브리드 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 상응하는 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산 또는 이의 조성물의 역가에 비해 더 높은 역가의 ω-OH 지방산 유도체 또는 이의 조성물을 야기한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 돌연변이 V141I 및/또는 V141T를 포함한 아미노산 위치 141에 돌연변이를 갖는다. 본원에서, 돌연변이 V141I 또는 V141T를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의하여 생산된 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 역가와 비교하여, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산, 각각의 보다 높은 역가를 유발한다. 일 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 V141I 및 A231T (서열 번호: 32), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 R27L, R82D, V141M, R178N 및 N407A (서열 번호: 34), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 P666A (서열 번호: 36), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 A796V (서열 번호: 38) (환원효소 도메인 중 (참고: 도 5)), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 A796V, P666D 및 T516V (서열 번호: 40) (환원효소 도메인 중), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 V141I 및 A231T (이의 촉매 도메인 중) 및 돌연변이 A796V (이의 환원효소 도메인 중 (서열 번호: 42)), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 R27L, R82D, V141M, R178N 및 N407A (이의 촉매 도메인 중) 및 돌연변이 A796V (이의 환원효소 도메인 중 (서열 번호: 44), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 V141T 및 A231T (이의 촉매 도메인 중) 및 돌연변이 A796V (이의 환원효소 도메인 중 (서열 번호: 46), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 일 구현예에서, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44 및 서열 번호: 46의 변이체는 서열 번호: 6과 비교하여, 더 많은 양의 ω-OH 지방산 또는 지방산 유도체를 생산하였다. 일 구현예에서, 이와 같은 ω-OH 지방산은 ω-OH C8:0 지방산, ω-OH C10:0 지방산, ω-OH C12:0 지방산, ω-OH C14:0 지방산, ω-OH C16:0 지방산, ω-OH C18:0 지방산, ω-OH C20:0 지방산, ω-OH C8:1 지방산, ω-OH C10:1 지방산, ω-OH C12:1 지방산, ω-OH C14:1 지방산, ω-OH C16:1 지방산, ω-OH C18:1 지방산, ω-OH C20:1 지방산 및 기타 동종의 것이다.
본 발명은 CYP153A-환원효소 하이브리드 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체를 식별한다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 및 46을 포함한다. CYP153A-환원효소 하이브리드 융합 핵산 변이체 (DNA 서열)은 서열 번호: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 및 47을 포함한다. 그러나, CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 대한 절대적인 서열 동일성이 필요한 것은 아님을 인지할 것이다. 예를 들면, 특정 폴리뉴클레오티드 서열에 있어서의 변화가 이루어질 수 있으며, 암호화된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 전형적으로, 예를 들면, 코돈 최적화를 통해서와 같은 보존적 돌연변이 및 잠재성 돌연변이를 포함한다. 변형된 또는 돌연변이화된(즉, 돌연변이체) 폴리뉴클레오티드 및 암호화된 변이체 폴리펩티드는 당업계에 공지된 방법을 사용하여 야생형 또는 주형 폴리펩티드에 비해 증가된 촉매 활성, 증가된 안정성, 또는 감소된 억제(예컨대, 감소된 피드백 억제)를 포함하지만 이에 제한되지 않는 개선된 기능과 같은 목적하는 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(EC) 번호에 따라 본원에 기재된 지방산 생합성 경로의 다양한 단계(즉, 반응)에 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드(예컨대, 특이 효소로서 기능하고 특이 효소 활성을 나타내는 것), 및 이러한 폴리펩티드를 암호화하는 예시적인 폴리뉴클레오티드를 제공한다. 서열 식별자 번호(상기 서열 번호)에 의해 본원에 식별된 이러한 예시적인 폴리펩티드 및 폴리뉴클레오티드가 도 1에 나타낸 것과 같은 숙주 세포에서 지방산 경로를 조작하는데 유용하다. 그러나, 본원에 기재된 폴리펩티드 및 폴리뉴클레오티드는 예시적이며, 따라서, 비제한적임을 이해해야 한다. 본원에 기재된 예시적인 폴리펩티드의 동족체의 서열이, 예를 들면, 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 공과 대학에 의해 제공되는 BRENDA 데이터베이스, 및 교토 대학과 도쿄 대학의 생물정보학 센터에 의해 제공된 KEGG 데이터베이스와 같은 데이터베이스를 사용하여 당업계의 숙련가들에게 이용 가능하며, 이들 모두는 월드 아이드 웹 상에서 이용 가능하다.
일 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44 및 서열 번호: 46과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 알라닌(A)이 글리신(G) (촉매 도메인 중)을 대체하는 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 CYP153A (G307A) 폴리펩티드로부터 유도되고, 링커 펩티드를 통하여 로도코쿠스 종(Rhodococcus sp .) NCIMB9784로부터의 P450RhF의 환원효소 도메인과 융합된다. 사이토크롬 P450RhF는 자족성이며, 고도의 기질 무차별성을 나타내며 광범위한 관능 그룹을 촉매한다. 기타 구현예에서, 본 개시내용을 실시하는데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 또는 서열 번호: 46의 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는다. 또한, 본 명세서에서 기재된 바와 같이 유용한 특징 및/또는 특성을 유발하는 하나 이상의 치환을 포함할 수 있다. 기타 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 또는 서열 번호: 46와 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는다. 여전히 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마이노박터 아쿠애올레이 이외의 유기체로부터 유도된다. 이와 같은 다른 유기체는, 비제한적으로, 아시네토박터 종, 마이코박테리움 마리넘, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 푼고룸, 카울로박터 크레스센투스, 하이포모나스 넵투니움, 도로슈도모나스 팔루스트리스, 스핑고모나스 종, 마이코박테리움 종을 포함한다. 또 다른 구현예에서, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 환원효소 도메인은 로도코쿠스 종 이외의 유기체에서 유래된다. 이와 같은 기타 유기체에는, 비제한적으로, 로도코쿠스 에퀴, 아시네토박터 라디오레시텐스, 버크홀데리아 말레이, 버크홀데리아 말레이, 랄스토니아 유트로파, 쿠프리아비두스 메탈리두란스가 포함된다.
관련된 구현예에서, 상기 개시내용은 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 또는 서열 번호: 47과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체를 포함한다. 일부 구현예에서 핵산 서열은 본원에 기재된 바와 같은 개선된 특징들 및/또는 특성들을 야기하는 하나 이상의 치환을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 암호화한다. 추가의 또 다른 관련 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 또는 서열 번호: 47과 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는 뉴클레오티드 서열에 의하여 암호화된다. 또 다른 측면에서, 본 개시내용은 실질적으로 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 또는 서열 번호: 47에 상응하는 핵산 서열의 전장에 걸쳐 엄격한 조건 하에 하이브리드화되는 핵산 서열에 의해 암호화된 아미노산 서열을 아우르는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터 유도된다. 또 다른 구현예에서, P450 하이브리드 융합 폴리펩티드는 아시네토박터 종, 마이코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울로박터 크레센투스, 하이포모나스 넵투늄, 로도슈도모나스 팔루스트리스, 스핀고모나스 종, 마이코박테리움 종으로부터 유도된다.
추가의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체
본 발명은 추가의 CYP153A-환원효소 하이브리드 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체를 식별하며, 여기서, 변이체가 주형 (주형 변이체)로서 사용되었다. 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체(서열 번호: 38)은 P540 CYP153A(G307A)-Red450RhF(A796V) 융합 폴리펩티드를 기반으로 하고, 글리신(G)이 알라닌(A)로 대체되는 촉매 도메인에 돌연변이 G307A을, 그리고 알라닌(A)이 발린(V)으로 대체되는 환원효소 도메인에 돌연변이 A796V를 포함하되, 링커 폴리펩티드가 상기 촉매 도메인을 상기 환원효소 도메인에 연결한다(도 4 및 5 참조). 일부 구현예에서, 마리노박터 아쿠아에올레이에서 유래된 CYP153A 폴리펩티드는 로도코쿠스 종 NCIMB9784에서 유래된 P450RhF의 환원효소 도메인과 링커를 통해 융합된다. 상기 주지된 바와 같이, 사이토크롬 P450RhF는 자족성이며, 고도의 기질 무차별성을 나타내며 광범위한 관능 그룹을 촉매한다. 상기 촉매 도메인에서의 돌연변이 G307A와 상기 환원효소 도메인에서의 돌연변이 A796V는 cyp153A (서열 번호: 38 참조)의 ω-하이드록실라제 활성을 개선하는 유익한 돌연변이이다. cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고 P450 cyp153A(G307A)-Red450RhF(A796V)(서열 번호: 38)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다 (참고: 실시예 7). 수득한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 실시예 (하기) 뿐만 아니라 서열 표 B 및 C (하기)에 나타나 있다. 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 그리고 하기를 포함한다: 서열 번호: 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142 및 144. 유사하게, 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 6과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 그리고 하기를 포함한다: 서열 번호: 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 및 164. 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 및/또는 지방산 유도체를 포함하는 ω-OH 지방산의 증가된 양을 생산할 수 있다.
상기 촉매 도메인에서의 돌연변이 Q12W, R27L, K119R, S140N, S157R, V159M, S233L 및 A244R (또한 돌연변이 G307A )와 상기 환원효소 도메인에서의 돌연변이 A796V는 cyp153A의 ω-하이드록실라제 활성을 추가로 개선하는 유익한 돌연변이이다 (참고: 서열 번호: 98 및 실시예 8). cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고 하기를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다: 서열 번호: 98) (참고: 실시예 11). 수득한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 실시예 (하기) 뿐만 아니라 서열 표 C (하기)에 나타나 있다. 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 98과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 그리고 하기를 포함한다: 서열 번호: 146, 148, 150, 152, 154, 156, 158, 160, 162 및 164. 유사하게, 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 6과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 또한 서열 번호: 38, 그리고 하기를 포함한다: 서열 번호: 146, 148, 150, 152, 154, 156, 158, 160, 162 및 164. 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 및/또는 지방산 유도체를 포함하는 ω-OH 지방산의 증가된 양을 생산할 수 있다.
CYP153A-환원효소 하이브리드 융합 핵산 변이체 (DNA 서열)은 서열 번호: 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161 및 163을 포함한다. 그러나, CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 대한 절대적인 서열 동일성이 필요한 것은 아님을 인지할 것이다. 예를 들면, 특정 폴리뉴클레오티드 서열에 있어서의 변화가 이루어질 수 있으며, 암호화된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 전형적으로, 예를 들면, 코돈 최적화를 통해서와 같은 보존적 돌연변이 및 잠재성 돌연변이를 포함한다. 변형된 또는 돌연변이화된(즉, 돌연변이체) 폴리뉴클레오티드 및 암호화된 변이체 폴리펩티드는 당업계에 공지된 방법을 사용하여 야생형 또는 주형 폴리펩티드에 비해 증가된 촉매 활성, 증가된 안정성, 또는 감소된 억제(예컨대, 감소된 피드백 억제)를 포함하지만 이에 제한되지 않는 개선된 기능과 같은 목적하는 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(EC) 번호에 따라 본원에 기재된 지방산 생합성 경로의 다양한 단계(즉, 반응)에 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드(예컨대, 특이 효소로서 기능하고 특이 효소 활성을 나타내는 것), 및 이러한 폴리펩티드를 암호화하는 예시적인 폴리뉴클레오티드를 제공한다. 서열 식별자 번호(상기 서열 번호)에 의해 본원에 식별된 이러한 예시적인 폴리펩티드 및 폴리뉴클레오티드가 도 1에 나타낸 것과 같은 숙주 세포에서 지방산 경로를 조작하는데 유용하다. 그러나, 본원에 기재된 폴리펩티드 및 폴리뉴클레오티드는 예시적이며, 따라서, 비제한적임을 이해해야 한다. 본원에 기재된 예시적인 폴리펩티드의 동족체의 서열이, 예를 들면, 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 공과 대학에 의해 제공되는 BRENDA 데이터베이스, 및 교토 대학과 도쿄 대학의 생물정보학 센터에 의해 제공된 KEGG 데이터베이스와 같은 데이터베이스를 사용하여 당업계의 숙련가들에게 이용 가능하며, 이들 모두는 월드 아이드 웹 상에서 이용 가능하다.
다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164 중 임의의 것의 아미노산 서열에 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 또는 89% 서열 동일성을 갖는다 (여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매함). 바람직하게는, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 재조합 숙주 세포에서 발현 시, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164 중 임의의 것의 아미노산 서열에 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다 (여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매함). 바람직하게는, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 재조합 숙주 세포에서 발현 시, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 글리신(G)이 알라닌(A)으로 대체된 마이노박터 아쿠애올레이로부터의 CYP153A (G307A) 폴리펩티드로부터 유도되고, 로도코쿠스 종 NCIMB9784으로부터의 P450RhF의 환원효소 도메인과 융합되며, 알라닌(A)이 발린(V)으로 대체된 A796V의 부가 돌연변이를 포함한다. 기타 구현예에서, 본 개시내용을 실시하는데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 또는 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164의 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는다. 또한, 본 명세서에서 기재된 바와 같이 유용한 특징 및/또는 특성을 유발하는 하나 이상의 치환을 포함할 수 있다. 기타 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 또는 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 또는 서열 번호: 96과 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는다. 여전히 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마이노박터 아쿠애올레이 이외의 유기체로부터 유도된다. 이와 같은 다른 유기체는, 비제한적으로, 아시네토박터 종, 마이코박테리움 마리넘, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 푼고룸, 카울로박터 크레스센투스, 하이포모나스 넵투니움, 도로슈도모나스 팔루스트리스, 스핑고모나스 종, 마이코박테리움 종을 포함한다. 또 다른 구현예에서, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 환원효소 도메인은 로도코쿠스 종 이외의 유기체에서 유래된다. 이와 같은 기타 유기체에는, 비제한적으로, 로도코쿠스 에퀴, 아시네토박터 라디오레시텐스, 버크홀데리아 말레이, 버크홀데리아 말레이, 랄스토니아 유트로파, 쿠프리아비두스 메탈리두란스가 포함된다.
관련된 구현예에서, 상기 개시내용은 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161 및 서열 번호: 163의 핵산 서열과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체를 포함한다 (CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 의하여 암호화된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매함). 바람직하게는, CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 의하여 암호화된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 재조합 숙주 세포에서 발현 시, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 일부 구현예에서 핵산 서열은 본원에 기재된 바와 같은 개선된 특징들 및/또는 특성들을 야기하는 하나 이상의 치환을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 암호화한다. 추가의 또 다른 관련 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161 및 서열 번호: 163 중 임의의 것의 뉴클레오티드 서열과 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는 뉴클레오티드 서열에 의하여 암호화된다. 또 다른 측면에서, 본 개시내용은 실질적으로 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161 및 서열 번호: 163 중 임의의 것에 상응하는 핵산 서열의 전장에 걸쳐 엄격한 조건 하에 하이브리드화되는 핵산 서열에 의해 암호화된 아미노산 서열을 아우르는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 마이노박터 아쿠애올레이 종으로부터 유도된다. 또 다른 구현예에서, P450 하이브리드 융합 폴리펩티드는 아시네토박터 종, 마이코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울로박터 크레센투스, 하이포모나스 넵투늄, 로도슈도모나스 팔루스트리스, 스핀고모나스 종, 마이코박테리움 종으로부터 유도된다.
서열
서열 표 A에 나타낸 변이체는 하이브리드 사이토크롬 P450 cyp153A16(G307A)-RedRhF 융합 단백질을 기본으로 한다.
서열 표 B에 나타낸 변이체는 하이브리드 사이토크롬 P450 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 기본으로 한다.
하기 표 C에 순차적으로 나타난 변이체들은 하이브리드 사이토크롬 P450 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)을 기반으로 한다.
하기 표 D에 순차적으로 나타난 변이체들은 하이브리드 사이토크롬 P450 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)을 기반으로 한다. 본 표에서, 모든 변이체가 돌연변이의 완전한 목록(주형 돌연변이 포함)으로 묘사된다.
변형 및 돌연변이
본원에서 사용되는 바와 같은 변이체 폴리펩티드는 적어도 하나의 아미노산에 의해 야생형 CYP153A 또는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와는 상이한 아미노산 서열을 갖는 폴리펩티드를 나타낸다. 예를 들면, 변이체(예컨대, 돌연변이체)는 알라닌, 발린, 류신, 및 이소류신과 같은 지방족 아미노산의 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체; 트레오닌의 세린으로의 대체; 아스파르트산 및 글루탐산과 같은 산성 잔기의 다른 산성 잔기로의 대체; 아스파라긴 및 글루타민과 같은 아미드 그룹을 갖는 잔기의 아미드 그룹을 갖는 다른 잔기로의 대체; 리신 및 아르기닌과 같은 염기성 잔기의 다른 염기성 잔기로의 교체; 및 페닐알라닌 및 티로신과 같은 방향족 잔기의 다른 방향족 잔기로의 대체를 포함하지만 이에 제한되지 않는 상기 보존적 아미노산 치환 중의 하나 이상을 가질 수 있다. 일부 구현예에서, 변이체 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 99, 또는 그 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 갖는다. 본 개시내용은 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 단편을 아우르되, 이와 같은 단편은 지방산의 오메가-하이드록실화된 지방산으로의, 예컨대 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체로의 전환에 촉매작용을 일으킨다. 바람직하게는, 본 개시내용의 상기 단편은, 재조합 숙주 세포에서 발현 시, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 따라서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 또는 돌연변이체의 단편은 상기 개시내용의 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 또는 돌연변이체의 생물학적 기능(예를 들면, 효소 활성, 구체적으로 ω-하이드록실라제 효소 활성)의 일부 또는 전부를 보유한다. 또한, 본 개시내용에 의해 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 예를 들면, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 생물학적 기능(예를 들면, 효소 활성, 구체적으로 ω-하이드록실라제 효소 활성)의 일부 또는 전부를 보유한다. 일부 구현예에서, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 본 개시내용의 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 생물학적 기능의 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 적어도 98% 이상을 보유한다. 다른 구현예에서, 상기 단편 또는 돌연변이체는 상응하는 야생형 CYP153A 폴리펩티드, 또는 본 개시내용의 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 생물학적 기능의 약 100%를 보유한다. 기타 구현예에서, 일부 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 증가된 생물학적 기능을 보인다. 어떤 아미노산 잔기들이 생물학적 활성에 영향을 주지 않으면서 치환, 삽입, 또는 결실될 수 있는지를 결정하는 가이던스(guidance)는 당업계에 잘 알려진 컴퓨터 프로그램들, 예를 들면, LASERGENE 소프트웨어(DNASTAR, Inc. , Madison, WI)를 이용하여 찾을 수 있다. 일부 구현예에서, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 증가된 생물학적 기능을 보인다. 예를 들면, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드에 비해 효소 활성에 있어서 적어도 10%, 적어도 25%, 적어도 50%, 적어도 75%, 또는 적어도 90% 개선을 나타낼 수 있다. 또 다른 구현예에서, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드에 비해 효소 활성에 있어서 적어도 100%, 적어도 200%, 또는 적어도 500% 개선을 나타낸다. 본 개시내용이 상기에서 언급된 바와 같이 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 단편들을 아우른다는 사실에 근거하여, 비록 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 구조적 및 기능성 기술 특성이 기재될 때마다 그와 같은 단편들에 대한 언급이 본원에 이루어지지 않을지 모르나, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체와 관련하여 본 명세서에 기재된 모든 구조적 및 기능성 기술 특성은 또한 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 단편에 적용됨이 이해되어야 한다.
본원에 기재된 폴리펩티드는 폴리펩티드 기능에 실질적인 영향을 주지 않는 추가적인 보존적 또는 비-필수 아미노산 치환을 가질 수 있는 것으로 이해된다. 특정 치환이 용인되는지(즉, ω-하이드록실라제 효소 활성과 같은 목적하는 생물학적 기능에 부정적인 영향을 주지 않는지)의 여부는 당업계에 알려진 바와 같이 결정될 수 있다(참고: Bowie et al. (1990) Science, 247:1306-1310). 보존적 아미노산 치환은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 계열이 당업계에 정의되어 있다. 이러한 계열은 염기성 측쇄(예컨대, 리신, 아르기닌, 히스티딘), 산성 측쇄(예컨대, 아스파르트산, 글루탐산), 비하전된 극성 측쇄(예컨대, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예컨대, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지화 측쇄(예컨대, 트레오닌, 발린, 이소류신), 및 방향족 측쇄(예컨대, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산을 포함한다.
변이체는 자연적으로 발생하거나 시험관내에서 생성될 수 있다. 특히, 이러한 변이체는 부위 지향 돌연변이(site directed mutagenesis), 무작위 화학적 돌연변이(random chemical mutagenesis), 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 이러한 변이체, 돌연변이체, 단편, 유사체, 또는 유도체는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 변이체를 만드는 방법은 당업계에 잘 알려져 있다. 예를 들면, 변이체는 무작위 및 부위 지향 돌연변이를 이용함으로써 제조될 수 있다. 무작위 및 부위 지향 돌연변이는 일반적으로 당업계에 알려져 있다(예를 들면, 참고: Arnold (1993) Curr. Opin. Biotech. 4:450-455). 무작위 돌연변이생성은 오류 발생 경향 PCR을 사용하여 달성될 수 있다 (참고: 예를 들어, Leung et al. (1989) Technique 1:11-15; 및 Caldwell et al. 1992) PCR Methods Applic. 2:28-33). 오류 유발 PCR에서, 실제 PCR은 DNA 폴리머라제의 복사 정확도(copying fidelity)가 낮은 조건하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율이 얻어지도록 한다. 간략하게, 이러한 절차에서, 돌연변이유발될 핵산(예컨대, P450 단백질 또는 P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열)은 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl2, MnCl2, Taq 폴리머라제, 및 적당한 농도의 dNTP와 혼합된다. 예를 들면, 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mMKCl, 10 mM Tris HCl(pH 8. 3), 0. 01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl2, 0. 5 mM MnCl2, 5 단위의 Taq 폴리머라제, 0. 2 mM dGTP, 0. 2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. 1분 동안 94°C, 1분 동안 45°C, 및 1분 동안 72°C의 30회 사이클 동안 PCR를 수행할 수 있다. 그러나, 이들 파라미터가 달라질 수 있음이 당해 기술의 숙련가에 의해 적절한 것으로 인정될 것이다. 그후, 돌연변이유발된 핵산을 적절한 벡터로 클로닝하고, 돌연변이유발된 핵산에 의해 암호화되는 폴리펩티드의 활성을 평가한다. 부위 지향 돌연변이는 관심 있는 선택적인 클로닝된 DNA에서 부위-특이적 돌연변이를 생성하기 위해 올리고뉴클레오티드-지향 돌연변이유발을 이용하여 달성될 수 있다. 올리고뉴클레오티드 돌연변이유발은 당업계에 기재되어 있다(예를 들면, Reidhaar-Olson et al. (1988) Science 241:53-57). 간략하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 하나 이상의 돌연변이를 지닌 복수의 이중 가닥 올리고뉴클레오티드를 합성하고, 돌연변이유발될 클로닝된 DNA(예컨대, P450 폴리펩티드 또는 P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열) 내로 삽입한다. 돌연변이유발된 DNA를 함유한 클론을 회수하고, 이들이 암호화하는 폴리펩티드의 활성을 평가한다.
변이체를 생성하는 또 다른 방법은 조립 PCR(assembly PCR)이다. 조립 PCR은 작은 DNA 단편들의 혼합물로부터의 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(미국 특허 제5,965,408호 참조). 변이체를 생성하는 또 다른 방법은 유성(sexual) PCR 돌연변이유발이다. 유성 PCR 돌연변이유발에서는, 강제된 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 단편화의 결과로서 시험관내에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 그후, PCR 반응의 프라이머 신장법(primer extension)에 의한 크로스오버(crossover)의 고정(fixation)이 후속된다. 성적 PCR 돌연변이유발은 당해 분야에 공지된 기재된 출판물이다(예를 들면, 참고: Stemmer (1994) Proc. Natl. Acad. Sci. U. S. A. 91:10747-10751). 변이체는 또한 생체내 돌연변이유발에 의해 생성될 수 있다. 일부 구현예에서, 핵산 서열에서의 무작위 돌연변이는 DNA 보수 경로 중 하나 이상에서 돌연변이를 갖는 박테리아 균주, 예를 들면, 대장균 균주에서 서열을 증식시킴으로써 생성된다. 이러한 돌연변이유발 유전자 균주(mutator strain)는 야생형 균주보다 더 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열(예컨대, P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열)의 증식은 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체내 돌연변이유발에 사용하기에 적합한 돌연변이유발 유전자 균주는 당업계의 공보(예를 들면, 국제 특허 출원 공개 공보 제WO 1991/016427호)에 기재되어 있다. 변이체는 또한 카세트 돌연변이유발을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 영역이 원래의 서열과는 상이한 합성 올리고뉴클레오티드 카세트로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 원래의 서열을 함유한다. 반복 앙상블 돌연변이유발(recursive ensemble mutagenesis)이 또한 변이체를 생성하는데 사용될 수 있다. 반복 앙상블 돌연변이유발은 구성원들이 아미노산 서열에 있어서 상이한 표현형 관련 돌연변이체의 다양한 개체군을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위해 피드백 메커니즘을 이용한다(예를 들면, Arkin et al. (1992) Proc. Natl. Acad. Sci. , U. S. A. 89:7811-7815). 일부 구현예에서, 변이체는 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)을 이용하여 생성된다. 지수 앙상블 돌연변이유발은 높은 백분율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리(combinatorial libraries)를 생성하기 위한 공정이며, 잔기들의 작은 그룹들이 기능성 단백질을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다(예를 들면, 참고: Delegrave et al. (1993) Biotech. Res. 11:1548-1552). 일부 구현예에서, 변이체는 별개의 폴리펩티드를 암호화하는 복수의 핵산의 일부가 함께 융합되어 키메라 폴리펩티드를 암호화하는 키메라 핵산 서열을 생성하는 셔플링 절차(shuffling procedure)를 이용하여 생성된다(예를 들면, 미국 특허 제5,965,408호 및 제5,939,250호에 기재됨).
모티프 및 구조
CYP153A(G307A) 돌연변이체의 확인 및 특성규명이 Honda Malca et al. (상기)에 기재되었고, 여기서 상기 저자들은 CYP153A에서의 잠재적인 기질-상호작용 잔기를 조사하였다. Honda Malca et al. 은 그것의 측쇄와 함께 헴(heme) 중심를 가리키는 아미노산을 함유함으로써 활성화된 산소의 공격 중에 모든 기질 분자와 접촉할 것으로 기대되는 구조 요소들 중 주요 잔기들의 확인에 초점을 맞춘 구조-기반 분석을 수행하였다. 그 목적을 위해, 위치 G307이 상기 단백질 구조에서 확인될 수 있으며, 또한 CYP153A6를 위해 구축된 이전에 기재된 상동성 모델의 활성 부위의 일부인, 두 개의 핫스팟 위치 중 하나로 확인되었다. 비교하자면, 본 개시내용은 생성물의 생산량을 개선하기 위한 노력으로 랜덤 돌연변이 생성을 기반으로 한다(표 5~11에서 나타낸 바와 같이 포화 라이브러리에 대한 실시예 참조, 하기). 예를 들면, 서열 번호: 98의 변이체는 서열 번호: 38을 기반으로 하고(G307A 및 A796V 돌연변이를 보유), 추가의 돌연변이, 예컨대 Q12W, R27L, K119R, S140N, S157R, V159M, S233L 및 A244R를 갖는다(이들 중 어느 것도 3차원 모델링에 기반한 CYP153A 도메인의 활성 부위에 위치하지 않는다)(도 6 참조).
CYP153A는 구상 단백질이고 그것의 촉매차원의 활성 부위는 기질 하이드록실화의 화학적 성질이 발생하는 헴(heme) 그룹에 인접한 아미노산 잔기를 수반한다. 도 5는 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 내 환원효소 도메인 옆의 CYP153A 촉매 도메인을 나타낸다. 위치 G307은 상기 활성 부위에서 헴(heme)에 매우 근접해 있다. 그러나, 본 개시내용은 CYP153A의 촉매적 특성이, 반드시 단백질의 활성 부위에 있지 않은 특정 위치들, 예컨대, 예를 들면, 하기의 위치 12, 27, 28, 119, 141, 157, 159, 231, 233, 및 244를 변이시킬 때, 개선될 수 있음을 보여준다: 서열 번호: 38; 서열 번호: 38의 위치 12, 28, 119, 140, 157, 159, 233, 244, 254, 및 407; 서열 번호: 38의 위치 12, 27, 111, 119, 141, 157, 159, 231, 233, 244, 및 254; 서열 번호: 38의 위치 12, 28, 119, 140, 149, 157, 159, 231, 233, 및 407; 서열 번호: 38의 위치 12, 27, 28, 119, 140, 157, 159, 233, 244, 및 407; 서열 번호: 38의 위치 10, 11, 12, 28, 119, 141, 159, 231, 233, 244, 및 407; 서열 번호: 38의 위치 11, 12, 27, 28, 119, 141, 157, 159, 197, 231, 233, 244, 407, 및 477; 서열 번호: 38의 위치 11, 12, 28, 119, 141, 157, 159, 197, 231, 233, 244, 및 407; 및/또는 서열 번호: 38의 위치 11, 12, 27, 28, 119, 141, 149, 157, 159, 231, 233, 및 407. 촉매적 특성을 개선하는 특정 변이체의 예들은 하기이다: Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A231Y, S233L, A244R (서열 번호: 166); Q12W, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, R254G, N407G (서열 번호: 168); Q12W, R27L, F111A, K119R, V141T, S157R, V159M, A231Y, S233L, A244R, R254G (서열 번호: 170); Q12W, Q28M, K119R, S140N, P149G, S157R, V159M, A231Y, S233L, N407G (서열 번호: 172); Q12W, R27L, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, N407G (서열 번호: 174); D10Y, I11L, Q12W, Q28M, K119R, V141T, V159M, A231Y, S233L, A244R, N407G (서열 번호: 176); I11L, Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G, P477G (서열 번호: 178); I11L, Q12W, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G (서열 번호: 180); 및 I11L, Q12W, R27L, Q28M, K119R, V141T, P149G, S157R, V159M, A231Y, S233L, N407G (서열 번호: 182).
숙주 세포
재조합 숙주 세포에 의한 ω-OH 지방산 조성물의 생산을 증가시키는 계획은 제조 숙주에서 CYP153A-환원효소 하이브리드 융합 유전자 및 티오에스테라제 유전자를 발현시킴으로써 지방산 생합성 경로를 통해 증가된 플럭스를 포함한다. 본원에서 사용되는 용어 재조합 숙주 세포 또는 조작된 숙주 세포는 유전자 구성이, 예를 들면, 새로운 유전적 요소의 의도적인 도입 및/또는 숙주 세포에 자연적으로 존재하는 유전적 요소의 의도적인 변형에 의해 상응하는 야생형 숙주 세포에 비해 변경된 숙주 세포를 나타낸다. 이러한 재조합 숙주 세포의 자손 또한 이러한 새로운 및/또는 변형된 유전적 요소를 함유한다. 본원에 기재된 본 발명의 측면의 어느 것에 있어서, 숙주 세포는 식물 세포, 곤충 세포, 진균 세포(예컨대, 사상균, 예를 들면, 칸디다 종(Candida sp.), 또는 출아효모, 예를 들면, 사카로마이세스 종(Saccharomyces sp.)), 조류 세포 및 박테리아 세포로부터 선택될 수 있다. 하나의 구현예에서, 재조합 숙주 세포는 재조합 미생물이다. 미생물인 숙주 세포의 예는 에스체리치아(Escherichia), 바실러스(Bacillus), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 아스퍼길루스(Aspergillus), 트리코데르마(Trichoderma), 뉴로스포라(Neurospora), 푸사리움(Fusarium), 후미콜라(Humicola), 리조무코르(Rhizomucor), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 무코르(Mucor), 미셀리오프토라(Myceliophtora), 페니실리움(Penicillium), 파네로카에테(Phanerochaete), 플레우로투스(Pleurotus), 트라메테스(Trametes), 크리소스포리움(Chrysosporium), 사카로미세스(Saccharomyces), 스테노트로파모나스(Stenotrophamonas), 스키조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 또는 스트렙토마이세스(Streptomyces)로부터의 세포를 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 숙주 세포는 그람-양성 박테리아 세포이다. 또 다른 구현예에서, 숙주 세포는 그람-음성 박테리아 세포이다. 일부 구현예에서, 숙주 세포는 대장균 세포이다. 일부 구현예에서, 숙주 세포는 대장균 B 세포, 대장균 C 세포, 대장균 K 세포, 또는 대장균 W 세포이다. 또 다른 구현예에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실러스 리체노포르미스(Bacillus lichenoformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 투린지엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸리스(Bacillus subtilis) 세포, 또는 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) 세포이다. 또 다른 구현예에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르에세이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스퍼길루스 아와모리(Aspergillus awamori) 세포, 아스퍼길루스 푸미가테스(Aspergillus fumigates) 세포, 아스퍼길루스 포에티두스(Aspergillus foetidus) 세포, 아스퍼길루스 니둘란스(Aspergillus nidulans) 세포, 아스퍼길루스 니게르(Aspergillus niger) 세포, 아스퍼길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스오파쿠스(Rhodococcusopacus) 세포, 리조무코르미에헤이(Rhizomucormiehei) 세포, 또는 무코르미에헤이(Mucormichei) 세포이다. 또 다른 구현예에서, 숙주 세포는 스트렙토마이세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 구현예에서, 숙주 세포는 악티노마이세테스(Actinomycetes) 세포이다. 일부 구현예에서, 숙주 세포는 사카로마이세스 세레비시에(Saccharomyces cerevisiae) 세포이다.
또 다른 구현예에서, 숙주 세포는 진핵 식물 세포, 조류 세포, 시아노박테리움 세포, 녹색-황 세균 세포, 녹색 비-황 세균 세포, 자색 황 세균 세포, 자색 비-황 세균 세포, 극한생물 세포, 효모 세포, 진균 세포, 본원에 기재된 유기체 중의 어느 것의 조작된 세포, 또는 합성 유기체이다. 일부 구현예에서, 숙주 세포는 광-의존성이거나 탄소를 고정한다. 일부 구현예에서, 숙주 세포는 독립영양적 활성을 갖는다. 일부 구현예에서, 숙주 세포는 빛의 존재하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 일부 구현예에서, 숙주 세포는 빛의 부재하에서 종속영양적 또는 혼합영양적이다. 특정 구현예에서, 상기 숙주 세포는 아라비돕시스 탈리아나, 파니쿰 비르가툼, 미스칸투스 기간테우스, 옥수수, 보트라이오코쿠스에 브라우니, 클라마이도모나스 레인하르트이, 두날리엘라 살리나, 사이네초코쿠스 종PCC 7002, 사이네초코쿠스 종PCC 7942, 시네코시스티스 종PCC 6803, 테르모사이네초코쿠스 엘론가테스 BP1, 클로로비움 테피덤, 클로로플렉수스 아우란티쿠스, 크로마티움 비노섬, 로도스피릴룸 루브럼, 로도박터 캅설라투스, 도로슈도모나스 팔루스리스, 클로스트리듐 륭달리, 클로스트리듐 써모셀룸, 펜니실리움 크리소게넘, 피키아패스토리스, 사카로마이세스 세레비지애, 쉬조사카로마이세스 폼베, 슈도모나스 플루오레스센스, 또는 자이모모나스 모빌리스에서 유래된 세포이다. 일 구현예에서, 상기 미생물 세포는 시아노박테리아, 예컨대 비제한적으로, 프로클로로코쿠스, 사이네초코쿠스, 시네코시스티스, 시아노테케, 및 노스톡 푼크티포르메에서 유래된 것이다. 또 다른 구현예에서, 상기 미생물 세포는 특정 시아노박테리아 종, 예컨대, 비제한적으로, 사이네초코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 사이네초코쿠스 종 PCC7001에서 유래된 것이다.
발현 벡터
일부 구현예에서, 폴리뉴클레오티드(또는 유전자) 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한 재조합 벡터에 의해 숙주 세포에 제공된다. 특정 구현예에서, 프로모터는 발달적으로-조절된 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적 프로모터, 또는 세포-특이적 프로모터이다. 일부 구현예에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택된 적어도 하나의 서열을 포함한다. 본원에 기재된 발현 벡터는 숙주 세포에서 폴리뉴클레오티드 서열의 발현에 적합한 형태로 폴리뉴클레오티드 서열을 포함한다. 발현 벡터의 설계는 형질전환되는 숙주 세포의 선택, 목적하는 폴리펩티드의 발현 수준 등과 같은 인자들에 따라 좌우될 수 있다는 것은 당업계의 숙련가들에 의해 인지될 것이다. 본원에 기재된 발현 벡터는 본원에 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 암호화되는 융합 폴리펩티드를 포함한 폴리펩티드를 생산하기 위해 숙주 세포에 도입될 수 있다(상기). 원핵생물, 예를 들면, 대장균에서 폴리펩티드를 암호화하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행된다. 융합 벡터는 그 안에 암호화된 폴리펩티드에, 통상적으로 재조합 폴리펩티드의 아미노- 또는 카복시-말단에 다수의 아미노산을 부가한다. 이러한 융합 벡터는 전형적으로 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키고; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것을 포함한 상기 세 가지 목적들 중의 하나 이상을 제공한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이러한 효소, 및 이들의 동족 인식 서열(cognate recognition sequence)의 예는 Xa 인자, 트롬빈 및 엔테로키나제를 포함한다. 예시적인 융합 발현 벡터는 pGEX 벡터(Pharmacia Biotech, Inc., Piscataway, NJ; Smith et al. (1988) Gene 67:31-40), pMAL 벡터(New England Biolabs, Beverly, MA), 및 pRITS 벡터(Pharmacia Biotech, Inc., Piscataway, N. J.)를 포함하고, 이들은 각각 글루타티온 S-전달효소(GST), 말토오스 E 결합 단백질, 또는 단백질 A를 상기 표적 재조합 폴리펩티드에 융합시킨다.
유도성, 비-융합 대장균 발현 벡터의 예는 하기를 포함한다: pTrc 벡터(Amann et al. (1988) Gene 69:301-315) 및 pET 11d 벡터 (Studier et al. , Gene Expression Technology:Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990) 60-89). pTrc 벡터로부터의 표적 유전자 발현은 하이브리드 trp-lac 융합 프로모터로부터의 숙주 RNA 폴리머라제 전사에 의존한다. pET 11d 벡터로부터의 표적 유전자 발현은 공동발현되는 바이러스성 RNA 폴리머라제(T7 gn1)에 의해 매개되는 T7 gn10-lac 융합 프로모터로부터의 전사에 의존한다. 이러한 바이러스성 폴리머라제는 lacUV 5 프로모터의 전사 조절하에서 T7 gn1 유전자를 보유하는 내재성 λ 프로파지(resident λ prophage)로부터 BL21(DE3) 또는 HMS174(DE3)와 같은 숙주 균주들에 의해 공급된다. 원핵 및 진핵 세포 모두를 위한 다른 적합한 발현 시스템은 당해 분야에서 잘 알려져 있다 (참고: 예컨대, Sambrook et al. (1989) Molecular Cloning:A Laboratory Manual, second edition, Cold Spring Harbor Laboratory). 유도성, 비-융합 대장균 발현 벡터의 예는 하기를 포함한다: pTrc 벡터(Amann et al. (1988) Gene 69:301-315) 및 PET 11d 벡터 (Studier et al. (1990) Gene Expression Technology:Methods in Enzymology 185, Academic Press, San Diego, CA, pp. 60-89). 특정 구현예에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도되는 프로모터에 작동가능하게 연결된다. 하나의 구현예에서, 숙주 세포는 효모 세포이다. 이러한 구현예에서, 발현 벡터 효모 발현 벡터이다. 벡터는 외래(foreign) 핵산(예컨대, DNA)을 숙주 세포 내로 도입하기 위한 당업계에서 인정되는 다양한 기술들을 통해 원핵 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염시키는 적절한 방법은, 예를 들면, 하기에서 찾아볼 수 있다: Sambrook et al. (상기). 박테리아 세포의 안정적인 형질전환을 위하여, (사용되는 발현 벡터 및 형질전환 기술에 따라) 세포의 특정 부분이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이러한 형질전환체를 식별하고 선택하기 위하여, 선택가능한 마커(예컨대, 항생제에 대한 내성)를 암호화하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선택가능한 마커는 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같지만 이로 제한되지 않는 약물에 대한 내성을 제공하는 것들을 포함한다. 선택가능한 마커를 암호화하는 핵산은 본원에 기재된 폴리펩티드를 암호화하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에서 도입될 수 있다.
선택적인 경로 조작
본 발명의 숙주 세포 또는 미생물은 효소 활성에 대한 특정 돌연변이의 효율성을 시험하기 위해 변경들을 함유하도록 유전적으로 조작되거나 변형된 숙주 균주 또는 숙주 세포(즉, 재조합 세포 또는 미생물)를 포함한다. 다양한 선택적인 유전적 조정 및 변경이, 어떤 천연 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 숙주 세포로 상호교환가능하게 사용될 수 있다. 하나의 구현예에서, 숙주 균주는 다른 생합성 폴리펩티드(예컨대, 효소)와 조합하여 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현을 시험하는데 사용될 수 있다. 숙주 균주는, 발효 성분, 탄소 공급원(예컨대, 공급원료), 온도, 압력, 감소된 배양 오염 조건, 및 산소 수준을 포함한 배양 조건들을 포함하지만 이로 제한되지 않는 특정 변수들을 시험하기 위해 다수의 유전적 변경을 포함할 수 있다.
하나의 구현예에서, 숙주 균주는 선택적인 fadE 및 fhuA 결실을 포함한다. 아실-CoA 데하이드로게나제(FadE)는 지방산을 대사시키는데 중요한 효소이다. 이것은 지방산 이용에서 두 번째 단계(베타-산화)를 촉매하며, 이것은 지방산의 장쇄(아실-CoA)를 아세틸-CoA 분자로 분해시키는 공정이다. 보다 구체적으로, 박테리아에서 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이것은 FadE에 의해 촉매된다. 대장균에 FadE가 없는 경우, 이것은 탄소 공급원으로서 지방산에서 성장할 수 없지만, 아세테이트에서는 성장할 수 있다. 선택적인 쇄 길이의 지방산을 이용하는 불가능성(inability)은 fadE 균주, 즉 FadE 기능이 파괴되는 fadE 돌연변이 균주의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 지방산 유도체 경로에서 중간체일 수 있는 아실-CoA가 세포에 누적될 수 있도록 보장하여 모든 아실-CoA가 지방산 유도체로 효율적으로 전환될 수 있도록 한다. 그러나, fadE 감쇠는 당이 탄소 공급원으로서 사용될 경우에 선택적인데, 그 이유는 이러한 조건하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며 아실-CoA 기질에 대해 에스테르 신타제 또는 다른 효소과 효율적으로 경쟁할 수 없기 때문이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들은 지방산보다 당의 소모를 선호하므로, 두 공급원이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 먼저 소모된다(참고: D. Clark, J Bacteriol. (1981) 148(2):521-6)). 게다가, 당의 부재 및 지방산의 존재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질이 상향-조절되고 아실-CoA에 대해 효율적으로 경쟁할 것이기 때문에, 아실-CoA 중간체가 베타 산화 경로에 대해 손실될 수 있다. 따라서, fadE 유전자가 녹아웃되거나 감쇠되는 것이 유리할 수 있다. 대부분의 탄소 공급원들이 주로 당을 기본으로 하기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 암호화하며, 이것은 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다(V. Braun (2009) J Bacteriol . 191(11):3431-3436). 이의 결실은 선택적이다. fhuA 결실은 세포로 하여금 특정 발효 조건에 유리할 수 있는 파지 공격(phage attack)에 대해 더 저항성있게 한다. 따라서, 발효 진행 동안 잠재적 오염을 겪기 쉬운 숙주 세포에서 fhuA를 결실시키는 것이 바람직할 수 있다.
또 다른 구현예에서, 숙주 균주(상기)는 또한 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함하는 유전자들 중의 하나 이상의 선택적인 과발현을 포함한다. 이러한 유전자의 예는 에스케리치아 콜라이로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 지방산 생합성에서의 조절제 및 효소를 암호화하는 이러한 유전자들 중 하나 이상의 과발현은 다양한 배양 조건하에서 ω-OH 지방산 및 이의 유도체를 포함하는 지방산 유도체 화합물의 역가를 증가시키는 역할을 할 수 있다.
또 다른 구현예에서, 대장균 균주가 ω-OH 지방산 및 이의 유도체의 생산을 위한 숙주 세포로서 사용된다. 유사하게, 이들 숙주 세포는 fadR, fabA, fabD, fabG, fabH, fabV 및/또는 fabF를 포함하지만 이에 제한되지 않는 다양한 배양 조건하에서 지방산 유도체(예컨대, ω-OH 지방산 및 α,ω-이산 등)와 같은 지방산 유도체 화합물의 역가를 추가로 증가 또는 강화시킬 수 있는 하나 이상의 생합성 유전자(즉, 지방산 생합성의 조절제 및 효소를 암호화하는 유전자)의 선택적인 과발현을 제공한다. 유전적 변경의 예는 에스케리치아 콜라이로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 일부 구현예에서, 이러한 생합성 유전자를 운반하는 합성 오페론이, 다양한 배양 조건하에서 P450 발현을 시험하고/하거나 ω-OH 지방산 및 α,ω-이산 생산을 더욱 증대시키기 위해 세포에서 조작되고 발현될 수 있다. 이러한 합성 오페론은 하나 이상의 생합성 유전자를 함유한다. 조직된 오페론은, 특정 배양 조건을 시험하기 위해 지방산 유도체의 과발현을 촉진시키는데 사용될 수 있는 콜레라균으로부터의 fabV, 쥐티푸스균으로부터의 fabH, 쥐티푸스균으로부터의 fabD, 쥐티푸스균으로부터의 fabG, 쥐티푸스균으로부터의 fabA, 및/또는 클로스트리디움 아세토부틸리쿰으로부터의 fabF를 포함하는 선택적인 지방산 생합성 유전자를 함유할 수 있다. 이러한 합성 오페론의 한가지 장점은, ω-OH 지방산 유도체 생산률이 더욱 증가되거나 증대될 수 있다는 것이다.
일부 구현예에서, ACP 및 생합성 효소(예컨대, ω-하이드록실라제, 티오에스테라제 등)를 발현하는데 사용되는 숙주 세포 또는 미생물은 ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 등과 같은 하나 이상의 특정 지방산 유도체(들)에 대한 생산을 증가시킬 수 있는 특정한 효소 활성을 포함하는 유전자를 추가로 발현할 것이다. 일 구현예에서, 숙주 세포는 하기를 갖는다: 티오에스테라제 활성(E.C. 3.1.2. * 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) (유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 에스테르 신타제 활성 (E.C. 2.3.1.75) (지방 에스테르의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 및/또는 알코올 탈수소효소 활성 (E.C. 1.1.1.1.) 및/또는 지방 알코올 아실-CoA 환원효소 (FAR) (E.C. 1.1.1.*) 활성 및/또는 카르복실산 환원효소 (CAR) (EC1.2.99.6) 활성 (지방 알코올의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 (지방 알데하이드의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 및 데카르보닐라제 (ADC) 활성 (알칸 및 알켄의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-CoA 환원효소 (E.C. 1.2.1.50) 활성, 아실-CoA 신타제 (FadD) (E.C. 2.3.1.86) 활성, 및 티오에스테라제 (E.C. 3.1.2. * 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 (지방 알코올의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 에스테르 신타제 활성 (E.C. 2.3.1.75), 아실-CoA 신타제 (FadD) (E.C. 2.3.1.86) 활성, 및 티오에스테라제 (E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 (지방 에스테르의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 케톤의 생산을 위해 OleA 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 내부 올레핀의 생산을 위해 OleBCD 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 및 알코올 탈수소효소 활성 (E.C. 1.1.1.1) (지방 알코올의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 티오에스테라제 (E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 데카르복실라제 활성 (말단 올레핀의 제조를 위해). 미생물 및 미생물 세포에서의 효소 활성의 발현은 미국 특허 제8,097,439호; 제8,110,093호; 제8,110,670호; 제8,183,028호; 제8,268,599호; 제8,283,143호; 제8,232,924호; 제8,372,610호; 및 제8,530,221호에 의해 교시되어 있으며, 이들은 본원에 참고로 포함되어 있다. 또 다른 구현예에서, ACP 및 다른 생합성 효소를 발현하는데 사용되는 숙주 세포 또는 미생물은 ω-OH 지방산, ω-OH 지방산 유도체, 및 α,ω-이산과 같은 하나 이상의 특정 지방산 유도체(들)를 생산하기 위해 상향조절되거나 과발현된 특정 원래의 효소 활성을 포함할 것이다. 일 구현예에서, 숙주 세포는 하기를 갖는다: 천연 티오에스테라제 (E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 (티오에스테라제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생산을 위해).
본 발명은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 및 다른 생합성 효소를 암호화하는 유전자를 발현하는 숙주 균주 또는 미생물을 포함한다(상기). 재조합 숙주 세포는 지방산 유도체, 예를 들면, ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 및 이의 조성물 및 배합물을 생산한다. 지방산 유도체는 전형적으로 배양 배지로부터 회수되고/되거나 숙주 세포로부터 단리된다. 하나의 구현예에서, 지방산 유도체는 배양 배지로부터 회수된다(세포외). 또 다른 구현예에서, 지방산 유도체는 숙주 세포로부터 단리된다(세포내). 또 다른 구현예에서, 지방산 유도체는 배양 배지로부터 회수되고 숙주 세포로부터 단리된다. 숙주 세포에 의해 생산된 지방산 유도체 또는 조성물은 특정 지방산 유도체의 분포 뿐만 아니라 ω-OH 지방산 유도체, 예를 들면, ω-OH 지방산, ω-OH 지방 에스테르, α,ω-이산 등의 성분의 쇄 길이 및 포화도를 결정하기 위해 당업계에 공지된 방법, 예를 들면, GC-FID를 사용하여 분석될 수 있다.
배양 및 발효
본원에서 사용되는 용어 발효는 광범위하게는 숙주 세포에 의한 표적 물질로의 유기 물질의 전환, 예를 들면, 탄소 공급원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 전파함으로써 ω-OH 지방산 또는 이의 유도체로의 재조합 숙주 세포에 의한 탄소 공급원의 전환을 나타낸다. 생산을 위해 허용되는 조건은 숙주 세포가 ω-OH 지방산과 같은 목적하는 생성물을 생산하도록 하는 선택적인 조건을 나타낸다. 유사하게, 벡터의 폴리뉴클레오티드 서열이 발현되는 조건 또는 조건들은 숙주 세포가 폴리펩티드를 합성할 수 있도록 하는 선택적인 조건을 의미한다. 적합한 조건은, 예를 들면, 발효 조건을 포함한다. 발효 조건은 온도 범위, 통기 수준, 공급 속도 및 배지 조성을 포함하지만 이에 제한되지 않는 다수의 파라미터를 포함할 수 있다. 이러한 조건들의 각각은, 개별적으로 및 조합하여, 숙주 세포가 자랄 수 있게 한다. 발효는 호기성, 혐기성, 또는 이의 변동(예를 들면 미호기성)일 수 있다. 예시적인 배양 배지는 브로스 또는 겔을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접 대사될 수 있는 탄소 공급원을 포함한다. 또한, 효소는 동원(예컨대, 발효성 당으로의 전분 또는 셀룰로스의 해중합) 및 후속적인 탄소 공급원의 대사를 촉진시키기 위해 배지에서 사용될 수 있다.
소규모 생산을 위해, 조직된 숙주 세포를, 예를 들면, 약 100㎕, 200㎕, 300㎕, 400㎕, 500㎕, 1mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L, 또는 10 L의 배치에서 성장시키고; 발효시키며; 유도시켜 목적하는 폴리뉴클레오티드 서열, 예를 들면, P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 발현할 수 있다. 대규모 생산을 위해, 조작된 숙주 세포를 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L, 및 1,000,000 L 또는 그 이상의 배치에서 성장시키고; 발효시키며; 유도시켜 목적하는 폴리뉴클레오티드 서열을 발현할 수 있다. 대안적으로, 대규모 공급-배치 발효가 수행될 수 있다. 본원에 기재된 바와 같은 ω-OH 지방산, 이의 유도체 및 조성물은 재조합 숙주 세포 배양물의 세포외 환경에서 발견되며, 배양 배지로부터 쉽게 단리될 수 있다. ω-OH 지방산 또는 이의 유도체는 재조합 숙주 세포에 의해 분비되고, 세포외 환경으로 운반되거나 또는 재조합 숙주 세포 배양물의 세포외 환경으로 수동적으로 운반될 수 있다. ω-OH 지방산 또는 이의 유도체는 당업계에 공지된 일상적인 방법을 사용하여 재조합 숙주 세포 배양물로부터 단리된다.
재조합 숙주 세포로부터 유도되는 생성물
본원에서 사용되는 바와 같이, 모뎀 탄소 또는 fM의 분율은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 물질(SRMs4990B 및 4990C)에 의해 정의된 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 14C/12C 동위원소 비 HOxI의 0. 95배와 관련된다. 이것은 붕괴-보정 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 대략 1. 1이다. 바이오생성물(예컨대, 본 발명에 따라 생산된 ω-OH 지방산 및 유도체를 포함하는 지방산 유도체)은 생물학적으로 생산된 유기 화합물을 포함한다. 특히, 본원의 지방산 생합성 경로를 이용하여 생산된 지방산 유도체(예컨대, ω-OH 지방산 및 이의 유도체)는 재생가능한 공급원으로부터 생산되지 않았으며, 이를테면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유도되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예컨대, 글루코스 vs. 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예컨대, 미국 특허 제7,169,588호 참조). 석유 기반 유기 화합물로부터 바이오생성물을 구별하는 능력은 상업적으로 이러한 물질들을 추적하는데 유익하다. 예를 들면, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 다를 포함하는 유기 화합물 또는 화학물질은 석유 기반 물질만으로 만들어진 유기 화합물 및 화학물질과는 구별될 수 있다. 따라서, 본원의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플에서 안정적인 탄소 동위원소 비(13C/12C)를 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물에서 13C/12C 비는 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 13C/12C 비의 결과이다. 이것은 또한 정확한 대사 경로를 반영한다. 국부적인 변이가 또한 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 13C/12C 및 상응하는 δ13C 값에서 상당한 차이를 나타낸다. 또한, C3 및 C4 식물의 지질 물질은 대사 경로의 결과로서 동일한 식물의 탄수화물 성분으로부터 유도된 물질과 상이하게 분석한다. 측정의 정확도 내에서, 13C은 동위원소 분별 효과(fractionation effect)로 인하여 큰 변화를 나타내며, 바이오생성물에 대한 이의 가장 중요한 점은 광합성 메카니즘이다. 식물에서의 탄소 동위원소 비에 있어서의 차이의 주요 원인은 식물에서의 광합성 탄소 대사의 경로, 특히 1차 카복실화(즉, 대기 CO2의 초기 고정) 동안 일어나는 반응에 있어서의 차이와 밀접하게 관련된다. 식생(vegetation)의 크게 두 가지 부류는 C3[또는 캘빈-벤슨(Calvin-Benson)] 광합성 사이클을 병합하는 것 및 C4[또는 해치-슬랙(Hatch-Slack)] 광합성 사이클을 병합하는 것이다. C3 식물에서, 1차 CO2 고정 또는 카복실화 반응은 효소인 리불로스-1,5-디포스페이트 카복실라제를 수반하며, 첫번째 안정적인 생성물은 3-탄소 화합물이다. 경목(hardwood) 및 침엽수와 같은 C3 식물은 온대 기후 지역에서 우세하다. C4 식물에서, 또 다른 효소인 포스포엔올-피루베이트 카복실라제를 수반하는 부가적인 카복실화 반응이 1차 카복실화 반응이다. 첫번째 안정적인 탄소 화합물은 이후에 탈카복실화되는 4-탄소산(carbon acid)이다. 이렇게 하여 방출된 CO2 는 C3 사이클에 의해 재고정된다. C4 식물의 예는 열대형 목초들, 옥수수, 및 사탕수수이다. C4 및 C3 식물 둘 다는 광범위한 13C/12C 동위원소 비를 나타내지만, 전형적인 값은 C4 식물에 대해 약 -7 내지 약 -13 per mil이고, C3 식물에 대해 약 -19 내지 약 -27 per mil이다(예컨대, 문헌 참조; Stuiver et al. (1977) Radiocarbon 19:355). 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다. 13C 측정 척도는 본래 PDB(Pee Dee Belemnite) 석회암에 의해 제로 세트(zero set)로 정의되며, 여기서 값은 이 재료로부터 천분율(parts per thousand) 편차로 주어진다. δ13C 값은 천분율(퍼밀), 약어로는 ‰로 표현되고, 아래와 같이 계산된다:
δ13C (‰) = [(13C/12C) 샘플- (13C/12C) 표준]/ (13C/12C) 표준 × 1000
PDB 표준 물질(RM)이 고갈되었기 때문에, 일련의 대안적인 RM이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차(per mil deviation)에 대한 표기는 δ13C이다. PDB에서 1/1000(per mil) 편차에 대한 표기법은 δ13C이다. 덩어리(masses) 44, 45 및 46의 분자 이온에 대한 높은 정확성 안정적 비 질량 분광분석법(IRMS)에 의해 CO2 에 대한 측정이 이루어진다. 본원에 기재된 조성물은, 예를 들면, 지방산 유도체 생성물을 포함한, 본원에 기재된 방법들 중 어느 하나에 의해 생산된 바이오생성물을 포함한다. 구체적으로, 바이오생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ13C를 가질 수 있다. 예를 들면, 바이오생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ13C를 가질 수 있다. 또 다른 경우에, 바이오생성물은 약 -10, -11, -12, 또는 -12. 3의 δ13C를 가질 수 있다. 본 방법에 따라 생산된 바이오생성물은 또한 각 화합물에서 14C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 14C는 핵 반감기가 5730년이기 때문에, 더 오래된 탄소를 함유하는 석유 기반 연료는 좀 더 새로운 탄소를 함유한 바이오생성물과 구별될 수 있다(참고: 예컨대, Currie, Source Apportionment of Atmospheric Particles, Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds. , 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series (Lewis Publishers, Inc.) 3-74, (1992)). 방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 14C 농도의 항상성은 살아있는 유기체에서 14C의 항상성을 유도한다는 것이다. 그러나, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, 14C는 제2의, 지구화학적인 시간 특성을 얻었다. 대기 CO2 중에서 및 이에 따라 생물권(living biosphere) 중에서의 이의 농도는 1960년대 중반의 핵실험 피크에서 거의 배가되었다. 이후, 약 1.2 x 10- 12 의 정상-상태 우주기원(steady-state cosmogenic)(대기) 기준 동위원소 비(14C /12C)로 점진적으로 복귀되었으며, 대략적인 이완 "반-감기"(approximate relaxation "half-life")는 7년 내지 10년이었다. 이 후자의 반감기가 문자 그대로 받아들여져야 하는 것은 아니며; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 14C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 14C 시간 특성이다. 14C는 가속제 질량 분광분석법(AMS)에 의해 측정될 수 있고, 그 결과는 현대의 탄소(fM)의 단위로 주어진다. fM은 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된다. 본원에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 14C/12C 동위원소 비 HOxI의 0.95배와 관련된다. 이것은 붕괴-보정 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 대략 1.1이다. 본원에 기재된 조성물은 적어도 약 1의 fM14C를 가질 수 있는 바이오생성물을 포함한다. 예를 들면, 본 발명의 바이오생성물은 적어도 약 1.01의 fM14C, 약 1 내지 약 1.5의 fM14C, 약 1.04 내지 약 1.18의 fM14C, 또는 약 1.111 내지 약 1.124의 fM14C를 가질 수 있다.
14C의 또 다른 척도는 현대 탄소 백분율 (percent of modern carbon; pMC)로 알려져 있다. 14C 연대를 이용하는 고고학자 또는 지질학자의 경우, AD 1950년은 0의 해(zero years old)와 같다. 이것은 또한 100 pMC를 나타낸다. 대기 중의 핵무기 탄소(bomb carbon)는 열-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 비슷해졌으며, 이는 AD 1950년 이후로 살아있는 식물 및 동물에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이것은 시간 경과에 따라 점차 감소하였으며, 오늘날의 값은 107.5 pMC 부근이다. 이것은 옥수수와 같은 신선한 바이오매스 물질이 107.5 pMC 부근의 14C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유발할 것이다. 107.5 pMC가 오늘날의 바이오매스 물질의 14C 함량을 나타내고 0 pMC가 석유 기반 생성물의 14C 함량을 나타낸다고 가정함으로써, 그 물질에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들면, 오늘날의 대두로부터 100% 유도된 물질은 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 물질이 석유 기반 생성물로 50% 희석되었다면, 이는 대략 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 100%를 107.5 pMC와 같다고 하고 0%를 0 pMC와 같다고 할당함으로써 유도된다. 예를 들면, 99 pMC로 측정된 샘플은 93%의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값을 평균 생물학적 기반 탄소 결과라고 하며, 오늘날의 생물학적 물질 또는 석유 기반 물질 중 어느 하나로부터 비롯된 분석된 물질 내의 모든 성분을 추정한다. 본원에 기재된 바와 같은 하나 이상의 지방산 유도체를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 또 다른 경우에, 본원에 기재된 지방산 유도체는 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본원에 기재된 지방산 유도체는 약 90, 91, 92, 93, 94, 또는 94. 2의 pMC를 가질 수 있다.
실시예
다음의 구체적인 실시예들은 본 발명을 예시하기 위한 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다.
프로토콜 및 방법
라이브러리 스크리닝
본원에 기재된 모든 프로토콜은 배양물을 성장시키기 위한 96 웰 플레이트-마스터 블럭-2mL 시스템(Greiner Bio-One, Monroe, NC 또는 Corning, Amsterdam, The Netherlands), 및 배양 브로스로부터 지방산 화학종을 추출하기 위한 플레이트(Costar, Inc.)에 의존한다. 아래에 제공된 프로토콜들은 발효 조건의 예들이다. 대안적인 프로토콜이 지방산 화학종 생산을 평가하는데 사용될 수 있다.
32 o C Plim 배양 프로토콜
(96 웰 플레이트에서 성장하는 LB 배양물로부터의) 30㎕ LB 배양물을 사용하여 290㎕ Plim 배지(표 2)에 접종하였으며, 그후 이를 32℃에서 진탕시키면서 대략 16시간 동안 항온처리하였다. 밤샘 시드(overnight seed) 40㎕를 사용하여 360㎕ Plim 배지에 접종하였다. 2시간 동안 32 ℃에서 성장시킨 후, 배양물을 IPTG(최종 농도 1 mM)로 유도하였다(아래 표 3). 그후, 달리 주지되지 않는다면 20시간 동안 진탕시키면서 32 ℃에서 배양물을 항온처리하고, 그후 이들을 아래에 상세된 표준 추출 프로토콜에 따라 추출하였다.
35 o C Nlim 배양 프로토콜
(96 웰 플레이트에서 성장하는 LB 배양물로부터의) 40㎕ LB 배양물을 사용하여 360㎕ LB 배지(아래 표 3)에 접종하였으며, 그후 이를 32℃에서 진탕시키면서 대략 4시간 동안 항온처리하였다. LB 시드 40㎕를 사용하여 360㎕ Nlim 배지에 접종하였다. 32℃에서 2시간 동안 35℃에서 성장시킨 후, 배양물을 IPTG(최종 농도 1 mM)로 유도하였다(아래 표 3). 그후, 달리 주지되지 않는다면 20시간 동안 진탕시키면서 35℃에서 배양물을 항온처리하고, 그후 이들을 아래에 상세된 표준 추출 프로토콜에 따라 추출하였다.
표 3: 배지 명칭 및 제형
지방산 화학종 표준 추출 프로토콜
추출되어지는 각 웰에 80㎕의 1M HCl에 이어 400㎕의 부틸 아세테이트(내부 표준으로서 500mg/L 펜타데칸올을 가짐)를 가하였다. 그후, 96 웰 플레이트를 플레이트 밀봉기(ALPS-300 히터; Abgene, ThermoScientific, Rockford, IL)를 사용하여 가열-밀봉하고, MIXMATE 혼합기(Eppendorf, Hamburg, Germany)를 사용하여 2000rpm에서 15분 동안 진탕시켰다. 진탕시킨 후, 플레이트를 실온에서 4500rpm에서 10분 동안 원심분리하여(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA) 수성 층과 유기 층을 분리하였다. 100㎕의 유기 층을 96 웰 플레이트(폴리프로필렌, Corning, Amsterdam, The Netherlands)로 옮기고 100uL의 BSTFA로 유도체화하였다. 후속적으로 플레이트를 가열 밀봉하고, w-OH FFA 방법을 사용하여 GC-FID에 의해 평가할 때까지 -20℃에서 저장하였으며, 상기 방법은 다음과 같이 수행하였다:1㎕의 샘플을 1-20 스플릿을 지닌 불꽃 이온화 검출기(FID)를 갖는 Agilent 7890A GC Ultra 장치(Agilent, Santa Clara, CA)에서 분석 컬럼(DB-1, 10m×180㎛×0. 2㎛ 필름 두께, JW 121-101A로부터 이용가능함)에 주입하였다. C10 내지 C18 지방산 및 ω-하이드록실화 지방산을 검출하고 정량하도록 기기를 설정하였다. 상기에 상세된 프로토콜은 표준 조건을 나타내며, 이것은분석 결과를 최적화하기 위해 필요에 따라 변경될 수 있다.
오류 유발 라이브러리 구축
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 오류 유발 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 미스매치된 뉴클레오티드의 삽입을 유리하게 하는 조건하에서 DNA 주형으로부터 PCR 증폭에 의해 생성되었다. 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc., Mountain View, CA)을 사용하여 수행하였다.
포화 라이브러리 구축
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 변성 프라이머(degenerate primer)를 사용하여 생성되었다. 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc., Mountain View, CA)을 사용하여 수행하였다.
조합 라이브러리 구축
유익한 것으로 확인된 돌연변이들을 조합하여 ω-OH 지방산 유도체 화학종의 생산에 있어서 추가의 개선을 갖는 CYP153-환원효소 하이브리드 융합 폴리펩티드 변이체(예컨대, 하이브리드 CYP153A-RedRhF 단백질 변이체)를 제공하였다. 당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 조합 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 목적하는 돌연변이를 도입하기 위해 프라이머를 사용하여 생성되었다. 상기한 바와 같이, 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc. , Mountain View, CA)을 사용하여 수행하였다. 조합 라이브러리는 전달 PCR(tPCR) 프로토콜을 사용하여 생성될 수 있다(Erijman et al. (2011) J. Structural Bio. 175:171-177).
라이브러리 스크리닝
일단 라이브러리 다양성이 오류-유발, 포화 라이브러리 또는 조합 라이브러리에서 생성되었다면, 이것을 상기한 방법들 중의 하나를 사용하여 스크링하였다. 두 가지 유형의 히트(hit)를 확인하였다: (1) 증가된 양의 ω-하이드록시 지방산(ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환. 각 히트 내의 하이브리드 cyp153A-RedRhF 단백질 변이체에서의 돌연변이는 당업계의 숙련가들에 의해 이용되는 표준 기술들을 사용하여 서열화함으로써 확인하였다. 아래 표 5, 6 및 7은 포화 라이브러리에서 유익한 것으로 확인된 돌연변이(히트)를 열거한다.
실시예 1:라이브러리 스크리닝을 위한 균주 및 플라스미드 작제
당해 실시예는 포화 또는 조합 돌연변이유발 라이브러리 스크리닝을 위해 작제된 균주 및 플라스미드를 설명한다.
마리노박터 아쿠아에올리에서 유래된 CYP153A(G307A) P450 촉매적 단백질과, 로도코쿠스 종에서 유래된 P450RhF의 c-말단 FMN- 및 Fe/S-함유 환원효소 도메인으로 제조된 하이브리드-융합 단백질에 대한 유전자 암호화 NCIMB9784는 하기와 같이 생성된다: cyp165A(G307A)_Maqu 유전자를 게놈 DNA에서 증폭시키고, 교차혼합(cross-over) PCR에 의해 코돈-최적화된 합성 P450RhF 환원효소 도메인과 융합시켰다. 생성된 융합 유전자(서열 번호: 5)를 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 pACYC-유도체(즉, p15A 복제단위, 카나마이신 내성 마커)로 클로닝하였다. 플라스미드를 pEP125라고 명명하였다(표 4 참조, 하기).
하이브리드 cyp153A(G307A)-Red450RhF 융합 단백질을 암호화하는 유전자를 또한 pEP125로부터 증폭시키고 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 pCL1920-유도체 벡터(SC101 복제단위, 스펙티노마이신 내성 마커)로 클로닝하였으며, 이것은 식물 티오에스테라제(fatB1), 3-케토-아실-ACP 신타제의 변이체(fabB) 및 전사 조절인자(fadR)를 암호화하는 유전자와 오페론을 형성하였다. 플라스미드를 pLC81이라고 명명하였다(표 4 참조, 하기).
추가의 플라스미드를 다음과 같이 생성하였다: 움벨룰라리아 칼리포르니카(Umbellularia californica)로부터의 식물 티오에스테라제(fatB1)를 암호화하는 유전자를 코돈-최적화된 DNA로서 합성하고, pCL1920-유도체 벡터(SC101 복제단위, 스펙티노마이신 내성 마커)로 클로닝하여, 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 하며, 이것은 아세틸-CoA 카복실라제(accDACB), 비오틴 리가제(birA) 및 아실-운반 단백질을 암호화하는 오페론을 형성하였다. 플라스미드를 pNH305라고 명명하였다(표 4 참조, 하기). 플라스미드 pAS033은 pNH305에서 fatB1을 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 코돈-최적화된 합성 식물 티오에스테라제(fatA3)로 대체함으로써 생성하였다(표 4 참조, 하기). 플라스미드 pEP146은 pLC81에서 fatB1을 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 코돈-최적화된 합성 식물 티오에스테라제(fatA3)로 대체함으로써 생성하였다(표 4 참조, 하기). pEP146은 또한 플라스미드 암호화된 repA 단백질에서 돌연변이를 운반하였다.
플라스미드 형질전환을 위해 사용되는 기본 균주는 GLP077 및 BZ128이었다. 간략하게, 기본 균주 GLPH077의 게놈은 다음과 같이 조작하였다: 아실-CoA 데하이드로게나제(fadE) 유전자를 결실시키고, 전사 조절인자(fadR) 및 합성 지방산 생합성 오페론을 과발현시켰다. 간략하게, 기본 균주 BZ128의 게놈은 다음과 같이 조작하였다: fadE(아실-CoA 데하이드로게나제) 유전자를 결실시키고, 합성 지방산 생합성 오페론, β-하이드록시 지방 아실-ACP 데하이드라타제(fabZ) 및 티오에스테라제의 변이체(tesA)를 과발현시켰다. 또한, 균주를 미리 트랜스포존 뿐만 아니라 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝에 적용시켰다.
표 4:라이브러리 스크리닝을 위해 사용된 플라스미드
하이브리드 cyp153A(G307A)-Red450RhF 융합 단백질을 숙주 세포에서의 발현이 ω-OH 지방산 유도체를 생산할 수 있는지 여부를 알아보기 위해 시험하였다. 서열 번호: 를 발현하는 미생물은 5, 글루코스로부터 1 g/L 초과의 ω-OH 지방산 유도체를 생산할 수 있었다. 따라서, 이러한 조작된 효소를 추가의 진화 연구를 위해 선택하였다.
실시예 2: cyp153A ( G307A )- Red450RhF 융합 단백질의 P450 촉매 도메인의 포화 라이브러리
cyp153A-Red450RhF 융합 단백질의 P450 촉매 도메인의 전체 포화 라이브러리를 구축하고, cyp153A(G307A)-Red450RhF(즉, 주형 폴리펩티드)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다. G307A(즉, 위치 307에서 알라닌 잔기가 글리신으로 대체됨)는 cyp153A의 ω-하이드록실라제 활성을 개선시키는 유익한 돌연변이이다(참고: Honda Malca et al. (2012) Chem. Commun. 48:5115). 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산(ωOH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 플라스미드 pEP125 및 pLC81(상기 표 4 참조)을 사용하여 전체 포화 라이브러리를 만들었다. 세 가지 포화 라이브러리를 스크리닝하였다: 첫번째 라이브러리를 위해 pEP125를 pNH305와 함께 균주 GLPH077로 형질전환시키고, 두번째 라이브러리를 위해 pLC81을 BZ128로 형질전환시키고, 세번째 라이브러리를 위해 pEP125를 pAS. 033과 함께 GLPH077 균주로 형질전환시켰다. 첫번째 및 두번째 라이브러리를 특히 ω-하이드록시 도데칸산 형성에서 개선된 변이체에 대해 스크리닝하고 세번째 라이브러리를 특히 ω-하이드록시 헥사데센산 형성에 있어서 개선된 변이체에 대해 스크리닝하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝시켰다. 개선된 변이체들이 아래 표 5 내지 7에 도시된다(하기). 특히, 위치 141의 변이체가 다수회 식별되었으며, ω-하이드록시 도데칸산 및 ω-하이드록시 헥사데센산 형성 둘 다에 대해 상당히 개선된 효소인 것으로 밝혀졌다.
표 5: cyp153A(G307A)-Red450RhF의 촉매 도메인의 첫번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
표 6: cyp153A(G307A)-Red450RhF의 촉매 도메인의 두번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
표 7: cyp153A(G307A)-Red450RhF의 촉매 도메인의 세번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
실시예 3: cyp153A ( G307A )- Red450RhF 융합 단백질의 환원효소 도메인의 부분 부위 포화 라이브러리
하이브리드 cyp153A-Red450RhF 융합 단백질의 환원효소 도메인의 부분적인 포화 라이브러리(열 번째 아미노산마다 돌연변이됨)를 구축하였고, 촉매적 P450 cyp153A 도메인의 위치 포화 돌연변이유발 라이브러리에서 확인된 변이체인 cyp153A(V141I, A231T, G307A)-Red450RhF (서열 번호: 32)에 대한 개선을 보였던 변이체에 대해 선별하였다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 라이브러리를 위해, cyp153A(V141I, A231T, G307A)-Red450RhF를 갖는 pLC81을 BZ128로 형질전환시켰다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 표 8에 도시된다. 특히, 변이체 A796V (서열 번호: 42) 및 P666A는 유의미하게 개선된 효소였다.
표 8: cyp153A(V141I A231T G307A)-Red450RhF의 환원효소 도메인의 부분 포화 라이브러리로부터의 개선된 변이체의 요약
실시예 4: cyp153A ( G307A )- Red450RhF 융합 단백질의 환원효소 도메인의 조합 라이브러리
환원효소 도메인의 부분 포화 라이브러리(실시예 3)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기본이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산 (ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다.
조합 라이브러리를 cyp153A(V141I, A231T, G307A)-Red450RhF (서열 번호: 32)를 갖는 pLC81에서 작제하고 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 아래 표 9에 도시된다.
표 9: cyp153A(V141I, A231T, G307A)-Red450RhF의 환원효소 도메인의 조합 라이브러리로부터의 개선된 변이체의 요약
실시예 5: cyp153A ( G307A )- Red450RhF 융합 단백질의 촉매성 및 환원효소 도메인의 조합 라이브러리
포화 라이브러리(실시예 2 및 3)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기본이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산 (ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다. 조합 라이브러리를 pLC81에서 작제하고 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 최선으로 개선된 두 가지 변이체가 아래 표 10에 도시된다.
표 10: cyp153A(G307A)-Red450RhF의 조합 라이브러리로부터의 최선으로 개선된 변이체
실시예 6: cyp153A ( G307A , A796V )- Red450RhF의 위치 141 및 309의 부위 포화 돌연변이유발
위치 141에서의 변화가 기질 특이성에 영향을 미쳤음을 주지하였다. 따라서, 이러한 두 개의 위치의 부위 포화 돌연변이유발을 cyp153A(G307A, A796V)-Red450RhF에서 수행하였다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 헥사데센산; 및/또는 (2) 헥사데센산에서 ω-하이드록시 헥사데센산으로의 증가된 전환이었다.
라이브러리를 위해, cyp153A(G307A A796V)-Red450RhF (서열 번호: 38)를 갖는 pEP146을 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 부위 포화 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체들이 도 2에 도시된다. 특히, V141T를 갖는 변이체 (서열 번호: 46)는 가장 높은 ω-하이드록시 헥사데센산 역가 및 헥사데센산으로부터의 가장 높은 전환을 나타내었다.
실시예 7: cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 포화 라이브러리
cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고, cyp153A(G307A)-Red450RhF(A796V)(즉, 주형 변이체, 서열 번호: 38)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다. G307A (즉, 알라닌 잔기가 위치 307에서 글리신으로 대체됨) 및 A796V (즉, 발린 잔기가 위치 796에서 알라닌으로 대체됨)가 cyp153A의 ω-하이드록실라제 활성을 개선시키는 유익한 돌연변이이다(위 참조). 히트수(hits)에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 포화 라이브러리를 제조하였다. 플라스미드 pEP302를 사용하여 pEP146(표 4 참조)의 유도체인 전체 포화 라이브러리를 만들었으며, 여기서, 유전자의 순서를 변경시키고(fatA3-fadB-fadR-cyp153A(G307A)-Red450RhF(A796V)) 마지막 유전자를 별도의 프로모터로부터 발현시켰다. 라이브러리를 균주 stNH1525로 형질전환시켰다. 간략하게, 기본 균주 stNH1525의 게놈을 다음과 같이 조작하였다: fadE (아실-CoA 데하이드로게나제) 유전자를 결실시키고, 합성 지방산 생합성 오페론을 과발현시켰다. 또한, 균주를 미리 트랜스포존 뿐만 아니라 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝에 적용시켰다.
라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝시켰다. 개선된 변이체, 특히, ω-하이드록시 헥사데칸산 및 ω-하이드록시 헥사데센산 형성을 상당히 개선시킨 변이체가 아래 표 11에 도시된다.
표 11: cyp153A(G307A)-Red450RhF(A976V)의 부위 포화 라이브러리로부터의 개선된 변이체의 요약
실시예 8: cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 촉매 도메인의 조합 라이브러리
촉매 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
조합 라이브러리를 cyp153A(G307A)-Red450RhF (A796A) (서열 번호: 38)를 갖는 pEP302 중 작제하고, 그리고 stNH1525로 변형시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 12에 도시된다.
표 12: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된 개선된 변이체의 요약 (서열 번호: 38)
실시예 9: 높은 발현 수준의 cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 촉매 도메인의 조합 라이브러리
촉매 도메인의 조합 라이브러리에서 확인된 유익한 돌연변이(실시예 8, 상기 참조)는 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선하기 위한 차기 조합 라이브러리를 위한 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
조합 라이브러리를 보다 높은 발현 수준에서 cyp153A(G307A)-Red450RhF (A796A) (서열 번호: 38)를 갖는, pAA. 016 플라스미드, pEP302의 유도체 중 작제하였고, 그리고 stNH1525로 변형시켰다. 당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 13에 도시된다.
표 13: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된, 더 높은 발현 수준의 개선된 변이체의 요약
실시예 10: cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 환원효소 도메인의 조합 라이브러리
환원효소 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
조합 라이브러리를 pEP302에서 작제하고 stNH1525로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 표 14에 도시된다.
표 14: cyp153A(G307A)-Red450RhF(A796V)의 환원효소 도메인의 조합 라이브러리에서 유래된 개선된 변이체
실시예 11: cyp153A ( Q12W , R27L , K119R , S140N , S157R , V159M , S233L , A244R, G307A )- Red450RhF ( A796V ) 융합 단백질 (서열 번호: 98)의 촉매 및 환원효소 도메인의 조합 라이브러리
촉매적 및 환원효소 도메인(상기 실시예 8-10 참조)의 조합 라이브러리에서 확인된 유익한 돌연변이는 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매적 및 환원효소 도메인의 조합 라이브러리)을 더욱 개선하기 위한 조합 라이브러리용 염기였다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)을 갖는, 조합 라이브러리를 pEP302의 유도체인 pEP. 333 플라스미드에 작제하였고(실시예 7 참조), 그리고 stNH1525로 변형시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다.
개선된 변이체가 표 15에 도시된다. 서열 번호: 98의 주형 내 일부 돌연변이는, 표 15에 의하여 나타난 바와 같은 야생형으로 복귀하였다. 예를 들면, 표 15에 나타난 네 번째의 돌연변이체에서, 신규한 돌연변이 V141T 및 A231Y가 첨가되었지만, S233L 및 A244R 돌연변이는 서열 번호: 152의 변이체에 더 이상 존재하지 않는다.
표 15: cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 및 환원효소 도메인의 조합 라이브러리 유래의 개선된 변이체.
실시예 12:cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 도메인의 조합 라이브러리
촉매 도메인(상기 실시예 8 참조)의 조합 라이브러리에서 확인된 유익한 돌연변이는 서열 번호: 98의 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질의 촉매적 및 환원효소 도메인의 조합 라이브러리)을 더욱 개선하기 위한 조합 라이브러리용 염기였다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
하기를 갖는, 조합 라이브러리를 pEP. 333 플라스미드의 저-사본 수 유도체인 pEP. 334 플라스미드에 작제하였다(실시예 11 참조): cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)의 촉매 도메인의 조합 라이브러리 및, 티오에스테라제 fatA3 및 베타-케토아실-ACP 합성효소 fabB의 변이체를 갖는 제2 오페론. pEP344를 균주 AA. 233으로 전환하였는데, 이것은 구성적으로 발현된 조절 단백질인 fadR의 변이체를 갖는 균주 stNH1525의 유도체(실시예 7 참조)이다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 표 16에 도시된다. 서열 번호: 98의 주형 내 일부 돌연변이는, 표 16에 의하여 나타난 바와 같은 야생형으로 복귀하였다. 예를 들면, 표 16에 나타난 첫번째의 돌연변이체에서, 신규한 돌연변이 Q28M, V141T 및 A231Y가 첨가되었지만, S140N 돌연변이는 서열 번호: 166의 변이체에 더 이상 존재하지 않는다.
표 16:cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 도메인의 조합 라이브러리 유래의 개선된 단백질 변이체.
당업계의 숙련가에게 자명한 바와 같이, 상기 측면들 및 구현예들의 다양한 변형들 및 변경들이 본 발명의 취지 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.
도 1은 재조합 미생물에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 및 티오에스테라제 폴리펩티드를 발현시킨 결과로서, 예를 들면, ω-하이드록실화 C12 지방산 (ω-OH C12 FFA) 및/또는 ω-하이드록실화 C16:1 지방산 (ω-OH C16:1 FFA)과 같은 ω-하이드록실화 지방산 유도체의 제조를 위한 예시적인 생합성 경로의 개략적인 개요이다. FAB는 미생물에서의 지방산 생합성을 나타내고; fatB1은 캘리포니아만 월계수(Umbellularia californica)(캘리포니아만)으로부터의 중쇄 아실-ACP 티오에스테라제를 나타내고; fatA3은 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 장쇄 아실-ACP 티오에스테라제를 나타낸다.
도 2는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현의 결과로서의 ω-하이드록실화 지방산의 제조의 예를 제공한다. 변이체를 통한 ω-하이드록실화(ω-OH) 지방산의 제조를 예시하기 위해 부위 포화 돌연변이유발이 사용되었다. 도시된 그래프는 CYP153A(G307A, A796V)-Red450RhF의 아미노산 위치 141 및 309의 부위 포화 돌연변이유발로부터의 최고 히트수(hits)를 보여준다. 도면은 총 지방산 화학종(총 FAS)(진회색 막대 참조); ω-하이드록시 헥사데센산(ω-OH C16:1)(담회색 막대 참조); 및 ω-하이드록시 지방산 퍼센트(% ω-OH FFA)(화살표 참조)를 나타낸다.
도 3은 하이브리드 사이토크롬 P450 Cyp153A(G307A)-RedRhF 융합 단백질 (서열 번호: 6)의 폴리펩티드 서열을 도시하며, 이는 서열 표 A에서 도시된 변이체에 대한 주형 서열로서 사용되었다.
도 4는 하이브리드 사이토크롬 P450 Cyp153A(G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 38)의 폴리펩티드 서열을 도시하며, 이는 서열 표 B에서 도시된 변이체에 대한 주형 서열로서 사용되었다.
도 5는 서열 번호: 38의 사이토크롬 P450 Cyp153A(G307A)-RedRhF(A796V) 하이브리드 융합 폴리펩티드 변이체의 구조를 도시하며, 이는, 2개의 개별 도메인, 즉, 링커 폴리펩티드에 의하여 연결된 촉매 및 환원효소 도메인을 갖는다. 상기 촉매 도메인은 아미노산 위치 1 내지 486의 범위에 속하는 것으로 보이고, 아미노산 위치 1 내지 470의 범위에 속하는 P450 Cyp153A(G307A) 및 아미노산 위치 471 내지 486의 범위에 속하는 링커 폴리펩티드를 포함한다. Red450RhF(A796V)으로 표현되는 환원효소 도메인은 아미노산 위치 487 내지 799의 범위에 속한다. 서열 번호: 38은 추가 변이체를 생성하기 위한 주형 서열로서 사용된다.
도 6은 서열 번호: 98의 3-차원 단백질 구조를 도시한다. 구들(balls)은 돌연변이화된 잔기들 상의 탄소, 질소 및 산소 원자를 묘사한다. 또한 상기 중심 근처에 중간의 철 원자를 둘러싸고 클러스터링된 헴(heme) 그룹이 보여진다. 상기 잠재적인 리간드 결합 부위가 회색(grayed-out) 표면으로 설명된다. 이 사진에서 보여지듯이, 모든 돌연변이화된 잔기들은 잠재적인 리간드 결합 부위 (즉, 활성 부위) 밖에 있다.
일반적인 개요
석유화학제품에 대한 우리의 의존도를 없애는 한 가지 방법은 미니어처(miniature) 생산 숙주로서 작용하는 환경 친화적인 미생물을 통해 ω-OH 지방산 유도체와 같은 지방산 유도체를 생산하는 것이다. 이러한 세포 숙주(즉, 재조합 숙주 세포 또는 미생물)는 재생가능한 공급원료(예컨대, 발효성 탄수화물, 바이오매스, 셀룰로스, 글리세롤, CO, CO2, 등)와 같은 재생가능한 공급원으로부터 ω-OH 지방산 유도체 및 이관능성 지방산 유도체를 생산하도록 조작된다. 이러한 ω-OH 지방산 유도체가 특수 화학물질, 중합체 및 향을 포함한 산업 제품을 위한 원료이다.
본 발명은 재조합 숙주 세포에서 발현되는 경우 ω-OH 지방산 유도체 조성물의 높은 역가, 수율 및/또는 생산성을 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 및 이의 변이체를 포함하는 ω-하이드록실라제-관련 융합 폴리펩티드에 관한 것이다. 본원에서, 증진된 ω-OH 지방산 유도체 생합성은, 숙주 세포를 변형함으로써 달성되며, 이로써 이들은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체를 발현하도록 하고, 이는 지방산의, ω-OH 지방산 예컨대, 예를 들어, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 또는 지방산 유도체로의 반응을 촉진한다. 본 발명은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 및 이의 변이체를 발현하는 재조합 숙주 세포 또는 생산 균주를 포함한다. 하나의 측면에서, 본 발명은 P450 서브패밀리 cyp153A에 관한 것이다.
정의
본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수형 "a", "an" 및"the"는, 문맥이 명백히 달리 나타내지 않는 한, 복수 지시대상을 포함한다. 따라서, 예를 들면, "하나의 숙주 세포(a host cell)"에 대한 언급은 둘 이상의 이러한 숙주 세포를 포함하고, "하나의 지방 에스테르(a fatty ester)"에 대한 언급은 하나 이상의 지방 에스테르, 또는 에스테르의 혼합물을 포함하며, 하나의 핵산 서열(a nucleic acid 서열)"에 대한 언급은 하나 이상의 핵산 서열을 포함하고, "하나의 효소(an enzyme)"에 대한 언급은 하나 이상의 효소를 포함하는 등이다.
용어 "효소 분류(EC) 번호"는 특정 효소 활성을 나타내는 번호를 말한다. EC 번호는 효소 명명법의 시스템 하에서 이들이 촉매하는 반응에 따라 효소를 분류한다. EC 번호는 효소-촉매된 반응을 특정화한다. 예를 들면, 상이한 유기체들로부터의 상이한 효소들이 동일한 반응을 촉매하는 경우, 이들은 동일한 EC 번호를 갖는다. 또한, 상이한 단백질 폴드가 동일한 반응을 촉매할 수 있고, 따라서, 동일한 EC 번호(예컨대, 비상동성 동기능 효소, 또는 NISE)가 할당될 것이다. EC 번호는 생화학 및 분자생물학 국제 연합(IUBMB)의 명명 위원회에 의해 확립되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. 예를 들면, ω-하이드록실라제 또는 ω-옥시게나제 효소 활성을 포함한 사이토크롬 P450 모노옥시게나제(P450) 효소 활성은 EC 1.14.15.3으로 분류된다. P450 효소 패밀리에 속하는 효소의 기능은 하나의 종으로부터 다음 종으로 대부분의 원핵생물에서 보존된다. 따라서, 상이한 미생물 종이 EC 1.14.15.3으로 분류된 동일한 효소 활성을 수행할 수 있다. EC 1.14.15.3에 의해 특성화된 효소 활성의 예는 본원에 논의된 바와 같은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체(상기)의 효소 활성이다.
용어 "오메가-하이드록실화 지방산" 또는 "ω-하이드록실화 지방산" 또는 "ω-하이드록시 지방산" 또는 "ω-하이드록실 지방산" 또는 "ω-OH 지방산" 또는 "ωOH 지방산"은 본원에서 상호교환 가능하게 사용되며, 지방산 대사로부터 기원하는 지방산을 나타내고 오메가(ω) 위치에 적어도 하나의 OH 그룹을 갖는다. ω-하이드록실화 지방산의 예시는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산이다. 일 구현예에서, 이와 같은 ω-하이드록실화된 지방산은 ω-OH C8:0 지방산, ω-OH C10:0 지방산, ω-OH C12:0 지방산, ω-OH C14:0 지방산, ω-OH C16:0 지방산, ω-OH C18:0 지방산, ω-OH C20:0 지방산, ω-OH C8:1 지방산, ω-OH C10:1 지방산, ω-OH C12:1 지방산, ω-OH C14:1 지방산, ω-OH C16:1 지방산, ω-OH C18:1 지방산, ω-OH C20:1 지방산 및 기타 동종의 것이다. 미생물에서, ω-하이드록실화 지방산은 ω-하이드록실화 지방산 유도체, 예를 들면, ω-하이드록실화 지방 에스테르 뿐만 아니라 α,ω-이산, α,ω-디에스테르, 및 α,ω-디올을 포함한 이관능성 지방산 유도체를 제조하는데 사용될 수 있다. 그러한 점에서, 용어 "오메가-하이드록실화 지방산 유도체" 및 "ω-하이드록실화 지방산 유도체" 및 "ω-하이드록시 지방산 유도체" 및 "ω-하이드록실 지방산 유도체" 및 "α,ω-이관능성 지방산 유도체" 및 "ω-OH 지방산 유도체"는 지방산 대사로부터 기원하고 오메가 위치에 적어도 하나의 OH 그룹을 갖거나 오메가 위치에 적어도 하나의 OH 그룹을 갖는 중간체로부터 유도된 화학적 개체(chemical entity)를 나타낸다. 본원에서, "오메가(ω) 위치"는 이의 1차 관능기에 대해 반대쪽 단부에 있는 지방산 유도체의 말단 탄소 원자를 나타낸다. 이러한 ω-하이드록실화 지방산 유도체는 α,ω-이산; α,ω- 디에스테르; α,ω-디올 및 이의 유도된 화합물(예컨대, 매크로락톤)을 포함하지만, 이에 제한되지 않는다.
본원에 언급된 바와 같은 "ω-하이드록실화 지방산 조성물" 또는 "ω-OH 지방산 조성물"은 재조합 숙주 세포에 의해 생산되며 전형적으로 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 유형의 ω-하이드록실화 지방산들의 혼합물을 포함한다. 유사하게, "ω-하이드록실화 지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생산되며 전형적으로 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 유형의 ω- 하이드록실화 지방산 유도체들(예컨대, 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 ω-하이드록실화 지방산; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 ω-하이드록실화 지방 에스테르; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-이산; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-디에스테르; 다양한 쇄 길이 및/또는 포화도 및/또는 분지 특성을 갖는 α,ω-디올; 등)의 혼합물을 포함한다. 몇몇 경우에, ω-OH 지방산 유도체 조성물은 주로 한 가지 유형의 ω-OH 지방산 유도체, 예를 들면, 1,12-도데센디올, 또는 1,14-테트라데칸디올, 또는 16-하이드록시 헥사데칸산 메틸 에스테르, 또는 16-하이드록시 헥사데센산, 또는 15-하이드록시 펜타데칸산, EH는 15-하이드록시 펜타데센산, 또는 18-하이드록시 옥타데센산, 또는 이러한 지방산 유도체 중의 어느 것의 메틸 에스테르, 또는 기타를 포함한다. 여전히 또 다른 경우에, ω-OH 지방산 유도체 조성물은 특별하게 설계된 조성물을 제공하기 위해 하나 이상의 유형의 ω-OH 지방산 유도체들의 혼합물을 포함한다(예컨대, 동일한 조성물에서 약 20% 12-하이드록시 도데칸산 및 약 80% 1,14-14-하이드록시 테트라데칸산이 이러한 예를 제공한다).
용어 "수탁 번호" 또는 "NCBI 수탁 번호" 또는 "GenBank 수탁 번호"는 특정 핵산 서열을 표시하는 번호를 나타낸다. 당해 설명에 논의된 서열 수탁 번호는 U. S. A. 국립 보건원에 의해 운영되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (UniProtKB 수탁 번호라고도 하는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.
본원에서 사용되는 용어 "뉴클레오티드"는 헤테로환계 염기, 당 및 하나 이상의 포스페이트 그룹으로 이루어진 폴리뉴클레오티드의 단량체 단위를 나타낸다. 자연적으로 발생하는 염기[구아닌(G), 아데닌(A), 시토신(C), 티민(T) 및 우라실(U)]은 전형적으로 퓨린 또는 피리미딘의 유도체이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토스(5-탄당)의 (DNA를 형성하는) 데옥시리보스 또는 (RNA를 형성하는) 리보스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체도 포함되는 것으로 이해하여야 한다. 핵산은 전형적으로 핵산 또는 폴리뉴클레오티드를 형성하는 포스페이트 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 당업계에 알려져 있다.
용어 "폴리뉴클레오티드"는 리보뉴클레오티드(RNA) 또는 데옥시리보뉴클레오티드(DNA)의 중합체를 나타내고, 이는 외가닥 또는 이중가닥일 수 있으며, 비-자연적 또는 변형된 뉴클레오티드를 함유할 수 있다. 용어 "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"은 어떠한 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 나타내는데 상호교환 가능하게 사용된다. 이들 용어는 분자의 일차 구조를 나타내며, 따라서 이중가닥 및 외가닥의 DNA, 및 이중가닥 및 외가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된 폴리뉴클레오티드와 같지만 이로 제한되지 않는 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하지만 이로 제한되지 않는 선택적인 형태로 존재할 수 있다.
본원에서 사용되는 용어 "폴리펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 나타내는데 상호교환 가능하게 사용된다. 용어 "재조합 폴리펩티드"는 재조합 기술에 의해 생성된 폴리펩티드를 나타내고, 여기서, 일반적으로 발현된 단백질을 암호화하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는데 사용되는 적합한 발현 벡터 내로 삽입된다. 유사하게, 용어 "재조합 폴리뉴클레오티드" 또는 "재조합 핵산" 또는 "재조합 DNA"는 당업계의 숙련가들에게 공지된 재조합 기술로 생산된다.
용어 "동족체" 및 "상동성"은 상응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50퍼센트(%) 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드를 나타낸다. 바람직하게는 상동성 폴리뉴클레오티드 또는 폴리펩티드는 상응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 약 99% 상동성인 폴리뉴클레오티드 서열 또는 아미노산 서열을 갖는다. 본원에서 사용되는 용어 서열 "상동성" 및 서열 "동일성"은 상호교환 가능하게 사용된다. 당업계의 통상의 숙련가는 둘 이상의 서열들 간의 상동성을 결정하는 방법을 잘 알고 있다. 간략하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 서열들은 최적의 비교 목적으로 정렬된다[예를 들어, 최적의 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 다에 갭(gap)이 도입될 수 있으며, 비교 목적을 위해 비-상동성 서열은 무시될 수 있다]. 하나의 바람직한 구현예에서, 비교 목적을 위해 정렬된 제1 서열의 길이는 제2 서열의 길이의 적어도 약 30%, 바람직하게는 적어도 약 40%, 보다 바람직하게는 적어도 약 50%, 보다 더 바람직하게는 적어도 약 60%, 훨씬 더 바람직하게는 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 또는 약 100%이다. 그후, 제1 및 제2 서열의 상응하는 아미노산 위치 또는 뉴클레오티드 위치에 있는 아미노산 잔기 또는 뉴클레오티드를 비교한다. 제1 서열에서 위치가 제2 서열에서 상응하는 위치로서 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점거된 경우, 분자는 그 위치에서 동일하다. 두 서열들 간의 상동성 퍼센트는, 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치의 개수의 함수이다. 서열의 비교 및 2개 서열 사이에서 동일성 퍼센트의 결정은 수학적 알고리즘, 예컨대 BLAST를 이용하여 달성될 수 있다 (Altschul et al. (1990) J. Mol. Biol. 215(3):403-410). 두 아미노산 서열들 간의 상동성 퍼센트 또한 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다 (Needleman and Wunsch (1970) J. Mol. Biol. 48:444-453). 두 뉴클레오티드 서열들 간의 상동성 퍼센트 또한 NWSgapdna. CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 당업계의 숙련가는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항들의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들이 생물공학 분야에 알려져 있다(참조; 예컨대, Rosenberg (2005) BMC Bioinformatics 6:278; Altschul et al. (2005) FEBS J. 272(20):5101-5109).
용어 "저 엄격, 중간 엄격, 고 엄격, 또는 초고 엄격 조건 하에서 하이브리드화한다"는 하이브리드화 및 세척을 위한 조건을 설명한다. 하이브리드화 반응을 수행하기 위한 가이드는 하기의 최신 프로토콜에서 찾을 수 있다: Current Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989), 6.3.1 - 6.3.6. 수성 및 비수성 방법이 상기 참조문헌에 기재되어 있으며, 어느 하나의 방법이 사용될 수 있다. 본원에 언급된 특정 하이브리드화 조건은 아래와 같다: (1) 저 엄격 하이브리드화 조건 -- 약 45℃에서 6X 염화나트륨/시트르산나트륨(SSC)에 이어 적어도 50℃에서 0.2X SSC, 0.1% SDS로 2회 세척(세척의 온도는 저 엄격 조건의 경우 55℃로 상승될 수 있다); (2) 중간 엄격 하이브리드화 조건 -- 약 45℃에서 6X SSC에 이어 60℃에서 0.2X SSC, 0.1% SDS로 1회 이상 세척; (3) 고 엄격 하이브리드화 조건 -- 약 45℃에서 6X SSC에 이어 65℃에서 0.2.X SSC, 0.1% SDS로 1회 이상 세척; 및 (4) 초고 엄격 하이브리드화 조건 -- 65℃에서 0.5M 인산나트륨, 7% SDS에 이어 65℃에서 0.2X SSC, 1% SDS로 1회 이상 세척. 초고 엄격 조건(4)가 달리 명시되지 않는 한 바람직한 조건이다.
“내인성” 폴리펩티드는 친계 세포(또는 숙주 세포)의 게놈에 의해 암호화되거나, 또는 상기 친계 숙주 세포에서 비롯된 또는 발달된 또는 유래된 폴리펩티드를 지칭한다. “외인성” 폴리펩티드는 친계 세포의 게놈에 의해 암호화되지 않거나 또는 친계 숙주 세포의 외부에서 비롯된 폴리펩티드를 지칭힌다. 변이체 또는 돌연변이체 폴리펩티드가 외인성 폴리펩티드의 예이다. 따라서, 비자연적으로 발생하는 핵산 분자는 일단 세포에 도입되면 세포에 외인성인 것으로 간주된다. 자연적으로 발생하는 핵산 분자 또한 특정 세포에 외인성일 수 있다. 예를 들면, 세포 X로부터 단리된 전체 암호화 서열은 일단 그 암호화 서열이 세포 Y에 도입되면 X 및 Y가 동일한 세포 유형이더라도 세포 Y에 대해 외인성 핵산이다.
용어 "과발현된"은 유전자가 그 유전자에 대한 야생형 또는 천연 또는 내인성 전사 속도에 비해 상승된 속도로 전사되게 함을 의미한다. 몇몇 예에서, 과발현은 또한 그 유전자에 대한 야생형 또는 천연 또는 내인성 번역 속도에 비해 유전자의 상승된 번역 속도를 포함한다. 과발현에 대한 시험방법은 당업계에 널리 공지되어 있으며, 예를 들면, 전사된 RNA 수준은 rtPCR을 사용하여 평가될 수 있고 단백질 수준은 SDS page 겔 분석을 사용하여 평가될 수 있다.
용어 "이종(heterologous)"은 상이한 유기체, 상이한 세포 유형, 또는 상이한 종으로부터 유도됨을 의미한다. 본원에서 사용되는 바와 같이 이것은 소정의 유기체에서 자연적으로 존재하지 않는, 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드- 또는 단백질 서열을 나타낸다. 예를 들면, 시아노박테리아에 고유한 폴리뉴클레오티드 서열이 재조합 방법에 의해 대장균(E. coli)의 숙주 세포에 도입될 수 있으며, 그후 시아노박테리아로부터의 폴리뉴클레오티드는 대장균 세포(예컨대, 재조합 세포)에 대해 이종이다. 용어 "이종"은 또한 비-천연 상태(non-native state)로 재조합 숙주 세포에 존재하는 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드-, 또는 단백질 서열에 관해 사용될 수 있다. 예를 들면, "이종" 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열은 상응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 비해, 예를 들면, 발현의 수준에 있어서 또는 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질의 서열에 있어서의 변형으로 변형될 수 있다.
본원에서 사용되는 바와 같이, 용어 폴리펩티드의 "단편"은 2개의 아미노산 잔기에서부터 1개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전장 폴리펩티드 또는 단백질의 더 짧은 부분을 나타낸다. 본 발명의 특정 구현예에서, 단편은 폴리펩티드 또는 단백질의 도메인(예컨대, 기질 결합 도메인 또는 촉매 도메인)의 전체 아미노산 서열을 나타낸다.
용어 "돌연변이유발"은 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 나타낸다. 단백질 암호화 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 돌연변이유발은 또한 변형된 단백질 활성을 야기하는 비-암호화 핵산 서열의 변화를 나타낸다.
본원에서 사용되는 "돌연변이"는 유전자의 핵산 위치에서의 영구적인 변화 또는 폴리펩티드 또는 단백질의 아미노산 위치에서의 영구적인 변화를 나타낸다. 돌연변이는 치환, 부가, 삽입, 및 결손을 포함한다. 예를 들면, 아미노산 위치에서의 돌연변이는 한 가지 유형의 아미노산의 다른 유형의 아미노산으로의 치환일 수 있다(예컨대, 세린(S)이 알라닌(A)으로 치환될 수 있고; 리신(L)이 트레오닌(T)으로 치환될 수 있고; 등). 이와 같이, 폴리펩티드 또는 단백질은 하나의 아미노산이 다른 아미노산으로 치환된 하나 이상의 돌연변이를 가질 수 있다. 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38의 아미노산 서열 내 특정 아미노산 위치에서의 돌연변이를 갖는다. 예를 들어, 서열 번호: 38의 아미노산 위치 12, 27, 119, 140, 157, 159, 233, 및 244 각각에서의 돌연변이를 갖는, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 본 개시내용에 의하여 제공된다. 이러한 특정 아미노산 위치 중 각각에서의 돌연변이를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산의 오메가-하이드록실화 지방산으로의 전환을 촉진한다. 바람직하게는, 이러한 특정 아미노산 위치 중 각각에서의 돌연변이를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 예를 들면, 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교할 경우, 보다 높은 역가에서의 ω-OH 지방산 유도체를 생산할 수 있다. 따라서, 청구된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 특정 아미노산 위치에서의 돌연변이는 바람직하게는 예를 들면, 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여 ω-OH 지방산 유도체를 더 높은 역가로 생산하는 청구된 효과를 허용하지 않을 수 있는 돌연변이는 포함하지 않는다. 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 당해 분야에서 공지된 방법을 사용하여, 그것의 기능, 예컨대, 야생형 CYP153A 폴리펩티드, 또는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 선택적인 다른 참조 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여 개선된 기능, 예컨대, 비제한적으로, 증가된 촉매적 활성, 증가된 안정성, 또는 감소된 억제(예를 들면, 감소된, 피드백 억제)와 관련하여 선별될 수 있다. 본 개시내용의 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이는, 예를 들면, 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가, 및/또는 지방산에서 ω-하이드록시 지방산으로의 전환 증가를 허용하는 성질을 갖는다. 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이는, 예를 들면, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가, 및/또는 지방산에서 ω-하이드록시 지방산으로의 전환 증가를 허용하는 성질을 갖는다. 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이는, 예를 들면, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가, 및/또는 지방산에서 ω-하이드록시 지방산으로의 전환 증가를 허용하는 성질을 갖는다. 본 개시내용의 다양한 구현예에서, 청구항에서 정의된 특정 위치에서의 돌연변이들 중 하나 이상은 하나 이상의 아미노산 치환 및/또는 결실을 의미한다. 바람직하게는, 청구항에서 정의된 특정 위치에서의 돌연변이들 중 하나 이상은 하나 이상의 아미노산 치환을 의미한다. 더 바람직하게는, 소정의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 대해 청구항에서 정의된 특정 위치에서의 모든 돌연변이들이 아미노산 치환이다. 특정 위치에서 아미노산 잔기가 결실되고 상이한 아미노산 잔기가 상기 위치에 삽입된 경우, 이것은 특정 위치에서의 아미노산 잔기의 치환으로 간주될 수 있다. 본 개시내용의 다양한 구현예에서, 아미노산 위치에서의 돌연변이는 (상기 위치에서의) 아미노산 치환을 의미하되, 상기 치환은 잠재적인(silent) 치환이 아니다.
본원에서 사용되는 용어 "유전자"는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 암호화하는 핵산 서열 뿐만 아니라 RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된 핵산 서열(예를 들면, 이러한 서열은 프로모터 또는 인핸서 서열을 포함하지만 이로 제한되지 않음) 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 암호화하는 작동가능하게-연결된 핵산 서열(예를 들면, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열을 포함하지만 이로 제한되지 않음)을 나타낸다.
발현 조절 서열은 당업계에 공지되어 있으며, 예를 들면, 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 인핸서, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 전사에 관여된 세포 단백질과 특이적으로 상호작용한다 (Maniatis et al. (1987) Science 236:1237-1245). 예시적 발현 조절 서열은 예를 들어, 하기에 기술된다: Goeddel, Gene Expression Technology:Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif. (1990). 본 발명의 방법에서, 발현 조절 서열은 폴리뉴클레오티드 서열과 작동가능하게 연결된다. “작동가능하게 연결된"이란 적절한 분자(예컨대, 전사 활성인자 단백질)가 발현 조절 서열(들)에 결합될 때 폴리뉴클레오티드 서열 및 발현 조절 서열이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류에 위치된다. 작동가능하게 연결된 인핸서는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류에 위치될 수 있다.
본원에서 사용되는 용어 "벡터"는 이것이 연결된 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 니타낸다. 유용한 벡터의 한 가지 유형은 에피솜(즉, 염색체외 복제를 할 수 있는 핵산)이다. 유용한 벡터는 이들이 연결되는 헥산의 자율 복제 및/또는 발현이 가능한 것이다. 당해 벡터가 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터를 본원에서 '발현 벡터"라고 한다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종 "플라스미드"의 형태로 되어 있으며, 이것은 일반적으로 이들의 벡터 형태에서 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프를 나타낸다. 기타의 유용한 발현 벡터가 직선 형태로 제공되어 있다. 등가의 기능을 제공하고, 이후에 당업계에 알려지게 된 이러한 다른 형태들의 발현 벡터도 포함된다. 일부 구현예에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 추가로 포함한다. 일부 구현예에서, 프로모터는 발달적으로-조절된 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적 프로모터, 또는 세포-특이적 프로모터이다. 재조합 벡터는 전형적으로 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택된 적어도 하나의 서열을 포함한다. 특정 구현예에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA에 안정적으로 삽입되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 영역의 제어하에 있다. 본원에서 사용되는 바와 같은 발현 벡터는 숙주 세포에서 폴리뉴클레오티드 서열의 발현에 적합한 형태로 본원에 기재된 바와 같은 특정 폴리뉴클레오티드 서열을 포함한다. 상기 발현 벡터의 디자인은 전환될 숙주 세포의 선택, 요망된 폴리펩티드의 발현 수준 등과 같은 인자에 따라 달라질 수 있음이 당해 분야의 숙련가에 의해 인정될 것이다. 본원에 기재된 발현 벡터는 숙주 세포에 유입되어 본 명세서에서 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 암호화된, 융합 폴리펩티드를 비롯한 폴리펩티드를 생산한다. 원핵생물, 예를 들면, 대장균에서 폴리펩티드를 암호화하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행된다. 융합 벡터는 그 안에 암호화된 폴리펩티드에, 통상적으로 재조합 폴리펩티드의 아미노- 또는 카복시-말단에 다수의 아미노산을 부가한다. 이러한 융합 벡터는 전형적으로 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키고; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것을 포함한 상기 세 가지 목적들 중의 하나 이상을 제공한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 특정 구현예에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도되는 프로모터에 작동가능하게 연결된다.
특정 구현예에서, 숙주 세포는 효모 세포이고, 발현 벡터는 효모 발현 벡터이다. 효모 S. 세레비시에(S. cerevisiae)에서의 발현을 위한 벡터의 예는 하기를 포함한다: pYepSec1(Baldari et al. (1987) EMBO J. 6:229-234); pMFa (Kurjan et al. (1982) Cell 30:933-943); pJRY88 (Schultz et al. (1987) Gene 54:113-123); pYES2 (Invitrogen Corp., San Diego, CA), 및 picZ (Invitrogen Corp., San Diego, CA). 또 다른 구현예에서, 숙주 세포는 곤충 세포이고, 발현 벡터는 바큘로바이러스 발현 벡터이다. 배양된 곤충 세포(예컨대, Sf9 세포)에서 단백질의 발현을 위해 이용 가능한 바큘로바이러스 벡터는, 예를 들면, pAc 계열(Smith et al. (1983) Mol. Cell Biol. 3:2156-2165) 및 pVL 계열(Lucklow et al. (1989) Virology 170:31-39)를 포함한다. 또 다른 구현예에서, 본원에 기재된 폴리뉴클레오티드 서열은 포유류 발현 벡터를 사용하여 포유류 세포에서 발현될 수 있다. 원핵 및 진핵 세포 모두를 위한 다른 적합한 발현 시스템은 당해 분야에서 잘 알려져 있으며; 예를 들어, 하기를 참고한다: Sambrook et al. , “Molecular Cloning:A Laboratory Manual,” second edition, Cold Spring Harbor Laboratory, (1989).
본원에서 사용되는 용어 "CoA" 또는 "아실-CoA"는 조효소 A(CoA)의 4'-포스포판테티오닐 모이어티의 설프하이드릴 그룹과 알킬 쇄의 카보닐 탄소 사이에서 형성되는 아실 티오에스테르를 나타내며, 이는 화학식 R-C(O)S-CoA를 갖고, 여기서 R은 적어도 4개의 탄소원자를 갖는 선택적인 알킬 기이다.
용어 "ACP"는 아실 운반 단백질을 의미한다. ACP는 지방산 생합성 동안 아실 중합체의 고도로 보존된 운반체이며, 여기서, 성장하는 쇄는 4'-포스포판테테인 모이어티의 말단 티올에서 티올 에스테르로서 합성 동안 결합된다. 단백질은 두 가지 형태, 즉, 아포(apo)-ACP(지방산 생합성에서 불활성) 및 ACP 또는 홀로(holo)-ACP(지방산 생합성에서 활성)로 존재한다. 용어 "ACP" 및 "홀로-ACP"는 본원에서 상호교환 가능하게 사용되며, 단백질의 활성 형태를 나타낸다. 포스포판테테이닐트랜스퍼라제라고 불리는 효소가 불활성 아포-ACP에서 활성 홀로-ACP로의 전환에 관여한다. 보다 구체적으로, ACP는 불활성 아포-ACP 형태로 발현되고, 4'-포스포판테테인 모이어티는 홀로-ACP를 생산하기 위해 홀로-아실 운반 단백질 신타제(ACPS), 포스포판테테이닐트랜스퍼라제의 활성에 의해 ACP 상에서 보존된 세린 잔기에 후-번역되도록 부착되어야 한다.
본원에서 사용되는 용어 "아실-ACP"는 아실 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 설프하이드릴 그룹과 알킬 쇄의 카보닐 탄소 사이에서 형성되는 아실 티오에스테르를 나타낸다. 일부 구현예에서 ACP는 완전 포화된 아실-ACP의 합성에 있어서 중간체이다. 또 다른 구현예에서 ACP는 불포화 아실-ACP의 합성에 있어서 중간체이다. 일부 구현예에서, 탄소 쇄는 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 26개의 탄소를 가질 것이다.
본원에서 사용되는 용어 "지방산 유도체"는 "지방산 또는 이의 유도체"라고 할 수 있는 "지방산" 또는 "지방산 유도체"를 의미한다. 용어 "지방산"은 화학식 RCOOH를 갖는 카복실산을 의미한다. R은 지방족 그룹, 바람직하게는 알킬 그룹을 나타낸다. R은 약 4 내지 약 22개 탄소원자를 포함할 수 있다. 지방산은 포화, 불포화, 또는 다중불포화될 수 있다. "지방산 유도체"는 생산 숙주 유기체(예컨대, 재조합 숙주 세포 또는 미생물)의 지방산 생합성 경로로부터 부분적으로 제조되는 생성물이다. "지방산 유도체"는 ACP, 아실-ACP 또는 아실-ACP 유도체로부터 부분적으로 제조되는 생성물을 포함한다. 예시적인 지방산 유도체는, 예를 들면, 아실-CoA, 지방산, 지방 알데히드, 단쇄 및 장쇄 알콜, 지방 알콜, 탄화수소, 에스테르(예컨대, 왁스,지방산 에스테르, 또는 지방 에스테르), 말단 올레핀, 내부 올레핀, 케톤 뿐만 아니라 ω-OH 지방산 및 α,ω-이산을 포함한 이의 ω-OH 지방산 유도체, 및 기타의 이관능성 화합물을 포함한다.
본원에서 사용되는 용어 "지방산 생합성 경로"는 지방산 및 이의 유도체를 생산하는 생합성 경로를 의미한다. 지방산 생합성 경로는 목적하는 특징을 갖는 지방산 유도체를 생산하는 추가의 효소를 포함할 수 있다.
지방산의 R 그룹은 직쇄 또는 측쇄일 수 있다. 측쇄는 하나 이상의 분지점을 가질 수 있고 환계 분지를 포함할 수 있다. 일부 구현예에서, 분지형 지방산은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25, 또는 C26 분지형 지방산이다. 기타 구현예에서, 분지형 지방산은 C6, C8, C10, C12, C13, C14, C15, C16, C17, C18, 또는 C20 분지형 지방산이다. 특정 구현예에서, 측쇄 지방산의 하이드록실(OH) 그룹은 오메가(ω) 위치에 있다. 특정 구현예에서, 측쇄 지방산은 이소-지방산 또는 안테이소-지방산이다. 예시적인 구현예에서, 상기 분지형 지방산은 이소-C7:0-, 이소-C8:0-, 이소-C9:0-, 이소-C10:0-, 이소-C11:0-, 이소-C12:0-, 이소-C13:0-, 이소-C14:0-, 이소-C15:0-, 이소-C16:0-, 이소-C17:0-, 이소-C18:0-, 이소-C19:0-, 이소-C20:0, 안테이소-C7:0-, 안테이소-C9:0-, 안테이소-C11:0-, 안테이소-C13:0-, 안테이소-C15:0-, 안테이소-C17:0- 및 안테이소-C19:0 분지형 지방산에서 선택된다.
지방산의 R 그룹은 포화 또는 불포화일 수 있다. 불포화된다면, R 그룹은 하나 또는 하나 이상의 불포화점을 가질 수 있다. 일부 구현예에서, 불포화 지방산은 단일불포화 지방산이다. 특정 구현예에서, 불포화 지방산은 C8:1-, C9:1-, C10:1-, C11:1-, C12:1-, C13:1-, C14:1-, C15:1-, C16:1-, C17:1-, C18:1-, C19:1-, C20:1-, C21:1-, C22:1-, C23:1-, C24:1-, C25:1-, 또는 C26:1 불포화 지방산이다. 특정 구현예에서, 불포화 지방산은 C8:1, C10:1, C12:1, C14:1, C16:1, C18:1, 또는 C20:1 이다. 또 다른 구현예에서, 불포화 지방산은 오메가-7 위치에서 불포화된다. 특정 구현예에서, 불포화 지방산은 시스 이중결합을 갖는다.
본원에서 사용되는 바와 같이, "재조합 숙주 세포" 또는 "조작된 숙주 세포"는 ω-하이드록실화 지방산 및 이관능성 지방산 유도체를 포함한 ω-하이드록실화 지방산 유도체를 생산하도록 변형된 숙주 세포, 예컨대, 미생물이다. 일부 구현예에서, 재조합 숙주 세포는 하나 이상의 폴리뉴클레오티드를 포함하며, 각각의 폴리뉴클레오티드는 ω-하이드록실라제 생합성 효소 활성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체를 암호화하고, 여기서, 재조합 숙주 세포는 폴리뉴클레오티드를 발현하는데 효과적인 조건하에서 탄소 공급원의 존재하에 배양되는 경우 ω-하이드록실화 지방산 및/또는 ω-하이드록실화 지방산 유도체 또는 이의 조성물을 생산한다.
본원에서 사용되는 용어 "클론"은 전형적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포의 그룹, 예를 들면, 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니의 박테리아를 나타낸다.
본원에서 사용되는 용어 "배양물"은 전형적으로 생존가능한 세포를 포함하는 액체 배지를 나타낸다. 하나의 구현예에서, 배양물은 제어된 조건 하에서 사전설정된 배양 배지에서 번식하는 세포를 포함하는 배양물, 예를 들면, 선택된 탄소원 및/또는 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포의 배양물을 포함한다.
용어 "배양하는" 또는 "배양"은 액체 또는 고체 배지에서 적절한 조건 하에 세포(예컨대, 미생물 세포)의 개체군을 성장시키는 것을 나타낸다. 특정 구현예에서, 배양은 기질에서 최종산물로의 발효성 생물전환을 나타낸다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 개별 성분들은 상업적 공급원으로부터, 예컨대, DIFCO 배지 및 BBL 배지 하에 이용 가능하다. 하나의 비제한적인 예에서, 수성 영양 배지는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함하는, YP 배지와 같은 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이다. 또한, 숙주 세포는, 예를 들면, 미국 특허 제5,000,000호; 제5,028,539호; 제5,424,202호; 제5,482,846호; 제5,602,030호 및 제WO2010127318호에 기재된 방법에 따라 탄소를 효율적으로 동화시키고 탄소 공급원으로서 셀룰로스 물질을 사용하도록 조작될 수 있다. 또한, 숙주 세포는 수크로스가 탄소 공급원으로서 사용될 수 있도록 인버타제(invertase)를 발현시키도록 조작될 수 있다.
본원에서 사용되는 용어 "이종 뉴클레오티드 서열을 발현하기에 효과적인 조건하에서"는 숙주 세포가 목적하는 지방산 유도체(예컨대, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)를 생산하도록 하는 선택적인 조건을 의미한다. 적합한 조건은, 예를 들면, 발효 조건을 포함한다.
본원에서 사용되는 바와 같이, 재조합 숙주 세포에서, 단백질, 예를 들면 효소의 "변형된" 또는 "변경된 수준의" 활성은 부모 또는 천연 숙주 세포에 비해 결정된 활성에서 하나 이상의 특징에 있어서의 차이를 나타낸다. 전형적으로 활성에 있어서의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 상응하는 야생형 숙주 세포 사이에 결정된다(예컨대, 야생형 숙주 세포에 비해 재조합 숙주 세포의 배양물의 비교). 변형된 활성은, 예를 들면, 재조합 숙주 세포에 의해 발현된 단백질의 변형된 양(예컨대, 단백질을 암호화하는 DNA 서열의 증가되거나 감소된 수의 카피, 단백질을 암호화하는 증가되거나 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가되거나 감소된 양의 단백질 번역의 결과로서); 단백질의 구조에 있어서의 변화(예컨대, 기질 특이성의 변화, 관찰된 동적 파라미터의 변화를 야기하는 단백질의 암호화 서열에 대한 변화와 같은 1차 구조에의 변화); 및 단백질 안정성에 있어서의 변화(예컨대, 단백질의 증가되거나 감소된 분해)의 결과일 수 있다. 일부 구현예에서, 폴리펩티드는 본원에 기재된 폴리펩티드 중의 어느 것의 돌연변이체 또는 변이체이다. 특정 예에서, 본원에 기재된 바와 같은 폴리펩티드에 대한 암호화 서열은 특정 숙주 세포에서 발현을 위해 최적화된 코돈이다. 예를 들면, 대장균에서의 발현을 위해, 하나 이상의 코돈이 최적화될 수 있다(Grosjean et al. (1982) Gene 18:199-209).
본원에서 사용되는 용어 "조절 서열"은 전형적으로 궁극적으로 단백질의 발현을 조절하는 단백질을 암호화하는 DNA 서열에 작동가능하게-연결된, DNA의 염기 서열을 나타낸다. 조절 서열의 예는 RNA 프로모터 서열, 전사 인자 결합 서열, 전사 종결 서열, (인핸서 요소와 같은) 전사의 조절인자, RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예를 들면, 리보솜 결합 부위(예컨대, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequence) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함하지만, 이에 제한되지 않는다.
본원에서 사용되는 어구 "뉴클레오티드 서열의 발현이 야생형 뉴클레오티드 서열에 비해 변형된다"는 내인성 뉴클레오티드 서열의 발현 및/또는 활성 또는 이종 또는 비-천연 폴리펩티드-암호화 뉴클레오티드 서열의 발현 및/또는 활성의 수준에 있어서의 증가 또는 감소를 의미한다.
본원에서 사용되는 어구 "CYP153A-환원효소 하이브리드 융합 폴리펩티드 서열 변이체의 활성이 CYP153A-환원효소 하이브리드 융합 폴리펩티드 서열(즉, 폴리펩티드 주형)의 활성에 비해 변형된다"는 발현된 폴리펩티드 서열 주형과 비교하여 발현된 폴리펩티드 서열 변이체의 활성 수준에 있어서의 증가 또는 감소를 의미한다. 폴리펩티드 주형은 핵산 주형(즉, DNA 주형 서열)에 의해 암호화된다. 폴리펩티드 서열 주형의 예는 cyp153A가 환원효소 도메인과 융합되어 있는 하이브리드 cyp153A-RedRhF 융합 단백질 서열이다. 폴리펩티드 서열 주형의 또 다른 예는 서열 번호: 6이다. 폴리펩티드 서열 주형의 또 다른 예는 서열 번호: 38이다. 선택적인 폴리펩티드 서열은 변이체를 포함한 주형으로서 작용할 수 있다.
본원에서 사용되는 바와 같이, 폴리뉴클레오티드에 대해 용어 "발현하다"는 이것이 기능을 하도록 하는 것이다. 폴리펩티드(또는 단백질)을 암호화하는 폴리뉴클레오티드는, 발현되는 경우, 그 폴리펩티드(또는 단백질)를 생산하도록 전사 및 번역될 것이다. 본원에서 사용되는 용어 "과발현하다"는 동일한 조건하에서 상응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현함(또는 발현되도록 함)을 의미한다. 또 다른 구현예에서, 용어 "과발현"은 동일한 조건하에서 주형 폴리뉴클레오티드 또는 주형 폴리펩티드 서열을 발현하는 상응하는 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현함(또는 발현되도록 함)을 의미한다. 주형 폴리펩티드 서열의 예는 CYP153A-RedRhF-하이브리드 융합 폴리펩티드이다.
용어 "변경된 수준의 발현" 및 "변형된 수준의 발현"은 상호교환 가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드, 또는 지방산 유도체가 동일한 조건하에서 상응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다.
본원에서 사용되는 용어 "역가"는 숙주 세포 배양물의 단위 용적당 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 양을 나타낸다. 본원에 기재된 조성물 및 방법의 임의의 측면에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L (2g/L), 3g/L, 5g/L, 10g/L, 20g/L, 30g/L, 40g/L, 50g/L, 60g/L, 70g/L, 80g/L, 90g/L, 100g/L 또는 상기한 값들 중의 선택적인 두 개에 의해 경계된 범위의 역가로 생산된다. 또 다른 구현예에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 100g/L 초과, 200g/L 초과, 300g/L 초과, 또는 그 이상, 예를 들면, 500 g/L, 700 g/L, 1000 g/L, 1200 g/L, 1500 g/L, 또는 2000 g/L의 역가로 생산된다. 하나의 구현예에서, 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 역가는 5g/L 내지 200g/L, 10g/L 내지 150g/L, 20g/L 내지 120g/L, 25g/L 내지 110g/L 및 30g/L 내지 100g/L이다.
본원에서 사용되는 용어 "숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 수율"은 투입된 탄소 공급원이 숙주 세포에서 생성물(즉, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)로 전환되는 효율을 나타낸다. 본 발명의 방법에 따라 ω-OH 지방산 및/또는 ω-OH 지방산 유도체를 생산하도록 조작된 숙주 세포는 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 11%, 적어도 12%, 적어도 13%, 적어도 14%, 적어도 15%, 적어도 16%, 적어도 17%, 적어도 18%, 적어도 19%, 적어도 20 %, 적어도 21%, 적어도 22%, 적어도 23%, 적어도 24%, 적어도 25%, 적어도 26%, 적어도 27%, 적어도 28%, 적어도 29%, 또는 적어도 30% 또는 상기한 값들 중의 어느 두 가지에 의해 경계된 범위의 수율을 갖는다. 또 다른 구현예에서, ω-OH 지방산 및/또는 ω-OH 지방산 유도체는 30%, 40%, 50%, 60%, 70%, 80%, 90% 초과 또는 그 이상의 수율로 생산된다. 대안적으로, 또는 추가로, 수율은 약 30% 이하, 약 27% 이하, 약 25% 이하, 또는 약 22% 이하이다. 따라서, 수율은 상기한 종점 중의 어느 두 가지에 의해 경계될 수 있다. 예를 들면, 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 수율은 5% 내지 15%, 10% 내지 25%, 10% 내지 22%, 15% 내지 27%, 18% 내지 22%, 20% 내지 28%, 20% 내지 30%, 25% 내지 40%, 또는 그 이상일 수 있다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 예는 10% 내지 30%이다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 또 다른 예는 10% 내지 40%이다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 수율의 또 다른 예는 10% 내지 50%이다.
본원에서 사용되는 용어 "생산성"은 단위 시간당 숙주 세포 배양물의 단위 용적당 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 양을 나타낸다. 본원에 기재된 조성물 및 방법의 선택적인 측면에서, 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 생산성은 적어도 100 mg/L/시간, 적어도 200 mg/L/시간0, 적어도 300 mg/L/시간, 적어도 400 mg/L/시간, 적어도 500 mg/L/시간, 적어도 600 mg/L/시간, 적어도 700 mg/L/시간, 적어도 800 mg/L/시간, 적어도 900 mg/L/시간, 적어도 1000 mg/L/시간, 적어도 1100 mg/L/시간, 적어도 1200 mg/L/시간, 적어도 1300 mg/L/시간, 적어도 1400 mg/L/시간, 적어도 1500 mg/L/시간, 적어도 1600 mg/L/시간, 적어도 1700 mg/L/시간, 적어도 1800 mg/L/시간, 적어도 1900 mg/L/시간, 적어도 2000 mg/L/시간, 적어도 2100 mg/L/시간, 적어도 2200 mg/L/시간, 적어도 2300 mg/L/시간, 적어도 2400 mg/L/시간, 또는 적어도 2500 mg/L/시간이다. 또한, 생산성은 2500 mg/L/시간 이하, 2000 mg/L/OD600 이하, 1500 mg/L/OD600 이하, 120 mg/L/시간 이하, 1000 mg/L/시간 이하, 800 mg/L/시간 이하, 또는 600 mg/L/시간 이하일 수 있다. 따라서, 생산성은 상기 종점 중의 어느 두 가지에 의해 경계될 수 있다. 예를 들면, 생산성은 3 내지 30 mg/L/시간, 6 내지 20 mg/L/시간, 또는 15 내지 30 mg/L/시간일 수 있다. 본 발명의 방법에 따라 재조합 숙주 세포에 의해 생산된 ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 바람직한 생산성은 500 mg/L/시간 내지 2500 mg/L/시간, 또는 700 mg/L/시간 내지 2000 mg/L/시간로부터 선택된다.
용어 "총 지방 화학종(FAS): 및 "총 지방산 생성물"은 국제 특허 출원 공보 제WO 2008/119082호에 기재된 바와 같이 GC-FID에 의해 평가되는 바와 같이 샘플에 존재하는 ω-OH 지방산 및 지방산의 총 양과 관련하여 본원에서 상호교환 가능하게 사용될 수 있다.
본원에서 사용되는 용어 "글루코스 이용률"은 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양물에 사용되는 글루코스의 양을 의미한다.
용어 "재생가능한 공급원료로부터의 탄소 공급원"은, 단독으로 사용되거나 공급원과 관련하여 사용되는 경우, 유지화학물질(oleochemicals)(즉, 지방산, 지방산 에스테르, TAG, 하이드록시 지방산 등과 같은 식물 및 동물로부터의 정유) 및 석유화학물질(즉, 알칸, 알켄 등과 같은 석유로부터 유도된 화학물질)을 제외하고 탄소가 유래되는 (재생가능한 공급원료 및/또는 바이오매스 및/또는 노폐물을 포함하는) 선택적인 생물학적 물질을 포함한다. 따라서, 본원에서 사용되는 바와 같은 용어 "재생가능한 공급원료로부터의 탄소 공급원"은 유지화학물질 및 석유화학물질로부터 유래된 탄소를 제외한다. 일부 구현예에서, 탄소 공급원은 당류 또는 탄수화물(예컨대, 단당류, 이당류 또는 다당류)을 포함한다. 일부 구현예에서, 탄소 공급원은 글루코스 및/또는 수크로스이다. 또 다른 구현예에서, 탄소 공급원은 옥수수, 사탕수수 또는 목질계 바이오매스로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물; 또는 바이오매스 또는 천연 가스와 같은 유기 재료의 재형성물; 또는 광합성적으로 고정된(fixed photosynthetically) 이산화탄소와 같은 재생가능한 공급원료로부터 유도된다. 또 다른 구현예에서, 바이오매스는 탄소 공급원으로 가공되고, 이것은 생물전환에 적합하다. 여전히 또 다른 구현예에서, 바이오매스는 탄소 공급원으로의 추가적인 가공을 필요로 하지 않지만, 탄소 공급원으로서 바로 사용될 수 있다. 이러한 바이오매스의 예시적인 공급원은 스위치그래스와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 탄소 공급원은 동물성 물질[예컨대, 우분(cow manure)]과 같은 대사 노폐물을 포함한다. 추가의 예시적인 탄소의 공급원은 조류(algae) 및 다른 해양 식물을 포함한다. (바이오매스를 포함하는) 또 다른 탄소 공급원은 발효 폐기물, 발효 바이오매스, 글리세롤/글리세린, 목초, 짚, 목재, 오수, 쓰레기, 마니플 고체 폐기물, 셀룰로스 도시 폐기물 및 음식 쓰레기를 포함하지만 이로 제한되지 않는 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다.
ω-OH 지방산 및 이의 유도체와 같은 생성물에 대해 본원에서 사용되는 용어 "단리된"은 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분리된 생성물을 나타낸다. 본원에 기재된 방법에 의해 생산된 지방산 및 이의 유도체(예컨대, ω-OH 지방산 및/또는 ω-OH 지방산 유도체)는 발효 브로쓰에서 뿐만 아니라 세포질에서도 비교적 비혼화성일 수 있다. 따라서, 지방산 및 이의 유도체는 세포내 또는 세포외에서 유기 상으로 수집될 수 있다.
본원에서 사용되는 용어 "정제하다", "정제된" 또는 "정제"는, 예를 들면, 단리 또는 분리에 의해 그 환경으로부터의 분자의 제거 또는 단리를 의미한다. "실질적으로 정제된" 분자는 이들이 연결된 다른 성분들로부터 적어도 약 60% 유리(예컨대, 적어도 약 70% 유리, 적어도 약 75% 유리, 적어도 약 85% 유리, 적어도 약 90% 유리, 적어도 약 95% 유리, 적어도 약 97% 유리, 적어도 약 99% 유리)된다. 본원에서 사용되는 바와 같이, 이들 용어는 또한 샘플로부터의 오염물의 제거를 나타낸다. 예를 들면, 오염물의 제거는 샘플에서 ω-OH 지방산 및/또는 ω-OH 지방산 유도체와 같은 지방산 유도체의 백분율의 증가를 유발할 수 있다. 예를 들면, 지방산 유도체가 재조합 숙주 세포에서 생산된 경우, 지방산 유도체는 숙주 세포 단백질 또는 다른 숙주 세포 물질의 제거에 의해 정제될 수 있다. 정제 후, 샘플 중의 지방산 유도체의 백분율은 증가된다. 용어 "정제하다", "정제된" 또는 "정제"는 절대 순도를 필요로 하지 않는 상대적인 용어이다. 따라서, 예를 들면, 지방산 유도체가 재조합 숙주 세포에서 생산된 경우, 정제된 지방산 유도체는 다른 세포 성분(예컨대, 핵산, 폴리펩티드, 지질, 탄수화물, 또는 기타의 탄화수소)으로부터 실질적으로 분리된 지방산 유도체이다.
세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 발현의 결과로서, 오메가-하이드록실화된 지방산 및 지방산 유도체 생산
촉매 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 12에 도시된다.
표 12: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된 개선된 변이체의 요약 (서열 번호: 38)
촉매 도메인의 조합 라이브러리에서 확인된 유익한 돌연변이(실시예 8, 상기 참조)는 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질 (높은 발현 수준에서 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질의 촉매 도메인의 조합 라이브러리)을 더욱 개선하기 위한 차기 조합 라이브러리를 위한 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 12에 도시된다.
표 13: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된, 더 높은 발현 수준의 개선된 변이체의 요약
환원효소 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체가 표 14에 도시된다.
표 14: cyp153A(G307A)-Red450RhF(A796V)의 환원효소 도메인의 조합 라이브러리에서 유래된 개선된 변이체
촉매적 및 환원효소 도메인(상기 실시예 8~10 참조)의 조합 라이브러리에서 확인된 유익한 돌연변이는 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R,G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98))의 촉매적 및 환원효소 도메인의 조합 라이브러리)을 더욱 개선하기 위한 조합 라이브러리용 염기였다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다. 개선된 변이체가 표 15에 도시된다.
표 15: cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 및 환원효소 도메인의 조합 라이브러리 유래의 개선된 변이체.
표 12~15를 고려하여, 다양한 구현예에서 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, 예를 들면, 서열 번호: 38, 또는 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교해보면, 지방산(유도체)의 ω-하이드록실화된 지방산 또는 ω-OH 지방산 유도체로의 전환에 촉매작용을 일으킬 경우, ω-하이드록시 지방산(ω-OH FFA 역가)의 양 증가를 허용한다. 따라서, 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 예를 들면, 서열 번호: 38, 또는 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 지방산(유도체)의 ω-하이드록시 지방산 또는 ω-OH 지방산 유도체로의 전환의 증가를 허용한다.
본 발명은 숙주 세포에서 ω-OH 지방산 및 ω-OH 지방산 유도체의 생산을 제공한다. ω-OH 지방산 생산은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현의 결과로서 증진될 수 있다. 예를 들면, 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 또는 예를 들면, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 더 높은 역가로 ω-OH 지방산 유도체를 생산한다. 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 예컨대, 서열 번호: 42 및/또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 보다 높은 역가에서의 ω-OH 지방산 유도체를 생산한다. 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 예컨대, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 보다 높은 역가에서의 ω-OH 지방산 유도체를 생산한다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 ω-OH 지방산 유도체의 생산을 위해 생합성 경로에 관련되고; 이것은 단독으로 또는 다른 효소와 함께 사용될 수 있다. 예를 들면, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 조직된 생합성 경로에서 사용될 수 있으며, 여기서, 티오에스테라제(즉, 자연적으로 또는 이종으로/외인성으로 발현된) 효소가 아실-ACP 또는 아실-CoA를 지방산으로 전환시킨다. 그후, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산을 ω-OH 지방산으로 전환시킬 수 있다(도 1 참조). 경로에서 추가의 효소는 ω-OH 지방산을 다른 이관능성 지방산 유도체, 예를 들면, α,ω-이산으로 전환시킬 수 있다.
더욱 특이적으로, 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 폴리펩티드 서열이며,6, 그리고 이는 ω-OH 지방산 및 지방산 유도체의 생산을 위한 개선된 효소 활성으로 변이체를 생성하도록 돌연변이를 도입하는 주형 서열로서 작용한다. 서열 번호: 6의 CYP153A-환원효소 하이브리드 융합 폴리펩티드는, 글리신이 알라닌으로 치환된 위치 307의 촉매 도메인에서 돌연변이를 갖는 P450 Cyp153A(G307A)-RedRhF 융합 단백질이다(도 3 참조). 이러한 단백질은 자족성이며, 지방산에서 ω-OH 지방산으로의 반응을 촉매하는 ω-하이드록실라제 효소 활성을 갖는다.
본 개시내용의 다양한 구현예에서, 본 개시내용에 의해 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 자기-충분하고, 지방산(유도체)의 ω-OH 지방산 (유도체)로의 반응에 촉매작용을 일으키는 ω-하이드록실라제 효소 활성을 보유한다. 본 개시내용의 다양한 구현예에서, 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산 (유도체)의 ω-OH 지방산 (유도체)로의 반응을 촉진시키는 ω-하이드록실라제 효소 활성을 가지며, 이는 예컨대, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 ω-하이드록실라제 효소 활성과 비교하여 더 높다. 본 개시내용의 다양한 구현예에서, 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산 (유도체)의 ω-OH 지방산 (유도체)로의 반응을 촉진시키는 ω-하이드록실라제 효소 활성을 가지며, 이는 예컨대, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 ω-하이드록실라제 효소 활성과 비교하여 더 높다. 본 개시내용의 다양한 구현예에서, 본 개시내용에 의하여 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산 (유도체)의 ω-OH 지방산 (유도체)로의 반응을 촉진시키는 ω-하이드록실라제 효소 활성을 가지며, 이는 예컨대, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 ω-하이드록실라제 효소 활성과 비교하여 더 높다.
일 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아미노산 위치 796, 141, 231, 27, 82, 178, 309, 407, 415, 516 및/또는 666 또는 이의 조합에 돌연변이을 포함하지만 이에 제한되지 않는, 이의 환원효소 도메인 중의 적어도 하나의 추가 돌연변이를 갖는 변형된 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 나타낸다. 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 상응하는 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체 또는 이의 조성물의 개선된 역가, 수율 및/또는 생산성을 유발한다.
CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 예시는 하기이다: 서열 번호: 38, 이는 알라닌이 발린으로 교체되는 위치 796의 환원효소 도메인에서 하나의 추가의 돌연변이를 갖는다(도 4 참조). 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 폴리펩티드 서열을 가지며, 이것은 또한 추가의 돌연변이 또는 추가의 변이체를 생성하는 주형 서열로서 작용한다. 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는, P450 Cyp153A(G307A)-RedRhF(A796V) 융합 단백질(도 5 참조)이고, 촉매 도메인(G307A)에서 하나의 돌연변이를 가지며, 환원효소 도메인(A796V)에서 하나의 돌연변이를 갖고, 자기-충분하며 지방산의 ω-OH 지방산으로의 반응에 촉매작용을 일으키는 ω-하이드록실라제 효소 활성을 보유한다. 일 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 그것의 촉매 및/또는 환원효소 도메인 중 그것의 아미노산 서열에서 적어도 1종의 추가의 돌연변이, 예컨대 비제한적으로 아미노산 위치 9, 10, 11, 12, 13, 14, 27, 28, 61, 77, 119, 140, 141, 149, 157, 159, 231, 233, 244, 254, 271, 309, 327, 407, 413, 451, 480, 527, 544, 557, 567, 591, 648, 649, 703, 706, 719, 745, 747, 749, 757, 770, 771 및 784 또는 이들의 조합(예를 들면, 그와 같은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 핵산 및 단백질 서열을 가리키는 서열 번호: 47-164 참조)에서 돌연변이를 갖는 변형된 CYP153A-환원효소 하이브리드 융합 폴리펩티드이다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 서열 번호: 38 (즉, 주형 변이체) (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 서열 번호: 6 (즉, 주형 변이체)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 예를 들어, 서열 번호: 42 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 예를 들어, 서열 번호: 46 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다. 일 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, 예를 들어, 서열 번호: 98 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현과 비교하는 경우, ω-OH 지방산 및/또는 ω-OH 지방산 유도체의 개선된 역가, 수율 및/또는 생산성을 유발한다.
세포가 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체로 형질전환되는 경우 이것은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포(예컨대, 재조합 세포)이다. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현시키는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체, 특히 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현시키는 상응하는 세포의 그것에 적어도 2배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 대장균 (Escherichia coli)과 같은 숙주에서, ω-OH 지방산은 자연적으로 또는 이종으로 발현된 효소에 의해 이관능성 지방산 유도체로 전환될 수 있다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 1배, 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 또는 적어도 약 10배 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 템플릿화 변이체, 특히, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 것보다 적어도 약 1배, 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 또는 적어도 약 10배 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 수율의 적어도 두 배이다. 하나의 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는, 주형 또는 참조 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는, 상응하는 세포의 그것보다 적어도 약 1퍼센트, 적어도 약 2퍼센트, 적어도 약 3퍼센트, 적어도 약 4퍼센트, 적어도 약 5퍼센트, 적어도 약 6퍼센트, 적어도 약 7퍼센트, 적어도 약 8퍼센트, 적어도 약 9퍼센트, 또는 적어도 약 10퍼센트 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체를 발현하는 상응하는 세포의 그것보다 적어도 약 1퍼센트, 적어도 약 2퍼센트, 적어도 약 3퍼센트, 적어도 약 4퍼센트, 적어도 약 5퍼센트, 적어도 약 6퍼센트, 적어도 약 7퍼센트, 적어도 약 8퍼센트, 적어도 약 9퍼센트, 또는 적어도 약 10퍼센트 더 높다. 또 다른 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는 세포에 의해 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체를 발현하는 상응하는 세포의 그것보다 적어도 약 1퍼센트, 적어도 약 2퍼센트, 적어도 약 3퍼센트, 적어도 약 4퍼센트, 적어도 약 5퍼센트, 적어도 약 6퍼센트, 적어도 약 7퍼센트, 적어도 약 8퍼센트, 적어도 약 9퍼센트, 또는 적어도 약 10퍼센트 더 높다.
또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현으로 인해 재조합 세포에서 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트 내지 적어도 약 80퍼센트 더 높다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현으로 인해 재조합 세포에서 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트 내지 적어도 약 80퍼센트 더 높다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현으로 인해 재조합 세포에서 생산된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트 내지 적어도 약 80퍼센트 더 높다.
일부 구현예에서, 세포에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다. 기타 구현예에서, 본 개시내용의 세포 또는 재조합 미생물에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체, 특히, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다. 기타 구현예에서, 본 개시내용의 세포 또는 재조합 미생물에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 42, 또는 서열 번호: 46의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다. 기타 구현예에서, 본 개시내용의 세포 또는 재조합 미생물에 의해 생산된 ω-OH 지방산의 역가 및/또는 수율은, 예를 들어, 서열 번호: 98의 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 상응하는 세포의 그것보다 적어도 약 20퍼센트, 적어도 약 25퍼센트, 적어도 약 30퍼센트, 적어도 약 35퍼센트, 적어도 약 40퍼센트, 적어도 약 45퍼센트, 적어도 약 50퍼센트, 적어도 약 55퍼센트, 적어도 약 60퍼센트, 적어도 약 65퍼센트, 적어도 약 70퍼센트, 적어도 약 75퍼센트, 적어도 약 80퍼센트, 적어도 약 85퍼센트, 적어도 약 90퍼센트, 적어도 약 95퍼센트, 적어도 약 97퍼센트, 적어도 약 98퍼센트, 또는 적어도 약 100퍼센트 더 높다.
따라서, 본 개시내용은 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하여 ω-OH 지방산 또는 이의 유도체를 생산하도록 조작된 재조합 숙주 세포를 제공한다. 그와 같은 변이체의 예들이 순차적으로 표 A, B 및 C(하기)에 묘사되었다. 일 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드-발현 숙주 세포, 즉 예를 들면, 서열 번호: 6, 서열 번호: 38, 서열 번호: 42, 또는 서열 번호: 46을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 일 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드-발현 숙주 세포, 즉 예를 들면, 서열 번호: 98에 기반한, CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉, 서열 번호: 38을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉, 서열 번호: 6을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉 예를 들면, 서열 번호: 42을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉 예를 들면, 서열 번호: 46을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 또 다른 구현예에서, ω-OH 지방산의 생합성은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체-발현 숙주 세포, 즉 예를 들면, 서열 번호: 98을 기반으로 하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 또는 동일한 효소 기능을 갖는 다른 폴리펩티드를 발현시키는 숙주 세포와 비교하여 증진된다. 각종 상이한 숙주 세포들이 본원에 기재된 바와 같은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하도록 변형될 수 있으며, 이것이 ω-OH 지방산 및 ω-OH 지방산 유도체 또는 이의 조성물의 증진된 생산에 적합한 재조합 숙주 세포를 야기한다. 생산된 ω-OH 지방산의 예시는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산이다. 일 구현예에서, 이와 같은 ω-OH 지방산은 ω-OH C8:0 지방산, ω-OH C10:0 지방산, ω-OH C12:0 지방산, ω-OH C14:0 지방산, ω-OH C16:0 지방산, ω-OH C18:0 지방산, ω-OH C20:0 지방산, ω-OH C8:1 지방산, ω-OH C10:1 지방산, ω-OH C12:1 지방산, ω-OH C14:1 지방산, ω-OH C16:1 지방산, ω-OH C18:1 지방산, ω-OH C20:1 지방산 및 기타 동종의 것이다. 본원에 기재된 바와 같은 재조합 숙주 세포에서 사용하기에 적합한 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 포함하는 각종 세포들이 유전 물질의 공급원을 제공할 수 있는 것으로 이해된다.
경로 조작 및 효소 활성
지방산 합성은 박테리아 생합성 기구의 가장 잘 보존된 시스템들 중 하나이다. 지방산 신타제 (FAS) 다중-효소 복합체는 모든 박테리아 및 진핵생물에 존재한다. FAS 관련 유전자들의 대부분은 세포 성장 및 생존에 필수적이다. 진핵생물 및 박테리아 FAS는 본질적으로 동일한 타입의 생화학적 형질전환을 구현한다. 진핵생물에서, FAS는 FAS I라고 하며, 이의 촉매 도메인들의 대부분은 하나의 폴리펩티드 사슬(비-해리성)에 의해 암호화된다. 박테리아와 같은 원핵생물에서, FAS는 FAS II라고 하며, 이의 개개의 효소들 및 운반 단백질들은 별개의(해리성) 단백질에 대해 암호화하는 별도의 유전자에 의해 암호화된다. 이와 같이, FASII는 상당한 변동 및 뚜렷한 특이성을 갖는 복합 시스템이다.
FAS 경로에서의 효소와 함께 아실기 운반 단백질(ACP)이 원래의(native) 유기체에서 생산된 지방산의 길이, 포화도 및 분지화를 조절한다. 이 경로에서의 단계들이 아세틸-CoA 카복실라제(ACC) 유전자 패밀리 및 지방산 생합성(FAB)의 효소에 의해 촉매된다. 예를 들면, FAS 경로에 포함될 수 있는 효소는 AccABCD, FabD, FabH, FabG, FabA, FabZ, FabI, FabK, FabL, FabM, FabB, 및 FabF를 포함한다. 목적하는 생성물에 따라, 이러한 유전자들 중 하나 이상이 감쇠되거나 과발현될 수 있다. 이와 같이, 원핵생물은 글루코스 또는 다른 탄소 공급원과 같은 재생가능한 공급원료로부터의 지방산 유도체의 생성을 증가시키도록 조작되었다. 여기서 주요 목표는 박테리아 균주를 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 및 지방 알콜(FALC)을 포함한, 지방산 유도체 생산을 위한 미생물 공장(microbial factory)으로 전환시키기 위해 지방산 유도체들의 생산을 조절하는 주요 조절 효소의 활성을 증가시키는 것이다(예컨대, 본원에 참고로 포함된 미국 특허 제8,283,143호 참조).
본 발명은 ω-OH 지방산 및 ω-OH 지방산 유도체와 같은 바람직한 화합물의 생산을 위한 효소 경로를 변형시키기 위해 효소 기능의 폴리펩티드를 암호화하는 CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드를 식별한다. 본원에서 효소 수탁 번호(EC 번호)에 의해 식별되는 이러한 폴리펩티드들은 ω-OH 지방산 및 기타의 이관능성 분자, 예를 들면, α,ω-이산과 같은 ω-OH 지방산 유도체의 생산을 유도하는 지방산 경로들을 조작하는데 유용하다(도 1 참조).
하나의 구현예에서, ω-OH 지방산 유도체를 생산하기 위해 글루코스와 같은 재생가능한 공급원료로부터 유도된 탄소 공급원을 사용하는 경로가 도 1에 도시되어 있다. 탄수화물(예컨대, 글루코스)은 원래의 유기체에 의해 아실-ACP와 같은 아실-티오에스테르로 전환된다(도 1의 단계 1 참조). 지방산 분해 효소 활성을 갖는 폴리펩티드에 대해 암호화하는 폴리뉴클레오티드는 목적하는 생성물에 따라 선택적으로 감쇠될 수 있다(하기 실시예 참조). 이러한 폴리펩티드의 비제한적인 예는 아실-CoA 합성효소(FadD) 및 아실-CoA 데하이드로게나제(FadE)이다. 표 1은 당업계에 공지된 방법에 따라 선택적으로 감쇠될 수 있는 다양한 지방산 분해 효소를 포함한, 대사 경로 내의 효소 활성(하기)의 광범위한 목록을 제공한다(예컨대, 상기 미국 특허 제8,283,143호 참조).
예를 들면, FadR(하기 표 1 참조)은 지방산 분해 및 지방산 생합성 경로에 관련된 주요 조절 인자이다(Cronan et al. , Mol . Microbiol . , 29(4):937-943 (1998)). 대장균 효소 FadD(하기 표 1 참조) 및 지방산 수송 단백질 FadL은 지방산 흡수 시스템의 성분이다. FadL은 지방산의 박테리아 세포로의 수송을 매개하고, FadD는 아실-CoA 에스테르의 형성을 매개한다. 다른 탄소 공급원이 이용가능하지 않을 때, 외인성 지방산이 박테리아에 의해 흡수되고 아실-CoA 에스테르로 전환되며, 이것은 전사 인자 FadR에 결합할 수 있고, 지방산 수송(FadL), 활성화(FadD) 및 β-산화(FadA, FadB 및 FadE)를 담당하는 단백질을 암호화하는 fad 유전자의 발현을 저하시킬 수 있다. 대안적인 탄소 공급원들이 이용가능할 때, 박테리아가 아실-ACP로서 지방산을 합성하며, 이것이 인지질 합성에 사용되지만 β-산화에 대한 기질은 아니다. 따라서, 아실-CoA 및 아실-ACP는 둘 다 상이한 최종산물을 야기할 수 있는 지방산의 독립적인 공급원들이다(Caviglia et al. , J. Biol. Chem. , 279(12):1163-1169 (2004)).
표 1:효소 활성
도 1은 아실-ACP와 같은 아실 티오에스테르가 전구물질 중간체로서 C12 또는 C16:1 지방산(FFA)으로 전환될 수 있는 예시적인 경로를 보여준다. 도 1의 단계 1에서, 티오에스테라제가 아실-ACP를 FFA로 전환시키는데 사용된다. 특정 구현예에서, 티오에스테라제를 암호화하는 유전자는 tesA, 'tesA, tesB, fatB1, fatB2, fatB3, fatA1, 또는 fatA이다(또한 이 단계를 촉매하는데 사용될 수 있는 티오에스테라제의 효소 활성을 갖는 폴리펩티드를 보여주는 상기 표 1 참조). 단계 2에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 또는 이의 변이체가 지방산으로부터 ω-OH 지방산(ω-OH FFA)을 생성하는데 사용된다. 다른 이관능성 분자, 예를 들면 α,ω-이산 또는 다른 ω-OH 지방산 유도체가 경로에 존재하는 효소 관능기에 따라 경로의 다운스트림에서 생산될 수 있다.
CYP153A-환원효소 하이브리드 융합 폴리펩티드
ω-하이드록실라제(또는 ω-옥시게나제)는 특정 비-햄(non-heme) 이철 옥시게나제(예컨대, 슈도모나스 퓨티다(Pseudomonas putida) GPo1로부터의 alkB) 및 특정 햄-타입 P450 옥시게나제(예컨대, 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 cyp153A와 같은 ω-하이드록실라제)를 포함한다. P450은 편재하여 분포된 효소이며, 높은 복잡성을 갖고 광범위한 활성을 나타낸다. 이들은 광범위하게 다양한 기질을 전환시키고 다양한 화학적 반응을 촉매하는 유전자들의 상과(superfamily)에 의해 암호화되는 단백질이다. Cyp153A는 ω-위치에 대해 높은 선택성을 갖는 탄화수소 쇄를 하이드록실화하는 가용성 박테리아 사이토크롬 P450의 아과(sub-family)이다(van Beilen et al. (2006) Appl. Environ. Microbiol. 72:59-65). cyp153A 패밀리의 구성원들, 예를 들면 마이코박테리움 종(Mycobacterium sp.) HXN-1500으로부터의 cyp153A6(Funhoff et al. (2006) J. Bacteriol . 188:5220-5227), 마이코박테리움 마리눔(Mycobacterium marinum)으로부터의 cyp153A16 및 폴라로모나스 종(Polaromonas sp .) JS666으로부터의 cyp153A(Scheps et al. (2011) Org . Biomol . Chem . 9:6727-6733) 뿐만 아니라 마리노박터 아쿠애올리(Marinobacter aquaeoli)로부터의 cyp153A(Honda-Malca et al. (2012) Chem. Commun. 48:5115-5117)는 알칸, 지방산 또는 지방 알콜의 ω-위치를 선택적으로 하이드록실화하는 것으로 시험관내에서 나타났다. 아래 표 2A 및 2B는 ω-OH 지방산 및 ω-OH 지방산 유도체를 생산하는데 사용될 수 있는 ω-하이드록실라제 효소 활성을 갖는 효소 및 산화환원 파트너의 예를 보여준다.
표 2A:ω-하이드록실라제 효소 활성(P450)(EC 1.14.15.3)의 예
표 2B:ω-하이드록실라제 효소 활성(P450)(EC 1.14.15.3)에 대한 산화환원 파트너의 예
모든 사이토크롬 P450과 마찬가지로, Cyp153A ω-하이드록실라제는 이들의 촉매 활성을 위해 전자를 필요로 하며, 이것은 페레독신 및 페레독신 환원효소와 같은 특이 산화환원 단백질을 통해 제공된다. 이들은 cyp153A와 상호작용하는 별개의 단백질이다. 자족성 하이브리드(키메라성) cyp153A 옥시게나제(즉, 활성을 위해 별개의 페레독신 및 페레독신 환원효소 단백질을 필요로 하지 않는 옥시게나제)는 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis) SK2로부터의 cyp153A (Kubota et al. (2005) Biosci. Biotechnol. Biochem. 69:2421-2430; Fujita et al. (2009) Biosci. Biotechnol. Biochem. 73:1825-1830)를 플라빈 모노뉴클레오티드(FMN) 및 NADPH-결합 부위 및 [2FeS] 페레독신 중심을 포함하는 P450RhF로부터의 환원효소 도메인과 융합함으로써 이전에 생성되었다(Hunter et al. (2005) FEBS Lett. 579:2215-2220)는 알칸, 지방산 또는 지방 알콜의 ω-위치를 선택적으로 하이드록실화하는 것으로 시험관내에서 나타났다. P450RhF는 I형 P450-융합된 PFOR에 속한다(DeMot and Parret (2003) Trends Microbiol. 10:502). 이러한 하이브리드 cyp153A-RedRhF 융합 단백질은 시험관내 생물형질전환에서 ω-위치에서 옥탄을 하이드록실화하고 또한 사이클로헥산 또는 부틸벤젠과 같은 다른 화합물을 하이드록실화하는 것으로 나타났다. 또 다른 자족성 하이브리드(키메라성) cyp153A 옥시게나제는 마리노박터 아쿠애올리(Marinobacter aquaeoli)로부터의 cyp153A를 P450RhF 및 P450-BM3으로부터의 환원효소 도메인과 융합시킴으로써 생성되었다(Scheps et al. (2013) Microb. Biotechnol. 6:694-707)는 알칸, 지방산 또는 지방 알콜의 ω-위치를 선택적으로 하이드록실화하는 것으로 시험관내에서 나타났다. 천연 P450-환원효소 융합 단백질의 예가 아래 표 2C 및 2D에 도시된다.
표 2C:자족성 ω-1, ω-2, ω-3-하이드록실라제 (EC 1. 14. 14. 1) 융합 단백질의 예
표 2D:자족성 I형 P450-융합된 PFOR 융합 단백질의 예
탄화수소 쇄의 ω-위치에 대한 이들의 높은 선택성을 고려하면, cyp153A 계열 옥시게나제는 재생가능한 탄소 공급원으로부터 α,ω-이관능성 지방산 유도체를 생산하기 위한 적합한 후보물질의 우수한 예인 것으로 보인다. 이것은 상업적으로 실현가능한 공정들의 개발이 이러한 귀중한 화합물들을 생성할 수 있게 할 것이다. 그럼에도, 다른 사이토크롬 P450과 마찬가지로, cyp153A 계열 단백질은 정제된 효소 또는 원 세포 용해물을 갖는 시험관내 실험에 또는 지방산 유도체 또는 탄화수소이 외인성으로 추가되는 휴지 세포 생물형질전환에 지금까지 대부분 적용되었다(Kubota et al. , Fujita et al. , Honda-Malca et al. , Scheps et al. , 상기). 그러나, 하이브리드 융합-사용 시험관내 과정 또는 휴지 세포 생물형질전환은 ω-하이드록시 지방산 유도체의 대규모의 비용-효율적인 생산에 도움이 되지 않는다. 당업계에서 널리 수용되는 지식은, 다수의 사이토크롬 P450 뿐만 아니라 alkB-타입 ω-하이드록실라제가 재조합 미생물에서 기능적으로 발현하기가 쉽지 않은데, 그 이유는 효소가 종종 불활성이고 이들의 화학작용이 규명하기가 어렵기 때문이다. 사실상, 지금까지 시도된 지방산-유도체 이외의 재생가능한 탄소 공급원을 사용하는 유일한 생체내 작업에서는 alkB ω-하이드록실라제를 사용하였으며 높은 세포 밀도 발효에서 단지 낮은 역가의 ω-하이드록시 지방산 유도체를 달성하였다(WO2013/024114A2).
본 발명은 재생가능한 탄소 공급원으로부터 생체내에서 ω-하이드록시 지방산 유도체를 효율적으로 생산할 수 있는 CYP153A-환원효소 하이브리드 융합 단백질 변이체를 제공한다. 보다 구체적으로, 알라닌(A)이 위치 307에서 글리신(G)을 치환하는 CYP153A (G307A) P450 촉매 도메인의 하이브리드 융합 단백질을 암호화하는 마리노박터 아쿠애올리(Marinobacter aquaeoli)로부터의 유전자를 링커 폴리펩티드를 통하여 로도코쿠스 종(Rhodococcus sp .) NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 환원효소 도메인을 암호화하는 유전자와 융합시켰다. 수득된 폴리펩티드는 하기이다: CYP153A-RedRhF 하이브리드 융합 폴리펩티드 (서열 번호: 6, 참고: 도 3) (하기를 가짐: 상응하는 핵산 서열 (서열 번호: 5). 이러한 CYP153A-환원효소 하이브리드 융합 단백질이 대장균에서 발현되는 경우, 글루코스 지방산 유도체와 같은 단순 탄소 공급원을 갖는 세포가 ω-하이드록시 지방산 유도체로 효율적으로 전환되었다(실시예 1 참조). 유사한 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 생성하는데 사용될 수 있는 적합한 ω-하이드록실라제(EC 1.14.15.3) 및 이들의 산화환원 파트너에 대한 또 다른 예가 표 2A 및 2B에 열거되어 있다(상기 참조).
CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체
본 개시내용은 숙주 세포에서 발현된 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 특히 숙주 세포에서 발현된 예를 들면, 서열 번호: 6, 서열 번호: 38, 서열 번호: 42, 서열 번호: 46 및 서열 번호: 98 중 어느 하나의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 그리고 좀 더 구체적으로 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 더 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체를 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 식별한다: 서열 번호: 38 (숙주 세포 중 발현됨). 다양한 구현예에서, 본 개시내용은 숙주 세포에서 발현된 예를 들면, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 더 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체 조성물을 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 42, 서열 번호: 46, 또는 서열 번호: 98 (숙주 세포 중 발현됨). 본 발명의 비제한적인 실시예(하기 실시예 1-7 참조)에서 하이브리드 CYP153A(G307A)-RedRhF 융합 폴리펩티드(상기 참조)가 증가된 양의 ω-OH 지방산 및 ω-OH 지방산 유도체를 생산하도록 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 효율적으로 조작하는 주형으로서 사용되었다. 예를 들면, 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 글루코스와 같은 단순 탄소 공급원으로부터 생체내에서 도데칸산과 같은 화합물을 12-하이드록시 도데칸산으로 효율적으로 전환시킬 수 있다. 예를 들면, 재생가능한 공급원료로부터 유도되는 것과 같은 어떠한 단순 탄소 공급원도 적합하다. 조작된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체(즉, 조작된 CYP153A-RedRhF 하이브리드 융합 폴리펩티드 변이체를 통해 예시됨)가 재생가능한 공급원료로부터 글루코스와 같은 탄소 공급원을 사용함으로써 대장균과 같은 숙주 세포에서 티오에스테라제와 공동-발현되는 경우 생체내에서 지방산을 ω-OH 지방산을 포함한 특정의 바람직한 화합물로 전환시킬 수 있는 것으로 나타났다(하기 실시예들 참조). 본 발명을 따름으로써, 다른 하이브리드 융합 폴리펩티드 변이체는 CYP153A 촉매 도메인을 암호화하는 유전자와 같은 돌연변이화된 유전자를 c-말단 환원효소 도메인을 암호화하는 돌연변이화된 유전자에 결합시킴으로써 조작될 수 있다(상기 표 2A 내지 2D 또한 도 5 참조). 예를 들면, 유전자 둘 다(P5450 촉매 도메인 및 환원효소 도메인)를 돌연변이시키거나 하나의 유전자(P450 촉매 도메인 또는 환원효소 도메인)를 돌연변이시키는 변형이 본원에 포함된다. 이러한 지침에 따라, 유사한 융합 단백질 변이체들이 다른 타입의 ω-하이드록실라제로부터 생성될 수 있다.
따라서, 본 개시내용은 숙주 세포에서 발현된 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 특히 숙주 세포에서 발현된 예를 들면, 서열 번호: 6, 서열 번호: 38, 서열 번호: 42, 서열 번호: 46 및 서열 번호: 98 중 어느 하나의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 그리고 좀 더 구체적으로 숙주 세포에서 발현된 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체를 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다: 서열 번호: 38 (숙주 세포 중 발현됨). 다양한 구현예에서, 본 개시내용은 숙주 세포에서 발현된 예를 들면, 하기의 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 높은 역가, 수율 및/또는 생산성의 ω-하이드록실화된 지방산 유도체 조성물을 유발하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다: 서열 번호: 42, 서열 번호: 46, 또는 서열 번호: 98 (숙주 세포 중 발현됨). CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 CYP153A 도메인 또는 환원효소 도메인 또는 둘 다에 하나 이상의 돌연변이를 갖는다. 일 구현예에서, 본 개시내용은 하기를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 제공한다: 서열 번호: 6 (참고: 도 3)과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성, 및 27, 82, 141, 178, 231, 309, 407, 415, 516, 666 및/또는 796으로 이루어진 그룹으로부터 선택된 아미노산 위치에 하나 이상의 돌연변이 (여기서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 ω-OH 지방산으로의 전환을 촉매함). 보다 구체적으로, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아르기닌(R)이 리신(L)으로 치환된 R27L; 아르기닌(R)이 아스파르트산(D)으로 치환된 위치 R82D; 발린이 이소류신(I)으로 치환된 위치 V141I; 발린(V)이 글루타민(Q)으로 치환된 위치 V141Q; 발린(V)이 글리신(G)으로 치환된 위치 V141G; 발린(V)이 메티오닌(M)으로 치환된 위치 V141M; 발린(V)이 류신(L)으로 치환된 위치 V141L; 발린(V)이 트레오닌(T)으로 치환된 위치 V141T; 아르기닌(R)이 아스파라긴(N)으로 치환된 위치 R178N; 알라닌(A)이 트레오닌(T)으로 치환된 위치 A231T; 아스파라긴(N)이 아르기닌(R)으로 치환된 위치 N309R; 아스파라긴(N)이 알라닌(A)으로 치환된 위치 N407A; 발린(V)이 아르기닌(R)으로 치환된 위치 V415R; 트레오닌(T)이 발린(V)으로 치환된 위치 T516V; 프롤린(P)이 알라닌(A)으로 치환된 위치 P666A; 프롤린(P)이 아스파르트산(D)으로 치환된 위치 P666D; 및 알라닌(A)이 발린(V)으로 치환된 위치 A796V를 포함한 하나 이상의 상기 돌연변이를 갖는다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 예시는 하기를 포함한다: 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44 및 서열 번호: 46. 하나의 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하이브리드 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 상응하는 숙주 세포에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 ω-OH 지방산 또는 이의 조성물의 역가에 비해 더 높은 역가의 ω-OH 지방산 유도체 또는 이의 조성물을 야기한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 돌연변이 V141I 및/또는 V141T를 포함한 아미노산 위치 141에 돌연변이를 갖는다. 본원에서, 돌연변이 V141I 또는 V141T를 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현은, CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의하여 생산된 ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 역가와 비교하여, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산, 각각의 보다 높은 역가를 유발한다. 일 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 V141I 및 A231T (서열 번호: 32), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 R27L, R82D, V141M, R178N 및 N407A (서열 번호: 34), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 P666A (서열 번호: 36), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 A796V (서열 번호: 38) (환원효소 도메인 중 (참고: 도 5)), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 A796V, P666D 및 T516V (서열 번호: 40) (환원효소 도메인 중), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 V141I 및 A231T (이의 촉매 도메인 중) 및 돌연변이 A796V (이의 환원효소 도메인 중 (서열 번호: 42)), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 R27L, R82D, V141M, R178N 및 N407A (이의 촉매 도메인 중) 및 돌연변이 A796V (이의 환원효소 도메인 중 (서열 번호: 44), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 하기를 가지며: 돌연변이 V141T 및 A231T (이의 촉매 도메인 중) 및 돌연변이 A796V (이의 환원효소 도메인 중 (서열 번호: 46), 그리고 티오에스테라제의 효소 활성을 갖는 숙주 세포 내 발현될 경우, ω-OH C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산의 증가된 양을 생산한다. 일 구현예에서, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44 및 서열 번호: 46의 변이체는 서열 번호: 6과 비교하여, 더 많은 양의 ω-OH 지방산 또는 지방산 유도체를 생산하였다. 일 구현예에서, 이와 같은 ω-OH 지방산은 ω-OH C8:0 지방산, ω-OH C10:0 지방산, ω-OH C12:0 지방산, ω-OH C14:0 지방산, ω-OH C16:0 지방산, ω-OH C18:0 지방산, ω-OH C20:0 지방산, ω-OH C8:1 지방산, ω-OH C10:1 지방산, ω-OH C12:1 지방산, ω-OH C14:1 지방산, ω-OH C16:1 지방산, ω-OH C18:1 지방산, ω-OH C20:1 지방산 및 기타 동종의 것이다.
본 발명은 CYP153A-환원효소 하이브리드 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체를 식별한다. CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 및 46을 포함한다. CYP153A-환원효소 하이브리드 융합 핵산 변이체 (DNA 서열)은 서열 번호: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 및 47을 포함한다. 그러나, CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 대한 절대적인 서열 동일성이 필요한 것은 아님을 인지할 것이다. 예를 들면, 특정 폴리뉴클레오티드 서열에 있어서의 변화가 이루어질 수 있으며, 암호화된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 전형적으로, 예를 들면, 코돈 최적화를 통해서와 같은 보존적 돌연변이 및 잠재성 돌연변이를 포함한다. 변형된 또는 돌연변이화된(즉, 돌연변이체) 폴리뉴클레오티드 및 암호화된 변이체 폴리펩티드는 당업계에 공지된 방법을 사용하여 야생형 또는 주형 폴리펩티드에 비해 증가된 촉매 활성, 증가된 안정성, 또는 감소된 억제(예컨대, 감소된 피드백 억제)를 포함하지만 이에 제한되지 않는 개선된 기능과 같은 목적하는 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(EC) 번호에 따라 본원에 기재된 지방산 생합성 경로의 다양한 단계(즉, 반응)에 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드(예컨대, 특이 효소로서 기능하고 특이 효소 활성을 나타내는 것), 및 이러한 폴리펩티드를 암호화하는 예시적인 폴리뉴클레오티드를 제공한다. 서열 식별자 번호(상기 서열 번호)에 의해 본원에 식별된 이러한 예시적인 폴리펩티드 및 폴리뉴클레오티드가 도 1에 나타낸 것과 같은 숙주 세포에서 지방산 경로를 조작하는데 유용하다. 그러나, 본원에 기재된 폴리펩티드 및 폴리뉴클레오티드는 예시적이며, 따라서, 비제한적임을 이해해야 한다. 본원에 기재된 예시적인 폴리펩티드의 동족체의 서열이, 예를 들면, 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 공과 대학에 의해 제공되는 BRENDA 데이터베이스, 및 교토 대학과 도쿄 대학의 생물정보학 센터에 의해 제공된 KEGG 데이터베이스와 같은 데이터베이스를 사용하여 당업계의 숙련가들에게 이용 가능하며, 이들 모두는 월드 아이드 웹 상에서 이용 가능하다.
일 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44 및 서열 번호: 46과 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 알라닌(A)이 글리신(G) (촉매 도메인 중)을 대체하는 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터의 CYP153A (G307A) 폴리펩티드로부터 유도되고, 링커 펩티드를 통하여 로도코쿠스 종(Rhodococcus sp .) NCIMB9784로부터의 P450RhF의 환원효소 도메인과 융합된다. 사이토크롬 P450RhF는 자족성이며, 고도의 기질 무차별성을 나타내며 광범위한 관능 그룹을 촉매한다. 기타 구현예에서, 본 개시내용을 실시하는데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 또는 서열 번호: 46의 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는다. 또한, 본 명세서에서 기재된 바와 같이 유용한 특징 및/또는 특성을 유발하는 하나 이상의 치환을 포함할 수 있다. 기타 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 또는 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 또는 서열 번호: 46와 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는다. 여전히 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마이노박터 아쿠애올레이 이외의 유기체로부터 유도된다. 이와 같은 다른 유기체는, 비제한적으로, 아시네토박터 종, 마이코박테리움 마리넘, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 푼고룸, 카울로박터 크레스센투스, 하이포모나스 넵투니움, 도로슈도모나스 팔루스트리스, 스핑고모나스 종, 마이코박테리움 종을 포함한다. 또 다른 구현예에서, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 환원효소 도메인은 로도코쿠스 종 이외의 유기체에서 유래된다. 이와 같은 기타 유기체에는, 비제한적으로, 로도코쿠스 에퀴, 아시네토박터 라디오레시텐스, 버크홀데리아 말레이, 버크홀데리아 말레이, 랄스토니아 유트로파, 쿠프리아비두스 메탈리두란스가 포함된다.
관련된 구현예에서, 상기 개시내용은 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 또는 서열 번호: 47과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체를 포함한다. 일부 구현예에서 핵산 서열은 본원에 기재된 바와 같은 개선된 특징들 및/또는 특성들을 야기하는 하나 이상의 치환을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 암호화한다. 추가의 또 다른 관련 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 또는 서열 번호: 47과 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는 뉴클레오티드 서열에 의하여 암호화된다. 또 다른 측면에서, 본 개시내용은 실질적으로 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 또는 서열 번호: 47에 상응하는 핵산 서열의 전장에 걸쳐 엄격한 조건 하에 하이브리드화되는 핵산 서열에 의해 암호화된 아미노산 서열을 아우르는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 마리노박터 아쿠애올레이(Marinobacter aquaeolei)로부터 유도된다. 또 다른 구현예에서, P450 하이브리드 융합 폴리펩티드는 아시네토박터 종, 마이코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울로박터 크레센투스, 하이포모나스 넵투늄, 로도슈도모나스 팔루스트리스, 스핀고모나스 종, 마이코박테리움 종으로부터 유도된다.
추가의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체
본 발명은 추가의 CYP153A-환원효소 하이브리드 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체를 식별하며, 여기서, 변이체가 주형 (주형 변이체)로서 사용되었다. 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 주형 변이체(서열 번호: 38)은 P540 CYP153A(G307A)-Red450RhF(A796V) 융합 폴리펩티드를 기반으로 하고, 글리신(G)이 알라닌(A)로 대체되는 촉매 도메인에 돌연변이 G307A을, 그리고 알라닌(A)이 발린(V)으로 대체되는 환원효소 도메인에 돌연변이 A796V를 포함하되, 링커 폴리펩티드가 상기 촉매 도메인을 상기 환원효소 도메인에 연결한다(도 4 및 5 참조). 일부 구현예에서, 마리노박터 아쿠아에올레이에서 유래된 CYP153A 폴리펩티드는 로도코쿠스 종 NCIMB9784에서 유래된 P450RhF의 환원효소 도메인과 링커를 통해 융합된다. 상기 주지된 바와 같이, 사이토크롬 P450RhF는 자족성이며, 고도의 기질 무차별성을 나타내며 광범위한 관능 그룹을 촉매한다. 상기 촉매 도메인에서의 돌연변이 G307A와 상기 환원효소 도메인에서의 돌연변이 A796V는 cyp153A (서열 번호: 38 참조)의 ω-하이드록실라제 활성을 개선하는 유익한 돌연변이이다. cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고 P450 cyp153A(G307A)-Red450RhF(A796V)(서열 번호: 38)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다 (참고: 실시예 7). 수득한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 실시예 (하기) 뿐만 아니라 서열 표 B 및 C (하기)에 나타나 있다. 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 그리고 하기를 포함한다: 서열 번호: 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142 및 144. 유사하게, 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 6과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 그리고 하기를 포함한다: 서열 번호: 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 및 164. 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 및/또는 지방산 유도체를 포함하는 ω-OH 지방산의 증가된 양을 생산할 수 있다.
상기 촉매 도메인에서의 돌연변이 Q12W, R27L, K119R, S140N, S157R, V159M, S233L 및 A244R (또한 돌연변이 G307A )와 상기 환원효소 도메인에서의 돌연변이 A796V는 cyp153A의 ω-하이드록실라제 활성을 추가로 개선하는 유익한 돌연변이이다 (참고: 서열 번호: 98 및 실시예 8). cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고 하기를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다: 서열 번호: 98) (참고: 실시예 11). 수득한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 실시예 (하기) 뿐만 아니라 서열 표 C (하기)에 나타나 있다. 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 98과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 그리고 하기를 포함한다: 서열 번호: 146, 148, 150, 152, 154, 156, 158, 160, 162 및 164. 유사하게, 이들 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 6과 비교하여, 더 많은 양의 ω-하이드록시 지방산 (ω-OH FFA 역가)을 생산하며, 또한 서열 번호: 38, 그리고 하기를 포함한다: 서열 번호: 146, 148, 150, 152, 154, 156, 158, 160, 162 및 164. 이러한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1 및/또는 C20:1 지방산 및/또는 지방산 유도체를 포함하는 ω-OH 지방산의 증가된 양을 생산할 수 있다.
CYP153A-환원효소 하이브리드 융합 핵산 변이체 (DNA 서열)은 서열 번호: 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161 및 163을 포함한다. 그러나, CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 대한 절대적인 서열 동일성이 필요한 것은 아님을 인지할 것이다. 예를 들면, 특정 폴리뉴클레오티드 서열에 있어서의 변화가 이루어질 수 있으며, 암호화된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 전형적으로, 예를 들면, 코돈 최적화를 통해서와 같은 보존적 돌연변이 및 잠재성 돌연변이를 포함한다. 변형된 또는 돌연변이화된(즉, 돌연변이체) 폴리뉴클레오티드 및 암호화된 변이체 폴리펩티드는 당업계에 공지된 방법을 사용하여 야생형 또는 주형 폴리펩티드에 비해 증가된 촉매 활성, 증가된 안정성, 또는 감소된 억제(예컨대, 감소된 피드백 억제)를 포함하지만 이에 제한되지 않는 개선된 기능과 같은 목적하는 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(EC) 번호에 따라 본원에 기재된 지방산 생합성 경로의 다양한 단계(즉, 반응)에 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드(예컨대, 특이 효소로서 기능하고 특이 효소 활성을 나타내는 것), 및 이러한 폴리펩티드를 암호화하는 예시적인 폴리뉴클레오티드를 제공한다. 서열 식별자 번호(상기 서열 번호)에 의해 본원에 식별된 이러한 예시적인 폴리펩티드 및 폴리뉴클레오티드가 도 1에 나타낸 것과 같은 숙주 세포에서 지방산 경로를 조작하는데 유용하다. 그러나, 본원에 기재된 폴리펩티드 및 폴리뉴클레오티드는 예시적이며, 따라서, 비제한적임을 이해해야 한다. 본원에 기재된 예시적인 폴리펩티드의 동족체의 서열이, 예를 들면, 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 공과 대학에 의해 제공되는 BRENDA 데이터베이스, 및 교토 대학과 도쿄 대학의 생물정보학 센터에 의해 제공된 KEGG 데이터베이스와 같은 데이터베이스를 사용하여 당업계의 숙련가들에게 이용 가능하며, 이들 모두는 월드 아이드 웹 상에서 이용 가능하다.
다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164 중 임의의 것의 아미노산 서열에 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 또는 89% 서열 동일성을 갖는다 (여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매함). 바람직하게는, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 재조합 숙주 세포에서 발현 시, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 다양한 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164 중 임의의 것의 아미노산 서열에 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다 (여기서 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매함). 바람직하게는, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 재조합 숙주 세포에서 발현 시, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 글리신(G)이 알라닌(A)으로 대체된 마이노박터 아쿠애올레이로부터의 CYP153A (G307A) 폴리펩티드로부터 유도되고, 로도코쿠스 종 NCIMB9784으로부터의 P450RhF의 환원효소 도메인과 융합되며, 알라닌(A)이 발린(V)으로 대체된 A796V의 부가 돌연변이를 포함한다. 기타 구현예에서, 본 개시내용을 실시하는데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 또는 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 112, 서열 번호: 114, 서열 번호: 116, 서열 번호: 118, 서열 번호: 120, 서열 번호: 122, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152, 서열 번호: 154, 서열 번호: 156, 서열 번호: 158, 서열 번호: 160, 서열 번호: 162 및 서열 번호: 164의 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는다. 또한, 본 명세서에서 기재된 바와 같이 유용한 특징 및/또는 특성을 유발하는 하나 이상의 치환을 포함할 수 있다. 기타 구현예에서, 상기 개시내용을 실시하는 데 사용하기 위한 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 38, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 66, 서열 번호: 68, 또는 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 또는 서열 번호: 96과 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는다. 여전히 또 다른 구현예에서, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마이노박터 아쿠애올레이 이외의 유기체로부터 유도된다. 이와 같은 다른 유기체는, 비제한적으로, 아시네토박터 종, 마이코박테리움 마리넘, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 푼고룸, 카울로박터 크레스센투스, 하이포모나스 넵투니움, 도로슈도모나스 팔루스트리스, 스핑고모나스 종, 마이코박테리움 종을 포함한다. 또 다른 구현예에서, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 환원효소 도메인은 로도코쿠스 종 이외의 유기체에서 유래된다. 이와 같은 기타 유기체에는, 비제한적으로, 로도코쿠스 에퀴, 아시네토박터 라디오레시텐스, 버크홀데리아 말레이, 버크홀데리아 말레이, 랄스토니아 유트로파, 쿠프리아비두스 메탈리두란스가 포함된다.
관련된 구현예에서, 상기 개시내용은 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161 및 서열 번호: 163의 핵산 서열과 적어도 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체를 포함한다 (CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 의하여 암호화된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매함). 바람직하게는, CYP153A-환원효소 하이브리드 융합 폴리뉴클레오티드 변이체에 의하여 암호화된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 재조합 숙주 세포에서 발현 시, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 일부 구현예에서 핵산 서열은 본원에 기재된 바와 같은 개선된 특징들 및/또는 특성들을 야기하는 하나 이상의 치환을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 암호화한다. 추가의 또 다른 관련 구현예에서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161 및 서열 번호: 163 중 임의의 것의 뉴클레오티드 서열과 적어도 약 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91% 또는 90% 서열 동일성을 갖는 뉴클레오티드 서열에 의하여 암호화된다. 또 다른 측면에서, 본 개시내용은 실질적으로 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 111, 서열 번호: 113, 서열 번호: 115, 서열 번호: 117, 서열 번호: 119, 서열 번호: 121, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 155, 서열 번호: 157, 서열 번호: 159, 서열 번호: 161 및 서열 번호: 163 중 임의의 것에 상응하는 핵산 서열의 전장에 걸쳐 엄격한 조건 하에 하이브리드화되는 핵산 서열에 의해 암호화된 아미노산 서열을 아우르는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체에 관한 것이다. 일부 구현예에서 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 마이노박터 아쿠애올레이 종으로부터 유도된다. 또 다른 구현예에서, P450 하이브리드 융합 폴리펩티드는 아시네토박터 종, 마이코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울로박터 크레센투스, 하이포모나스 넵투늄, 로도슈도모나스 팔루스트리스, 스핀고모나스 종, 마이코박테리움 종으로부터 유도된다.
서열
서열 표 A에 나타낸 변이체는 하이브리드 사이토크롬 P450 cyp153A16(G307A)-RedRhF 융합 단백질을 기본으로 한다.
서열 표 B에 나타낸 변이체는 하이브리드 사이토크롬 P450 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 기본으로 한다.
하기 표 C에 순차적으로 나타난 변이체들은 하이브리드 사이토크롬 P450 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)을 기반으로 한다.
하기 표 D에 순차적으로 나타난 변이체들은 하이브리드 사이토크롬 P450 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)을 기반으로 한다. 본 표에서, 모든 변이체가 돌연변이의 완전한 목록(주형 돌연변이 포함)으로 묘사된다.
변형 및 돌연변이
본원에서 사용되는 바와 같은 변이체 폴리펩티드는 적어도 하나의 아미노산에 의해 야생형 CYP153A 또는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와는 상이한 아미노산 서열을 갖는 폴리펩티드를 나타낸다. 예를 들면, 변이체(예컨대, 돌연변이체)는 알라닌, 발린, 류신, 및 이소류신과 같은 지방족 아미노산의 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체; 트레오닌의 세린으로의 대체; 아스파르트산 및 글루탐산과 같은 산성 잔기의 다른 산성 잔기로의 대체; 아스파라긴 및 글루타민과 같은 아미드 그룹을 갖는 잔기의 아미드 그룹을 갖는 다른 잔기로의 대체; 리신 및 아르기닌과 같은 염기성 잔기의 다른 염기성 잔기로의 교체; 및 페닐알라닌 및 티로신과 같은 방향족 잔기의 다른 방향족 잔기로의 대체를 포함하지만 이에 제한되지 않는 상기 보존적 아미노산 치환 중의 하나 이상을 가질 수 있다. 일부 구현예에서, 변이체 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 99, 또는 그 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 갖는다. 본 개시내용은 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 단편을 아우르되, 이와 같은 단편은 지방산의 오메가-하이드록실화된 지방산으로의, 예컨대 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체로의 전환에 촉매작용을 일으킨다. 바람직하게는, 본 개시내용의 상기 단편은, 재조합 숙주 세포에서 발현 시, 예를 들어, 서열 번호: 6, 또는 서열 번호: 38 (상응하는 숙주 세포 중)의 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 소정의 역가의 오메가-하이드록실화된 지방산과 비교하여, 더 높은 역가의 오메가-하이드록실화된 지방산을 허용한다. 따라서, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 또는 돌연변이체의 단편은 상기 개시내용의 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 또는 돌연변이체의 생물학적 기능(예를 들면, 효소 활성, 구체적으로 ω-하이드록실라제 효소 활성)의 일부 또는 전부를 보유한다. 또한, 본 개시내용에 의해 제공된 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드, 예를 들면, 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 생물학적 기능(예를 들면, 효소 활성, 구체적으로 ω-하이드록실라제 효소 활성)의 일부 또는 전부를 보유한다. 일부 구현예에서, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 본 개시내용의 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 생물학적 기능의 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 적어도 98% 이상을 보유한다. 다른 구현예에서, 상기 단편 또는 돌연변이체는 상응하는 야생형 CYP153A 폴리펩티드, 또는 본 개시내용의 상응하는 전장 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 생물학적 기능의 약 100%를 보유한다. 기타 구현예에서, 일부 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 증가된 생물학적 기능을 보인다. 어떤 아미노산 잔기들이 생물학적 활성에 영향을 주지 않으면서 치환, 삽입, 또는 결실될 수 있는지를 결정하는 가이던스(guidance)는 당업계에 잘 알려진 컴퓨터 프로그램들, 예를 들면, LASERGENE 소프트웨어(DNASTAR, Inc. , Madison, WI)를 이용하여 찾을 수 있다. 일부 구현예에서, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드와 비교하여, 증가된 생물학적 기능을 보인다. 예를 들면, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드에 비해 효소 활성에 있어서 적어도 10%, 적어도 25%, 적어도 50%, 적어도 75%, 또는 적어도 90% 개선을 나타낼 수 있다. 또 다른 구현예에서, 단편은 상응하는 야생형 CYP153A 폴리펩티드, 또는 상응하는 주형 CYP153A-환원효소 하이브리드 융합 폴리펩티드에 비해 효소 활성에 있어서 적어도 100%, 적어도 200%, 또는 적어도 500% 개선을 나타낸다. 본 개시내용이 상기에서 언급된 바와 같이 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 단편들을 아우른다는 사실에 근거하여, 비록 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 구조적 및 기능성 기술 특성이 기재될 때마다 그와 같은 단편들에 대한 언급이 본원에 이루어지지 않을지 모르나, 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체와 관련하여 본 명세서에 기재된 모든 구조적 및 기능성 기술 특성은 또한 본 개시내용의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 단편에 적용됨이 이해되어야 한다.
본원에 기재된 폴리펩티드는 폴리펩티드 기능에 실질적인 영향을 주지 않는 추가적인 보존적 또는 비-필수 아미노산 치환을 가질 수 있는 것으로 이해된다. 특정 치환이 용인되는지(즉, ω-하이드록실라제 효소 활성과 같은 목적하는 생물학적 기능에 부정적인 영향을 주지 않는지)의 여부는 당업계에 알려진 바와 같이 결정될 수 있다(참고: Bowie et al. (1990) Science, 247:1306-1310). 보존적 아미노산 치환은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 계열이 당업계에 정의되어 있다. 이러한 계열은 염기성 측쇄(예컨대, 리신, 아르기닌, 히스티딘), 산성 측쇄(예컨대, 아스파르트산, 글루탐산), 비하전된 극성 측쇄(예컨대, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예컨대, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지화 측쇄(예컨대, 트레오닌, 발린, 이소류신), 및 방향족 측쇄(예컨대, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산을 포함한다.
변이체는 자연적으로 발생하거나 시험관내에서 생성될 수 있다. 특히, 이러한 변이체는 부위 지향 돌연변이(site directed mutagenesis), 무작위 화학적 돌연변이(random chemical mutagenesis), 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 이러한 변이체, 돌연변이체, 단편, 유사체, 또는 유도체는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 변이체를 만드는 방법은 당업계에 잘 알려져 있다. 예를 들면, 변이체는 무작위 및 부위 지향 돌연변이를 이용함으로써 제조될 수 있다. 무작위 및 부위 지향 돌연변이는 일반적으로 당업계에 알려져 있다(예를 들면, 참고: Arnold (1993) Curr. Opin. Biotech. 4:450-455). 무작위 돌연변이생성은 오류 발생 경향 PCR을 사용하여 달성될 수 있다 (참고: 예를 들어, Leung et al. (1989) Technique 1:11-15; 및 Caldwell et al. 1992) PCR Methods Applic. 2:28-33). 오류 유발 PCR에서, 실제 PCR은 DNA 폴리머라제의 복사 정확도(copying fidelity)가 낮은 조건하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율이 얻어지도록 한다. 간략하게, 이러한 절차에서, 돌연변이유발될 핵산(예컨대, P450 단백질 또는 P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열)은 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl2, MnCl2, Taq 폴리머라제, 및 적당한 농도의 dNTP와 혼합된다. 예를 들면, 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mMKCl, 10 mM Tris HCl(pH 8. 3), 0. 01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl2, 0. 5 mM MnCl2, 5 단위의 Taq 폴리머라제, 0. 2 mM dGTP, 0. 2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. 1분 동안 94°C, 1분 동안 45°C, 및 1분 동안 72°C의 30회 사이클 동안 PCR를 수행할 수 있다. 그러나, 이들 파라미터가 달라질 수 있음이 당해 기술의 숙련가에 의해 적절한 것으로 인정될 것이다. 그후, 돌연변이유발된 핵산을 적절한 벡터로 클로닝하고, 돌연변이유발된 핵산에 의해 암호화되는 폴리펩티드의 활성을 평가한다. 부위 지향 돌연변이는 관심 있는 선택적인 클로닝된 DNA에서 부위-특이적 돌연변이를 생성하기 위해 올리고뉴클레오티드-지향 돌연변이유발을 이용하여 달성될 수 있다. 올리고뉴클레오티드 돌연변이유발은 당업계에 기재되어 있다(예를 들면, Reidhaar-Olson et al. (1988) Science 241:53-57). 간략하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 하나 이상의 돌연변이를 지닌 복수의 이중 가닥 올리고뉴클레오티드를 합성하고, 돌연변이유발될 클로닝된 DNA(예컨대, P450 폴리펩티드 또는 P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열) 내로 삽입한다. 돌연변이유발된 DNA를 함유한 클론을 회수하고, 이들이 암호화하는 폴리펩티드의 활성을 평가한다.
변이체를 생성하는 또 다른 방법은 조립 PCR(assembly PCR)이다. 조립 PCR은 작은 DNA 단편들의 혼합물로부터의 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(미국 특허 제5,965,408호 참조). 변이체를 생성하는 또 다른 방법은 유성(sexual) PCR 돌연변이유발이다. 유성 PCR 돌연변이유발에서는, 강제된 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 단편화의 결과로서 시험관내에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 그후, PCR 반응의 프라이머 신장법(primer extension)에 의한 크로스오버(crossover)의 고정(fixation)이 후속된다. 성적 PCR 돌연변이유발은 당해 분야에 공지된 기재된 출판물이다(예를 들면, 참고: Stemmer (1994) Proc. Natl. Acad. Sci. U. S. A. 91:10747-10751). 변이체는 또한 생체내 돌연변이유발에 의해 생성될 수 있다. 일부 구현예에서, 핵산 서열에서의 무작위 돌연변이는 DNA 보수 경로 중 하나 이상에서 돌연변이를 갖는 박테리아 균주, 예를 들면, 대장균 균주에서 서열을 증식시킴으로써 생성된다. 이러한 돌연변이유발 유전자 균주(mutator strain)는 야생형 균주보다 더 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열(예컨대, P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열)의 증식은 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체내 돌연변이유발에 사용하기에 적합한 돌연변이유발 유전자 균주는 당업계의 공보(예를 들면, 국제 특허 출원 공개 공보 제WO 1991/016427호)에 기재되어 있다. 변이체는 또한 카세트 돌연변이유발을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 영역이 원래의 서열과는 상이한 합성 올리고뉴클레오티드 카세트로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 원래의 서열을 함유한다. 반복 앙상블 돌연변이유발(recursive ensemble mutagenesis)이 또한 변이체를 생성하는데 사용될 수 있다. 반복 앙상블 돌연변이유발은 구성원들이 아미노산 서열에 있어서 상이한 표현형 관련 돌연변이체의 다양한 개체군을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위해 피드백 메커니즘을 이용한다(예를 들면, Arkin et al. (1992) Proc. Natl. Acad. Sci. , U. S. A. 89:7811-7815). 일부 구현예에서, 변이체는 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)을 이용하여 생성된다. 지수 앙상블 돌연변이유발은 높은 백분율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리(combinatorial libraries)를 생성하기 위한 공정이며, 잔기들의 작은 그룹들이 기능성 단백질을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다(예를 들면, 참고: Delegrave et al. (1993) Biotech. Res. 11:1548-1552). 일부 구현예에서, 변이체는 별개의 폴리펩티드를 암호화하는 복수의 핵산의 일부가 함께 융합되어 키메라 폴리펩티드를 암호화하는 키메라 핵산 서열을 생성하는 셔플링 절차(shuffling procedure)를 이용하여 생성된다(예를 들면, 미국 특허 제5,965,408호 및 제5,939,250호에 기재됨).
모티프 및 구조
CYP153A(G307A) 돌연변이체의 확인 및 특성규명이 Honda Malca et al. (상기)에 기재되었고, 여기서 상기 저자들은 CYP153A에서의 잠재적인 기질-상호작용 잔기를 조사하였다. Honda Malca et al. 은 그것의 측쇄와 함께 헴(heme) 중심를 가리키는 아미노산을 함유함으로써 활성화된 산소의 공격 중에 모든 기질 분자와 접촉할 것으로 기대되는 구조 요소들 중 주요 잔기들의 확인에 초점을 맞춘 구조-기반 분석을 수행하였다. 그 목적을 위해, 위치 G307이 상기 단백질 구조에서 확인될 수 있으며, 또한 CYP153A6를 위해 구축된 이전에 기재된 상동성 모델의 활성 부위의 일부인, 두 개의 핫스팟 위치 중 하나로 확인되었다. 비교하자면, 본 개시내용은 생성물의 생산량을 개선하기 위한 노력으로 랜덤 돌연변이 생성을 기반으로 한다(표 5~11에서 나타낸 바와 같이 포화 라이브러리에 대한 실시예 참조, 하기). 예를 들면, 서열 번호: 98의 변이체는 서열 번호: 38을 기반으로 하고(G307A 및 A796V 돌연변이를 보유), 추가의 돌연변이, 예컨대 Q12W, R27L, K119R, S140N, S157R, V159M, S233L 및 A244R를 갖는다(이들 중 어느 것도 3차원 모델링에 기반한 CYP153A 도메인의 활성 부위에 위치하지 않는다)(도 6 참조).
CYP153A는 구상 단백질이고 그것의 촉매차원의 활성 부위는 기질 하이드록실화의 화학적 성질이 발생하는 헴(heme) 그룹에 인접한 아미노산 잔기를 수반한다. 도 5는 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 내 환원효소 도메인 옆의 CYP153A 촉매 도메인을 나타낸다. 위치 G307은 상기 활성 부위에서 헴(heme)에 매우 근접해 있다. 그러나, 본 개시내용은 CYP153A의 촉매적 특성이, 반드시 단백질의 활성 부위에 있지 않은 특정 위치들, 예컨대, 예를 들면, 하기의 위치 12, 27, 28, 119, 141, 157, 159, 231, 233, 및 244를 변이시킬 때, 개선될 수 있음을 보여준다: 서열 번호: 38; 서열 번호: 38의 위치 12, 28, 119, 140, 157, 159, 233, 244, 254, 및 407; 서열 번호: 38의 위치 12, 27, 111, 119, 141, 157, 159, 231, 233, 244, 및 254; 서열 번호: 38의 위치 12, 28, 119, 140, 149, 157, 159, 231, 233, 및 407; 서열 번호: 38의 위치 12, 27, 28, 119, 140, 157, 159, 233, 244, 및 407; 서열 번호: 38의 위치 10, 11, 12, 28, 119, 141, 159, 231, 233, 244, 및 407; 서열 번호: 38의 위치 11, 12, 27, 28, 119, 141, 157, 159, 197, 231, 233, 244, 407, 및 477; 서열 번호: 38의 위치 11, 12, 28, 119, 141, 157, 159, 197, 231, 233, 244, 및 407; 및/또는 서열 번호: 38의 위치 11, 12, 27, 28, 119, 141, 149, 157, 159, 231, 233, 및 407. 촉매적 특성을 개선하는 특정 변이체의 예들은 하기이다: Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A231Y, S233L, A244R (서열 번호: 166); Q12W, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, R254G, N407G (서열 번호: 168); Q12W, R27L, F111A, K119R, V141T, S157R, V159M, A231Y, S233L, A244R, R254G (서열 번호: 170); Q12W, Q28M, K119R, S140N, P149G, S157R, V159M, A231Y, S233L, N407G (서열 번호: 172); Q12W, R27L, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, N407G (서열 번호: 174); D10Y, I11L, Q12W, Q28M, K119R, V141T, V159M, A231Y, S233L, A244R, N407G (서열 번호: 176); I11L, Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G, P477G (서열 번호: 178); I11L, Q12W, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G (서열 번호: 180); 및 I11L, Q12W, R27L, Q28M, K119R, V141T, P149G, S157R, V159M, A231Y, S233L, N407G (서열 번호: 182).
숙주 세포
재조합 숙주 세포에 의한 ω-OH 지방산 조성물의 생산을 증가시키는 계획은 제조 숙주에서 CYP153A-환원효소 하이브리드 융합 유전자 및 티오에스테라제 유전자를 발현시킴으로써 지방산 생합성 경로를 통해 증가된 플럭스를 포함한다. 본원에서 사용되는 용어 재조합 숙주 세포 또는 조작된 숙주 세포는 유전자 구성이, 예를 들면, 새로운 유전적 요소의 의도적인 도입 및/또는 숙주 세포에 자연적으로 존재하는 유전적 요소의 의도적인 변형에 의해 상응하는 야생형 숙주 세포에 비해 변경된 숙주 세포를 나타낸다. 이러한 재조합 숙주 세포의 자손 또한 이러한 새로운 및/또는 변형된 유전적 요소를 함유한다. 본원에 기재된 본 발명의 측면의 어느 것에 있어서, 숙주 세포는 식물 세포, 곤충 세포, 진균 세포(예컨대, 사상균, 예를 들면, 칸디다 종(Candida sp.), 또는 출아효모, 예를 들면, 사카로마이세스 종(Saccharomyces sp.)), 조류 세포 및 박테리아 세포로부터 선택될 수 있다. 하나의 구현예에서, 재조합 숙주 세포는 재조합 미생물이다. 미생물인 숙주 세포의 예는 에스체리치아(Escherichia), 바실러스(Bacillus), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 아스퍼길루스(Aspergillus), 트리코데르마(Trichoderma), 뉴로스포라(Neurospora), 푸사리움(Fusarium), 후미콜라(Humicola), 리조무코르(Rhizomucor), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 무코르(Mucor), 미셀리오프토라(Myceliophtora), 페니실리움(Penicillium), 파네로카에테(Phanerochaete), 플레우로투스(Pleurotus), 트라메테스(Trametes), 크리소스포리움(Chrysosporium), 사카로미세스(Saccharomyces), 스테노트로파모나스(Stenotrophamonas), 스키조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 또는 스트렙토마이세스(Streptomyces)로부터의 세포를 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 숙주 세포는 그람-양성 박테리아 세포이다. 또 다른 구현예에서, 숙주 세포는 그람-음성 박테리아 세포이다. 일부 구현예에서, 숙주 세포는 대장균 세포이다. 일부 구현예에서, 숙주 세포는 대장균 B 세포, 대장균 C 세포, 대장균 K 세포, 또는 대장균 W 세포이다. 또 다른 구현예에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실러스 리체노포르미스(Bacillus lichenoformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 투린지엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸리스(Bacillus subtilis) 세포, 또는 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) 세포이다. 또 다른 구현예에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르에세이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스퍼길루스 아와모리(Aspergillus awamori) 세포, 아스퍼길루스 푸미가테스(Aspergillus fumigates) 세포, 아스퍼길루스 포에티두스(Aspergillus foetidus) 세포, 아스퍼길루스 니둘란스(Aspergillus nidulans) 세포, 아스퍼길루스 니게르(Aspergillus niger) 세포, 아스퍼길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스오파쿠스(Rhodococcusopacus) 세포, 리조무코르미에헤이(Rhizomucormiehei) 세포, 또는 무코르미에헤이(Mucormichei) 세포이다. 또 다른 구현예에서, 숙주 세포는 스트렙토마이세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 구현예에서, 숙주 세포는 악티노마이세테스(Actinomycetes) 세포이다. 일부 구현예에서, 숙주 세포는 사카로마이세스 세레비시에(Saccharomyces cerevisiae) 세포이다.
또 다른 구현예에서, 숙주 세포는 진핵 식물 세포, 조류 세포, 시아노박테리움 세포, 녹색-황 세균 세포, 녹색 비-황 세균 세포, 자색 황 세균 세포, 자색 비-황 세균 세포, 극한생물 세포, 효모 세포, 진균 세포, 본원에 기재된 유기체 중의 어느 것의 조작된 세포, 또는 합성 유기체이다. 일부 구현예에서, 숙주 세포는 광-의존성이거나 탄소를 고정한다. 일부 구현예에서, 숙주 세포는 독립영양적 활성을 갖는다. 일부 구현예에서, 숙주 세포는 빛의 존재하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 일부 구현예에서, 숙주 세포는 빛의 부재하에서 종속영양적 또는 혼합영양적이다. 특정 구현예에서, 상기 숙주 세포는 아라비돕시스 탈리아나, 파니쿰 비르가툼, 미스칸투스 기간테우스, 옥수수, 보트라이오코쿠스에 브라우니, 클라마이도모나스 레인하르트이, 두날리엘라 살리나, 사이네초코쿠스 종PCC 7002, 사이네초코쿠스 종PCC 7942, 시네코시스티스 종PCC 6803, 테르모사이네초코쿠스 엘론가테스 BP1, 클로로비움 테피덤, 클로로플렉수스 아우란티쿠스, 크로마티움 비노섬, 로도스피릴룸 루브럼, 로도박터 캅설라투스, 도로슈도모나스 팔루스리스, 클로스트리듐 륭달리, 클로스트리듐 써모셀룸, 펜니실리움 크리소게넘, 피키아패스토리스, 사카로마이세스 세레비지애, 쉬조사카로마이세스 폼베, 슈도모나스 플루오레스센스, 또는 자이모모나스 모빌리스에서 유래된 세포이다. 일 구현예에서, 상기 미생물 세포는 시아노박테리아, 예컨대 비제한적으로, 프로클로로코쿠스, 사이네초코쿠스, 시네코시스티스, 시아노테케, 및 노스톡 푼크티포르메에서 유래된 것이다. 또 다른 구현예에서, 상기 미생물 세포는 특정 시아노박테리아 종, 예컨대, 비제한적으로, 사이네초코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 사이네초코쿠스 종 PCC7001에서 유래된 것이다.
발현 벡터
일부 구현예에서, 폴리뉴클레오티드(또는 유전자) 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한 재조합 벡터에 의해 숙주 세포에 제공된다. 특정 구현예에서, 프로모터는 발달적으로-조절된 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적 프로모터, 또는 세포-특이적 프로모터이다. 일부 구현예에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택된 적어도 하나의 서열을 포함한다. 본원에 기재된 발현 벡터는 숙주 세포에서 폴리뉴클레오티드 서열의 발현에 적합한 형태로 폴리뉴클레오티드 서열을 포함한다. 발현 벡터의 설계는 형질전환되는 숙주 세포의 선택, 목적하는 폴리펩티드의 발현 수준 등과 같은 인자들에 따라 좌우될 수 있다는 것은 당업계의 숙련가들에 의해 인지될 것이다. 본원에 기재된 발현 벡터는 본원에 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 암호화되는 융합 폴리펩티드를 포함한 폴리펩티드를 생산하기 위해 숙주 세포에 도입될 수 있다(상기). 원핵생물, 예를 들면, 대장균에서 폴리펩티드를 암호화하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행된다. 융합 벡터는 그 안에 암호화된 폴리펩티드에, 통상적으로 재조합 폴리펩티드의 아미노- 또는 카복시-말단에 다수의 아미노산을 부가한다. 이러한 융합 벡터는 전형적으로 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키고; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것을 포함한 상기 세 가지 목적들 중의 하나 이상을 제공한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이러한 효소, 및 이들의 동족 인식 서열(cognate recognition sequence)의 예는 Xa 인자, 트롬빈 및 엔테로키나제를 포함한다. 예시적인 융합 발현 벡터는 pGEX 벡터(Pharmacia Biotech, Inc., Piscataway, NJ; Smith et al. (1988) Gene 67:31-40), pMAL 벡터(New England Biolabs, Beverly, MA), 및 pRITS 벡터(Pharmacia Biotech, Inc., Piscataway, N. J.)를 포함하고, 이들은 각각 글루타티온 S-전달효소(GST), 말토오스 E 결합 단백질, 또는 단백질 A를 상기 표적 재조합 폴리펩티드에 융합시킨다.
유도성, 비-융합 대장균 발현 벡터의 예는 하기를 포함한다: pTrc 벡터(Amann et al. (1988) Gene 69:301-315) 및 pET 11d 벡터 (Studier et al. , Gene Expression Technology:Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990) 60-89). pTrc 벡터로부터의 표적 유전자 발현은 하이브리드 trp-lac 융합 프로모터로부터의 숙주 RNA 폴리머라제 전사에 의존한다. pET 11d 벡터로부터의 표적 유전자 발현은 공동발현되는 바이러스성 RNA 폴리머라제(T7 gn1)에 의해 매개되는 T7 gn10-lac 융합 프로모터로부터의 전사에 의존한다. 이러한 바이러스성 폴리머라제는 lacUV 5 프로모터의 전사 조절하에서 T7 gn1 유전자를 보유하는 내재성 λ 프로파지(resident λ prophage)로부터 BL21(DE3) 또는 HMS174(DE3)와 같은 숙주 균주들에 의해 공급된다. 원핵 및 진핵 세포 모두를 위한 다른 적합한 발현 시스템은 당해 분야에서 잘 알려져 있다 (참고: 예컨대, Sambrook et al. (1989) Molecular Cloning:A Laboratory Manual, second edition, Cold Spring Harbor Laboratory). 유도성, 비-융합 대장균 발현 벡터의 예는 하기를 포함한다: pTrc 벡터(Amann et al. (1988) Gene 69:301-315) 및 PET 11d 벡터 (Studier et al. (1990) Gene Expression Technology:Methods in Enzymology 185, Academic Press, San Diego, CA, pp. 60-89). 특정 구현예에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도되는 프로모터에 작동가능하게 연결된다. 하나의 구현예에서, 숙주 세포는 효모 세포이다. 이러한 구현예에서, 발현 벡터 효모 발현 벡터이다. 벡터는 외래(foreign) 핵산(예컨대, DNA)을 숙주 세포 내로 도입하기 위한 당업계에서 인정되는 다양한 기술들을 통해 원핵 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염시키는 적절한 방법은, 예를 들면, 하기에서 찾아볼 수 있다: Sambrook et al. (상기). 박테리아 세포의 안정적인 형질전환을 위하여, (사용되는 발현 벡터 및 형질전환 기술에 따라) 세포의 특정 부분이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이러한 형질전환체를 식별하고 선택하기 위하여, 선택가능한 마커(예컨대, 항생제에 대한 내성)를 암호화하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선택가능한 마커는 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같지만 이로 제한되지 않는 약물에 대한 내성을 제공하는 것들을 포함한다. 선택가능한 마커를 암호화하는 핵산은 본원에 기재된 폴리펩티드를 암호화하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에서 도입될 수 있다.
선택적인 경로 조작
본 발명의 숙주 세포 또는 미생물은 효소 활성에 대한 특정 돌연변이의 효율성을 시험하기 위해 변경들을 함유하도록 유전적으로 조작되거나 변형된 숙주 균주 또는 숙주 세포(즉, 재조합 세포 또는 미생물)를 포함한다. 다양한 선택적인 유전적 조정 및 변경이, 어떤 천연 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 숙주 세포로 상호교환가능하게 사용될 수 있다. 하나의 구현예에서, 숙주 균주는 다른 생합성 폴리펩티드(예컨대, 효소)와 조합하여 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현을 시험하는데 사용될 수 있다. 숙주 균주는, 발효 성분, 탄소 공급원(예컨대, 공급원료), 온도, 압력, 감소된 배양 오염 조건, 및 산소 수준을 포함한 배양 조건들을 포함하지만 이로 제한되지 않는 특정 변수들을 시험하기 위해 다수의 유전적 변경을 포함할 수 있다.
하나의 구현예에서, 숙주 균주는 선택적인 fadE 및 fhuA 결실을 포함한다. 아실-CoA 데하이드로게나제(FadE)는 지방산을 대사시키는데 중요한 효소이다. 이것은 지방산 이용에서 두 번째 단계(베타-산화)를 촉매하며, 이것은 지방산의 장쇄(아실-CoA)를 아세틸-CoA 분자로 분해시키는 공정이다. 보다 구체적으로, 박테리아에서 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이것은 FadE에 의해 촉매된다. 대장균에 FadE가 없는 경우, 이것은 탄소 공급원으로서 지방산에서 성장할 수 없지만, 아세테이트에서는 성장할 수 있다. 선택적인 쇄 길이의 지방산을 이용하는 불가능성(inability)은 fadE 균주, 즉 FadE 기능이 파괴되는 fadE 돌연변이 균주의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 지방산 유도체 경로에서 중간체일 수 있는 아실-CoA가 세포에 누적될 수 있도록 보장하여 모든 아실-CoA가 지방산 유도체로 효율적으로 전환될 수 있도록 한다. 그러나, fadE 감쇠는 당이 탄소 공급원으로서 사용될 경우에 선택적인데, 그 이유는 이러한 조건하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며 아실-CoA 기질에 대해 에스테르 신타제 또는 다른 효소과 효율적으로 경쟁할 수 없기 때문이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들은 지방산보다 당의 소모를 선호하므로, 두 공급원이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 먼저 소모된다(참고: D. Clark, J Bacteriol. (1981) 148(2):521-6)). 게다가, 당의 부재 및 지방산의 존재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질이 상향-조절되고 아실-CoA에 대해 효율적으로 경쟁할 것이기 때문에, 아실-CoA 중간체가 베타 산화 경로에 대해 손실될 수 있다. 따라서, fadE 유전자가 녹아웃되거나 감쇠되는 것이 유리할 수 있다. 대부분의 탄소 공급원들이 주로 당을 기본으로 하기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 암호화하며, 이것은 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다(V. Braun (2009) J Bacteriol . 191(11):3431-3436). 이의 결실은 선택적이다. fhuA 결실은 세포로 하여금 특정 발효 조건에 유리할 수 있는 파지 공격(phage attack)에 대해 더 저항성있게 한다. 따라서, 발효 진행 동안 잠재적 오염을 겪기 쉬운 숙주 세포에서 fhuA를 결실시키는 것이 바람직할 수 있다.
또 다른 구현예에서, 숙주 균주(상기)는 또한 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함하는 유전자들 중의 하나 이상의 선택적인 과발현을 포함한다. 이러한 유전자의 예는 에스케리치아 콜라이로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 지방산 생합성에서의 조절제 및 효소를 암호화하는 이러한 유전자들 중 하나 이상의 과발현은 다양한 배양 조건하에서 ω-OH 지방산 및 이의 유도체를 포함하는 지방산 유도체 화합물의 역가를 증가시키는 역할을 할 수 있다.
또 다른 구현예에서, 대장균 균주가 ω-OH 지방산 및 이의 유도체의 생산을 위한 숙주 세포로서 사용된다. 유사하게, 이들 숙주 세포는 fadR, fabA, fabD, fabG, fabH, fabV 및/또는 fabF를 포함하지만 이에 제한되지 않는 다양한 배양 조건하에서 지방산 유도체(예컨대, ω-OH 지방산 및 α,ω-이산 등)와 같은 지방산 유도체 화합물의 역가를 추가로 증가 또는 강화시킬 수 있는 하나 이상의 생합성 유전자(즉, 지방산 생합성의 조절제 및 효소를 암호화하는 유전자)의 선택적인 과발현을 제공한다. 유전적 변경의 예는 에스케리치아 콜라이로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 일부 구현예에서, 이러한 생합성 유전자를 운반하는 합성 오페론이, 다양한 배양 조건하에서 P450 발현을 시험하고/하거나 ω-OH 지방산 및 α,ω-이산 생산을 더욱 증대시키기 위해 세포에서 조작되고 발현될 수 있다. 이러한 합성 오페론은 하나 이상의 생합성 유전자를 함유한다. 조직된 오페론은, 특정 배양 조건을 시험하기 위해 지방산 유도체의 과발현을 촉진시키는데 사용될 수 있는 콜레라균으로부터의 fabV, 쥐티푸스균으로부터의 fabH, 쥐티푸스균으로부터의 fabD, 쥐티푸스균으로부터의 fabG, 쥐티푸스균으로부터의 fabA, 및/또는 클로스트리디움 아세토부틸리쿰으로부터의 fabF를 포함하는 선택적인 지방산 생합성 유전자를 함유할 수 있다. 이러한 합성 오페론의 한가지 장점은, ω-OH 지방산 유도체 생산률이 더욱 증가되거나 증대될 수 있다는 것이다.
일부 구현예에서, ACP 및 생합성 효소(예컨대, ω-하이드록실라제, 티오에스테라제 등)를 발현하는데 사용되는 숙주 세포 또는 미생물은 ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 등과 같은 하나 이상의 특정 지방산 유도체(들)에 대한 생산을 증가시킬 수 있는 특정한 효소 활성을 포함하는 유전자를 추가로 발현할 것이다. 일 구현예에서, 숙주 세포는 하기를 갖는다: 티오에스테라제 활성(E.C. 3.1.2. * 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) (유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 에스테르 신타제 활성 (E.C. 2.3.1.75) (지방 에스테르의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 및/또는 알코올 탈수소효소 활성 (E.C. 1.1.1.1.) 및/또는 지방 알코올 아실-CoA 환원효소 (FAR) (E.C. 1.1.1.*) 활성 및/또는 카르복실산 환원효소 (CAR) (EC1.2.99.6) 활성 (지방 알코올의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 (지방 알데하이드의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 및 데카르보닐라제 (ADC) 활성 (알칸 및 알켄의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-CoA 환원효소 (E.C. 1.2.1.50) 활성, 아실-CoA 신타제 (FadD) (E.C. 2.3.1.86) 활성, 및 티오에스테라제 (E.C. 3.1.2. * 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 (지방 알코올의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 에스테르 신타제 활성 (E.C. 2.3.1.75), 아실-CoA 신타제 (FadD) (E.C. 2.3.1.86) 활성, 및 티오에스테라제 (E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 (지방 에스테르의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 케톤의 생산을 위해 OleA 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 내부 올레핀의 생산을 위해 OleBCD 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 아실-ACP 환원효소 (AAR) (E.C. 1.2.1.80) 활성 및 알코올 탈수소효소 활성 (E.C. 1.1.1.1) (지방 알코올의 생산을 위해). 또 다른 구현예에서, 숙주 세포는 하기를 갖는다: 티오에스테라제 (E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 데카르복실라제 활성 (말단 올레핀의 제조를 위해). 미생물 및 미생물 세포에서의 효소 활성의 발현은 미국 특허 제8,097,439호; 제8,110,093호; 제8,110,670호; 제8,183,028호; 제8,268,599호; 제8,283,143호; 제8,232,924호; 제8,372,610호; 및 제8,530,221호에 의해 교시되어 있으며, 이들은 본원에 참고로 포함되어 있다. 또 다른 구현예에서, ACP 및 다른 생합성 효소를 발현하는데 사용되는 숙주 세포 또는 미생물은 ω-OH 지방산, ω-OH 지방산 유도체, 및 α,ω-이산과 같은 하나 이상의 특정 지방산 유도체(들)를 생산하기 위해 상향조절되거나 과발현된 특정 원래의 효소 활성을 포함할 것이다. 일 구현예에서, 숙주 세포는 하기를 갖는다: 천연 티오에스테라제 (E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 (티오에스테라제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생산을 위해).
본 발명은 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체 및 다른 생합성 효소를 암호화하는 유전자를 발현하는 숙주 균주 또는 미생물을 포함한다(상기). 재조합 숙주 세포는 지방산 유도체, 예를 들면, ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 및 이의 조성물 및 배합물을 생산한다. 지방산 유도체는 전형적으로 배양 배지로부터 회수되고/되거나 숙주 세포로부터 단리된다. 하나의 구현예에서, 지방산 유도체는 배양 배지로부터 회수된다(세포외). 또 다른 구현예에서, 지방산 유도체는 숙주 세포로부터 단리된다(세포내). 또 다른 구현예에서, 지방산 유도체는 배양 배지로부터 회수되고 숙주 세포로부터 단리된다. 숙주 세포에 의해 생산된 지방산 유도체 또는 조성물은 특정 지방산 유도체의 분포 뿐만 아니라 ω-OH 지방산 유도체, 예를 들면, ω-OH 지방산, ω-OH 지방 에스테르, α,ω-이산 등의 성분의 쇄 길이 및 포화도를 결정하기 위해 당업계에 공지된 방법, 예를 들면, GC-FID를 사용하여 분석될 수 있다.
배양 및 발효
본원에서 사용되는 용어 발효는 광범위하게는 숙주 세포에 의한 표적 물질로의 유기 물질의 전환, 예를 들면, 탄소 공급원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 전파함으로써 ω-OH 지방산 또는 이의 유도체로의 재조합 숙주 세포에 의한 탄소 공급원의 전환을 나타낸다. 생산을 위해 허용되는 조건은 숙주 세포가 ω-OH 지방산과 같은 목적하는 생성물을 생산하도록 하는 선택적인 조건을 나타낸다. 유사하게, 벡터의 폴리뉴클레오티드 서열이 발현되는 조건 또는 조건들은 숙주 세포가 폴리펩티드를 합성할 수 있도록 하는 선택적인 조건을 의미한다. 적합한 조건은, 예를 들면, 발효 조건을 포함한다. 발효 조건은 온도 범위, 통기 수준, 공급 속도 및 배지 조성을 포함하지만 이에 제한되지 않는 다수의 파라미터를 포함할 수 있다. 이러한 조건들의 각각은, 개별적으로 및 조합하여, 숙주 세포가 자랄 수 있게 한다. 발효는 호기성, 혐기성, 또는 이의 변동(예를 들면 미호기성)일 수 있다. 예시적인 배양 배지는 브로스 또는 겔을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접 대사될 수 있는 탄소 공급원을 포함한다. 또한, 효소는 동원(예컨대, 발효성 당으로의 전분 또는 셀룰로스의 해중합) 및 후속적인 탄소 공급원의 대사를 촉진시키기 위해 배지에서 사용될 수 있다.
소규모 생산을 위해, 조직된 숙주 세포를, 예를 들면, 약 100㎕, 200㎕, 300㎕, 400㎕, 500㎕, 1mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L, 또는 10 L의 배치에서 성장시키고; 발효시키며; 유도시켜 목적하는 폴리뉴클레오티드 서열, 예를 들면, P450 하이브리드 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 발현할 수 있다. 대규모 생산을 위해, 조작된 숙주 세포를 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L, 및 1,000,000 L 또는 그 이상의 배치에서 성장시키고; 발효시키며; 유도시켜 목적하는 폴리뉴클레오티드 서열을 발현할 수 있다. 대안적으로, 대규모 공급-배치 발효가 수행될 수 있다. 본원에 기재된 바와 같은 ω-OH 지방산, 이의 유도체 및 조성물은 재조합 숙주 세포 배양물의 세포외 환경에서 발견되며, 배양 배지로부터 쉽게 단리될 수 있다. ω-OH 지방산 또는 이의 유도체는 재조합 숙주 세포에 의해 분비되고, 세포외 환경으로 운반되거나 또는 재조합 숙주 세포 배양물의 세포외 환경으로 수동적으로 운반될 수 있다. ω-OH 지방산 또는 이의 유도체는 당업계에 공지된 일상적인 방법을 사용하여 재조합 숙주 세포 배양물로부터 단리된다.
재조합 숙주 세포로부터 유도되는 생성물
본원에서 사용되는 바와 같이, 모뎀 탄소 또는 fM의 분율은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 물질(SRMs4990B 및 4990C)에 의해 정의된 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 14C/12C 동위원소 비 HOxI의 0. 95배와 관련된다. 이것은 붕괴-보정 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 대략 1. 1이다. 바이오생성물(예컨대, 본 발명에 따라 생산된 ω-OH 지방산 및 유도체를 포함하는 지방산 유도체)은 생물학적으로 생산된 유기 화합물을 포함한다. 특히, 본원의 지방산 생합성 경로를 이용하여 생산된 지방산 유도체(예컨대, ω-OH 지방산 및 이의 유도체)는 재생가능한 공급원으로부터 생산되지 않았으며, 이를테면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유도되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예컨대, 글루코스 vs. 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예컨대, 미국 특허 제7,169,588호 참조). 석유 기반 유기 화합물로부터 바이오생성물을 구별하는 능력은 상업적으로 이러한 물질들을 추적하는데 유익하다. 예를 들면, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 다를 포함하는 유기 화합물 또는 화학물질은 석유 기반 물질만으로 만들어진 유기 화합물 및 화학물질과는 구별될 수 있다. 따라서, 본원의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플에서 안정적인 탄소 동위원소 비(13C/12C)를 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물에서 13C/12C 비는 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 13C/12C 비의 결과이다. 이것은 또한 정확한 대사 경로를 반영한다. 국부적인 변이가 또한 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 13C/12C 및 상응하는 δ13C 값에서 상당한 차이를 나타낸다. 또한, C3 및 C4 식물의 지질 물질은 대사 경로의 결과로서 동일한 식물의 탄수화물 성분으로부터 유도된 물질과 상이하게 분석한다. 측정의 정확도 내에서, 13C은 동위원소 분별 효과(fractionation effect)로 인하여 큰 변화를 나타내며, 바이오생성물에 대한 이의 가장 중요한 점은 광합성 메카니즘이다. 식물에서의 탄소 동위원소 비에 있어서의 차이의 주요 원인은 식물에서의 광합성 탄소 대사의 경로, 특히 1차 카복실화(즉, 대기 CO2의 초기 고정) 동안 일어나는 반응에 있어서의 차이와 밀접하게 관련된다. 식생(vegetation)의 크게 두 가지 부류는 C3[또는 캘빈-벤슨(Calvin-Benson)] 광합성 사이클을 병합하는 것 및 C4[또는 해치-슬랙(Hatch-Slack)] 광합성 사이클을 병합하는 것이다. C3 식물에서, 1차 CO2 고정 또는 카복실화 반응은 효소인 리불로스-1,5-디포스페이트 카복실라제를 수반하며, 첫번째 안정적인 생성물은 3-탄소 화합물이다. 경목(hardwood) 및 침엽수와 같은 C3 식물은 온대 기후 지역에서 우세하다. C4 식물에서, 또 다른 효소인 포스포엔올-피루베이트 카복실라제를 수반하는 부가적인 카복실화 반응이 1차 카복실화 반응이다. 첫번째 안정적인 탄소 화합물은 이후에 탈카복실화되는 4-탄소산(carbon acid)이다. 이렇게 하여 방출된 CO2 는 C3 사이클에 의해 재고정된다. C4 식물의 예는 열대형 목초들, 옥수수, 및 사탕수수이다. C4 및 C3 식물 둘 다는 광범위한 13C/12C 동위원소 비를 나타내지만, 전형적인 값은 C4 식물에 대해 약 -7 내지 약 -13 per mil이고, C3 식물에 대해 약 -19 내지 약 -27 per mil이다(예컨대, 문헌 참조; Stuiver et al. (1977) Radiocarbon 19:355). 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다. 13C 측정 척도는 본래 PDB(Pee Dee Belemnite) 석회암에 의해 제로 세트(zero set)로 정의되며, 여기서 값은 이 재료로부터 천분율(parts per thousand) 편차로 주어진다. δ13C 값은 천분율(퍼밀), 약어로는 ‰로 표현되고, 아래와 같이 계산된다:
δ13C (‰) = [(13C/12C) 샘플- (13C/12C) 표준]/ (13C/12C) 표준 × 1000
PDB 표준 물질(RM)이 고갈되었기 때문에, 일련의 대안적인 RM이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차(per mil deviation)에 대한 표기는 δ13C이다. PDB에서 1/1000(per mil) 편차에 대한 표기법은 δ13C이다. 덩어리(masses) 44, 45 및 46의 분자 이온에 대한 높은 정확성 안정적 비 질량 분광분석법(IRMS)에 의해 CO2 에 대한 측정이 이루어진다. 본원에 기재된 조성물은, 예를 들면, 지방산 유도체 생성물을 포함한, 본원에 기재된 방법들 중 어느 하나에 의해 생산된 바이오생성물을 포함한다. 구체적으로, 바이오생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ13C를 가질 수 있다. 예를 들면, 바이오생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ13C를 가질 수 있다. 또 다른 경우에, 바이오생성물은 약 -10, -11, -12, 또는 -12. 3의 δ13C를 가질 수 있다. 본 방법에 따라 생산된 바이오생성물은 또한 각 화합물에서 14C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 14C는 핵 반감기가 5730년이기 때문에, 더 오래된 탄소를 함유하는 석유 기반 연료는 좀 더 새로운 탄소를 함유한 바이오생성물과 구별될 수 있다(참고: 예컨대, Currie, Source Apportionment of Atmospheric Particles, Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds. , 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series (Lewis Publishers, Inc.) 3-74, (1992)). 방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 14C 농도의 항상성은 살아있는 유기체에서 14C의 항상성을 유도한다는 것이다. 그러나, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, 14C는 제2의, 지구화학적인 시간 특성을 얻었다. 대기 CO2 중에서 및 이에 따라 생물권(living biosphere) 중에서의 이의 농도는 1960년대 중반의 핵실험 피크에서 거의 배가되었다. 이후, 약 1.2 x 10- 12 의 정상-상태 우주기원(steady-state cosmogenic)(대기) 기준 동위원소 비(14C /12C)로 점진적으로 복귀되었으며, 대략적인 이완 "반-감기"(approximate relaxation "half-life")는 7년 내지 10년이었다. 이 후자의 반감기가 문자 그대로 받아들여져야 하는 것은 아니며; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 14C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 14C 시간 특성이다. 14C는 가속제 질량 분광분석법(AMS)에 의해 측정될 수 있고, 그 결과는 현대의 탄소(fM)의 단위로 주어진다. fM은 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된다. 본원에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 14C/12C 동위원소 비 HOxI의 0.95배와 관련된다. 이것은 붕괴-보정 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 대략 1.1이다. 본원에 기재된 조성물은 적어도 약 1의 fM14C를 가질 수 있는 바이오생성물을 포함한다. 예를 들면, 본 발명의 바이오생성물은 적어도 약 1.01의 fM14C, 약 1 내지 약 1.5의 fM14C, 약 1.04 내지 약 1.18의 fM14C, 또는 약 1.111 내지 약 1.124의 fM14C를 가질 수 있다.
14C의 또 다른 척도는 현대 탄소 백분율 (percent of modern carbon; pMC)로 알려져 있다. 14C 연대를 이용하는 고고학자 또는 지질학자의 경우, AD 1950년은 0의 해(zero years old)와 같다. 이것은 또한 100 pMC를 나타낸다. 대기 중의 핵무기 탄소(bomb carbon)는 열-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 비슷해졌으며, 이는 AD 1950년 이후로 살아있는 식물 및 동물에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이것은 시간 경과에 따라 점차 감소하였으며, 오늘날의 값은 107.5 pMC 부근이다. 이것은 옥수수와 같은 신선한 바이오매스 물질이 107.5 pMC 부근의 14C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유발할 것이다. 107.5 pMC가 오늘날의 바이오매스 물질의 14C 함량을 나타내고 0 pMC가 석유 기반 생성물의 14C 함량을 나타낸다고 가정함으로써, 그 물질에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들면, 오늘날의 대두로부터 100% 유도된 물질은 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 물질이 석유 기반 생성물로 50% 희석되었다면, 이는 대략 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 100%를 107.5 pMC와 같다고 하고 0%를 0 pMC와 같다고 할당함으로써 유도된다. 예를 들면, 99 pMC로 측정된 샘플은 93%의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값을 평균 생물학적 기반 탄소 결과라고 하며, 오늘날의 생물학적 물질 또는 석유 기반 물질 중 어느 하나로부터 비롯된 분석된 물질 내의 모든 성분을 추정한다. 본원에 기재된 바와 같은 하나 이상의 지방산 유도체를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 또 다른 경우에, 본원에 기재된 지방산 유도체는 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본원에 기재된 지방산 유도체는 약 90, 91, 92, 93, 94, 또는 94. 2의 pMC를 가질 수 있다.
실시예
다음의 구체적인 실시예들은 본 발명을 예시하기 위한 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다.
프로토콜 및 방법
라이브러리 스크리닝
본원에 기재된 모든 프로토콜은 배양물을 성장시키기 위한 96 웰 플레이트-마스터 블럭-2mL 시스템(Greiner Bio-One, Monroe, NC 또는 Corning, Amsterdam, The Netherlands), 및 배양 브로스로부터 지방산 화학종을 추출하기 위한 플레이트(Costar, Inc.)에 의존한다. 아래에 제공된 프로토콜들은 발효 조건의 예들이다. 대안적인 프로토콜이 지방산 화학종 생산을 평가하는데 사용될 수 있다.
32 o C Plim 배양 프로토콜
(96 웰 플레이트에서 성장하는 LB 배양물로부터의) 30㎕ LB 배양물을 사용하여 290㎕ Plim 배지(표 2)에 접종하였으며, 그후 이를 32℃에서 진탕시키면서 대략 16시간 동안 항온처리하였다. 밤샘 시드(overnight seed) 40㎕를 사용하여 360㎕ Plim 배지에 접종하였다. 2시간 동안 32 ℃에서 성장시킨 후, 배양물을 IPTG(최종 농도 1 mM)로 유도하였다(아래 표 3). 그후, 달리 주지되지 않는다면 20시간 동안 진탕시키면서 32 ℃에서 배양물을 항온처리하고, 그후 이들을 아래에 상세된 표준 추출 프로토콜에 따라 추출하였다.
35 o C Nlim 배양 프로토콜
(96 웰 플레이트에서 성장하는 LB 배양물로부터의) 40㎕ LB 배양물을 사용하여 360㎕ LB 배지(아래 표 3)에 접종하였으며, 그후 이를 32℃에서 진탕시키면서 대략 4시간 동안 항온처리하였다. LB 시드 40㎕를 사용하여 360㎕ Nlim 배지에 접종하였다. 32℃에서 2시간 동안 35℃에서 성장시킨 후, 배양물을 IPTG(최종 농도 1 mM)로 유도하였다(아래 표 3). 그후, 달리 주지되지 않는다면 20시간 동안 진탕시키면서 35℃에서 배양물을 항온처리하고, 그후 이들을 아래에 상세된 표준 추출 프로토콜에 따라 추출하였다.
표 3: 배지 명칭 및 제형
지방산 화학종 표준 추출 프로토콜
추출되어지는 각 웰에 80㎕의 1M HCl에 이어 400㎕의 부틸 아세테이트(내부 표준으로서 500mg/L 펜타데칸올을 가짐)를 가하였다. 그후, 96 웰 플레이트를 플레이트 밀봉기(ALPS-300 히터; Abgene, ThermoScientific, Rockford, IL)를 사용하여 가열-밀봉하고, MIXMATE 혼합기(Eppendorf, Hamburg, Germany)를 사용하여 2000rpm에서 15분 동안 진탕시켰다. 진탕시킨 후, 플레이트를 실온에서 4500rpm에서 10분 동안 원심분리하여(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA) 수성 층과 유기 층을 분리하였다. 100㎕의 유기 층을 96 웰 플레이트(폴리프로필렌, Corning, Amsterdam, The Netherlands)로 옮기고 100uL의 BSTFA로 유도체화하였다. 후속적으로 플레이트를 가열 밀봉하고, w-OH FFA 방법을 사용하여 GC-FID에 의해 평가할 때까지 -20℃에서 저장하였으며, 상기 방법은 다음과 같이 수행하였다:1㎕의 샘플을 1-20 스플릿을 지닌 불꽃 이온화 검출기(FID)를 갖는 Agilent 7890A GC Ultra 장치(Agilent, Santa Clara, CA)에서 분석 컬럼(DB-1, 10m×180㎛×0. 2㎛ 필름 두께, JW 121-101A로부터 이용가능함)에 주입하였다. C10 내지 C18 지방산 및 ω-하이드록실화 지방산을 검출하고 정량하도록 기기를 설정하였다. 상기에 상세된 프로토콜은 표준 조건을 나타내며, 이것은분석 결과를 최적화하기 위해 필요에 따라 변경될 수 있다.
오류 유발 라이브러리 구축
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 오류 유발 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 미스매치된 뉴클레오티드의 삽입을 유리하게 하는 조건하에서 DNA 주형으로부터 PCR 증폭에 의해 생성되었다. 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc., Mountain View, CA)을 사용하여 수행하였다.
포화 라이브러리 구축
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 변성 프라이머(degenerate primer)를 사용하여 생성되었다. 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc., Mountain View, CA)을 사용하여 수행하였다.
조합 라이브러리 구축
유익한 것으로 확인된 돌연변이들을 조합하여 ω-OH 지방산 유도체 화학종의 생산에 있어서 추가의 개선을 갖는 CYP153-환원효소 하이브리드 융합 폴리펩티드 변이체(예컨대, 하이브리드 CYP153A-RedRhF 단백질 변이체)를 제공하였다. 당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 조합 라이브러리를 제조하였다. 하나의 예에서, 벡터 골격은 벡터에서 제한 엔도뉴클레아제를 사용하여 제조되는 반면 DNA 삽입체에 있어서의 다양성의 발생은 목적하는 돌연변이를 도입하기 위해 프라이머를 사용하여 생성되었다. 상기한 바와 같이, 하나의 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조자의 프로토콜에 따라 INFUSION 클로닝 시스템(Clontech Laboratories, Inc. , Mountain View, CA)을 사용하여 수행하였다. 조합 라이브러리는 전달 PCR(tPCR) 프로토콜을 사용하여 생성될 수 있다(Erijman et al. (2011) J. Structural Bio. 175:171-177).
라이브러리 스크리닝
일단 라이브러리 다양성이 오류-유발, 포화 라이브러리 또는 조합 라이브러리에서 생성되었다면, 이것을 상기한 방법들 중의 하나를 사용하여 스크링하였다. 두 가지 유형의 히트(hit)를 확인하였다: (1) 증가된 양의 ω-하이드록시 지방산(ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환. 각 히트 내의 하이브리드 cyp153A-RedRhF 단백질 변이체에서의 돌연변이는 당업계의 숙련가들에 의해 이용되는 표준 기술들을 사용하여 서열화함으로써 확인하였다. 아래 표 5, 6 및 7은 포화 라이브러리에서 유익한 것으로 확인된 돌연변이(히트)를 열거한다.
실시예 1:라이브러리 스크리닝을 위한 균주 및 플라스미드 작제
당해 실시예는 포화 또는 조합 돌연변이유발 라이브러리 스크리닝을 위해 작제된 균주 및 플라스미드를 설명한다.
마리노박터 아쿠아에올리에서 유래된 CYP153A(G307A) P450 촉매적 단백질과, 로도코쿠스 종에서 유래된 P450RhF의 c-말단 FMN- 및 Fe/S-함유 환원효소 도메인으로 제조된 하이브리드-융합 단백질에 대한 유전자 암호화 NCIMB9784는 하기와 같이 생성된다: cyp165A(G307A)_Maqu 유전자를 게놈 DNA에서 증폭시키고, 교차혼합(cross-over) PCR에 의해 코돈-최적화된 합성 P450RhF 환원효소 도메인과 융합시켰다. 생성된 융합 유전자(서열 번호: 5)를 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 pACYC-유도체(즉, p15A 복제단위, 카나마이신 내성 마커)로 클로닝하였다. 플라스미드를 pEP125라고 명명하였다(표 4 참조, 하기).
하이브리드 cyp153A(G307A)-Red450RhF 융합 단백질을 암호화하는 유전자를 또한 pEP125로부터 증폭시키고 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 pCL1920-유도체 벡터(SC101 복제단위, 스펙티노마이신 내성 마커)로 클로닝하였으며, 이것은 식물 티오에스테라제(fatB1), 3-케토-아실-ACP 신타제의 변이체(fabB) 및 전사 조절인자(fadR)를 암호화하는 유전자와 오페론을 형성하였다. 플라스미드를 pLC81이라고 명명하였다(표 4 참조, 하기).
추가의 플라스미드를 다음과 같이 생성하였다: 움벨룰라리아 칼리포르니카(Umbellularia californica)로부터의 식물 티오에스테라제(fatB1)를 암호화하는 유전자를 코돈-최적화된 DNA로서 합성하고, pCL1920-유도체 벡터(SC101 복제단위, 스펙티노마이신 내성 마커)로 클로닝하여, 이의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되도록 하며, 이것은 아세틸-CoA 카복실라제(accDACB), 비오틴 리가제(birA) 및 아실-운반 단백질을 암호화하는 오페론을 형성하였다. 플라스미드를 pNH305라고 명명하였다(표 4 참조, 하기). 플라스미드 pAS033은 pNH305에서 fatB1을 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 코돈-최적화된 합성 식물 티오에스테라제(fatA3)로 대체함으로써 생성하였다(표 4 참조, 하기). 플라스미드 pEP146은 pLC81에서 fatB1을 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 코돈-최적화된 합성 식물 티오에스테라제(fatA3)로 대체함으로써 생성하였다(표 4 참조, 하기). pEP146은 또한 플라스미드 암호화된 repA 단백질에서 돌연변이를 운반하였다.
플라스미드 형질전환을 위해 사용되는 기본 균주는 GLP077 및 BZ128이었다. 간략하게, 기본 균주 GLPH077의 게놈은 다음과 같이 조작하였다: 아실-CoA 데하이드로게나제(fadE) 유전자를 결실시키고, 전사 조절인자(fadR) 및 합성 지방산 생합성 오페론을 과발현시켰다. 간략하게, 기본 균주 BZ128의 게놈은 다음과 같이 조작하였다: fadE(아실-CoA 데하이드로게나제) 유전자를 결실시키고, 합성 지방산 생합성 오페론, β-하이드록시 지방 아실-ACP 데하이드라타제(fabZ) 및 티오에스테라제의 변이체(tesA)를 과발현시켰다. 또한, 균주를 미리 트랜스포존 뿐만 아니라 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝에 적용시켰다.
표 4:라이브러리 스크리닝을 위해 사용된 플라스미드
하이브리드 cyp153A(G307A)-Red450RhF 융합 단백질을 숙주 세포에서의 발현이 ω-OH 지방산 유도체를 생산할 수 있는지 여부를 알아보기 위해 시험하였다. 서열 번호: 를 발현하는 미생물은 5, 글루코스로부터 1 g/L 초과의 ω-OH 지방산 유도체를 생산할 수 있었다. 따라서, 이러한 조작된 효소를 추가의 진화 연구를 위해 선택하였다.
실시예 2: cyp153A ( G307A )- Red450RhF 융합 단백질의 P450 촉매 도메인의 포화 라이브러리
cyp153A-Red450RhF 융합 단백질의 P450 촉매 도메인의 전체 포화 라이브러리를 구축하고, cyp153A(G307A)-Red450RhF(즉, 주형 폴리펩티드)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다. G307A(즉, 위치 307에서 알라닌 잔기가 글리신으로 대체됨)는 cyp153A의 ω-하이드록실라제 활성을 개선시키는 유익한 돌연변이이다(참고: Honda Malca et al. (2012) Chem. Commun. 48:5115). 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산(ωOH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 플라스미드 pEP125 및 pLC81(상기 표 4 참조)을 사용하여 전체 포화 라이브러리를 만들었다. 세 가지 포화 라이브러리를 스크리닝하였다: 첫번째 라이브러리를 위해 pEP125를 pNH305와 함께 균주 GLPH077로 형질전환시키고, 두번째 라이브러리를 위해 pLC81을 BZ128로 형질전환시키고, 세번째 라이브러리를 위해 pEP125를 pAS. 033과 함께 GLPH077 균주로 형질전환시켰다. 첫번째 및 두번째 라이브러리를 특히 ω-하이드록시 도데칸산 형성에서 개선된 변이체에 대해 스크리닝하고 세번째 라이브러리를 특히 ω-하이드록시 헥사데센산 형성에 있어서 개선된 변이체에 대해 스크리닝하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝시켰다. 개선된 변이체들이 아래 표 5 내지 7에 도시된다(하기). 특히, 위치 141의 변이체가 다수회 식별되었으며, ω-하이드록시 도데칸산 및 ω-하이드록시 헥사데센산 형성 둘 다에 대해 상당히 개선된 효소인 것으로 밝혀졌다.
표 5: cyp153A(G307A)-Red450RhF의 촉매 도메인의 첫번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
표 6: cyp153A(G307A)-Red450RhF의 촉매 도메인의 두번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
표 7: cyp153A(G307A)-Red450RhF의 촉매 도메인의 세번째 부위 포화 라이브러리로부터의 개선된 변이체의 요약.
실시예 3: cyp153A ( G307A )- Red450RhF 융합 단백질의 환원효소 도메인의 부분 부위 포화 라이브러리
하이브리드 cyp153A-Red450RhF 융합 단백질의 환원효소 도메인의 부분적인 포화 라이브러리(열 번째 아미노산마다 돌연변이됨)를 구축하였고, 촉매적 P450 cyp153A 도메인의 위치 포화 돌연변이유발 라이브러리에서 확인된 변이체인 cyp153A(V141I, A231T, G307A)-Red450RhF (서열 번호: 32)에 대한 개선을 보였던 변이체에 대해 선별하였다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 포화 라이브러리를 제조하였다. 라이브러리를 위해, cyp153A(V141I, A231T, G307A)-Red450RhF를 갖는 pLC81을 BZ128로 형질전환시켰다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 표 8에 도시된다. 특히, 변이체 A796V (서열 번호: 42) 및 P666A는 유의미하게 개선된 효소였다.
표 8: cyp153A(V141I A231T G307A)-Red450RhF의 환원효소 도메인의 부분 포화 라이브러리로부터의 개선된 변이체의 요약
실시예 4: cyp153A ( G307A )- Red450RhF 융합 단백질의 환원효소 도메인의 조합 라이브러리
환원효소 도메인의 부분 포화 라이브러리(실시예 3)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기본이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산 (ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다.
조합 라이브러리를 cyp153A(V141I, A231T, G307A)-Red450RhF (서열 번호: 32)를 갖는 pLC81에서 작제하고 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 아래 표 9에 도시된다.
표 9: cyp153A(V141I, A231T, G307A)-Red450RhF의 환원효소 도메인의 조합 라이브러리로부터의 개선된 변이체의 요약
실시예 5: cyp153A ( G307A )- Red450RhF 융합 단백질의 촉매성 및 환원효소 도메인의 조합 라이브러리
포화 라이브러리(실시예 2 및 3)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기본이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 도데칸산 (ωOH FFA 역가); 및/또는 (2) 도데칸산에서 ω-하이드록시 도데칸산으로의 증가된 전환이었다. 조합 라이브러리를 pLC81에서 작제하고 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 최선으로 개선된 두 가지 변이체가 아래 표 10에 도시된다.
표 10: cyp153A(G307A)-Red450RhF의 조합 라이브러리로부터의 최선으로 개선된 변이체
실시예 6: cyp153A ( G307A , A796V )- Red450RhF의 위치 141 및 309의 부위 포화 돌연변이유발
위치 141에서의 변화가 기질 특이성에 영향을 미쳤음을 주지하였다. 따라서, 이러한 두 개의 위치의 부위 포화 돌연변이유발을 cyp153A(G307A, A796V)-Red450RhF에서 수행하였다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 헥사데센산; 및/또는 (2) 헥사데센산에서 ω-하이드록시 헥사데센산으로의 증가된 전환이었다.
라이브러리를 위해, cyp153A(G307A A796V)-Red450RhF (서열 번호: 38)를 갖는 pEP146을 BZ128로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 부위 포화 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체들이 도 2에 도시된다. 특히, V141T를 갖는 변이체 (서열 번호: 46)는 가장 높은 ω-하이드록시 헥사데센산 역가 및 헥사데센산으로부터의 가장 높은 전환을 나타내었다.
실시예 7: cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 포화 라이브러리
cyp153A-Red450RhF 융합 단백질의 전체 포화 라이브러리를 구축하고, cyp153A(G307A)-Red450RhF(A796V)(즉, 주형 변이체, 서열 번호: 38)를 능가하는 개선을 나타낸 변이체에 대해 스크리닝하였다. G307A (즉, 알라닌 잔기가 위치 307에서 글리신으로 대체됨) 및 A796V (즉, 발린 잔기가 위치 796에서 알라닌으로 대체됨)가 cyp153A의 ω-하이드록실라제 활성을 개선시키는 유익한 돌연변이이다(위 참조). 히트수(hits)에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 포화 라이브러리를 제조하였다. 플라스미드 pEP302를 사용하여 pEP146(표 4 참조)의 유도체인 전체 포화 라이브러리를 만들었으며, 여기서, 유전자의 순서를 변경시키고(fatA3-fadB-fadR-cyp153A(G307A)-Red450RhF(A796V)) 마지막 유전자를 별도의 프로모터로부터 발현시켰다. 라이브러리를 균주 stNH1525로 형질전환시켰다. 간략하게, 기본 균주 stNH1525의 게놈을 다음과 같이 조작하였다: fadE (아실-CoA 데하이드로게나제) 유전자를 결실시키고, 합성 지방산 생합성 오페론을 과발현시켰다. 또한, 균주를 미리 트랜스포존 뿐만 아니라 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝에 적용시켰다.
라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝시켰다. 개선된 변이체, 특히, ω-하이드록시 헥사데칸산 및 ω-하이드록시 헥사데센산 형성을 상당히 개선시킨 변이체가 아래 표 11에 도시된다.
표 11: cyp153A(G307A)-Red450RhF(A976V)의 부위 포화 라이브러리로부터의 개선된 변이체의 요약
실시예 8: cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 촉매 도메인의 조합 라이브러리
촉매 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
조합 라이브러리를 cyp153A(G307A)-Red450RhF (A796A) (서열 번호: 38)를 갖는 pEP302 중 작제하고, 그리고 stNH1525로 변형시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 12에 도시된다.
표 12: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된 개선된 변이체의 요약 (서열 번호: 38)
실시예 9: 높은 발현 수준의 cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 촉매 도메인의 조합 라이브러리
촉매 도메인의 조합 라이브러리에서 확인된 유익한 돌연변이(실시예 8, 상기 참조)는 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선하기 위한 차기 조합 라이브러리를 위한 기반이었다. 히트에 대한 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
조합 라이브러리를 보다 높은 발현 수준에서 cyp153A(G307A)-Red450RhF (A796A) (서열 번호: 38)를 갖는, pAA. 016 플라스미드, pEP302의 유도체 중 작제하였고, 그리고 stNH1525로 변형시켰다. 당업계의 숙련가들에게 공지된 표준 기법들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체, 특히, ω-하이드록시 지방산 형성을 상당히 개선시킨 변이체가 아래 표 13에 도시된다.
표 13: cyp153A(G307A)-Red450RhF(A796V)의 촉매 도메인의 조합 라이브러리에서 유래된, 더 높은 발현 수준의 개선된 변이체의 요약
실시예 10: cyp153A ( G307A )- Red450RhF ( A796V ) 융합 단백질의 환원효소 도메인의 조합 라이브러리
환원효소 도메인의 포화 라이브러리(실시예 7)에서 식별된 유리한 돌연변이가 cyp153A(G307A)-Red450RhF(A796V) 융합 단백질을 더욱 개선시키기 위한 조합 라이브러리의 기반이었다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
조합 라이브러리를 pEP302에서 작제하고 stNH1525로 형질전환시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 표 14에 도시된다.
표 14: cyp153A(G307A)-Red450RhF(A796V)의 환원효소 도메인의 조합 라이브러리에서 유래된 개선된 변이체
실시예 11: cyp153A ( Q12W , R27L , K119R , S140N , S157R , V159M , S233L , A244R, G307A )- Red450RhF ( A796V ) 융합 단백질 (서열 번호: 98)의 촉매 및 환원효소 도메인의 조합 라이브러리
촉매적 및 환원효소 도메인(상기 실시예 8-10 참조)의 조합 라이브러리에서 확인된 유익한 돌연변이는 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매적 및 환원효소 도메인의 조합 라이브러리)을 더욱 개선하기 위한 조합 라이브러리용 염기였다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)을 갖는, 조합 라이브러리를 pEP302의 유도체인 pEP. 333 플라스미드에 작제하였고(실시예 7 참조), 그리고 stNH1525로 변형시켰다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다.
개선된 변이체가 표 15에 도시된다. 서열 번호: 98의 주형 내 일부 돌연변이는, 표 15에 의하여 나타난 바와 같은 야생형으로 복귀하였다. 예를 들면, 표 15에 나타난 네 번째의 돌연변이체에서, 신규한 돌연변이 V141T 및 A231Y가 첨가되었지만, S233L 및 A244R 돌연변이는 서열 번호: 152의 변이체에 더 이상 존재하지 않는다.
표 15: cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 및 환원효소 도메인의 조합 라이브러리 유래의 개선된 변이체.
실시예 12:cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 도메인의 조합 라이브러리
촉매 도메인(상기 실시예 8 참조)의 조합 라이브러리에서 확인된 유익한 돌연변이는 서열 번호: 98의 cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질의 촉매적 및 환원효소 도메인의 조합 라이브러리)을 더욱 개선하기 위한 조합 라이브러리용 염기였다. 선택 기준은 (1) 증가된 양의 ω-하이드록시 지방산 (ω-OH FFA 역가); 및/또는 (2) 지방산에서 ω-하이드록시 지방산으로의 증가된 전환이었다.
하기를 갖는, 조합 라이브러리를 pEP. 333 플라스미드의 저-사본 수 유도체인 pEP. 334 플라스미드에 작제하였다(실시예 11 참조): cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질(서열 번호: 98)의 촉매 도메인의 조합 라이브러리 및, 티오에스테라제 fatA3 및 베타-케토아실-ACP 합성효소 fabB의 변이체를 갖는 제2 오페론. pEP344를 균주 AA. 233으로 전환하였는데, 이것은 구성적으로 발현된 조절 단백질인 fadR의 변이체를 갖는 균주 stNH1525의 유도체(실시예 7 참조)이다. 당업계의 숙련가들에게 공지된 표준 기술들을 사용하여 조합 라이브러리를 제조하였다. 라이브러리를 상기한 표준 프로토콜 중의 하나를 사용하여 스크리닝하였다. 개선된 변이체가 표 16에 도시된다. 서열 번호: 98의 주형 내 일부 돌연변이는, 표 16에 의하여 나타난 바와 같은 야생형으로 복귀하였다. 예를 들면, 표 16에 나타난 첫번째의 돌연변이체에서, 신규한 돌연변이 Q28M, V141T 및 A231Y가 첨가되었지만, S140N 돌연변이는 서열 번호: 166의 변이체에 더 이상 존재하지 않는다.
표 16:cyp153A(Q12W, R27L, K119R, S140N, S157R, V159M, S233L, A244R, G307A)-Red450RhF(A796V) 융합 단백질 (서열 번호: 98)의 촉매 도메인의 조합 라이브러리 유래의 개선된 단백질 변이체.
당업계의 숙련가에게 자명한 바와 같이, 상기 측면들 및 구현예들의 다양한 변형들 및 변경들이 본 발명의 취지 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.
<110> REG LIFE SCIENCES, LLC
<120> OMEGA-HYDROXYLASE-RELATED FUSION POLYPEPTIDE VARIANTS WITH
IMPROVED PROPERTIES
<130> LS00054PCT3
<150> PCT/EP2015/079832
<151> 2015-12-15
<160> 184
<170> KoPatentIn 3.0
<210> 1
<211> 1413
<212> DNA
<213> Marinobacter aquaeolei
<400> 1
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgg cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt taa 1413
<210> 2
<211> 470
<212> PRT
<213> Marinobacter aquaeolei
<400> 2
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Gly Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser
465 470
<210> 3
<211> 1413
<212> DNA
<213> Marinobacter aquaeolei
<400> 3
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt taa 1413
<210> 4
<211> 470
<212> PRT
<213> Marinobacter aquaeolei
<400> 4
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser
465 470
<210> 5
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 5
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 6
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 6
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 7
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 7
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 8
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 8
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 9
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 9
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 10
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 10
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 11
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 11
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 12
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 12
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 13
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 13
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
caggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 14
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 14
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gln Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 15
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 15
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
ggggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 16
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 16
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gly Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 17
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 17
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 18
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 18
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 19
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 19
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
ctggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 20
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 20
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Leu Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 21
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 21
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 22
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 22
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 23
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 23
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 24
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 24
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 25
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 25
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggccgggat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 26
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 26
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Arg Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 27
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 27
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcggcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 28
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 28
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 29
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 29
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg ggcgtcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 30
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 30
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Arg His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 31
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 31
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 32
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 32
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 33
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 33
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 34
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 34
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 35
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 35
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcggcggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
2400
<210> 36
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 36
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Ala Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 37
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 37
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 38
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 38
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 39
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 39
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaagtcct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcggacgg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 40
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 40
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Val Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Asp Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 41
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 41
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 42
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 42
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 43
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 43
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 44
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 44
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 45
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 45
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 46
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 46
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 47
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 47
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgaa ctgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 48
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 48
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asn Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 49
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 49
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 50
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 50
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 51
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 51
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattcga tagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 52
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 52
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Asp Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 53
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 53
atgccaacac tgcccagaac atttgacgac attcagtcct tcctgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 54
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 54
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Phe Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 55
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 55
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
ttgacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 56
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 56
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Leu Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 57
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 57
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 58
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 58
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 59
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 59
atgccaacac tgcccagaac atttgacgac attcagaagc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 60
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 60
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Lys Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 61
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 61
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc ttcctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 62
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 62
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Phe Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 63
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 63
atgccaacac tgcccagaac atttgacgac attacgtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 64
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 64
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Thr Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 65
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 65
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 66
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 66
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 67
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 67
atgccaacac tgcccagaac atttgactac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 68
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 68
Met Pro Thr Leu Pro Arg Thr Phe Asp Tyr Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 69
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 69
atgccaacac tgcccagaac atttgacgac attaggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 70
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 70
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Arg Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 71
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 71
atgccaacac tgcccagaac atttgacgac ttgcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 72
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 72
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Leu Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 73
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 73
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gacgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 74
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 74
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Thr Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 75
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 75
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 76
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 76
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 77
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 77
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tccgctcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 78
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 78
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Arg Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 79
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 79
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 80
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 80
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 81
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 81
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 82
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 82
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 83
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 83
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggcaggg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 84
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 84
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Arg Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 85
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 85
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 86
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 86
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 87
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 87
atgccaacac tgcccagaac atttaaggac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 88
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 88
Met Pro Thr Leu Pro Arg Thr Phe Lys Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 89
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 89
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 90
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 90
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 91
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 91
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 92
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 92
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 93
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 93
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 94
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 94
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 95
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 95
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtgggg ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 96
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 96
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Gly Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 97
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 97
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 98
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 98
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 99
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 99
atgccaacac tgcccagaac atttgacgac attaggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
ttgacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gtagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggctctgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggcaggg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccggt 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 100
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 100
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Arg Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Leu Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Val Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ser Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Arg Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Gly
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 101
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 101
atgccaacac tgcccagaac atttgacgac attaggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gtagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccggt 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 102
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 102
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Arg Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Val Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Gly
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 103
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 103
atgccaacac tgcccagaac atttgacgac attacgtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttatacca gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tgggcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 104
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 104
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Thr Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Gln Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Trp Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 105
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 105
atgccaacac tgcccagaac atttgacgac attaggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
ttgacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 106
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 106
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Arg Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Leu Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 107
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 107
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 108
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 108
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 109
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 109
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gacgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccggt 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 110
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 110
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Thr Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Gly
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 111
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 111
atgccaacac tgcccagaac atttgacgac attaggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggcaggg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
attgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 112
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 112
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Arg Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Arg Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Ile Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 113
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 113
atgccaacac tgcccagaac atttgacgac attacgtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg gcggaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gtagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 114
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 114
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Thr Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Ala Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Val Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 115
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 115
atgccaacac tgcccagaac atttgacgac attacgtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
ttgacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggataggccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 116
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 116
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Thr Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Leu Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Arg Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 117
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 117
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gacgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttatacca gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccg ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccggt 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 118
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 118
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Thr Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Gln Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Gly Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Gly
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 119
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 119
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gacgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccg ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggctctgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg atgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 120
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 120
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Thr Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Gly Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ser Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Met Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 121
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 121
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gacgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccg ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggctctgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccggt 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 122
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 122
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Thr Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Gly Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ser Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Gly
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 123
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 123
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gacgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggctctgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg atgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccggt 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 124
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 124
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Thr Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ser Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Met Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Gly
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 125
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 125
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga gctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccga acgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgtgggac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc ttcctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 126
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 126
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Glu Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asn
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Trp Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Phe Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 127
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 127
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga gctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccga acgctccgtc gtacgaaatc gccgtgcact tagatccgcg gagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 128
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 128
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Glu Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asn
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Arg Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 129
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 129
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 130
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 130
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 131
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 131
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga gctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg cagcattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cttgtctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgtgggac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc ttcctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 132
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 132
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Glu Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Gln His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Leu Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Trp Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Phe Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 133
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 133
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga gctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg cagcattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cttgtctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc ttcctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 134
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 134
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Glu Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Gln His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Leu Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Phe Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 135
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 135
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga gctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccga acgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 136
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 136
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Glu Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asn
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 137
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 137
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga gctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgcg gagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 138
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 138
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Glu Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Arg Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 139
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 139
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgtg gagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 140
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 140
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Trp Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 141
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 141
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgcg gagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc ttcctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 142
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 142
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Arg Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Phe Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 143
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 143
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 144
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 144
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 145
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 145
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 146
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 146
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 147
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 147
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccg ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 148
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 148
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Gly Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 149
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 149
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg atgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 150
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 150
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Met Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 151
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 151
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 152
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 152
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 153
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 153
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg atgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgtg gagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcttggag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatggt gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 154
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 154
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Met Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Trp Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Leu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Gly Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 155
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 155
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
ttgacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
acggaaatgt tcatagcgat ggatgggccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 156
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 156
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Leu Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Gly Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 157
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 157
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 158
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 158
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 159
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 159
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg cagcattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccacg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcgc ggtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tcacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 160
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 160
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Gln His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp His Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Ala Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Ile
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 161
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 161
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
ttgacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gacgagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 162
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 162
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Leu Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Asp Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 163
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 163
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccg ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgtg gagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 164
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 164
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Gly Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Trp Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 165
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 165
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 166
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 166
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 167
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 167
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccg ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 168
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 168
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Gly Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 169
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 169
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg gcggaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccg ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 170
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 170
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Ala Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Gly Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 171
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 171
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggatgggccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 172
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 172
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Gly Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 173
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 173
atgccaacac tgcccagaac atttgacgac atttggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgaac 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 174
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 174
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Asn Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 175
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 175
atgccaacac tgcccagaac atttgactac ttgtggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 176
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 176
Met Pro Thr Leu Pro Arg Thr Phe Asp Tyr Leu Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 177
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 177
atgccaacac tgcccagaac atttgacgac ttgtggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctac tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaagg ggtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 178
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 178
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Leu Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Thr Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Gly Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 179
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 179
atgccaacac tgcccagaac atttgacgac ttgtggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctac tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 180
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 180
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Leu Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Thr Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 181
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 181
atgccaacac tgcccagaac atttgacgac ttgtggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatgggccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgagg gcacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 182
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 182
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Leu Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Gly Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Gly His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 183
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 183
atgccaacac tgcccagaac atttgactac ttgtggtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagtt gatgattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggatcggagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgccg gtcgatgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt tacgcattgg ccaccggcgg ggagtttgcc 720
gatgaaaatc ggatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
2400
<210> 184
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<223> /note="Description of Artificial Sequence: Synthetic polypeptide"
<400> 184
Met Pro Thr Leu Pro Arg Thr Phe Asp Tyr Leu Trp Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Met Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Arg Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ser Met Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Tyr Ala Leu Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Arg Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
Claims (13)
- 서열 번호: 38의 아미노산 서열에 적어도 90% 서열 동일성을 갖는 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체로서,
상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 아미노산 위치 12에서의 돌연변이 및 하기의 아미노산 위치 각각에서의 돌연변이를 포함하며:
(a) 서열 번호: 38의 12, 27, 28, 119, 141, 157, 159, 231, 233, 및 244;
(b) 서열 번호: 38의 12, 28, 119, 140, 157, 159, 233, 244, 254, 및 407;
(c) 서열 번호: 38의 12, 27, 111, 119, 141, 157, 159, 231, 233, 244, 및 254;
(d) 서열 번호: 38의 12, 28, 119, 140, 149, 157, 159, 231, 233, 및 407;
(e) 서열 번호: 38의 12, 27, 28, 119, 140, 157, 159, 233, 244, 및 407;
(f) 서열 번호: 38의 10, 11, 12, 28, 119, 141, 159, 231, 233, 244, 및 407;
(g) 서열 번호: 38의 11, 12, 27, 28, 119, 141, 157, 159, 197, 231, 233, 244, 407, 및 477;
(h) 서열 번호: 38의 11, 12, 28, 119, 141, 157, 159, 197, 231, 233, 244, 및 407; 또는
(i) 서열 번호: 38의 11, 12, 27, 28, 119, 141, 149, 157, 159, 231, 233, 및 407;
상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 지방산에서 오메가-하이드록실화 지방산으로의 전환을 촉매하는, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체. - 청구항 1에 있어서,
(a) 서열 번호: 38의 아미노산 위치 12, 27, 28, 119, 141, 157, 159, 231, 233, 및 244에서의 돌연변이는, Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A231Y, S233L, 및 A244R, 각각이며;
(b) 서열 번호: 38의 아미노산 위치 12, 28, 119, 140, 157, 159, 233, 244, 254, 및 407에서의 돌연변이는, Q12W, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, R254G, 및 N407G, 각각이며;
(c) 서열 번호: 38의 아미노산 위치 12, 27, 111, 119, 141, 157, 159, 231, 233, 244, 및 254에서의 돌연변이는, Q12W, R27L, F111A, K119R, V141T, S157R, V159M, A231Y, S233L, A244R, 및 R254G, 각각이며;
(d) 서열 번호: 38의 아미노산 위치 12, 28, 119, 140, 149, 157, 159, 231, 233, 및 407에서의 돌연변이는, Q12W, Q28M, K119R, S140N, P149G, S157R, V159M, A231Y, S233L, 및 N407G, 각각이며;
(e) 서열 번호: 38의 아미노산 위치 12, 27, 28, 119, 140, 157, 159, 233, 244, 및 407에서의 돌연변이는, Q12W, R27L, Q28M, K119R, S140N, S157R, V159M, S233L, A244R, 및 N407G, 각각이며;
(f) 서열 번호: 38의 아미노산 위치 10, 11, 12, 28, 119, 141, 159, 231, 233, 244, 및 407에서의 돌연변이는, D10Y, I11L, Q12W, Q28M, K119R, V141T, V159M, A231Y, S233L, A244R, 및 N407G, 각각이며;
(g) 서열 번호: 38의 아미노산 위치 11, 12, 27, 28, 119, 141, 157, 159, 197, 231, 233, 244, 407, 및 477에서의 돌연변이는, I11L, Q12W, R27L, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, N407G, 및 P477G, 각각이며;
(h) 서열 번호: 38의 아미노산 위치 11, 12, 28, 119, 141, 157, 159, 197, 231, 233, 244, 및 407에서의 돌연변이는, I11L, Q12W, Q28M, K119R, V141T, S157R, V159M, A197T, A231Y, S233L, A244R, 및 N407G, 각각이며; 그리고
(i) 서열 번호: 38의 아미노산 위치 11, 12, 27, 28, 119, 141, 149, 157, 159, 231, 233, 및 407에서의 돌연변이는, I11L, Q12W, R27L, Q28M, K119R, V141T, P149G, S157R, V159M, A231Y, S233L, 및 N407G, 각각인,
CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체. - 청구항 2에 있어서,
(a) (a)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 166의 아미노산 서열을 포함하며;
(b) (b)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 168의 아미노산 서열을 포함하며;
(c) (c)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 170의 아미노산 서열을 포함하며;
(d) (d)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 172의 아미노산 서열을 포함하며;
(e) (e)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 174의 아미노산 서열을 포함하며;
(f) (f)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 176의 아미노산 서열을 포함하며;
(g) (g)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 178의 아미노산 서열을 포함하며;
(h) (h)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 180의 아미노산 서열을 포함하며; 그리고
(i) (i)의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체는 서열 번호: 182의 아미노산 서열을 포함하는,
CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체. - 서열 번호: 166, 서열 번호: 168, 서열 번호: 170, 서열 번호: 172, 서열 번호: 174, 서열 번호: 176, 서열 번호: 178, 서열 번호: 180 및 서열 번호: 182로 이루어진 군에서 선택된, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체.
- 청구항 1 내지 4 중 어느 한 항에 있어서, 재조합 숙주 세포에서의 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체의 발현이, 상응하는 숙주 세포 중 서열 번호: 6, 또는 서열 번호: 38의 CYP153A-환원효소 하이브리드 융합 폴리펩티드의 발현에 의해 생산된 오메가-하이드록실화 지방산의 역가와 비교하여, 더 높은 역가의 오메가-하이드록실화 지방산을 유발하는, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체.
- 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 하이브리드 CYP153A-RedRhF 융합 단백질 변이체인, CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체.
- 청구항 1 내지 4 중 어느 한 항의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체를 발현하는, 재조합 숙주 세포.
- 청구항 7에 있어서, EC 3.1.2.-, EC 3.1.1.5 또는 EC 3.1.2.14의 티오에스테라제 폴리펩티드를 추가로 발현하는, 재조합 숙주 세포.
- 청구항 8에 있어서, 상기 재조합 숙주 세포는, 탄소 공급원을 함유하는 배지에서 배양되는 경우, 서열 번호: 38, 또는 서열 번호: 6을 포함하는, 상응하는 CYP153A-환원효소 하이브리드 융합 폴리펩티드를 발현하는 숙주 세포에 의해 생산된 오메가-하이드록실화 지방산 조성물의 역가보다 적어도 10% 더 큰, 적어도 15% 더 큰, 적어도 20% 더 큰, 적어도 25% 더 큰, 또는 적어도 30% 더 큰 역가로 오메가-하이드록실화 지방산 조성물을 생산하는, 재조합 숙주 세포.
- 청구항 7 내지 9 중 어느 한 항의 재조합 숙주 세포를 포함하는, 세포 배양물.
- 오메가-하이드록실화된 지방산의 제조 방법으로서,
(i) 탄소 공급원의 존재 하에, 청구항 7 내지 9 중 어느 한 항의 재조합 숙주 세포 또는 청구항 10의 세포 배양물을 배양하는 단계; 및
(ii) 오메가-하이드록실화된 지방산을 수거하는 단계를 포함하는, 방법. - 하기를 포함하는 폴리펩티드를 암호화하는 적어도 2종의 핵산 서열을 발현시키기 위해 조작된 경로를 포함하는, 재조합 미생물:
(i) EC 3.1.2. -, EC 3.1.1.5, 또는 EC 3.1.2.14의 티오에스테라제; 및
(ii) 청구항 1 내지 6 중 어느 한 항의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체. - 상기 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체가 자족성(self-sufficient) CYP153A-RedRhF 하이브리드 융합 폴리펩티드 변이체인, 청구항 1 내지 6 중 어느 한 항의 CYP153A-환원효소 하이브리드 융합 폴리펩티드 변이체, 또는 청구항 7 내지 9 중 어느 한 항의 재조합 숙주 세포, 또는 청구항 10의 세포 배양물, 또는 청구항 11의 방법, 또는 청구항 12의 재조합 미생물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EPPCT/EP2015/079832 | 2015-12-15 | ||
PCT/EP2015/079832 WO2017101987A1 (en) | 2015-12-15 | 2015-12-15 | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
PCT/US2016/066405 WO2017106205A1 (en) | 2015-12-15 | 2016-12-13 | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180132604A true KR20180132604A (ko) | 2018-12-12 |
Family
ID=55022448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187020089A KR20180132604A (ko) | 2015-12-15 | 2016-12-13 | 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 변이체 |
Country Status (13)
Country | Link |
---|---|
US (3) | US10787648B2 (ko) |
EP (2) | EP3390620B1 (ko) |
JP (2) | JP6957469B2 (ko) |
KR (1) | KR20180132604A (ko) |
CN (3) | CN108699536B (ko) |
AU (1) | AU2016370490B2 (ko) |
BR (1) | BR112018012193A2 (ko) |
CA (1) | CA3008836A1 (ko) |
ES (1) | ES2908400T3 (ko) |
MX (1) | MX2018007298A (ko) |
MY (2) | MY194277A (ko) |
SI (1) | SI3390620T1 (ko) |
WO (2) | WO2017101987A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3671948A2 (en) | 2018-10-31 | 2020-06-24 | Samsung Electronics Co., Ltd. | Foldable electronic device with controlled antenna sagnal intensity |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112016029235B1 (pt) | 2014-06-16 | 2023-11-28 | Genomatica, Inc | Variante de polipeptídeo de fusão híbrida cyp153a-redutase, célula hospedeira recombinante, cultura de células, método de produção de um ácido graxo ômega-hidroxilado que possui um aumento na titulação e microorganismo recombinante |
WO2017101987A1 (en) * | 2015-12-15 | 2017-06-22 | REG Life Sciences, LLC | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
EP3810778A4 (en) * | 2018-05-10 | 2022-06-29 | Genomatica, Inc. | Multifunctional fatty acid derivatives and biosynthesis thereof |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1305083C (en) | 1987-02-18 | 1992-07-14 | Yoshiharu Kimura | Microorganism belonging to genus rhodococcus, and a process for producing alkene derivative and unsaturated fatty acid |
US5482846A (en) | 1988-08-31 | 1996-01-09 | University Of Florida | Ethanol production in Gram-positive microbes |
US5424202A (en) | 1988-08-31 | 1995-06-13 | The University Of Florida | Ethanol production by recombinant hosts |
US5028539A (en) | 1988-08-31 | 1991-07-02 | The University Of Florida | Ethanol production using engineered mutant E. coli |
US5000000A (en) | 1988-08-31 | 1991-03-19 | University Of Florida | Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes |
AU7791991A (en) | 1990-04-24 | 1991-11-11 | Stratagene | Methods for phenotype creation from multiple gene populations |
US5602030A (en) | 1994-03-28 | 1997-02-11 | University Of Florida Research Foundation | Recombinant glucose uptake system |
US6428767B1 (en) | 1995-05-12 | 2002-08-06 | E. I. Du Pont De Nemours And Company | Method for identifying the source of carbon in 1,3-propanediol |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
US5939250A (en) | 1995-12-07 | 1999-08-17 | Diversa Corporation | Production of enzymes having desired activities by mutagenesis |
CN101172952B (zh) | 2002-04-29 | 2013-03-27 | 陶氏环球技术有限责任公司 | 关于种子油工业应用的综合化学方法 |
EP1811029A4 (en) | 2004-11-10 | 2008-03-12 | Marine Biotech Inst Co Ltd | PROCESS FOR ISOLATING THE P450 GENE |
ES2529176T3 (es) | 2006-05-19 | 2015-02-17 | Ls9, Inc. | Producción de ácidos grasos y derivados de los mismos |
US8110670B2 (en) | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
US20100242345A1 (en) | 2006-05-19 | 2010-09-30 | LS9, Inc | Production of fatty acids & derivatives thereof |
US8501973B2 (en) | 2006-10-13 | 2013-08-06 | Elevance Renewable Sciences, Inc. | Synthesis of terminal alkenes from internal alkenes via olefin metathesis |
EP3281931A1 (en) | 2006-10-13 | 2018-02-14 | Elevance Renewable Sciences, Inc. | Methods of making organic compounds by metathesis |
WO2008113041A2 (en) | 2007-03-14 | 2008-09-18 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
EP2129785B2 (en) | 2007-03-28 | 2021-11-17 | Genomatica, Inc. | Enhanced production of fatty acid derivatives |
US20080293060A1 (en) | 2007-04-23 | 2008-11-27 | Ls9, Inc. | Methods and Compositions for Identification of Hydrocarbon Response, Transport and Biosynthesis Genes |
JP5912251B2 (ja) | 2007-05-22 | 2016-06-01 | アールイージー ライフ サイエンシズ リミテッド ライアビリティ カンパニー | 炭化水素産生遺伝子およびその使用方法 |
JP5324129B2 (ja) | 2007-05-25 | 2013-10-23 | 神戸天然物化学株式会社 | Cyp153による芳香族化合物の製造方法 |
US20100199548A1 (en) | 2007-07-06 | 2010-08-12 | Ls9, Inc. | Systems and methods for the production of fatty esters |
FR2921362B1 (fr) | 2007-09-20 | 2012-09-21 | Arkema France | Procede de synthese d'acides gras omega-insatures |
US8313934B2 (en) | 2007-09-27 | 2012-11-20 | Ls9, Inc. | Reduction of the toxic effect of impurities from raw materials by extractive fermentation |
TWI351779B (en) | 2007-12-03 | 2011-11-01 | Advance Smart Ind Ltd | Apparatus and method for correcting residual capac |
US8183028B2 (en) | 2007-12-21 | 2012-05-22 | Ls9, Inc. | Methods and compositions for producing olefins |
CN102027109B (zh) | 2008-05-16 | 2016-01-06 | Reg生命科学有限责任公司 | 产生碳氢化合物的方法和组合物 |
WO2009142983A1 (en) | 2008-05-23 | 2009-11-26 | Alliant Techsystems Inc. | Broadband patch antenna and antenna system |
US8273694B2 (en) | 2008-07-28 | 2012-09-25 | Jeffrey A Brown | Synthetic compositions obtained from algae |
WO2010021711A1 (en) | 2008-08-18 | 2010-02-25 | Ls9, Inc. | Systems and methods for the production of mixed fatty esters |
WO2010024319A1 (ja) | 2008-08-28 | 2010-03-04 | 三井化学株式会社 | オレフィンの製造方法 |
BRPI0920650A2 (pt) | 2008-10-07 | 2019-08-27 | Ls9 Inc | métodos para produzir um aldeído graxo, microrganismo geneticamente modificado, aldeído graxo |
CN102264910B (zh) | 2008-10-28 | 2015-08-26 | Reg生命科学有限责任公司 | 用于产生脂肪醇的方法和组合物 |
US7989875B2 (en) | 2008-11-24 | 2011-08-02 | Nxp B.V. | BiCMOS integration of multiple-times-programmable non-volatile memories |
AU2009329970B2 (en) | 2008-12-23 | 2016-07-28 | Genomatica, Inc. | Methods and compositions related to thioesterase enzymes |
US8071799B2 (en) | 2009-01-29 | 2011-12-06 | Energy & Environmental Research Center Foundation | Chain-selective synthesis of fuel components and chemical feedstocks |
CN102459569B (zh) | 2009-04-10 | 2018-02-23 | Reg生命科学有限责任公司 | 脂肪酸衍生物的产生 |
CN111808892A (zh) | 2009-04-27 | 2020-10-23 | 基因组股份公司 | 脂肪酸酯的产生 |
US20120115195A1 (en) | 2009-05-01 | 2012-05-10 | The Regents Of The University Of California | Product of fatty acid esters from biomass polymers |
CN102656273B (zh) | 2009-09-25 | 2016-05-25 | Reg生命科学有限责任公司 | 脂肪酸衍生物的产生 |
US8237003B2 (en) | 2009-11-09 | 2012-08-07 | Exxonmobil Chemical Patents Inc. | Metathesis catalyst and process for use thereof |
US8809563B2 (en) | 2009-11-09 | 2014-08-19 | Exxonmobil Chemical Patents Inc. | Metathesis catalyst and process for use thereof |
US8361769B1 (en) * | 2009-11-16 | 2013-01-29 | U.S. Department Of Energy | Regioselective alkane hydroxylation with a mutant CYP153A6 enzyme |
US20110124071A1 (en) | 2009-11-17 | 2011-05-26 | LS9, Inc | Methods and compositions for producing hydrocarbons |
US8530221B2 (en) | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
WO2011127409A2 (en) | 2010-04-08 | 2011-10-13 | Ls9, Inc. | Methods and compositions related to fatty alcohol biosynthetic enzymes |
MX352746B (es) | 2010-05-28 | 2017-12-06 | Terravia Holdings Inc | Aceites específicos producidos a partir de microorganismos heterótrofos recombinantes. |
US8372610B2 (en) | 2010-09-15 | 2013-02-12 | Ls9, Inc. | Production of odd chain fatty acid derivatives in recombinant microbial cells |
WO2012071439A1 (en) | 2010-11-22 | 2012-05-31 | The Regents Of The University Of California | Host cells and methods for producing diacid compounds |
AU2012212079B2 (en) | 2011-02-02 | 2016-07-28 | Corbion Biotech, Inc. | Tailored oils produced from recombinant oleaginous microorganisms |
CA2841794C (en) | 2011-07-06 | 2019-08-13 | Verdezyne, Inc. | Genetically modified yeast with increased alcohol dehydrogenase activity for preparing a fatty dicarboxylic acid |
DE102011110946A1 (de) | 2011-08-15 | 2016-01-21 | Evonik Degussa Gmbh | Biotechnologisches Syntheseverfahren von omegafunktionalisierten Carbonsäuren und Carbonsäure-Estern aus einfachen Kohlenstoffquellen |
EP2639308A1 (de) | 2012-03-12 | 2013-09-18 | Evonik Industries AG | Enzymatische omega-Oxidation und -Aminierung von Fettsäuren |
FR3003577B1 (fr) | 2013-03-19 | 2016-05-06 | Ferropem | Inoculant a particules de surface |
CN105378486B (zh) * | 2013-06-14 | 2024-05-14 | 基因组股份公司 | 生产omega-羟基化的脂肪酸衍生物的方法 |
BR112016029235B1 (pt) * | 2014-06-16 | 2023-11-28 | Genomatica, Inc | Variante de polipeptídeo de fusão híbrida cyp153a-redutase, célula hospedeira recombinante, cultura de células, método de produção de um ácido graxo ômega-hidroxilado que possui um aumento na titulação e microorganismo recombinante |
WO2017101987A1 (en) * | 2015-12-15 | 2017-06-22 | REG Life Sciences, LLC | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
-
2015
- 2015-12-15 WO PCT/EP2015/079832 patent/WO2017101987A1/en active Application Filing
-
2016
- 2016-12-13 MY MYPI2018000942A patent/MY194277A/en unknown
- 2016-12-13 SI SI201631502T patent/SI3390620T1/sl unknown
- 2016-12-13 CN CN201680081302.3A patent/CN108699536B/zh active Active
- 2016-12-13 BR BR112018012193A patent/BR112018012193A2/pt unknown
- 2016-12-13 CN CN202210871940.2A patent/CN116334013A/zh active Pending
- 2016-12-13 MX MX2018007298A patent/MX2018007298A/es unknown
- 2016-12-13 EP EP16836213.5A patent/EP3390620B1/en active Active
- 2016-12-13 WO PCT/US2016/066405 patent/WO2017106205A1/en active Application Filing
- 2016-12-13 EP EP21209002.1A patent/EP4026899A1/en active Pending
- 2016-12-13 US US16/063,198 patent/US10787648B2/en active Active
- 2016-12-13 CN CN202210859052.9A patent/CN116334012A/zh active Pending
- 2016-12-13 AU AU2016370490A patent/AU2016370490B2/en active Active
- 2016-12-13 KR KR1020187020089A patent/KR20180132604A/ko not_active Application Discontinuation
- 2016-12-13 ES ES16836213T patent/ES2908400T3/es active Active
- 2016-12-13 MY MYPI2021004987A patent/MY196584A/en unknown
- 2016-12-13 CA CA3008836A patent/CA3008836A1/en active Pending
- 2016-12-13 JP JP2018531169A patent/JP6957469B2/ja active Active
-
2020
- 2020-08-24 US US17/001,015 patent/US11384341B2/en active Active
-
2021
- 2021-10-06 JP JP2021164702A patent/JP7458358B2/ja active Active
-
2022
- 2022-06-07 US US17/834,681 patent/US20230159901A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3671948A2 (en) | 2018-10-31 | 2020-06-24 | Samsung Electronics Co., Ltd. | Foldable electronic device with controlled antenna sagnal intensity |
Also Published As
Publication number | Publication date |
---|---|
MY194277A (en) | 2022-11-25 |
JP2018537111A (ja) | 2018-12-20 |
MY196584A (en) | 2023-04-19 |
US20210230562A1 (en) | 2021-07-29 |
US20230159901A1 (en) | 2023-05-25 |
WO2017101987A1 (en) | 2017-06-22 |
BR112018012193A2 (pt) | 2018-12-04 |
EP3390620B1 (en) | 2022-01-05 |
CN116334013A (zh) | 2023-06-27 |
EP4026899A1 (en) | 2022-07-13 |
AU2016370490B2 (en) | 2023-01-05 |
JP7458358B2 (ja) | 2024-03-29 |
ES2908400T3 (es) | 2022-04-29 |
CA3008836A1 (en) | 2017-06-22 |
JP2022002535A (ja) | 2022-01-11 |
SI3390620T1 (sl) | 2022-05-31 |
US20190002845A1 (en) | 2019-01-03 |
JP6957469B2 (ja) | 2021-11-02 |
US11384341B2 (en) | 2022-07-12 |
CN116334012A (zh) | 2023-06-27 |
WO2017106205A1 (en) | 2017-06-22 |
US10787648B2 (en) | 2020-09-29 |
CN108699536B (zh) | 2022-08-02 |
MX2018007298A (es) | 2019-01-10 |
CN108699536A (zh) | 2018-10-23 |
AU2016370490A1 (en) | 2018-06-21 |
EP3390620A1 (en) | 2018-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7094343B2 (ja) | 改良された特性を有するアシル-acpレダクターゼ | |
JP2021176340A (ja) | ω−ヒドロキシル化脂肪酸誘導体を生産する方法 | |
JP7458358B2 (ja) | 改良された特性を有するω-ヒドロキシラーゼ関連融合ポリペプチドバリアント | |
US11421206B2 (en) | Omega-hydroxylase-related fusion polypeptides with improved properties |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal |